大数据学什么语言

 我来答
打下大虾的大侠
高粉答主

2020-10-13 · 学会数理化,走遍天下都不怕
打下大虾的大侠
采纳数:6186 获赞数:48109

向TA提问 私信TA
展开全部
1、Python语言

十多年来,Python在学术界当中一直很流行,尤其是在自然语言处理(NLP)等领域。因而,如果你有一个需要NLP处理的项目,就会面临数量多得让人眼花缭乱的选择,包括经典的NTLK、使用GenSim的主题建模,或者超快、准确的spaCy。同样,说到神经网络,Python同样游刃有余,有Theano和Tensorflow;随后还有面向机器学习的scikit-learn,以及面向数据分析的NumPy和Pandas。

还有Juypter/iPython――这种基于Web的笔记本服务器框架让你可以使用一种可共享的日志格式,将代码、图形以及几乎任何对象混合起来。这一直是Python的杀手级功能之一,不过这年头,这个概念证明大有用途,以至于出现在了奉行读取-读取-输出-循环(REPL)概念的几乎所有语言上,包括Scala和R。

Python往往在大数据处理框架中得到支持,但与此同时,它往往又不是“一等公民”。比如说,Spark中的新功能几乎总是出现在Scala/Java绑定的首位,可能需要用PySpark编写面向那些更新版的几个次要版本(对Spark Streaming/MLLib方面的开发工具而言尤为如此)。

与R相反,Python是一种传统的面向对象语言,所以大多数开发人员用起来会相当得心应手,而初次接触R或Scala会让人心生畏惧。一个小问题就是你的代码中需要留出正确的空白处。这将人员分成两大阵营,一派觉得“这非常有助于确保可读性”,另一派则认为,我们应该不需要就因为一行代码有个字符不在适当的位置,就要迫使解释器让程序运行起来。

2、R语言

在过去的几年时间中,R语言已经成为了数据科学的宠儿——数据科学现在不仅仅在书呆子一样的统计学家中人尽皆知,而且也为华尔街交易员,生物学家,和硅谷开发者所家喻户晓。各种行业的公司,例如Google,Facebook,美国银行,以及纽约时报都使用R语言,R语言正在商业用途上持续蔓延和扩散。

R语言有着简单而明显的吸引力。使用R语言,只需要短短的几行代码,你就可以在复杂的数据集中筛选,通过先进的建模函数处理数据,以及创建平整的图形来代表数字。它被比喻为是Excel的一个极度活跃版本。

R语言最伟大的资本是已围绕它开发的充满活力的生态系统:R语言社区总是在不断地添加新的软件包和功能到它已经相当丰富的功能集中。据估计,超过200万的人使用R语言,并且最近的一次投票表明,R语言是迄今为止在科学数据中最流行的语言,被61%的受访者使用(其次是Python,39%)。

3、JAVA

Java,以及基于Java的框架,被发现俨然成为了硅谷最大的那些高科技公司的骨骼支架。 “如果你去看Twitter,LinkedIn和Facebook,那么你会发现,Java是它们所有数据工程基础设施的基础语言,”Driscoll说。

Java不能提供R和Python同样质量的可视化,并且它并非统计建模的最佳选择。但是,如果你移动到过去的原型制作并需要建立大型系统,那么Java往往是你的最佳选择。
执灯一盏问沧桑
高能答主

2020-10-13 · 致力于成为全知道最会答题的人
知道大有可为答主
回答量:3.3万
采纳率:21%
帮助的人:1040万
展开全部
是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》[1]中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。[2]
中文名
大数据
外文名
big data,mega data
提出者
维克托·迈尔-舍恩伯格及肯尼斯·库克耶
提出时间
2008年8月中旬
应用学科
计算机,信息科学,统计学
快速
导航
特征结构应用意义趋势IT分析工具促进发展
定义
对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
大数据与云计算的关系
麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。[3]
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
湾区聚集
高能答主

2020-10-13 · 聚焦粤港澳大湾区最新资讯新鲜娱乐
湾区聚集
采纳数:2689 获赞数:9897

向TA提问 私信TA
展开全部
学大数据需要学原则上大数据开发需要编程语言的基础,因为大数据的开发基于一些常用的高级语言,比如java和.Net。

不论是hadoop,还是数据挖掘,都需要有高级编程语言的基础,一般有了几年java开发经验,转行做大数据会比较容易上手。因此, 如果想从事大数据开发,还是需要至少精通一门高级语言。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
社会小袖

2020-10-13 · 有趣的人一定很有趣吧
社会小袖
采纳数:1396 获赞数:6725

向TA提问 私信TA
展开全部
原则上大数据开发需要编程语言的基础,因为大数据的开发基于一些常用的高级语言,比如java和.Net。不论是hadoop,还是数据挖掘,都需要有高级编程语言的基础,一般有了几年java开发经验,转行做大数据会比较容易上手。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
帐号已注销
2020-10-13 · TA获得超过560个赞
知道小有建树答主
回答量:1.6万
采纳率:28%
帮助的人:860万
展开全部
继续学什么语言,这个你还去查查关于这个语言的一些消息,关于这个大数据。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(16)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式