想要学习大数据，应该怎么入门？

 我来答

12个回答

#热议# 上班途中天气原因受伤算工伤吗？

CDA数据分析师
2021-09-17 · 百度认证:北京国富如荷网络科技有限公司

CDA数据分析师

向TA提问

关注

展开全部

如今大数据发展得可谓是如日中天，各行各业对于大数据分析和大数据处理的需求也是与日俱增，越来越多的决策、建议、规划和报告，都要依靠大数据的支撑，学习大数据成了不少人提升或转行的机会。因此，入门大数据开始成为很多人的第一步，下面给大家讲讲，究竟大数据入门，首要掌握的知识点有哪些，如何一步一步进阶呢？

首先我们要了解Java语言和Linux操作系统，这两个是学习大数据的基础，学习的顺序不分前后。楼主是JAVA毕业的，这无疑是极好的开头和奠基啊，可谓是赢在了起跑线上，接收和吸收大数据领域的知识会比一般人更加得心应手。

Java ：只要了解一些基础即可，做大数据不需要很深的Java 技术，学java SE 就相当于有学习大数据。基础

Linux：因为大数据相关软件都是在Linux上运行的，所以Linux要学习的扎实一些，学好Linux对你快速掌握大数据相关技术会有很大的帮助，能让你更好的理解hadoop、hive、hbase、spark等大数据软件的运行环境和网络环境配置，能少踩很多坑，学会shell就能看懂脚本这样能更容易理解和配置大数据集群。还能让你对以后新出的大数据技术学习起来更快。

好说完基础了，再说说还需要学习哪些大数据技术，可以按我写的顺序学下去。

Hadoop：这是现在流行的大数据处理平台几乎已经成为大数据的代名词，所以这个是必学的。Hadoop里面包括几个组件HDFS、MapReduce和YARN，HDFS是存储数据的地方就像我们电脑的硬盘一样文件都存储在这个上面，MapReduce是对数据进行处理计算的，它有个特点就是不管多大的数据只要给它时间它就能把数据跑完，但是时间可能不是很快所以它叫数据的批处理。

记住学到这里可以作为你学大数据的一个节点。

Zookeeper：这是个万金油，安装Hadoop的HA的时候就会用到它，以后的Hbase也会用到它。它一般用来存放一些相互协作的信息，这些信息比较小一般不会超过1M，都是使用它的软件对它有依赖，对于我们个人来讲只需要把它安装正确，让它正常的run起来就可以了。

Mysql：我们学习完大数据的处理了，接下来学习学习小数据的处理工具mysql数据库，因为一会装hive的时候要用到，mysql需要掌握到什么层度那?你能在Linux上把它安装好，运行起来，会配置简单的权限，修改root的密码，创建数据库。这里主要的是学习SQL的语法，因为hive的语法和这个非常相似。

Sqoop：这个是用于把Mysql里的数据导入到Hadoop里的。当然你也可以不用这个，直接把Mysql数据表导出成文件再放到HDFS上也是一样的，当然生产环境中使用要注意Mysql的压力。

Hive：这个东西对于会SQL语法的来说就是神器，它能让你处理大数据变的很简单，不会再费劲的编写MapReduce程序。有的人说Pig那?它和Pig差不多掌握一个就可以了。

Oozie：既然学会Hive了，我相信你一定需要这个东西，它可以帮你管理你的Hive或者MapReduce、Spark脚本，还能检查你的程序是否执行正确，出错了给你发报警并能帮你重试程序，最重要的是还能帮你配置任务的依赖关系。我相信你一定会喜欢上它的，不然你看着那一大堆脚本，和密密麻麻的crond是不是有种想屎的感觉。

Hbase：这是Hadoop生态体系中的NOSQL数据库，他的数据是按照key和value的形式存储的并且key是唯一的，所以它能用来做数据的排重，它与MYSQL相比能存储的数据量大很多。所以他常被用于大数据处理完成之后的存储目的地。

Kafka：这是个比较好用的队列工具，队列是干吗的?排队买票你知道不?数据多了同样也需要排队处理，这样与你协作的其它同学不会叫起来，你干吗给我这么多的数据(比如好几百G的文件)我怎么处理得过来，你别怪他因为他不是搞大数据的，你可以跟他讲我把数据放在队列里你使用的时候一个个拿，这样他就不在抱怨了马上灰流流的去优化他的程序去了，因为处理不过来就是他的事情。而不是你给的问题。当然我们也可以利用这个工具来做线上实时数据的入库或入HDFS，这时你可以与一个叫Flume的工具配合使用，它是专门用来提供对数据进行简单处理，并写到各种数据接受方(比如Kafka)的。

Spark：它是用来弥补基于MapReduce处理数据速度上的缺点，它的特点是把数据装载到内存中计算而不是去读慢的要死进化还特别慢的硬盘。特别适合做迭代运算，所以算法流们特别稀饭它。它是用scala编写的。Java语言或者Scala都可以操作它，因为它们都是用JVM的。

已赞过 已踩过<

评论收起

天津三六零快看科技

广告2024-11-10

大数据科学与技术专题资料下载，不用四处查资料，360文库海量精选大数据科学与技术全行业资料覆盖，千万文档即刻下载，享专属优惠!

wenku.so.com

喵喵喵喵喵咪c7
2019-11-28 · TA获得超过4024个赞

知道小有建树答主

回答量：2277

采纳率：100%

帮助的人：69.6万

我也去答题访问个人页

关注

展开全部

学习大数据开发的第一个阶段：了解大数据的理论知识
学习一门课程，首先你对这门课程要有简单的了解，比如说要先学习这门课程的一些专业术语，学习一些入门的概念，知道这门课程是做什么的，主要学习的有那些知识。学习大数据开发也是一样，你要知道什么是大数据，一般大数据主要运用在那些领域。避免自己在对大数据一无所知的情况下就开始盲目学习。

学习大数据开发的第二个阶段：计算机编程语言的学习
对于零基础的学员来说，开始入门可能不是那么容易，需要学习大量的理论知识，阅读枯燥的教材。因为要掌握一门计算机编程语言，大家都知道计算机编程语言有很多，比如：R，C++，JAVA等等。
学习大数据开发的第三阶段：大数据相关课程的学习
经过一段时间的基础学习之后，我们对编程语言也已经基本掌握了，接下来就可以进行大数据部分的课程学习了。在这里大数据开发学习要特别提醒大家：行业真正大数据，82%主讲都是hadoop、spark生态体系、storm实时开发等课程。而所谓“大数据”机构85%基本讲的都是JAVA/PHP数据或数据库学习（大数据课程含量不超过15%），初学者请务必认清你要学的是不是真正大数据！
学习大数据开发的第四个阶段：项目实战阶段
实战训练可以帮助我们更好的理解所学的内容，同时对相关知识加强记忆。在以后的实际运用中，可以更快的上手，对于相关知识该怎么用也有了经验。
学会这四个阶段在也不用担心零基础学不好大数据了。再说了学习嘛，只要你用心肯定能学会的，只要你付出就一定会有回报的！

已赞过 已踩过<

评论收起

IT小尚

科技发烧友

2021-11-05 · 有一些普通的科技小锦囊

知道小有建树答主

回答量：169

采纳率：40%

帮助的人：3万

我也去答题访问个人页

关注

展开全部

1.以用促学。小伙伴在学习大数据开发技术的过程中，要确定自己的发展方向，在学习大数据的时候，以用促学是最为直接和有效的学习方法。这种学习方式不仅仅对在大数据培训班学习的小伙伴来说是有一定的帮助，对广大从业者学习也是有一定的指导学习性，这种学习方式不仅能让小伙伴提高学习效率，还能提升职业价值。
2.注重项目实战案例练习。项目实战案例练习对小伙伴学习大数据开发技术有一定的帮助，由于当前大数据技术体系已经趋于成熟了，所以会有很多案例可以参考学习，这个过程能够积累大量的大数据应用经验。另外，通过案例来学习大数据，还会积累一定的行业场景知识，这也会增加学习者的大数据落地应用经验。
3.注重交流。在学习大数据的过程中，初学者往往会遇到很多问题，而在这些问题当中，最为重要的问题就包括学习的方向和脉络，如果能够把握住学习大数据的关键问题，那么往往会提升学习效率，这就要求初学者要在学习的不同阶段多与同行进行交流。

已赞过 已踩过<

评论收起

加米谷大数据科技
2019-05-31 · 大数据人才培养的机构

加米谷大数据科技

成都加米谷大数据科技有限公司是一家专注于大数据人才培养的机构。公司由来自华为、京东、星环、勤智等国内知名企业的多位技术大牛联合创办。面向社会提供大数据、人工智能等前沿技术的培训业务。

向TA提问

关注

展开全部

先把JavaSE学好，能掌握JavaEE的话会更好，再去学习大数据。Java是学习大数据的基础，但真正的大数据核心内容是hadoop、spark、storm方面的内容。

1、Java编程技术

Java编程技术是大数据学习的基础，想学好大数据，掌握Java基础是必不可少的。

2、Linux命令

大数据开发通常是在Linux环境下进行的，想从事大数据开发相关工作，还需掌握Linux基础操作命令

3、Hadoop

Hadoop是大数据开发的重要框架

4、Scala

Scala是一门多范式的编程语言，大数据开发重要框架Spark是采用Scala语言设计的，想要学好Spark框架，拥有Scala基础是必不可少的

5、Spark

Spark是专为大规模数据处理而设计的快速通用的计算引擎

6、项目实践

增加对大数据技术的理解和应用。

本回答被网友采纳

已赞过 已踩过<

评论收起

热心晓朋友
2020-01-14 · TA获得超过287个赞

知道小有建树答主

回答量：1251

采纳率：65%

帮助的人：31.3万

我也去答题访问个人页

关注

展开全部

学习大数据入门学习步骤

第1阶段Java

第2阶段JavaEE核心

第3阶段Hadoop生态体系

第4阶段大数据spark生态体

大数据怎么入门

已赞过 已踩过<

评论收起

更多回答（10）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

大数据是什么专业_大数据是什么专业_法本信息技术实施

法本信息是国内大数据是什么专业行业专业服务商，为企业提供大数据专业服务及创新性解决方案，拥有成熟的方法论，自主研发产品，经验丰富的团队，帮助客户挖掘自身的核心价值。

www.farben.com.cn广告

大数据专业_法本信息-面向全球的IT综合服务上市企业

www.farben.com.cn

新版数据科学-360文库在线阅读-可下载可打印

360文库全行业资料文档，覆盖学习资料、实用文档、总结范文、协议模板、汇报资料、行业材料等6亿+精品文档，快速下载，即刻套用，任您挑选!

wenku.so.com广告

想要学习大数据，应该怎么入门？

您可能关注的内容

其他类似问题

为你推荐：