大数据该怎么学习,自学能学会吗?

大数据自学能学会吗?大概需要多长时间?自学出来的能找到工作吗?... 大数据自学能学会吗?大概需要多长时间?自学出来的能找到工作吗? 展开
 我来答
喵喵喵喵喵咪c7
2019-03-20 · TA获得超过4024个赞
知道小有建树答主
回答量:2277
采纳率:100%
帮助的人:67.6万
展开全部
想要自学大数据,知道如何下手的小伙伴有福利了,本文专门为你准备的学习计划,这些技术知识梳理、其中的定义、关系以及作用,对你以后的学习会有很大的帮助!

大数据本质也是数据,但是又有了新的特征,包括数据来源广、数据格式多样化(结构化数据、非结构化数据、Excel文件、文本文件等)、数据量大(最少也是TB级别的、甚至可能是PB级别)、数据增长速度快等。
针对大数据主要的4个特征我们需要考虑以下问题:
数据来源广,该如何采集汇总?,对应出现了Sqoop,Cammel,Datax等工具。
数据采集之后,该如何存储?,对应出现了GFS,HDFS,TFS等分布式文件存储系统。
由于数据增长速度快,数据存储就必须可以水平扩展。
数据存储之后,该如何通过运算快速转化成一致的格式,该如何快速运算出自己想要的结果?
对应的MapReduce这样的分布式运算框架解决了这个问题;但是写MapReduce需要Java代码量很大,所以出现了Hive,Pig等将SQL转化成MapReduce的解析引擎;
普通的MapReduce处理数据只能一批一批地处理,时间延迟太长,为了实现每输入一条数据就能得到结果,于是出现了Storm/JStorm这样的低时延的流式计算框架;
但是如果同时需要批处理和流处理,按照如上就得搭两个集群,Hadoop集群(包括HDFS+MapReduce+Yarn)和Storm集群,不易于管理,所以出现了Spark这样的一站式的计算框架,既可以进行批处理,又可以进行流处理(实质上是微批处理)。
而后Lambda架构,Kappa架构的出现,又提供了一种业务处理的通用架构。
为了提高工作效率,加快运速度,出现了一些辅助工具:
Ozzie,azkaban:定时任务调度的工具。
Hue,Zepplin:图形化任务执行管理,结果查看工具。
Scala语言:编写Spark程序的最佳语言,当然也可以选择用Python。
Python语言:编写一些脚本时会用到。
Allluxio,Kylin等:通过对存储的数据进行预处理,加快运算速度的工具。
以上大致就把整个大数据生态里面用到的工具所解决的问题列举了一遍,知道了他们为什么而出现或者说出现是为了解决什么问题,进行学习的时候就有的放矢了。
热心晓朋友
2019-11-20 · TA获得超过287个赞
知道小有建树答主
回答量:1251
采纳率:65%
帮助的人:30.3万
展开全部
自学大数据是可以的,但是如果没有java的基础的话学起来就不是很轻松,如果有基础、自制力还可以的话你可是试着学习一下,在网上很多免费的视频看一下,实在不行就报个班。自学的话就没有时间了,培训的话估计5个月左右的时间。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
百度网友63e3e07
2018-10-18 · TA获得超过505个赞
知道小有建树答主
回答量:655
采纳率:75%
帮助的人:72.6万
展开全部
建议大专以上,本科学历来学大数据比较好,这关系到以后的就业,大多数公司有学历要求。大数据要求一定编程基础,像JAVA,python等开发语言都是大数据学习的基础。 完全零基础的不建议自学,如果没有一个合适的老师指导,很容易事倍功半。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
小纠结1y
2019-06-10 · 超过34用户采纳过TA的回答
知道小有建树答主
回答量:110
采纳率:33%
帮助的人:36.2万
展开全部
大数据学习模式基本的授课模式分为两种,一种线上视频教学,一种线下面授教学,如果你是0基础的话,建议是选择光环大数据的线下学习,毕竟,没有基础的话,刚开始学的时候会有点困难,如果课程安排太快,你很容易跟不上,想要自学大数据前提是你已经有了一定的知识技能储备,否则不要浪费时间,学习效率效果都不会理想。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
加米谷大数据科技
2019-12-24 · 大数据人才培养的机构
加米谷大数据科技
成都加米谷大数据科技有限公司是一家专注于大数据人才培养的机构。公司由来自华为、京东、星环、勤智等国内知名企业的多位技术大牛联合创办。面向社会提供大数据、人工智能等前沿技术的培训业务。
向TA提问
展开全部

大数据怎么学呢?

1、不同的业务领域需要不同方向理论、技术和工具的支持

如文本、网页要自然语言建模,随时间变化数据流需要序列建模,图像音频和视频多是时空混合建模

2、大数据学习要善用开源,IT前沿领域的开源化已成不可逆转的趋势

为什么要开源,这得益于IT发展的工业化和构件化,各大领域的基础技术栈和工具库已经很成熟,下一阶段就是怎么快速组合、快速搭积木、快速产出的问题。

3、大数据开发需要学习的内容包括三大部分,分别是:大数据基础知识、大数据平台知识、大数据场景应用

大数据平台知识:是大数据开发的基础,往往以搭建Hadoop、Spark平台为主;

大数据场景是目前大数据的重要应用,这些场景包括很多领域,比如金融大数据、交通大数据、教育大数据、餐饮大数据等等,这些场景应用的背后也需要对行业知识有一定的了解。

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 3条折叠回答
收起 更多回答(5)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式