大数据专业需要学习什么样的知识?

 我来答
成都加米谷大数据
2020-12-10 · 超过82用户采纳过TA的回答
知道小有建树答主
回答量:278
采纳率:83%
帮助的人:9.1万
展开全部
一、Java语言以java语言为基础掌握面向对象编程思想所涉及的知识,以及该知识在面向对象编程思想中的应用,培养学生设计程序的能力。掌握程度:精通
二、数据结构与算法掌握基于JAVA语言的底层数据结构和算法原理,并且能够自己动手写出来关于集合的各种算法和数据结构,并且了解这些数据结构处理的问题和优缺点。掌握程度:熟练。
三、数据库原理与MYSQL数据库掌握关系型数据库的原理,掌握结构化数据的特性。掌握关系型数据库的范式。通过MYSQL数据库掌握通过SQL语言与MYSQL数据库进行交互。熟练掌握各种复杂SQL语句的编写。掌握程度:熟练。
四、LINUX操作系统全面了解LINUX。详解LINUX下的管理命令、用户管理、网络配置管理等。掌握SHELL脚本编程,能够根据具体业务进行复杂SHELL脚本的编写。掌握程度:精通。
五、Hadoop技术学习Hadoop技术的两个核心:分布式文件系统HDFS和分布式计算框架MapReduce。掌握MR的运行过程及相关原理,精通各种业务的MR程序编写。掌握Hadoop的核心源码及实现原理。掌握使用Hadoop进行海量数据的存储、计算与处理。掌握程度:精通。
六、分布式数据库技术:精通分布式数据库HBASE、掌握Mongodb及了解其它分布式数据库技术。精通分布式数据库原理、应用场景、HBASE数据库的设计、操作等,能结合HIVE等工具进行海量数据的存储于检索。掌握程度:精通。
七、数据仓库HIVE精通基于hadoop的数据仓库HIVE。精通HIVESQL的语法,精通使用HIVESQL进行数据操作。内部表、外部表及与传统数据库的区别,掌握HIVE的应用场景及Hive与HBase的结合使用。掌握程度:精通。
八、PYTHON语言精通PYTHON语言基础语法及面向对象。精通PYTHON语言的爬虫、WEB、算法等框架。并根据业务可以基于PYTHON语言开发完成的业务功能和系统。掌握程度:精通。
九、机器学习算法熟练掌握机器学习经典算法,掌握算法的原理,公式,算法的应用场景。熟练掌握使用机器学习算法进行相关数据的分析,保证分析结果的准确性。掌握程度:熟练。
十、Spark高级编程技术掌握Spark的运行原理与架构,熟悉Spark的各种应用场景,掌握基于SparkRDD的各种算子的使用;精通SparkStreaming针对流处理的底层原理,熟练应用SparkSql对各种数据源处理,熟练掌握Spark机器学习算法库。达到能够在掌握Spark的各种组件的基础上,能够构建出大型的离线或实时的业务项目。掌握程度:精通。
十一、真实大数据项目实战通过几个真实的大数据项目把之前学习的知识与大数据技术框架贯穿,学习真实的大数据项目从数据采集、清洗、存储、处理、分析的完整过程,掌握大数据项目开发的设计思想,数据处理技术手段,解决开发过程中遇到的问题和技术难点如何解决。
清软长陌散见振22
高粉答主

2020-12-09 · 每个回答都超有意思的
知道小有建树答主
回答量:4万
采纳率:32%
帮助的人:2023万
展开全部
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
云南新华电脑学校
2020-12-10 · 百度认证:云南新华电脑职业培训学校官方账号
云南新华电脑学校
云南新华电脑学校是经云南省教育厅批准成立的省(部)级重点计算机专业学校,采用三元化管理模式,教学设备先进,师资雄厚学生毕业即就业,学院引进了电商企业入驻,创建心为电商创业园区,实现在校即创业
向TA提问
展开全部
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性),平台有hadoop
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(1)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式