数据科学家需要具备什么能力
4个回答
2019-01-24 · 大数据人才培养的机构
加米谷大数据科技
成都加米谷大数据科技有限公司是一家专注于大数据人才培养的机构。公司由来自华为、京东、星环、勤智等国内知名企业的多位技术大牛联合创办。面向社会提供大数据、人工智能等前沿技术的培训业务。
向TA提问
关注
展开全部
分析和机器学习是数据科学家工作的核心
需要统计学和计算机科学技能
最常见的技术技能:
1. Python
是数据科学家的主要语言
2. R
Python或R对于几乎每一个数据科学家职位来说都是必须的
3. SQL
在数据科学领域,SQL有时会被忽视,但是如果打算进入就业市场,这是一项值得展示的技能
4. Hadoop和Spark
它们都是Apache提供的用于大数据的开源工具
5. Java和SAS
这两种语言的背后都有大公司支持,至少有一些免费产品
6. Tableau
这个分析平台和可视化工具功能强大,易于使用,并且越来越受欢迎
2018-10-28 · 国内专业的大数据轻应用自助平台
关注
展开全部
数学功底:微积分是严格要掌握的。不一定要掌握多元微积分,但一元微积分是必须要熟练掌握并使用的。另外线性代数一定要精通,特别是矩阵的运算、向量空间、秩等概念。当前机器学习框架中很多计算都需要用到矩阵的乘法、转置或是求逆。虽然很多框架都直接提供了这样的工具,但我们至少要了解内部的原型原理,比如如何高效判断一个矩阵是否存在逆矩阵并如何计算等。
数理统计:概率论和各种统计学方法要做到基本掌握,比如贝叶斯概率如何计算?概率分布是怎么回事?虽不要求精通,但对相关背景和术语一定要了解。
交互式数据分析框架:这里并不是指SQL或数据库查询,而是像Apache Hive或Apache Kylin这样的分析交互框架。开源社区中有很多这样类似的框架,可以使用传统的数据分析方式对大数据进行数据分析或数据挖掘。笔者有过使用经验的是Hive和Kylin。不过Hive特别是Hive1是基于MapReduce的,性能并非特别出色,而Kylin采用数据立方体的概念结合星型模型,可以做到很低延时的分析速度,况且Kylin是第一个研发团队主力是中国人的Apache孵化项目,因此日益受到广泛的关注。
机器学习框架:机器学习当前真是火爆宇宙了,人人都提机器学习和AI,但笔者一直认为机器学习恰似几年前的云计算一样,目前虽然火爆,但没有实际的落地项目,可能还需要几年的时间才能逐渐成熟。不过在现在就开始储备机器学习的知识总是没有坏处的。说到机器学习的框架,大家耳熟能详的有很多种, 信手拈来的就包括TensorFlow、Caffe8、Keras9、CNTK10、Torch711等,其中又以TensorFlow领衔。笔者当前建议大家选取其中的一个框架进行学习,但以我对这些框架的了解,这些框架大多很方便地封装了各种机器学习算法提供给用户使用,但对于底层算法的了解其实并没有太多可学习之处。因此笔者还是建议可以从机器学习算法的原理来进行学习。
数理统计:概率论和各种统计学方法要做到基本掌握,比如贝叶斯概率如何计算?概率分布是怎么回事?虽不要求精通,但对相关背景和术语一定要了解。
交互式数据分析框架:这里并不是指SQL或数据库查询,而是像Apache Hive或Apache Kylin这样的分析交互框架。开源社区中有很多这样类似的框架,可以使用传统的数据分析方式对大数据进行数据分析或数据挖掘。笔者有过使用经验的是Hive和Kylin。不过Hive特别是Hive1是基于MapReduce的,性能并非特别出色,而Kylin采用数据立方体的概念结合星型模型,可以做到很低延时的分析速度,况且Kylin是第一个研发团队主力是中国人的Apache孵化项目,因此日益受到广泛的关注。
机器学习框架:机器学习当前真是火爆宇宙了,人人都提机器学习和AI,但笔者一直认为机器学习恰似几年前的云计算一样,目前虽然火爆,但没有实际的落地项目,可能还需要几年的时间才能逐渐成熟。不过在现在就开始储备机器学习的知识总是没有坏处的。说到机器学习的框架,大家耳熟能详的有很多种, 信手拈来的就包括TensorFlow、Caffe8、Keras9、CNTK10、Torch711等,其中又以TensorFlow领衔。笔者当前建议大家选取其中的一个框架进行学习,但以我对这些框架的了解,这些框架大多很方便地封装了各种机器学习算法提供给用户使用,但对于底层算法的了解其实并没有太多可学习之处。因此笔者还是建议可以从机器学习算法的原理来进行学习。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
大致需要四方面的能力:
1,数学能力。因为需要构建很多复杂的模型,里面涉及很多算法,需要雄厚的数学基础。
2,统计能力。得出模型结果后,通常需要统计基础结合实际的业务情况来解读结果。
3,编程能力。大部分软件都需要自己建模编程,因此编程时一种表达自己构建模型的基础。
4,业务分析能力。能够对于实际情况进行有效的解读,才可以转化为数学统计语言。
1,数学能力。因为需要构建很多复杂的模型,里面涉及很多算法,需要雄厚的数学基础。
2,统计能力。得出模型结果后,通常需要统计基础结合实际的业务情况来解读结果。
3,编程能力。大部分软件都需要自己建模编程,因此编程时一种表达自己构建模型的基础。
4,业务分析能力。能够对于实际情况进行有效的解读,才可以转化为数学统计语言。
本回答被提问者和网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
2020年成为数据科学家需要具备哪些技能?
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询