2个回答
展开全部
数据科学是一门应用学科,需要系统提升数据获取、数据分析、数据可视化、机器学习的水平。下面就简单提供一个数据分析入门的路径:
第一阶段:Excel数据分析
每一位数据分析师都脱离不开Excel。excel是日常工作中最常用的工具,如果不考虑性能和数据量,可以应付绝大部分分析工作。虽然现在机器学习满地走,Excel依旧是无可争议的第一工具。
第二阶段:SQL数据库语言
作为数据分析人员,首先要知道如何去获取数据,其中最常见的就是从关系型数据库中取数,因此可以不会R,不会python,但是不能不会SQL。DT时代,数据正在呈指数级增长。Excel对十万条以内的数据处理起来没有问题,但是往小处说,但凡产品有一点规模,数据都是百万起。这时候就需要学习数据库。
第三阶段:数据可视化&商业智能
数据可视化能力已经越来越成为各岗位的基础技能。领英的数据报告显示,数据可视化技能在历年年中国最热门技能中排名第一。
学习数据分析可以到CDA数据分析认证中心了解一下,CDA是大数据和人工智能时代面向国际范围全行业的数据分析专业人才职业简称,具体指在互联网、金融、咨询、电信、零售、医疗、旅游等行业专门从事数据的采集、清洗、处理、分析并能制作业务报告、提供决策的新型数据人才。
第一阶段:Excel数据分析
每一位数据分析师都脱离不开Excel。excel是日常工作中最常用的工具,如果不考虑性能和数据量,可以应付绝大部分分析工作。虽然现在机器学习满地走,Excel依旧是无可争议的第一工具。
第二阶段:SQL数据库语言
作为数据分析人员,首先要知道如何去获取数据,其中最常见的就是从关系型数据库中取数,因此可以不会R,不会python,但是不能不会SQL。DT时代,数据正在呈指数级增长。Excel对十万条以内的数据处理起来没有问题,但是往小处说,但凡产品有一点规模,数据都是百万起。这时候就需要学习数据库。
第三阶段:数据可视化&商业智能
数据可视化能力已经越来越成为各岗位的基础技能。领英的数据报告显示,数据可视化技能在历年年中国最热门技能中排名第一。
学习数据分析可以到CDA数据分析认证中心了解一下,CDA是大数据和人工智能时代面向国际范围全行业的数据分析专业人才职业简称,具体指在互联网、金融、咨询、电信、零售、医疗、旅游等行业专门从事数据的采集、清洗、处理、分析并能制作业务报告、提供决策的新型数据人才。
展开全部
想要入行数据分析师,那么有两个部分必须掌握:工具 + 数据分析方法论。
先谈工具。
学习过程应该由易入难。从认识表结构、懂得表连接、掌握小数据量处理,到表在心中、只需要代码批量自动化处理、并且会通过算法实现相关性分析,这两个状态之间有三个层次。
第一个层次:当数据分析师只用面对小量数据时(一般来说小于几万行),他/她应当先学会从MySQL(一种部署在本地计算机的数据库)的Sql语法提取数据,然后用excel进行做表做图的处理,亦或是用FinbeBI或者是PowerBI做出更为精美的指标看板,以供决策者看到公司销售、运营、人力等指标的变化趋势。
第二个层次:当数据分析师面对中量级数据(也就是百万千万级数据)时,他/她会发现:excel和BI无法打开这一庞大数据集。那么怎么办呢?这时Python的批量处理数据能力就变成了入门最简单且处理最高效的工具了。Python是一种入门简单,语法简洁的编程语言,它拥有丰富的"工具库“。就像英语具有“日常英语”和“商务英语”等不同的语句库,python也有具有不同功能的工具库。比如python的pandas库就能够轻易地,对千万级表的数据做到,将第10行到第20万行的所有1都替换成0;python的numpy库又能轻易地进行N维空间的矩阵运算。另外python的matplotlib和seaborn可以短时高效地绘制跟excel和BI一样精美的指标图。
第三个层次:当数据分析师处理超大数据量的时候,hadoop和spark等等大数据工具及组件就会派上用场。这时学习的就是从多台服务器上调取大量数据,并且要将这大量数据做出高效运算,和用算法进行分析。
先打地基,后建高楼。万楼皆从平地起。Excel,MySQL,BI就是处理小数据的地基。Python可处理中量级。Hadoop和spark等工具则是处理大数据的利器。
沿着这个思路往下,结合刻意联系的原则(量化的特定目标+实践+及时反馈),你一定会收获入门数据分析师的果实。
先谈工具。
学习过程应该由易入难。从认识表结构、懂得表连接、掌握小数据量处理,到表在心中、只需要代码批量自动化处理、并且会通过算法实现相关性分析,这两个状态之间有三个层次。
第一个层次:当数据分析师只用面对小量数据时(一般来说小于几万行),他/她应当先学会从MySQL(一种部署在本地计算机的数据库)的Sql语法提取数据,然后用excel进行做表做图的处理,亦或是用FinbeBI或者是PowerBI做出更为精美的指标看板,以供决策者看到公司销售、运营、人力等指标的变化趋势。
第二个层次:当数据分析师面对中量级数据(也就是百万千万级数据)时,他/她会发现:excel和BI无法打开这一庞大数据集。那么怎么办呢?这时Python的批量处理数据能力就变成了入门最简单且处理最高效的工具了。Python是一种入门简单,语法简洁的编程语言,它拥有丰富的"工具库“。就像英语具有“日常英语”和“商务英语”等不同的语句库,python也有具有不同功能的工具库。比如python的pandas库就能够轻易地,对千万级表的数据做到,将第10行到第20万行的所有1都替换成0;python的numpy库又能轻易地进行N维空间的矩阵运算。另外python的matplotlib和seaborn可以短时高效地绘制跟excel和BI一样精美的指标图。
第三个层次:当数据分析师处理超大数据量的时候,hadoop和spark等等大数据工具及组件就会派上用场。这时学习的就是从多台服务器上调取大量数据,并且要将这大量数据做出高效运算,和用算法进行分析。
先打地基,后建高楼。万楼皆从平地起。Excel,MySQL,BI就是处理小数据的地基。Python可处理中量级。Hadoop和spark等工具则是处理大数据的利器。
沿着这个思路往下,结合刻意联系的原则(量化的特定目标+实践+及时反馈),你一定会收获入门数据分析师的果实。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询