想从事数据分析工作,学什么软件或语言最好
Excel
EXCEL是其中最简单的,倒不是容易而是人人都会。但如果是用来分析的话,图表只是基础,还要学会使用透视图以及VBA函数。Excel的功能其实非常强大,尤其是通过学习VBA,几乎能解决所有的问题,但成本就高了,而且Excel的数据处理量并不是很大,几十万而已,大数据量还要另寻方法。
SPSS
SPSS最初是社会科学统计软件,如果刚入门数据分析,懂点SPSS事非常有好处的,当然前提是要懂SQL。SPSS得使用对人的能力要求不高,编程模块很少使用,通常用于科学、市场之类的调研,在院校中使用较多。
有了以上的基础之后,可能就需要精通一门统计分析软件。
近几年的互联网潮,R语言流行起来了,在互联网行业运用较多。R语言是开源的,学习起来并不容易,需要一个长期的过程。
SPSS刚刚有提到,适用于市场研究,上手较快。如果会编程的话,功能还是蛮强大的。
SAS一般是金融行业应用较广,特别是银行业和医学统计,包括一些制造业也很多。银行业通常会用SAS来做统计,数据挖掘也会用到,价格昂贵,学起来比较难,建议网上寻找一些课程和教材来学。
所以打击爱可以针对自己的行业和实际情况来做选择,以上列举的只是大致情况。
Python
以上就是各种数据分析工具和语言的介绍,其次还要掌握一些第三方工具,这些工具一般偏业务化应用,可视化数据展示类偏多,所以在技术上没有太多要求,不过SQL需要掌握。
Tableau
多次介绍过的一款可视化工具,可视化方面应该是做得最不错的工具了,偏前端分析。不懂python不懂R的可以试试。有点贵,土豪们加油!
Qlikview
相对tableau有点丑,不要喷,毕竟人家走数据处理路线,作为BI产品,数据处理速度还是不错的,取个数不至于像tableau慢。两者像互补兄弟,各有优势,但都一样贵,哈哈!所以对数据处理要求较高的话,建议尝试。
FineBI
国内的可视化软件,bi工具。无功无过,重在稳定和应用,国内有一定市场,企业应用挺广。有一定数据分析基础的同学,应该说很快就能上手,免费版无限用!
还有一些D3之类的chart软件这里由于篇幅就不介绍了,主要偏应用,在工作中使用还是蛮广的。
总体来将,每个工具各有优势,但最关键的还是对于业务的熟悉度,没有远离和思路,任何工具都用不起来,所以在做数据分析时,一定要扎根学习业务和数据建模方法,工具不是万能的!
对于入门小白,建议从excel工具入手—打好报表基础
学习Excel也是一个循序渐进的过程
基础的:简单的表格数据处理打印、查询、筛选、排序
函数和公式:常用函数、高级数据计算、数组公式、多维引用、function
可视化图表:图形图示展示、高级图表、图表插件
数据透视表、VBA程序开发
按照我习惯的方法,先过一遍基础,知道什么是什么,然后找几个case练习。多逛逛excelhome论坛,平常多思考如何用excel来解决问题,善用插件,还有记得保存。
函数和数据透视表是两个重点,结合业务场景来学习,可参考《谁说菜鸟不会数据分析》。
制作数据模板必须掌握的excel函数
日期函数:day,month,year,date,today,weekday,weeknum。日期函数是做分析模板的必备,可以用日期函数来控制数据的展示,查询指定时间段的数据。
数学函数:product,rand,randbetween,round,sum,sumif,sumifs,sumproduct
统计函数:large,small,max,min,median,mode,rank,count,countif,countifs,average,averageif,averageifs。统计函数在数据分析中具有举足轻重的作用,求平均值,最大值,中位数,众位数都用得到。
查找和引用函数:choose,match,index,indirect,column,row,vlookup,hlookup,lookup,offset,getpivotdata。这几个函数的作用不用多说,特别是vlookup,不会这个函数基本上复杂报表寸步难行。
文本函数:find,search,text,value,concatenate,left,right,mid,len。这几个函数多半用在数据整理阶段使用。
逻辑函数:and,or,false,true,if,iferror
(以上学会,基本能秒杀90%的办公室白领。)
报表工具—FineReport
客观来讲,FineReport是操作简单却功能极其强大的工具,但入门容易,升级难,要想达到高手的境界,还是需要几个月的学习的。
FineReport的知识层次如下,每一个层次又有很多级别。
操作:FineReport的使用技巧,按照大功能可分为数据表、图表、参数查询、数据填报、移动端、平台搭建、定时调度、部署集成。
扩展:FineReport外围但非常相关,主要是底层的数据处理,需要掌握的有数据库知识SQL语言、ETL等,前端的一些实现开发,需要掌握的是JS
开发:FineReport支持各类插件,不满足的功能可以自己开发定制,需要掌握java
下一步注重分析挖掘—两大语言R语言
1.夯实基础编程语句。这一部分主要是R的最基础部分的学习,包括数据管理(向量、矩阵、数据框、字符串等的操作等)、数学计算与常见函数、数组与矩阵操作的常用函数、逻辑运算、流程控制语句(if, else, while, for 等)
2.掌握基础统计模型与分析方法
3.学会运用可视化工具,主要是学习ggplot2包
4.高级R进阶:掌握一些牛掰的package
2018-09-04
软件的话,就见仁见智了,毕竟数据分析中最重要是业务逻辑和角度,深入理解业务,熟悉数据分析的切入点,就算是excel都可以做出好的分析。tableau是个好东西,功能强大图表类型也很多,技术好的人可以做出很炫的效果,但是用久了会陷入追求图表的效果的漩涡,初学成本也是有的,需要潜心学习几个月才能用的熟练。目前看,毕竟是在国内大环境下,国外产品还是不太符合“国情”。可以试试几款国内的软件,Fine、DataFocus、海致BDP三个都总体不错但各有所长,如果不想花太多时间在学习软件上选DataFocus,想兼顾报表用帆软的报表和BI结合使用,想图形酷炫的话BDP做的不错。看你个人需要。