大数据分析工具有哪些,有什么特点?
Excel:为Excel微软办公套装软件的一个重要的组成部分,它可以进行各种数据的处理、统计分析和辅助决策操作,广泛地应用于管理、统计财经、金融等众多领域。
SAS是由美国北卡罗来纳州立大学1966年开发的统计分析软件,提供从基本统计数的计算到各种试验设计的方差分析,相关回归分析以及多变数分析的多种统计分析过程。
R是一个开源的分析软件,也是分析能力不亚于SPSS和Matlab等商业软件的轻量级分析工具。
SPSS是“统计产品与服务解决方案”软件。除了基本的统计分析功能之外,还提供非线性回归、聚类分析(Clustering)、主成份分析(PCA)和基本的时序分析。
Tableau Software用来快速分析、可视化并分享信息。Tableau Desktop 是基于斯坦福大学突破性技术的软件应用程序。它可以以在几分钟内生成美观的图表、坐标图、仪表盘与报告。
Pytho是一种解释型脚本语言,语法简洁而清晰,具有丰富和强大的类库,现在大数据分析一般都用Python来完成。
数据分析师,在有些公司也会有数据产品经理、数据挖掘工程师等等。他们最初级最主要的工具就是Excel。有些公司也会涉及到像Visio,Xmind、PPT等设计图标数据分析方面的高级技巧。数据分析师是一个需要拥有较强综合能力的岗位,因此,在有些互联网公司仍然需要数据透视表演练、Vision跨职能流程图演练、Xmind项目计划导图演练、PPT高级动画技巧等。
2、数据库:MySQL
Excel如果能够玩的很转,能胜任一部分数据量不是很大的公司。但是基于Excel处理数据能力有限,如果想胜任中型的互联网公司中数据分析岗位还是比较困难。因此需要学会数据库技术,一般Mysql。你需要了解MySQL管理工具的使用以及数据库的基本操作;数据表的基本操作、MySQL的数据类型和运算符、MySQL函数、查询语句、存储过程与函数、触发程序以及视图等。比较高阶的需要学习MySQL的备份和恢复;熟悉完整的MySQL数据系统开发流程。
3、数据可视化:Tableau & Echarts
如果说前面2条是数据处理的技术,那么在如今“颜值为王”的现在,如何将数据展现得更好看,让别人更愿意看,这也是一个技术活。好比公司领导让你对某一个项目得研究成果做汇报,那么你不可能给他看单纯的数据一样,你需要让数据更直观,甚至更美观。
Hadoop HDFS、Hadoop MapReduce, HBase、Hive 渐次诞生,早期Hadoop生态圈逐步形成。
开源生态圈活跃,并免费,但Hadoop对技术要求高,实时性稍差。
2. 商用大数据分析工具
一体机数据库/数据仓库(费用很高)
IBM PureData(Netezza), Oracle Exadata, SAP Hana等等。
数据仓库(费用较高)
Teradata AsterData, EMC GreenPlum, HP Vertica 等等。
数据集市(费用一般)
QlikView、 Tableau 、国内永洪科技Yonghong Data Mart 等等。
前端展现
用于展现分析的前端开源工具有JasperSoft,Pentaho, Spagobi, Openi, Birt等等。
用于展现分析商用分析工具有Cognos,BO, Microsoft, Oracle,Microstrategy,QlikView、 Tableau 、国内永洪科技Yonghong Z-Suite等等。
二、数据可视化,数据可视化也是人们对数据分析软件的需求之一。通过一目了然地展示海量复杂的数据,用户可以更直观地看到数据背后隐藏的信息,从而掌握行业未来的发展趋势。数据可视化可以让员工更容易地了解日常工作进度,分析业务绩效,同时让管理者找到改变整体业务的方法,帮助分析绩效和过去的结果,预测未来的绩效等值。通过分析,可以掌握业务增长和下滑的原因,趋利避害。
虽然数据分析的工具千万种,综合起来万变不离其宗。无非是数据获取、数据存储、数据管理、数据计算、数据分析、数据展示等几个方面。而SAS、R、SPSS、python、excel是被提到频率最高的数据分析工具。
Python
R软件
SPSS
Excel
SAS软件
Python,是一种面向对象、解释型计算机程序设计语言。Python语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。
常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。需要注意的是在您使用扩展类库时可能需要考虑平台问题,某些可能不提供跨平台的实现。
R是一套完整的数据处理、计算和制图软件系统。它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。
SPSS是世界上最早的统计分析软件,具有完整的数据输入、编辑、统计分析、报表、图形制作等功能,能够读取及输出多种格式的文件。
可以进行各种数据的处理、统计分析和辅助决策操作,广泛地应用于管理、统计财经、金融等众多领域。
SAS把数据存取、管理、分析和展现有机地融为一体。提供了从基本统计数的计算到各种试验设计的方差分析,相关回归分析以及多变数分析的多种统计分析过程,几乎囊括了所有最新分析方法,其分析技术先进,可靠。分析方法的实现通过过程调用完成。许多过程同时提供了多种算法和选项。
广告 您可能关注的内容 |