大数据分析一般用什么工具呢?

 我来答
十方融海 2022-03-14
展开全部
大数据分析的具体内容可以分为四步:1、数据获取:需要把握对问题的商业理解,转化成数据问题来解决,直白点讲就是需要哪些数据,从哪些角度来分析,界定问题后,再进行数据采集。这样,就需要数据分析师具备结构化的逻辑思维。2、数据处理:数据的处理需要掌握有效率的工具,例如:Excel基础、常用函数和公式、数据透视表、VBA程序开发等式必备的;其次是Oracle和SQLsever。这是企业大数据分析不可缺少的技能。还有Hadoop之类的分布式数据库,也应该掌握。3、分析数据:分析数据需要各类统计分析模型,如关联规则、聚类、分类、预测模型等等。SPSS…
海同职坐标在线
2020-11-23 · 百度认证:上海海同优才教育培训有限责任公司
海同职坐标在线
向TA提问
展开全部

虽然数据分析的工具千万种,综合起来万变不离其宗。无非是数据获取、数据存储、数据管理、数据计算、数据分析、数据展示等几个方面。而SAS、R、SPSS、python、excel是被提到频率最高的数据分析工具。


  • Python

  • Python,是一种面向对象、解释型计算机程序设计语言。Python语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。

    常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。需要注意的是在您使用扩展类库时可能需要考虑平台问题,某些可能不提供跨平台的实现。

  • R软件

  • R是一套完整的数据处理、计算和制图软件系统。它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。

  • SPSS

  • SPSS是世界上最早的统计分析软件,具有完整的数据输入、编辑、统计分析、报表、图形制作等功能,能够读取及输出多种格式的文件。

  • Excel 

  • 可以进行各种数据的处理、统计分析和辅助决策操作,广泛地应用于管理、统计财经、金融等众多领域。

  • SAS软件

  • SAS把数据存取、管理、分析和展现有机地融为一体。提供了从基本统计数的计算到各种试验设计的方差分析,相关回归分析以及多变数分析的多种统计分析过程,几乎囊括了所有最新分析方法,其分析技术先进,可靠。分析方法的实现通过过程调用完成。许多过程同时提供了多种算法和选项。

十方融海
2022-03-14 广告
大数据分析的具体内容可以分为四步:1、数据获取:需要把握对问题的商业理解,转化成数据问题来解决,直白点讲就是需要哪些数据,从哪些角度来分析,界定问题后,再进行数据采集。这样,就需要数据分析师具备结构化的逻辑思维。2、数据处理:数据的处理需要... 点击进入详情页
本回答由十方融海提供
喵喵喵喵喵咪c7
2019-05-17 · TA获得超过4024个赞
知道小有建树答主
回答量:2277
采纳率:100%
帮助的人:72.2万
展开全部
大数据是宝藏,人工智能是工匠。大数据给了我们前所未有的收集海量信息的可能,因为数据交互广阔,存储空间近乎无限,所以我们再也不用因“没地方放”而不得弃掉那些“看似无用”的数据。
在浩瀚的数据中,如果放置这些数据,不去分析整理,那就相当于一堆废的数据,对我们的发展没有任何意义。今天给大家分享的就是:大数据分析工具的介绍和使用。
工具一:Pentaho BI
Pentaho BI和传统的一些BI产品不一样,这个框架以流程作为中心,再面向Solution(解决方案)。Pentaho BI的主要目的是集成一系列API、开源软件以及企业级别的BI产品,便于商务智能的应用开发。自从Pentaho BI出现后,它使得Quartz、Jfree等面向商务智能的这些独立产品,有效的集成一起,再构成完整且复杂的一项项商务智能的解决方案。

工具二:RapidMiner
在世界范围内,RapidMiner是比较好用的一个数据挖掘的解决方案。很大程度上,RapidMiner有比较先进的技术。RapidMiner数据挖掘的任务涉及了很多的范围,主要包括可以简化数据挖掘的过程中一些设计以及评价,还有各类数据艺术。
工具三:Storm
Storm这个实时的计算机系统,它有分布式以及容错的特点,还是开源软件。Storm可以对非常庞大的一些数据流进行处理,还可以运用在Hadoop批量数据的处理。Storm支持各类编程语言,而且很简单,使用它时相当有趣。像阿里巴巴、支付宝、淘宝等都是它的应用企业。
工具四:HPCC
某个国家为了实施信息高速路施行了一个计划,那就是HPCC。这个计划总共花费百亿美元,主要目的是开发可扩展的一些计算机系统及软件,以此来开发千兆比特的网络技术,还有支持太位级网络的传输性能,进而拓展研究同教育机构与网络连接的能力。
工具五:Hadoop
Hadoop这个软件框架主要是可伸缩、高效且可靠的进行分布式的处理大量数据。Hadoop相当可靠,它假设了计算元素以及存储可能失败,基于此,它为了保证可以重新分布处理失败的节点,维护很多工作数据的副本。Hadoop可伸缩,是因为它可以对PB级数据进行处理。
当数据变得多多益善,当移动设备、穿戴设备以及其他一切设备都变成了数据收集的“接口”,我们便可以尽可能的让数据的海洋变得浩瀚无垠,因为那里面“全都是宝”。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
有的同学不会笑
2020-02-19
知道答主
回答量:47
采纳率:0%
帮助的人:2.5万
展开全部
以前大数据分析会用到多种工具,比如数仓工具、数据建模工具、BI工具等等。现在新一代的大数据分析平台,都是一站式的数据分析平台,一个平台搞定所有。比如亿信一站式数据分析平台(ABI),该平台融合了数据源适配、ETL数据处理、数据建模、数据分析、数据填报、工作流、门户、移动应用等核心功能而打造的一站式数据处理分析平台。提供的数据分析工具丰富:除了中国式复杂报表、dashboard、大屏报表外,ABI还支持自助式分析,包括拖拽式多维分析、看板和看板集,业务用户通过简单拖拽即可随心所欲的进行探索式自助分析。同时,类word即席报告、幻灯片报告,让汇报展示更加出彩。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
海过头
2020-10-16 · TA获得超过4337个赞
知道答主
回答量:88
采纳率:0%
帮助的人:4.6万
展开全部
大数据开发是一个复杂的IT系统,需要学会Hadoop等分布式系统的开发技能。
1.1采集层:Sqoop可用来采集导入传统关系型数据库的数据、Flume对于日志型数据采集,另外使用Python一类的语言开发网络爬虫获取网络数据;
1.2储存层:分布式文件系统HDFS最为常用;
1.3计算层:有不同的计算框架可以选择,常见的如MapReduce、Spark等,一般来讲,如果能使用计算框架的“原生语言”,运算效率会最高(MapReduce的原生支持Java,而Spark原生支持Scala);
1.4应用层:包括结果数据的可视化、交互界面开发以及应用管理工具的开发等,更多的用到Java、Python等通用IT开发前端、后端的能力.
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
数据分析不是个事儿
2020-12-22 · 关于数据分析,积累了些心得与大家分享。
数据分析不是个事儿
采纳数:4 获赞数:11

向TA提问 私信TA
展开全部

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(9)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式