2021-07-30 · 专注大学生职业技能培训在线教育品牌
1、hadoop
Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。Hadoop 还是可伸缩的,能够处理 PB 级数据。此外,Hadoop 依赖于社区服务器,因此它的成本比较低,任何人都可以使用。
2、HPCC
HPCC,High Performance Computing and Communications(高性能计算与通信)的缩写。1993年,由美国科学、工程、技术联邦协调理事会向国会提交了“重大挑战项目:高性能计算与 通信”的报告,也就是被称为HPCC计划的报告,即美国总统科学战略项目,其目的是通过加强研究与开发解决一批重要的科学与技术挑战问题。HPCC是美国实施信息高速公路而上实施的计划,该计划的实施将耗资百亿美元,其主要目标要达到:开发可扩展的计算系统及相关软件,以支持太位级网络传输性能,开发千兆 比特网络技术,扩展研究和教育机构及网络连接能力。
3、Storm
Storm是自由的开源软件,一个分布式的、容错的实时计算系统。Storm可以非常可靠的处理庞大的数据流,用于处理Hadoop的批量数据。Storm很简单,支持许多种编程语言,使用起来非常有趣。Storm由Twitter开源而来,其它知名的应用企业包括Groupon、淘宝、支付宝、阿里巴巴、乐元素、 Admaster等等。
4、Apache Drill
为了帮助企业用户寻找更为有效、加快Hadoop数据查询的方法,Apache软件基金会近日发起了一项名为“Drill”的开源项目。Apache Drill 实现了 Google's Dremel。该项目将会创建出开源版本的谷歌Dremel Hadoop工具(谷歌使用该工具来为Hadoop数据分析工具的互联网应用提速)。而“Drill”将有助于Hadoop用户实现更快查询海量数据集的目的。
5、RapidMiner
RapidMiner是世界领先的数据挖掘解决方案,在一个非常大的程度上有着先进技术。它数据挖掘任务涉及范围广泛,包括各种数据艺术,能简化数据挖掘过程的设计和评价。
6、 Pentaho BI
Pentaho BI 平台不同于传统的BI 产品,它是一个以流程为中心的,面向解决方案(Solution)的框架。其目的在于将一系列企业级BI产品、开源软件、API等等组件集成起来,方便商务智能应用的开发。它的出现,使得一系列的面向商务智能的独立产品如Jfree、Quartz等等,能够集成在一起,构成一项项复杂的、完整的商务智能解决方案。
2、Echarts,这是一款使用纯Java的数据,可视化软件工具,也是属于百度的一个产品,主要就应用于软件的产品开发,有着各种不一样的图表种类,而且还能够体现动态可视化的效果。有着众多不同的图表种类,而且主题也并非只是一种,以往大家所使用的,可能最多也只是对于可视化进行定制,但是在这一个软件中主要以图表为准,也提供文本和表格的一种模式,可以按照相应的需求直接就引入表格或者是文本。
3、HighCharts,这也是一款具有可视化效果的数据可视化软件工具,虽然说属于国外的产品,但是相对来说,文档的介绍还是比较详细的,有着众多不一样的图表种类,但是也同样需要进行二次开发,不过就是因为需要付费的问题,可能很多人会放弃这一款软件,而选择其他的一些软件。
4、AntV,是来自于蚂蚁金服的一款数据可视化软件工具,不仅仅能够有效体现可视化的一种作用,而且还会具备数据简单分析的一种能力。不过在使用过程中也同样需要进行二次开发,就是因为所选择的语法本身就有一定优势性,很多企业在使用过程中也会觉得更具有方便的特色,难怪也引来更多人的认可。