ETL的原理?

哪位高手做过ETL工具告诉俺一下原理呗!俺公司有一批数据要做数据挖掘,筛选,让俺简单针对这批数据做一个!... 哪位高手 做过ETL工具 告诉俺一下原理呗!俺公司有一批数据要做数据挖掘,筛选,让俺简单针对这批数据做一个! 展开
 我来答
派可数据PackingData
2021-06-11 · 百度认证:北京派可数据科技有限公司官方账号
派可数据PackingData
向TA提问
展开全部

ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。

数据仓库是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。

ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据, ETL是BI(商业智能)项目重要的一个环节。

扩展资料:

ETL与ELT:

ETL所描述的过程,一般常见的作法包含ETL或是ELT(Extract-Load-Transform),并且混合使用。通常愈大量的数据、复杂的转换逻辑、目的端为较强运算能力的数据库,愈偏向使用ELT,以便运用目的端数据库的平行处理能力。

ETL(orELT)的流程可以用任何的编程语言去开发完成,由于ETL是极为复杂的过程,而手写程序不易管理,有愈来愈多的企业采用工具协助ETL的开发,并运用其内置的metadata功能来存储来源与目的的对应(mapping)以及转换规则。

工具可以提供较强大的连接功能(connectivity)来连接来源端及目的端,开发人员不用去熟悉各种相异的平台及数据的结构,亦能进行开发。当然,为了这些好处,付出的代价便是金钱。

上海巴鲁图工程机械科技有限公司_
2022-05-15 广告
光电编码器,是一种通过光电转换将输出轴上的机械几何位移量转换成脉冲或数字量的传感器。光电编码器每转输出60(我们用老板没有说)个脉冲,五线制。其中两根为电源线,三根为脉冲线(A相、B相、Z)。电源的工作电压为 (+5~+24V)直流电源。光... 点击进入详情页
本回答由上海巴鲁图工程机械科技有限公司_提供
shuaniqian
2012-12-21 · 超过15用户采纳过TA的回答
知道答主
回答量:54
采纳率:66%
帮助的人:31.7万
展开全部
ETL 其实就是把源数据加工成你想要的数据 然后放到你想放到的DB中或者file里 ,工具有很多 微软的 SSIS java里面的kettle IBM 的informatica ,datastage都可以进行上面的工具 前期的话 推荐你用微软的ETL工具 ,他是一套BI系统,可以后期进行多维分析,报表分析等
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
iceglaze
推荐于2018-04-11 · TA获得超过2639个赞
知道小有建树答主
回答量:1132
采纳率:100%
帮助的人:749万
展开全部
ETL是数据抽取(Extract)、清洗(Cleaning)、转换(Transform)、装载(Load)的过程。每个过程都有数据算法在里面。建议你看一下《数据挖掘》这本书,然后选择上面的部分算法来实现你的软件。
本回答被网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
找食的虫
2012-12-20
知道答主
回答量:49
采纳率:0%
帮助的人:24.1万
展开全部
其实简单的说,就是由源数据向目标表导入数据的一个过程,只是在这中间我们需要对数据进行筛选,选出你所需要的,如果你用的是IBM公司的informatic/datastage那就简单了直接拖取控件就行,在空间中加入条件,如果你用的是微软的产品那你需要做一个ssis包。其实原理是一样的。还有就是谨记插入数据之前先truncate。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(2)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式