kettle 处理来自两个数据流的数据 100
1.Join我得到A数据流(不管是基于文件或数据库),A包含field1,field2,field3字段,然后我还有一个B数据流,B包含field4,field5,fie...
1. Join
我得到A 数据流(不管是基于文件或数据库),A包含field1 , field2 , field3 字段,然后我还有一个B数据流,B包含field4 , field5 , field6 , 我现在想把它们 ‘加’ 起来, 应该怎么样做.
这是新手最容易犯错的一个地方,A数据流跟B数据流能够Join,肯定是它们包含join key ,join key 可以是一个字段也可以是多个字段。如果两个数据流没有join key ,那么它们就是在做笛卡尔积,一般很少会这样。
2. 多数据源输入,(可能是文本或是两个以上源数据库),用database join 操作.
------------------------------------以上是网上找来的----------------------------------
我自己试验的结果,database join是需要数据库连接的,根本不能处理来自文本的数据流。
我要处理两个数据流,A包含fieldA , field2 , field3 字段,B包含fieldB , field5 , field6,其中fieldA和fieldB要做比较,同时在两个filed里面的数据被筛选出来,并将对应的field2、3、5、6输出到文本中去,该怎么做? 展开
我得到A 数据流(不管是基于文件或数据库),A包含field1 , field2 , field3 字段,然后我还有一个B数据流,B包含field4 , field5 , field6 , 我现在想把它们 ‘加’ 起来, 应该怎么样做.
这是新手最容易犯错的一个地方,A数据流跟B数据流能够Join,肯定是它们包含join key ,join key 可以是一个字段也可以是多个字段。如果两个数据流没有join key ,那么它们就是在做笛卡尔积,一般很少会这样。
2. 多数据源输入,(可能是文本或是两个以上源数据库),用database join 操作.
------------------------------------以上是网上找来的----------------------------------
我自己试验的结果,database join是需要数据库连接的,根本不能处理来自文本的数据流。
我要处理两个数据流,A包含fieldA , field2 , field3 字段,B包含fieldB , field5 , field6,其中fieldA和fieldB要做比较,同时在两个filed里面的数据被筛选出来,并将对应的field2、3、5、6输出到文本中去,该怎么做? 展开
展开全部
使用Merge Join,按照你说的“同时在两个filed里面的数据被筛选出来”,应该使用内连接【INNER】方式,然后再在后续步骤中将自己需要的字段输出。
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
七鑫易维信息技术
2024-09-02 广告
2024-09-02 广告
Play Video 七鑫易维是致力于机器视觉和人工智能领域的高新科技企业,迄今已专注眼球追踪技术的研发、创新与应用超过14年,拥有完全自主知识产权,全球专利总量655余项。 作为眼球追踪技术领域的全球知名品牌,七鑫易维的产品体系覆盖眼动分...
点击进入详情页
本回答由七鑫易维信息技术提供
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询