频繁项集 数据挖掘 数据格式

我想写一个关于中医方剂数据的文章例如共有一百个方子每个方子包含若干中药想要找出某一药对出现的频次(如:某方同时包含A和B俩个药,那么一百个方子中共有多少个包含A和B?),... 我想写一个关于中医方剂数据的文章 例如共有一百个方子 每个方子包含若干中药 想要找出某一药对出现的频次(如:某方同时包含A和B俩个药,那么一百个方子中共有多少个包含A和B?),我现在用的是weka,数据格式为(下图1,1代表方剂1,2代表方剂2),这样对不对呢? 导入后见下图2。但是,用apriori算法,挖出来的是这样的(下图3),是因为我的数据表格式不对吗,是必须要手工一个个地改成000010000那种吗?谢谢大侠了~~ 展开
 我来答
渣吟软师星0z
2018-08-03
知道答主
回答量:11
采纳率:0%
帮助的人:2.2万
展开全部
严格来说,中药数据挖掘大部分包括了频率分析、聚类分析、因子分析、关联规则和复杂网络。这些分析,建议你最好整理成0和1的格式。就是一列为一个药物,一行为一个药方,用了这个药标记为1,没用标记为0.假如你实在不会整理,可以每个药方整理到一个单元格里,然后每个药物用逗号隔开,我们也可以处理成0和1格式的!
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
美林数据技术股份有限公司
2019-06-26 广告
美林数据Tempo大数据分析平台,它是一款集数据接入、数据处理、数据挖掘、数据可视化、数据应用于一体的软件产品。它秉持“智能、互动、增值”的设计理念,面向企业级用户提供自助式数据探索与分析能力,为企业提供从BI到AI的一体化数据分析与应用解... 点击进入详情页
本回答由美林数据技术股份有限公司提供
avhg
2013-11-14 · TA获得超过129个赞
知道答主
回答量:140
采纳率:0%
帮助的人:75.3万
展开全部
数据表格式不对。weka没有处理事务表的格式吧?(有大侠知道有的话麻烦指正啊),事务表格式用spss可以做。SQL转置处理一下或者写个脚本转置一下吧
本回答被提问者采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式