频繁项集 数据挖掘 数据格式
我想写一个关于中医方剂数据的文章例如共有一百个方子每个方子包含若干中药想要找出某一药对出现的频次(如:某方同时包含A和B俩个药,那么一百个方子中共有多少个包含A和B?),...
我想写一个关于中医方剂数据的文章 例如共有一百个方子 每个方子包含若干中药 想要找出某一药对出现的频次(如:某方同时包含A和B俩个药,那么一百个方子中共有多少个包含A和B?),我现在用的是weka,数据格式为(下图1,1代表方剂1,2代表方剂2),这样对不对呢? 导入后见下图2。但是,用apriori算法,挖出来的是这样的(下图3),是因为我的数据表格式不对吗,是必须要手工一个个地改成000010000那种吗?谢谢大侠了~~
展开
2个回答
展开全部
严格来说,中药数据挖掘大部分包括了频率分析、聚类分析、因子分析、关联规则和复杂网络。这些分析,建议你最好整理成0和1的格式。就是一列为一个药物,一行为一个药方,用了这个药标记为1,没用标记为0.假如你实在不会整理,可以每个药方整理到一个单元格里,然后每个药物用逗号隔开,我们也可以处理成0和1格式的!
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
美林数据技术股份有限公司
2019-06-26 广告
2019-06-26 广告
美林数据Tempo大数据分析平台,它是一款集数据接入、数据处理、数据挖掘、数据可视化、数据应用于一体的软件产品。它秉持“智能、互动、增值”的设计理念,面向企业级用户提供自助式数据探索与分析能力,为企业提供从BI到AI的一体化数据分析与应用解...
点击进入详情页
本回答由美林数据技术股份有限公司提供
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询