关于数据挖掘中的apriori算法,帮忙推出关联规则 事务数为 5 支持度为0.6,置信度为0.6
所选项集:abcacdebcdfabcdabcdf候选集1:abcdef频繁集1:abcd候选集2:abacadbcbdcd频繁集2:abacadbcbdcd候选集3:a...
所选项集: abc acde bcdf abcd abcdf
候选集1: a b c d e f
频繁集1: a b c d
候选集2: ab ac ad bc bd cd
频繁集2: ab ac ad bc bd cd
候选集3: abc abd acd bcd
频繁集3: abc acd bcd
候选集4: abcd
频繁集4:
最大频繁项集:abc acd bcd
关联规则: 展开
候选集1: a b c d e f
频繁集1: a b c d
候选集2: ab ac ad bc bd cd
频繁集2: ab ac ad bc bd cd
候选集3: abc abd acd bcd
频繁集3: abc acd bcd
候选集4: abcd
频繁集4:
最大频繁项集:abc acd bcd
关联规则: 展开
2个回答
展开全部
abc的支持数P1=3,acd的支持数P2=3,bcd的支持数P3=3,关联规则的输出就是在由频繁项集的项组成的关联规则中,找出置信度大于等于最小置信度阈值的关联规则。因为由频繁项集的项组成的关联规则的支持度大于等于最小支持阈值,所以规则产生过程就是在由频繁项集的项组成的关联规则中,找出置信度大于等于最小置信度阈值的强关联规则,基本步骤如下:
1) 对于每个频繁项集L,产生L的所有非空真子集。
2) 对于L的每个非空真子集 ,如果L的支持计数除以 的支持计数大于等于最小置信度阈值min_conf,则输出强关联规则 =>(L- )。
例如:abc的非空真子集有a,b,c,ab,ac,bc。分别算出他们的支持数,再除以abc的支持数,若结果大于0.6则可输出强关联规则。Pa/P1=4/3>0.6,则可以输出关联规则:a=>bc;同理可输出强关联规则:b=>ac,c=>ab;
同理,对于acd,bcd采用同样地方法。
1) 对于每个频繁项集L,产生L的所有非空真子集。
2) 对于L的每个非空真子集 ,如果L的支持计数除以 的支持计数大于等于最小置信度阈值min_conf,则输出强关联规则 =>(L- )。
例如:abc的非空真子集有a,b,c,ab,ac,bc。分别算出他们的支持数,再除以abc的支持数,若结果大于0.6则可输出强关联规则。Pa/P1=4/3>0.6,则可以输出关联规则:a=>bc;同理可输出强关联规则:b=>ac,c=>ab;
同理,对于acd,bcd采用同样地方法。
美林数据技术股份有限公司
2020-10-29 广告
2020-10-29 广告
Tempo大数据分析平台,是一款面向企业用户的数据分析与应用工具,为用户提供报表设计、可视化分析、机器学习、文本分析等自助式数据分析与探索。平台基于大数据架构,集数据接入、数据分析探索、成果管理与应用为一体,面向企业全民用户提供从数据到业务...
点击进入详情页
本回答由美林数据技术股份有限公司提供
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询