SPSS modeler关联规则apriori里支持度和置信度的值设置为多少比较好 10

SPSSmodeler关联规则apriori里支持度和置信度的值设置为多少比较好,这些值设定为多少对挖掘的结果有什么影响... SPSS modeler关联规则apriori里支持度和置信度的值设置为多少比较好,这些值设定为多少对挖掘的结果有什么影响 展开
 我来答
百度网友a1b219
2019-04-16 · TA获得超过134个赞
知道答主
回答量:273
采纳率:75%
帮助的人:27.7万
展开全部
置信度、支持度、提升度是评价关联规则的三个重要指标。

样本100,条件A=》结果B,A:60,B40,同时发生A和B:30

则:

条件支持度=P(A)=条件A60/样本100=0.6

结果支持度=P(B)=结果B40/样本100=0.4(在sas中称为预期置信度)

规则支持度=P(A&B)=30/100=0.3

规则置信度=P(B|A)=P(A&B)/P(A)=30/60=0.5,即同时发生的记录数除以样本数,

提升度=P(B|A)/P(B)=0.5/0.4=1.25

,注意不要混淆了条件支持度和规则支持度,网文好多只说支持度,实际上有的指的条件支持度、有的值规则支持度,我今天搞了一早上才恍然大悟,效率低啊,自我鄙视一下。

在spss的apriori的运行结果中还有部署能力的概念,观察了一下,发现:部署能力=条件支持度-规则支持度,就是说还有多少人有发展空间,比如有10人,符合条件的有7人,同时如何条件和结果的有4人,那部署能力就是7-4=3人了。

二、算法

关联分析基本就是Apriori算法,没用过其他的。

apriori算法的具体实现就不说,暂时我也说不清楚,我只追求会用,不求甚解,只知道大概步骤就是:1、根据设置的条件支持度找出频繁项集;2、分析找出来的这些频繁项集,得出规则;3、找出大于或等于给定置信度的规则。

一般各个dm软件跑apriori算法的时候都需要设置:最小条件支持度,最小规则置信度,有的还需要设置最大前项数,spss的modeler就需要设置这三个。
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式