数据挖掘的功能 数据挖掘可以挖掘到什么类型的模式
1个回答
展开全部
数据挖掘功能用于指定数据挖掘任务要找的模式类型.一般而言,数据挖掘任务可以分两类:描述和预测.描述性挖掘任务描述数据库中的数据的一般性质.预测性挖掘任务对当前数据进行推断,以做出预测.
概念/类描述:特征化和区分
数据特征化
数据区分
挖掘频繁模式,关联和相关
关联分析.假设作为AllElectronics的市场部经理,想确定在相同的事务中,哪些商品经常被一起购买.从AllElectronics事务数据库中挖掘出来的这种规则的一个例子是
buys (X, "computer") => buys(X, "software") [support = 1%, confidence = 50%]
其中,X是变量,代表顾客.50%的置信度或可信性表示,如果一位顾客购买计算机,则购买软件的可能性是50%.1%的支持度意味所分析的所有事务的1%显示计算机与软件一起购买.这个关联规则涉及单个重复的属性或谓词(即 buys).包含单个谓词的关联规则称作单维关联规则(single-dimensional association rule).去掉谓词符号,上面的规则可以简单地写成 "computer => software [1%, 50%]".
假设给定涉及购买的AllElectronics关系数据库.数据挖掘系统还可以发现如下形式的规则:
age(X, "20...29") ^ income(X, "20K...29K") => buys(X, "CD player") [support = 2%, confidence = 60%]
该规则指出,所研究的AllElectronics顾客,2%是20 ~ 29岁,年收入为2000 ~ 29000,并且在AllElectronics购买了CD播放机.这个年龄和收入组的顾客购买CD机的概率为60%.注意,这个属性称为一维,上面的规则可以称作多维关联规则 (multidimensional association rule).
概念/类描述:特征化和区分
数据特征化
数据区分
挖掘频繁模式,关联和相关
关联分析.假设作为AllElectronics的市场部经理,想确定在相同的事务中,哪些商品经常被一起购买.从AllElectronics事务数据库中挖掘出来的这种规则的一个例子是
buys (X, "computer") => buys(X, "software") [support = 1%, confidence = 50%]
其中,X是变量,代表顾客.50%的置信度或可信性表示,如果一位顾客购买计算机,则购买软件的可能性是50%.1%的支持度意味所分析的所有事务的1%显示计算机与软件一起购买.这个关联规则涉及单个重复的属性或谓词(即 buys).包含单个谓词的关联规则称作单维关联规则(single-dimensional association rule).去掉谓词符号,上面的规则可以简单地写成 "computer => software [1%, 50%]".
假设给定涉及购买的AllElectronics关系数据库.数据挖掘系统还可以发现如下形式的规则:
age(X, "20...29") ^ income(X, "20K...29K") => buys(X, "CD player") [support = 2%, confidence = 60%]
该规则指出,所研究的AllElectronics顾客,2%是20 ~ 29岁,年收入为2000 ~ 29000,并且在AllElectronics购买了CD播放机.这个年龄和收入组的顾客购买CD机的概率为60%.注意,这个属性称为一维,上面的规则可以称作多维关联规则 (multidimensional association rule).
美林数据技术股份有限公司
2023-08-27 广告
2023-08-27 广告
常见的大数据分析工具有:1. Hadoop:分布式计算框架,适合处理大量数据,但学习曲线较陡峭。2. Spark:实时大数据分析工具,易用性好,可扩展性强,但易用性相对较差。3. Flink:实时数据分析工具,处理速度快,可扩展性好,但社区...
点击进入详情页
本回答由美林数据技术股份有限公司提供
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询