关于R语言和数据挖掘的
我们手头有一个海南省的联通用户订购联通数据包套餐的数据,我们打算根据现有数据使用NaiveBayes方法预测新的消费者最有可能订购哪个联通数据包套餐。现有数据集当中消费者...
我们手头有一个海南省的联通用户订购联通数据包套餐的数据,我们打算根据现有数据使用Naive Bayes 方法预测新的消费者最有可能订购哪个联通数据包套餐。现有数据集当中消费者的信息有一列是消费者目前的详细居住地址。联通数据挖掘项目组讨论数据挖掘时有2 种意见:A)使用Naive Bayes 方法训练数据时,地址精确到海南的县市一级即可。B)地址应精确到小区,这样才能提高精确度。假设你是负责联通数据挖掘项目的主管,请你评价以上2 种意见。你认为地址列数据最好的处理方法应该是怎样的呢?
展开
1个回答
2015-08-07 · 知道合伙人金融证券行家
关注
展开全部
这个问题跟工具无关,而是跟业务专业相关,当然单纯从数据挖掘角度来说,越详细可能会越体现效果,但是我觉得应该从以下方面考虑:
首先是看你们的后期资源和推广能力能否精确到小区进行,比如就算你们通过挖掘发现不同小区之间有差异化特性,那你们后期的营销或推广团队能否有这个力度将其进行小区个性化的产品服务。
其次是从数据挖掘的角度来看,可以精确到小区没问题的,因为本身就是通过数据挖掘系统来进行操作,多一层变量无非是对硬件资源和运行效率多了一些需求,而且数据挖掘之后可能会发现小区这个变量未必会有价值。
首先是看你们的后期资源和推广能力能否精确到小区进行,比如就算你们通过挖掘发现不同小区之间有差异化特性,那你们后期的营销或推广团队能否有这个力度将其进行小区个性化的产品服务。
其次是从数据挖掘的角度来看,可以精确到小区没问题的,因为本身就是通过数据挖掘系统来进行操作,多一层变量无非是对硬件资源和运行效率多了一些需求,而且数据挖掘之后可能会发现小区这个变量未必会有价值。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询