python中的sklearn中决策树使用的是哪一种算法

 我来答

3个回答

#热议# 上班途中天气原因受伤算工伤吗？

从空去听8
2017-12-30 · TA获得超过7439个赞

知道大有可为答主

回答量：6907

采纳率：93%

帮助的人：5566万

我也去答题访问个人页

关注

展开全部

要弄清楚这个问题，首先要弄懂决策树三大流行算法ID3、C4.5和CART的原理，以及sklearn框架下DecisionTreeClassifier的帮助文档。
3个算法的主要区别在于度量信息方法、选择节点特征还有分支数量的不同。
ID3，采用熵（entropy）来度量信息不确定度，选择“信息增益”最大的作为节点特征，它是多叉树，即一个节点可以有多个分支。
C4.5，同样采用熵（entropy）来度量信息不确定度，选择“信息增益比”最大的作为节点特征，同样是多叉树，即一个节点可以有多个分支。
CART，采用基尼指数（Gini index）来度量信息不纯度，选择基尼指数最小的作为节点乎则特征，它是二叉树，即一个节点只分两支。
然后你认真阅读sklearn的DecisionTreeClassifier的帮助文档，可以发现，度量信息的方法默认是Gini，但可以改成entropy，请按需选择；构建的贺顷滚树是二叉禅余树；可以通过设置max_deepth、max_leaf等来实现“剪枝”，这是根据CART的损失函数减少的理论进行的。
所以总结说，如果信息度量方法按照默认的设置，那么sklearn所用的决策树分类器就是CART，如果改成了entropy，那么只是使用了别的度量方法而已。其实两者差不多。

已赞过 已踩过<

评论收起

光点科技
2023-08-15 广告

通常情况下，我们会按照结构模型把系统产生的数据分为三种类型：结构化数据、半结构化数据和非结构化数据。结构化数据，即行数据，是存储在数据库里，可以用二维表结构来逻辑表达实现的数据。最常见的就是数字数据和文本数据，它们可以某种标准格式存在于文件... 点击进入详情页

本回答由光点科技提供

人有于人5154
2016-10-15

知道答主

回答量：25

采纳率：100%

帮助的人：12.7万

我也去答题访问个人页

关注

展开全部

1首先需要安装Cython，网上下载后进行键轿本地安装pythonsetup.pyinstall2下载Sklearn包，进行本地安液慧装（使用pip或easy_install总是出错，如cannotimportmurmurhash3_32，最终本地安装成功）3安装后可用nosetests-vsklearn来闹亮答进行测试

本回答被提问者采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

飞蓝天
2017-03-10

知道答主

回答量：30

采纳率：0%

帮助的人：7.9万

我也去答题访问个人页

关注

展开全部

好像是GINI，但是也可以选择信息增益

已赞过 已踩过<

评论收起

更多回答（1）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

python中的sklearn中决策树使用的是哪一种算法

其他类似问题

为你推荐：