决策树原理与Sklearn参数详解

 我来答
新科技17
2022-06-07 · TA获得超过5873个赞
知道小有建树答主
回答量:355
采纳率:100%
帮助的人:73.5万
展开全部
目录

1、决策树(Decision Tree)原理

2、Sklearn DecisionTreeClassifiter 参数详解

3、Sklearn DecisionTreeRegresion 参数详解

4、总结

1、决策树(Decision Tree)原理

2、DecisionTreeClassifiter核心参数详解:

3、DecisionTreeRegressor核心参数详解:

回归树参数 :与分类树基本相同,比较值得一提的是criterion。在回归树中criterion衡量分枝质量的指标有三种:

1、输入“mse”使用均方误差mean squared err(MSE), 父节点和子节点之间的均方误差的差额将被用来作为特征选择的标准 ,这种方法通过使用叶子节点的均值来最小化L2损失。

2、输入“friedman_mse”使用费尔德曼均方误差,这种指标使用费尔德曼针对潜在分枝中的问题改进后的均方误差。

3、输入“mae”使用绝对平均误差MAE(mean absolute error),这种指标使用叶节点的中值来最小化L1损失。

, 其中N是样本数量,i是每一个数据样本,fi是模型回归出的数值,yi是样本点i实际的数值标签。因此MSE的本质是回归值与真实值的差异。 在回归树中,MSE不仅是最优的分枝指标,也是最常用的衡量回归树回归质量的指标。

回归树接口:

score: 返回的是R平方,并不是MSE。R平方定义如下:

, , ,

其中u是残差平方和(MSE*N),v是总平方和,N是样本数量,i是每个样本,fi是模型回归出的值,yi是样本点i的实际数值标签。y帽是真实数值标签的平均数。

R2可以为正也可以为负,当残差平方和远远大于模型总平方和时,模型非常糟糕,R2为负;但MSE永远为正。但Sklearn当中使用均方误差作为评判标准时,却是计算“负均方误差”(neg_mean_squared_error)以负数表示。其实就是MSE前加了个负号。

总结: 本文详细介绍了决策树创建过程以及决策树的工作原理,同时对sklearn中DecisionTreeClassifiter和DecisionTreeRegressor核心参数、属性、接口进行了介绍。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
光点科技
2023-08-15 广告
通常情况下,我们会按照结构模型把系统产生的数据分为三种类型:结构化数据、半结构化数据和非结构化数据。结构化数据,即行数据,是存储在数据库里,可以用二维表结构来逻辑表达实现的数据。最常见的就是数字数据和文本数据,它们可以某种标准格式存在于文件... 点击进入详情页
本回答由光点科技提供
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式