英文翻译 急急急~~~在线等

Therearedifferentdecisiontreealgorithms.Inthelate1970sJ.RossQuinlanintroducedadecisio... There are different decision tree algorithms. In the late 1970s J. Ross Quinlan introduced a decision tree algorithm named ID3. ID3 picks predictors and their splitting values based on the gain in information that the split or splits provide. ID3 was later enhanced in the version called C4.5. Classification and Regression Trees or CART, a relatively new and popular non-parametric analysis technique, was used After these algorithms. Another equally popular decision tree technology to CART is CHAID or Chi- Square Automatic Interaction Detector. CHAID is similar to CART in that it builds a decision tree but it differs in the way that it chooses its splits. Instead of the entropy or Gini metrics for choosing optimal splits the technique relies on the chi-square test used in contingency tables to determine which categorical predictor is furthest from independence with the prediction values (Kovalerchuk and Vityaev, 2000). One of the most important differences between CHAID and the other methods is tree generating. ID3. C 4.5 and CART generate binary trees, whereas CHAID can generate nonbinary trees. CHAID works with all Types of continuous or categorical variables. However, continuous predictor variables automatically categorized for the purpose of the analysis. By means of Chi-Square metrics CHAID is able to separately segment the groups classified in terms of level of relations. Therefore, leaves of the tree have not binary branches but as much branches as the number of different variables in the data. So, it was deemed convenient to use CHAID algorithm method in the study. 展开
污心流泪Ct
2009-06-09 · TA获得超过1022个赞
知道小有建树答主
回答量:734
采纳率:0%
帮助的人:0
展开全部
有各种不同的决策树算法。在20世纪70年代末,J. Ross Quinlan 介绍了一种名为ID3的决策树算法。ID3基于拆分或提供拆分的信息获取来挑选预测值及其拆分值。ID3后来增强版叫C4.5,即分类与回归树,或CART——一种相对新的且流行的非参数分析技术,它在这些算法之后得到应用。另一个与CATR同样流行的决策树技术叫CHAID或卡方自动互动检视法 。CHAID在构建决策树上与CATR类似,但在选择拆分分叉的方法上不同。为选择最佳分叉代替平均信息量或Gini 度量,该技术依赖于相依表中应用卡方测试来确定哪个类别预测值最远离独立的预测值(Kovalerchuk 和Vityaev,2000年)。CHAID 与其他方法相比最重要的不同在于树的生成方式。ID3. C 4.5 和 CART 生成的是二进制树,而CHAID可生成非二进制树。CHAID可完成所有种类的连续或分类变量,然而,连续的预测变量可自动根据分析进行分类。依靠卡方度量CHAID 能够从相关程度分类上对分组进行单个分段。因此,树的分枝没有二进制分支但又和数据不同变量数一样多。所以,它被认为CHAID算法可方便地应用于研究中。
senluWL
2009-06-09 · TA获得超过311个赞
知道答主
回答量:99
采纳率:0%
帮助的人:0
展开全部
(不是我翻译的哦 是用谷歌翻译的,我的英语水平还达不到翻译全文)
有不同的决策树算法。 20世纪70年代末学者罗斯琳昆兰介绍了决策树算法ID3的。 ID3的选择和他们的分裂预测值的基础上获得的信息,或分裂的分裂提供。增强的ID3后来的版本称为C4.5 。分类与回归树或推车,一个相对较新的和流行的非参数分析技术,用在这些算法。另一个同样受欢迎决策树技术车是交互或卡方自动交互检测。交互是类似的车,因为它建立了决策树但不同的方式,它选择了分裂。相反的熵或基尼指标选择最优分割技术依赖卡方检验用于应急表,以确定哪些明确的预测是最远的来自独立的预测值( Kovalerchuk和Vityaev , 2000年) 。其中最重要的区别交互与其它方法是树生成。 ID3的。 ç 4.5和车产生二叉树,而交互可以产生nonbinary树木。交互工程所有类型的连续或绝对的变数。然而,连续预测变量自动分类的目的是分析。通过卡方数据交互能够单独部分的群体划分方面的关系。因此,叶的树没有二进制分行,但多支的数目不同的变量中的数据。因此,有人认为方便使用交互算法的研究。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式