[ML] 特征提取3种基本方法

 我来答

1个回答

#热议# 空调使用不当可能引发哪些疾病？

白露饮尘霜17
2022-07-05 · TA获得超过1.2万个赞

知道大有可为答主

回答量：6645

采纳率：100%

帮助的人：35.9万

我也去答题访问个人页

关注

展开全部

嵌入（embed） ：学习算法中本来就包含有特征选择的过程，例如决策树一类的分类器，它们在决定分枝点时就会选择最有效的特征来对数据进行划分。但这种方法是在局部空间中进行优选，效果相对有限。
封装(Wrapper)： 特征选择过程与训练过程整合在一起，以模型的预测能力作为衡量特征子集的选择标准，例如分类精度，有时也可加入复杂度惩罚因子。多元线性回归中的前向搜索和后向搜索可以说是封装方法的一种简单实现。不同的学习算法要搭配不同的封装方法，如果是线性分类器，可以采用之前博文谈到的 LASSO方法（glmnet包）。如果是非线性分类器，如树模型则可以采用随机森林封装（RRF包）。封装法可以选择出高质量的子集，但速度会比较慢。
过滤(Filter)： 特征选择过程独立于训练过程，以分析特征子集内部特点来预先筛选，与学习器的选择无关。过滤器的评价函数通常包括了相关性、距离、信息增益等。在数据预处理过程中删除那些取值为常数的特征就是过滤方法的一种。过滤法速度快但有可能删除有用的特征。
在实务中进行特征选择可以先借由专家知识来初步筛选，再用过滤法快速筛选无关变量，最后采用封装法得到最优子集和模型结果。

已赞过 已踩过<

评论收起

科哲生化
2024-08-26 广告

你说的是饮用水标准吗？引起食品不安全的微生物因素主要是其中的致病菌，产毒菌以及腐败菌等，因此菌落总数这一指标并不能恰当的反映应用水的安全情况，而应当对水中的一些具体有害微生物进行限制；取消这一指标，也是与国际标准接轨；另外对这一指标加以控制... 点击进入详情页

本回答由科哲生化提供

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

[ML] 特征提取3种基本方法

为你推荐：