如何处理机器学习中的不平衡分类问题

 我来答

1个回答

#热议# 普通体检能查出癌症吗？

dajiang983
2017-06-17 · 知道合伙人教育行家

dajiang983
知道合伙人教育行家

采纳数：41375 获赞数：317581

向TA提问私信TA

关注

展开全部

常规的分类评价指标可能会失效，比如将所有的样本都分类成大类，那么准确率、精确率等都会很高。这种情况下，AUC时最好的评价指标。
你能够使用原型选择技术去降低不平衡水平。选择那些重要的样本。One-Sided Selection (OSS) 是一个预处理技术（模型训练之前使用），能够处理类别不平衡问题。
从另一个角度，可以增加小类的样本个数，可以使用过采样与原型生成技术（prototype-generation techniques）。
在K-Fold 校验中，每一份数据集中原则上应该保持类别样本比例一样或者近似，如果每份数据集中小类样本数目过少，那么应该降低K的值，知道小类样本的个数足够。
一般来说，如果事前不对不平衡问题进行处理，那么对于小类别的样本则会错误率很高，即大部分甚至全部小类样本都会分错。

本回答由提问者推荐

已赞过 已踩过<

评论收起

超维机器人
2023-06-20 广告

简单来讲智能巡检机器人价值主要体现在五个方面：运维自动化、运维可视化、运维可靠性、运维安全性、运维性价比，具体主要体现在以下三大功能：巡检、迎检、资产盘点一、巡检功能主要是对机房环境、设备工作状态的日常巡检，按照客户原有的巡检管理制度来执行... 点击进入详情页

本回答由超维机器人提供

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

如何处理机器学习中的不平衡分类问题

其他类似问题

为你推荐：