如何处理机器学习中的不平衡分类问题

 我来答
dajiang983
2017-06-17 · 知道合伙人教育行家
dajiang983
知道合伙人教育行家
采纳数:41375 获赞数:317581

向TA提问 私信TA
展开全部
常规的分类评价指标可能会失效,比如将所有的样本都分类成大类,那么准确率、精确率等都会很高。这种情况下,AUC时最好的评价指标。
你能够使用原型选择技术去降低不平衡水平。选择那些重要的样本。One-Sided Selection (OSS) 是一个预处理技术(模型训练之前使用),能够处理类别不平衡问题。
从另一个角度,可以增加小类的样本个数,可以使用过采样与原型生成技术(prototype-generation techniques)。
在K-Fold 校验中,每一份数据集中原则上应该保持类别样本比例一样或者近似,如果每份数据集中小类样本数目过少,那么应该降低K的值,知道小类样本的个数足够。
一般来说,如果事前不对不平衡问题进行处理,那么对于小类别的样本则会错误率很高,即大部分甚至全部小类样本都会分错。
超维机器人
2023-06-20 广告
简单来讲智能巡检机器人价值主要体现在五个方面:运维自动化、运维可视化、运维可靠性、运维安全性、运维性价比,具体主要体现在以下三大功能:巡检、迎检、资产盘点一、巡检功能主要是对机房环境、设备工作状态的日常巡检,按照客户原有的巡检管理制度来执行... 点击进入详情页
本回答由超维机器人提供
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式