训练集和测试集划分比例

 我来答
小么社会生活说
2022-11-08 · TA获得超过1177个赞
知道大有可为答主
回答量:6182
采纳率:100%
帮助的人:60.1万
展开全部

一般分配比例为训练集和测试集的比例为7:3或是8:2。

训练集(Training Set)含义:帮助我们训练模型,即通过训练集的数据让我们确定拟合曲线的参数。

测试集(Test Set)含义: 为了测试已经训练好的模型的精确度。因为在训练模型的时候,参数全是根据现有训练集里的数据进行修正、拟合,有可能会出现过拟合的情况,即这个参数仅对训练集里的数据拟合比较准确,如果出现一个新数据需要利用模型预测结果,准确率可能就会很差。

常见的划分方法:留出法。直接将数据集D划分为两个互斥的的集合,其中一个集合作为训练集S,另一个作为测试集T,即D=S∪T, S ∩ T = 空集。在S上训练出模型后,用T来评估其误差。

一般,在用留出法划分集合的时候,会通过若干次随机划分、重复实验评估后取平均值作为留出法的评估结果,减少误差。

如果我们训练集的比例比较大,可能会导致训练出的模型更接近于用D训练出的模型,同时T较小,评价结果又不够准确;若T的比例比较大,则有可能导致评估的模型与之前有较大的差别,从而降低了评估的保真性。这个问题没有完美的解决方案,常见的做法是将大约2/3~4/5的样本用于训练。

洪兴管理咨询有限公司
2024-06-25 广告
CNAS能力附表是公司为确保实验室检测、校准服务符合国际标准的重要文档。该表详细列出了公司所具备的检测、校准能力和对应的技术标准,以及特定领域的专业资质。通过对各项能力的清晰展示,CNAS能力附表不仅体现了公司的专业实力,也为客户提供了明确... 点击进入详情页
本回答由洪兴管理咨询有限公司提供
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式