![](https://iknow-base.cdn.bcebos.com/lxb/notice.png)
训练集和测试集划分比例
1个回答
展开全部
一般分配比例为训练集和测试集的比例为7:3或是8:2。
训练集(Training Set)含义:帮助我们训练模型,即通过训练集的数据让我们确定拟合曲线的参数。
测试集(Test Set)含义: 为了测试已经训练好的模型的精确度。因为在训练模型的时候,参数全是根据现有训练集里的数据进行修正、拟合,有可能会出现过拟合的情况,即这个参数仅对训练集里的数据拟合比较准确,如果出现一个新数据需要利用模型预测结果,准确率可能就会很差。
常见的划分方法:留出法。直接将数据集D划分为两个互斥的的集合,其中一个集合作为训练集S,另一个作为测试集T,即D=S∪T, S ∩ T = 空集。在S上训练出模型后,用T来评估其误差。
一般,在用留出法划分集合的时候,会通过若干次随机划分、重复实验评估后取平均值作为留出法的评估结果,减少误差。
如果我们训练集的比例比较大,可能会导致训练出的模型更接近于用D训练出的模型,同时T较小,评价结果又不够准确;若T的比例比较大,则有可能导致评估的模型与之前有较大的差别,从而降低了评估的保真性。这个问题没有完美的解决方案,常见的做法是将大约2/3~4/5的样本用于训练。
![](https://ecmc.bdimg.com/public03/b4cb859ca634443212c22993b0c87088.png)
2024-06-25 广告
CNAS能力附表是公司为确保实验室检测、校准服务符合国际标准的重要文档。该表详细列出了公司所具备的检测、校准能力和对应的技术标准,以及特定领域的专业资质。通过对各项能力的清晰展示,CNAS能力附表不仅体现了公司的专业实力,也为客户提供了明确...
点击进入详情页
本回答由洪兴管理咨询有限公司提供
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询