模型的选择

 我来答
会哭的礼物17
2022-06-06
知道答主
回答量:0
采纳率:0%
帮助的人:0
展开全部

将现实的问题映射到这四个大类,比如,搜索排序的问题,可以转化为“点击”“不点击”的分类问题,逻辑回归分类的输出是概率,就可以根据这个概率实现排序。

复杂的模型,如深度学习、SVM,需要很多的数据来喂饱他,数据量太小的话,会容易过拟合。到底多少的数据量能够满足深度学习的要求呢?这个没有标准答案,还需要看你数据的分布是怎样的。

模型选择跟数据形态有关系,文本、多媒体、还是结构化数据?比如文本数据,可以用朴素贝叶斯。

超参数 的选择。
比如选用多项式回归,那么选择多少阶呢?
试试不同的超参数,然后评估效果的好坏来验证。
常用的调参方法是: 网格搜索+交叉验证

K折交叉验证的意思是,把测试数据切成K份,每次用其中一份作为验证集,其他的数据用来训练。
可以用K折交叉验证,也可以直接切出验证集(留出法)。
比赛中用K折交叉验证比较多,因为数据集是有限的,需要充分利用。而工业中直接切出验证集比较多,因为工业中的数据量大,根据大数定理,验证集能够代表整体。
交叉验证是一种评估模型和超参数的方式,不是用来调参的。交叉验证的K个模型最后都不会直接用,流程是:
1、选一组超参数(或选一种模型)。
2、然后进行K折交叉验证,发现使用这组参数(或这个模型)的时候,这K个模型的准确度比较好,就确定使用这组超参(或模型)。
3、然后用全量的数据来训练出真正要用的模型。

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
景联文科技
2024-06-11 广告
杭州景联文科技有限公司专注于大模型数据集的研发与应用。我们深知,在人工智能飞速发展的时代,数据是驱动模型优化的核心动力。因此,我们致力于构建丰富、多元的大模型数据集,涵盖各行各业,为AI模型提供充足的“养分”。通过不断积累与优化,我们的数据... 点击进入详情页
本回答由景联文科技提供
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式