大数据场景下,非线性核函数的 svm 模型为什么很少用到

 我来答
我是秋毒
2017-08-04 · TA获得超过175个赞
知道小有建树答主
回答量:102
采纳率:0%
帮助的人:87.8万
展开全部

我觉得主要有两点原因:

1、我们要求样本特征维数要和数据集规模成正比,当样本数很多时,样本的特征数也应该很多,如果特征维数很高,往往线性可分(SVM解决非线性分类问题的思路就是将样本映射到更高维的特征空间中),可以直接采用LR或者线性核的SVM;

2、大数据场景下,往往意味着数据集规模庞大,样本很多,如果样本数量很多,由于求解最优化问题的时候,两两样本都需要计算内积,使用非线性核(其实主要就是高斯核)明显计算量会远大于线性核;

另外如果遇到样本数很多,而特征数很少时,应该手动添加一些特征。

推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式