大数据场景下,非线性核函数的 svm 模型为什么很少用到
展开全部
我觉得主要有两点原因:
1、我们要求样本特征维数要和数据集规模成正比,当样本数很多时,样本的特征数也应该很多,如果特征维数很高,往往线性可分(SVM解决非线性分类问题的思路就是将样本映射到更高维的特征空间中),可以直接采用LR或者线性核的SVM;
2、大数据场景下,往往意味着数据集规模庞大,样本很多,如果样本数量很多,由于求解最优化问题的时候,两两样本都需要计算内积,使用非线性核(其实主要就是高斯核)明显计算量会远大于线性核;
另外如果遇到样本数很多,而特征数很少时,应该手动添加一些特征。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询