从损失函数的角度解释为什么lr做点击率预测不如GBDT好
1个回答
展开全部
logistic regression 是线性模型,如果不对特征做比较多的变换的话,特征维度很低表达能力自然就差。GBDTt里面非线性的变换很多,表达能力就强很多。
Facebook的 CTR prediction 使用过以GBDT的输出作为feature的 LR Model, 效果相对于单独的GBDT和LR是要更好一些的。参见 ‘Practical Lessons from Predicting Clicks on Ads at Facebook’。这篇论文里把GBDT的每个leaf都用binary encoding来表示,实际上使得LR能够学习到GBDT所能表达的任何结果。
事实上很多feature extraction能力强大的model稍作改造都是可以拿来作为LR的输入的。方法得当的话,LR还是很强大的。
Facebook的 CTR prediction 使用过以GBDT的输出作为feature的 LR Model, 效果相对于单独的GBDT和LR是要更好一些的。参见 ‘Practical Lessons from Predicting Clicks on Ads at Facebook’。这篇论文里把GBDT的每个leaf都用binary encoding来表示,实际上使得LR能够学习到GBDT所能表达的任何结果。
事实上很多feature extraction能力强大的model稍作改造都是可以拿来作为LR的输入的。方法得当的话,LR还是很强大的。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询