从损失函数的角度解释为什么lr做点击率预测不如GBDT好

 我来答
hql______
2016-05-09 · TA获得超过3.6万个赞
知道大有可为答主
回答量:8385
采纳率:85%
帮助的人:4003万
展开全部
logistic regression 是线性模型,如果不对特征做比较多的变换的话,特征维度很低表达能力自然就差。GBDTt里面非线性的变换很多,表达能力就强很多。
Facebook的 CTR prediction 使用过以GBDT的输出作为feature的 LR Model, 效果相对于单独的GBDT和LR是要更好一些的。参见 ‘Practical Lessons from Predicting Clicks on Ads at Facebook’。这篇论文里把GBDT的每个leaf都用binary encoding来表示,实际上使得LR能够学习到GBDT所能表达的任何结果。
事实上很多feature extraction能力强大的model稍作改造都是可以拿来作为LR的输入的。方法得当的话,LR还是很强大的。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式