大模型在广告ctr预估中的应用

最新推荐文章于 2024-12-06 21:47:03 发布

WitsMakeMen

最新推荐文章于 2024-12-06 21:47:03 发布

阅读量989

点赞数 7

CC 4.0 BY-SA版权

文章标签：深度学习人工智能机器学习 LLM 广告

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/WitsMakeMen/article/details/135537308

背景

预训练大模型在ctr预估方面取得了不错的效果，但是应用大模型方面还主要停留在提取离线预训练，然后使用大模型的打分结果或者中间的embedding向量，这种级联的应用方式相对灵活方便。但是这种使用大模型提取特征的方式存在自身的问题，那就是通过独立训练得到的特征，对于最终的ctr模型来说不是最优的。主要原因是预训练的大模型和ctr模型存在不对齐的问题，造成大模型提取的特征存在冗余重叠的情况。为了解决这个问题，微软ad团队提出了预训练+联合学习和蒸馏学习的方式，对大模型进行端到端的应用，从而返回大模型真正的威力。
论文：Learning Supplementary NLP Features for CTR Prediction in Sponsored Search

贡献

论文证明了非端到端应用的预训练模型，不能取得最好的ctr预测效果，原因是因为离线提取的特征和ctr特征存在冗余重叠问题，影响到了预训练模型提取特征的效果。
第一次提出了一种预训练+联合学习的方法，相对与离线大模型提取特征的应用方式，本方法能够有效的客服预训练模型提取特征存在冗余重叠的问题，并且提出了一种蒸馏学习的方法，将预训练的大模型中的只是蒸馏到一个更轻量级的小模型中。
基于商业和公共的数据集进行了充分的实验，证明了基于联合学习的方式，取得了显著的效果。基于蒸馏学习的方式，相比于基于特征的蒸馏学习的方式，能够取得两倍显著效果。

实现

预训练+联合学习

在这里插入图片描述

蒸馏学习

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

WitsMakeMen 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。