【电商搜索】现代工业级电商搜索技术-EMNLP2024-无监督的用户偏好学习

sp_fyf_2024

于 2024-10-08 22:56:15 发布

阅读量1.2k

点赞数 25

CC 4.0 BY-SA版权

分类专栏：大语言模型电商搜索技术文章标签：神经网络语言模型人工智能数据挖掘深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fyf2007/article/details/142771365

【电商搜索】现代工业级电商搜索技术-EMNLP2024-无监督的用户偏好学习

0. 论文信息

Title: Unsupervised Human Preference Learning
Authors: Sumuk Shashidhar, Abhinav Chinta, Vaibhav Sahai, Dilek Hakkani Tur
Comments: EMNLP 2024 Main Conference
https://arxiv.org/pdf/2410.03731
在这里插入图片描述

1. 摘要：

本文提出了一种新颖的方法，使用小型参数模型作为偏好代理，以生成指导大型预训练模型的自然语言规则，实现个性化内容的高效生成。该方法通过一个小型的本地“方向盘”模型来指导一个更大的基础模型，以产生符合个人偏好的内容，同时利用大模型的广泛知识和能力，且无需对大模型进行微调。实验结果表明，该技术在数据和计算效率方面显著优于现有的个性化方法。

2. 研究背景：

大型语言模型（LLMs）在推理、知识检索和内容生成方面展示了令人印象深刻的能力，但在适应个体用户偏好方面存在挑战。现有的个性化技术，如上下文学习和参数高效微调，难以捕捉人类偏好的复杂性，尤其是在个人数据集较小的情况下。

3. 问题与挑战：

LLMs通常在大规模、通用的数据集上进行训练，这促进了中立性，但限制了它们学习和适应个体

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

sp_fyf_2024 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。