推荐算法：重排

最新推荐文章于 2025-01-05 19:30:36 发布

老弓爱学习

最新推荐文章于 2025-01-05 19:30:36 发布

阅读量1k

点赞数 28

CC 4.0 BY-SA版权

文章标签：推荐算法

本文链接：https://blog.csdn.net/qq_34517343/article/details/143082798

1.物品的相似性度量、提升多样性的方法

物品相似性度量

基于属性、基于物品向量

基于图文的（CNN+BERT）

CLIP 最有效的预训练方法

n对图片+文字，组成n(n-1)对负样本

提升多样性的方法

精排：给定n个候选物品，模型打分reward1，…rewardn

从n个中选k个

2.Maximal Marginal Relevance（MMR）[两两相似度]

精排给定n个候选物品，模型打分reward1，…rewardn

相似性sim(i,j)

选中集合S，未选中集合R

计算集合中每个物品i的Marginal Relevance分数：
$MR_i=\theta\cdot reward_i-(1-\theta)\cdot \mathop{\max}\limits_{j\in S} sim(i,j)$
MMR：
$\arg \mathop{\max}\limits_{i\in R} MR_i$
把选中的有从R移动到S

算法流程

S为空集，R为全集

选择精排分数最高的物品，从R移到S

做k-1轮循环：

a.计算R中所有物品的分数 ${MRi}i∈R\{MR_i\}_{i\in R}$

b.选出分数最高的物品，从R移到S

滑动窗口

因为随着S增大，sim约等于1，MMR失效

设置滑动窗口W，选中最近的10个物品，用W代替S

3.业务规则下的多样性算法

重排的规则

最多连续出现k篇某种（图文、视频）笔记

每k篇笔记最多出现1篇某种笔记（运营推广笔记boost>1）

前t篇笔记最多出现k篇某种笔记

MMR+重排规则

MMR每轮选出一个物品

重排结合MMR和规则，在满足规则的前提下最大化MR

每一轮先用规则排除掉R中的部分物品，得到子集R’

4.5.DPP多样性算法[整个S相似度]

数学基础

k个向量（线性独立）决定k维超平形体

面积：底×高（根据投影计算），衡量多样性，面积/体积大→多样性
$det(V^\mathrm T V)=vol(P(v_1,...v_k))^2$

DPP解决多样性问题

精排打分reward1，…rewardn，选k个

价值大： $∑reward\sum reward$ 大

多样性好： $P (S)$ 体积大

推荐系统： $arg⁡max⁡S:∣S∣=kθ⋅(∑j∈Srewardj)+(1−θ)⋅log⁡det⁡(VSTVS)\arg \mathop{\max}\limits_{S:|S|=k} \theta\cdot (\sum_{j\in S}{reward_j})+(1-\theta)\cdot \log \det (V^\mathrm T_S V_S)$