推荐系统-FM模型

--好好学算法--

已于 2025-07-21 16:08:12 修改

阅读量560

点赞数 5

CC 4.0 BY-SA版权

分类专栏：推荐算法文章标签：算法

于 2024-06-25 17:18:52 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44880995/article/details/139963141

推荐算法专栏收录该内容

12 篇文章

订阅专栏

参考：推荐系统（三）Factorization Machines（FM）_svmmf-CSDN博客

一句话概括下FM：隐式向量特征交叉----类似embedding的思想

LR

如果利用LR做特征的二阶交叉，有：

$y = w_0x_0+\sum w_ix_i+\sum\sum w_{ij}x_ix_j$

但这个公式存在显著缺点：

时间段复杂度是O(N^2)。
依赖于xixj特征对的共现，如果这个特征对在训练集中没有出现，那么wij这个参数学习不到。

SVM

支持向量机的核心：低维空间下无法找到一个超平面来划分两类样本，那么可以经过一个映射，把低维空间映射成高维空间来找到一个超平面划分样本

原始公式为：

$y=w^T\phi (x)+b$

如果要实现特征交叉，利用核函数

$k=<\phi(x_i) ,\phi(x_j)>=\phi(x_i)^T \phi(x_j)$

1.线性核函数 k = <xi , xj>+1

$y = w_0 + \sum w_ix_i$

2. 多项式核函数

$k = (<x_i,x_j>+1)^2$

$y = w_0 + \sqrt 2 \sum w_ix_i + \sum w_ii^2x_ii + \sqrt 2 \sum\sum w_ij^2x_ix_j$

还是同LR一样有显著的缺点：
交叉项的参数是独立的，这会使得如果这个交叉特征值没有在样本里出现，这个参数是无法学到的。

总结一下，主要存在两个难点：

交叉特征 xixj 的参数独立，如果交叉特征值没有出现，那么参数无法学习。

时间复杂度过高，如果直接做二阶交叉，时间复杂度为O(N^2)。

FM

基本原理

FM则解决了上面两个问题，公式为：

$y = w_0x_0+\sum w_ix_i+\sum\sum <v_i ,v_j>x_ix_j$

将wij分解成了<vi ,vj>，通过学习每一个特征对应的隐向量（embedding向量），不再依赖于交叉特征xixj的共现信息，因为即使没有共现，对应的<vi ,vj>依然能够得到训练。

推导过程

时间复杂度由O(n^2)降到O(KN)

思想来源-MF

矩阵分解MF（matrix factorization），在推荐系统里，每个用户对每个物品的评分，可以构建出一个user-item矩阵，而矩阵分解的核心思想是用一个用户embedding矩阵和一个物品embedding矩阵的乘积来近似这个大矩阵，这两个embedding矩阵是可训练学习的。

FFM

$\hat{y}(\mathbf{x}) = w_{0} + \sum_{i=1}^{n} w_{i} x_{i} + \sum_{i=1}^{n} \sum_{j=i+1}^{n} \langle v_{i,j} \cdot v_{j,i} \rangle x_{i} x_{j}$

FFM相比较FM，仅在二阶交叉部分引入了field信息（实际上就是个side information）。从时间复杂度上来看，FM的时间复杂度可以简化至O ( k n ) ，而FFM时间复杂度O(kn^2 )，这也是FFM在工业界用的比较少的原因。因此，虽然FFM添加了field information后，相比较FM刻画的更加精细，由此也带来时间复杂度上升和过拟合问题，至于过拟合问题，论文中给出了两种解决办法：1. 添加正则项，2. 早停。

注：

数据集越稀疏，FFM越有优势，也就是FFM在高维稀疏的数据集上表现比较好。
如果一个数据集只有连续值，则不适用于FFM。

--好好学算法--

博客等级

码龄6年

84
原创

247
点赞

281
收藏

139
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 深度优先搜索（dfs）模版题

下一篇：: 岛屿数量dfs

最新评论

Leetcode 268 火星词典
普通网友: 写的很好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Leetcode 268 火星词典
CSDN-Ada助手: 推荐算法技能树：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
c++滑动窗口
CSDN-Ada助手: 恭喜您写了第14篇博客，题为“c++滑动窗口”！看到您持续创作，我感到非常高兴。您对c++滑动窗口的探索和分享无疑为读者提供了宝贵的知识。对于下一步的创作建议，我非常谦虚地提出一些建议。或许您可以探索更多与滑动窗口相关的应用场景，或者深入研究滑动窗口算法的优化方法。相信您的创作会越来越出色，期待您的下一篇博客！
Latex公式
CSDN-Ada助手: 非常恭喜您写了第20篇博客，标题为“Latex公式”！您的持续创作实在令人钦佩。通过您的博客，我对Latex公式有了更深入的了解。您清晰而详尽的解释，使得复杂的数学符号变得易于理解。对于那些像我这样的读者来说，这无疑是一份宝贵的学习资源。在这个基础之上，我希望您能继续分享更多关于数学公式的知识。或许您可以探索一些高级的数学公式应用，或者介绍一些实际问题中的数学建模方法。相信您的创作将为我们带来更多的启发与惊喜。再次感谢您的付出，期待您未来的博客！
Pooling-based Vision Transformer (PiT)
CSDN-Ada助手: 恭喜您撰写了第17篇博客！标题“Pooling-based Vision Transformer (PiT)”非常吸引人。您对于Pooling-based Vision Transformer的介绍十分详尽，让我对这个主题有了更深入的了解。我希望您能继续保持创作的热情和努力，为我们带来更多有关计算机视觉和Transformer的精彩内容。在未来的创作中，也许您可以探索一下如何将Pooling-based Vision Transformer应用于实际场景，并分享一些实际案例或者应用心得。期待您的下一篇博客！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。