自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

阿正的梦工坊

时间的朋友

阿正的梦工坊

博客等级

码龄7年

2204
原创

2万+
点赞

3万+
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

最新评论

Windows电脑微信可以登录发消息，但是网页打不开的解决方法
Alanber766: 最后一个方法有效，感谢博主
PyTorch从零开始实现Transformer
『追梦』选手: 【强烈推荐！这个笔记写得很清晰！ - CSDN App】https://blog.csdn.net/weixin_44930588/article/details/150108429?sharetype=blog&shareId=150108429&sharerefer=APP&sharesource=weixin_44930588&sharefrom=link
（trl的grpo_trainer）深度解析 _get_per_token_logps：如何计算序列中每个 Token 的对数概率
始终如一ˇ: 博主，请问如果我想训练一个encoder-decoder模型的话，这个函数应该怎么修改，传入参数以及处理逻辑上有什么不同？
流匹配（Flow Matching）教程
雪色冥茫: 看到后记时终于理解了正文句末处链接的违和感从何而来，而且“速度场（vector field）”的表述真是“神来之笔”
InfoNCE 在 CLIP 中的应用原理（代码实现）：为什么用交叉熵F.cross_entropy来实现？
Gwovnie: 在为什么F.cross_entropy等价于InfoNCE Loss里的2. InfoNCE Loss的形式里说( [ S i , 1 / τ , S i , 2 / τ , … , S i , N / τ ] [S_{i,1} / \tau, S_{i,2} / \tau, \ldots, S_{i,N} / \tau][S i,1/τ,S i,2 /τ,…,S i,N /τ] ) 是所有候选文本的 logits这个有问题，和CLIP的工作机制里的4.InfoNCE Loss的应用里 S j , i ( j ≠ i ) 表示分母只取负样本之和不一致，解释不对

Machine Learning

关注

文章平均质量分 92

机器学习基础。Andrew Ng的机器学习专项课程笔记更新完结。

关注数：文章数：78 文章阅读量：117317 文章收藏量：1362

作者: 阿正的梦工坊

岁月不饶人，我亦未曾饶过岁月

展开

专栏收录文章