facebook AI research的论文vilbert真的学会人工智能了吗?(反复实验研究这篇论文有感)

我的研究方向是VQA视觉对话。这篇ViLBERT反复看了无数遍,代码都熟烂于心了。在我加入了我自己的研究方向并结合了vilbert的代码后取得了很高预测结果后我感叹不愧是facebook AI research的论文,太厉害了!

因为vilbert的数据不适合我现在的研究内容,我找了其他同样是facebook AI research的论文(不同的作者)的数据集并多次运行新的数据集的代码后我突然意识到这根本不是真正的人工智能!

先说一些vilbert的结构:

简单来说:先进行图片特征的提取:fast R-CNN。文本特征的提取:BERT。

然后分别进行图像特征和文本特征的自注意力+掩码。再进行文本和图像特征之间相互的多头注意力+掩码。这样就获得了文本特征(带了图像特征),图像特征(带了文本特征),融合特征这些特征值。

再进行类似transformer的手法进行encoder和decoder说白了还是注意力(q,k,v)的手段。

那么这个时候你可以输入任何的内容它都可以学习到相关的关系。

比如VQA:输入问题和图像,经过大量的数据训练后它能学到问题和图像的关系。

比如看图说话:输入图像和图像相关的话,它就能学到根据图像写一段话。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小豆子爱学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值