KBQA新方法

原创已于 2022-10-10 20:45:51 修改 · 396 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#知识图谱 #人工智能 #自然语言处理

于 2022-10-09 12:00:00 首次发布

NLP自然语言处理同时被 3 个专栏收录

2 篇文章

订阅专栏

2 篇文章

订阅专栏

2 篇文章

订阅专栏

KBQA新方法

以往的KBQA步骤范式为：

实体识别
实体链接
意图识别（or 关系or 属性识别）
查询数据库

而本文中介绍的来自美团[^1]的方案是：

实体识别
实体链接
查询数据库（控制步数）
关系学习模型打分

引子

接下来将详细介绍论文中的方法，但在介绍之前，先看看2021年3月份一篇关于知识补全的文章BERTRL[^2]：

与以往将知识图谱用Trans系列或图神经网络建模的方式不同，文章中将知识图谱线性化输入到Bert中。文章中提及了两种线性化图谱的方式：

将所有涉及待预测量两个实体之间的路径同时输入模型
分别将每种路径单独输入模型，之后分数聚合（文中的聚合方式为取分数最大值）
$\operatorname { s c o r e } ( h , r , t ) = \operatorname { max } p ( y = 1 | h , r , t , h \frac { p } { t } , t )$

这里举一个输入的例子：[CLS]姚明的妻子是谁？是叶莉吗？[SEP]姚明的女儿是姚沁蕾；姚沁蕾的妈妈是叶莉

如此一来，就融合了知识图谱的知识以及语义知识了。提到这，是不是想起被Jena知识推理工具支配的恐惧，Jena的知识推理是基于经验主义的规则系统，召回率极低，但准确率高，代码举例：

[rule: (?a :女儿 ?b)(?b :妈妈 ?c) -> (?a :夫妻 ?c)]

有关jena的工程化实践，有时间会细说。

主文

前文说过有两种线性化图谱的方式，BERTRL用了单独输入各个路径的方式，而美团这篇用了另一种，平铺一次性输入，举例：

[CLS]姚明的妻子是谁？是叶莉吗？[SEP] 姚明的女儿是姚沁蕾；姚沁蕾的妈妈是叶莉 [SEP] 姚明的母亲是方凤娣；方凤娣的儿媳是叶莉

微调方法

将全部路径一股脑输入模型，预测档期那候选实体是否为答案，之后依次将所有候选实体算出分数，即达到了目的。

预训练方法

除了直接使用Bert模型进行进行微调之外，作者还提供了一种预训练的方法，预训练之后再进行微调可有效提高KBQA效果。作者提出了三种任务：

关系抽取

[CLS]句子[SEP]头实体h, 关系r, 尾实体t[SEP] 根据句子预测头实体h和尾实体t是否具有关系r
关系匹配

[CLS]句子1 [SEP]句子2 [SEP] 预测句子1和句子2是否具有相同的关系
关系推理即BERTRL

引用

Large-Scale Relation Learning for Question Answering over Knowledge Bases with Pre-trained Language Models
Inductive Relation Prediction by BERT

近期文章更新预告

接下来将更新以下内容，你的关注与打赏是创作的最大动力：

基础知识
- 理解损失函数
- 理解正则化
推荐系统
- W&D工程化其他文章未涉及的建议
知识图谱
- 表征学习

相关论文PDF获取，可关注公众号【无数据不智能】并回复：KBQA关系学习

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。