Enhanced multi-channel graph convolutional network for aspect sentiment triplet extraction.

最新推荐文章于 2024-09-28 11:18:02 发布

带带二师兄

最新推荐文章于 2024-09-28 11:18:02 发布

阅读量1k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：笔记文章标签：算法机器学习人工智能

本文链接：https://blog.csdn.net/qq_42523037/article/details/127066792

笔记专栏收录该内容

6 篇文章

订阅专栏

本文介绍了一种基于图卷积神经网络（GCN）的情感三元组抽取模型，该模型能够从句子中抽取出方面术语、意见术语及其情感极性。通过定义句子中单词间的关系并采用表格填充的方法进行解码，实现对评论文本的情感分析。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1前言

关于情感三元组的任务和背景前面的文章已经介绍过了，不再赘述前人工作和摘要。

2预备知识

2.1GCN

图卷积神经网络GCN就是一个结合了注意全局信息的特征提取器。
假设我们手头有一批图数据，其中有N个节点（node），每个节点都有自己的特征D维，我们设这些节点的特征组成一个N×D维的矩阵X，然后各个节点之间的关系也会形成一个N×N维的矩阵A，也称为邻接矩阵（adjacency matrix）。X和A便是我们模型的输入。
GCN也是一个神经网络层，它的层与层之间的传播方式是：
在这里插入图片描述
关于GCN内容很多，我们只需要知道GCN是这样的一个黑盒子：
输入进去是一个具有若干特征的一个图，输出的是提取了全局各个节点信息特征的另一个图（我们可以从该图获得需要的信息比如类别、颜色）。

2.2 语法知识

词性标注：
我们经常用以下缩写来代表对应单词的词性：
DT 限定词（如this,that,these,those,such，
NN Noun, singular or mass 常用名词单数形式
VBZ Verb, 3rd person singular present 动词第三人称单数
JJ Adjective 形容词或序数词
名词：NN,NNS,NNP,NNPS
代词：PRP，PRP$
形容词：JJ，JJR,JJS
数词：CD
动词：VB,VBD,VBG,VBN,VBP,VBZ
副词：RB,RBR,RBS
句法依赖树：

3正文模型

在这里插入图片描述
3.1 问题公式化

3.2 关系定义和表格填充
我们为 ASTE 定义了句子中单词之间的十种关系。这些关系如表1所示
在这里插入图片描述
具体来说，四个关系或标签 {B-A, I-A, B-O, I-O} 旨在提取方面术语和意见术语。与 GTS (Wu et al., 2020a) 相比，我们定义的关系在我们的模型中引入了更准确的边界信息。B 和 I 分别表示术语的开头和内部，而 -A 和 -O 子标签旨在确定术语的作用，即方面或意见。表 1 中的 A 和 O 关系用于检测由两个不同的词组成的词对是否分别属于同一个方面或意见词。三个情感关系{POS, NEU, NEG}的目标不仅是检测一个词对是否匹配，还要判断aspect-opinion对的情感极性。

因此，我们可以使用表格填充方法为每个标记的句子构建一个关系表（Miwa and Sasaki, 2014; Gupta et al., 2016）。

3.3 三元组解码
ASTE 任务的解码细节如算法 1 所示。为简单起见，我们使用上三角表来解码三元组。首先，我们仅使用基于主对角线的所有词对（wi，wi）的预测关系，来提取aspect term和opinion term。其次，我们需要判断提取的aspect term和opinion term是否匹配。特别是，对于方面项 a 和意见项 o，我们计算所有单词对 (wi, wj) 的预测关系，其中 wi ∈ a 和 wj ∈ o。
如果预测关系中存在任何情感关系，则认为aspect term和opinion term是配对的，否则这两个不配对。最后，为了判断aspect-opinion对的情感极性，将预测最多的情感关系s∈S视为情感极性。因此，我们收集了一个三元组 (a, o, s)。

3.4 EMC-GCN 模型
3.4.1 输入层和编码层
BERT (Devlin et al., 2019) 已经证明了它在各种任务中的有效性。我们利用 BERT 作为句子编码器来提取隐藏的上下文表示。给定一个带有 n 个标记的输入句子 X = {w1, w2, …, wn}，编码层在最后一个 Transformer 块处输出隐藏表示序列 H = {h1, h2, …, hn}。

3.4.2 双仿射注意力模块
我们利用双仿注意力模块来捕获句子中每个词对的关系概率分布，因为双仿注意力已被证明在句法依赖解析中有效（Dozat and Manning，2017）。
在这里插入图片描述