ACL2020-知识图谱论文-NER(一)

提出一种无需标签数据的命名实体识别方法,通过广泛标签特征自动标注文本,结合HMM整合预测,最终训练序列标记模型,实现实体级F1得分显著提升。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、Named Entity Recognition without Labelled Data: A Weak Supervision Approach
 
摘要:本文提出了一种简单但强大的方法来学习NER模型,在缺乏标签数据,通过薄弱的监督。该方法依赖于广泛的标签功能来自动标注来自目标域的文本。这些注释然后使用隐藏马尔科夫模型合并在一起,该模型捕获了标签函数的不同准确性和混淆性。在此统一标注的基础上,最终可以训练序列标记模型。我们从两个方面来评价这个方法(CoNLL 2003和来自路透社和彭博社的新闻文章),并证明与域外神经NER模型相比,实体级F1得分提高了约7个百分点。
结论
针对命名实体等序列标记任务,提出了一种弱监督模型识别。为了利用任务可用的所有可能的知识来源,该方法使用广泛的标签功能,包括数据驱动的NER模型、地名词典、启发式功能和实体之间的文档级关系。标签功能可以专门识别特定的标签,而忽略其他的标签。此外,不同于以前薄弱的监督方法,标记功能可以产生概率预测。这些标记函数的输出,然后合并在一起使用隐藏马尔科夫模型,其参数估计与鲍姆-韦尔奇算法。在这些统一预测的基础上,最终可以学习神经序列标记模型。
 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值