前序文章:
背景
基于前面的章节,我们可以认为当前已经有了一个可以提供关于医疗知识的问答知识库。在进行pipline方式问答任务时,接到问题后,通常就是将问题进行分类,以作精细化的处理与回答。这个问题分类通常也被称为意图识别。对于意图识别获问题分类来说,本质上就是对文本进行分类,可以使用传统的机器学习算法以及深度学习算法来处理该问题,但是在缺乏语料标注的情况下,使用规则可能是最好的方式。原项目就是如此。
基于规则的问题分类
在知识图谱数据入库的模块中提供了实体数据导出功能,导出的数据即为一些实体数据,除此之外源代码中还提供了一些否定词deny.txt,我也将该文件放到dict文件夹下。这部分都是基于规则进行分类的特征词。问题的问题主要是接下来的对应类别的问题解析,已经问题搜索做准备。
下面就开始设计问题分类的类。KGQAMedicine\question_classify\rul