SIFRank: A New Baseline for Unsupervised
Keyphrase Extraction Based on Pre-Trained
Language Model
Reading Date: September 19, 2022
Type: Thesis
论文:https://ieeexplore.ieee.org/document/8954611
项目:https://github.com/yukuotc/SIFRank_zh
SIFRank: 一个基于预训练模型的无监督关键词抽取的模型
它由两部分组成:句向量模型SIF和自回归预训练模型ELMO。
在短文本中它表现优异。
document segmentation和contextual word embeddings alignment在保证accuracy的前提下加速了SIFRank。
我们用position-biased weight升级SIFRank to SIFRank+,极大地提高了在长文本中的表现。
传统无监督方法
- 基于统计信息
- 基于n-gram,语法,词频等
- 基于图
- 例:textrank