TextRank起源与PageRank
TextRank的灵感来源于大名鼎鼎的PageRank算法,这是一个用作网页重要度排序的算法。
并且,这个算法也是基于图的,每个网页可以看作是一个图中的结点,如果网页A能够跳转到网页B,那么则有一条A->B的有向边。这样,我们就可以构造出一个有向图了。
然后,利用公式:

经过多次迭代就可以获得每个网页对应的权重。下面解释公式每个元素的含义:
S ( V i ) S(V_i) S(Vi) : 网页 V i V_i Vi的重要度(权重),初始值可设为1。
d d d : 阻尼系数,一般为0.85。
I n ( V i ) In(V_i) In(Vi</