可以发现特殊领域海量数据中专属的名词,这种名词在结巴等公众领域词库中是没有的。
先上结果,可以挖掘到一些特有的方法词汇!
看下代码文件目录:
wiki_quality.txt-Dell文档类资源-CSDN下载
看下原始的数据文件:
代码如下:
import urllib
import requests
import os
import time
import thre
可以发现特殊领域海量数据中专属的名词,这种名词在结巴等公众领域词库中是没有的。
先上结果,可以挖掘到一些特有的方法词汇!
看下代码文件目录:
wiki_quality.txt-Dell文档类资源-CSDN下载
看下原始的数据文件:
代码如下:
import urllib
import requests
import os
import time
import thre