1. 前言
本文所需数据及相关文件共享于百度云盘:
链接:http://pan.baidu.com/s/1dFKSlmp
密码:yo3p
2. 数据来源
数据为百度热搜榜的几段文本,分别放在不同的路径下,如下图所示:
3. 模板概览
4. 思路
a) 读入txt文本,先使用String Searcher对搜索指数进行提取,对提取后的指数进行编号,待用;
b) a步骤中的非指数部分含有热搜词汇,再使用一个StringSearcher进行提取,编号,待用;
c) 使用FeatureMerger对热搜词汇与指数进行挂接;
d) 对挂接后的数据进行条件赋值,输出。
5. 脚本
Py脚本使用了os包&#