队参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021)的做法,利用Python对政府工作报告进行分词处理,统计地级市政府工作报告中与环境规制相关的15个关键词,包括环境保护、环保、污染等
一、数据介绍
数据名称:政府工作报告-环境规制力度
数据范围:286个地级市(包括直辖市)
数据年份:2002-2025年
样本数量:5989条
数据来源:地方政府网
数据说明:内含环境规制相关的15个词频明细、文本长度、文本词频总数
二、整理说明
➤从地方政府网爬取工作报告原始文件
➤将报告文本整理为面板数据
➤去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和
➤保留中英文、数字、标点符号,利用正则表达式统计15个词频
➤保留中英文、数字,统计全文文本总长度
➤保存文本词频总数、15个词频明细、文本长度
三、指标说明
一共24个指标,如下
四、数据概览
面板形态
地级市-环境规制词频-excel版
地级市-环境规制词频-Stata版
【下载→
方式一(推荐):主页 ↓个人↓简介
方式二:数据下载地址汇总_-CSDN博客