2002-2025年地级市环境规制力度文本词频数据

队参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021)的做法,利用Python对政府工作报告进行分词处理,统计地级市政府工作报告中与环境规制相关的15个关键词,包括环境保护、环保、污染等

一、数据介绍

数据名称:政府工作报告-环境规制力度

数据范围:286个地级市(包括直辖市)

数据年份:2002-2025年

样本数量:5989条

数据来源:地方政府网

数据说明:内含环境规制相关的15个词频明细、文本长度、文本词频总数

二、整理说明

➤从地方政府网爬取工作报告原始文件

➤将报告文本整理为面板数据

➤去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和

➤保留中英文、数字、标点符号,利用正则表达式统计15个词频

➤保留中英文、数字,统计全文文本总长度

➤保存文本词频总数、15个词频明细、文本长度

三、指标说明

一共24个指标,如下

四、数据概览

面板形态

地级市-环境规制词频-excel版

地级市-环境规制词频-Stata版

【下载→

方式一(推荐):主页 ↓个人↓简介

经管数据库-CSDN博客

方式二:数据下载地址汇总_-CSDN博客

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值