编写一个 Python 程序,读取data.txt文件中的文本,对进行分词,统计频率最高的前100个,结果输出到result.csv文件中。
时间: 2024-01-22 18:17:49 浏览: 112
以下是一个可能的解决方案:
```python
import jieba
import csv
from collections import Counter
# 读取文本文件
with open('data.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 分词并统计词频
words = [w for w in jieba.cut(text) if len(w) > 1] # 只保留长度大于1的词
counter = Counter(words)
top100 = counter.most_common(100)
# 输出到csv文件
with open('result.csv', 'w', newline='', encoding='utf-8') as f:
writer = csv.writer(f)
writer.writerow(['词语', '频率'])
for word, freq in top100:
writer.writerow([word, freq])
```
这个程序依赖于jieba库和collections.Counter类。首先读取data.txt文件并将其存储在一个字符串变量text中。然后使用jieba库对文本进行分词,只保留长度大于1的词。接下来使用Counter类对词频进行统计,并使用most_common方法提取前100个最频繁出现的词语和它们的频率。最后将结果输出到result.csv文件中。
阅读全文
相关推荐

















资源下载链接为:
https://pan.quark.cn/s/d9ef5828b597
在Web开发中,将Canvas内容保存为图片或直接保存页面上的图片是一个常见需求。本文将介绍如何通过JavaScript实现这两种功能。
Canvas是HTML5提供的一个强大的绘图工具,允许开发者通过JavaScript动态绘制图形、文字和图片等。它支持复杂的图形操作,如变换、渐变和阴影等。要将Canvas内容保存为图片,可以使用toDataURL()方法。该方法会将Canvas内容转换为一个数据URL,通常是一个base64编码的PNG或JPEG图像。
以下是一个将Canvas内容保存为图片的函数示例:
在这个函数中,canvas参数是Canvas元素的DOM对象,name参数是保存的图片名称。通过调用toDataURL()方法,我们获取Canvas的图像数据,并创建一个元素。设置href属性为图像数据URL,download属性为文件名,然后模拟点击该链接,浏览器便会开始下载图片。
如果需要保存页面上的一张图片,可以直接操作
元素。假设页面中有一个
元素,其src属性指向要保存的图片,可以使用以下方法:
在这个函数中,img参数是
元素的DOM对象,name是保存的图片名称。通过将a.href设置为图片的src属性,然后触发点击事件,即可实现图片的下载。
需要注意的是,toDataURL()默认生成PNG格式的图片,但也可以通过指定MIME类型(如image/jpeg)来生成其他格式的图片。此外,由于同源策略的限制,如果Canvas绘制的内容来自跨域资源,可能无法正确转换为数据URL。同时,浏览器的安全策略可能会限制download属性的使用,例如在某些情况下不允许非用户交互式触发下载。
总之,JavaScript提供了简单的方法来将Canvas内容

