Python《沉默的羔羊》之最多单词

渣渣虎

已于 2023-11-11 19:00:27 修改

阅读量1.3k

点赞数 1

CC 4.0 BY-SA版权

文章标签： python

于 2023-11-11 18:59:45 首次发布

本文链接：https://blog.csdn.net/qq_45959128/article/details/134352180

本文介绍了如何使用Python的jieba库对中文文本进行分词，并从demo.txt文件中找出长度大于2、频率最高的单词，如果有多个频率相同的单词，则按Unicode排序输出。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

安装jieba库

pip install jieba

文件"demo.txt"是《沉默的羔羊》中文版内容，请读入文件内容，分词后输出长度大于2且最多的单词。‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬

如果存在多个单词出现频率一致，请输出按照Unicode排序后最大的单词。

注意：要读入的文件已放入当前目录下，源文件中直接读取此文件即可。

import jieba
from collections import Counter

# 读取文件内容
file_path = "demo.txt"
with open(file_path, "r", encoding="utf-8") as file:
    content = file.read()

# 分词
words = list(jieba.cut(content))

# 过滤长度大于2的单词
filtered_words = [word for word in words if len(word) > 2]

# 计算词频
word_frequency = Counter(filtered_words)

# 找到最多的单词
most_common_words = word_frequency.most_common()

# 如果存在多个单词出现频率一致，请按照Unicode排序
most_common_words.sort(key=lambda x: (x[1], x[0]), reverse=True)

# 输出结果
if most_common_words:
    max_word, max_count = most_common_words[0]
    print(f"{max_word}")

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

渣渣虎

关注关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

Python练习题19：《沉默的羔羊》之最多单词

qq_38958704的博客

11-09

7814

import jieba txt = open("E:\\LX\\沉默的羔羊.txt", encoding='utf-8').read() words = jieba.lcut(txt) #精确模式分词，返回一个列表类型 d = {} #建立一个空字典，用来存放键值对数据 for word in words: d[word] = d.get(word, 0) + 1 #如果这个词语（键）在字典中，其值+1，不在则赋以0 maxc = 0 maxw = "" for key in d: if.

Python每天一个小程序——字典翻转输出和《沉默的羔羊》之最多单词

小吴同学的博客

06-15

3114

1 条评论您还未登录，请先登录后发表或查看评论

python123期末四题编程题 -无空隙回声输出-文件关键行数-字典翻转输出-《沉默的羔羊》之最多单词

01-20

1. 无空隙回声输出描述获得用户输入，去掉其中全部空格，将其他字符按收入顺序打印输出。 ‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬ 输入输出示例输入输出示例 1 Alice + Bob Alice+Bob 题解 s = input() print(s.replace( , )) #利用s中replace的方法把空格去掉 2. 文件关键行数描述关键行指一个文件中包含的不重复行。关键行数指一个文件中包含的

《沉默的羔羊》之最多单词（Python）

2301_79497461的博客

11-29

1612

描述附件是《沉默的羔羊》中文版内容，请读入内容，分词后输出长度大于2且最多的单词。如果存在多个单词出现频率一致，请输出按照Unicode排序后最大的单词。输入格式文件‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬ 输出格式字符串

python《沉默的羔羊》之最多单词

最新发布

04-05

要实现统计《沉默的羔羊》中文版内容中长度大于2且出现频率最高的单词，可以采用Python中的`jieba`库来进行分词操作，并利用字典记录每个单词的出现次数。以下是完整的解决方案： ### 实现方案 #### 1. 导入库并...

python期末测验: 课程水平综合测验 (第10周)-无空隙回声输出/文件关键行数/字典翻转输出/《沉默的羔羊》之最多单词

Gusta_j的博客

08-20

1856

无空隙回声输出描述获得用户输入，去掉其中全部空格，将其他字符按收入顺序打印输出。输入输出示例 1 Alice + Bob Alice+Bob s = input() s = s.replace(' ', '') print(s) 文件关键行数描述关键行指一个文件中包含的不重复行。关键行数指一个文件中包含的不重复行的数量。‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬

《沉默的羔羊》之最多单词+文本词频统计 -- Hamlet

qq_46957383的博客

11-11

877

文本处理：《沉默的羔羊》之最多单词+文本词频统计

沉默的羔羊。。。。

General Michael

05-21

1062

找工作的日子已经持续了一段了。。。。我真的不明白，投了近30次的简历竟然只有2家公司打电话去面试。。。而面试也无果而终，上周末的华为面试，在友人的帮助下磕磕绊绊完成了四面，今天就通知说因为资格问题建议我去测试部门～～～sign！！华为面试等待的过程中和两个同来的聊了几句，都是毕业1、2年的，经历感觉远远不如我。不知道他们后来的面试如何，有可能很好，也有可能2面就被pass掉～，我就不明白难

沉默的羔羊

美文欣赏

12-13

669

当别人误解我的时候我总是沉默沉默对我来说其实是一种反驳当世界遗忘我的时候我一个人过幸福对我来说其实是一种传说当敌人越来越多朋友都离开我当爱情变成一种负担却无法解脱我不是沉默的羔羊我有话要讲给我一点酒让我有勇气向你吐露我的悲伤我不是沈默的羔羊我也有梦想当明天太阳升起照在我的脸上我一样能散发光芒羔羊

《沉默的羔羊》

§为艺术而技术§

07-12

2212

Image Size: 671 x 932 File Size: 90KB MARiLA 添加 - 审核通过于： 2003-9-1 20:04:55 　导演：Jonathan Demme　主演：安东尼·霍普金斯　朱迪·福斯特　Ted Levine　类型：惊悚犯罪恐怖发行公司：Orion　首映日期：1991年2月13日

《沉默的羔羊》之最多单词

Python的学习之路

01-21

181

分词后输出长度大于等于2且出现频率最多的单词。如果存在多个单词出现频率一致，请输出按照Unicode排序后最大的单词。

MOOC_Python语言程序设计_习题_《沉默的羔羊》文本分析

wonderh的专栏

11-12

3545

要求附件是《沉默的羔羊》中文版内容，请读入内容，分词后输出长度大于2且最多的单词。解答 import jieba def getText(): txt = open("沉默的羔羊.txt", "r", encoding='utf-8').read().lower() return txt data = jieba.lcut(getText()) rs = {} for w in data: if (w.isalpha() and len(w) > 2):

MOOC《Python语言程序设计》第6周练习题

jingwushikong的博客

03-26

1万+

MOOC《Python语言程序设计》第6周练习题这周日讲解了组合数据类型，重点介绍表达和处理一组数据的方法，涉及到多种数据类型，包括：集合类型、序列类型（含元组类型和列表类型）和字典类型；讲解2个颇有用处的实例：基本统计值计算和文本词频统计，其中，即有英文Hamlet的词频统计，也有中文《三国演义》的人物出场统计；进一步讲解用于中文分词的jieba库，从此以后，处理中英文文本、做些统计分析将不...

Python123Python语言程序设计2021期末考试题库（编程题答案）