小工具随手记：使用Python中的pyttsx3包将PDF文档转为MP3音频

蓝多多的小仓库

于 2021-12-05 00:32:15 发布

阅读量985

点赞数 1

CC 4.0 BY-SA版权

分类专栏：小蓝的随手记文章标签： python 音视频

本文链接：https://blog.csdn.net/qq_43554335/article/details/121724388

小蓝的随手记专栏收录该内容

22 篇文章

订阅专栏

本文介绍了一种简化版的PDF朗读程序，通过使用pyttsx3和PyPDF2库实现文本转语音。程序实现了基本功能，但效果一般。作者分享了如何调整语音参数以提升音频质量，以及国内镜像源配置方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

今天不想看文档了，搞了个简易版本的朗读PDF程序，效果一般般，和microsoft自带的那个朗读功能一样。

需要安装pyttsx3和PyPDF2：

如需配置国内镜像源请参考：Pycharm配置镜像源（长期有效）_蓝多多的小仓库-CSDN博客

代码如下：

import pyttsx3,PyPDF2
# 打开需要读取的PDF
pdfreader = PyPDF2.PdfFileReader(open('../source/paper.pdf','rb'))
# 初始化获取语音引擎
speaker = pyttsx3.init()
for page_num in range(pdfreader.numPages):
    # 从PDF中提取文本
    text = pdfreader.getPage(page_num).extractText()
    # 去掉文本中的换行符
    cleaned_text = text.strip().replace('\n',' ')
    # 调整人声类型
    voices = speaker.getProperty('voices')
    speaker.setProperty('voice', voices[1].id)
    # 调整语速
    rate = speaker.getProperty('rate')
    speaker.setProperty('rate', 100)
    # 调整声量
    volume = speaker.getProperty('volume')
    speaker.setProperty('volume', 0.8)
    # 将格式为mp3的音频保存
    speaker.save_to_file(cleaned_text,'../source/paper.mp3')
    speaker.runAndWait()
speaker.stop()

结果（可以凑活听，效果一般）：