pytong之语音环境:edge-tts and edge-playback

该文介绍了在Windows10系统中如何安装和使用Python3.x,以及两个相关工具:edge-tts(文本转语音)和edge-playback(语音播放)。安装过程中涉及pip和pipx的使用,以及可能遇到的网络问题和解决办法。此外,还强调了安装后需添加系统路径以确保命令行能正确调用这些工具。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

系统平台:windows10

一、安装python3.x

二、安装edge-tts(文本转换为声音文件)

        启动windows命令行(cmd),执行如下命令:

pip install edge-tts

可能会因为网络的问题出现错误。用ping测试pypi.org是否通畅:ping pypi.org,会出现丢包。

安装成功后测试:

命令行测试:

edge-tts --text "Hello, world!" --write-media hello.mp3 --write-subtitles hello.vtt

编程代码测试:

import subprocess  
# 获取用户输入的文本内容  
text = input("请输入要朗读的文字:")  
# 运行 Edge 命令行工具,并朗读文本内容  
subprocess.run(["edge-tts", "-o:1"], input=text.encode('utf-8')) 

二、安装edge-playback(语音播放)

pip install pipx
pipx install edge-tts

命令行测试:

edge-playback --text "Hello, world!"

注意事项:

pipx install edge-playback安装后要添加系统路径

1、安装后要添加或修改路径(path),会有提示,但都是英文的,认真看。或者查找如下两个文件的位置,把路径添加到系统PATH里面。"pipx install edge-playback"后有两个文件:

edge-tts.exe

edge-playback.exe

pip install edge-tts 安装后注意在程序中的调用:

2、import edge_tts   (注意是下划线,不要写成import edge-tts,命令行是用edge-tts)

### 关于 edge-ttsedge-playback 的使用方法及区别 #### 安装方式 为了在命令行中使用 `edge-tts` 和 `edge-playback` 功能,建议通过 `pipx` 工具来安装这些库。具体操作如下: ```bash $ pipx install edge-tts ``` 这一步骤可以确保工具独立运行而不污染全局环境[^1]。 对于 Python 脚本中的集成,则需导入相应的模块。需要注意的是,在代码中应使用 `import edge_tts`(带下划线),而不是尝试直接调用命令行形式的名称[^2]。 #### 使用说明 ##### **edge-tts** 这是一个基于微软 Edge 浏览器在线文字转语音服务的轻量级接口实现方案。它允许开发者无需依赖本地部署的 Microsoft Edge 或特定操作系统即可访问 TTS 功能[^3]。 其核心特性在于支持多种语言和声音模型的选择,并且不需要额外申请 API 密钥。以下是基本使用的例子: ```python from edge_tts import Communicate, VoicesManager async def main(): communicate = Communicate("你好", "zh-CN-XiaoyiNeural") await communicate.save("output.mp3") if __name__ == "__main__": import asyncio asyncio.run(main()) ``` 上述代码片段展示了如何利用异步函数生成一段中文音频文件并保存到本地磁盘上[^4]。 ##### **edge-playback** 相比之下,`edge-playback` 更侧重于提供一种简便的方式让终端用户快速测试或播放由 `edge-tts` 产生的音效效果。例如下面这条简单的指令就能完成即时合成与回放的任务: ```bash edge-playback --voice zh-CN-YunyangNeural --text "你好" ``` 这里指定了目标发音人为 `"zh-CN-YunyangNeural"` 并传递了一条短消息作为输入数据。 #### 主要差异对比 | 特性 | edge-tts | edge-playback | |--------------------|-----------------------------------------------|----------------------------------------| | 应用场景 | 开发者用于构建自定义应用 | 终端用户的即刻试听 | | 技术层面 | 提供 SDK 接口 | 基于 MPV 实现的声音流媒体处理器 | | 输出形式 | 文件存储 (e.g., .mp3) | 即时播放 | 尽管两者都围绕着相同的底层技术——Microsoft Edge Text-To-Speech 构建而成,但它们各自面向不同的需求群体以及应用场景有所区分。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大叔山

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值