docker 部署whisper实时语音转文字
时间: 2025-06-28 14:11:38 浏览: 19
### 使用 Docker 部署 Whisper 实现实时语音转文本
为了实现通过 Docker 部署 Whisper 并完成实时语音到文本的转换,可以按照如下方法操作:
#### 准备工作
确保本地环境已经安装并配置好 Docker 和 Docker Compose。这一步骤对于后续顺利运行容器至关重要。
#### 获取镜像
可以从官方仓库拉取预构建好的 Whisper Docker 镜像,或者基于公开项目如 `WhisperLive` 自定义构建适合特定需求的镜像[^3]。
```bash
docker pull gitcode.com/gh_mirrors/wh/whisperlive:latest
```
#### 创建必要的文件夹结构
建立用于存储音频输入、输出以及日志记录的相关目录,方便管理和调试过程中的数据交换。
```bash
mkdir -p ~/whisper-data/{input,output,logs}
```
#### 编写 docker-compose.yml 文件
编写一个简单的 `docker-compose.yml` 来简化启动流程和服务管理。此文件应指定所需的服务及其依赖关系,并映射主机上的路径至容器内部相应位置以便于访问资源。
```yaml
version: '3'
services:
whisper-service:
image: gitcode.com/gh_mirrors/wh/whisperlive:latest
volumes:
- ./data/input:/app/data/input
- ./data/output:/app/data/output
- ./data/logs:/app/data/logs
ports:
- "8000:80"
environment:
- TZ=Asia/Shanghai
```
#### 启动服务
利用上述编写的 `docker-compose.yml` 文件来一键启动整个应用栈,包括但不限于网络设置、端口转发等自动化配置项。
```bash
cd path/to/docker-compose-file
docker-compose up -d
```
此时,Web 浏览器可以通过 http://localhost:8000 访问由 Whisper 提供的服务接口,上传待识别的音频文件或将麦克风流式传输给服务器进行即时处理。
#### API 调用示例
下面给出一段 Python 代码片段作为客户端调用 RESTful API 的例子,展示如何向已部署的服务发送请求以获取转换后的文本结果。
```python
import requests
url = "http://localhost:8000/transcribe"
with open('path_to_audio_file', 'rb') as f:
response = requests.post(url, files={'audio': f})
print(response.json())
```
以上即为完整的使用 Docker 容器化技术快速搭建一套支持实时语音转文字功能的应用实例介绍[^1]。
阅读全文
相关推荐

















