使用 Conda 部署 Whisper 模型

最新推荐文章于 2026-03-04 11:05:15 发布

原创

最新推荐文章于 2026-03-04 11:05:15 发布 · 1.9k 阅读

文章标签：

#conda #whisper

1. 创建 Conda 环境

首先，我们需要为 Whisper 创建一个新的 Conda 环境，这样可以隔离项目的依赖，避免和其他项目的库产生冲突。

1.1 创建环境

打开终端并运行以下命令创建一个新的 Conda 环境（这里我们使用 Python 3.8 版本）：

conda create -n whisper-env python=3.8

该命令会创建一个名为 whisper-env 的新环境，并安装指定版本的 Python。

1.2 激活环境

创建完环境后，运行以下命令激活环境：

conda activate whisper-env

激活环境后，你的所有操作都将在该环境内进行。记得在使用完环境后，可以通过以下命令退出环境：

conda deactivate

2. 安装 Whisper 和依赖

Whisper 模型依赖于 PyTorch、ffmpeg 等多个库。接下来我们将安装这些依赖。

2.1 安装 PyTorch

Whisper 依赖于 PyTorch，且支持 GPU 加速。如果你的机器有 NVIDIA GPU，可以安装支持 CUDA 的版本来加速计算。如果没有 GPU，可以安装 CPU 版本。

安装 GPU 版本的 PyTorch（支持 CUDA 11.8）：

conda install pytorch torchvision torchaudio cudatoolkit=11.8 -c pytorch

如果没有 GPU，安装 CPU 版本：

conda install pytorch torchvision torchaudio cpuonly -c pytorch

2.2 安装 Whisper

Whisper 模型可以通过 pip 从 GitHub 安装。运行以下命令来安装 Whisper：

pip install git+https://github.com/openai/whisper.git

2.3 安装 FFmpeg

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

AI标书

关注关注

20
点赞
踩
22

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

学习实践-Whisper语音识别模型实战（部署+运行）

LZL2020LZL的博客

04-12

9718

OpenAI的语音识别模型Whisper，Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）和多任务（multitask）监督数据对 Whisper 进行了训练。OpenAI 认为使用这样一个庞大而多样的数据集，可以提高对口音、背景噪音和技术术语的识别能力。除了可以用于语音识别，Whisper 还能实现多种语言的转录，以及将这些语言翻译成英语。

本地部署whisper模型（语音转文字）

maxcode

01-31

5118

Whisper是 OpenAI 2022年发布的一款语音预训练大模型，集成了多语种ASR、语音翻译、语种识别的功能。Whisper使用弱监督训练的方法，可以直接进行多任务的学习。

1 条评论您还未登录，请先登录后发表或查看评论

记录本地部署 Whisper 模型的过程

aihuijutang的博客

11-29

8249

通过以上步骤，你已经成功地在本地部署了 Whisper 模型，并利用 CUDA 加速推理过程。使用 Flask 构建了一个简单的 API，使得音频文件的转录变得非常方便。整个部署过程包括了环境准备、依赖安装、模型加载、音频处理、API 构建等步骤。部署 Whisper 模型并不复杂，但需要一定的硬件支持，尤其是在处理大型音频数据时，CUDA 和 GPU 能够提供显著的性能提升。希望本文能够帮助你顺利部署并使用 Whisper 进行语音转录。如果遇到任何问题，欢迎继续提问。

Python3.10语音识别项目：Whisper+Miniconda环境部署教程

最新发布

weixin_36369848的博客

03-04

698

本文介绍了如何在星图GPU平台上自动化部署Python3.10镜像，快速搭建Whisper语音识别项目环境。该平台简化了部署流程，用户可轻松创建隔离的Miniconda环境，并安装Whisper模型，实现将会议录音、外语视频等音频内容自动转换为文字的高效应用。

Whisper 从0安装教程 windows

blog of Chongzi

11-01

2270

（我试了把指令里的12.1，改成12.2，然后没找到这个版本的pytorch）这个教程是装在系统中运行的，我一开始是想按照这个教程来装的，但是我后来在anaconda里面装了pytorch，感觉都在anaconda里面搞算了，毕竟装到系统里面还要改环境变量啥的很麻烦。因为看到Anaconda官网上最新的版本是基于python3.11的，但是我自己电脑上的版本是python3.10，为了避免我这种不太会搞环境的人不装错，还是先卸载3.10，装上3.11。最后用了这个教程，在anaconda里面装好了运行。

whisper模型环境搭建与使用

weixin_59602119的博客

08-01

1555

whisper模型环境搭建与使用

如何在你的电脑上完成whisper的简单部署

m0_52156129的博客

03-02

1万+

Windows使用whisper前需要进行的一些环境配置

Windows下用conda一键搞定whisper-large-v3部署（附完整依赖清单）

tech5的博客

02-26

687

本文提供了一份详尽的Windows系统下使用Conda部署Whisper-large-v3语音识别模型的实战指南。通过精准匹配PyTorch、FFmpeg等核心依赖版本，并附上完整的依赖清单，有效解决了常见的‘依赖地狱’问题，确保模型能在CPU和GPU环境下稳定运行，实现一键式高效部署。

在 windows 上部署使用 Whisper 教程

lazy_11的博客

09-16

1万+

Whisper是 OpenAI 提供的开源语音识别模型，能够将音频文件转录为文本或字幕文件，支持多种语言和多格式输出。自动检测和转录多语言音频。支持生成.txt.srt.vtt等格式的字幕文件。能够处理嘈杂环境下的音频。通过 GPU 加速，提高转录效率。通过这篇教程，你已经了解了如何在 Windows 系统上部署 Whisper，创建虚拟环境、安装必要依赖，并利用 GPU 加速音频转录。

windows部署whisper模型

01-23

### 如何在 Windows 系统中部署 Whisper 语音识别模型 #### 准备工作为了能够在 Windows 上顺利部署 Whisper 模型，需要先安装 Python 和必要的依赖库。建议使用 Anaconda 或 Miniconda 来管理虚拟环境和包。创建一个新的 Conda 虚拟环境并激活该环境： ```bash conda create -n whisper-env python=3.9 conda activate whisper-env ``` 接着安装 PyTorch 及其他所需软件包。对于 CPU 版本的安装命令如下所示；如果有 GPU，则应选择相应的 CUDA 版本来加速计算[^1]。 ```bash pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cpu pip install git+https://github.com/openai/whisper.git ``` #### 下载预训练好的 Whisper 模型文件 Whisper 提供了几种不同大小的预训练模型可供下载，具体取决于硬件条件和个人需求来挑选合适的版本。通常情况下 `base` 就已经足够满足大多数应用场景的需求了[^2]。 ```python import whisper model = whisper.load_model("base") ``` 这段代码会自动从互联网获取对应的权重参数并将它们缓存到本地磁盘以便后续重复利用而不必每次都重新下载。 #### 实现简单的录音转文字功能下面给出一段完整的 Python 示例程序，用于读取麦克风输入的声音片段，并将其转换成文本输出显示出来[^3]。 ```python import sounddevice as sd from scipy.io.wavfile import write import numpy as np import whisper def record_audio(filename="output.wav", duration=5, fs=44100): myrecording = sd.rec(int(duration * fs), samplerate=fs, channels=2) sd.wait() # Wait until recording is finished write(filename, fs, myrecording) record_audio() audio_file_path = "output.wav" transcription = model.transcribe(audio_file_path)["text"] print(f"Transcribed Text: {transcription}") ``` 此脚本首先录制五秒钟长的立体声音频保存至当前目录下的 output.wav 文件里，之后再调用之前加载过的 Whisper 对象来进行实际的文字化处理操作最后打印出结果字符串。 #### 测试与优化完成上述步骤后就可以尝试运行整个流程看看效果如何了。如果一切正常的话应当可以看到控制台窗口中有被识别出来的语句内容呈现出来。当然这只是一个非常基础的例子，在真实项目当中可能还需要考虑更多细节方面的问题比如错误处理机制、性能优化措施等等[^4]。

自动语音识别模型whisper安装和初探

WenbinYao&YouweiHu

04-14

7943

whisper是OpenAI 最近发布的语音识别模型。OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）和多任务（multitask）监督数据对 Whisper 进行了训练，whisper可以执行多语言语音识别、语音翻译和语言识别。

whisper在conda中部署（windows+cpu）

aierb的博客

03-01

1013

whisper在conda中部署

可以白嫖的语音识别开源项目whisper的搭建详细过程 | 如何在Linux中搭建OpenAI开源的语音识别项目Whisper

Luke Ewin的博客

05-14

8281

这篇文章将会讲述如何在Ubuntu服务器上搭建商用级别的语音识别项目Whisper，这里你可以从零开始根据文档来搭建，文档中包括了Anaconda的安装，NVIDIA显卡驱动的安装，CUDA的安装，以及PyTorch的安装等等内容。

【语音识别】vLLM 部署 Whisper 语音识别模型指南

Talk is cheap. Show me the code

04-10

5052

使用 vLLM 部署 openai whisper

微调Whisper模型，让你的语音技术走在前沿！

糯米导航

10-08

1508

在本文中，我将详细介绍如何为Whisper模型搭建环境、准备数据集、进行微调，最后验证模型的性能。这是一个适合语音识别爱好者和专业开发者的全面指南。

OpenAI 开源语音识别模型 Whisper 初体验