Sherpa-ONNX：说话人识别与语音识别自动开启（VAD）+ Python API 完整指南

最新推荐文章于 2025-06-20 11:11:59 发布

一只蜗牛儿

最新推荐文章于 2025-06-20 11:11:59 发布

阅读量4.6k

点赞数 8

CC 4.0 BY-SA版权

文章标签：语音识别 python 人工智能

本文链接：https://blog.csdn.net/qq_42978535/article/details/142821046

介绍

Sherpa-ONNX 是一个基于 ONNX 的轻量级语音识别框架，支持多种语音处理任务，包括说话人识别（Speaker Recognition）和自动语音识别（Automatic Speech Recognition, ASR）。在本指南中，我们将重点介绍如何使用 Sherpa-ONNX 进行说话人识别、自动开启语音识别（VAD）以及如何通过 Python API 进行操作。

安装环境

在开始之前，确保你的系统上已安装以下软件和库：

Python 3.7 或以上版本
pip（Python 包管理工具）
ONNX Runtime（用于运行 ONNX 模型）

步骤 1：安装必要的库

在终端中运行以下命令以安装 Sherpa-ONNX 和其他依赖库：

pip install numpy onnx onnxruntime
pip install sherpa-onnx

步骤 2：模型准备

Sherpa-ONNX 需要预训练模型以进行说话人识别和语音识别。你可以从官方 GitHub 仓库下载相应的模型文件。

# 假设模型文件存储在 models/ 目录下
mkdir models
cd models
# 下载说话人识别模型
wget [说话人识别模型下载链接]
# 下载语音识别模型
wget [语音识别模型下载链接]

步骤 3：自

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

一只蜗牛儿

关注关注

8
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

paddlespeech 声纹识别embedding向量提取；sherpa-onnx说话人识别

weixin_42357472的博客

06-27

1181

参考： https://aistudio.baidu.com/aistudio/projectdetail/4353348https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/demos/speaker_verification/README_cn.md注意 1）安装paddlespeech，参考： https://blog.csdn.net/weixin_42357472/article/details/131269539?spm=1001.2

sherpa-onnx流式ASR模型

09-26

sherpa-onnx流式ASR模型或者去sherpa官网下载对应模型模型名 sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20

参与评论您还未登录，请先登录后发表或查看评论

sherpa-onnx说话人识别+语音识别自动开启（VAD）+语音识别Python API

lstef的博客

06-17

4010

实现实时语音识别，自动识别语音开始结束，识别讲话人身份

Sherpa-onnx：开源语音识别框架的突破性进展

最新发布

gitblog_07119的博客

06-20

497

Sherpa-onnx：开源语音识别框架的突破性进展项目概述 Sherpa-onnx是一个基于ONNX Runtime的开源语音识别框架，由k2-fsa团队开发维护。该项目以其模块化设计、高性能和跨平台支持在开发者社区中获得了广泛好评。技术亮点卓越的架构设计该框架采用了高内聚、低耦合的模块化设计理念，使得各个功能组件能够独立开发和优化。这种架构不仅提高了代码的可维护性，也为性能优化提供了良...

【亲测免费】强大而全面的语音处理工具——Sherpa-Onnx

gitblog_00354的博客

08-10

2325

强大而全面的语音处理工具——Sherpa-Onnx 在人工智能的浪潮中，语音技术已成为连接人机的重要桥梁。今天，我们要向您隆重推荐一个开源宝藏——Sherpa-Onnx，一个集多种语音功能于一体的强大本地运行库，完美适配从服务器到边缘设备的各种场景。项目介绍 Sherpa-Onnx 是一款开源的语音处理神器，它涵盖了从语音识别（ASR）、语音合成（TTS）到说话人验证与识别等一整套语音技术功能。...

sherpa-onnx部署笔记

guoqingru0311的博客

04-08

1575

sherpa-onnx部署笔记

sherpa-onnx 项目教程

gitblog_00311的博客

08-10

1319

sherpa-onnx 项目教程项目介绍 sherpa-onnx 是一个基于 next-gen Kaldi 的语音识别、文本转语音和说话人识别项目，使用 onnxruntime 进行本地处理，无需互联网连接。该项目支持多种平台和编程语言，包括 Android、iOS、Raspberry Pi、RISC-V、x86_64 服务器等。项目快速启动安装依赖首先，确保你已经安装了 Python 和...

sherpa-onnx 项目使用教程

gitblog_00307的博客

08-10

1101

sherpa-onnx 项目使用教程 1. 项目的目录结构及介绍 sherpa-onnx 项目的目录结构如下： sherpa-onnx/ ├── csrc/ │ ├── online-wenet-ctc-model.cc │ └── ... ├── python/ │ ├── setup.py │ └── ... ├── scripts/ │ ├── build.sh │ ...

将sherpa-onnx嵌入unity中进行语音识别（ASR）

fasd385sd的博客

12-07

2451

是一个开源项目，旨在提供离线的语音识别、文本转语音、说话人识别和语音活动检测（VAD）功能。该项目支持很多语言，其中包括C#，在原项目文件中有C#示例，因此可以移植到unity中，本文参考了sherpa-onnx的TTS实现和原项目C#示例代码。首先该项目进行语音识别需要语音识别大模型，我这边以模型作为测试，要下载该模型请自行去该项目的官方网址去下载。然后需要导入相关dll库和lib库，我在原项目文件中找了很久都没找到，最后在他的示例项目中找到。现在万事俱备，接下来可以开始了。

Unity使用sherpa-onnx实现离线语音合成

不忘初心方得始终

05-14

2709

Unity使用sherpa-onnx实现离线语音合成

【免费下载】 sherpa-onnx 安装和配置指南

gitblog_07717的博客

09-13

4999

sherpa-onnx 安装和配置指南 1. 项目基础介绍和主要编程语言项目基础介绍 sherpa-onnx 是一个开源项目，旨在提供离线的语音识别、文本转语音、说话人识别和语音活动检测（VAD）功能。该项目基于下一代 Kaldi 和 onnxruntime，支持多种平台和操作系统，包括嵌入式系统、Android、iOS、Raspberry Pi、RISC-V 和 x86_64 服务器。主要编...

java centos 离线使用sherpa-onnx文字转语音TTS

zhangr

11-26

1478

sherpa-onnx 是一个基于下一代 Kaldi 和 onnxruntime 的开源项目，专注于语音识别、文本转语音、说话人识别和语音活动检测（VAD）等功能。sherpa-onnx 提供了以下核心功能：语音识别（Speech-to-Text, ASR）：支持流式和非流式语音识别。语音语言识别（Spoken Language Identification）：识别语音的语言。文本转语音（Text-to-Speech, TTS）：将文本转换为语音。相关文件已上传至资源库。

sherpa-onnx 说话人

01-15

Sherpa-ONNX 提供了一套完整的解决方案来执行说话人识别任务。该框架不仅能够处理传统的语音信号输入，还集成了自动语音活动检测（VAD），从而提高了实际应用中的鲁棒性和效率[^1]。 #### 安装依赖项为了开始使用...

Sherpa-onnx 多语言ASR模型解析与应用

gitblog_07168的博客

06-20

341

Sherpa-onnx 多语言ASR模型解析与应用 Sherpa-onnx项目中的多语言自动语音识别(ASR)模型为开发者提供了强大的语音转文本能力。该项目发布的sherpa-onnx-x.y.z-arm64-v8a-vad_asr-be_de_en_es_fr_hr_it_pl_ru_uk-fast_conformer_ctc_20k.apk应用包集成了高效的语音识别功能，支持包括英语、德语、法...

【离线语音助手】Xamarin From Android 语音识别 合成 sherpa-onnx

weixin_45809638的博客

02-18

1168

xamarin from 通过 sherpa-onnx 实现离线语音识别、语音合成

文字转语音——sherpa-onnx语音识别离线部署C++实现

huanrx的博客

04-08

2883

C++项目中接入Sherpa-onnx实现文字转语音功能Windows、VS2022选择动态库是因为能够避免一些配置上的bug。库文件地址：https://huggingface.co/csukuangfj/sherpa-onnx-libs/tree/main 里边有各个平台的库文件，选择最新版本的window 64bit shared下载。 git地址：https://github.com/makdi76/sherpa-onnxsherpa-onnx教程地址：sherpa-onnx — sherpa 1.

使用kaldi的sherpa-onnx根据文字语音合成（英文）

lstef的博客

06-25

1073

kaldi sherpa-onnx 文字转语音tts实现

【免费下载】开源项目推荐：sherpa-onnx

gitblog_07718的博客

09-13

2096