语音识别
文章平均质量分 54
AI算法网奇
资深算法工程师,CSDN博客专家。多年一线算法研发经验 主要研究方向为三维重建、多模态模型。希望把我的经验和知识带给每一个喜欢钻研朋友,为中国人工智能行业添砖加瓦!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
cosyvoice docder部署
cosyvoice coder部署原创 2026-04-02 10:20:08 · 35 阅读 · 0 评论 -
语音播报 文字转语音 edge_tts
语音播报 文字转语音 edge_tts原创 2026-03-30 14:59:13 · 118 阅读 · 0 评论 -
FastCosyVoice 提速部署实战
FastCosyVoice 部署实战原创 2026-03-29 02:06:13 · 74 阅读 · 0 评论 -
CosyVoice 加速3倍 server封装
CosyVoice 加速3倍 server封装原创 2026-03-28 16:42:53 · 51 阅读 · 0 评论 -
语音播报实时
语音播报实时原创 2026-03-27 22:00:54 · 53 阅读 · 0 评论 -
语音播报 F5-TTS 部署笔记
语音播报 F5-TTS 部署笔记原创 2026-03-27 20:33:24 · 42 阅读 · 0 评论 -
语音播报 整理笔记2026
语音播报 整理笔记2026原创 2019-04-16 21:17:01 · 3503 阅读 · 0 评论 -
PyTorch 线程亲和性测试:CUDA 上下文绑定的惊人代价
【代码】PyTorch 线程亲和性测试:CUDA 上下文绑定的惊人代价。原创 2026-03-27 12:30:28 · 16 阅读 · 0 评论 -
CosyVoice 克隆声音异常解决
CosyVoice 克隆声音异常解决原创 2026-03-26 21:49:01 · 34 阅读 · 0 评论 -
语种检测 部署笔记
语种检测 部署笔记原创 2025-08-04 10:18:08 · 15 阅读 · 0 评论 -
ast 音频分类
ast 音频分类原创 2025-08-26 19:44:50 · 22 阅读 · 0 评论 -
音频读写速度优化 音频格式
音频读写速度优化 音频格式原创 2025-08-20 21:25:25 · 298 阅读 · 0 评论 -
音频大模型学习笔记
音频大模型学习笔记原创 2025-08-20 13:43:17 · 201 阅读 · 0 评论 -
音频分类EfficientAT 部署踩坑笔记
音频分类EfficientAT 部署踩坑笔记原创 2025-08-19 21:51:54 · 251 阅读 · 0 评论 -
语音分类数据:
Telephone bell ringing: 0.754 (电话铃声)Inside, small room: 0.235 (室内小房间)Telephone: 0.183 (电话)Music: 0.092 (音乐)Ringtone: 0.047 (手机铃声)Inside, large room or hall: 0.028 (室内大厅或礼堂)Alarm: 0.014 (警报)Animal: 0.009 (动物)Vehicle: 0.008 (车辆)原创 2025-08-19 12:09:46 · 581 阅读 · 0 评论 -
音频分类模型笔记
音频分类模型笔记原创 2025-08-18 17:04:58 · 648 阅读 · 0 评论 -
spleeter 人声分离笔记
spleeter 人声分离笔记原创 2025-08-18 01:20:00 · 781 阅读 · 0 评论 -
人声分离 说话者分离
人声分离算法笔记原创 2025-08-18 01:01:12 · 501 阅读 · 0 评论 -
whisper推理封装
whisper推理封装原创 2025-08-17 00:53:30 · 16 阅读 · 0 评论 -
python 音量检测
python 音量检测原创 2025-08-16 22:47:24 · 340 阅读 · 0 评论 -
语音处理Pyannote算法笔记
语音处理Pyannote算法笔记原创 2025-08-16 16:43:02 · 388 阅读 · 0 评论 -
whisper 语种检测学习笔记
whisper 语种检测学习笔记原创 2025-08-15 23:15:38 · 404 阅读 · 0 评论 -
说话人识别
说话人识别原创 2025-08-12 08:54:17 · 437 阅读 · 0 评论 -
ctc 解码原理
ctc 解码原理原创 2025-08-11 14:06:58 · 595 阅读 · 0 评论 -
语言识别 语种识别 2025
语言识别 语种检测 2025原创 2025-08-11 11:54:26 · 8384 阅读 · 0 评论 -
频谱图学习笔记
【代码】频谱图学习笔记。原创 2025-08-08 20:38:45 · 328 阅读 · 0 评论 -
语音识别 SenseVoice与FunASR对比
语音识别 SenseVoice与FunASR对比原创 2025-08-08 17:14:25 · 2901 阅读 · 0 评论 -
silero-vad 训练自己的数据
silero-vad 训练自己的数据原创 2025-08-02 13:10:54 · 766 阅读 · 0 评论 -
语音数据集 整理
语音数据集 整理原创 2025-08-02 12:42:01 · 2455 阅读 · 0 评论 -
音频获取长度 截取
音频获取长度原创 2025-08-01 12:02:04 · 529 阅读 · 0 评论 -
人声分离 音乐源分离学习笔记
人声分离 音乐源分离学习笔记原创 2025-08-01 01:02:26 · 581 阅读 · 0 评论 -
语音识别准确率计算 jiwer 库
语音识别准确率计算 jiwer 库原创 2025-07-31 15:19:12 · 359 阅读 · 0 评论 -
whisper tokenizer
whisper tokenizer原创 2025-07-31 00:52:35 · 324 阅读 · 0 评论 -
OWSM v4 语音识别学习笔记
OWSM v4 语音识别学习笔记原创 2025-07-30 15:16:18 · 7467 阅读 · 0 评论 -
语音识别dolphin 学习笔记
语音识别dolphin 学习笔记原创 2025-07-30 14:17:03 · 813 阅读 · 0 评论 -
Whisper 语音识别 使用笔记
WhisperProcessor 语音转文字 使用笔记原创 2025-07-30 01:25:06 · 1153 阅读 · 0 评论 -
繁体中文转简体中文
繁体中文转简体中文原创 2025-07-30 01:19:30 · 3286 阅读 · 0 评论 -
音频数据增强
音频数据增强原创 2025-07-30 00:51:42 · 3637 阅读 · 0 评论 -
vad 语音活动检测 FSMN-VAD和Silero-VAD
vad Voice Activity Detection 语音活动检测原创 2025-07-29 14:45:43 · 886 阅读 · 0 评论 -
语音识别数据增强
2.一段语音,一段文字,随意拆分的话,语音要拆分,文字也要对应拆分。原创 2025-07-28 21:47:45 · 305 阅读 · 0 评论
分享