一、中文韵律数据集
以下是与中文文本到语音(TTS)系统中韵律处理相关的数据集及其网址,以表格形式展示:
数据集名称 |
简介 |
网址 |
Chinese-TTS-Dataset |
覆盖汉语多音字及音变现象的高效 TTS 数据集,适合韵律建模与预测。 |
GitHub |
200,955条中文文本韵律标注语料数据 |
包含20万条中文文本,进行了四级韵律标注,句式多样化,适合用于TTS韵律预测。 |
DataTang |
TTS-CProsC: A Chinese Prosody Corpus |
包含330,000条中文句子的韵律标注数据集,可用于TTS系统的韵律预测训练。 |
|