基于VITS 模型的藏语康巴方言语音合成研究

作者: 王嘉文 高定国 尼琼 巴果

基于VITS 模型的藏语康巴方言语音合成研究0

摘要:藏语康巴方言是一种分布在中国西南部的少数民族语言,数据量低且具有丰富的声调和声母变化,给语音合成带来了很大的挑战。目前,现有的藏语语音合成模型大多基于传统的声码器或神经网络架构,需要大量的标注数据和复杂的训练过程,而且合成效果不理想。文章通过改进VITS模型,使其运用于藏语语音合成,在一个小规模的藏语康巴方言语料库上训练了VITS模型。实验结果表明,VITS模型可以很好地应用于藏语康巴方言的语音合成,不仅可以保持语音的自然度和清晰度,还可以准确地反映语音的声调和声母变化。

关键词: VITS; 藏语; 康巴方言; 语音合成

中图分类号:TP18 文献标识码:A

文章编号:1009-3044(2024)04-0008-03

上一篇 点击页面呼出菜单 下一篇