微软推出语音合成模型NaturalSpeech2

来源：鞭牛士时间：2023-07-28 15:38:35

(资料图片仅供参考)

微软日前推出语音合成模型NaturalSpeech2，该模型采用潜在扩散式设计，可提供“商业级”语音，歌唱解决方案。在零样本情况下，该模型可以生成具有不同说话人身份、韵律和风格（如唱歌）的语音的能力。且其在零样本条件下生成的语音与语音提示，和真实语音的韵律近乎一致，并在LibriTTS和VCTK测试集上的自然度（以CMOS为度量）与真人语音难以区分。

关键词：

图文推荐

中央财经2台在线直播观看2020（中央财经2台在线直播）

强光下的羊脂白玉

电动自行车停在店门口被盗，民警追踪4天逮住偷车贼

掩耳盗铃之骗得了自己骗不了警方

国家文物局：今年将全力争取“普洱景迈山古茶林文化景观”申遗工作

不完美受害人钟楚曦饰演（钟楚曦是广州花都区人吗）

热门文字

精彩赏析