小米集团AI实验室发布ZipVoice系列语音合成(TTS)模型

32度域获悉,据小米技术消息,近日,小米集团AI实验室新一代Kaldi团队发布了基于Flow Matching架构的ZipVoice系列语音合成(TTS)模型——ZipVoice(零样本单说话人语音合成模型)与ZipVoice-Dialog(零样本对话语音合成模型)。ZipVoice解决了现有零样本语音合成模型的参数量大、合成速度慢的痛点,ZipVoice-Dialog则解决了现有对话语音合成模型在稳定性和推理速度上的瓶颈。

本内容为作者独立观点,不代表32度域立场。未经允许不得转载,授权事宜请联系 business@sentgon.com
如对本稿件有异议或投诉,请联系 lin@sentgon.com
👍喜欢有价值的内容,就在 32度域 扎堆
(0)

猜你喜欢

发表回复

登录后才能评论