面壁智能VoxCPM 1.5上线并开源:高采样音频克隆,生成效率翻倍

12月10日,面壁智能宣布,VoxCPM 1.5版本正式上线并开源,多项核心能力升级。

其中,AudioVAE采样率从16kHz提升至44.1kHz,模型可根据高质量音频,克隆效果更佳、细节更丰富的声音;此外,VoxCPM 1.5仅需6.25个token即可生成1秒音频,较此前版本提高一倍,在保持速度的同时提升了音频生成质量。同时,VoxCPM 1.5版本稳定性增强,减少音频伪影,优化长文本音频的生成效果。

本内容为作者独立观点,不代表32度域立场。未经允许不得转载,授权事宜请联系 business@sentgon.com
如对本稿件有异议或投诉,请联系 lin@sentgon.com
👍喜欢有价值的内容,就在 32度域 扎堆
(0)

猜你喜欢

发表回复

登录后才能评论