12月10日,面壁智能宣布,VoxCPM 1.5版本正式上线并开源,多项核心能力升级。
其中,AudioVAE采样率从16kHz提升至44.1kHz,模型可根据高质量音频,克隆效果更佳、细节更丰富的声音;此外,VoxCPM 1.5仅需6.25个token即可生成1秒音频,较此前版本提高一倍,在保持速度的同时提升了音频生成质量。同时,VoxCPM 1.5版本稳定性增强,减少音频伪影,优化长文本音频的生成效果。
12月10日,面壁智能宣布,VoxCPM 1.5版本正式上线并开源,多项核心能力升级。
其中,AudioVAE采样率从16kHz提升至44.1kHz,模型可根据高质量音频,克隆效果更佳、细节更丰富的声音;此外,VoxCPM 1.5仅需6.25个token即可生成1秒音频,较此前版本提高一倍,在保持速度的同时提升了音频生成质量。同时,VoxCPM 1.5版本稳定性增强,减少音频伪影,优化长文本音频的生成效果。