VoxCPM1.5— 面壁智能开源的端到端语音合成模型

admin 百科 12

VoxCPM1.5是什么

voxcpm 1.5 是由面壁智能研发的新一代端到端文本转语音(tts)系统,具备上下文理解能力与高保真声音复刻特性。该模型采用端到端扩散+自回归混合架构,直接从原始文本生成连续语音波形,支持高达 44.1khz 的采样率音频克隆,显著提升音质细腻度与细节还原能力。在推理效率方面实现突破,仅需 6.25 个 token 即可合成 1 秒语音,整体生成速度提升一倍,同时大幅降低异常噪声与失真现象。此外,voxcpm 1.5 提供灵活的定制化支持,兼容 lora 微调与全参数微调方式,便于开发者构建专属语音模型。

VoxCPM1.5— 面壁智能开源的端到端语音合成模型-第1张图片-佛山资讯网

标签: git github 工具 短视频 元宇宙

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~