通义百聆语音双子星升级并开源,大幅提升语音合成与识别能力

admin 百科 12

据通义大模型官方发布,通义百聆正式推出升级版语音大模型fun-cosyvoice3与fun-asr,并同步向全球开源。本次迭代重点强化模型的核心能力与落地实用性,旨在为开发者及企业用户提供更高效、更可靠的语音ai解决方案。

通义百聆语音双子星升级并开源,大幅提升语音合成与识别能力-第1张图片-佛山资讯网

通义百聆语音双子星升级并开源,大幅提升语音合成与识别能力-第2张图片-佛山资讯网

Fun-CosyVoice3:低延迟、高保真的智能语音合成

首包响应时间缩短50%,真正达成“边输边说”的实时合成体验。中英文混合语音合成错误率显著降低56.4%,全面支持9种国际语言、18类中文方言,并内置多维度情感表达调控能力。其轻量开源版本Fun-CosyVoice3-0.5B具备出色的zero-shot音色复刻性能。

Fun-ASR:高鲁棒性、低延迟的语音识别引擎

标签: git github ai ios nas 大模型 本地化 cos

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~