通义百聆语音双子星升级并开源，大幅提升语音合成与识别能力

admin 百科 2025-12-15 23

据通义大模型官方发布，通义百聆正式推出升级版语音大模型fun-cosyvoice3与fun-asr，并同步向全球开源。本次迭代重点强化模型的核心能力与落地实用性，旨在为开发者及企业用户提供更高效、更可靠的语音ai解决方案。

通义百聆语音双子星升级并开源，大幅提升语音合成与识别能力-第1张图片-佛山资讯网

通义百聆语音双子星升级并开源，大幅提升语音合成与识别能力-第2张图片-佛山资讯网

Fun-CosyVoice3：低延迟、高保真的智能语音合成

首包响应时间缩短50%，真正达成“边输边说”的实时合成体验。中英文混合语音合成错误率显著降低56.4%，全面支持9种国际语言、18类中文方言，并内置多维度情感表达调控能力。其轻量开源版本Fun-CosyVoice3-0.5B具备出色的zero-shot音色复刻性能。

Fun-ASR：高鲁棒性、低延迟的语音识别引擎

标签： git github ai ios nas 大模型本地化 cos

本文地址： https://www.fsgp.cn/p/baike/62860.html