GLM-ASR— 智谱开源的语音识别系列模型

admin 百科 2025-12-14 14

GLM-ASR是什么

glm-asr是智谱ai自主研发的语音识别模型家族，涵盖面向云端服务的glm-asr-2512与面向端侧部署的开源模型glm-asr-nano-2512。其中，glm-asr-2512是当前全球性能领先的云端语音识别系统，具备多场景适配、多语言覆盖及多口音鲁棒性，实测字符错误率（cer）低至0.0717。而glm-asr-nano-2512则是一款参数量为1.5b的轻量化端侧模型，在开源语音识别领域达到sota水准，不仅支持粤语等方言识别与极低信噪比下的语音捕获（如耳语级输入），更在保障用户数据本地化处理的前提下，实现毫秒级响应与强隐私保护。依托该系列模型，智谱ai输入法已集成语音转写、实时翻译、文本润色等多项能力，持续推动人机语音交互向更高效、更智能的方向演进。

GLM-ASR— 智谱开源的语音识别系列模型-第1张图片-佛山资讯网