GLM-ASR— 智谱开源的语音识别系列模型

admin 百科 14

GLM-ASR是什么

glm-asr是智谱ai自主研发的语音识别模型家族,涵盖面向云端服务的glm-asr-2512与面向端侧部署的开源模型glm-asr-nano-2512。其中,glm-asr-2512是当前全球性能领先的云端语音识别系统,具备多场景适配、多语言覆盖及多口音鲁棒性,实测字符错误率(cer)低至0.0717。而glm-asr-nano-2512则是一款参数量为1.5b的轻量化端侧模型,在开源语音识别领域达到sota水准,不仅支持粤语等方言识别与极低信噪比下的语音捕获(如耳语级输入),更在保障用户数据本地化处理的前提下,实现毫秒级响应与强隐私保护。依托该系列模型,智谱ai输入法已集成语音转写、实时翻译、文本润色等多项能力,持续推动人机语音交互向更高效、更智能的方向演进。

GLM-ASR— 智谱开源的语音识别系列模型-第1张图片-佛山资讯网

标签: git github 编码 ai 短视频 多语言 本地化 api调用 hugging face 智谱ai输入法

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~