智谱ai正式推出并开源glm-asr系列语音识别模型,并同步发布基于该系列打造的桌面级“智谱ai输入法”。

此次发布的模型与产品涵盖以下三款核心成果:
- GLM-ASR-2512:具备国际领先水平的云端语音识别大模型;
- GLM-ASR-Nano-2512:参数量仅为1.5B的轻量级开源端侧语音模型,性能达当前开源领域SOTA水准;
- 智谱AI输入法:深度融合语音识别与大语言模型能力的桌面端高效生产力工具。
据官方介绍,GLM-ASR-2512是智谱全新一代语音识别模型,支持高实时性语音到文本转换。在涵盖多场景、多语种、多方言的真实复杂环境中持续验证,展现出行业顶尖的识别稳定性与准确性,字符错误率(CER)低至0.0717。
在此基础上,智谱AI进一步开源了GLM-ASR-Nano-2512。该模型虽仅含1.5B参数,却在多项基准测试中刷新开源语音识别性能纪录,部分指标甚至超越多个主流闭源方案。它专为本地部署优化,在保障识别精度的同时,显著提升数据隐私安全性与语音交互响应速度。

依托上述双模型技术底座,智谱AI正式上线“智谱AI输入法”,为Windows与macOS用户提供流畅自然的PC端语音交互体验。用户不仅能获得高准确率的语音转写能力,还可一键完成跨语言翻译、语义润色、内容改写等智能操作,真正实现“说话即指令,语音即生产力”。

标签: windows 工具 mac ai macos win 大模型 api调用 cos 本地部署
还木有评论哦,快来抢沙发吧~