腾讯自主研发的大模型混元2.0(tencent hy2.0)正式发布,与此同时,deepseek v3.2也正加速融入腾讯生态体系。当前,这两大前沿模型已率先在元宝、ima等腾讯原生ai应用中完成部署并上线,腾讯云亦同步开放了对应模型的api接口及一站式平台服务。
此次推出的Tencent HY2.0采用先进的混合专家(MoE)架构,整体参数规模达406B,其中激活参数为32B,并全面支持长达256K的上下文窗口。
相较于前代模型(Hunyuan-T1-20250822),HY2.0Think在预训练语料质量、强化学习策略设计等方面均实现关键突破。在数学推理、科学理解、编程生成、指令精准执行等高难度复杂任务场景中,其综合性能稳居国内领先行列,泛化能力亦获得显著跃升。
在数学与科学知识推理方向,HY2.0Think依托高质量数据集开展Large Rollout强化学习训练,大幅提升了逻辑推演与问题求解能力。在国际权威评测如IMO-AnswerBench(国际数学奥林匹克竞赛基准)、HMMT2025(哈佛-麻省理工数学竞赛2025)中,该模型表现优异,达到业界一流水准。叠加预训练阶段的数据升级,其在极具挑战性的Humanity's Last Exam(HLE)知识测评以及ARC AGI等泛化能力评估任务中,同样取得突破性进展。

标签: 工具 腾讯 ai 大模型 腾讯云 deepseek 2025
还木有评论哦,快来抢沙发吧~