在近期举行的 axios ai+ summit 上,谷歌 deepmind 首席执行官德米斯・哈萨比斯(demis hassabis)公布了他对 2026 年人工智能发展的前瞻性判断。他明确指出,明年将是多模态模型能力跃升、交互式视频空间落地、以及高可靠性 ai agent 实现关键突破的集中爆发期。

哈萨比斯特别指出,Gemini 系列模型正推动多模态理解迈向新高度——它不再停留于表层内容识别,而是具备语义纵深解析能力。他以电影《搏击俱乐部》中的经典镜头为例:AI 能将主角摘下婚戒的动作,关联到存在主义语境中“剥离社会身份、回归本真自我”的哲学隐喻,而非仅输出“手指移除金属环”这类字面描述。正是这种跨模态、跨符号的抽象推理能力,支撑起新一代复杂内容生成,如结构化信息图、动态知识图谱可视化等此前难以企及的输出形态。
关于 AI Agent 的演进,他重申了此前在 2024 年 5 月提出的路线图:未来 12 个月内,Agent 将初步具备“类人级任务闭环”能力——即在无持续人工干预前提下,自主完成目标拆解、工具调用、反馈评估与策略迭代全过程。DeepMind 正致力于打造一款真正跨平台、跨终端的通用智能体,覆盖手机、桌面、车载及可穿戴设备,成为用户日常生活的主动协作者而非被动响应者。
还木有评论哦,快来抢沙发吧~