近日,随着大语言模型技术迎来爆发式演进,业界始终在热切探寻下一个颠覆性突破。在此背景下,runway推出的“whisper thunder”模型——即gen-4.5版本,宛如一颗骤然升空的新锐彗星,在ai视频生成赛道强势闪耀。早期公开演示中,该模型所生成的视频呈现出人物与动物在街巷间疾驰、形态自如流转甚至彼此交融变形的视觉奇观,画面质感堪比院线级电影,令人震撼。
那么,“Whisper Thunder”究竟为何物?Runway又是一家怎样的公司?
Runway并非OpenAI、谷歌或Anthropic这类家喻户晓的AI巨头,而更像一位低调蓄力、一鸣惊人的行业“黑马”。其背后资方阵容亮眼,涵盖General Atlantic、Baillie Gifford、英伟达(NVIDIA)及Salesforce Ventures等顶级机构。据CNBC专访披露,Runway首席执行官坦言:这款看似横空出世的图像生成模型,实则凝聚了团队整整七年的心血打磨;而Gen-4.5在内部研发阶段的代号正是“David”——这一命名,恰如其分地隐喻了公司以小博大、挑战巨擘的雄心与姿态。
Runway创立于2018年,核心聚焦于基于视频与真实世界观测数据训练的“世界模型”(World Models),旨在让AI对物理世界的运行逻辑、时空关系与因果动态具备更本真、更细腻的理解与响应能力。其用户生态极为多元,覆盖主流媒体集团、影视制作公司、国际品牌方、独立设计师、UGC内容创作者乃至高校学生群体。目前公司员工规模约120人,PitchBook数据显示其最新估值已达35.5亿美元。
当地时间12月1日,Runway正式发布Gen-4.5模型,并启动分阶段开放策略:本周起陆续向全体付费客户全面开放使用权,支持通过Runway自有平台、官方API接口,以及部分深度合作渠道接入调用。该模型在权威第三方评测榜单Artificial Analysis的Video Arena中表现抢眼。该榜单采用严格盲测机制——将两段由不同模型生成的视频并列呈现给专业评委,全程隐去模型来源信息,仅凭观感投票选出更优作品。最终排名显示:Gen-4.5高居榜首;谷歌Veo 3位列第二;OpenAI Sora 2 Pro则排在第七位。这一结果直观印证:Gen-4.5所产出的视频在人类感知层面更具可信度、自然度与提示契合度。

从底层技术架构来看,Gen-4.5展现出多项关键突破:
- 深度依托NVIDIA GPU集群进行高强度训练,融合海量高质量视频-文本配对数据,实施前沿多模态联合建模;
- 特别强化对时间维度的建模能力,显著提升视频帧序列中物体运动轨迹、形变逻辑与角色行为的一致性与连贯性;
- 支持以极简文本提示驱动生成高分辨率、高动态质量的完整视频,尤其擅长构建复杂空间场景与富有张力的人物表演;
- 大幅增强创意控制粒度,赋予用户对风格、节奏、光影及角色一致性的精细干预能力;
- 显著优化跨帧稳定性,确保同一角色、物体或环境要素在长时序视频中保持视觉与语义层面的高度统一。
具体功能亮点包括:
标签: runway 谷歌 工具 nvidia ai openai 英伟达 ai视频 sora veo
还木有评论哦,快来抢沙发吧~