Runway重夺全球第一!1247分碾压谷歌Veo3,没有千亿算力也能干翻科技巨头

2025-12-02 发布 · 浏览13次 · 点赞0次 · 收藏0次

【导读】Runway Gen-4.5这波有点厉害!

刚刚更新的Runway Gen-4.5击败谷歌Veo3,重夺AI视频王座

在Artificial Analysis的榜单中Runway以1247的ELO分数拿下第一。


在观看了RunwayGen-4.5的宣传视频后,被其中的一句话所打动:

我们创造了一个,你可以用来创造一切的的产品。

RunwayGen-4.5此前代号为WhisperThunder。

Gen-4.5采用最先进技术,在视频生成的运动质量、提示词遵循度和视觉保真度方面树立了全新标杆。


以下是一些惊艳的例子。

RunwayGen-4.5在视频模型的预训练数据效率和后训练技术方面均取得显著进步,并成为用于世界建模的新基础模型。

Gen-4.5在ArtificialAnalysis文本转视频排行榜中获得1,247Elo积分,创下新标准并超越了全球所有其他AI视频模型。


Runway是第一家将文生视频技术真正做成可供大众使用的SaaS产品的公司。

在2023年初,Runway率先推出了Gen-1(视频生视频)和Gen-2(文生视频)。

当时谷歌的ImagenVideo和Meta的Make-A-Video还停留在实验室演示阶段,而Runway直接让普通用户通过网页就能生成视频。


它是第一个让「AI视频生成」成为独立商业赛道的公司,甚至早于OpenAI的Sora(Sora发布于2024年初)。

Gen-4.5实现了前所未有的物理精确度和视觉精度。

  • 物体以逼真的重量、动量和力量运动。

  • 液体以恰当的动力学特性流动。

  • 表面细节以极高的保真度渲染。

  • 而像发丝和材质编织这样的精细细节在运动和时间内保持连贯。

在复杂场景、精细构图、物理准确性上都表现出色,并且能生成富有表现力的角色。

Gen-4.5能够处理从照片级真实感和电影感,到风格化动画的广泛美学风格,同时保持连贯的视觉语言。

Gen-4.5从初期研发、预训练、后训练到推理的整个开发过程完全基于英伟达GPU完成。

尽管能力有了飞跃,Rnway仍表现出视频生成模型常见的若干限制:

  • 因果推理:效果有时会先于原因出现(例如,门在按下把手之前就打开了)。

  • 物体恒存性:物体可能在帧间意外消失或出现(例如,杯子被遮挡后消失)。

  • 成功偏差:动作异常容易成功(例如,瞄准不佳的射门仍能得分)。


Runway创始人最新访谈

Runway Gen 4.5如何重塑模拟引擎革命?

Runway ML创始人Cristóbal Valenzuela访谈刚刚曝光!


视频模型正从娱乐工具转向世界模拟引擎,这是否预示AGI新时代的曙光?

Cristóbal Valenzuela在 Gen 4.5模型社区投票登顶视频竞技场排行榜后,与Lukas Biewald展开深度对话,剖析视频建模领域的挑战与创新。

视频AI的终局是「世界模拟器」吗?

以小博大:专注与效率的胜利

采访一开始,Lukas就抛出了一个尖锐的问题:「Runway作为一个创业公司,是如何与拥有无限资源的谷歌竞争的?」

Chris的回答非常坦诚。七年前Runway刚成立时,甚至没人觉得「视频模型」是一个值得投入的领域。如今虽然行业已被引爆,且巨头纷纷入局,但Chris认为资源仍然不是决定性因素。


  • 专注(Obsession):

    相比大厂的广泛布局,Runway拥有一支对视频生成愿景极度痴迷的团队。

  • 效率(Efficiency):

    当你没有几千亿美元可以挥霍时,你必须在训练和推理的效率上极度创新。「在有限资源下做到世界第一,迫使我们变得更具创造力。」



二级标题炼丹的玄学:技术中的「品味」

Gen 4.5为什么能大幅领先?Chris提到了一个有趣的词——「品味」(Taste)

这里的「品味」指的不仅仅是生成画面的美学风格,更多是指「如何训练模型的直觉」。


  • 模型训练没有单一的「魔法按钮」。

  • 它关乎成千上万个参数的微调、无数个Tips&Tricks的组合。

  • Chris引用了Ilya Sutskever的观点,认为现在是「拥有更大算力的基础研究回归之年」。谁更擅长做基础科学实验,谁就能领先。

超越语言:视频模型即「世界模型」

这是本次采访中最核心的观点。

Chris认为,理解视频模型的最佳方式,是将其视为「通用模拟引擎」(Universal Simulation Engines)。


  • 语言的局限:

    语言模型(LLM)受限于语言本身——语言只是人类对现实的一种抽象,而非现实本身。

  • 观察数据的力量:

    视频模型通过学习大量的观察数据,能够捕捉到物理世界的规律,如因果关系、空间与时间的连续性、物体恒存性等。


实测案例:Chris举了一个内部测试的Prompt例子:「一只袋鼠推着另一只坐在婴儿车里的小袋鼠」。

这不仅需要模型理解复杂的生物运动,还要处理摄像机的跟随运镜。

Gen 4.5能够完美处理这种复杂的物理交互,证明了它不仅仅是在生成像素,而是在理解物理世界


未来的应用:从电影到机器人

如果视频模型是「模拟引擎」,那它的应用场景将远超现在的影视制作:


  1. 非线性娱乐体验:

    未来的游戏或互动内容可能不再是预先制作好的,而是实时生成的、可交互的「梦境」。

  2. 具身智能(EmbodiedAI):

    有开发者已经开始利用Runway生成合成视频数据,用来训练机器人的手臂操作。

  3. 个性化学习:

    想象一下,你想学习任何知识,AI都能实时为你生成一段专属的教学视频。


在采访的最后,Chris并没有回避关于安全性的问题。

面对「AI生成内容对儿童限制过多」的抱怨,他表示这确实是一个艰难的平衡,但未来或许会出现类似流媒体平台的「儿童模式」,把控制权交给家长。

Runway的野心从未止步于「视频剪辑工具」。

正如Chris所言,他们正在构建的是一种新的媒介,一种能够模拟万物的智能系统。

我们首先模拟的是娱乐和媒体,但你会看到,这些模型将开始模拟远超于此的一切。

参考资料:

https://runwayml.com/

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定极速推送!

Runway重夺全球第一!1247分碾压谷歌Veo3,没有千亿算力也能干翻科技巨头 - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论

游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。