AI不是在拍电影,而是在模拟世界
AI ProductsAI Principles

AI不是在拍电影,而是在模拟世界

C
Cristobal Valenzuela
2025年11月8日YouTube
返回首页

金句精选

"未来你可能实时生成屏幕上的每一个像素——任何世界、任何场景、完全互动。这不是电影,是完全不同的东西。"

"AI不是工具,它是一个新媒介。"

"电影是'捕捉现实',AI是'模拟现实'。"

"人们最低估的,是AI不会只是'更好的工具',而是会创造出全新的体验——那种感觉都不像电影的体验。"

"摄影花了大约20年的实验,才有了'摄影'这个名字。"

AI不是在拍电影,而是在模拟世界

一个艺术家出身的CEO,用7年告诉好莱坞:你们理解错了


"未来你可能实时生成屏幕上的每一个像素——任何世界、任何场景、完全互动。这不是电影,是完全不同的东西。而且会比大多数人想象的更早到来。"

当Runway CEO Cristobal Valenzuela说这话时,语气平静,但每个字都像在描述一场正在发生的革命。

这不是科幻。这是一家估值30亿美元、融资5亿美元的AI公司正在做的事。

更重要的是——他们已经说服了好莱坞最大的工作室相信这件事。


一、10年前的兔子洞

2015年左右,Cristobal还是NYU艺术+技术双学位的学生。他读到几篇深度学习论文,然后——用他的话说——"掉进了兔子洞"。

"我痴迷于这个想法:你可以用AI算法不仅创造语言,还能创造像素、视频和图像。"

3年后的2018年,他创立了"Runway ML"。

那时候跟投资人说"用机器学习做创意工具",大部分人会礼貌拒绝。"如果你在2018年做ML产品,融资的规模和估值完全不同。"

但7年后,Runway已经不需要那个"ML"后缀——

30亿估值5亿融资120人团队(大部分是研究工程师),数百万用户,从好莱坞顶级工作室到独立创作者。

但Cristobal最在意的不是这些数字,而是一个更大的问题:AI到底是什么?


二、AI不是工具,是新媒介

如果你问大多数人"AI视频生成是什么",他们会说:"一个更强大的视频编辑工具。"

Cristobal会告诉你:你理解错了。

"我一直认为,我们在Runway做的事情,本质上是在建立一个新的媒介。"

他的类比是:摄影机。

"摄影机创造了整个产业,催生了电影这个全新艺术形式。但关键在于——摄影机借用了绘画的语言和语法,但它们本质上是不同的东西。"

你不能说摄影是"更快的绘画工具"。

同样,AI也不是"更快的视频剪辑工具"。它是完全不同的东西。

Cristobal的核心论断:

"这些视频模型本质上是模拟系统。它们可以模拟世界上的任何东西,以及事物应该如何运作。你可以部署智能体,模拟智能体如何与世界互动。如果把它当作创意工具,它就是一个新媒介——不遵循电影的原则和功能。"

这解释了为什么Runway不只是"AI视频工具",而是在建立一套全新的创作语法。


三、世界模型:不是生成像素,是模拟物理

那么,这个"新媒介"的技术本质是什么?

答案是:世界模型(World Models)。

传统视频生成在"学习像素"——给AI看1000万个视频,它学会"天空是蓝色"、"人走路腿会动"。但它不理解为什么

世界模型不一样。它试图理解世界的物理规则——光如何照射,阴影如何形成,物体如何坠落,空间如何呈现。

"这些模型是模拟系统。它们模拟世界应该如何运作。"

这意味着AI不再是"生成一段视频",而是"创建一个可互动的世界":

  • 改变光照角度,阴影实时重新计算

  • 添加新物体,它会遵循物理规则坠落

  • 让角色转身,AI保持空间一致性

这不是视频,这是实时模拟。

Cristobal说:"电影是'捕捉现实',AI是'模拟现实'。"


四、好莱坞的温水煮青蛙

"我们和世界上最大最好的工作室合作。"

Cristobal没透露名单,但他说得明确:好莱坞各大工作室都在用Runway。

为什么不宣传?因为这是"温水煮青蛙"式的渗透——

前期:概念设计、故事板,2分钟可视化导演脑海里的场景
中期:虚拟制片、场景预览
后期:特效补全、调色、老片修复

"我们在好莱坞有非常好的采用率,但这些工作室不会对外说。"

一旦开始用,就很难停下来。

就像当年非线性剪辑软件取代剪辑台——一开始老派剪辑师说"这不是真正的剪辑",10年后,没人再用剪辑台。

AI现在正处于那个临界点。


五、长期主义:为什么70%是研究人员

120人的公司,大部分是研究工程师——这在创业公司里非常罕见。

通常创业公司优先招销售、产品、运营,快速增长,快速变现。

但Runway反其道而行。

Cristobal的逻辑:> "我们不追逐短期风口,我们押注长期趋势。"

具体做法

  1. 研究驱动:Gen-3 Alpha能生成4K影院级画质、多镜头、时间连贯性——都需要深度研究积累

  2. 每12个月融一轮:稳定节奏让团队专注长期研究,而非刷短期数据

  3. 纽约+伦敦双实验室:要的是"研究氛围",不是"创业氛围"

这让Runway在OpenAI、Google等巨头夹击下,保持了差异化——

他们不是做"更好的Sora",而是做"不同的东西"。


六、像素流时代

Cristobal对未来的预测听起来像科幻,但他坚信会很快到来:

"未来,你可能实时生成屏幕上的每一个像素。"

想象一下:

你打开一个"电影",但它不是提前拍好的。它是AI根据你的选择、视角、互动,实时生成的

每个人看到的都不一样,因为每个人的选择不一样。

这不是电影,也不是游戏。这是新的媒介。

"这是人们最低估、最忽视的事情。"

技术上可行吗?比大多数人想象的更快。

因为世界模型的本质就是"模拟",当计算能力足够强,你就可以实时生成3D世界、实时响应输入、实时渲染光影。

那时候:

  • 电影不再需要"拍摄"

  • 游戏不再需要"建模"

  • 所有视觉内容,都是AI实时生成的


七、摄影用了20年找到名字

采访结束时,Cristobal说了句让我印象深刻的话:

"摄影花了大约20年的实验,才有了'摄影'这个名字。"

1826年,第一张照片诞生。但直到1839年,"摄影术"(Photography)才被正式命名。

中间13年,没人知道该怎么称呼这个东西。

Cristobal认为,AI现在也是这样:

"我们还不确定该怎么称呼它,因为我们正在经历这件事。"

有人叫它"AI视频生成",有人叫它"世界模拟器"。都不够准确。

因为它是新的媒介,而新媒介需要时间定义自己。

但有一点确定——它不是电影,也不是游戏。

而Runway,正在创造它。


写在最后

我反复想起Cristobal的话:

"人们最低估的,是AI不会只是'更好的工具',而是会创造出全新的体验——那种感觉都不像电影的体验。"

我们总用旧框架理解新技术。

就像1895年《火车进站》放映时,观众吓得逃跑——因为不知道"电影"会变成什么。

今天,我们也不知道"AI生成的世界"会变成什么。

但有一件事确定——

那些现在开始用AI创作的人,正在定义未来的语法。

就像1900年代那些拿起摄影机的先驱,最终定义了"电影"这个词的含义。

Cristobal和Runway,正在做同样的事。

只不过这次,他们不是在拍摄现实,而是在模拟世界。