AI不是在拍电影,而是在模拟世界
一个艺术家出身的CEO,用7年告诉好莱坞:你们理解错了
"未来你可能实时生成屏幕上的每一个像素——任何世界、任何场景、完全互动。这不是电影,是完全不同的东西。而且会比大多数人想象的更早到来。"
当Runway CEO Cristobal Valenzuela说这话时,语气平静,但每个字都像在描述一场正在发生的革命。
这不是科幻。这是一家估值30亿美元、融资5亿美元的AI公司正在做的事。
更重要的是——他们已经说服了好莱坞最大的工作室相信这件事。
一、10年前的兔子洞
2015年左右,Cristobal还是NYU艺术+技术双学位的学生。他读到几篇深度学习论文,然后——用他的话说——"掉进了兔子洞"。
"我痴迷于这个想法:你可以用AI算法不仅创造语言,还能创造像素、视频和图像。"
3年后的2018年,他创立了"Runway ML"。
那时候跟投资人说"用机器学习做创意工具",大部分人会礼貌拒绝。"如果你在2018年做ML产品,融资的规模和估值完全不同。"
但7年后,Runway已经不需要那个"ML"后缀——
30亿估值,5亿融资,120人团队(大部分是研究工程师),数百万用户,从好莱坞顶级工作室到独立创作者。
但Cristobal最在意的不是这些数字,而是一个更大的问题:AI到底是什么?
二、AI不是工具,是新媒介
如果你问大多数人"AI视频生成是什么",他们会说:"一个更强大的视频编辑工具。"
Cristobal会告诉你:你理解错了。
"我一直认为,我们在Runway做的事情,本质上是在建立一个新的媒介。"
他的类比是:摄影机。
"摄影机创造了整个产业,催生了电影这个全新艺术形式。但关键在于——摄影机借用了绘画的语言和语法,但它们本质上是不同的东西。"
你不能说摄影是"更快的绘画工具"。
同样,AI也不是"更快的视频剪辑工具"。它是完全不同的东西。
Cristobal的核心论断:
"这些视频模型本质上是模拟系统。它们可以模拟世界上的任何东西,以及事物应该如何运作。你可以部署智能体,模拟智能体如何与世界互动。如果把它当作创意工具,它就是一个新媒介——不遵循电影的原则和功能。"
这解释了为什么Runway不只是"AI视频工具",而是在建立一套全新的创作语法。
三、世界模型:不是生成像素,是模拟物理
那么,这个"新媒介"的技术本质是什么?
答案是:世界模型(World Models)。
传统视频生成在"学习像素"——给AI看1000万个视频,它学会"天空是蓝色"、"人走路腿会动"。但它不理解为什么。
世界模型不一样。它试图理解世界的物理规则——光如何照射,阴影如何形成,物体如何坠落,空间如何呈现。
"这些模型是模拟系统。它们模拟世界应该如何运作。"
这意味着AI不再是"生成一段视频",而是"创建一个可互动的世界":
-
改变光照角度,阴影实时重新计算
-
添加新物体,它会遵循物理规则坠落
-
让角色转身,AI保持空间一致性
这不是视频,这是实时模拟。
Cristobal说:"电影是'捕捉现实',AI是'模拟现实'。"
四、好莱坞的温水煮青蛙
"我们和世界上最大最好的工作室合作。"
Cristobal没透露名单,但他说得明确:好莱坞各大工作室都在用Runway。
为什么不宣传?因为这是"温水煮青蛙"式的渗透——
前期:概念设计、故事板,2分钟可视化导演脑海里的场景
中期:虚拟制片、场景预览
后期:特效补全、调色、老片修复
"我们在好莱坞有非常好的采用率,但这些工作室不会对外说。"
一旦开始用,就很难停下来。
就像当年非线性剪辑软件取代剪辑台——一开始老派剪辑师说"这不是真正的剪辑",10年后,没人再用剪辑台。
AI现在正处于那个临界点。
五、长期主义:为什么70%是研究人员
120人的公司,大部分是研究工程师——这在创业公司里非常罕见。
通常创业公司优先招销售、产品、运营,快速增长,快速变现。
但Runway反其道而行。
Cristobal的逻辑:> "我们不追逐短期风口,我们押注长期趋势。"
具体做法:
-
研究驱动:Gen-3 Alpha能生成4K影院级画质、多镜头、时间连贯性——都需要深度研究积累
-
每12个月融一轮:稳定节奏让团队专注长期研究,而非刷短期数据
-
纽约+伦敦双实验室:要的是"研究氛围",不是"创业氛围"
这让Runway在OpenAI、Google等巨头夹击下,保持了差异化——
他们不是做"更好的Sora",而是做"不同的东西"。
六、像素流时代
Cristobal对未来的预测听起来像科幻,但他坚信会很快到来:
"未来,你可能实时生成屏幕上的每一个像素。"
想象一下:
你打开一个"电影",但它不是提前拍好的。它是AI根据你的选择、视角、互动,实时生成的。
每个人看到的都不一样,因为每个人的选择不一样。
这不是电影,也不是游戏。这是新的媒介。
"这是人们最低估、最忽视的事情。"
技术上可行吗?比大多数人想象的更快。
因为世界模型的本质就是"模拟",当计算能力足够强,你就可以实时生成3D世界、实时响应输入、实时渲染光影。
那时候:
-
电影不再需要"拍摄"
-
游戏不再需要"建模"
-
所有视觉内容,都是AI实时生成的
七、摄影用了20年找到名字
采访结束时,Cristobal说了句让我印象深刻的话:
"摄影花了大约20年的实验,才有了'摄影'这个名字。"
1826年,第一张照片诞生。但直到1839年,"摄影术"(Photography)才被正式命名。
中间13年,没人知道该怎么称呼这个东西。
Cristobal认为,AI现在也是这样:
"我们还不确定该怎么称呼它,因为我们正在经历这件事。"
有人叫它"AI视频生成",有人叫它"世界模拟器"。都不够准确。
因为它是新的媒介,而新媒介需要时间定义自己。
但有一点确定——它不是电影,也不是游戏。
而Runway,正在创造它。
写在最后
我反复想起Cristobal的话:
"人们最低估的,是AI不会只是'更好的工具',而是会创造出全新的体验——那种感觉都不像电影的体验。"
我们总用旧框架理解新技术。
就像1895年《火车进站》放映时,观众吓得逃跑——因为不知道"电影"会变成什么。
今天,我们也不知道"AI生成的世界"会变成什么。
但有一件事确定——
那些现在开始用AI创作的人,正在定义未来的语法。
就像1900年代那些拿起摄影机的先驱,最终定义了"电影"这个词的含义。
Cristobal和Runway,正在做同样的事。
只不过这次,他们不是在拍摄现实,而是在模拟世界。