Scale AI 创始人 Alexandr Wang:穿越创业“迷茫期”,在“最不性感”的难题中突围
AI Business

Scale AI 创始人 Alexandr Wang:穿越创业“迷茫期”,在“最不性感”的难题中突围

A
Alexandr Wang
2024年12月14日YouTube
返回首页

金句精选

对于初创公司来说,如果你注定要失败,最好现在就失败。最可怕的事情其实是:你可能已经‘死’了,但你却要在三年后才发现这一点。

面对竞争,唯一的答案就是做得更好。你需要某种非理性的自信,坚信自己能胜出,这种非理性的自信最终会通过你招募的人才和做出的产品决策,在这个过程中逐渐变成现实。

技术难度与经济价值往往呈负相关。许多极具经济价值的问题在技术上并不难,只是非常繁琐、是一堆烂摊子,但这正是大多数好的创业机会所在。

思维循环(Thinking Loop)的首次复现来自中国的 DeepSeek……这意味着在顶尖的美国实验室和中国实验室之间,基本上不存在研究差距了。

19岁辍学打造$140亿帝国:Scale AI创始人揭秘“脏活”里的AI金矿

📝 创作说明

  • 选题方向: Scale AI的“反直觉”护城河与AI时代的生存法则
  • 评分: AI相关性 48/50 + 故事性 45/50 + 加分项 15/20 = 总分 108/120
  • 字数: 2130/2000字
  • 核心价值: 揭示了在AI大模型光鲜亮丽的背后,如何通过解决“最不性感”的数据标注问题构建百亿帝国,并结合Palantir和Facebook的内部心法,为AI创业者提供了一套从“脏活”中挖掘金矿的实战方法论。

正文内容

你以为AI的未来是那些写出惊天代码的算法天才?

大错特错。

就在前不久,Alexandr Wang(Alex),这位世界上最年轻的白手起家亿万富翁,Scale AI的创始人,在South Park Commons的访谈中扔下了一枚重磅炸弹。他直言不讳地指出,DeepSeek R1(一家中国AI实验室的模型)的横空出世,证明了中美在算法研究上已经“没有差距”。

这意味着什么?意味着算法本身不再是唯一的壁垒。

当所有人都盯着ChatGPT、Claude这些“性感”的大模型狂欢时,Alex早在19岁时就看穿了这场游戏的本质:AI的燃料不是代码,而是数据。

但他做的不是什么高大上的数据分析,而是被硅谷精英嗤之以鼻的“脏活”——数据标注。给图片里的停车标志画框,分辨红绿灯,教AI什么是猫什么是狗。

就是靠着这些“没人愿意做”的脏活,Scale AI在短短几年内估值冲破140亿美元(约1000亿人民币),成为了OpenAI、Meta、甚至是美国军方背后不可或缺的“送水人”。

Alex的故事,不是一个天才少年的顺风局,而是一场关于“如何在最拥挤的赛道里找到无人区”的生存实验。


Alexandr Wang的背景,简直就是“别人家的孩子”的天花板。

从小就是数学竞赛的常客,在全美数学竞赛中拿奖拿到手软。19岁那年,他在麻省理工学院(MIT)读大一,GPA满分4.0。按照常规剧本,他应该去Google或者Facebook当一名年薪百万的算法工程师,过上那种穿格子衫、喝手冲咖啡的精英生活。

但他偏不。

大一暑假,他跑去硅谷著名的孵化器Y Combinator(YC)实习。在那里的经历,彻底粉碎了他对“按部就班”的幻想。他看到无数顶着名校光环的创业者,在几个月内就把公司搞垮。

那种环境,被他形容为“饥饿游戏”(The Hunger Games)。

“在YC,90%的公司都会死。最恐怖的不是死,而是你可能已经死了,但要等到三年后才发现尸体凉了。”Alex回忆道。

这种极度的生存焦虑,逼迫他做出了一个让所有人跌破眼镜的决定:从MIT辍学,创办Scale AI。


当时的硅谷,所有人都想做下一个Google,所有人都想写出最牛的神经网络。

Alex却发现了一个巨大的痛点:每个人都想造车(模型),但没人愿意去炼油(数据)。

自动驾驶公司拥有数百万小时的行车视频,但这些数据对AI来说是“盲”的。如果不把视频里的每一辆车、每一个行人都精准地框选出来,AI就永远学不会开车。

这是一个巨大的、枯燥的、劳动密集型的深坑。

当时的解决方案是什么?要么让高薪的工程师自己苦哈哈地标数据,要么外包给质量参差不齐的廉价劳动力。

Alex看到了这里面的巨大冲突:AI需要海量的高质量数据,但获取数据的过程极其低效且昂贵。

这就是他的切入点。如果能把“人类的标注能力”变成一个简单的API接口,就像调用代码一样调用人类的智慧,那会怎样?


于是,Scale AI诞生了。

但这不仅仅是一个“把活儿外包出去”的故事。Alex的转折点在于,他没有用传统的“包工头”思维去做这件事,而是用“数学奥赛”的思维去解构这个“脏活”。

他没有简单地雇人点鼠标,而是构建了一套**人机协同(Human-in-the-loop)**的复杂系统。AI先做预标注,人类进行修正,数据再反哺AI。

这一招,直接把数据标注的效率提升了一个数量级,质量更是吊打同行。

当OpenAI需要通过RLHF(人类反馈强化学习)来训练ChatGPT变得“听话”时,他们发现,只有Scale AI能接得住这种规模和精度的数据需求。

那一刻,Alex赌赢了。他把最不性感的生意,做成了AI时代最硬核的基础设施。


那么,普通人如何复制Alex的这套“反直觉”打法?结合他在访谈中透露的Scale AI、Palantir以及Facebook的内部心法,我为你拆解了这套**“AI脏活金矿”四步法**。

第一步:寻找“API化”的人类智慧缺口

Alex的核心洞察是:未来的人类计算(Human Compute),应该像云计算一样,通过API随意调用。

在你的行业里,有没有那种“必须人来做,但极其重复、极其耗时”的环节?

  • 传统思维:这是个烂活,我要么不做,要么招个实习生做。
  • Scale思维:这是一个未被标准化的API。

实操案例: 假设你是做跨境电商的。你每天需要写500条针对不同国家、不同文化背景的Listing(商品文案)。

  • 错误做法:自己写到吐,或者找外包翻译,质量不可控。
  • AI+做法
    1. 搭建一个工作流(Workflow)。
    2. 用GPT-4先生成500条草稿。
    3. 找几个母语者(人类节点),只负责“审核”和“微调”AI生成的草稿。
    4. 将人类修改后的数据(好标题 vs 坏标题)存下来,微调一个小模型。
    5. 最终,你把“写文案”这个动作,封装成了一个内部API:输入产品图,输出高转化文案。

Alex就是把“标注图片”这件事API化了。你完全可以把“写法律文书”、“做财务报表”、“剪辑短视频”这些事,用同样的逻辑重做一遍。

第二步:利用“Palantir效应”重塑客户认知

Alex在访谈中分享了一个极具冲击力的故事。他曾亲眼目睹Palantir(另一家大数据巨头)的高管是如何搞定政府大单的。

那位高管对客户说:“你们没选Palantir也没关系。虽然你们以后肯定会后悔,虽然如果选了我们,你们的效率会高十倍,生活会美好得多。但没事,等你们撞了南墙,我们还是朋友,随时欢迎回来。”

这种**“非理性的自信”(Irrational Self-Belief)**,是Alex学到的关键一课。

在AI领域,技术往往是抽象的。客户(或者是你的老板)根本看不懂你的模型参数有多少。

Palantir心法

  • 感知即现实(Perception is Reality):在大型企业或政府机构,现实往往太丑陋、太复杂,没人愿意面对。他们更愿意相信一种“被构建的感知”。
  • 行动指南:当你用AI工具解决问题时,不要只展示代码。你要展示“没有这个AI,业务会崩溃成什么样” vs “有了这个AI,世界是多么美好”。你要像Palantir一样,把你的AI产品包装成“上帝赐予的礼物”。
  • 数据支撑:Scale AI在销售时,不会只说“我们标注得快”,而是说“使用我们的数据,你们的模型性能可以提升20%,这相当于节省了数百万美元的算力成本”。

第三步:用“Facebook算法”评估你的工作价值

Alex曾在Facebook实习,他发现那里的晋升逻辑非常有意思,也非常反直觉。

在大多数科技公司,工程师想升职,得做“难”的东西。算法越复杂,架构越精妙,大家越觉得你牛。

但在Facebook,Alex发现:谁能产生最大的经济影响,谁就升得最快。

哪怕你写的代码极其简单,哪怕你只是修复了日志里的几个错误,但如果这个修复能让服务器效率提升10%,那你就是英雄。

Scale AI的选人标准: Alex直言,他们偏爱那些愿意解决“非技术难题”的聪明人。

  • 技术难题:如何把模型的准确率从99.1%提升到99.2%。
  • 经济难题:如何让分布在菲律宾、肯尼亚的50万名标注员,在同一时间理解同一个复杂的标注规则?

后者在技术上可能不难(不需要高深算法),但在**运营(Operations)**上极其复杂。

给你的建议: 在AI时代,别再沉迷于“手搓大模型”的虚荣感了。去问自己:

  • 我的AI应用,到底帮公司省了多少钱?
  • 到底帮用户节省了多少时间?
  • 如果我用最简单的Prompt工程就能解决问题,为什么非要训练一个模型?

记住Alex的话:技术难度和经济价值,往往是不相关的。

第四步:警惕“DeepSeek时刻”,拥抱开源与效率

Alex在访谈末尾特意提到了DeepSeek R1。他认为,中国开源模型的崛起是一个信号:算法的护城河正在消失。

如果DeepSeek能用更少的算力、更低的成本,达到GPT-4级别的效果,那么未来的竞争焦点在哪里?

答案又回到了原点:数据和应用场景。

当算法变得像自来水一样便宜时,决定胜负的,是你手里有没有独特的数据,以及你能不能把这些数据“喂”给模型,解决一个具体的、哪怕是很脏很累的问题。

行动清单

  1. 停止焦虑算法差距:直接使用现成的开源模型(如Llama 3, DeepSeek, Mistral)。
  2. 建立数据闭环:无论你做什么产品,必须设计一个机制,让用户在使用过程中自然地为你产生高质量数据。
  3. 关注推理成本:Alex提到,未来的战争是“推理效率”的战争。谁能用更便宜的芯片、更小的模型解决问题,谁就是赢家。

Alexandr Wang的故事,本质上是一个关于**“降维打击”**的故事。

他拥有搞定最难数学题的智商,却选择了弯下腰,去捡起那些散落在地上的“数据硬币”。

他还提到了Paul Graham(YC创始人)的一个经典理论:“活在未来,然后把缺失的部分造出来。”

Alex看到了未来:一个AI无处不在的世界。 但他同时也看到了缺失的部分:连接人类智慧与硅基智能的桥梁——数据基础设施。

所以,当你在寻找下一个AI风口时,不妨问问自己: 现在有什么事情是AI急需,但所有人都嫌累、嫌脏、嫌麻烦而不愿意去做的?

找到它,用最极致的运营手段去解决它,用最自信的态度去包装它。

哪怕它看起来像是在“标图片”或者“改文案”,只要它能产生巨大的经济价值,它就是下一个$140亿的起点。

正如Alex所说:“在饥饿游戏中,如果你还在犹豫这个想法够不够酷,那你可能已经死了。”