三年了。
从2023年到2026年,张小珺和广密每个季度都会坐下来聊一次大模型的技术进展和趋势走向。这是第九集。
但这一集的气氛和以前都不一样。
「我觉得过去一个季度模型水平进步的幅度,可能超过了2025年全年。」广密说。
他在硅谷,身边都是前沿实验室的研究员和顶级工程师。他们看到的,是一场正在加速的革命——而不是一场进入瓶颈的停滞。
第一个转折:Coding 把AI从第一幕推向了第二幕
广密的核心判断是这样的:
AI 发展有两幕。
第一幕:聊天机器人。你问它问题,它给你答案。全球数亿用户在用,但它本质上是一个更好的搜索引擎。
第二幕:能干活的 Agent。它不只是回答问题,它写代码、跑测试、改 bug、提交 PR,甚至主动发现新的研究突破。
两幕之间的分水岭,是 Coding 能力。
「Claude Opus 4.5 到 4.6 的跨越,」广密说,「我觉得算是一个从 GPT-3 到 GPT-4 水平的,叫跨时代的提升。」
证据来自他身边的研究员们。
去年,一个系统里70%~80%的代码还是人写的。今年,人写的代码占比不到1%。顶尖工程师的日常,变成了「AI写,人审」——而且审的能力很多人都跟不上了。
Claude Code 和 Codex 在很多任务上,已经对标到 Meta L8/L9 级别的首席架构师。一个 feature,两三次迭代就能跑通。
「我们认识的人,每天消耗几百美金的 token,一周几千美金。」广密说,「这个量还是挺夸张的。」
最关键的数字:一个想法从有念头到跑通代码,以前需要两三周,现在需要一两天。
这是研发速度的10-20倍提升。
第二个转折:AI研究的突破,开始由AI自己带来
这是广密认为「更质变的信号」的地方。
传统上,AI 研究突破是人类工程师带来的——他们设计架构,提出假设,跑实验,分析结果。AI 工具是辅助。
但现在,他在硅谷的朋友告诉他:最近很多 AI 研究上的突破,不是人类工程师带来的,而是 Codex、Claude Code 带来的。
比如,做多模态研究的团队:以前从设计到数据迭代,完整跑一个多模态模型需要一两个月。现在,因为 Coding AI 加速了数据处理管道,整个周期缩短到了几天或一周。
更具体的例子:解一道竞赛级数学题,以前可能要半天,Codex 现在可以很快完成。而且不只是解题——它对 debug 的能力,对其他领域研究的加速,都已经开始产生实质影响。
Anthropic 有一个公开数据点:过去50多个工作日,他们发布了70多款产品和功能。在互联网时代,这个速度是不可能的。
「Coding 是 AI 加速 AI 的关键要素,」广密说,「可能仅次于 GPU 本身了。」
关于「谁赢了」的问题:各领风骚100天
过去三年,硅谷一直在反复出现同一场戏。
有时候觉得 OpenAI 无敌,有时候觉得 Google 回来了,有时候觉得 Anthropic 弯道超车了。
广密给出了他的观察:「我感觉每个公司都有自己的窗口,各领风骚100天。今天胜利的秘籍,可能就是下个时代的毒药。」
一个具体的案例:OpenAI 因为 ChatGPT 太成功,开始把注意力集中在 to-C 用户和订阅量上。这让他们在 Coding 方向的投入相对滞后。
而 Anthropic,用一组数字重新定义了竞争。
广密说,Anthropic 的 ARR 已经超过了 OpenAI。但更惊人的是背后的结构:Anthropic 头部的100-200万用户贡献的收入,超过了 OpenAI 5000-6000万订阅用户的总收入。
用户少100倍,但收入更高。
原因只有一个:这批用户每天在用 Claude 写代码、跑 Agent、做高价值任务。他们不是来问「帮我写一首诗」的,他们是来消耗大量 token 完成真实工作的。
「今天我感觉更有意思的是,」广密说,「不再是只追求 DAU 或者广告这个规模,而是追求 token usage 这个指标。尤其是超级开发者或者塔尖的用户,这个感觉更重要。」
关于未来:模型将成为全球GDP的操作系统
这是广密最大胆的判断。
他认为,全球最领先的3-5家模型公司,如果成功成为全球 GDP 的「操作系统」,每家的市值可能达到10万亿美金。加在一起,是30-50万亿美金。
「今天微软、苹果算什么?」他反问,「如果全球 GDP 的 35% 被模型 automate,那这是一个完全不同量级的市场。」
这个判断指向了他的投资策略:更极致、更聚焦。把绝大部分的注意力放在能持续做出好模型的公司上。对他来说,其他都是支线,模型才是主线。
他也谈到了新模型公司的机会。他的判断是:机会存在,但比想象中难非常多。
原因有三:第一,要持续每年投入300-500亿美金,还要投三五年;第二,创始人和管理层要有认知,有认知才有魄力买卡;第三,要能招到上百名世界级 AI 科学家。
「再造一个台积电」——这是他用来形容这件难度的比喻。
关于白领通缩:一句话,但不是废话
这期节目的情绪很复杂,是因为广密和张小珺都清楚地意识到:加速意味着替代。
研究员不再亲自写代码,白领的工作正在被 Agent 接管,这是正在发生的事实。
但广密的态度是清醒的,不是绝望的。
「AI 取代的是不拥抱 AI 的人,积极拥抱 AI 的人可能是受益者。」
他举了一个例子:以前做一个有影响力的媒体,需要几百个人。现在,一个人的自媒体也可以有很大的影响力。这是整个基础设施极大繁荣带来的结果。
个体的创造力,曾经受限于基础设施。当 AI 把这个限制打开,有想法、有审美、有品味的人,会获得比以前大得多的放大器。
最后一个问题:你消耗了100美金的token,能赚回110块吗?
广密提到了他最近听到的一个他认为很重要的指标:
消耗100美金的 token,能不能赚到110美金?
很多人在用 AI,但这个闭环没有跑通。要么产出没有商业价值,要么效率提升没有转化成收入。
他认为,2026年会是这个闭环开始爆发的年份。
「我觉得过去一个季度 AI 已经进入基点时刻了,今天是在加速的,显著加速的。」
这不是一个 PPT 里的预测,而是一个每周亲眼看见事情发生的人,给出的第一人称判断。
金句: 金句1:Coding是新的AI加速器,领先的coding模型就会像领先的GPU。 金句2:各领风骚100天,今天胜利的秘籍可能就是下个时代的毒药。 金句3:Anthropic头部的一两百万用户贡献的收入,超过了OpenAI五六千万订阅用户——用户少100倍,收入更高。 金句4:消耗100美金的token,能不能赚到110块钱?这可能是今年最重要的创业指标。 金句5:AI取代的是不拥抱AI的人,积极拥抱AI的人可能是受益者。