当SaaS巨头开始恐慌封锁API:你的AI智能体,为什么必须拥有“全局记忆”?
就在前几周,老牌软件巨头SAP突然发布了一项令人咋舌的新政策:全面封禁未经特定批准的AI智能体(AI Agents)访问其数据。
这不仅是SAP一家的动作。随着AI原生的浪潮席卷而来,关于“SaaS末日(SaaS Apocalypse)”的恐慌正在硅谷蔓延。传统SaaS巨头们开始感到恐惧:如果AI智能体可以直接通过API调取数据、完成工作,那谁还会来为那些昂贵的软件UI界面和人头账号(Seats)买单?
但反直觉的是,封锁数据不仅救不了SaaS,反而会直接杀死你公司里的AI。
如果你觉得你们公司花大价钱接入的AI智能体像个“白痴”,只会说些车轱辘话,那是因为你没有给它最致命的武器——全局业务上下文(Context)。
今天,我们借着a16z对数据集成独角兽Fivetran CEO George Fraser的深度访谈,来为你拆解:为什么AI智能体必须拥有全局数据?SaaS巨头的数据封锁战将如何收场?以及,作为企业管理者或开发者,你该如何为AI构建真正的“数据底座”。
一、 失去上下文的AI,就像断网的ChatGPT
试想一下,你现在还在使用2022年底那个“未联网版”的ChatGPT。
当你问它昨天发生的新闻,它会抱歉地告诉你:“我的知识库只更新到6个月前。”
这恰恰就是今天大多数企业在使用AI智能体时的真实写照。
你的业务数据天生就散落在世界各地:客户信息在Salesforce里,人力数据在Workday里,财务数据在SAP里,还有无数的自建数据库。如果你只是买了一个大模型API,却没有把这些散落的系统数据统一喂给它,那么这个AI就永远是一个“局外人”。
AI智能体需要上下文(Context)。
在过去十几年里,企业把所有数据汇聚到一个地方(比如数据湖或数据仓库),主要是为了做商业智能(BI)——看看大屏,算算这季度的营收预测。
但现在,把数据放在一起有了一个全新且更具颠覆性的理由:让AI智能体真正懂你的业务。
Fivetran这家公司在做的,就是帮企业把Salesforce、NetSuite等各种SaaS工具和底层数据库里的数据,实时同步到一个集中的数据平台。事实证明,这套原本为BI报表打造的数据基础架构,稍微做些改造,就是AI智能体最完美的“全局记忆中枢”。
二、 SaaS巨头的“护城河焦虑”与数据绑架
当AI智能体开始展现出替代人类执行复杂工作流的潜力时,华尔街先慌了,接着是SaaS巨头。
他们的逻辑很简单:过去我卖软件,是按“人头(Seats)”收费的。你们公司有100个产品经理,我就卖100个账号。现在你们弄了一个“产品经理Bot”,它只需要一个底层角色权限,就能没日没夜地干100个人的活儿。我的收入岂不是要暴跌?
于是,一种极度短视的防御策略出现了——建立围墙花园,把数据锁死。
他们试图告诉你:“你的数据现在是我的了。如果你想用AI分析这些数据,抱歉,你只能用我自家平台里集成的AI工具。”
这简直荒谬至极。
首先,没有任何一家SaaS厂商,能提供解决客户所有数据问题的工具。 你的业务逻辑是跨系统的,销售数据必须和财务数据、供应链数据结合在一起才有价值。把数据锁在单一的SaaS孤岛里,AI根本无法进行跨系统的深度思考。
其次,企业买软件的钱,在整体预算里根本不值一提。 一家典型的重度使用软件的公司,其软件支出大约只占总人力成本的5%到10%。企业引入AI,是为了让整个公司运转得更高效、赚更多的钱,而不是为了抠那点买Slack账号的预算,把5%的软件支出降到4.5%。
应对策略:给CIO们的避坑指南
如果你是企业的CIO或IT负责人,在接下来的3到6个月里,你必须强硬起来:
- 坚持数据主权: 必须确保你拥有所有企业数据的一份完整拷贝,并存放在你自己控制的数据湖中。绝不能在这一点上向任何供应商妥协。
- 拿起合同武器: 很多时候SaaS厂商敢拦截你,是因为你没反抗。在签订或续签大型MSA(主服务协议)时,务必把“保证无障碍获取自身数据”的条款写进去。
- 查阅“避雷指南”: Fivetran推出了一个名为 opendatainfrastructure.com 的开源数据基础设施基准测试网站。他们给各个SaaS厂商的数据开放度打分。如果一家厂商试图收取高昂的数据导出费(Egress charges),或者在条款里限制你访问自己的数据,它就会被标红。在采购前,先去查查你的供应商是红是绿。
三、 打破反直觉的谎言:“数据引力”根本不存在
在构建AI数据底座时,你可能经常听到一个高大上的词:数据引力(Data Gravity)。
这个理论忽悠了很多人。它声称:因为企业的数据量太大了,把数据从云端移出来的“出口费用(Egress charges)”极其昂贵。因此,数据是有“引力”的,你的应用和AI计算必须被迫部署在数据所在的特定云区域里。
George Fraser在访谈中抛出了一个极其反共识的观点:数据引力完全是伪命题。
为什么大家会觉得数据大、移动贵?是因为过去很多工程师写了**“愚蠢的数据管道(Dumb Data Pipelines)”**。 他们每天半夜12点,把整个公司的全量数据集从数据库里生硬地复制一遍。这种疯狂的“读放大”,当然会让你觉得数据量大得惊人、网费贵得离谱。
但如果你采用现代的**CDC(变更数据捕获,Change Data Capture)**技术,一切就变了。 你只需要同步每天发生变化的那一小撮数据。Fivetran为几千家大型企业同步着海量数据,但如果你去看看AWS或GCP的网络仪表盘,你会震惊地发现:任何特定时刻,真正在移动的数据量其实小得可怜。
所以,别再被“数据引力”吓倒了。你完全有能力,也有财力,把所有数据轻盈地汇聚到你自己的AI大脑中。
四、 AI智能体的终极形态:是软件,还是“新员工”?
当数据准备就绪,AI智能体究竟会以什么姿态接入你的公司?
目前,行业里正在发生一场关于“智能体交互方式”的有趣辩论。
流派一:拟人化的“新员工”模式(UI流)
很多人开始把AI当成真人来对待。比如,有人专门买了一台Mac Mini,给AI分配了专属的WhatsApp号码、独立的邮箱,甚至让它运行完整的Safari浏览器。
为什么这么做?因为很多系统(比如LinkedIn或Zillow)有极强的反爬虫机制,或者像iMessage一样根本不开放API。为了绕过这些限制,最简单的办法就是给AI一个完整的图形界面(UI),让它像人类一样去“点击”和“阅读”。
甚至在未来,你的HR部门可能不仅要招聘人类,还要负责给新上岗的AI办理“入职”——拉它进Slack群,给它开通各类文档权限。在这个世界里,AI不是软件,它们是消耗软件资源的“新员工”。
流派二:纯粹的代码极客模式(API/CLI流)
但George Fraser坚持认为,API和命令行(CLI)才是AI智能体的最终归宿。
他分享了自己用 NanoClaw(一个开源的个人AI智能体框架)管理网球队的硬核案例。这个AI有自己的身份,能自动给队员发邮件,还能用 Selenium(Python浏览器自动化工具)登录网协官网查赛程、排首发。关键是,他并没有让AI去傻乎乎地读取消耗大量Token的网页HTML,而是写了专门的技能脚本,精准提取数据。
在Fivetran内部,他们也开发了一个处理客服工单的AI智能体。它不需要花哨的浏览器,而是直接通过调用 Salesforce CLI(命令行工具)来检查日志、审查代码、起草回复。事实证明,只要系统的API和CLI足够完善,AI完全不需要去“看”界面,直接通过代码交互的速度更快、成本更低。
连接一切的桥梁:MCP(模型上下文协议)
无论走哪种流派,当AI需要调用成百上千个企业内部工具时,如何解决权限认证和工具发现?
这里必须提到近期爆火的 MCP(Model Context Protocol)。 虽然从第一性原理来看,未来的超级大模型或许聪明到可以自己手搓工具代码,但在当下的工程实践中,MCP不可或缺。它就像是AI智能体与企业数据源之间的“万能插座”,完美解决了身份验证(Authentication)、授权(Authorization)和工具可发现性(Discoverability)的问题。当你真正坐下来写一个需要读取业务上下文的AI系统时,你几乎必然会用到MCP。
五、 结语:别让你的AI成为一座孤岛
历史总是惊人的相似。90年代,当开放API刚刚兴起时,老一代软件厂商也曾发出过同样的哀嚎:“开放API会让我们被边缘化!”
但结果呢?那些拥抱开放的SaaS公司成就了过去十年的繁荣,而封闭者早已被扫进历史的垃圾堆。今天,面对AI智能体的冲击,SaaS巨头们的封锁注定只是一场短暂的“回光返照”。
作为企业,你现在最紧迫的任务,不是纠结于AI能帮你省掉几个软件账号的钱,而是立刻行动起来,把散落在各个SaaS围墙里的数据抢救出来,建立你自己的数据底座。
请记住: 真正的护城河从来不是封闭的数据高墙,而是全量业务上下文喂养出来的、与你企业共生共长的AI智能体。
当你的竞争对手还在让AI写着不痛不痒的营销文案时,你的AI已经能够调取十年的销售数据、实时的库存状态和最新的客户工单,像一个拥有超级记忆的顶尖高管一样,为你做出下一个决定生死的商业决策。
这,才是不可阻挡的未来。
