Fivetran CEO:AI Agent时代,为何所有数据都需要集中?
AI Business

Fivetran CEO:AI Agent时代,为何所有数据都需要集中?

2026年6月2日YouTube
返回首页

金句精选

There is a new reason to have all your data in one place which is if you want to use AI agents in business, AI agents need context.

The thing about data in the context of business is it is always born somewhere else, it's always born in systems of record like Salesforce, like Workday, like SAP.

Agents don't need as many individual identities. When you have AI agents accessing systems, you really just need roles.

Open APIs are a good thing. If these companies did not have open APIs, they would have been consigned to the dust bin of legacy SAS decades ago.

当SaaS巨头开始恐慌封锁API:你的AI智能体,为什么必须拥有“全局记忆”?

就在前几周,老牌软件巨头SAP突然发布了一项令人咋舌的新政策:全面封禁未经特定批准的AI智能体(AI Agents)访问其数据。

这不仅是SAP一家的动作。随着AI原生的浪潮席卷而来,关于“SaaS末日(SaaS Apocalypse)”的恐慌正在硅谷蔓延。传统SaaS巨头们开始感到恐惧:如果AI智能体可以直接通过API调取数据、完成工作,那谁还会来为那些昂贵的软件UI界面和人头账号(Seats)买单?

但反直觉的是,封锁数据不仅救不了SaaS,反而会直接杀死你公司里的AI。

如果你觉得你们公司花大价钱接入的AI智能体像个“白痴”,只会说些车轱辘话,那是因为你没有给它最致命的武器——全局业务上下文(Context)

今天,我们借着a16z对数据集成独角兽Fivetran CEO George Fraser的深度访谈,来为你拆解:为什么AI智能体必须拥有全局数据?SaaS巨头的数据封锁战将如何收场?以及,作为企业管理者或开发者,你该如何为AI构建真正的“数据底座”。


一、 失去上下文的AI,就像断网的ChatGPT

试想一下,你现在还在使用2022年底那个“未联网版”的ChatGPT。

当你问它昨天发生的新闻,它会抱歉地告诉你:“我的知识库只更新到6个月前。”

这恰恰就是今天大多数企业在使用AI智能体时的真实写照。

你的业务数据天生就散落在世界各地:客户信息在Salesforce里,人力数据在Workday里,财务数据在SAP里,还有无数的自建数据库。如果你只是买了一个大模型API,却没有把这些散落的系统数据统一喂给它,那么这个AI就永远是一个“局外人”。

AI智能体需要上下文(Context)。

在过去十几年里,企业把所有数据汇聚到一个地方(比如数据湖或数据仓库),主要是为了做商业智能(BI)——看看大屏,算算这季度的营收预测。

但现在,把数据放在一起有了一个全新且更具颠覆性的理由:让AI智能体真正懂你的业务。

Fivetran这家公司在做的,就是帮企业把Salesforce、NetSuite等各种SaaS工具和底层数据库里的数据,实时同步到一个集中的数据平台。事实证明,这套原本为BI报表打造的数据基础架构,稍微做些改造,就是AI智能体最完美的“全局记忆中枢”。


二、 SaaS巨头的“护城河焦虑”与数据绑架

当AI智能体开始展现出替代人类执行复杂工作流的潜力时,华尔街先慌了,接着是SaaS巨头。

他们的逻辑很简单:过去我卖软件,是按“人头(Seats)”收费的。你们公司有100个产品经理,我就卖100个账号。现在你们弄了一个“产品经理Bot”,它只需要一个底层角色权限,就能没日没夜地干100个人的活儿。我的收入岂不是要暴跌?

于是,一种极度短视的防御策略出现了——建立围墙花园,把数据锁死。

他们试图告诉你:“你的数据现在是我的了。如果你想用AI分析这些数据,抱歉,你只能用我自家平台里集成的AI工具。”

这简直荒谬至极。

首先,没有任何一家SaaS厂商,能提供解决客户所有数据问题的工具。 你的业务逻辑是跨系统的,销售数据必须和财务数据、供应链数据结合在一起才有价值。把数据锁在单一的SaaS孤岛里,AI根本无法进行跨系统的深度思考。

其次,企业买软件的钱,在整体预算里根本不值一提。 一家典型的重度使用软件的公司,其软件支出大约只占总人力成本的5%到10%。企业引入AI,是为了让整个公司运转得更高效、赚更多的钱,而不是为了抠那点买Slack账号的预算,把5%的软件支出降到4.5%。

应对策略:给CIO们的避坑指南

如果你是企业的CIO或IT负责人,在接下来的3到6个月里,你必须强硬起来:

  1. 坚持数据主权: 必须确保你拥有所有企业数据的一份完整拷贝,并存放在你自己控制的数据湖中。绝不能在这一点上向任何供应商妥协。
  2. 拿起合同武器: 很多时候SaaS厂商敢拦截你,是因为你没反抗。在签订或续签大型MSA(主服务协议)时,务必把“保证无障碍获取自身数据”的条款写进去。
  3. 查阅“避雷指南”: Fivetran推出了一个名为 opendatainfrastructure.com 的开源数据基础设施基准测试网站。他们给各个SaaS厂商的数据开放度打分。如果一家厂商试图收取高昂的数据导出费(Egress charges),或者在条款里限制你访问自己的数据,它就会被标红。在采购前,先去查查你的供应商是红是绿。

三、 打破反直觉的谎言:“数据引力”根本不存在

在构建AI数据底座时,你可能经常听到一个高大上的词:数据引力(Data Gravity)

这个理论忽悠了很多人。它声称:因为企业的数据量太大了,把数据从云端移出来的“出口费用(Egress charges)”极其昂贵。因此,数据是有“引力”的,你的应用和AI计算必须被迫部署在数据所在的特定云区域里。

George Fraser在访谈中抛出了一个极其反共识的观点:数据引力完全是伪命题。

为什么大家会觉得数据大、移动贵?是因为过去很多工程师写了**“愚蠢的数据管道(Dumb Data Pipelines)”**。 他们每天半夜12点,把整个公司的全量数据集从数据库里生硬地复制一遍。这种疯狂的“读放大”,当然会让你觉得数据量大得惊人、网费贵得离谱。

但如果你采用现代的**CDC(变更数据捕获,Change Data Capture)**技术,一切就变了。 你只需要同步每天发生变化的那一小撮数据。Fivetran为几千家大型企业同步着海量数据,但如果你去看看AWS或GCP的网络仪表盘,你会震惊地发现:任何特定时刻,真正在移动的数据量其实小得可怜。

所以,别再被“数据引力”吓倒了。你完全有能力,也有财力,把所有数据轻盈地汇聚到你自己的AI大脑中。


四、 AI智能体的终极形态:是软件,还是“新员工”?

当数据准备就绪,AI智能体究竟会以什么姿态接入你的公司?

目前,行业里正在发生一场关于“智能体交互方式”的有趣辩论。

流派一:拟人化的“新员工”模式(UI流)

很多人开始把AI当成真人来对待。比如,有人专门买了一台Mac Mini,给AI分配了专属的WhatsApp号码、独立的邮箱,甚至让它运行完整的Safari浏览器。

为什么这么做?因为很多系统(比如LinkedIn或Zillow)有极强的反爬虫机制,或者像iMessage一样根本不开放API。为了绕过这些限制,最简单的办法就是给AI一个完整的图形界面(UI),让它像人类一样去“点击”和“阅读”。

甚至在未来,你的HR部门可能不仅要招聘人类,还要负责给新上岗的AI办理“入职”——拉它进Slack群,给它开通各类文档权限。在这个世界里,AI不是软件,它们是消耗软件资源的“新员工”。

流派二:纯粹的代码极客模式(API/CLI流)

但George Fraser坚持认为,API和命令行(CLI)才是AI智能体的最终归宿。

他分享了自己用 NanoClaw(一个开源的个人AI智能体框架)管理网球队的硬核案例。这个AI有自己的身份,能自动给队员发邮件,还能用 Selenium(Python浏览器自动化工具)登录网协官网查赛程、排首发。关键是,他并没有让AI去傻乎乎地读取消耗大量Token的网页HTML,而是写了专门的技能脚本,精准提取数据。

在Fivetran内部,他们也开发了一个处理客服工单的AI智能体。它不需要花哨的浏览器,而是直接通过调用 Salesforce CLI(命令行工具)来检查日志、审查代码、起草回复。事实证明,只要系统的API和CLI足够完善,AI完全不需要去“看”界面,直接通过代码交互的速度更快、成本更低。

连接一切的桥梁:MCP(模型上下文协议)

无论走哪种流派,当AI需要调用成百上千个企业内部工具时,如何解决权限认证和工具发现?

这里必须提到近期爆火的 MCP(Model Context Protocol)。 虽然从第一性原理来看,未来的超级大模型或许聪明到可以自己手搓工具代码,但在当下的工程实践中,MCP不可或缺。它就像是AI智能体与企业数据源之间的“万能插座”,完美解决了身份验证(Authentication)、授权(Authorization)和工具可发现性(Discoverability)的问题。当你真正坐下来写一个需要读取业务上下文的AI系统时,你几乎必然会用到MCP。


五、 结语:别让你的AI成为一座孤岛

历史总是惊人的相似。90年代,当开放API刚刚兴起时,老一代软件厂商也曾发出过同样的哀嚎:“开放API会让我们被边缘化!”

但结果呢?那些拥抱开放的SaaS公司成就了过去十年的繁荣,而封闭者早已被扫进历史的垃圾堆。今天,面对AI智能体的冲击,SaaS巨头们的封锁注定只是一场短暂的“回光返照”。

作为企业,你现在最紧迫的任务,不是纠结于AI能帮你省掉几个软件账号的钱,而是立刻行动起来,把散落在各个SaaS围墙里的数据抢救出来,建立你自己的数据底座。

请记住: 真正的护城河从来不是封闭的数据高墙,而是全量业务上下文喂养出来的、与你企业共生共长的AI智能体。

当你的竞争对手还在让AI写着不痛不痒的营销文案时,你的AI已经能够调取十年的销售数据、实时的库存状态和最新的客户工单,像一个拥有超级记忆的顶尖高管一样,为你做出下一个决定生死的商业决策。

这,才是不可阻挡的未来。