Whisperflow创始人揭秘:从“读心术”硬件到AI语音,帮你彻底告别打字
AI Products

Whisperflow创始人揭秘:从“读心术”硬件到AI语音,帮你彻底告别打字

T
T, Peter
2025年11月23日YouTube
返回首页

金句精选

我们不向其他软件公司寻求灵感,因为大多数公司不擅长培养用户习惯。我关注的是游戏。

我们团队的核心指标不是ARR(年度经常性收入)或用户数,而是我们为用户培养语音习惯这件事做得有多好。

我们曾打造了一个可穿戴设备,能将你的想法直接转换成文字,你甚至都不需要开口说话。

除了Whisper,没有公司建立过一个真正的‘听写模型’——它能从你所说的话,转换成你希望写下的内容,而不是逐字记录。

烧掉3年、裁掉35名博士,他只为砍掉一个能“读心”的AI硬件

📝 创作说明

  • 选题方向: The Painful Pivot: From Mind-Reading Hardware to AI Software
  • 评分: AI相关性 40/50 + 故事性 49/50 + 加分项 16/20 = 总分 105/120
  • 字数: 2045/2500字
  • 核心价值: 通过一个真实的创业故事,揭示在AI时代,解决用户“当下的习惯”远比追求“未来的科技”更重要。

正文内容

想象一下这个场景:你花了整整3年,组建了一个由40名博士组成的顶尖团队,投入无数资源,终于做出了一款能将你的“想法”直接转换成文字的AI硬件。这简直就是科幻电影里的黑科技。

但就在产品初具雏形,甚至能识别你脑中默念的单词时,作为CEO的你,却亲手砍掉了这个项目。

你解雇了几乎所有人,从40人的豪华团队缩减到5人,然后把全部精力投入到一个无心插柳的桌面软件上。

这听起来是不是疯了?

这正是Wispr Flow创始人兼CEO Tanay Kothari在2024年真实经历的故事。他放弃了一个看似能改变世界的“读心”设备,而这个疯狂的决定背后,隐藏着一个关于AI产品成功的反直觉真相。


故事的主角叫Tanay Kothari,一个对人机交互极度着迷的创业者。

他从小就觉得我们跟电脑、手机的互动方式太“笨拙”了。每天敲击键盘5个小时,像个机械人一样重复着输入、删除、修改。他觉得这不应该是科技该有的样子,科技应该像和密友聊天一样,轻松、自然、毫不费力。

所以,他的创业使命从一开始就不是为了做个小工具,而是要彻底颠覆人与机器的沟通方式。2021年,当GPT-3刚刚崭露头角时,他和联合创始人Sahed就看到了一个巨大的机会:未来,人们一定会通过“说话”来操控机器。

这个愿景,驱动着他们开始了那场长达3年的、梦幻般的豪赌。


他们的赌注是解决一个终极问题:当语音成为主流交互方式后,在公共场合怎么办?你总不能在办公室大声使唤AI,也不想打扰身边的人。

答案只有一个:无声语音(Silent Speech)

于是,他们投入了全部心血,打造一款看起来像蓝牙耳机的可穿戴设备。它能捕捉你说话时产生的神经信号,在你一个字都没说出口的情况下,把你的想法直接变成文字。这个项目集结了机器学习、信号处理、神经科学等领域的40位博士,堪称一个小型“科技联合国”。

到了2024年5月,奇迹发生了。

他们成功了。原型机真的能工作,可以准确识别出用户在脑中思考的10个单词。然而,巨大的喜悦之后,一个致命的冲突浮出水面:当他们把这个革命性的硬件连接到当时的ChatGPT、Siri和Alexa时,“it all sucked(体验烂透了)”。

硬件捕捉到的思维碎片,AI根本无法理解。它们只能僵硬地逐字转录,结果就是一堆毫无逻辑的垃圾。他们拥有了一辆未来的法拉利,却发现全世界的公路都还是泥巴路。他们解决了2030年的科幻问题,却被2024年的现实狠狠扇了一巴掌。


为了让硬件能用,团队只好自己动手,开发一个能理解人类杂乱思维的软件系统,他们称之为“Flow OS”。它的核心功能,就是把那些“嗯…啊…那个…我想说的是…”这种意识流的语言,自动整理成结构清晰、可以直接发送的文本。

这个Flow OS,本来只是硬件的“辅助轮”。

为了方便发给朋友测试,Tanay顺手把它打包成了一个简单的桌面应用。

然后,转折点出现了。

“那两个朋友变成了五个,然后是一百个,再然后是一千个。”

这个无心插柳的桌面软件,像病毒一样传播开来。用户反馈极其热烈,因为这个软件精准地解决了他们当下最痛苦的问题:市面上所有的语音输入工具都太蠢了,而这个东西,居然能“听懂”人话。

2024年8月,Tanay Kothari迎来了创业生涯中最艰难的抉择:一边是投入了3年心血、代表着未来的“读心”硬件;另一边,是意外爆火、解决了当下痛点的桌面软件。

他选择了后者。一个痛苦但无比清晰的决定:砍掉硬件,裁掉几乎整个团队,公司从40人锐减到5人,all in做软件。

这个软件,就是今天的Wispr Flow。


从“读心”到“懂你”:杀死未来,赢得现在的四步法则

这次代价高昂的转型,为所有AI时代的创业者提供了一份血淋淋的路线图。Tanay的核心顿悟是:“在人们需要语音硬件之前,他们首先需要养成使用语音的习惯。” 而要养成习惯,你必须先解决眼下最痛的问题。

第一步:识别真正的瓶颈——AI的“最后一公里”

Tanay团队最初认为瓶颈是“如何无声输入”,但用户的真正瓶颈是“语音输入后的编辑和整理工作太烦人”。

现有的语音工具,包括Siri和各类输入法,都停留在“转录”(Transcription)阶段,它们的目标是100%准确地记下你说的每个字,包括口头禅、重复和犹豫。但这根本不是用户想要的。用户想要的是“听写”(Dictation),即AI能理解你的意图,直接输出你想要写的内容。

Wispr Flow的AI模型,攻克的就是这“最后一公里”。

它不是简单调用OpenAI的API,而是构建了一个“上下文引擎”(Contextual Engine)。当你口述一封邮件时,它知道自动分点、加上冒号;当你在代码编辑器里提到media manager.ts这个文件名时,它能准确识别并打上标签;当你提到三个都叫“Brian”的朋友时,它能通过上下文判断你指的是哪一个。

这个引擎,才是解决用户当下痛苦的核心。

第二步:用最小可行产品(MVP),验证最小习惯单元

那个意外走红的桌面App,成了一次完美的MVP测试。它没有花哨的功能,只验证了一个核心假设:如果语音输入能做到智能、可靠、免编辑,用户会愿意每天使用它吗?

从2个朋友到1000个早期用户的爆炸式增长,给了他们最响亮的肯定答案。

这证明,市场对一个“更好的软件解决方案”的需求是巨大且迫切的。相比之下,那个“读心”硬件虽然酷炫,但它试图培养的是一个全新的、不存在的用户习惯,难度呈指数级增加。

先用软件MVP验证核心习惯,再考虑用硬件去拓展习惯的边界,这才是更务实的路径。

第三步:忍痛割爱,聚焦单一价值点

从40人裁到5人,这听起来像是一场灾难。但对Tanay来说,这是一次“向死而生”的战略聚焦。

他砍掉的不仅仅是35名员工,更是神经科学、机械工程、硬件设计等所有与核心价值无关的业务线。剩下的5个人,可以100%专注于一件事:打造地球上最好的AI语音听写软件。

这种极度的专注,带来了惊人的效率。这支精悍的小团队,做出的产品留存率据称是“所有AI产品中最高的之一”。因为他们把全部资源都用在了打磨那些“让用户感觉被懂得”的细节上。

这给我们的启示是:在AI时代,与其做一个功能全面的平庸产品,不如做一个在单一价值点上做到极致的“魔法”产品。

第四步:用AI重构体验——让用户感觉“你懂我”

Wispr Flow的成功,本质上是用AI重新定义了“语音输入”这个旧品类。它不仅仅是工具,更像一个能理解你的助理。

Tanay透露,他们的AI模型会持续学习每个用户独特的语言风格和写作习惯。你写邮件和发Slack的语气是不同的,Wispr Flow会逐渐适应这些差异,让输出越来越贴合你的个人风格。

这种个性化的AI体验,最终达到的效果就是让用户产生一种强烈的感觉:“这个产品懂我(This product just gets me)。”

当用户产生这种情感连接时,“使用语音”就不再是一项任务,而是一种自然的习惯。这正是Tanay梦寐以求的,也是他当初放弃硬件时所押注的未来。


理论升华:你的AI,在帮用户完成什么“任务”?

Tanay的故事,完美印证了哈佛商学院克莱顿·克里斯坦森提出的“Jobs to be Done”(JTBD)理论。这个理论的核心是,用户购买产品,不是为了产品本身,而是为了“雇佣”它来完成某项特定“任务”。

最初的“读心”硬件,试图完成的“任务”是“在公共场合私密地与AI交互”。然而,在2024年,这个任务对大多数人来说,并非高频刚需。

而Wispr Flow这个软件,“被雇佣”来完成的任务是:“帮我快速、准确地把脑子里的想法变成结构化的文字,让我摆脱繁琐的打字和编辑。”

这是一个每天发生无数次、让无数人感到痛苦的高频核心任务。Wispr Flow用AI把这个任务的体验做到了极致,所以它成功了。它没有创造新任务,而是用10倍好的方案,解决了旧任务。


局限性提醒

当然,Tanay这种“杀死未来”的极端决策并非万能解药。它有两个前提:

  1. 清晰的市场信号:他之所以敢砍掉硬件,是因为软件MVP的增长数据给了他强大的信心。如果没有这个“B计划”的意外爆火,贸然放弃主航道是极其危险的。
  2. 技术成熟度的窗口期:Wispr Flow的成功,离不开近年来大语言模型(LLM)能力的飞跃。如果是在2021年,单靠软件可能也无法提供足够好的体验,这个转型同样可能失败。

这个故事并非劝你放弃长远梦想,而是提醒你,通往梦想的路径,往往始于解决脚下最坚实、最痛苦的那个问题。


金句收尾

Tanay Kothari花了三年时间,试图用一个“读心”设备去创造未来,最终却发现,最大的机会恰恰在于用AI修复当下。

有时候,最颠覆的科技,不是那个能读懂你心思的,而是那个终于能听懂你说话的。


📊 内容数据看板

核心数据

  • 3年: 投入“读心”硬件的研发时间
  • 40人: 巅峰时期博士与工程师团队规模
  • 5人: 转型后公司核心团队规模
  • 2024年8月: 做出艰难转型决定的时间点
  • 5小时/天: 普通员工每天花在打字上的平均时间
  • 1000+: 桌面软件MVP在短时间内吸引的早期用户数

AI工具应用

  • Wispr Flow: 主角产品,核心是其自研的“上下文引擎”(Contextual Engine)和“Flow OS”AI模型。
  • ChatGPT / Siri / Alexa: 作为反面案例,它们的“转录”模型无法满足智能“听写”的需求,暴露了AI应用的“最后一公里”问题。

关键金句

  • “在人们需要语音硬件之前,他们首先需要养成使用语音的习惯。” (Before people need a hardware for voice, they need to build the habit of voice.)
  • “我们当时领先于时代。” (We were ahead of the time.)
  • “魔法来自于对细节疯狂的关注。” (The magic comes from an insane attention to detail.)
  • “这个产品懂我。” (This product just gets me.)

可延伸话题

  • Jobs to be Done理论在AI产品设计中的具体应用。
  • AI创业中,选择“解决当下痛点”与“布局未来科技”的战略权衡。
  • 如何通过AI技术,将一个传统工具(如语音输入)进行品类再创造。