罗永浩对话Insta360刘靖康:从“捣蛋”天才少年到全球全景影像巨头
AI Products

罗永浩对话Insta360刘靖康:从“捣蛋”天才少年到全球全景影像巨头

2025年12月25日小宇宙
返回首页

金句精选

创业是能赚大钱、自己喜欢做的事情、对社会有价值的事情,这三者的交集。

计算机革命使得人类第一次出现了二十多岁的亿万富翁,这件事儿对人类造成的深远影响和贡献可能是被严重低估了。

持续不犯错的确是这个行业的一个隐性门槛,是因为你有一代犯错,就会把你之前积累的信任和口碑全部推倒重来。

如果一个消费电子或者说一个硬件公司的成功,我觉得起码有一半的功劳是跟供应商有关系的。这就是为什么现在全世界做硬件,尤其智能硬件都没法跟中国竞争。

对于互联网公司来讲,普遍会有这么一种恐惧... 就特别想去在终端层面能够占据自己的这个位置。

正文内容

你有没有想过,为什么在GoPro几乎垄断运动相机的时代,一家中国公司能硬生生杀出重围,甚至在2024年上半年营收反超了GoPro?

答案不是更便宜的价格,也不是更硬核的硬件,而是**“软件定义的摄影师”**。

当所有人都在比拼像素、防抖和传感器尺寸时,影石Insta360(下称影石)的创始人刘靖康在思考一个更本质的问题:为什么我们需要自己举着相机?为什么我们需要自己构图?

今天,我们就来拆解这个90后极客,是如何用代码和AI思维,把“相机”变成一个“全自动的AI摄影师”,并在这个过程中实现了从濒临破产到百亿市值的逆袭。

90后黑客的“不务正业”

刘靖康,91年出生,典型的高智商“坏小子”。

在南京大学读书时,他不是那种拿奖学金的乖学生。大二那年,他为了搞清楚学校妹子的分布情况,用代码爬取了全校7000张学生证照片,合成了一张“标准脸”。这事儿闹得很大,差点被开除。

更有名的“战绩”是,他通过一段采访视频的按键音,破解了周鸿祎的手机号。这听起来像电影情节,却是他真实的技术底色——对图像、声音和数据的极度敏感

但他并不是一开始就想做相机。他的第一次创业是做“名校直播”,第二次是做“视频社交”,结果都黄了。尤其是视频社交,因为男女比例严重失衡(2.3:1),根本运营不下去。

直到2014年,他看到了国外一个极客用6台GoPro绑在一起拍出的360度全景视频,那种“上帝视角”的震撼击中了他。他决定,要做一个能直接拍出这种效果的消费级产品。

从VR泡沫到“先拍摄后取景”

创业初期,刘靖康踩了一个巨大的坑:赌错了赛道。

2015年,VR(虚拟现实)概念火得一塌糊涂。影石拿到了融资,做出了全景相机,指望大家戴着VR头盔看视频。结果呢?VR根本没普及,头盔都在吃灰。

公司账上从400万烧到只剩100万,眼看就要解散。

这时候,刘靖康做了一个极其关键的用户洞察。他发现,虽然普通人不看VR,但有一群硬核玩家(骑行、滑雪爱好者)在疯狂使用他们的相机。为什么?

不是为了看全景,而是为了**“不遗漏”**。

传统运动相机(如GoPro)有一个致命痛点:你在滑雪或跳伞时,必须时刻注意镜头有没有对准自己。一旦构图歪了,精彩瞬间就废了。

但全景相机能记录360度所有画面。你只需要举着杆子,不用管角度,回家后再通过软件重新取景(Reframing)。

这个发现,让刘靖康找到了“活路”,也让他摸到了AI影像的门槛:把摄影师的工作,交给算法。

转折点:看不见的自拍杆

真正让影石“出圈”的,是一个看起来像魔法的功能——隐形自拍杆

在全景视频中,底部总会有一个难看的黑洞或杆子。影石的算法团队通过计算机视觉技术,在拼接画面时自动把那根杆子“抹掉”了。

结果就是,用户拍出来的视频,像是有个低空无人机在跟拍。这个功能在滑雪、摩托车圈子瞬间炸了。

这不仅仅是一个特效,这是AI介入硬件的开始。它解决了一个物理难题:如何在没有摄影师的情况下,拍出第三人称视角的画面。

靠着这个“杀手级”体验,影石从VR的死胡同里跳了出来,直接杀进了GoPro的腹地——运动相机市场。


方法论拆解:打造“AI摄影师”的5个步骤

影石的成功,本质上是AI技术+产品定义的双重胜利。刘靖康把这个过程拆解为非常清晰的5步:

1. 重新定义需求:从“拍得清”到“拍得对”

传统相机的逻辑是:我给你最好的画质,你自己去构图。 影石的逻辑是:你只管记录,构图交给我。

他们发现,用户买无人机、买运动相机,本质上不是为了参数,而是为了**“出片”**。但90%的人不懂运镜,不懂剪辑。

所以,影石把全景相机的核心卖点从“VR体验”转变为“先拍摄,后取景”。这极大降低了废片率。你不需要有摄影技巧,AI算法保证你永远在画面的C位。

2. AI重塑工作流:从CNN到端到端模型

这是影石最硬核的技术护城河。

早在2018年,影石就推出了“一键成片”功能。当时的底层技术是CNN(卷积神经网络)+ 代码规则

  • 原理:用AI识别画面中的人、车、狗,然后程序员写死规则——“如果有人,就给特写;如果是风景,就拉广角”。
  • 效果:60分。能用,但很生硬。

转折点发生在2023年,ChatGPT爆发后。 刘靖康迅速意识到,AI的范式变了。影石立刻将技术栈切换为端到端的大模型训练

  • 新原理:不再写规则,而是把海量的人类优秀剪辑视频“喂”给AI。让AI自己去学习什么是“好的节奏”,什么是“精彩的瞬间”。
  • 效果:90分。AI现在的剪辑水平,已经能捕捉到情绪、卡点音乐,甚至懂得留白。

这让影石的APP不再是一个工具,而是一个自动化剪辑工厂

3. 硬件做减法,软件做加法

为了实现“AI摄影师”的目标,影石在硬件形态上极其大胆。

比如Insta360 GO系列(拇指相机)。它只有一个拇指大小,磁吸在胸前。

  • 硬件逻辑:牺牲续航、牺牲屏幕,换取极致的轻便和无感。
  • 软件逻辑:依靠强大的防抖算法(FlowState)和水平校正,让这颗小豆子拍出来的画面像云台一样稳。

这就是典型的“软硬解耦”。用算法弥补硬件的物理缺陷,从而创造出全新的拍摄场景(如第一人称视角的猫咪视角、婴儿视角)。

4. “包围”竞争对手,而不是“死磕”

面对GoPro这个巨头,刘靖康没有选择硬碰硬(比如只做一款更便宜的运动相机)。他用了一套**“包围战术”**:

  • 左翼:全景相机(X系列)。这是GoPro做不好的,直接降维打击。
  • 右翼:拇指相机(GO系列)。这是GoPro没有的形态,切入女性、亲子、宠物市场。
  • 中路:模块化相机(One R系列)。把全景和广角做成可更换的镜头,直接跟GoPro抢存量用户。

这三块加起来的市场份额,比单纯的运动相机市场要大得多。这叫**“把蛋糕做大,顺便切走你的一块”**。

5. 供应链的“暴力”磨合

作为一个软件出身的团队,影石早期在硬件上吃尽了苦头。

第一代产品良率低到发指,工厂根本不愿意接单。刘靖康带着团队直接睡在工厂产线上,自己动手拧螺丝。

这里有一个血泪数据:为了打磨一个甚至消费者感知不强的工艺细节,成本可能会上升30%。 但正是这种对质量的死磕(甚至为此召回过整批产品),才让影石在海外高端市场站稳了脚跟。


理论升华:需求背后的需求(马车理论)

刘靖康在访谈中提到了一个经典的产品哲学,我称之为**“马车理论”**。

如果当年你问客户需要什么,他们会说:“我要一匹跑得更快、不吃饭、不睡觉的马。” 如果你听了客户的话,你只会去改良马种。 但福特造出了汽车。

同理,在影像领域:

  • 表层需求:我要一个像素更高、防抖更好的相机。
  • 深层需求:我想记录当下的美好,但我不想因为盯着屏幕而错过了当下的体验。

影石做的所有AI功能(自动取景、自动剪辑、隐形自拍杆),本质上都是为了解决这个深层矛盾:把人从“拍摄”这个动作中解放出来,让你去“体验”生活,让AI去“记录”生活。

局限性提醒:AI的“通货膨胀”

虽然AI极大地降低了创作门槛,但刘靖康也清醒地看到了硬币的另一面:装X的通货膨胀。

当AI能一键把滑雪视频里的天空换成极光,把笨拙的动作修成大神,“真实”就变得稀缺了。

  • 适用边界:AI非常适合“记录”和“分享”层面的效率提升,比如快速出片发朋友圈。
  • 不适用场景:AI无法替代顶级的“创作”。那种为了一个镜头等待光线、精心设计的成就感,是AI无法提供的。

此外,硬件的物理限制依然存在。即便AI再强,光学的物理规律(底大一级压死人)和电池技术(能量密度瓶颈)依然是未来5-10年难以突破的天花板。

金句收尾

刘靖康说:“我们公司的终极目标,是造出一个**‘隐形的AI摄影师’**。它能上天入地,能在你最开心的时候自动记录,而你甚至感觉不到它的存在。”

在这个AI席卷一切的时代,最大的机会或许不在于做一个更好的工具,而在于把工具变没

当技术足够先进时,它应该像魔法一样,悄无声息地服务于生活,而不是打扰生活。