Loading... # 闪电说团队两年 AI 创业踩坑实录 # 一、访谈概述 ## 1. 背景介绍 ### A. 访谈对象 余猛和龚震,闪电说创始人。 ### B. 访谈主题 AI 应用创业两年的踩坑实录与经验分享。 ### C. 来源 向阳乔木(@vista8)在 X 平台发布的访谈文章。 ## 2. 核心观点 ### A. 创业本质 "做 AI 应用,本质上就是在卖 token,跟深圳兄弟做跨境电商没什么区别。"——龚震 ### B. 关键洞察 - AI 应用具有消费品属性 - 技术壁垒在长期积累中形成 - 创业没有方法论,只有长期方向 # 二、产品演进历程 ## 1. 初始探索(2023 年) ### A. 起点:寻找差异化 余猛在 ChatGPT 火了之后思考:大模型时代,真正的差异化在哪里? - 计算是通用的 - 模型结构全球能参与创新的可能就一百来人 - 剩下的,只有数据 ### B. 第一次尝试:对话式记忆助手 在手机上做一个用 AI 当界面的记忆工具,记 To-do、记大姨妈、记生日,所有东西都用对话完成。 **发现问题**: - 成本太高:用 GPT-4 每个月单人成本 10 美金,人家记大姨妈的 APP 都是免费的 - 频次太低:本质上没有人喜欢记东西,这是反人性的 ### C. 第二次尝试:全天候录音 既然主动记录不行,那就被动记录。 **产品形态演进**: 1. 电脑客户端 + 录音笔 2. 手机 APP 3. 耳夹式耳机 4. 最终方案:装个 APP,用任何耳机都能变成全天候记录设备 **核心问题**: 拿到全天候声音之后,今天的 AI 根本没法充分利用。打呼噜需要专门的 AI 分析,咳嗽需要医疗能力,情绪识别又是另一套。这是个生态问题,不是他们能跨越的鸿沟。 ## 2. 转折点(2025 年初) ### A. 发现真需求 Claude Code 发布,余猛和团队从早用到晚,发现:语音编程太爽了。 ### B. 产品定位转变 从记忆转向语音输入,推出闪电说语音输入法。 ## 3. 产品演进时序 ```mermaid timeline title 闪电说产品演进时间线 2023年 : 对话式记忆助手<br>成本高、频次低 : 全天候录音项链<br>AI 无法充分利用 2025年初 : 发现语音编程需求<br>推出闪电说语音输入法 2025年 : PMF 验证<br>商业化启动 ```  # 三、创业理念 ## 1. 长期方向 ### A. 余猛的观点 他在移动互联网做过百万级产品,但没有长期方向,很混乱。到了 AI 时代,他给自己的要求是:一定要找到长期方向。 **选择策略**: - 收敛到一个大方向 - 在里面做暴力破解 - 从 2024 年 1 月到现在,他们就没做过和声音无关的事情 ### B. 创新方法论 "创新本质上是用新的方法成功,所以我觉得是没有什么方法论的。" **关键洞察**: - 所有方法论都要被质疑 - 经验很难简单适用 - 真正重要的是新的思想、新的方法 ## 2. 大厂经验与创业 ### A. 龚震的结论 "在大厂工作是学不会创业的。" **原因分析**: - 大厂怎么挣钱,你可以了解,但那套方法你学不会 - 你不是在大厂里做一个挣钱的机器,你只是机器里的一部分 - 大厂挣钱模式也是由小长大的,对你怎么挣到第一个 100 万,意义不大 ### B. 创业 idea 来源 **方法一**:多看 GitHub 上高赞的项目 - 前段时间有两个项目反复登上 GitHub 日榜第一 - 一个做舆情分析,一个做信息 tracking - 背后代表的是两类非常明确的需求 **方法二**:搜索热度验证 - 看到所有热点和关键词,都拿工具查一下有没有人关注和搜索 - 简单的微信指数就行 - 一个被人反复搜的东西,一定有价值 # 四、技术壁垒与商业模式 ## 1. 技术壁垒的真相 ### A. 余猛的回答 他也给自己提过这个问题,但还没有得到充分性的答案。 **大佬观点**: 有一天竞争壁垒就是你活过来了,谁走到最后,回头一看这些东西才是你的壁垒。 ### B. 消费品逻辑 今天的 AI 应用有消费品的属性。 **核心特点**: - 核心的大模型技术都是采购的 - 结合某个场景的独特判断 - 有点像消费品逻辑 **类比说明**: 奶茶这么多人做,但还有这么多需求。 "我觉得可以把它当做一个 AI 的消费品,但做了之后一定可以形成技术壁垒。" ## 2. 商业化本质 ### A. token 分销 本质是做 token 分销。 **核心原则**: token 分销的本质在于赚有钱人的钱。 ### B. 转化漏斗数据 闪电说的 AI 纠错开关开启率大概 50%,真正用上 API key 的人不到 20%。 **转化路径**: - 50% 开启 AI 纠错 - 20% 使用 API key - 30% 有付费意愿但没被转化 - 最有钱的前 3% 到 5% 会被转化 ### C. 商业化公式 只要不是特别奇怪的产品,人均 70% 的毛利。 "所以我们说它是消费品,你就是在卖奶茶。" ## 3. 付费习惯差异 ### A. 付费率对比 | 地区 | 付费率 | 客单价 | |------|--------|--------| | 台湾 | 3% 到 5% | 中等 | | 中国 | 1% 到 2% | 较低 | | 美国 | 5% 到 7% | 高 | ### B. 中国用户特点 不是中国人付费习惯差,是经济发展水平没到。但中国有钱人还是很多,做高客单价产品也没问题。 **特殊偏好**: 中国人更喜欢买内容和买实物,买一个能到手的东西。 "送所有礼品里,送麦克风效果最好。你给他 200 块钱,不如给他一个 200 块钱的麦克风。" # 五、增长策略 ## 1. 核心原则 大家都在用的招,就是最好用的招。 不要想奇淫巧技,奇淫巧技是你在业务过程中,根据对用户和产品的理解迸发出来的,不能作为日常探索所需。 ## 2. 第一阶段:网红营销 ### A. 核心逻辑 网红背后代表的是一个用户群体。 你能搞明白你的用户群体是谁,就能找到合适的网红,获得最高效率。 ### B. KOL 选择策略 不用找大网红,大网红很贵。 **正确做法**: 如果你的产品 PMF 了,应该尽量去找 100 个小 KOL,每个给几百几千。 "最后可能跑出来一条爆款,就把买 20 条的钱赚回来了。" ### C. 渠道选择 Monica 最开始在 YouTube 台湾跑得很好,原因有两个: - 团队国际化不成熟,台湾文案做得好 - Monica 是 PC 端产品,YouTube 在 PC 端转化率高 ## 3. 第二阶段:内生增长机制 ### A. 病毒传播要素 真正要破圈,有很好的自然传播,酷的属性和好玩性很重要。 ### B. Monica 的案例 Monica 移动端从一个月 1 万刀收入到 10 万刀,就是因为一个很火的东西叫"AI 嘲讽"。 把你的 profile 全部读一遍,给你一个很嘲讽的评论。靠这个东西,移动端收入涨了 10 倍。 ## 4. 第三阶段:SEO 和投放 ### A. 基本功很重要 SEO 很重要,GEO 很重要。 Google 不会骗你,你很有用它就往前排,你被很多人推崇它就往前排。 ### B. 投放策略 找到对的人、熟练的人,不要怕花钱。 **学习路径**: 我们都是最开始找 SEO 专家外包,跟他学,学完发现我们也能做。找投放专家跟他学,学完发现也能自己做。 ## 5. 闪电说出海策略 ### A. 定位 我们是免费的 Wispr Flow。 ### B. 策略 在一个 Wispr Flow 已经花了几千万美金教育过的市场,最简单粗暴的策略就是告诉大家我们免费。 ### C. 差异化 他们想猛猛去讲 AI 输入 agent 的体验,因为 Wispr Flow 还没做。 # 六、技术细节 ## 1. 准确率现状 ### A. 主流语言表现 主流语言基本都卡在 90% 上下了。 - 阿里的 SenseVoice 标准测评是 90 多 - Wispr Flow 在多语言上表现好一点,但在中文上甚至没有 SenseVoice 好 - Wispr Flow 是个比 SenseVoice 大 10 倍以上的模型 ### B. 降噪技术 大家更多是在转降噪,因为稍微降噪一点点,准确率就会好很多。 ### C. 下一个机会 接下来的机会在方言模型。 **ROI 计算**: 你有了足够的语言模型,又构建了语音输入法的商业模式,转方言模型的 ROI 就打正了。 **训练成本**: 训一个模型大概 200 万,大部分成本在数据上。 ## 2. 产品体验设计 ### A. 快比准更重要 关于产品设置,余猛和龚震都推荐用更聪明的模型,智能效果会明显提升。 ### B. 交互模式 **余猛更喜欢"自由说"模式**:按一下说话,再按一下结束。 **龚震的习惯**:只用一个键,总是开 AI 纠错,但把异步纠错打开。 ### C. 流式取舍 流式的问题是:你不断说话,字会不断变,因为有不断纠错。 他们希望大家不要被文字输入结果干扰。如果是为了解决安全感问题,分段出就好了,每 5 秒每 10 秒分一段。 # 七、用户场景 ## 1. 高频场景 ### A. 最高频 AI coding 和 AI chat。这也是他们能启动的原因,受了用户指向性影响。 ### B. 次高频 做大量文字工作的人也很猛,比如网文作者、自媒体作者。 ### C. 职业细分 - 医生:写病历需求,很多老医生不太会用键盘、不太会拼音 - 律师:大量文案工作和客户沟通需求 - 老师:教案和备课需求 这几类频次没那么高,但也是周几次活的水平。 ### D. 意外场景 用户需要在游戏里喷人,打字喷有点慢,用闪电说喷可能快一点,再加上 AI 体验,能喷得更猛一点。 # 八、长期愿景 ## 1. 个人模型 ### A. 初心 提供一个工具,给大家一个选择,可以让大家控制自己的数据,拥有自己的数据。 ### B. 技术构想 以后可能有一个技术,你的数据在本地,你有一个本地的 10B 模型,能干好管理你的记忆、管理你的上下文。 ### C. 应用场景 今天可能还要自己说,以后可能只要跟闪电说说"我要买鞋子",它基于你的记忆直接生成描述,发给所有购物 agent。 "我虽然没做任何购物 agent,但我可以跟他们协作。" ## 2. 记忆入口 ### A. 前置环节 语音输入法是最前置的环节,可能除了真正把脑子挖出来,这是更好的构建记忆的方式。 ### B. 真实性 社交媒体发言、写的文档,都是经过加工的,基于某种目的输出给别人看的。但语音输入这个环节更前置,更能代表真实想法。 # 九、给 AI 创业者的建议 ## 1. 找到长期方向,然后暴力破解 不要为了创业而创业,一定是自己感兴趣的,哪怕不赚钱也愿意做的事情。 收敛到一个大方向,在里面做足够多探索,每天都在复利。 ## 2. 把 AI 应用当消费品来做 技术壁垒暂时回答不了,但消费品逻辑是清晰的。 找到市场空白,用便宜好用的方法生产产品,包装好卖出去。 ## 3. 增长没有奇淫巧技 大家都在用的招,就是最好用的招。 网红营销、SEO、投放,找到对的人学习,不要怕花钱。 ## 4. 出海优先选 T0 国家 不是中国人付费习惯差,是经济水平差异。 美国付费率能到 5% 到 7%,中国 1% 到 2%,而且客单价差距更大。 ## 5. 商业化本质是赚有钱人的钱 5% 的有钱人付费,70% 的毛利,覆盖 100% 的人的成本和推广成本。 算账算得正,就能进入增长循环。 ## 6. 创业给自己足够长的时间 没有任何一个人出来创业一年就要做出什么成果,这是不可能的。 最痛苦的是不知道做什么,找到方向之后,剩下的是耐心。 "除非我确实没有能力做了,那我才会放弃,不然我会一直坚持下去。" # 十、关键数据总结 ## 1. 产品数据 - AI 纠错开启率:50% - API key 使用率:不到 20% - 付费转化:前 3% 到 5% - 毛利率:70% ## 2. 市场数据 | 地区 | 付费率 | 备注 | |------|--------|------| | 台湾 | 3%-5% | PMF 产品 | | 中国 | 1%-2% | 正常情况 | | 美国 | 5%-7% | T0 国家 | ## 3. 技术数据 - 主流语言准确率:90% 上下 - 方言模型提升空间:30% 到 80% - 方言模型训练成本:约 200 万 *** ## 参考资料 1. [向阳乔木 on X: "做AI应用像卖奶茶:闪电说团队两年踩坑实录,毫无保留,真诚分享!"](https://x.com/vista8/status/2012548038959697936?s=20) 最后修改:2026 年 01 月 17 日 © 允许规范转载 赞 如果觉得我的文章对你有用,请随意赞赏