4242章经2026年3月14日· 57:10

OpenClaw 之后,我只想未来 3-6 个月的事情|对谈 Sheet0 创始人王文锋

王文锋聊OpenClaw与Agent新阶段,以及他创业思路的根本转变。他对比了OpenClaw和去年Manus带起的Agent热,认为Coding Agent已接近AGI,并详解了长程任务、Proactive、自进化三大能力。他坦言自己从预判5-10年转向只看未来3-6个月,拒绝为差异化放大Ego,而是跟随趋势做“管AI的AI”产品——让AI直接驱动Claude Code,将开发周期压缩到两周,个人效率提升10倍。

  1. 0:00开场
  2. 0:35新老Agent波
  3. 5:30垂直Agent之辩
  4. 14:04能力震撼
  5. 19:39OpenClaw三板斧
  6. 31:29Aha Moment
  7. 34:44Harness概念
  8. 41:18战略拷问
  9. 45:38目标用户
  10. 48:24短期视野
  11. 51:48放下Ego
  12. 55:14结尾

转录文稿

开场0:00

There's something there.

曲凯0:20

好 。 我们很开心又请到了 Sheet0 的创始人文锋 。

王文锋0:26

这个谢谢曲老师 , 跟上次曲老师录节目也过去了快一年了 。

曲凯0:31

差不多正好一年 。

王文锋0:33

对 ,10 个月吧 ,10 个月 。

新老Agent波0:35

曲凯0:35

对 ,而且我们刚才在聊这一波跟去年那波其实很像 , 对吧 ? 去年当时是 Agent 刚起来 , 然后我们聊的是整个 Agent 的东西 , 然后那波起来其实是 Manus 带起来的 。

王文锋0:45

对 。

曲凯0:45

然后大家就都开始在看 Agent,但今天呢 ,是 OpenClaw 又带起来一波 , 然后我发现最近大家又都在看 Agent。 所以你感觉现在跟去年的区别是什么 ?

王文锋0:57

其实我没觉得有本质上的区别 。 我觉得 Manus 跟 OpenClaw 有个共同点 , 就是它们都证明了一类新形态的产品 。

对 , 像 Manus 那会儿其实刚出来的时候 ,其实主打的产品是 Deep Research 的场景 。 这个场景解锁的核心的来源是 O1 模型带来的这个推理能力的 Swilling 的能力 。

那这一波 OpenClaw 我觉得它本质上起来的原因是 Coding 的能力的释放 。 对 , 就是很多人他分析 OpenClaw 为什么活下来 ,有人会说它是可以在你的 IM 里面 , 比如像 Telegram、Discord 去直接很方便去使用 。

有些人会把这个原因归在这儿 。 但从我的视角来讲 , 本质上 OpenClaw 它可能是第一个真正的把现在最新模型的 Coding 能力压榨到极限的一个形态 。在这种情况下就是说 ,以前大家没想到这个事情能跑得通 , 能达到这样的效果 ,但是 OpenClaw 把它做出来之后发现 , 哇 , 好厉害 。

所以这时候我觉得我们去年其实一整年很多人也都在关注 Proactive Agent 这个事情 。 那之前其实我们都不知道 Proactive Agent 长什么样子 ,但是 。

曲凯2:10

就是主动性 。

王文锋2:11

对 , 对 , 对 , 一个是 Proactive, 另外一个就是说 Agent 的这个自我迭代 、 自我进化 。 那这个话题其实是一个被关注了很久 ,也讨论了很久的一个事情 ,但是没有东西真的跑出来 。

那 OpenClaw 的话其实是把这个东西跑出来了 。 所以它是 , 我觉得跟 Manus 的共同点就是它都证明了就是说新一代的 Agent 的形态是成立了的 。

对 , 我觉得是一个非常显著的一个信号 。

曲凯2:35

对 , 我记得去年我们那期播客里面你说的一句话让我印象特别深刻 , 你说 AI Coding 是大模型的灵巧手 。

王文锋2:41

对 , 对 , 对 。 那其实今天我们看到这个事情其实是已经被证明了的 。 所以这里面有个结论是 , 我觉得可能从现在开始 ,以及到将来 , 我觉得最终所有的 Agent 都会是 Coding Agent。

那其实这一次 OpenClaw 虽然它有很多的组件 、 很多的模块 ,但它最核心的一个东西叫做一个 Pad 的一个 Agent。 那个 Pad Agent 它其实就是一个极简的一个 , 被设计得非常好的一个 Coding Agent。

说简单一点 ,OpenClaw 可能就是这个 Pad 的这个 Talk。 它只不过说它在里面解决了 Memory 的问题 , 它解决了不同的 Channel, 比如像 Slack、Discord、Telegram 的集成的问题 。

这个是一个点 。 那另外一个点的话就是 , 去年大家可能讨论得多的是说环境 , 我怎么去做 RL。 那其实当时呢 , 大家的一个观点呢就是说 , 我可能需要去针对不同的应用场景 , 我要去构建不同的环境 , 然后这个环境呢 , 然后可能我有些针对这个场景的定制化的一些策略吧 。

那比如说像 LaVeT 这样的产品 , 它有特殊的交互 。 那实践到今天为止 , 我觉得这个事情其实是已经被统一了 。

那基本上你通过 Terminal 加 Skill 能够去做到任何的事情 。 以前的话就是说 , 我们可能在一些垂直的领域里面 , 我们有一些垂直的 National Hall 或者经验 , 那这个东西以前是没有办法去 Skill 或者没有办法去复制 。

所以这个时候我们只能去针对这些场景 , 我们去定制一个我们所谓的 Training Agent。 但今天基本上你加上一个 Coding Agent, 再加上对应的 Skill, 没有一个场景是做不到的 。

对 , 所以现在事实上来看的话就是 ,Coding Agent 已经成为了最核心的部分 。 那这里面一个变化就是说 , 机模的 Coding 能力跟 Coding Agent 是两码事 。

就是我们需要 Coding Agent 这个东西去把机模的 Coding 的能力释放出来 。 所以今天我觉得相对于去年的我们讲说灵巧手的结论 , 可能更进一步的就是说 , 那接下来所有的 Agent 是围绕 Coding Agent 去开始 ,Talk 也好 , 还是说是研发也好 。

对 , 所以我觉得今年可能就大家所有的 Agent 都会发现 , 最后本质上又变成了一个 Coding Agent 的一个 Talk。 对 , 然后去年 Manus 它是 , 我们讲就在那会儿刚出来的时候大家都吐槽嘛 , 就说这个东西就是一个 Talk, 什么好做的 。

对 ,其实 Manus 它是模型 API 时代的极致 Talk 的表现 。 那在目前这个阶段 ,OpenClaw 它其实是针对 Coding Agent 的 Talk 的最好的表现 。

那是不是极致的表现 , 这个问题我觉得现在还没有办法判断 。 但我觉得今年的可能另外一个很大的机会就是说 , 谁能对 Coding Agent Talk 做得很好 。

曲凯5:30

是 。 我们如果回到一年前 , 就拿今天跟一年前去做一些对标对比的话 ,因为大家 Agent 已经跑了一年了 。

垂直Agent之辩5:30

曲凯5:38

当时是 Manus 先起来 , 然后 Genspark 我记得是最快跟上的吧 , 然后就开始有一些小的跟上 。 然后呢 , 中间大家还衍生出来一些分歧跟选择 , 就是有讲说我是要做通用 Agent 的 ,有说我要做一个 Agent 的平台 , 对吧 , 就是我提供一些基础能力 , 然后大家可以在上面各自建自己的 Agent, 然后也有做各种垂直 Agent。

所以现在你回头来看 , 你觉得会有什么这些路径的选择里面的一些对错标准之类的吗 ?

王文锋6:08

虽然我觉得很不愿意承认 ,但我觉得事实上可能垂直 Agent 这条路是可能需要被高度怀疑的一件事情 。 就刚才其实我们讲了 , 就是说现在 Coding Agent 加上 Skill 的东西 , 基本上都能实现以前这个垂直 Agent 的效果跟作用 。

曲凯6:25

是 ,不止垂直 Agent 的 , 整个把 SaaS 都打趴了嘛 。

王文锋6:29

对 , 对 , 对 。Astropique 官方呢前段时间发了一个报告 , 那个报告里头 , 它介绍了说现在大家是怎么去用这个 Claude Code 的 。

那我们从绝大多数人的理解来讲的话 , 可能 Claude Code 啊 , 带 Code 嘛 , 很多人都会觉得它就是一个给工程师用的一个工具 , 然后去拿它去做软件开发 。

但实际上在那个报告里面 , 只有 49.7% 的使用场景是 Software Engineering, 就是大家拿它去写代码 。 那剩下的超过 50% 的场景 , 都是在那些我们看起来非 Coding 的一些场景 , 比如说办公自动化 , 比如说数据分析 , 比如说做 Marketing, 或做一些文案的编写 ,Copywriting 这些场景 。

所以说这个东西我觉得已经不是说我们推演它怎么样 ,而是说现在事实上来讲 ,Claude Code 已经能做所有的事情了 。

那在这种情况下, 如果我们还是在强调垂直 Agent, 我觉得更多它可能是为了避免跟 Claude Code 这样的通用的东西去竞争的一种给自己树立的一个心理的安全感 。

对 , 所以我觉得从事实上垂直 Agent 这个逻辑是有问题的 。

曲凯7:33

今天我们那个群里面不是新民还说了一句话 , 我觉得还挺有意思的 。 就像其实我们回头来看抖音 , 应该是内容时代的王者 , 对吧 , 基本上是一站式平台 , 所有的内容都在网站上面去靠 。

但 2P 领域过去都是垂直的 , 对吧 , 可能你看美国市场 , 可能有一堆百亿美金的各种 2P platforms。 那未来是不是 2P 里面也会有一家类似于抖音这种形态 , 或者字节这种形态的公司一家独大 , 或者说这家有没有可能就是 OpenAI、Anthropic 之类的 ?

王文锋8:08

说实话我现在 。

曲凯8:10

现在肯定很难 。

王文锋8:11

现在很难去预判 。 但是我觉得我们可以分析一下, 为什么在 SaaS 时代出现了很多的垂直的 SaaS。其实为什么软件这个东西大家觉得这个商业模式很好 , 核心是我觉得软件它解决了一个本质的问题 , 就是说在没有软件以前 , 大家想去把一个专家的经验 、 决策的能力进行分发的时候 , 它其实需要培训 , 然后要学习 。

那这个时间周期是很长的 。 那所以说软件的出现 , 第一次的让专家能力能够快速的进行规模化的复制 , 对吧 ,以前我去学校学 , 现在我用这个软件 , 我可能学个一下午 , 我就知道怎么用了 。

这时候我按软件的操作 , 我可能就也获得了一个类似专家的一个能力 。

曲凯8:58

对 , 所以当时 SaaS 它讲的重要都是行业 NoHow 嘛 。

王文锋9:01

对 , 所以说这个时候你要去复制专家能力 ,其实你就得需要可能你针对行业 , 或者针对一个具体的问题 , 或者领域 , 我要去设计一套独特的交互 , 通过不同的交互 , 然后我去把专家的工作流变成一个 UI。

那其实现在为什么包括说现在 Claude Code 出来以后, 就美股的软件股跌得很多 , 那很多人会觉得以前的软件要花很多时间要去做 , 那现在有了这种新的工具之后, 我实现它的成本或者时间变得很快 。

但其实我觉得这可能是表层的因素 。 那更深层的因素就我刚才讲的 , 软件本质上在过去的一个核心地位是说 , 它可能是规模化复制专家能力的一个载体 。

那现在有了这个 Agent 以后, 我希望获得一个专家能力这件事情变得更容易了 。 以前我还要打开网页 , 打开 SaaS, 我要去学习要怎么去交互 。

那现在可能有了 Agent 之后, 我直接跟 Agent 说我的目的 , 那它自己就会去提出方案 , 解决问题 , 然后再进行自我的迭代 。

曲凯10:05

对 ,而且以及以前的 SaaS 其实是一个通用的专家 , 对吧 , 反正不管怎么样你就用这一套东西 。 所以以前的 SaaS 和 2P 大家强调的是 Best Practice, 就是最佳实践 , 然后大家都去复制这个最佳实践就 OK 了 。

但确实每一家的情况是不一样的嘛 。 那 AI 相当于说你给每家一个客制化的一个专家 , 这个专家还能随着你的情况时刻去改变 。

王文锋10:27

对 , 所以回到曲老师你的问题的话 , 就说未来会不会有一个类似说企业版的抖音 。 因为在这个里面的话 , 就我们过去讲 Best Practice, 我觉得在 AI 时代可能 Best Practice 没有那么重要 。

因为 Best Practice 的本质上是说 , 我们长尾的需求 , 我没有办法去很好的解决 。 所以我们需要去让大家把做一件事情的方法或者共识能够去收敛到 Best Practice 上面 。

因为这个时候 ROI 是够的 。 但是呢 ,在今天其实你的一个 Best Practice 跟不是 Best Practice 的一个东西 , 让 AI 去执行的话 , 对于 AI 来讲其实都一样 , 没什么区别 。

对 , 所以在这个里面 , 就是说如果通用 Agent 的逻辑成立 , 那最后我觉得可能 , 至于说是不是 OpenAI,是不是 Astropique, 我觉得这个不确定 ,但是我觉得肯定会有一个统一的东西 , 能够去解决绝大多数的问题跟需求 。

曲凯11:21

对 , 你看其实我们刚才讲两点第一点 , 就是大家会觉得说 AI Coding 颠覆了之前 2P 这么多年的很多积累 , 对吧 ,因为大家觉得软件本质上就是一堆 Coding。

但这个我同意你讲的 ,因为我有一种类比的逻辑啊 , 就是如果说软件的壁垒跟价值在 Coding 的话 , 那美国的 SaaS 公司早就被所有中国公司取代掉了 。

王文锋11:41

对 , 对 , 对 。

曲凯11:42

因为中国的 Engineer 就便宜嘛 。

王文锋11:44

对 。

曲凯11:44

那如果这个逻辑成立的话 , 那早就应该是中国 SaaS 起来了 。 那这个至少没有看到 。 对 , 另外就是 Know-how 这个事情 ,但这个我想再追问一下, 就你真的觉得 Skill,因为 Skill 现在其实还是非常简单的嘛 , 对吧 , 它真的能取代那么复杂的一套 SaaS 的 Know-how 的那些东西吗 ?

你看基本上最近就是 Anthropic 只要出了一篇文章 , 给了一套 Skill, 然后对应的那个行业的 SaaS 就大跌 。 它真是一个能那么简单的一个替代解决方案吗 ?

王文锋12:13

我现在倾向于是的 。 就是 Skill 刚出来的时候 ,10 月份其实我就在极客上发了个动态 , 我说大家对 Skill 这个东西是低估了的 。

就现在大家质疑 Skill 是不是能够去很好的去复现原来我在 SaaS 上那工作流 。 我觉得本质上还是对于现在模型能力的一个怀疑 。

就是如果模型能力它持续的去提高 , 那有什么理由它 , 就是你现在给一个你工作上的一个说明 , 给我们一个真实的人, 那它能够按照这个工作上的说明去把这个工作完成吗 ?

我觉得是可以的 。 只不过这里面可能这个说明里面有一些工具 , 这些工具我可能需要去学习一下 。 那现在的情况就是 , 我觉得模型不是说我们还需要等它到像人一样 ,其实我觉得现在它已经到了人一样的地步 。

就我觉得现在今天最大的问题已经不在于说是模型会不会能够完全替代 SaaS,其实这个事情我觉得是已经是被证明了的 。

曲凯13:16

所以我插一句 , 就是你是非常认可说 AI 和 Agent 会颠覆 SaaS 的 。

王文锋13:22

对 , 对 , 对 。 就我前面讲的 , 就 SaaS 的这个逻辑 , 本质上是一套标准的 SOP 或者说工作流 。 这个 SOP 呢 ,以前你只能通过一个交互 , 就是大家的这个操作跟行为 , 然后这样能够去得到一个特定样的结果 。

这个结果可能就是你原先 SaaS 里面的一张表单 , 或者说是一个 Dashboard, 或者说就是一条记录 。 但今天的话 ,其实你用 Agent 去做的话 , 你也一样能得到表单或者 Dashboard, 或者说这么一个记录 。

就是从效果上来讲的话 , 我觉得它是能一样的 。 而且从使用的体验上来讲 , 就是如果现在 Agent 的使用方式的门槛能进一步降低的话 , 那我觉得对于绝大多数人来说 , 为什么还要用 SaaS?

另外一个点就是今天我觉得目前最大的问题是很多人其实不知道现在的 Agent 已经强到什么地步了 。 就 OpenClaw 给我最大的震撼不在于产品本身 ,而是它那个作者 。

能力震撼14:04

王文锋14:21

我去看了一下 GitHub 的提交记录 , 它在 1 月份的时候 , 就在 OpenClaw 没有火之前 , 它天天在那 Coding 的时候 , 它一天的最多的 Commit 次数达到了 1600 次 。

为什么它震撼我呢 ? 就是说我压根之前其实是没有想到说 AI 能做到这样一个地步 。

曲凯14:38

你给不懂技术的解释一下, 这个大概是什么概念 。

王文锋14:41

就 1600 次是什么意思呢 ? 就是说基本上它相当于一个小的工程团队 , 就三四个人这么一个体量的一个技术小组 , 一年的工作量 。

就像它一天能干完三四个人一年的工作量 。 所以这里面我的反思就是说 , 今天 Agent 的问题已经不再说 Agent 到底能解决多么多么复杂的问题 。其实这个事情我觉得一个就是我刚才说的 OpenClaw 作者的例子 。

另一个例子的话就是在 1 月份的时候 ,Cursor 他们内部用 Agent 一周做了一个浏览器出来 300 万行代码 , 然后另外就是 Astropique 官方他们也用 Agent 断了段的实现了一个 CVE 的编辑器出来 。

这些东西其实都非常复杂的软件工程 。 那其实我们在真实的世界里面很少能够去找到比这还复杂的问题 。

那这几个例子其实证明了现在 Coding Agent 它对于这种长程的复杂任务的解决能力 , 这个事情就我们从天花板能力天花板来讲 , 它已经够到这个底线了 。

但问题是很多人他不知道现在 AI 到这个地步了 。 所以现在如果举个不太恰当的比喻 , 就比如现在顶级的用 Agent 的这些人, 比如说一个月能用 2 万 、3 万美元 Token 的人, 把他们的水平假如说 90 分 , 那我觉得今天我们绝大多数的人可能现在对 Agent 的使用只停留在 10 分左右 。

这里面它不是一个简单的 8 分的差距 ,而是说这中间的分数差距它是一个非线性的 。 就是说你现在 Agent 用得好的人, 一个人可能是 1000 倍的效率 ,但 Agent 用得不好的人 ,他可能要么在做 Chat, 要么就可能做一些简单的编程任务 。

所以这里面的 Gap 就是说 , 第一个让大家知道现在的 Coding Agent 已经非常厉害 , 第二个问题是在他知道非常厉害的情况下 ,他怎么去让自己也变得能够把 Agent 用好 。

那像 OpenClaw 的话 , 我觉得它就是一个具体的案例 , 就是它证明了现在 Coding Agent 已经到厉害到这种程度 。

只不过现在大家也诟病的问题就是它的整个配置使用是比较麻烦的 。 那其实它是第二点的问题 , 就是说我怎么去把一个 Coding Agent 用起来 , 用好 , 我觉得这个是今天的一个瓶颈 。

曲凯16:55

但这个是不是就是很多产品化的问题 ?

王文锋16:57

对 , 产品化其实是个很重要的一个事情 。 但是 OpenClaw 这个形态 , 它是不是一个好的一个形态 , 这个问题其实我现在也在思考 , 我也没有答案 。

就是有人把 OpenClaw 比作成 Linux, 原生的那个 Linux 其实好像也没有人直接用 , 大家用的都是 Linux 的发行版 , 红帽呀 , 什么 SyntOS 呀 ,Ubuntu 是这样的一些东西 。

对 , 如果说现在 OpenClaw 是一个 Linux 内核的话 , 那可能说接下来大家可以做做对应的发行版 。 但我觉得这个事情可能会有类似的规律 ,但是可能也不一定是简单的一个复制 。

曲凯17:37

这个事现在我们再聊到当下, 我相信全球至少有 1000 个团队可能都不止在做这件事情 。

王文锋17:44

对 , 对 。 今天做 OpenClaw 呢 , 我自己的观察呢是有这么几类 。 第一类呢就是把 OpenClaw 简单的来做 Host, 我就给它提供一个虚拟机的环境 , 然后让它能跑起来 。

那这部分的用户群体呢 , 我觉得可能更多的还是工程师这个群体 。 那真正的怎么把这东西能够让普通人能用起来 , 比如说他是之前做运营的 ,他是之前做销售的 , 怎么让这些人用起来 , 我觉得才是接下来我觉得最需要去考虑的一个点 。

像我们团队的话 ,其实我也一直鼓励大家 , 就我们非技术的同事去用这个东西 ,但是事实上就他们真的是把这东西配不好 。

所以这里面就是又回到我们前面讨论的问题 , 就是说套壳这件事 , 怎么把 Coding Agent 这个壳套好 , 然后让普通人也能够用得很好 。

那我觉得这个可能是一个类似说去年 Manus 那样的一件事情 。

曲凯18:43

对 , 我觉得这个一定是今年的主线 。 我跟好多人都讨论过 , 就是 OpenClaw 我看现在的数据大概是 200 多万个 Agent, 我相信里面有很多是可能一个人搞了一堆账号的那种 。

然后 Manus 应该是几十万的用户量级嘛 , 像 Cursor 什么的我估计也是百万级 。

王文锋19:01

这他们数据我其实倒没有太关注 , 我主要关注的可能是 Claude Code 跟 CodeX 的数据 。 现在 CodeX 的活跃用户吧 , 已经到 100 万了 。

然后对应的从市场份额来讲 , 可能 Claude Code 是它的 3 到 5 倍 。 也就是说这两个加起来的话 , 应该活跃用户也得要有 500 万了 。

那其实这 500 万的话 , 可能更多的还是在工程师这个层面 。

曲凯19:21

对 , 所以我想讲就是大家能不能有个 Vision, 能看到说未来有 10 亿的用户 , 我觉得是一定的 。

王文锋19:29

对 , 是一定的 , 我觉得是一定的 。

曲凯19:30

对 , 所以从渗透率来讲 ,其实现在它渗透率连 1% 都没到 。

王文锋19:35

对 。

曲凯19:35

这一定不再是个基础设施嘛 。

王文锋19:37

对 , 对 , 对 。

曲凯19:39

然后 Agent 里面我们现在在提 OpenClaw 的时候 , 经常会提到几个点啊 , 第一个是长程任务 , 对吧 , 第二是它的 Proactive, 你刚才提到的就主动性 , 第三是它是不是能自我进化 。

OpenClaw三板斧19:39

曲凯19:50

我们可以分开讲一下这几个点 。 第一个长程任务这件事能不能给大家解释一下 ?

王文锋19:55

最直观的一个表现就是如果大家去用了一些像 Manus 也好 , 或者其他的一些 Claude Code 也好 , 或者 Cursor 也好 , 我们会发现它在工作的过程当中, 它会把你中间每一步在做什么 , 调哪些工具显示出来 。

对 , 基本上我们用它有多少个 Step 去描述一个任务的复杂度 。 如果你的一个任务越复杂 , 它的这个 Step 其实就越多的 。

现在基本上我们可能看到的 Step, 很多任务还是集中在几十个 Step 上面 , 比如说我去读一些文件 , 我去访问一些 API, 我去调一些 Tool。

对 , 那今年的话 , 我们可能能看到它的这个长程的扩展能力能够到几百甚至上千的这个地步 。

因为这里面核心它需要的是你对一个问题的一个拆解能力 。

曲凯20:43

但当时我记得去年我们聊的时候 ,其实提出了一个问题 , 就是当步骤增多 , 它就会有不确定性的问题 , 它的准确率就会下降 。

而且你当时我记得很清楚 , 你当时讲的是如果每一步的正确率 , 比如都是哪怕是 90% 的话 , 那接乘下来最后准确率也是非常低的 ,以及说它在中间容易产生闭环空转 、 死循环这种情况吧 。

那现在这些问题是仍然存在吗 ? 还是怎么样被解决的 ?

王文锋21:12

我觉得这个问题应该是解决了 。 就是去年那个时候的逻辑跟思路好像说我现在可能就是把一个 Agent 当做一个装载机 , 这个状态如果你是存在内存里面 , 然后我的第一步 、 第二步 、 第三步 , 我觉得是一个不可逆的 。

但现在其实今天的最佳实践 , 它其实已经把这个状态落到了文件上面 。 那这个时候其实如果我们在前面有几个步骤做错的时候 ,Agent 它自己是有能够去修复这个问题的能力 , 比如说它的这个 Memory, 它的这个 Progress 的文件改错了 , 它意识到这个问题的时候 , 它也直接就把东西一改 , 把这个错误就修复掉了 。

所以错误修复这个问题 , 我觉得现在已经不是个问题了 。 对 , 就是你通过所有东西都 Failed System 化以后,Agent 能够去明确的看到现在问题在哪 , 然后它自己有了修复这个问题的能力 。

曲凯22:02

这个能不能理解就是这些长程任务啊 , 包括自我修复能力等等 ,其实就是计谋能力提升带来的 。

王文锋22:09

我觉得计谋能力是一方面吧 , 另外一个方面就是大家到现在为止发现其实把模型跟文件系统结合在一起是最好的 。

所以这里面除了模型能力本身的提高以外, 我觉得还有一个很重要的就是整个围绕着模型的 API 演化出来的这一套 , 我们怎么基于文件系统 , 或者说我们现在怎么去基于一个所谓的给模型配个 Computer 的方式 , 然后让它能够去自己去 Organize 自己的数据也好 , 逻辑也好这件事情 , 或者整个这套实践出来的工程方法论 , 我觉得是共同决定的 。

曲凯22:40

对 , 这个其实就是去年我们当时聊 Context 嘛 , 对吧 ,其实现在就是说我们找到了一个路径 , 说 OK,Context 就是给它个电脑 , 给它个文件夹 , 就是一个最好的 Context 了 。

王文锋22:49

去年那个时候的逻辑还在于说是我人要去控制 Context, 那今天其实我们会发现最有效的方式不是人去控制 Context,而是让 Agent 自己去维护 Context。

曲凯23:01

这个其实最终还是回到 Manus 当时那个 High Cloud 讲的 , 就 Less Structure, More Intelligence。

王文锋23:08

对 , 对 , 对 ,其实我们看过去人家就一直就是对的 。 比如说大家在这个事情上面 ,有些人他不信 ,有些人可能觉得信 ,但是我可能要做点差异化出来 。

但实际上做出差异化 , 我们发现可能是一些雕花的一些工作 ,不一定 work。

曲凯23:25

是 , 所以这个是长程任务 。 然后那个主动性这个事呢 , 怎么理解 ?

王文锋23:29

长程任务它跟主动性我觉得是一个很接近的一个事情 。 就比如说我们现在用一些 AI 产品的时候 , 很多时候我就是一次性的一个任务 , 比如说给我给个报告 , 或者帮我写个小程序 , 或者写个小网站 , 那这东西我今天干完 , 这个任务就结束了 , 然后我的这次会话也就回收了 。

那 Proactive 的意思呢 , 我觉得分两类 。 第一类的话就是我这个任务它是不是需要去重复的维持性 , 持续的维持性 。

举个最简单的例子 , 比如说每天早上 8 点的时候给我发一个昨天的工作总结 、 工作纪要 , 或者每天晚上 10 点的时候把今天群里大家讨论的问题 , 哪些事情没有办完 , 给我写一个当天的日报出来 , 然后发到群里给大家看 。

那这些东西就是说我不需要去主动的 Prompt 它 ,而是它能够基于我过去跟它的交互 , 它知道我现在需要什么东西 , 它能主动的把这个东西提供给我 。

而且在这个过程里面 , 它能够去不断的优化它自己的那套工作流 。 那这个东西我觉得是叫 Proactive。

曲凯24:34

这个主动性我能不能理解 , 就像你刚才举的例子其实有两种情况 。 一种情况是我告诉它说你每天 8 点给我发一个 , 然后它每次发了 , 对吧 ,但这个好像不是一个非常主动的事情 , 这仍然是被动触发的主动 , 对吧 。

另一种是说我没告诉它 , 我突然发现今天它多做了这个事 , 明天多做那个事 , 它相当于给我提供了一些惊喜 。

所以我们讲的主动应该是更偏第二种 。

王文锋24:57

我觉得这个是一个第一步跟第二步的一个区别吧 。 就确实我现在设一个定时任务 , 它是一种主动的方式 ,但更主动的方式就是我不设定时任务 , 就是我跟你在日记月历的时候 , 然后你更了解我的业务 , 了解我的性格 , 然后了解我的角色 , 了解我的工作内容 。

那这时候就像同事一样 ,他哪天主动的告诉你说现在我发现我们有个什么什么问题 , 然后有个什么好的方案 , 你看我们这么搞行不行 。

曲凯25:26

这个其实是字节讲一个 Context Not Control 嘛 , 对吧 ,其实也是我给你足够的 Context, 你知道我要做什么 , 你也懂我 , 那你遇到一个情况你就自己会主动去处理 , 你知道吗 。

王文锋25:37

对 , 所以这里面核心就是说 Agent 它能不能主动的去做 Exploring, 然后自己进行反思总结迭代 。 如果你一定要定义真正的 Proactive 的话 , 我觉得可能这种是一个真正的一个 Proactive。

曲凯25:48

那在这件事上现在你觉得包括 OpenClaw, 包括 Agent 做到哪一步了 ? 或者就是你在自己日常使用的时候有遇到过什么这类的案例吗 ?

王文锋25:56

其实这里面还是会有一个 Setup 的过程 , 它是个典型的现有建项现有单的一个问题 。 它想要去了解你 , 你必须得先跟它产生一些连接 。其实我一直在研究大家怎么在用 OpenClaw, 就我觉得现在的一个新的范式 , 或者说我们现在讲 Proactive Agent 这个东西其实它是比较抽象的 。

那其实我觉得真正的 Proactive Agent 它可能是一个 , 就我们前面提到的说产品形态的问题 。 最早我们是 Chat, 对吧 , 然后 Manus 出来之后大家会发现你这东西可以断断续续的把一个任务解决了 。

那总体来讲现在是一个人跟 AI 的一个角色 。 那 OpenClaw 我觉得更大的作用就是说 AI 管 AI, 所以一定要去定义一个点的话 , 我觉得 Proactive Agent 就是一个 AI 管 AI 的一个 Agent。

就以前的话你自己需要去管一大堆的 Agent, 对吧 , 你管 Manus 也好 , 或者管 Genspark 也好 , 或者管 ChatGPT, 或者管 Claude Code 也好 , 总归是你直接在去管理这些 Agent。

那你管理 Agent 的时候相当于做什么事情 ,是你去主动提出来的 。 那接下来你想让 Agent 主动的帮你做事情的时候 , 那其实这个需求就是曲老师你也讲了 ,不应该由人来提出来 。

不由人提出来之后, 那应该由谁提出来 ? 那就由 AI 自己提出来 。 如果 AI 自己提出来之后, 它自己能不能把这个任务去完成 , 它能不能形成闭环 , 自然而然它就是 Proactive 的 。

那这个时候它肯定不是一个单个的 Agent 能够去做到的 。 因为其实现在 Agent 它能力很强 ,但是它还是需要一个 Setup 的过程 。

那这个时候我们能不能有一个 Meta 的一个 Agent, 然后让它能够去 Setup 出来一些特定的 Agent, 专门去解决一个特定的问题 , 然后这个问题解决之后我可能把成功经验记录 , 然后这个 Agent 我也可能就释放了 。

所以在这个里面的话 , 我觉得 Proactive Agent 可能就是一个管 AI 的 Agent。

曲凯27:37

对 , 聊到这正好就是 AI 管 AI 的话跟那个 Agent 的自进化也相关吧 。 对 , 这个事你是怎么看的 ? 就它如果足够主动 , 足够智能 , 现在大家讲的是说一个人的效率提升十倍百倍嘛 , 替代一些可能比如说不知道基层的人 ,他如果真的主动能到那个程度 , 那未来是不是他真的可以替代所有人 ?

王文锋27:59

我们可以回过头看 , 就是 AI 最早的落地场景 , 或者模型最早的落地场景其实是客服领域 。 那我们当时看到一个情况就是原先一个团队 , 它可能有 10 个客服 , 然后那有了 AI 之后它可能把 10 个客服变成 1 个客服 。

所以我觉得在这种 Proactive Agent 的这个情况下, 我觉得可能也是个类似的 。 比如我现在团队里面可能我有 10 个工程师 , 那这 10 个工程师我可能最后只需要留 2 个就行了 。

那为什么还是需要留 2 个呢 ? 就是说大家讲 Taste, 我觉得 Taste 这个东西它是很难被 AI 替代的 。 我们就拿我们真实的人与人之间的这个交流来看 , 一方面就是如果你在团队里面的情况是我需要把一个东西给你讲清楚 , 你才能 get 到这个事情是什么以及怎么做 , 那我觉得这种情况很危险 。

因为我有给你讲清楚的功夫 , 我已经给 AI 讲完了 , 可能 AI 马上就给我做完 。 那其实我们现在需要的是那种我可能点一下你就知道我在想什么 , 我在做什么 。

就是为什么我点一下你就能知道我可能在说什么 , 或者我想要什么事情的 , 可能是因为我们有这个默契 。

而我们的这个默契是可能在平时的工作里面 、 生活里面去培养出来的 。

曲凯29:19

它其实是一种更先天的自带的 Context 吗 ?

王文锋29:23

我觉得一方面可能是我们讲的悟性吧 。

曲凯29:25

我觉得所谓的悟性就是来自于之前的 Context 嘛 , 比如说这个人之前在字节做过几年了 , 现在在你这儿 , 然后你点一句他就知道了 。

但这带来一个问题 , 你看现在包括 Moldbook 什么的 , 包括现在他们说那个 AI 跟 AI 交流 , 对吧 , 把自己的那个 OpenClaw 放出去说 , 跟其他的去学习 , 这件事它的作用到底有多大 ,是不是能成 。

比如说今天你的一个 Agent 在你这儿做了很多 Agent 的东西 , 然后他学会了这套东西 , 然后他出去是不是能教另外一个新的 Agent 说 OK, 这套东西应该这么做 , 然后那家公司的一个人可能就说两句话 , 然后他就能把这套东西做出来 。

王文锋30:02

我觉得是可以的 。 从目前的实际的 Agent 能力来讲 , 我觉得这个事情是能做到的 。 对 , 只不过这里面就是说有多少的东西值得去这么分发跟复制了 。

就是不同的企业它其实有不同的流程的 , 它的业务也不一样 。 那这个时候就像你招聘一样 , 本质上这个人他是有能力的 ,但是招进来之后你可能需要让他来习惯公司内部的流程跟大家的工作方法 , 我们会有磨合的一个时间周期 。

所以那现在就是说对于 Skill 这个东西 , 可能是他能够去积累下来这个经验 , 我们的一些工作里面的一些方法论 , 那这个事情我觉得是可以复制的 。

但是它就是比如说我们公司内部的一个 Coding Agent, 我们针对我们的大把仓库 , 我们针对我们的这个工作流程 , 我们优化了这个 Agent, 我放给另外一个公司 , 可能这个东西对大家没有太大的价值 。

那这个时候还是回到了那句话 , 就是说我现在怎么去根据我们内部的实际特点 , 我能够去搭建一套 Proactive Agent 的这个体系出来 。

所以 Proactive Agent 这个事情 , 至少我觉得在这个阶段来看 , 它不是一个说自然而然的一个事情 。 比如说你现在有个什么产品 , 我要这产品一购买或一安装 , 然后它就能够真的去非常自动的去做探索 , 然后看你各种各样的文档 , 然后去吸收这些 。

我觉得至少目前我觉得这个事情还是有点距离 。

曲凯31:29

嗯 , 明白 。 然后在你自己使用 OpenClaw, 包括你说你在研究大家怎么用的时候 , 你有遇到过什么 Aha Moment?

Aha Moment31:29

王文锋31:35

我说一下我们现在的这个日常的工作流 。 我们现在日常工作流是我们收集用户反馈需求 , 我们会在一个叫 Linear 的平台上去做管理 。

它是一个类似于说项目管理的一个软件 , 然后我们再在每天的日会上面 , 我们再把这个任务分发给工程师 。

工程师再拿这个需求之后, 再用 Claude Code 这些工具去做开发 , 开发完之后然后再去做测试 , 测试完之后我们提 PR, 然后再合并 。

然后我的 Aha Moment 是说我现在把我们的 Linear, 把我们的 GitHub, 把我们的日常的聊天的 , 我们现在用的是 Lark。

对 , 我把全线都开放给 AI 之后, 我们忽然发现 AI 现在收到一个 Linear 任务之后, 它就直接能够把这个任务做完测试 , 然后再提交到 GitHub 上面 。

那也就是说以前的话就是我还需要中间有一个类似于说我们去把任务分发给人, 人再来去指挥 AI, 变成了现在 AI 其实监控我们的 Linear, 它直接就绝大多数的任务都直接能做完了 。

所以在这时候我们的工程师其实它从原先的一个 AI 的指挥者吧 , 我觉得就直接变成了一个最后质检员 。

就是它最后就看一下 PR, 没什么问题 , 然后在 PR 里面它带上了说我这个工作我的测试结果 , 如果是一些跟前端相关的一些修改的话 , 它可能还有一些前端的截图 。

这个事情是基本上我是在节前去做完的 。 当时让我非常震撼的一件事情 , 就是我们可能会下意识的觉得它现在没有办法做到这个事情 ,但实际上它是就一周的时间这个东西就完全跑通了 。

曲凯33:11

所以你们现在实际的效率你觉得是涨了多少 ?

王文锋33:15

就我个人的话 , 我觉得我个人的效率至少比去年这个时候多涨了 10 倍 。

曲凯33:19

如果这么讲的话 , 你想大家一般默认说之前开发一个产品 , 可能比如说几个人的团队要做一年, 如果 10 倍的话 , 那实际上是不是这种情况 ?

就是今天一个新公司以前要做一年发展品的 , 现在做两个月就可以发了 。

王文锋33:32

两个月都太慢了 , 现在可能两周就够了 。 就核心所以这个东西现在的瓶颈不在于说是生产效率上, 现在生产效率我觉得没有瓶颈 , 现在核心的瓶颈是做什么 , 做成什么样 , 这个东西是最难的 。

就大家都想现在 idea is cheap,但其实现在我觉得 idea not cheap。 就 idea 很重要 , 就当你这个生产能力无限纷扰的时候 , 那一个有意思的东西其实是挺难的 。

所以这也是刚才我们在聊 OpenClaw 的时候 , 我觉得另外一个奇怪的一个点就是 OpenClaw 一月份出来的 , 到现在大家围绕 OpenClaw 还是在做一些二次开发也好 , 还是在做一些简单的把 OpenClaw 做 host 也好 , 它没有一个全新的 OpenClaw。

因为 OpenClaw 我觉得它是代表一种产品形态 , 这个产品形态就 AI 管 AI, 然后它释放了 Coding Agent 的能力 ,但现在它并没有一个说类似的也是 AI 管 AI, 然后释放了这个 Coding 能力的一个新形态的类似的产品出来 。

所以它一定不在构建能力上 。 本质上我觉得可能产品的定义或者产品的形态 , 我觉得可能要比大家想的还要难一点 。

曲凯34:44

OK, 所以你觉得今年除了我们刚才聊的那些 Agent, 还会有哪些变化和值得期待的发展的事情 ?

Harness概念34:44

王文锋34:50

我现在还是比较期待的 Agent 的 Harness 这一块吧 。 就去年我们其实在讲 Context Engineering,但其实 Context Engineering 它其实是一个很抽象的一个概念 。

我觉得它的作用是把大家的认识拉到了就是说有这么一个东西 , 这个东西现在对 Agent 的这个成功与失败至关重要 ,但是这个东西到底是长什么样子不知道 。

那 Agent 的 Harness 的话是去年 9 月底左右在硅谷出来的一个概念 , 到现在可能它只是在小范围流行吧 。 那 Agent 的 Harness 我觉得一个核心的作用是什么呢 ?

就好比人要骑马 , 得要有马鞍一样 , 对吧 , 马很狂野 , 尤其是好马 , 那人要去说要我怎么去约束它 , 制服它 。

那 Agent 现在也一样 ,Agent 就是如果把它比作成一个绝世好马的话 , 我作为人我怎么去控制好这个 Agent 的行为 。

那这时候就是我们需要一个 Agent 的 Harness 出来 。 那 Agent 的 Harness 呢 , 我觉得它有意思的地方在于说它不像以前的 SaaS, 像以前的 SaaS 它是明显的有一个分层结构的 , 就是说我最下面是什么 Infra, 中间是 SaaS, 然后最上面才是终端用户 End User。

但 Agent 的 Harness 呢 , 就是说它其实是一个 To End User 的一个类似于说是脚手架一样的一个东西 。 我怎么去针对不同人的特点 , 就比如说身高体重 , 那对于公司来讲就是你团队的业务 , 然后你团队内部的同事 , 我怎么能够把大家的特点结合在一起 , 然后去构建出一个符合你们公司的这么一套脚手架出来 , 然后能够在你们公司的环境里面能快速把你的业务跑

起来 。 那这个东西的话我觉得是我今年比较期待任何有些进展 。 它呢跟 Infra 又不太一样 ,因为 Infra 更多的是一个 To Developer 的一个东西 , 然后我现在其实这个东西我觉得它有点 Infra 的属性 ,但是呢它又是一个比较 To End User 的一个东西 。

曲凯36:53

顺便你既然提到 Infra, 你觉得新的这一波 Agent 又会有什么新的 Infra 的机会吗 ?

王文锋36:59

Coding Agent 本身已经在被 Infra 化了 。 那今天 Claude Code、CodeX 它本身是直接给程序员设计到一套东西 , 它不是一个为了让 AI 管 AI 而设计到一套东西 。

因为我们其实已经现在看到就是说现在 Agent 它已经在套 Coding Agent, 然后把 Coding Agent 作为它自己的智能引擎内核 , 然后去做产品 。

那这个时候我们会不会有个更好的 , 比如像 OpenClaw 里面它那个 Py 的 Coding Agent, 那这个东西我觉得是一个 Infra。

那剩下的其实

至少我目前这边没有看到什么特别明显的 。 如果一定要说的话 , 可能现在就是有一部分我看到的用法就是大家用一些像 Upstand 这类的一些产品 , 然后去作为自己上下文的这个管理 。

但这个事情的话 , 它能成为一个生意吗 ? 我觉得不好说 。 包括 Andrew Capacity, 然后他其实最近在 Twitter 上疯狂讲 , 现在大家缺的其实不是什么 MCP, 缺的也不是 API, 缺的是一个让模型或者让 Coding Agent 能更好去工作的 CLI。Claude Code 本身其实就是一个 CLI, 它的全称是 Command Line Interface, 就命令行工具 。

就包括 OpenClaw 也是 ,OpenClaw 它其实也非常依赖 CLI。 就那大哥他做了一件事 , 就是把一些 MCP 变成一些 CLI。 如果你一定要说 Infra 的话 , 我觉得 CLI 这块是有 Infra。

另外一个就是今天 。

曲凯38:26

没事 , 我想到一个 , 就是之前大家也都觉得说 AI Coding 其实最主要是前端能力很强吧 ,但后端还是弱的嘛 。

现在怎么样了 ?

王文锋38:34

其实我觉得不弱 。

曲凯38:37

你是觉得当时就不弱还是现在不弱 ?

王文锋38:40

当时可能没想到那种那么弱 。 那今天的话我觉得它其实跟前端相比没有明显的弱势了 。 就为什么 Coding Agent 在之前前端这个能力很强 ,是因为它能够看到说它自己写完一个代码之后, 它前端搞成啥样子 。

曲凯38:58

它更可被验证 。

王文锋38:58

对 , 它有个即时的反馈 。 之前大家讲说后端的能力弱 , 两方面的原因 , 第一方面原因就是它见过的后端代码没那么多 ,因为它没有办法提供反馈 。

第二个的话是后端的一些改完之后的逻辑 , 它可能都是在程序的内存里面或者在数据库里面 ,AI 没有办法直接去访问到内存的数据跟数据库的数据 。

但今天如果你针对你们自己的程序 , 像我们 C40 的话 , 我们其实已经做了一套相关的工具了 , 所以它改完之后, 就相当于我们代码里面是一个专门给 AI 开放的一个接口 , 然后它直接能够去访问我们内存的状态 , 然后就是我们把我们的数据库的权限也给它了 。

就是说那这个时候它发现我数据如果跟它预期的不对 , 那它就知道出错了 , 出错之后它可以去迭代代码 。

曲凯39:43

但这里呢 , 大家也有经常提的那个幻觉安全性的问题怎么解决呢 ? 比如你数据库权限都开放给它 , 你怎么 。

王文锋39:50

就是这个只给一个 ReadOnly 的权限就好 。

曲凯39:53

嗯哼 , 反正就是设定好权限 , 对吧 ,不会让它突然某一天把数据库全杀了什么的 。

王文锋39:58

对 , 就是说整个权限管理这一块我觉得 。

曲凯40:02

这不也是个 Infra 的机会 ?

王文锋40:04

就有机会 ,但是它能不能被产品化 ?

曲凯40:06

明白明白 。

王文锋40:07

我觉得是个挑战 。

曲凯40:08

嗯嗯 ,OK。 我觉得 Agent 讲的挺全的了 , 对吧 , 你上面这些 , 然后聊聊你们自己吧 。 所以这一年 Agent 变化这么大 , 尤其 OpenClaw 这个东西出来 , 那 Stealing 现在在做什么 ,有什么改变 ?

我们这期播客放出来的时候 , 你们应该已经发了或者马上要发一个新的版本吧 ? 你们给大家讲讲那个新版本是什么样的 , 大概是做什么 ?

王文锋40:30

新版本其实我们就是在做 , 就是我刚才说的我们内部那套 Linear 的那套流程 , 我们把它产品化出来 。

曲凯40:37

那是给 Engineer、Developer 用吗 ?

王文锋40:39

对 。

曲凯40:40

哦 ,OK, 所以你是大转型 ?

王文锋40:42

对 。

曲凯40:43

哦 。

王文锋40:43

就现在的思路就是说我们要去做管 AI 的 AI。 对 , 我觉得其实现在你今天在做一个更聪明的 Agent 或者更好的 Agent, 我觉得已经没有太大价值了 。

我觉得现在基本上我的观点是 Coding Agent 已经 AGI 了 。 我觉得没有什么它现在经过我精心配置它做不到的事情 。

但是呢 , 现在问题就是说配置的这个过程太难了 , 门槛太高了 。 那我需要一个 AI 能够去更好的去管理 , 更好的去配置 。

就相当于我现在之前我有 5 个人, 我现在管不管 , 我现在要雇一个专门能管这些 AI 的 AI 进来 。 那在这个里面 ,其实去年我自己的一个问题在于什么呢 ?

战略拷问41:18

王文锋41:23

就是太靠预判了 , 就老想讲一个不一样的东西 。 但是我们今年的策略是预判为辅 , 跟随为主 。

曲凯41:32

可以 , 非常好 。 我聊那么多创业者嘛 , 我觉得你这句话有一种非常成熟创业者的感觉 。 我们在你之前会放那个跟 Apple 的录的一期 ,其实里面讲的很重要一个点 , 就是要优化胜率而不是赔率 。

王文锋41:46

对 。

曲凯41:46

就是务实的把一件确定性高的事情做好 。

王文锋41:49

对 , 所以当时我们内部其实讨论一件事情 , 就是我问大家每人一个问题 。 我说假如回到 25 年 3 月底 , 你做不做 Genspark?

因为 3 月初 Manus 出来 , 然后 3 月底 4 月初 Genspark 出来 , 我们团队就 1.5 个人说要做 Genspark。

曲凯42:06

哦 ,OK, 所以你们团队比较有梦想 。

王文锋42:08

对 , 就大家我觉得都是一种技术与产品的理想主义 。 本质上其实是在优化赔率 ,而不是在优化胜率 。 所以今年我们的策略就是跟随为主 , 然后在产品上面我们得要做到一种就是能够很快速的能够去修正产品方向跟产品重点的一个产品形态 。

然后在这个里面呢 , 我们的策略就是 AI 管 AI 嘛 。 我们以前这个程序开发还需要程序员去驱动 Claude Code, 那现在 AI 能不能直接去驱动 Claude Code?

然后为什么是 Coding 这个场景呢 ? 核心是我觉得现在 AI Coding 其实又进入了一个新的阶段 。 之前呢 , 就是大家是 Copilot 的 Copy,不全 , 再接下来是 Claude Code 跟 Coding Agent 的范式 。

本质上还是你需要程序员去主动的去 prompt, 它是一个 reactive 的 , 虽然它能够有很好的端到端的这个表现 , 需求输入还是人在输入 。

那其实现在进入第三个阶段就是 AI 指挥 AI 去实现你的代码 。 那这个时候它的需求输入其实从人输入变成了 AI 自己去输入需求 。

这里面 AI 可能需要去呈现这个需求 。 我觉得从我们团队来讲 , 我们现在在迫切的需要这个东西 。

曲凯43:16

对 , 我觉得这个很好 。 这个好在就是我发现很多做得很好的公司和产品 , 它有一个特点 , 就是他们自己本身就是用户 。

所以你在做的这个产品本身你们也是用户 , 就是它是一个正向循环 。

王文锋43:28

对 ,因为这个里面我们解决的问题是 , 就是我觉得现在大家用 AI 的水平真的是差距太大了 。

曲凯43:35

所以你做的其实也是一种平权 。

王文锋43:38

对 , 只不过说我现在可能做的是怎么把现在用 AI 只有 10 分的人拉到 60 分以上 。 因为像我们团队 , 我们上个月 AI Coding 的支出是 2 万美金 。其实我觉得现在大家是很需要让自己变成 10 倍 、100 倍的团队的 。

而 10 倍 、100 倍团队这个事情 , 就大家现在不知道该怎么办 。 所以我们就现在 Coding 这个场景上, 一个是我们自己能用 , 第二个是我觉得 Coding 其实这个需求是被验证了的 。

它是一个 1.5 部分之内的需求 。 而现在正好是有一个这么一个变化 , 就是说大家从原先的在整个软件工程的链路里面 , 工程师的位置是我们团队的需求提出来 , 它还是需要去经过我们工程师去分发 , 然后工程师再去驱动 AI 去干活 。

那现在的范式就变成了业务方嘛 , 需求提出来之后,AI 自己干完活之后, 程序员最后变成质检 。

曲凯44:29

这里我刚才就有个小问题想问 , 你像那个什么 CodeRapid 其实是做 。

王文锋44:33

你说的是 CodeReview 吧 ?

曲凯44:34

对 , 就是你说的质检这一步为什么不能也用 AI 做 ?

王文锋44:37

就是相当于是最后代码合并那一步 。 就是这个地方就 。

曲凯44:41

哦 , 就不是 CodeReview。

王文锋44:43

对 , 它不是 CodeReview。 它质检其实就是它去点一下那个合并按钮 。 因为点合并按钮的时候 , 人他是需要去扫一下的 。

就相当于这个东西就是人其实是最后的那个 。

曲凯44:54

最后把关一下 。

王文锋44:55

把关一下, 就像你流水线上基本上你的良品率 99%,但你最后还是最后有个人你需要去贴一个什么合格证 。

曲凯45:02

明白明白 ,其实是审核员 , 审核上限 。

王文锋45:05

对对对对对对 。

曲凯45:06

然后你的用户呢 , 人群画像大概是怎么样的 ?

王文锋45:10

从画像上来看 ,有一半的是 Founder, 剩下的 1/4 是那种超级产品经理 , 还有 1/4 就是超级的一些 Builder。 那这些人的典型特点呢 , 就是想法特别多 , 思路非常清晰 ,有很强的 Ownership,而且他是擅长同时处理多个领域 , 比如说设计 、 产品 、 这个研发可能次之 。

总的来讲 , 大家都是一些符合性的一些知识面很广的一些人才 。

曲凯45:38

对 , 所以你面向的是 , 就你现在第一波可能是 1 亿 Token 消耗的人嘛 , 对吧 ? 然后但你后面呢 , 或者说你最终你觉得你的用户是他不会 Coding, 可以用你 Coding, 还是说他本身已经在用但还没有用好 , 还是说就是用得很好的才能更把你们用好 ?

目标用户45:38

王文锋45:57

我觉得这里面可能就会像 SaaS 时代 , 你有不同的商业模式 , 你是 To Enterprise 还是 To SMB。 我觉得在 Agent 时代可能也会出现类似的划分 ,但是它不是按照组织的人数去划分的 , 就是按照你 Token 消耗的多少去划分的 。在 SaaS 时代有一个观点是你要去服务世界 500 强的用户 , 那我去服务这些超过 1 亿 Token 的用户 , 就好比在过去 SaaS 时代去服务世界 500 强 。

曲凯46:25

这个逻辑就是我们把 C 端也分成什么中大 C、 小 C 什么的 , 对吧 ? 然后你是先做中大 C。

王文锋46:31

对 , 可以这么来理解吧 。 但是因为核心的逻辑就是 , 当一个用户或者一个主体一年可以给我贡献 10 万美金的时候 , 我为什么要去看他是一个人还是一个团队或者一个公司呢 ?

如果我能服务 1000 个这样的用户 , 我一年是不是就 1 亿美金的 ARR 了 ? 所以我觉得这是今天的最大的变化 , 就是以前你是不可能在一个人上面收到 10 万美金的 。

曲凯46:56

到几万美金这种体量的应该就是创始人了 , 对吧 ? 因为他肯定是做这个东西最后是能很快的期待是能赚钱的 。他不可能是打工人, 说我赚着工资然后我自己还花个 。

王文锋47:08

所以我刚才讲的 , 我那个 Talking to the Woo 里头 , 一半是创始人 ,其中绝大多数是 AI native 的一些 Founder。 还有一类呢 ,是公司里面那些非常核心的骨干 , 然后以及我知道像一些已经成立 , 比如说有 10 年的这种公司 ,他们内部其实专门成立了这种 Agent 的测验小组 , 把全公司 Token 消耗前 10 的人聚到一起 , 直接汇报给 CEO 跟 CTO。

那其实组织其实也在做这方面的调整 。

曲凯47:40

就最后一定是报销的 , 对吧 ?

王文锋47:43

对 。

曲凯47:43

就未来可能你好像讲过的 , 就是人和公司不会有那么明确的分界 。

王文锋47:47

对 ,因为这里面本质上为什么现在我们从一个人手里或者一个小组织手里 , 就我们以前所定的 SMB 手里能收到 10 万美金呢 ?

是因为这 10 万美金可能就是他招工程师的预算 ,因为他不用 ,他可能就招工程师 , 硅谷招工程师 15 万美金 , 对吧 ?

你招好几个 , 那 100 万美金去了 ,但是你现在你可能只需要 10 万 、20 万 , 能达到一样的效果 。

曲凯48:09

我在想如果效率那么高 ,其实最终就是比如说当下因为这个失业的人 ,他会交流 ,他会学习 , 然后里面一定有很多人是能学会又能再赶上来的 。

王文锋48:20

对 , 所以这些人他自然而然就会变成可能 1000 万或者 1 亿 Token 的消耗者 。

短期视野48:24

曲凯48:25

对 ,但最终我觉得这个问题又变回这个产品和需求的供给的问题 。 就是世界上需不需要这么多产品 , 这些产品如果说每个人都是一个 , 就所谓一人独角兽嘛 , 对吧 ?

那最后独角兽的容量会不会变 , 对吧 ? 比如说现在全球我不知道 , 随便讲 , 可能 1000 个独角兽公司 , 那最后人人都是独角兽公司 , 那这个需求从哪来 , 对吧 ?

供给多了 。

王文锋48:51

事实上我的观点是 , 它可能是个负反馈循环 , 它不是正反馈循环 。 因为现在整个市场里面需求是一层套一层的 , 我把工资发给我的这些员工 , 员工再去消费 , 然后通过这种正向循环 , 你的需求的盘子越来越大 。

但现在很多事业以后它没有消费需求了 , 然后依赖这些工资收入去做消费的这些企业需求萎缩了 , 然后这些企业的需求进一步传递到它的上游 , 它就形成了一个这个负反馈的一个循环 。

所以我说我只考虑 3-6 个月嘛 , 那因为你不知道将来会变成什么样子 。

曲凯49:31

它有点像那个之前说那个什么各种平台打掉中间商 , 现在这个劳动力市场里的中间商就是实际做事的人。

王文锋49:40

对对 。

曲凯49:41

所以你看这个逻辑来讲 , 所谓的一人独角兽公司 , 就是说我把员工都打掉了 。AI 某一个层面来讲起的这个角色 , 我把中间的人打掉了 。

王文锋49:50

所以如果这个事情发展的真的很快的话 , 我觉得社会稳定会出现很大的问题 。 那这个问题我觉得就交给聪明人去解决吧 。

我觉得这是个很复杂的一个社会问题 。

曲凯50:02

那在这个情况之下, 你们现在团队受这个影响的变化是什么 ?

王文锋50:07

我们招人非常非常谨慎跟苛刻 。 就如果按照我们以前标准来讲 , 我们现在团队可能已经十几块 、 二十号人了 ,但是我们现在只有 7 个人。

而这 7 个人我觉得产出的速度跟效率 , 我觉得是可能原先三五十个人的团队的这种效率 。

曲凯50:28

你觉得这些人他们在使用 AI Coding 的时候 ,是能够去培养跟训练出来的 , 还是说需要靠他自己一开始就是 ?

王文锋50:37

是能够培养跟训练的 ,但是前提是你的这个组织愿意给你提供不受限的 Token 消耗的额度 。 那这个其实我觉得很多组织 。

曲凯50:48

这个也是一个问题 , 就是你最后怎么去评判跟衡量它的产出呢 ? 比如说我一天 , 你刚才说你们最多什么一天花 4000 美金 ,4000 美金是一个人吗 ?

还是什么 ?

王文锋50:58

就我们这 7 个人一起 。

曲凯51:00

对 , 就假设今天有一个人他一天花了 1000 美金 Token, 对吧 ? 那你怎么评判衡量他这个产出呢 ?

王文锋51:07

这是下一步的事情 。 你现在要做的事情就是让大家跟上, 谁跟不上就淘汰谁 。 然后衡量产出这个事情就是你作为 CEO 可能你要看一下账单 ,因为我这个事情我现在答案是还是可能得靠人来去判断 。

你作为 CEO 你看这个人今天消耗 2000 美金 Token, 或者说这周消耗了七八千美金 Token, 那你就得看他这周的这个产出是不是跟消耗是 match 的 。

如果不 match, 那说明这个人就有问题 。 然后你可能要么解决问题 , 要么解决人。

曲凯51:39

OK, 我觉得我们这期的标题就可以是我只解决未来 3-6 个月的事情 。

王文锋51:45

也可以 , 我觉得事实上是这个样子 。

放下Ego51:48

曲凯51:49

所以去年你在解决的是多长时间维度的问题 ?

王文锋51:52

去年我在解决 5-10 年以后的问题 。5-10 年以后的这个问题 ,因为谢子霖的终局的目标是要做 100% 的可信 。

我一个很大的一个体会是 , 你不要去尝试解决那些人们还没有遇到瓶颈的问题 。 像去年谢子霖的理念是我要去搞 100% 可解释 、100% 准确 。

那这个事情是一个非常正确的一件事情 ,也是很有价值的一件事情 。 然后你问每个人他需不需要 , 每个人都会说需要 ,但是你去解决这个事情一方面 , 事实上是模型做不到 。

第二点就是人们其实对这个事也没有那么的敏感在这个阶段 。 现在大家的瓶颈没有出在我现在因为不能 100% 准确 , 我就不能用了 , 对吧 ?

你这个阶段它可以通过模型获得更多其他方面的好处 。 我没有必要因为这么一个点 , 然后我就否定模型的价值 。

所以也是顺着这个思路 ,其实我前面讲的就是现在工程师的注意力已经被十几个 Terminal 的窗口去约束住了 。他一直在这个地方已经遇到瓶颈 , 所以我觉得是顺着他的瓶颈 , 然后顺势的去解决他的问题 ,而不是说你在这儿尝试去说服他这个事情目前你应该这么做 , 说服不了 。

我只是把大家都遇到一个问题 , 我发现总结 , 然后我搞一个产品出来 , 然后顺着他们的需求去多做半步 。

曲凯53:24

OK。

王文锋53:25

对 , 所以今年我们就是跟随为主 。

曲凯53:27

但这个为什么你觉得是跟随呢 ? 我觉得没有什么人在做这件事 。

王文锋53:31

我觉得更多的其实它是一个逻辑层面的东西 。

曲凯53:37

对 , 就是我给你理解就是你在跟随一个正确的大的方向 。

王文锋53:41

或者说是 。

曲凯53:43

一个明确的趋势 。

王文锋53:44

就是这里面的点在于说以前的话我的一个预判它可能能管半年, 但现在 AI 发展太快了 , 我可能一个预判最多管一到两个月 。

那这种情况下我就不预判了 。 因为预判带来的问题是 ,由于预判你就会往你的预判上去下注 。

如果你押对了 , 好 , 那没问题 。 如果你押错了 , 你的转向的成本 、 反应的速度就会变慢 。

曲凯54:07

对 , 尤其是 AI Coding 带来效率提升了嘛 , 对吧 ? 你只要判断一个东西 , 你一个月就做完了 ,其实就 OK 了 。

王文锋54:12

对对对 , 所以这个里面它更多是解放我们团队也好 , 大家的思维 , 就是大家真正的把这种你心里的 Ego 放下 ,其实是件很难的事 。

就是前面讲的回到 25 年 3 月 , 你要不要做 Genspark? 要知道现在已经一年过去了 , 我们已经看到 Genspark 已经很成功了 。

最近新的 AI 好像 1.5 亿美金了 , 都有个这样的例子 。 然后你想你第一反应是不做 , 把这事很离谱 , 对吧 ?

你从商业逻辑来讲很离谱 。 就本质上来讲 , 就是大家现在在做产品 , 尤其是我觉得现在创业的人里面 , 大家为了去讲差异化这个事情 , 会过多的把自己的 Ego 去放大 。

所以我觉得在这里面就是我们跟随不是说是抄 ,而是说我们要迅速认识到我们自己哪些地方没做对 , 客观的去看这个事情 。

所以现在我觉得最大的区别就是 OpenClaw。OpenClaw 我觉得本质上就是 AI 管 AI, 那 AI 管 AI 的产品到底该怎么做 , 该怎么发展 。

我觉得这个是可能今年最值得期待的一件事情 。

曲凯55:14

挺好 , 非常期待你新产品 。

结尾55:14

王文锋55:16

好 , 谢谢曲老师 。

just

one more day,maybe we'll get itright。