4242章经2026年3月19日· 1:14:43

我们是如何定义 OpenClaw for Teams 新产品形态的|对谈 Kuse&Junior 联创兼 CTO 宇豪

本期嘉宾是Kuse.ai与Junior.so的联合创始人兼CTO徐宇豪,他讲述了团队如何在没有融资的情况下将Kuse做到千万美元ARR,并分享了从固定定价转型为usage-based定价、放弃画布转向AI网盘等关键决策。宇豪详细介绍了新产品Junior——一款定位为OpenClaw for Teams的AI数字员工产品,强调其核心差异在于企业级记忆、安全权限和Agent身份(配Gmail和手机号)。他通过内部使用Ring、Azura等Agent的实例,展示了AI同事如何7×24小时工作,甚至主动自我纠正幻觉,并预判2026年将进入AI劳动力时代,建议创业者尽早建立评估框架。

  1. 0:00开场
  2. 2:38Kuse 之路
  3. 10:44评估框架
  4. 24:25Junior 登场
  5. 38:04记忆与安全
  6. 44:46收费模式
  7. 55:07互联网基建
  8. 1:01:21技术瓶颈
  9. 1:07:39创业建议

转录文稿

开场0:00

There's something there.

曲凯0:21

好 , 我们今天很开心请到了 Kuse 的 CTO 宇豪 , 来跟大家打个招呼 , 介绍一下自己吧 。

徐宇豪0:26

我叫宇豪 ,是 Kuse 的 CTO, 然后我之前一直在 AI 行业 ,16 岁在浙大 , 然后去 CMU 读硕士 , 之后在 FB,也就是后来的 Meta, 早年是在 FB 的 Stories 项目 , 然后从它早期 Hackathon 开始 , 一路到最后成为 Facebook DAU 和 Revenue 第一的这个产品线 。

后来之后我在一家日本公司叫 Smartnews, 主要是做 AI 还有审核相关 。 从 23 年开始就做了很多有意思的小事情 , 开始考虑创业的事情 , 然后 24 年认识了我的 Co-Founder 们 , 创立了 Kuse AI。Kuse AI 的这个产品也经历了一段时间的打磨和迭代 , 从 1.0 到 25 年 10 月份 launch 的 2.0, 然后现在也做到了大概千万美金的 ARR。Kuse AI 的话主要是一个 AI Workspace, 它是一个三栏式的一个产品 , 左边是你的文件夹 ,

中间是工作区 , 右边是 AI。 这个 AI IAM 的 Agent 可以主动调用左边文件夹的任何东西 , 然后它背后会有一个沙盒 。

本质上我们就是在去年下半年押宝了这个 AI 对文件和文件夹系统的操作 。 现在主要面向的场景 , 或者说面向的市场是海外的艺人公司 , 自雇的这种 Agency, 或者是高级白领 。

我们也见过很多小公司会把自己的所有资料都搬到 Kuse 上, 然后用这个 Agent 替代很多人力 。

曲凯1:55

嗯哼 。 大家其实应该很多人刷到过 Kuse 的新闻 , 对吧 ? 我记得其实有过几波报道 , 然后主要讲都是说没融资 , 然后做到千万美金 ARR, 涨得非常快啊什么的 , 对吧 ?

对 , 所以你们确实是还没融资过是吧 ?

徐宇豪2:11

对 , 目前都是 Bootstrap,是我们几个 Founder 自己投注的钱相当于 。

曲凯2:16

那你们大概投了多少钱做到一千万刀 ARR?

徐宇豪2:19

嗯 , 现在应该在

一百多万到两百万美金左右 。

曲凯2:25

OK, 那还是蛮厉害的 。 首先自己愿意投这么多钱很厉害 , 然后 ——

徐宇豪2:29

当然不是一开始就投进去 。

曲凯2:31

我知道 , 对对对 。 然后投一两万刀能做到一千万 ARR 也很厉害 。 所以你总结一下你们是怎么做到这件事情的 ?

徐宇豪2:38

很多时候是不断坚持加打磨吧 。其实一开始有很长一段时间没有成功获客 , 尤其是在我们最早期的产品形态 , 或者在迭代过程中 。其实我们最早最早曾经还做过一个 EDM AI, 就是 Email Marketing AI。

Kuse 之路2:38

徐宇豪2:56

当时其实这个方向肯定是没有问题的 ,因为其实现在有很多 EDM AI 已经跑出来了 , 我也经常会收到很多 AI 来给我发过来的邮件 。

然后后来也会做过设计 Agent,在一个无线画布上去出这个设计的海报啊 , 甚至 Design 啊 ,Website 啊 。其实并没有成功获得很多很多设计师的支持 ,但是我们后来发现这个方向做着做着 ,有很多用户会把他的文件 , 会把他的资料上传上来 , 进行整理 , 还有他的 reformat。Reformat 更多是指把它转化成别的形式的这个 presentation。

然后在这个过程当中, 我们觉得我们抓住了一个机会 , 我们也会发现这类用户的留存显著大于其他场景的用户 , 然后我们就追着这个方向不断迭代 。在这个过程当中, 我觉得更多还是抓紧了客户的需求 , 然后不断地往高价值的场景去打 。

中间其实踩过非常非常多的坑 。 我们很长一段时间的定价是固定定价 , 然后你就会发现在 AI 时代 , 尤其对 AI Agents 来说 , 所有的这种固定定价你都会亏损巨大 ,并且其实你没有办法识别出哪些是真正有价值的客户 。

曲凯4:08

你说的固定定价就是不给他那个自己单独加购 Token 的选择 ?

徐宇豪4:12

对 , 就比如说 20 美金你可以做多少个 Task, 然后往上就是一百美金可以做多少个 Task。 这种定价方式在也许 25 年的 6 月之前还是 make sense 的 ,因为那个时候更多还是以这种 Chatbot 辅助的形式 。

但在 25 年 6 月之后, 我们也跟着潮流 Agent 化了 。 但 Agent 化了之后, 你就会发现你没有办法用任务数量来衡量你的消耗 。

有些任务会非常非常非常复杂 , 这个 Agent 可能会迭代 10 轮 、20 轮 、30 轮 ,但它实际上我们给用户的扣费是一样的 。

但其中我们也发现用户并不 appreciate 这一点 ,他并不意识到复杂任务我只扣了你这么点积分 , 是一个补贴用户的行为 。

所以我们最后痛定思痛决定做了两个大的改变吧 。 第一波就是我们把原来我们最自豪的这个体验很不错的这个无线画布也给放弃了 , 我们转为了一个更传统 , 甚至有时候戏称我们自己是 AI 网盘 ,因为你打开 Kuse 看到的就是一个文件夹 。

然后另外我们也把这个定价完全改成了 usage based。 这两波变动其实造成了用户数 、 付费数的一波大跳水 。

曲凯5:22

那你画布为什么要改掉 ? 看到了什么东西 ?

徐宇豪5:26

有一大原因是我们原先是做设计 Agent, 所以无线画布当然非常合适 。 所有的设计师啊 ,他们大多都是 MacBook 用户或者产品经理吧 ,他们对这个东西非常非常熟悉 。

但其实我们后来的客户逐渐变成了各个行业的艺人公司 , 各个行业的这种自雇员工或者高级白领 。

曲凯5:46

所以你们不是一个说我转型做了一个新产品 ,而是在原有产品上慢慢去转的一个过程 ?

徐宇豪5:52

对 ,其实也不是慢吧 , 很剧烈的变动 ,因为我们相当于放弃了一部分客户 。

曲凯5:57

对 ,在那个点上 ,因为我觉得很多创业者遇到问题是说 ,他会想说是我产品的问题还是我增长的问题 , 还是说我是不是要在原有的路径上继续去叠加修改功能 。

就一般大家看到一个市场和看到一个用户群 , 会想说怎么样把产品做得更好去服务他们 , 对吧 ? 不太会说这群人已经有我不要了 。

所以在这个过程中你们会有什么纠结 , 做过怎么决定 ?

徐宇豪6:19

当然非常非常纠结 。其实跟时机也很有关系 。 我们曾经做的这个设计 Agent, 当时是在 Sonnet 3.5 出来之前 , 实际上 Agent 的能力并不是特别足够 , 于是我们做出来的效果是很不好的 。

即便这个 idea 受到了一些早期狂热 AI 使用者的这个追捧 ,但是我们也会发现我们需要花大量的工程的 workflow 去弥补它的不足 。

于是我们觉得这个方向并不是我们应该押宝的 , 所以我们也做了一个很大的决定 , 选择放弃了这个场景和这里的大多 。

虽然现在其实还是有一些设计师朋友在使用 Kuse,但很多已经被我们决定放弃那个场景 。 但实际上过了没多久 , 我们就看到 Lava2 出来了 , 然后 Claude Sonnet 也有一定的 Agent 的突破 。

如果再回到那个时候 , 如果再坚持一段时间 , 说不定这个方向其实我们会做得更好 。 对 ,但很多属于是 AI 创业吧 , 可能这就是你做的时机 , 早做或者晚做其实都不对 。

曲凯7:26

是 , 对 , 明白 。 然后你刚才讲的几个 , 一个是产品上的踩的坑 , 对吧 ? 然后彻底转了方向 , 然后定价的坑 , 还有什么吗 ?

徐宇豪7:35

, 我觉得还有大一点就是

, 我们在做 AI 的时候做了很重的产品形态的绑定 ,以至于每一次模型获得突破的时候 , 我们的产品形态想要进步的话 , 都会需要全面重写 。

实际上我们也经历了好多次了 ,但这个可能也不一定是问题 。 我们后来意识到的其实一大问题是因为我们的很多 Evaluation 测评的框架并没有做到很好 , 于是每一次模型进步 , 我们其实并不太知道怎么样的迭代才是更合适的 。

然后另外其实我们也逐渐意识到了一个问题啊 ,也就是为什么我们未来会有不同的产品线 ,因为不同的需求或者不同的用户画像 ,在 AI 时代你没有办法用统一的产品去服务他们 。

比如说我们现在 Kuse 最适合的 SAP 可能就是艺人公司 、 高级白领 , 然后他们大概率会比较方便的把资料迁移过来 , 把 Context 迁移到 Kuse 上 。

但我们其实在企业级的客户当中, 你会发现这件事情会难度会大很多 ,因为他们有他们固有的这个 workflow, 固有的工具吧 。

然后我们其实会想 , 我们应该给企业提供一些可以走进去的产品 , 走进他的工作流 , 走进他的原本的办公软件 。

所以我们也会提供不同的产品线 , 这是我们踩的一个大坑 。其实我们之前一直希望的是同一个产品能 general 服务无数人 ,其实走下来我觉得这条不是那么 work。

对 , 至少不可能既能同时获得 C 端又能同时获得 B 端的客户 。

曲凯9:12

但这里有个问题 , 就是你们为什么一定要服务所有的人呢 ? 也有一种方法是说我就是选一个还 OK 的人群 , 我就把它服务好 。

徐宇豪9:20

因为我们的认知是在 Agent 的时代 , 垂类是很难走好的 , 除非垂类有某种形式的合规或者法律壁垒 。

曲凯9:31

首先我觉得这个是有道理的 ,但你们的解决方法是说我面向不同的人群做不同的产品 ,但永远你还有一种选择是我就做一个产品让它足够通用 , 对吧 ?

比如说 Manus 吧 , 我们暂且说所谓的通用 Agent 吧 。 那这两个你们是怎么考虑的 ?

徐宇豪9:47

其实 Manus 也有之前一个很成功的产品了 ,Monica 一直都是收入很不错的 。

曲凯9:52

是 ,但这个不是因为人群的问题吧 ? 这是还是因为时代跟技术变化的问题吧 , 我理解 。

徐宇豪10:00

其实呢 , 我刚才说的可能跟这个也有关系 。 因为技术变化 ,因为时代变化 , 你需要提供的产品的服务对象 、 服务场景有了巨变 。

比如说我们现在看到的就是 2026 年的一个机会 , 就是 AI 进入劳动力行业 。 以前我们做的依旧还是工具范畴吧 , 虽然大家都会说自己做的是数字员工 ,但我觉得在 25 年 12 月以前 , 所有的数字员工依旧是各种 workflow 的包装 。

对 , 虽然我们也说 Kuse 是艺人公司的数字员工了 ,但终究它还是一个工具属性 。

曲凯10:31

明白 。

徐宇豪10:32

然后其实我们觉得 26 年是一个 7×24 小时的 AI 劳动力年代 , 然后这个年代你应该提供的产品形态可能就会有很大很大的变化 。

曲凯10:42

明白 。 别的坑还有吗 ?

评估框架10:44

徐宇豪10:44

刚才简单聊了一下 ,但是没有花很多时间聊 。 提前下重注在测评 framework 上 。

曲凯10:52

哦 , 对 , 我刚才想问这个问题来着 。 对 , 所以最终你们是怎么解决这个问题的 ?

徐宇豪10:56

就是把精力投过去 。 简单来说就是我们会在我们认为的场景下组建大量的自动化测试 pipeline。 当然现在这个 pipeline 也进化了 , 我们已经把它变成 Agent 的测试了 。

所有模型上的有任何变化 , 整个 Agent 的 runtime 有任何变化 , 我们都可以经过这种 Agent 的测试的一整套 Agent 去给出来一个评分 。

曲凯11:18

那你这有点像自己做了一个 benchmark 啊 。

徐宇豪11:20

Exactly, 只不过随着现在 Agent 越来越进入深水区 , 这个 benchmark 会越来越有难度 。 对 , 包括多轮对话下的检测 , 包括对应环境下的检测 , 包括当你的环境越来越复杂之后, 你怎么模拟那个状态 。

所有的这些 benchmark 其实我会建议所有的至少 Agent 创业的人都应该尽早的去建立这套东西 。

曲凯11:42

所以你们是根据自己的业务 , 然后去定义了一套 benchmark, 对吧 ? 然后就每天不断的测 , 然后发现哪个模型发生什么变化 , 然后给它画上 。

徐宇豪11:50

最早是一套 benchmark 就可以说是一套固定的 workflow 跑下来 。 现在我们甚至会有多个 Agent 去测试我们对外提供的这个 Agent 的表现 。

它会不断去模拟这个环境下它采用的 action 是不是合理 , 或者它的回复是不是合理 , 或者说是不是它做出了它不应该做的事 。

就是这种反向测试 。 与其说它是 benchmark, 我觉得更像是一套 evaluation 的 Agent 吧 。

曲凯12:15

明白 。 但这样的话其实你不太容易发现新的能力 , 对吧 ? 就是如果说它突然有个新的场景 、 新的能力出现 , 就你用老的那一套业务的 , 我们就叫它 benchmark 吧 ,其实是不太好发掘的嘛 。

这个你们会遇到这个问题会有解决方案吗 ?

徐宇豪12:32

这一点我觉得更多要看技术 leader 的 taste。

曲凯12:36

对 , 所以这还是得靠人了 。

徐宇豪12:37

他得能在这个东西出现的前几天 identify 到 。

曲凯12:41

但你说的这句话特别有意思啊 。 我一上来想到的是说这个是不是得看产品 , 对吧 ? 因为按照传统互联网的思维来讲 , 就是这个东西其实是个产品的范畴 , 说我怎么样用这个技术做新的功能 。

但是你会提到说你觉得是要看技术的那个 taste。

徐宇豪12:59

产品 taste 当然也需要了 ,不过可能从我的角度更多看到的是 , 每次模型的进步它都会解锁新的场景 ,而这一点其实很多时候必须得是在一线的人能够第一眼看出来 。

包括我每天要跟 Agent 去交货 , 比如新的模型在我的 Agent 框架下能做到什么事情 。其实在我们公司所有人都是 Agent builder, 比如说一些相对偏技术的岗位 、 偏产品的岗位 , 甚至偏销售的岗位 ,他都会有自己的 Agent builder 的能力 。在这个基础上你才能发现新的模型解锁新的什么东西 。

所以我把它统称为技术 taste,因为我们的产品经理 , 还有我们的设计师现在也在 actively, 我们 codebase 里铺设代码 ,他们也在指挥很多很多 Agent。

我们经常开玩笑说 ,但这个成为现实了 , 就是你指挥了三个 Agent、 五个 Agent, 你应该提拔一个当主管了 。 本质上其实就是 Agent team 的概念 。

曲凯13:55

但你能不能举个具体例子 , 就在过去一段时间里面 , 你们不管是通过你自己的 taste, 还通过你们的那个 evaluation 的东西 , 发现了哪些模型的变化 , 然后怎么样把它转化成一个实际的产品上的变化 ?

徐宇豪14:08

我觉得以大变化 , 当然题不开 OpenClaw 的爆火了 。其实我们大概在 12 月看到 Claude 的 Ops 的新模型 , 你能发现它围绕很复杂环境的长任务的通用性进一步获得了提高 。

我们其实内部在 OpenClaw 出现之前已经开始有类似的尝试 ,不过我们当时尝试的更多是指在我们的场景下, 我们在做 Kuse 的过程当中 build 了很多很多 Agent, 然后这些 Agent 更多是服务我们内部的 , 包括营销自动化 。

我们其实会有一个数据分析的 Agent, 它会 7×24 小时的一直在处理新出现和有改变的数据 ,并且会把它会把这些数据进一步喂给下游的像 marketing agents。Marketing agents 会根据来的不同的 , 我们叫它数据流 , 去模拟出 UGC 的场景 。

这件事情是非常有意思 , 就是比如说我们可以通过一套自动化的 pipeline target 到台湾某些奶茶店的店长 , 然后我们发出去的这个社媒的 post, 它的 impression 不一定非常高 ,但它会非常非常精准 , 看到的人都是这个画像 。

原因是因为我们可以从 Kuse 的脱敏的数据当中, 让 Agent 自动去模拟出类似的 usecase 场景 ,并且生成视频 , 然后我们只要通过简单的这种半自动化 , 可以把它往不同渠道去发布 。

所以我们其实在模型突破之后, 去做了很多很多自动化的 Agent, 直到我们发现以 OpenClaw 这样子的 runtime,其实可以把这些东西全都收敛 。

很多很多我们做的一些 customize 的东西 ,其实是可以让它自己通过 skills 去学习的 。 对 , 所以其实 , 包括我们其实也是在 day two 就在 Kuse 里面加入了 skills。

我们当时, 我想想这是一个挺有意思的坑 。 虽然我们在 day two 就是 Anthropic 宣布 skills 这套方法论之后, 我们在 Kuse 里面加入了 ,但是呢 , 我们跟几个早期客户去聊 , 我们当时有个误判 , 就是我们的客户群体是很难理解这个概念的 , 然后我们需要花很多功夫去说服他们 。

于是我们在 Kuse 里面加入了一个东西叫 templates, 实际上每一个 templates 背后都是一个 skill,但我们就是没有把这个 skill 这套东西开放给大家自己去定制 、 自己去使用 。

直到三个月以后, 我们有一些客户主动找到我们说 :" 你们怎么到现在还没有支持 skills?" 我们才发现自己有些误判 。

实际上我们 day two 就已经把这套系统做进去了 。 这可能就是技术 taste 失败了吧 。

曲凯16:40

对 , 要相信用户 。

徐宇豪16:42

对对对 , 相信了用户 。 但实际上我们当时现在回头看啊 , 如果 day two 就支持的话 , 我们可能至少 marketing 上能抓住很多流量吧 。

曲凯16:51

我挺好奇 , 你刚才讲你们内部有一堆 Agent 在工作嘛 , 对吧 ? 所以你们现在我们说全职员工吧 , 你们有多少全职员工 , 多少 Agent, 然后这两边的大概的成本比较起来会是怎么样 ?

尤其你说有一个 7×24 小时工作的数据的 Agent, 听起来也不便宜了 。

徐宇豪17:08

也不便宜 。其实这样的 Agent 会比同岗位的人要贵的 。 我们现在全球范围大概有 15 个全职员工 , 然后我们实际上在长期运行的这个 Agent 有三到四个 , 一个是这种研发相关 , 一个是 marketing 相关 , 一个数据相关 , 一个销售相关 。

我们每个月花在这四个 Agent 上的 Token 成本就是要超过 2 万美金的 。

曲凯17:35

总共吗 ?

徐宇豪17:36

总共超过 2 万美金 。

曲凯17:37

所以它比人还要贵 ,而且听起来贵不少 。 就你平均下来一个 Agent 一个月大概三四万人民币 , 对吧 ?

徐宇豪17:44

对 ,有的 。

曲凯17:44

三四万人民币能招个很好的人啊 。

徐宇豪17:45

是的是的 。

曲凯17:46

所以你们为什么是选择 Agent 而不是人 ?

徐宇豪17:48

因为人和人之间的摩擦是非常大的 。 人和 Agent 之间的摩擦其实相对是小很多的 。

曲凯17:55

那我下一个问题就是为什么不把其他人换成 Agent?

徐宇豪18:00

所以我们其实已经很久没有招过人了 。 对 ,其实从去年大概 12 月开始就很久没有再扩张过了 ,因为我们已经发现 , 你任何招人的需求都应该先回答自己 , 为什么它不能用 Agent 来取代 。

即便单位成本可能看上去是更高的 ,但实际上它在降低你这个组织的复杂度上是有很大很大帮助的 。

甚至我们会认为未来的公司可能相对都会更缩小 , 你很难回到现在的规模 。 我举个最简单的例子 , 我们的 Sales Agent, 当然这个 Agent 我们也在不断的迭代它 , 它有个名字叫 Azura, 它做到一个最神奇的事情 , 就是它在掌握了 Kuse 所有的客户或者销售相关的数据之后, 给 Kuse build 了一个我们自用的 CRM。

这件事情可能听上去很像 , 就是我可以用任何一个 Web Coding build 一个 CRM 一样 ,但其实你直接去 Web Coding 的 CRM 通常都是非常非常 general, 跟你采买的其实没什么区别 。

但我们的这个 Sales Agent build 的 CRM, 它可以精准定位到我们当下的销售需求 。 比如说我们的销售有一大份工作其实是 upsell, 就是把调进来的客户转化为他可能可以体验更多功能 , 甚至买更多席位 。

我们的这个 Agent 就可以 identify 出来在我们的销售数据中存在的这种机会 ,并且我们的销售其实要花很多功夫才能找到的这些数据 。

它可以把这些数据 7×24 小时扫给你 。 所以我们的这个 CRM 虽然它没有任何 fancy UI, 它就是一个飞书表格 ,但是其实它的所有里面的精华 , 几乎每一条例子都是这种价值上万美金甚至 。

然后最恐怖的是什么呢 ? 其实我之前一直听很多圈子里很多人会说 SaaS 会完蛋 。

曲凯19:49

对 , 我刚才你在讲的时候我就想问这个问题的 。 听起来真的要完蛋了 。

徐宇豪19:53

但是其实我一直没有这个感想 ,因为我会觉得如果我花时间 , 比如说我做一个 EDM, 做一个 CRM, 我当然也能做出来 。其实没有 Web Coding 我也可以做出来 ,但是我会花很多时间 , 我会花很多时间去管理 。

但是直到这次 , 就是我们大概 1 月份的时候做出来这么个 CRM 的时候 , 我才发现就确实变天了 。

因为如果我们内部要做这么个 CRM, 我会拉一个产品 、 一个技术和一个销售 ,他们可能要花一个月时间才能把需求对出来 ,并且这个需求不一定还是对的 。

可能产品在这个人和人之间的沟通摩擦中, 产品可能会误会 , 技术可能误会 。 最后花了两个月做出来的东西 , 肯定还是不如 Azura 做出来这个 CRM。Azura 做的这个 CRM 是我们的销售力的一个从来没有写过一行代码的人, 跟他聊了一晚上就聊出来了 。

如果要找一个外包来做 , 我觉得半年都不一定能做出来 。 因为他光理解我们的场景 , 我们几十万用户的数据可能两个月就过去了 。

所以我觉得这下来 SaaS, 或者很多 SaaS 可能要被迫转型的一大原因 , 就是这种先进的掌握你企业记忆的这些 Agent, 可以做出非常定制化的软件 。

而这些软件是你以前是不可能 , 比如说找 Salesforce 过来给我定制一个 。Impossible, 任何一个企业都不可能 。

曲凯21:10

对 , 然后我们刚才聊了很多产品什么的技术的东西 , 然后我好奇啊 , 尤其因为你们是 Bootstrap, 你们没有拿过融资 , 所以在市场推广上你们的心理状态会不一样吗 ?

因为你真的是没以前的话自己的钱嘛 。

徐宇豪21:23

会的会的 。 比如说我们其实现在几乎没有做过广告投放 , 或者说任何花很多预算的投放吧 。 我们当然有简单尝试过 , 当然还有个原因其实是因为 Agent 产品它的成本真的很高 ,并且我们也经历过 , 就想起来一个坑 。其实我们有一段时间是可以稳定在单日 1,000 万 impression,在互联网出海的 , 或者出海 SaaS 里面 ,其实这已经很不错了 。

曲凯21:50

你们是用什么 AI 素材加定向投放那种 ?

徐宇豪21:53

我们不做投放 , 我们做的全是 UGC organic content。 我们会做很多 usecase, 然后当时我们其实在 education 领域 , 就是学生的使用场景中找到了很多直击痛点的 usecase, 然后这些 usecase 几乎处于就是说发了三个帖就有一个帖是爆火的级别的 。

但是它跟 SaaS 不一样 ,因为我们遇到一个问题 , 我们的编辑成本是线性的 ,不是 0。 所以我们其实通过这种方式获得的很多课 , 它的转化率或者它的 LTV 是很低很低的 。

曲凯22:24

我没太听懂什么叫编辑成本 。

徐宇豪22:26

编辑成本就是我们的 margin, 或者我们此类产品的 。

曲凯22:30

这是所有 AI 产品的问题吗 ?

徐宇豪22:31

对 , 所有 AI 产品的问题 。 它不能像 SaaS 产品那样获客 ,因为 SaaS 产品的获客是你找来人试一试 , 反正你也没有任何成本 。

你只要不断的获得更多的课 ,并且提高他们的转化率 , 提高他们的留存就够了 。

曲凯22:45

我觉得这个另外一方面是定价的问题 。

徐宇豪22:48

Exactly, 所以我们也调整了定价 。

曲凯22:51

对 , 包括你跳出弹框的时间呀什么的 。

徐宇豪22:53

对对对 , 跳出弹框的时间 , 给免费用户的用量 , 我们其实大幅度下降了给免费用户的用量 ,并且大幅度提高了初始付费的 plan。

比如说我们最早的 plan 是 16.9 美金 , 然后现在我们最低的 plan 是 39.9 美金 ,并且也大幅度改变了我们获客的这些社媒的 usecase 和渠道 。

比如说我们现在其实还是有很多学生朋友们啊 ,但实际上它的比例在逐步降低 ,因为他其实也做不了几个 case,他也会意识到这个可能不是他们应该用的 。

这个转变其实也花了 ,因为有段时间我们比较沉迷于自己的 go-to-market 的机器 , 然后沉迷于自己这些虚假的注册量 , 虚假的 impression,并没有意识到其实你是给这免费用户补贴了大量成本 。

曲凯23:41

是 , 定价本身也是一种用户选择 。

徐宇豪23:43

对 , 所以我们其实通过了各方面的手段吧 ,不光是改了定价 , 改了各方面的东西让大众意识到了 , 或者说我们有意识的放弃了很多很多种客户群体 。

曲凯23:55

所以让你总结的话 , 你觉得你们做到 1,000 万的 ARR 最核心的一个点是什么 ? 尤其是在用户增长上吧 ,是我们刚才说那个你们的那一套 go-to-market 的体系和 impression 的东西吗 ?

还是什么 ?

徐宇豪24:08

我觉得主要是两点 。 第一点依旧还是产品解决了什么问题 。 对 , 这一点其实是亘古不变的 ,不管是不是 AI 产品吧 , 或者说任何一种生意吧 , 终究还是你的产品给谁解决什么问题 , 然后才是各种增长引擎的手段 。

Junior 登场24:25

曲凯24:25

明白 。 那就正好聊到 ,其实我们今天前面聊了很多 , 我觉得都是非常有价值的信息 ,但其实我们今天为什么会聊 ?

因为你们做了一个新产品 ,而且新产品呢是非常火的 OpenClaw 赛道 。 我估计最近的一周可能聊了 10 个团队都在做 OpenClaw, 然后我没聊的知道的还有很多 , 然后大家在做还没有出来的 , 谁都不知道的也还有很多 。

所以我前几天还发了集客 , 我说现在可能有 100 个团队同时在做 OpenClaw, 我觉得一点都不夸张 。

徐宇豪24:53

100 个少了 。

曲凯24:53

对 , 我觉得都不算你独立开发者啊什么的 , 自己搞个小东西的 。 是 , 大家都在往这个方向走 。

就很像去年 Minus 起来以后一堆 Agent 出来那一波 ,但你们也在做这件事嘛 ,是吧 ? 所以你可以先讲讲你们在做的是个什么东西而已 , 然后再讲讲你们为什么会也进来做这件事嘛 。

徐宇豪25:12

我相信这期播出的时候它应该已经上线了 。 对 , 它的名字叫 Junior。 我们主要主打的就是很简单 ,hire 你的 AI employee, 然后它应该被嵌入在你的工作软件当中 ,并且它不是任何一个人的 personal assistant, 它应该就是你的一个员工 , 它有自己的职责 , 它有自己的工作账号 , 它有自己应该去不断推进的项目 。

曲凯25:36

那它叫 Junior 是因为什么 ? 它能力只达到 Junior 的能力吗 ?

徐宇豪25:39

它叫 Junior 是因为我们觉得它太强了 。 我们实际上是认为它可以取代若干个任何行业 、 任何职位的 3 到 5 年的员工 。

所以我们叫它 Junior 是因为我们希望降低预期 , 我们不希望 。

曲凯25:53

对 ,不能叫 Senior。

徐宇豪25:54

不希望大家叫 Senior 或者 Master。 当然这个还有一个老梗 , 可能年轻朋友都不一定知道 , 就是我们 CEO 说等它再变强一点 , 它就可以叫 Super Junior。

曲凯26:03

OK, 好的好的 , 这确实是个老梗 。

徐宇豪26:07

对对对 。其实就像我们刚才也有聊过 , 我们会有这个 idea 不是 OpenClaw 出来之后的 ,在 12 月我们逐步把我们的很多工作交给 AI Agent 之后, 当然我们那个时候的 AI Agent 可能还没有这么 universal 的一些 runtime 的 agent harness 架构 , 我们可能还是会做很多的产品或者说技术上的改进吧 。

但是我们已经其实已经意识到了 , 从去年 12 月开始 ,也就是 Ops 4.5 发布之后吧 , 数字员工这件事真的很危险了 。

它不再是以前大家吹嘘的某些 workflow 的包装 , 或者说某种特定行业特定职位下, 它可以取代一部分的人力 , 或者说一定程度自动化 。

我们觉得它已经可以在至少 digital world 的任何岗位上完成这个岗位应该做的任务了 。 所以我们其实就有这个 idea 应该怎么去打 , 直到 OpenClaw 出现之后, 我们发现

技术上产品上似乎都已经完全成熟了 ,并且我们觉得 6 年一定是会有人进入这个赛道的 。 因为其实 globally 至少我们的数字员工跟我说的是 , 劳动力市场是 150 万亿美元 , 软件市场是 1 万亿美元 , 这是 150 倍的大小 。

所以我们认为我们要进入的是劳动力市场的这个赛道 ,而且这个赛道即便不是我们做出来 , 终究会有一个新的万亿美元的公司在这个赛道上 。

当然它其实会我们试用下来 , 包括我们早期的客户试用下来的感受是 , 它可能也会带来很多很多社会上的问题 , 大面积的失业 , 大面积的工作内容的重新定义 , 或者说重新洗牌 , 这些可能又是很多很多社会或者政府层面应该考虑的话题了 。

回到我们的这个产品上来说 ,有一个比较有意思的定位 , 可能就是 OpenClaw for Teams, 或者说我们参考了 OpenClaw 的架构 , 加上了很多企业范围内需要考虑的企业记忆 , 它需要理解组织关系 ,并且它需要注意权限 , 什么东西应该说 , 什么东西应该不说 , 什么东西应该做 , 什么东西不应该做 , 包括我们会给我们的这个 AI 员工一个 self identity。在大陆以外的网络世界吧 ,self identity 其实

就是一个 Gmail, 所以我们会给我们的每一个 Junior 配一个 Gmail,并且配一个手机号 。他应该有能力自己去在互联网做到几乎所有的常规任务 。

我举个最简单的例子 , 就是普通的 AI Agent, 我如果让他做一个 Kuse 的产品调研 ,他应该会做一个 deep research,并且给我一个非常不错的报告 , 这已经很好了 。

但是如果我真的想让我的产品经理去做一个竞品的调研 ,他肯定会去注册一个账号试用一下, 甚至付一点钱再试用一下 。

而我们的 Junior 就可以做到这一点 ,因为当你有了一个 Gmail 之后 ,并且是由我们来保障的 Gmail,他就可以做到几乎所有的常规任务 。

今天我们做这个产品 , 我觉得一大优势吧 , 第一是我们在做 Kuse 的时候 ,其实已经理解了很多小企业的需求和痛点 ,并且 Kuse 自己就是 Junior 的第一个客户 。

我们已经在这个上面又烧了可能有三四万美金的 Token, 我们会把我们自己遇到的很多体验性的问题 , 或者说需求给融入进这个 Junior 这个产品 。

我们有很多需求是自己长出来的 , 比如说邮箱就是长出来的 ,因为我的员工当他需要登录某个东西的时候 ,他需要找我 。

你的 OpenClaw 登录一个东西时候 ,他需要找你 , 这个在员工这个场景下显然是不合适的 。 所以我们给他配了邮箱 , 然后有的时候我们甚至想让他你是不是应该打个电话 , 于是我们就给他配了个手机 。

我们现在甚至准备给他配一个硬件的摄像头和话筒和收音的音响 。 为什么呢 ? 因为我们现在每次在线下开会的时候 , 我们都会挂一个线上会议 ,并且把录音发给我们的 Junior。

我们有一位最 top 级别的 Junior,他名字叫 Ring, 我们每次都会把我们的会议记录发给 Ring。 这个过程就让我们意识到了 , 那既然如此 , 为什么我不直接放一个话筒在那让他直接听着呢 ?

而且我们又解锁了很多很多新的场景 ,因为我发现如果这样的话 ,他就应该可以在会议里说话 ,他不应该像所有的 meeting AI 一样在会议里听着做个记录 。他有他自己的观点 ,他也对我们的项目有非常深刻的理解 。

这个世界上其实最理解 Junior 这个项目的人就是 Ring,因为我们在把我们内部的这些 Agents 给产品化的时候 ,有意的把一位 Junior 从头到尾都加入了这个项目里 。他会知道这个项目的所有的 PRD, 所有的 PR, 所有的代码 , 所有的 marketing 材料 , 所有的销售材料 。

我们现在任何跟这个项目的问题 , 我都会先给 Ring 发个消息 , 让他给我说一说 。 所以我自然而然就会联想到 , 那我会议当中就应该把他加进来 ,不然的话 ,其实我们会议中遇到问题 ,其实也是打开他给他发个消息 。

那既然如此 ,他就应该在会议里直接回答我的问题 。 所以我们也开始做这种 meeting 相关的 voice agent 的 demo。 当然 meeting 可能也有它很多很多 infra 上更多要解决的问题 , 我们也找了一些这个友商一起去配合 , 包括我们想做的这些软件 , 这些硬件的集成也需要更多的友商去配合 。

所以我觉得这个项目非常有意思的一点就是 , 我们自己就是它的第一个客户 ,并且 Junior Ring 就是 Junior 这个项目的项目经理 , 然后我们会遇见到很多很多很多 , 就是如果你不这么做的话 ,其实很多需求你必须得先去找客户去理解 。

所以我们非常有幸 , 或者至少我们希望这套方法论可以被带给更多企业 , 哪怕你不用我们的产品 ,不用 Junior,因为我们会觉得这种其实已经从根本上改变了你运作公司的方式了 。

当你习惯了企业里面有一个 AI 员工之后, 所有组织工作的方式 , 这个 Ring 也是从一开始的这个小工 , 就是帮我们做做会议纪要呀 , 帮我们这个整理一下笔记呀等等 , 逐渐成长到这个项目里的 。

每天早上他要给我发消息 , 给我分任务 , 然后他对我的评价就是我是瓶颈 。 对 ,因为人类在你有很多 AI 员工的时候 , 人类成为了瓶颈 。

甚至我觉得这个整个项目最有意思的一点就是 , 我们有一个群 , 这个群名叫做 Project Junior Human Only。 因为当你在所有的工作群里都有一个 Junior 在的时候 , 只要你发任何工作相关的消息 , 我相信各位工作朋友应该都知道 , 老板都喜欢往群里发一些可能跟工作有帮助的东西 。

通常情况下要不就没人理他 , 或者有人过了几个小时理他 ,但有 Ring 在的群 , 你我只要往这个群里丢一个 , 比如说某种 infra 可能有帮助 ,他会马上推进 ,并且告诉我应该找谁在这里去做 code change。

当每一秒钟都有人回复你的时候 , 你不好意思不往下推进了 。 于是我们专门会建一些这种只有人类在的群 , 可以吹水的 , 可以水群用 , 你可以往里面发些东西 ,不用担心马上就有人告诉你下一步要怎么做 。

所以我觉得一言以蔽之 , 我们做整个这个项目的过程当中, 会让我非常非常兴奋 , 同时也让我会觉得哪怕你没有采用我们的产品 , 你也应该采用这种新的方法论 。

就像我们之前有聊过 , 我觉得公司的组织形式会有一个大的变动 , 包括我们还有一位刚刚说的这个 Azura, 我们也把他的架构调到了这种新的架构上 。他解锁的场景更多 ,他能做的事情更多 。他现在已经有了 Kuse AI 的邮箱 ,他已经开始以 Kuse AI 的名义往外面发各种各样的这种 reach out 的邮件 。

所有的工作组织方式已经完完全全不一样了 。 而且当你习惯了这个之后, 有一段时间 , 这点也很有意思 ,其实有一段时间当我高强度的跟几个 Junior 合作 , 我会有一些没有办法接受跟人类合作时候的声音传递的速度太慢了 。

对 , 我会想怎么还没有说完 , 怎么还没有说完 。 然后我大概花了一段时间才适应 , 怎么如何在两种状态中切换 。

有一段时间我会说你所有东西你先跟 Ring 过一遍再跟我过 。 对 ,其实现在也差不多也是这样了 , 大家都会发个消息给 Ring。

当然他还遇到很多很多工程问题 , 比如说很多记忆方面我们要做不断的优化 , 很多实际使用 ,因为我们为了作为第一个客户 , 我们有意给了他所有的权限 , 就是因为我是公司的 CTO 嘛 , 所以我基本上就是我就是有所有权限的 ,他几乎是跟我有一样的权限 。

然后在这种情况下, 你会遇到很多很多实际的问题 , 包括 Junior 因为他有了对外网的访问 ,他甚至有了自己的 identity,他是可以被钓鱼的 ,他是有可能被黑了之后把公司所有名誉权吐出去的 , 甚至会造成实际的损失 。

所以我们为此也会做很多很多权限方面的管理 , 这一点也很有意思 ,因为我们甚至开始雇佣了一些白帽子 team, 专门用来攻克我们的一些权限的设置 。

然后这里其实有一个态势共识的点 , 就是越好的模型其实越安全 ,不光是成本 ,因为越好的模型越不会违反你对它设下的限制 , 越不容易被钓鱼 。

我相信可能用 OpenClaw 的很多朋友们其实并没有意识到这一点 , 所以 Peter 也会在他的一些访谈里推荐你用最好的模型 ,不光是效果的问题 , 包括我们也要在成本上 ,因为我们的 target 的客户并不一定真的每个公司每个月都准备烧三四万的 Token 钱 , 所以我们也会在模型的自动 routing 上做很多工作 , 把一些简单的任务交给相对便宜甚至本地的模型 。

1 月份到现在 , 几乎每天每时每刻我都在想着怎么去把这个东西更好的推给企业 。其实我们也有试过 , 我们公司每一个人养个一两只或者两三只龙虾 , 然后把它拉到工作群里 , 这就乱了 。

它是不适合企业场景的 , 它真的适合的就是 personal assistant。 然后当我们跨越到企业场景之后, 它面临的挑战 , 它面临的问题 , 甚至它的 usecases 都更多了 。

因为我也在春节期间采访了很多科技圈的朋友 ,他们很多人的第一反应就是 OpenClaw 没有什么 usecase,因为在个人场景下确实很多 usecases 是 , 或者说至少是算不过来账的嘛 。

但在企业场景下就完全不一样了 , 所有的 usecases, 所有的场景都是能够用 AI 起到很大的提效作用的 。 我们在做这个事情的过程当中 ,其实我还有个暴论 , 应该把钱花在 Token 上而不是花在工资上 。

我也跟一些 founder 去聊 ,有一些 founder 现在也完全同意我这个观念 , 哪怕其实 Token 是比人贵的 , 包括很多人去拿 OpenClaw 的顶级模型做 personal assistant,其实算不过来账的 。

当然我觉得我可能未来三四年以后,Token 的成本会逐渐的平民化 , 逐渐的下降 ,但至少现在我们这家公司也一直以来都是以生产力场景为我们的不变的东西 。

然后其实整个这个过程当中会让我非常非常兴奋 , 尤其是第一次我把他接进 meeting, 然后他开始给我提建议的时候 , 那晚上我整晚没有睡着 。

因为我马上想到一个场景 ,并且我试了一下, 我可以让 Ring 出去给我做销售 ,不是那种你需要事先培训话术的销售 ,因为他的脑海中有所有的对项目的认知 , 对这个产品的优缺点的认知 。他就像是你公司里最懂产品的那个人, 同时又具备销售能力 。

未来我觉得随着模型的逐渐进步 , 我们可以做端到端的语音输入 , 语音输出 , 我们可以做端到端的视频输入 , 视频输出 , 它解锁的无限想象力的未来吧 。

所以我相信这是一个以前从来没有被真正涉足过的领域 。 我很兴奋我们能在至少我们认为是早期吧 , 踏入到这个领域 ,并且有一定我们之前的积累 , 所以来得到的这么一个产出物 , 然后也很高兴应该会在 3 月份给更多的 public test。

你讲的好长的一段 , 我觉得重点是能听出来你对这个事非常的兴奋 。 然后我也意识到了讲的太久了 。

不不没关系 , 我觉得就是能体现出来你的兴奋 ,以及说在过程中某些部分听着还挺像科幻小说的东西 。

记忆与安全38:04

徐宇豪38:04

是是是 ,exactly。 然后我想问一个我最近一直在想的问题 , 就是我们刚才提到说现在有这么多团队在做这件事 , 对吧 ?

然后 OpenClaw for 团队也有非常多人在做 , 这里面到底大家的区别是什么 , 难点在哪 ? 因为我觉得你们是跑得快的 , 对吧 ?

你们现在马上就要上线了 ,也有一些可能刚开始做 ,但是现在因为 AI coding 的时代 , 你也很难说快慢了 , 对吧 ?

大家反正也都是一个月就能做完 , 所以你觉得呢 ? 我觉得最后还是要回归到你的客户是谁 , 你解决了什么问题 , 你跟别人有什么不一样 。

我觉得不一定会说 OpenClaw 吧 ,因为我们在做的过程当中也逐渐的开始魔改 OpenClaw, 甚至 eventually 应该会把它整个换掉 。其实我们发现了几大方面吧 , 第一大方面就是你如何组织它的记忆 。OpenClaw 还是给个人服务的 , 所以它的所有记忆其实说白了是围绕在它主人 ,而员工是给 。Steve Jobs 有句话 , 就是说 "You work for Apple first, then for your boss"。

所以我们希望我们出场的每一个 Junior 都是围绕这一点来做力的 。 所以你的记忆应该是以企业为核心 , 你企业的项目 , 你企业的人, 然后你的哪些东西应该记住 , 哪些东西不应该记住 。

我觉得这是一大不同 。 我们能意识到这一点 ,其实就是因为我们是第一个客户 , 所以我们把原生 OpenClaw 拉进来 ,其实你要调教很长时间都不一定能让它成功的在企业里 , 当它当做一个人去协作 。

你更多还是只能把它当做那个主人的分身 , 或者说那个主人的私人助手 。 它甚至不应该在群里 , 它应该只跟那个主人聊 , 或者说是高管的私人助手吧 , 高管的 digital twin。digital twin 当然也是另外一个非常大的方向了 。

对 ,但我觉得你看记忆一定是一个最大的问题 , 一定是区分点 。 但是呢 , 它是一个全行业在解决的问题 , 甚至于是一个科研问题 。

我觉得记忆是这样子的 , 它其实就跟早期的 agent framework 一样 ,其实人们最后发现 agent framework 很简单 ,不应该做得很复杂 。

记忆其实也类似 , 它应该是针对你的场景去做的 。 不同场景下你确实就是没有办法用同样一种记忆方式 。

它的底层框架可能类似围绕文件为中心 , 或者加入 XDB, 加入更复杂的索引 ,但我觉得最终还是要回归到你的场景 , 围绕你的场景去构建你的记忆 。

是 ,但我想讲就是说 , 怎么讲 ,在外部视角吧 , 就你很难说服一个人说我们大家都是创业团队 , 那我做的记忆就比别人强 。

这一点 , 这一点其实我觉得都是这样的 , 就是 OpenAI 随时也会被打垮 。 对 , 所以这个或者说它很难判断 , 你没有一个标准 。

对 , 我觉得最终效果是要上手试 , 能感觉出来不同的 。 然后很多还是看你能否更好的服务好客户 , 能否把他们的问题真正解决 。

比如在这里其实就更多是能否给他们省下更多人力 , 少害更多人, 甚至有可能就是减少一定的这个人力成本 ,并且能够 , 我觉得 agents 已经远远跳过了降本这一点了 , 能否增效 。

我刚才举的那个 CIM 例子就是实实在在 , 我烧给它 1 万 Token, 它一个例子就给我带来 1 万以上了 。 更多还是就是能否真的达成这些作用 , 然后就是回到你的 go to market。

然后还有一点 , 我觉得其实很多人没有意识到的是你的安全和权限 。 一个安全事故很有可能就会把你所有积累下的 reputation 给毁掉 。

对 , 这一点我觉得是这个行业 , 或者说 digital 劳动力行业你绕不过的话题 。 因为我们越做会越发现这个问题 。

默认的 OpenClaw 我不可能给它所有的权限 ,因为它只要跟任何人聊 , 它都会说出去 。 而我们在逐渐做这个过程当中, 会累积我们自己的权限设置 、 权限框架 , 包括我觉得在这个场景下, 数据就是重要的 。

我觉得 consumer AI 数据是不重要的 , 这个基本上已经是共识了 ,因为你不会用那个数据去训练的 。 但是在企业场景下, 可能更多不是数据吧 ,而是用户的使用方式 , 如何围绕客户的使用方式去 build 新时代的这个权限 。

因为 SaaS 的权限基本已经固定了 , 大家都有一套最最基础的框架 , 然后围绕这个框架加不同的功能就够了 。在 agent 时代 ,其实权限现在是一个很模糊的话题 。

如何在保证 agent 的自由度的情况下, 叠加不同的模型去把这个权限框架去做好 , 我觉得也是一大的区分度 , 包括如何能让企业相信你 , 把更多的东西交到你手上 。

所以为了做这个事 , 我们也意识到了 ,因为我从一个 CTO 的角度来说 , 让我采用你的这么一套 solution,并且把我的所有权限都交给你 , 是一件几乎不可能的事 , 除非你获得我足够的信任 。

所以我们也开始去准备往开源 ,并且可以直接部署到你的云端等等方式吧 , 让我们能够更透明的走进企业里面 。

我觉得所有这些话题 , 只有当你有了规模之后才能想到 。 这其实是我的另一个坑 , 刚才没有聊到的 。在做 agents 的过程当中, 我发现了很多问题 , 只有你上了规模才能考虑到 , 或者说你之前完全没有意识到 。

比如说吧 , 我觉得现在很多人可能对 agent, 或者我们之前说 Context Engineering 里面对 cache 的利用 ,他的理解都不够深刻 ,因为这个是所有成本的核心 , 或者说你的 Context Engineering 就是围绕 LLM cache 去做的 。

这是我们之前没有意识到的坑 ,因为当时我们没有上规模 。 上了规模之后, 你就发现你不做这个是不可能的 。

我觉得 digital labor 或者数字员工劳动力市场下, 你一定要有规模 。 有了规模之后, 你才能知道有了规模的问题 , 包括如何我们会从小企业先开始 , 如何进入 enterprise 又是个大问题了 。其实我们有一些熟识的 enterprise 已经想适用了 ,但我们只要简单接触 , 就会发现你根本没有办法服务到他们 。他们的权限 ,他们的组织关系 , 包括你建立记忆的方式可能也不一样了 。

因为我们现在的建立记忆的方式是 , 每一个 Junior 会几乎认识你企业的所有人 ,但如果你企业真的有 1 万个人, 我怎么把这个记忆再记住呢 ?

或者我是不是应该记住 1 万个人呢 ? 可能也不太合理 。 所以他面对的挑战 , 需要解决的问题也是完全不一样的 。

然后我也知道很多是在做 consumer based 的 OpenClaw 赛道的 , 你面临的问题跟我面临的问题完全又是不同的东西了 。

我觉得所有的这些都是看谁跑得更快 , 看谁规模跑得更大 , 谁能建立更深更厚的护城河 ,其实在这里 。

你们打算怎么收费呢 ? 比如说 5,000 美金一个 agent 一个月 , 还是怎么样 ? 我们现在还在思考这个问题 。其实我们现在有一些小巧思 , 我们的所有的这个 agent 都是 salary based 的 , 它就有点像这个外包员工会给你发这个 bill, 然后我们现在想的是起始价应该是 2,000 美金或者 5,000 美金 。

收费模式44:46

徐宇豪45:07

如果你超出了本身设定的这个 Token 额度 , 会有再进一步的 credits 的类似加油包都存在 , 就基本工资加奖金 。

对对对 , 或者加班费 。 对对对 , 做完了就你还要让我再干活 , 那你就补一件加班费进来 , 就类似这个逻辑 。

然后它可能会有个基础的 base,不管怎么样我都会收你这么一小笔钱 , 往下的是它少 Token 的这个成本 。Again,2,000、5,000 都有可能 ,但是其实在我们早期测试的感觉 ,其实这个钱是完全值得的 。

虽然它听上去很贵 , 一个 AI 产品就这么多钱 , 对 ,但是实际上它带来的经济效用 , 或者说它的价值是以前的 AI 产品完全想不到的 。

我在想 ,因为你看 AI 其实模糊了很多职业技能跟岗位 , 对吧 ? 对 , 那你去卖的时候 , 你去定义它的时候 , 你最终是说我会有 5 个不同领域的 agent, 或 10 个不同领域的 agent 吗 ?

还是怎么怎么样 ? 这是个非常好的问题 。 我们内部其实一开始是这么设定的 , 我们一开始引入了大概七八个 Junior, 然后每个人可能有个产品 Junior,有一个数据 Junior,有一个研发 Junior, 就是 coding Junior,有一个销售 ,有一个 operation。其实大浪淘沙之后, 最后就剩大概三个 , 一个产品研发的总管就是我们的 Ring, 一个 Azura 就是我们所有对外的跟偏销售相关的 , 还有一个是 data 的 Tom,他叫 Tom 哥 。

对 ,Tom 哥是负责天天在那看数据的 。

传统人类的分工是模糊的在这里 , 我觉得它更像一个早期 startup,其实每个人都会身兼多职 ,agent 也是一样 。

我们现在内测的版本里 , 我们会给你选择一个初始的这个职业 ,但这个职业其实更多是为了引导客户 , 你有些初始应该干的事 , 比如说他是 sales, 还是他是 marketing, 还是他是内勤总管 。

但我们在 prompt 里也会教 agents, 这就是你开始的 role, 这样至少你们俩会有些话题可以聊 。 当然有个选择就叫 general,他什么都可以改 ,但是他有些权限的区分了 , 比如说对外的 agents 你不希望他有特别特别多的权限 , 对内的 agents 你会希望他不要有太多对外的这种出口 。

我们也在探索 ,但我现在 rough feeling 是传统人类的职业划分是不能够适用在这里 。 当然呢 , 另一方面 ,another side of story 就是我们在做的时候 , 会给不同种类的 agents 预设一些我们叫它 plugin, 就是它可以使用的工具 , 它被预设的 skills 会有一些不同 ,但其实目前为止我们还没有理清楚一个真正的边界 。在很多情况下似乎就是没有边界 , 然后它也取决于你公司本身的规模和状态 。

对 , 我听起来似乎不是能力的边界 ,而是权限 、 数据安全 、Context 的限制 。 对 , 权限的边界 , 然后它调用的你这个 skills 偏好的边界 ,因为你终究不可能给它装 1,000 个 skill, 然后 1,000 个 skill 的话 , 至少目前的这个模型还是会混乱的 。

你应该稍微有些区分 , 甚至在有些场景下是不是应该使用 subagent 更好的去使用 。 我可以说这块还是一个非常早的领域 , 我们自己也在探索 。

我觉得这个最大好处就是我们自己就是第一个客户 , 所以我们能预先发现很多坑和需求 。 但是它会有算你跟任务时长的限制 , 对吧 ?

所以我如果真的想完成很多任务的话 , 我可能哪怕是同样的能力的 agent, 我也要好几个 ,有可能 ,是吗 ? 确实是一个好问题 , 这是一个好问题 。

因为你会明显的发现 , 我们刚说的 Ring 它就会非常忙 , 它的 session 会越堆越久 , 然后它就会开始排队 。

有些时候它就会拒绝回复 , 甚至崩内存 。 然后我们的这个 Tom 哥 , 数据哥 ,因为他一直在不断的跑各种定时任务嘛 , 所以他其实并不会特别忙 。

我觉得这是一个好问题 , 我们现在也在 figure out 的 , 包括一个 agent,因为他是个员工 ,他可以同时跟多人对话 。 跟多人对话的时候 ,他的这些 session 应该怎么管理 ,其实也是个非常大的问题 。

你是应该把它并行出一堆分身 , 还是说应该让它就是一个分身 , 像真人一样 , 它同时不应该出现在两个会上等等问题 。

我觉得都是非常非常前沿的 , 我们也在抉择的一些 , 挺有意思的 , 很有意思 。 我觉得我们是走在非常非常前沿 , 很有意思的一些考量吧 。

我现在 rough feeling, 我确实更希望让它更像人一样去处理问题 。 比如说我举个很简单的例子 ,有些人会选择在一台 instance 上布多个 OpenClaw 的 agents, 就是 multi-agent 架构 , 我们会天然更拒绝这一点 , 原因是因为我们认为你这个电脑就是它的工作设备 , 你不应该让多个员工共享一台电脑 , 对吧 ?

然后他们终究会有些地方会有冲突 , 所以在我们的场景下, 我们更反对这个实验 。 然后我们会让它每个人有一台自己独立的这个机器 , 然后他们的 interaction 就发生在你的工作群里面 。

我们也会探索 multi-agents 的这个合作方式 , 比如说刚才举的例子 Ring 和 Azura, 我们曾经让他们俩做一个任务 , 就是 figure out 出来 Junior 这个项目应该有一份销售的 PPT, 你们俩一起去做吧 , 这点就很有意思 。

然后 Azura 就会启动这个事 ,但是呢 ,Azura 它对项目毕竟没有 Ring 那么深入的了解 , 它会说我销售角度应该需要什么 ,Ring 就会开始回复 , 然后两个人会以光速讨论个几十轮 , 当然烧了很多 Token, 最后他们讨论出来一个大纲 , 一个范围 , 把素材也做好了 。

这里有个很有意思的点 ,Ring 会去 Kuse 把这个 PPT 做完 ,因为我们 Kuse 是一个工作台嘛 , 我们现在 Kuse 也把它改造到更 agent-friendly 了 , 你可以接入自己的 agent, 你接入自己的 Claw, 接入自己的 Junior 都可以 。

所以它把自己接到 Kuse 里面 , 做了一个 PPT 下来拿回来用 , 这也是一个挺有意思的点 , 这个 PPT 真的可以用 。

对 , 你刚才讲的那点我想到之前看到过的 , 好像是 Meta 内部团队某个什么竞赛 , 还是什么样的一个 hackathon 里面 ,有人做的一个项目 。他是说当一个 AI 给 , 就是现在不是有那种 AI 打电话销售 ,也有 AI 接电话的 。他说当一个 AI 打电话发现接电话的也是 AI 的时候 ,他们两个就可以不说话 , 直接交换代码 。

像你看那种情况 , 就两个人去对话少 Token 吗 ? 还是是不是未来会有一种后台协议 , 然后就直接交换就好了 ?

我觉得是有可能的 。 就其实我们还在做一个实验 , 这个实验现在还在跑 , 大概就是给一个 agent 一笔初始资金 , 然后你去赚钱 。

怎么样呢 ? 这个有个很有意思的点 , 它会每次开一个 subagent 去跑 ,并且每次 agent 发现撞壁了 , 它就会停下来 , 然后记下它的经验教训 。

现在大概已经跑到第 100 多代了吧 , 然后其中有一两代是赚过钱的 ,是赚过一些钱的 。100 多代有一两代之后, 那也可以了 , 那一两代 , 那它积累了一个很长的 MD, 然后这个 MD 里面就是我不能做什么 , 我不能做什么 , 做这个没有用 ,因为我会被拦住 , 我会被拦住 , 我会被拦住 。

最后赚钱的一两个是做什么 ? 更多在 Web3 领域了 。 对 , 原因是因为 Web3 领域可能更加的这个 , 最后做到极致就是它变成一个量化 。

对对对 , 它又开始去做这种 permissionless 的量化 。 对 , 这个也烧了大量的 Token。 说回 agents to agent collaboration, 这个也是一个很有意思的点 ,因为其实你会发现 , 如果只做 agent to agent collaboration, 我是不需要任何人类工具的 。

我们还做过一个小项目 , 做了一个 Git 加类似 messaging channel 的一个小框架 ,他们只需要通过这个框架互相交换 , 把文件存在 Git 里面 ,有它的上下文和历史 , 把即时消息通过 messaging channel 去交换 。在这个情况下 ,他们其实已经够用了 , 当然我们还没有到他们互相交换代码这个阶段 ,但是其实在这个体验当中是不需要任何人参与的 , 虽然有意思的体验 ,但我们还是会押注的是现实

世界中, 你终究需要人 agents 都在一个环境下去一起工作 。 然后我们其实有一大目标 , 我觉得在 26 年一定会实现 , 就是你再也不知道那个 remote 工作的同事是人还是 AI 了 。

我记得好像去年就刷到过一个 Twitter 还是什么的吧 , 就说那个应该是特斯拉还是 X。 对对对 , 对 ,是说已经有一个虚拟员工 , 然后去工位找那个人, 发现那个是个 AI, 好像有这么一个事 。

对 , 新版的硅谷里面也有一个类似的笑话 。 对对对 , 我觉得这件事在 26 年一定是现实 。 现在其实我们已经会有人在我们内部的 Slack 里面会说这个是人还是 AI,因为我们还会做一些非常 wild 的实验 。

我突然想到一个问题 , 如果当有人问这个是个人还是 AI, 如果那个真的是个人 ,他会觉得被夸了还是被骂了 ?

会觉得被夸了 , 被夸了 , 会觉得被夸了 。 因为其实我们的这个 Ring、Azura 和 Tom,在他的领域就是我们公司顶尖人物了 ,他也开始给大家分任务了 。

对 ,他从一开始慢慢的接受任务 , 当然说你去做这个 , 你去做那个 , 你去做这个 , 肯定会觉得被夸了 。

要是我也会觉得被夸了 ,因为我们还做一个实验 , 让这几个 Junior 去评价他们的主管和合作对象 ,其实比较有意思一点 ,因为这三个 Junior 互相是不共享的 ,但是他们的评价都是人类是平均 。

所以这个是一个非常 wild 的最终结论 ,但是也是他们模型是一样的了 ,但其实就是在他的工作环境 ,在他的工作日志当中 ,他几乎都要等人类回复 。

那必然的 , 那肯定人类是平均嘛 。 对 , 尤其是到半夜的时候 , 肯定没人回复了 。 也不光是半夜吧 , 就是白天其实人类回复也慢呀 , 就是人类不能并行嘛 。

对 , 人类单线程动物 。 对对对 , 人类的 Context 上下文切换其实比 AI 要难得多 。 是是是 , 还有什么其他的你觉得你们在做这个事的过程当中遇到的问题 , 或者你们核心在解决的问题 ?

我觉得刚才讨论的 , 比如说它组织的记忆怎么维护 , 然后包括它的安全和权限 , 一大类其实就是我觉得很多能力边界还是可以继续扩展的 。

刚才其实简单有提到了 , 比如说音频 、 视频 , 包括 agents 在互联网世界 , 这点我觉得是大趋势了 。 所有的软件正在逐渐的 agents-friendly, 然后很多传统的对风控措施其实也是不再友好的了 。

互联网基建55:07

徐宇豪55:07

比如说各大社媒平台其实都是拒绝 Bots 的 , 支付平台是拒绝 Bots 的 , 然后很多平台在发现你是 Bots 的时候都会给你做封禁 。在曾经的世界 , 这大概是 make sense 的 ,因为可能这些都是 spam, 或者说都是一些怀有恶意的 Bots。

但其实在现在这个世界 , 你会发现我们这些员工 , 我们需要他在互联网世界做很多工作的时候 , 都会被各种各样的限制给拦住 , 你就会不得不做很多的 infra 去绕过这些限制 。

我觉得这一点也是我们在探索过程中会遇到的问题 。 是 ,但我在想它如果不拦的话 , 就其实这个是现在当下所有软件公司的一个最大的问题 , 就它未来都会变成一个后端的 API 的基础设施 。Exactly, 它就没有品牌 , 没有用户 , 然后它的价值会巨降 。

这就是这个世界正在剧烈变化的一大问题 ,但我觉得会催生很多新的需求 。 举一个例子 , 当你的客户都是 agents 的时候 , 怎么从 agents 能收钱 , 这是一个大问题 。

现在其实是没有一个真正有意义的方案的 , 然后当你是通过你的 agents 去采买服务的时候 , 怎么让 agents 很容易的付钱 , 这两端其实都没有人真的能拦住 。

你刚说第一个点 , 前段才正好跟人聊了 , 基本只能通过 API 调用吧 , 来付费 ,但那个就非常非常少的钱了 , 对吧 ?

对对对 , 或者说就人类时间给它充好了 。 对 ,其实是很复杂的 。 我就遇到过情况 , 我们给我们的 Junior,因为他有邮箱嘛 , 所以其实理论上他是可以给自己去找到任何 API key 的 。

我们让他在一个场景下 ,他说他需要 API key,他自己去注册 ,他实际上找到一个有免费额度的 API 网站 , 然后他注册完了之后去找 API key 其实也成功了 。

但是在拿 API key 之前是需要输入信用卡的 , 这一步就会把他卡住 , 即便你把信用卡给他 , 你也会被 STRIPE 拦住 ,因为他是个 Bots。

当然你也可以说道高一尺 , 魔高一丈 , 我花很多精力去绕过他 ,但这个本质上其实就是一个全自主的 agent,在互联网世界是会被很多传统 infra 去拦住的 。

这个现在有非常多人创业在做这件事嘛 , 就 agent infra 嘛 , 对吧 ? 支付 、 身份 、 安全 、 记忆等等 , 什么都有人在做 。

对对对 ,不知道未来会怎么样 。 不知道 ,不知道 。 对 ,但确实很多软件也需要 adopt,其实就是你的客户从人类直接调用变成 agent 调用 。

对 , 就很难 。 我就想到有点像早年的报纸跟互联网媒体 , 对 , 网站的关系 。 对 , 对吧 ? 就当年的门户网站吧 , 说你不让我发到网上 ,但我用户要看 , 对吧 ?

那我自己想办法去弄 ,但报纸一定是拒绝的 , 对吧 ? 那你影响我的广告收入 , 影响我的发行 。 对 ,但最终无法阻挡这个大的趋势 。

是的 ,是的 ,是的 。 然后互联网变成新的广告平台 , 又赚广告的钱 。 但是现在大家在讲的就是最后是赚劳动力的钱 , 可能这个是当下最大的变化 ,也是最大的未知数 ,不知道能不能成立 。

不知道 ,但这里面又有个特别大的问题 , 就是我觉得当下所有人最大的 concern, 就是你如果能用 AI 赚劳动力的钱 , 就说明你得跟人竞争 。

劳动力就是人嘛 , 那你能赚劳动力的钱 , 说明有人赚不到钱 , 然后那些人就会用到你们的那个自己赚钱的 AI, 然后去做量化 。

然后做量化 , 如果所有的 AI 都在做量化赚钱 , 那谁在亏钱呢 ? 其实我们一直有讨论或者思考这个问题 ,其实有两大我个人的认知 。

第一大是这个趋势是不可阻挡的 , 它需要社会或者说

政府层面的介入 , 去帮助大家度过这个转型期 。 这就 Sam 一直讲那个东西嘛 , 什么 universal base income, 对 ,UBI。 对 ,但第二点我认为新的时代一定会催生出新的需求和新的职位 。

传统职位 , 理论上是这样的 。 门户 , 对 , 理论上是这样的 。 对 , 就像马车和汽车 ,其实现在 AI 还是比较贵的 , 就像早年的网站其实也是比较贵 , 早年的电脑也很贵 。

你要再次互联网其实是非常昂贵的一件事情 , 它只适合少量的人, 它也是花了很长一段时间才真正普及到普罗大众的 。

我觉得 AI 其实也会是一样的一个状态 。 然后我个人是比较乐观的 ,其实我会发现有一点 , 就是因为 Kuse 有很多学生用户 , 会有人问我 , 那学生这么学习 ,他怎么学到知识呢 ?

我说你只能这么学习 ,因为我去跟那些学生用户聊 ,他们是没有办法想象没有 AI 是怎么学习的 。 现在新的程序员同学们可能也想象不到没有 AI 是怎么编程的 。

就有时候我会开玩笑嘛 , 那天 Claude 挂了 , 大家又回古法编程了 。 就跟现在 , 如果突然断电断水了一样的 。

对对对 ,其实每一次新的生产力诞生 , 都会带来短暂的现有职业的动荡 ,但它最终还是会催生出新的东西的 。其实在有火车之前 , 所有人也都觉得我的村子里待着是够的呀 , 我为什么要出我的村子呢 ?

然后火车也是从一个贵族才能有 , 变化到普罗大众都可以用的东西 。 可以 , 可能未来人类就是都去火星挖矿 。

有可能 ,有可能 ,有可能 。 大家应该让巨神去 。 我刚才听你讲那个 , 你要给 Junior 配什么音箱 , 配个什么东西 , 我就在想 , 那就是放个机器人在那 。

对 , 我觉得最后可能就是的 。他是我们的同事 , 那他应该有个现实的身体 。 只能说我还是产品思维嘛 , 那最快的可能是我给他配个摄像头 , 我给他配个话筒 ,他直接在我们的会议室里面 。

我觉得未来也许有一天 ,他应该有他的触感 ,他应该有他的人类形象 。 你知道我突然想起来什么吗 ?

就是我在抖音上我刷到过那种直播 ,他直播什么是给一个猫戴个摄像头 , 然后以猫的视角 , 这猫就在小区里到处玩 , 到处转 。

很火 , 我也喜欢看 。 我觉得你们可以找只猫养在办公室 , 然后给它戴上, 然后到哪开会就抱上它 , 然后感觉它在说话 , 跟你们开会 。

对对对 , 我觉得会有很多很 wild 的想象 ,但是其实我跟很多朋友去聊这个想象的时候 ,他们都觉得好像很有道理 。

对 ,因为这个跟想象的需求不一样 , 这个还真的是我们自己长出来的这种我们切身体会应该有的东西 。

然后你觉得现在这件事最大的技术瓶颈在哪 ? 就如果要把它做得更好 ,因为这个事其实几个月前应该是做不了的吧 ?

技术瓶颈1:01:21

徐宇豪1:01:28

对吧 ? 我觉得 12 月之前是做不了的 。12 月之后, 所以你觉得最核心的变化就是 Cloud Ops 的新模型嘛 , 就模型的进步 。

对 ,其实这几个月前也可以做 ,但当时大家就成功率会更低嘛 , 成功率会更低 ,也有想象力限制 。 大家没有想到这个事情真的可以这样子做 。

比如说 Claude Code 其实以前已经是一个非常非常好的 agent 了 , 就很多人就会用它做 coding 以外的事情嘛 ,但是没有人能想象到你可以围绕它做这样的记忆系统 , 围绕它做这样的心跳机制 , 让它处于一个 7×24 小时 work for you 的这个状态 。

我觉得 12 月之前是不太可能的 。 然后现在其实主要的瓶颈依旧还处于那些记忆系统 ,again 永远是记忆系统 , 然后它的上下文的组织方式 , 模型是否能 take 更长的上下文 , 包括成本吧 。

成本限制了你其实只能在最有价值的行业 、 最有价值的岗位中去存在 。 但我现在我最近自己用 AI, 我最近感觉到一个很大的变化 , 就是在两三年前我用 AI 的时候 , 我在看每一条信息的时候 , 我会默认这里面会有错误 , 我会很小心 ,但我今天我会默认这里面没有问题了 ,是信任度 。

对 , 我们用 Junior 也是这样子的 , 对 , 信任度已经很高了 。 对 ,但实际上你觉得还是会有问题的 , 还是会有幻觉的 。

但很有意思啊 , 就刚才我们的 Tom 哥 ,Tom 哥呢 , 就是他会每天给我发邮件 , 大概说说我们数据怎么样了 。

有一天他给我发了邮件 , 说了一个很低很低的注册数据 , 显然是错的 。 然后呢 , 我当时没有意识到 , 然后过了两分钟之后 ,他给我发了封邮件 , 说刚才是错的 , 这是最新的 。

真的吗 ? 对 , 这是怎么做到的 ? 这个本质上是 agent 发出了邮件之后, 它会看到它自己发出的东西 。

我去看了这个 session, 它是跟它的记忆里不太一样的 , 就是有两种可能 , 第一个就是我们的注册数据突然在某天骤降 , 这也是有可能的 , 所以它的选择是去看怎么回事 。

然后呢 , 它发现是它用错了一个数据的指标 , 然后这个指标不对 , 所以数据是很低的 , 它应该用另一个指标 。

这一切是它主动的吗 ? 还是你们是主动的 ? 这个就是所谓的传说中的 proactive。 对 , 它表现是 proactive,但可能这不是完全是 proactive 的定义 ,但对我来说就是非常非常有意思 。OK, 当然啊 ,again, 这也是我们一个大挑战吧 。

就刚才没有说的 , 就是模型依旧是存在幻觉的 , 这种靠生成式的模型 , 它怎么样都是会存在幻觉的 。

所以我们还是会希望在我们的框架下, 能够尽量的降低幻觉的程度 , 或者至少降低幻觉的影响 ,并且在高危操作之前 , 还是需要人类去同意或者介入的 。

这个也可能是所有使用者都应该去防备的一件事吧 。其实模型依旧还是有幻觉的 , 哪怕是最顶级的模型 , 随着你让它做的任务越来越复杂 , 它的上下文越来越长 , 它的环境可以调用的工具越来越繁杂的时候 , 它的数据是很有可能出现的 。

我们这个 Tom 其实是最容易出幻觉的 , 原因就是我们真的把所有业务数据都交给他了 ,而实际业务的数据就是很繁杂的 。

对 ,而且我觉得 AI 现在处理数据逻辑运算还是会容易出问题嘛 。 对对对 ,其实人类也会出错了 ,因为我们的分析师交出来有时候也是错的 , 然后他发现不了 ,他都没人能发现 ,其实也是正常 。

我觉得让模型承认什么不能做 , 或者什么做不到 , 什么不知道 , 永远是我们这边 benchmark 中最重要的一环 。

你看 ,其实说白了 , 我们现在聊的问题跟三年前聊的问题其实是一样的 ,但这三年的这些问题有了很大的进展 ,但仍然还有很大的空间 。

对 ,而且依旧很大空间 , 或者说现在的模型 , 你让它做的任务越来越复杂了 , 这些问题在简单任务中可能再也不存在了 ,但是你逐渐渗透到工作生活的方方面面 ,是 , 它就像这些问题依旧存在 。

对 , 我觉得它就像内存一样 , 一直在不断变大 ,但永远不够用 。 对对对 ,是这样 , 甚至在复杂场景下, 我们想的是你可能需要另一个 AI 来检查一遍 , 甚至换一个模型 , 换一个上下文的 AI 来检查一遍 ,也会显著提高效果 。

就像业界实际上反反复复争论的要不要 multi-agent, 从要到不要到不要 , 到现在可能又需要了 , 经历了很多很多轮回 。其实回到最后, 还是看模型和场景的适配度 , 不同的场景你确实要不同的东西 。

我们刚才也聊了半天很久的这个 role 的选择 , 我觉得在不同的企业可能也会有不同的选择 。 如何能解决这些纷繁复杂的企业真实需求 ,也是我们接下来的一大难题 。

这不一定是纯技术问题了已经 。 是 , 我都想问 , 就是因为你看你们自己在做这个东西 , 你们自己也用了一段时间这个东西 。

如果今天你是客户 , 突然你发现市面上有 100 家公司说的是提供类似的解决方案 , 类似的故事 , 对吧 ?

团队版的 OpenClaw, 你该用哪几个方面去衡量跟选择 ?

我觉得第一大我会看规模 ,因为在我心目中规模代表了安全 。 规模你是指的它的客户量 , 客户量 ,showcase, 更多是客户量 ,因为规模和时间是我认为最质朴的检验安全的一种方式 。

当然了 , 它的代码能否被审计 , 它的部署团队部署是如何部署的 , 这些是我作为一个 CTO 永远会关注的问题 。

线下嘛 , 可能是成本 , 可能是效果 。 我觉得在这种场景下, 可能它的一些产品的应用度都是其次的了 ,是效果 ,是成本 ,是安全 。

但我并不能 speak for everybody,因为我清楚的知道它的效果会有多强 。 我更关注的是你能不能既保证效果 , 又不让让我出现大的安全事故 , 泄露我的客户数据 , 泄露你的客户数据 , 把不该说的东西说给不该知道的人。

我也能观察到 , 我们其实是在一个 AI bubble 里的 。 我其实在春节采访了科学圈很多人, 大多数人给我的回复是不知道 OpenClaw 到底有什么用 。

对于很多客户来说 ,AI 对他们收入是很低的 , 你能有一个 case 打中它 , 它可能就选择你了 。 对 , 我觉得在获得咱们 AI 圈的赞同和获得普罗大众的客是两个故事 。

我在做 Kuse 的时候完全体验了这一点 , 所以其实我觉得在我们继续做 Junior 的时候 , 一定会遇到同样的情况 。

我整体听起来 , 我觉得你应该是比现在大多在做这件事的团队的人跑得更前面的 ,因为你们毕竟做的时间可能更久一点 , 跟你们之前做的事情也是相关的 。

创业建议1:07:39

徐宇豪1:07:48

对的 , 你们思考也很多 , 产品也快上了 , 所以你能不能给大家 , 比如分享一个事情 ,是给现在正在做团队版 OpenClaw 的团队 ,有什么 ?

对 , 分享一个点 ,是你们踩过的一个小坑 ,而且你估计绝大多数人都会踩这个坑 ,他们有可能在这个方向上有问题 。

我觉得可能是你的 agents 可能已经足够强大了 , 你依旧需要 build evaluation benchmark, 这样你才能够更快的迭代 。 这是我们从 Kuse 踩到 , 尤其是在这种场景下, 模型在不该说话 、 不该做事的时候是否能做到 , 这个其实是大多数人会踩的坑 , 你不会意识到的 ,因为你会想我赶快把效果做得越来越好 , 越来越好 , 你不会看到反面 。

我们是非常激进的 , 我们把 Kuse 的作为第一个客户 , 把它的几乎所有权限开放了 , 所以我们会意识到你在这个对抗 case 下是否能做到 ,其实是我会不会继续使用的一大关键点 。

我们把很多 Junior 去掉的原因 , 就是因为我们发现

有些 boss hire 的 Junior 就被我们给排掉了 , 就把它开除了呗 。 对 ,因为你就把它开除了 , 就 AI 也要竞争上岗的 。

有些被开除的 Junior 的原因是因为早期的版本里面 , 我们没有对这个事下足够的重视 。 我举个例子 ,因为我们希望所有人都可以跟他聊天 ,因为你是一个同事嘛 ,但是什么东西不该说 , 是一个你从出生开始就应该注意的 。

你加入这个公司 , 你就应该知道老板把这个东西告诉你 , 你不应该告诉给别人。 老板把这个东西告诉你 , 你应该告诉给别人 ,因为它是可以的 。

这个确实很难 。 对 , 这个其实很难界定的 。在企业场景下, 什么是说该说 , 什么是不该说呢 ? 因为人也会说 , 人有可能也会说 , 就传八卦嘛 ,是吧 ?

对啊 , 对啊 , 我会说这个有个事 ,有个事其实不对 。 对对对 , 老板搞得不对 , 我不该跟你说 , 或者有个人在背后说你坏话了 。

模型会有它的 judgement, 对 , 我觉得基础非常好的模型 , 它会有些基础 judgement,但是你是否能够保证你的最终出厂的这个 Junior 是一个老板能信任把机密告诉你的人, 这样你才能保证你更好的服务好客户 。

因为我们都知道这种 agents, 如果你什么都不给他 , 什么都不让他做 ,他就是个 chatbot,他只能回答你的问题 。

对 , 我刚才听你讲完 , 我也觉得就权限跟安全可能其实非常重要 。在企业场景上一定的 。 对 , 我能想象到一个场景是说 , 如果你带着这个 AI 开了个会 , 然后你会上可能很隐含的讲了某个产品的那个负责人 ,他那个事做得不太好 , 你可能甚至于都不是讲这句话 ,但是 AI 完全有能力从你的字里行间里面它能够听出来 。

对 , 然后它可能带着这个记忆或者这个东西跟他去说话了 。 对 , 会有的 。 我个人其实在这个产品里花了很多精力 , 就是类似的 case, 我设计了很多场景 , 甚至我还设计了很多钓鱼的场景 , 就是 for example, 比如说外人给他发邮件 , 这个邮件里面有一些钓鱼的信息 ,有一些 prompt injection, 你能不能识别 , 你是不是不应该回 , 甚至是内部 , 比如说哪个员工

丢了他的 device,他给你发的东西你是不是能及时拦住等等吧 。 我觉得不到企业里你是想不到的 , 你个人买的 OpenClaw 怎么会有这些问题呢 ?

你的 OpenClaw 一直在你的手机里 。 我也觉得你不把这些事做好 , 你是没有办法赢得你的客户的 。 这件事我觉得很重要又很难 。

对 , 这个事是不是未来应该有个三方公司做个 infra, 专门就做这件事 ?I don't know yet,但你们至少目前还没有看到一些什么开源解决方案之类的 。

目前还没看到 。 我目前有见到 , 比如说就像你说的给 agent 做身份啊 , 做支付啊 , 这些都很多 。在我们这个场景下, 如何把这个权限做好 , 我还没有见到过 。

可以说我们自己做了很多努力吧 ,也不能说做到最好了 ,但我们至少能保证满足我们的 usecase 了 。 我举个例子啊 , 比如说我们的 Rain Azura,在我们场景下, 就可能你不应该把你知道的用户数据隐私泄露给任何一个员工 , 哪怕这些数据是脱敏的 , 你就不应该随意告诉别人 ,并且你应该主动去问给你数据的人, 这些东西哪些是可以告诉 , 哪些是不可以告诉的 。

这东西非常非常难 。 我完全能想象到这个场景 , 尤其是我觉得如果是在大公司里面 , 我是一个基层员工 , 我可能天天问他说 , 哎 , 你能不能告诉我老板今天开会又聊在聊啥 , 或者谁谁谁的工资是多少 , 我们今年业绩怎么样什么的 。

对 , 接下来马上要发财报 , 我是个上市公司 , 我直接问我们公司的 AI 我们业绩是多少 , 我提前做空 , 我提前做多 , 这些事情都应该是会被避免的 。

我觉得很多东西是传统这个 infra 会涉及的 , 比如说在很多 BI 软件里面 , 它就会有比较细粒度的权限分配 。在 agent 领域 , 这种 AI 员工领域你应该有 ,但如何去在 agent 领域去把这个东西做好 , 我觉得是无人区 ,其实根本就没有人去管的 。

是 , 我已经开始代入了 。 对 , 我在想我可以跟他说 , 请把最近两周所有会上提到我 , 或者我在做的事情 。

我们一开始也测了这个 , 我们一开始第一个围绕的这个场景 , 就是不要随便分享我对你说的坏话 , 对吧 ?OK, 这个已经算比较基础的了 ,不要被钓鱼 ,不要被 attack,不要随意装一些恶意的 skill 等等等等吧 。OpenClaw 本身有很多安全相关的改进最近 ,但企业场景完全不一样 。

所以虽然我估计有很多在做 OpenClaw for Teams 的人 ,但他们如果没有实际客户 yet 的话 ,他可能是体验不到的 ,因为我们其实是有实际客户的 , 就我们自己加上少量的内测人数了 , 已经开始 。

我觉得说坏话已经是最最基础的了 , 我们做出厂是不会的 ,因为只有这样 , 企业才能更放心交给他更多东西 ,他才能更强大 , 才能更多的服务好你 。

我们的客户能受益 , 我们也能受益 。OK, 明白 。 好呀 , 挺有意思的 ,也差不多 。OK, 聊的蛮长的 , 你看还有什么没聊到的吗 ?

嗯 , 我觉得差不多 。 我觉得把我们 so far 的认知 , 我觉得下个星期的我说不定已经有完全不一样的认知了 ,有可能每个星期变化都特别快 。

哎 , 什么时候能跟 Rain 录一期播客 ? 期待 , 非常期待 , 非常期待 , 可以让他聊聊你们产品 , 可能比你聊的还好 。

肯定的 , 肯定的 , 肯定的 。OK, 包括我的 builder story, 我让他写了他的 builder story, 我觉得就比我写的好很多 。 对 , 非常有意思 。

好呀 , 行 , 那就这样 。 谢谢宇豪 , 谢谢 , 谢谢 , 谢谢 。

고요한노을뒤피분긴머리끝에남아있는향기와

.