4242章经2024年8月31日· 52:24

未来是千亿 bot 和个人模型的时代 | 对谈心识宇宙创始人陶芳波

心识宇宙创始人陶芳波解释为何从MindOS转向个人AI产品Me.bot,认为未来是千亿bot和个人模型的时代。他提出个人模型如同个人计算机,AI最小单元是bot,而最重要的bot是代表个人需求侧的Me.bot。他认为当前Agent缺乏自我进化能力,并通过借鉴认知科学中的记忆与预测机制,让AI持续学习形成个人模型。这最终可能成为下一代超级入口。

  1. 0:00缘起
  2. 2:46个人模型
  3. 5:09需求侧
  4. 8:31Bot网络
  5. 14:19两阶段
  6. 20:34双自我
  7. 23:07记忆训练
  8. 31:05技术路线
  9. 36:16自我
  10. 38:19用法
  11. 42:17入口
  12. 51:01脑与身

转录文稿

缘起0:00

陶芳波0:03

There's something there.

曲凯0:22

我们今天很开心请到了 " 心识宇宙 " 的创始人陶芳波 。 跟大家 ——

陶芳波0:27

你再来一下 ! 这是需要我干嘛 ?

曲凯0:30

需要你打个招呼 。

陶芳波0:31

哦 , 这样才能重来重来 。

曲凯0:33

Hello 大家好 ,42 章经的听众们 , 很高兴接受曲凯老师的邀请 。 然后我再稍微补一点问题 : 就是大家知道你 , 应该很多人是因为 MindOS 这个产品知道的 。

你们那个当时是比较早 , 去年在很早时候就出来的一个 Agent 的一个产品了 。

陶芳波0:50

是 。

曲凯0:50

对吧 ? 但现在最近你是在做一个新的产品 , 可能很多人也有看到 , 叫 Me.bot 嘛 。

陶芳波0:54

嗯 。

曲凯0:54

对吧 ? 能不能给大家简单介绍一下这家公司的一个简单历史吧 ? 就你怎么样开始的这家公司 , 然后到 MindOS, 又到现在 Me.bot。

陶芳波1:02

因为我其实是一个做 AI 研究的人。 我在成立这家公司之前 ,其实包括读博士 , 包括在 Facebook、 在阿里的达摩院 , 我一直是一个研究者的身份 。

大概是在 21 年年底的时候 , 我就认为 AGI 的时代应该是一个快要到来的时代 , 所以当时就成立了这家公司 。

名字叫心识宇宙 , 它其实就是想做一个 Agent 的一个世界 。 这个就是大概很多人对于心识宇宙这家公司的一个最初始的印象 , 就是做 Agent 平台 。

但是过去这一年呢 ,其实我们思考有一些变化 , 就是一个是我们会觉得 , 你先去帮每一个个人做好自己的 Agent, 比起你先尝试去把所有现有的服务和软件都变成 Agent, 要来得可操作得多 。

然后第二呢 ,是我们会觉得传统就上一代的那个 Agent 的技术 , 我们一直在做的那个技术 , 更像是一个脚手架 。

它有一些天然的一些工程带来的问题 , 无法让 AI 可以变得足够的聪明 。 所以我们就希望能够把现在为个人做的这个 Agent, 具有一个自我学习能力 。

所以在这样的理念下, 我们就推出了一个新的产品 , 叫 Me.bot。 大概是在今年 4 月份 、5 月份左右的时候 ,是做了一个内测的发布 。

目前大概也有个小几万的用户 ,也希望大家可以来应用 Me.bot。Web 端可以直接使用 , 如果是移动端的话 , 可能还得翻墙到海外的 App Store 去使用 。

安卓用户的话可以直接下载 。

曲凯2:34

然后你应该是国内接触 AI、 做 AI, 包括 Agent 这些概念时间最长的人之一了 。 所以你做到今天 , 你对于 AI 这件事有哪些总结的一些认知啊 , 什么这些点吧 ?

个人模型2:46

陶芳波2:46

我有一个很强的感受是 , 我们可能高估了 AI 的基础能力的价值 ,但低估了它在场景当中的 know-how 的价值 。

我觉得这个是我的一个感觉 ,也是我过去做 MindOS 的时候犯的一个错误 。 它会非常像计算机革命 , 计算机革命一开始就是 IBM CEO 说 :" 全世界只需要五台计算机 , 所有人都连我这儿 , 你们那些任务我这五台超级计算机都可以解决 。"Steve Jobs 和 Bill Gates, 就当时他们都还只是 20 来岁的年轻人, 说 :" 不行 , 我们不只需要五台计算机 , 我们不仅需要每个人的桌面上有一台计算机 , 甚

至我们身上都得有各种各样的计算机 。" 那今天其实我们已经看到 , 我们身上 、 我们戴的手表 、 我们的手机 ,其实就是各种各样不同尺寸 、 不同功能的计算机了 。

而它比起五台超级计算机而言 , 它带来的这种个性化的价值 , 它对于个人服务的这种体验的捕捉 ,是要好了多的 。

曲凯3:38

这个还是挺有意思的 。

陶芳波3:40

对 , 我最近经常会去借鉴那个计算机的发展历史 , 就是个人计算机是怎么做小型化的 。其实它那上面的文件系统 , 就是今天我们讲的记忆系统 , 很像吧 ?

然后它是因为有了这些文件系统 ,因为有了你的个人的操作在上面 , 它还构建起了一个上面的应用生态 。

也就是说 , 你的应用生态不会构建在一个超级计算机上, 你的应用生态其实是在构建在你的个人计算机上 。

那么你说未来基于 AI 的这些应用生态 ,是构建在 GPT 上, 还是构建在一个个人模型上 ? 我觉得这就是一个很有意思的问题了 。

当然 AI 把这个发展就极大地压缩了 , 可能从大型机到个人计算机花了 30 年, 从 AI 的大的 Foundation Model 到 Personal Model 可能只要花 5 年 。

但是我觉得 Personal Model 就是新时代的 Personal Computer。

曲凯4:26

嗯哼 。

陶芳波4:27

一个大模型结合一个场景或者个人, 它会形成一个新的 bot。 这样的一个 bot 会成为未来世界的一个基础单元 , 企业会有它自己的 bot, 个人会有它自己的 bot, 然后这些 bot 和 bot 之间 , 它会有自己的新的通信协议和自己的网络 。

那么这个以 bot 作为基础单元的这个世界 ,是我们在接下来可能 30 年左右会去逐渐形成的一个世界 。 所以我们应该在这个世界里面找到 , 到底什么 bot 是最值得做的 , 什么 bot 是跟这个场景结合得最好的 。

然后最后锚定到的一个点 ,也是我在创业初期的时候其实没有想得特别清楚 , 就是到底最重要的 bot 是什么 。

曲凯5:07

这个怎么讲 ? 什么叫最重要的 bot 是什么 ?

需求侧5:09

陶芳波5:09

就是说如果我们认为未来这个世界上会有很多很多的 bot。

曲凯5:14

是 , 然后你就可以去 ——

陶芳波5:15

但是 bot 本身又有很多不同的角色 。 比方说那个 Character.AI 里面 , 可能有一些代表了名人的 bot。 小商家现在很多 , 比如在网站上放他们那个 AI 的一个 widget, 可以跟用户交流 , 这也属于一个它对外展示和销售的一个 bot。

那么我们在电影里面看到的 , 无论是贾维斯和赫尔 , 都像是说我们每个人拥有一个类似于助理或者陪伴的 bot。

硅谷现在有一个很有意思的分类 , 就是一家 AI 的 Native 的公司 , 它会把它分类到它所创造的这个 bot 的类型或者职业上 。

比如说它认为 Devon 就是创造程序员的 bot 的公司 , 然后什么什么就是创造可能是 HR 的 bot 的公司 。

曲凯5:56

对 , 国内其实我们也有一种说法是说 , 就国内的 SaaS 这些也都不太行嘛 。

陶芳波6:01

对 。

曲凯6:02

对吧 ? 大家讲说那未来会不会跳过 SaaS 这个阶段 ? 包括美国其实也在讲了 , 对吧 ? 就是第三代软件啊之类这种说法 。

陶芳波6:08

对 。

曲凯6:08

对吧 ? 它就是说 SaaS 其实是一个人还是在去使用各种功能 。

陶芳波6:11

对 。

曲凯6:12

但后面其实你就是用一个 bot 就好了 。 包括我们最早也有我们聊过一些公司 , 它是做 , 就是做物流系统的 。

现在物流系统呢 , 可能你如果真的是用 SaaS 来用 , 需要那个人手工地去调 , 对吧 ? 说这个订单 , 调整它的什么优先阶段 , 七七八八的 。

陶芳波6:26

对 。

曲凯6:26

但它完全就可以做到一个微信的 bot 里面 , 人话跟它讲 , 对吧 ? 你帮我把明天的这个订单改成后天下午几点再去送 ,其实就 OK 了 。

它就是一个 bot 的形态去取代了之前非常复杂的一个软件的系统 。

陶芳波6:39

嗯 , 对 , 对 。 但是这里面就有一个很有意思的问题了 。 当我们在说 AI 是下一代软件的时候 , 会有里面有一个其实藏得很深的一个假设 , 就是因为软件本身原来都是提供服务 、 提供内容 ,其实是供给侧的形态 。

那么 bot 是下一代软件 , 意味着我们想到的 bot 其实都是供给侧的 bot。 比如说它代表那个红酒厂商的 , 然后它是提供某种编程服务的 。

曲凯7:04

是 。

陶芳波7:05

对吧 ? 其实我后来觉得最重要的 bot 可能不是供给侧的 bot,而是身份型的 bot。 它其实是一个偏需求侧的 bot,因为其实大量的我们日常生活中其实还是在有需求侧的属性 , 我产生各种各样的需要 , 然后交给这些供给 。

那么现在一个很有意思的点就是 , 如果说发起需求的这个其实不是我这个本人 ,而是和我绑定的 、 互为映射的这样的一个 bot, 那么这个 bot 有可能就是我认为在所谓的 bot 的世界里面最重要的那一个形态 。

而这个其实是软件以前是没有这种形态的 。

曲凯7:45

对 , 之前这块需求是谁在满足呢 ? 或者说大家在什么行为上面会比较类似于这种 ?

陶芳波7:52

我觉得之前的满足方式是静态的 。 它其实有点像是一个身份 , 之前最早的身份其实是类似于像 Facebook 这样的一个身份 , 或者说我们会用 Email 这样的工具去发送我们的需求 。

但现在就是说因为 AI 的技术 , 我可以把这个身份变得非常的动态化 ,而且这个身份它是完全是你的一个映射 。

所以也是因为这个原因吧 , 我们特别想做的这个产品就叫做 Me.bot。 本质上是在做一个 bot, 它是你自己 ,但从刚才供给和需求的角度来看 , 它其实是一个发起需求 、 整合需求的一个 AI,而非提供服务 、 提供内容的一个 AI。

曲凯8:31

明白 。 对 , 我们再往回捋一下, 就是其实你之前我们在讨论一个问题 , 就是 AI 的最小单元到底是什么 。

Bot网络8:31

陶芳波8:37

对 。

曲凯8:37

然后你的答案应该是就是 bot。

陶芳波8:38

对 , 就是 bot。 它有两层单元 , 一层单元是 bot, 那另外一层单元是 bot 的之间的互动 。 就像是点和边的关系 ,在一个 graph 里面 , 点也是一种单元 , 边也是一种单元 。

然后这个边呢 , 大量的边会是 bot 和 bot 之间的 ,但是也会有大量的边是你的这个需求侧的 bot。

曲凯9:01

但如果说 , 比如说你刚才提的这点 , 如果大量的这个边或者这个互动是 bot 和 bot 之间完成的 , 那它到底算是好多个 bot, 还是其实它就是一个东西呢 ?

就比如它 , 我们就把它当做一黑盒 , 它就是按这个逻辑完成了嘛 。 对吧 ? 那你有没有必要再去分 , 或者再去用很多个 bot 的逻辑和思路去设计这个东西 ?

陶芳波9:23

它作为很多个 bot 的设计思路 , 它本质上并不是因为网络就一定比非网络好 。其实它用很多 bot 的设计的原因 ,是为了让每一个 bot 具有一个跟真实世界的实体的一个绑定 。

比方说这里有个 bot, 它就叫曲凯的 bot, 就是你自己的需求侧的 bot。 然后可能那边有个 bot 叫做园艺森林的饮料的 bot, 它就是一个供给侧的 bot。

它一旦发生这样的绑定了之后, 你和你的曲凯的 bot 之间就形成了一个相对来讲独立的一个优化的循环 。

就是它的目标其实并不是为了网络当中的优化 , 它的目标是为了使得它的所有的服务更能够对齐到你的需求上 。

然后园艺森林的那个 bot, 它的目标是使得它的提供服务的能力更对齐到园艺森林本身的背后的服务的提供能力上 。

所以这样的话 , 就可以使得整个网络里面有不同的人拥有不同的 bot,并且独立地在优化 , 最终会使得这个网络的整体的效率和服务的能力去得到提升 。

曲凯10:24

是不是我可以理解成就是每一个对每一个主体对应一个 bot?

陶芳波10:28

对 , 每一个主体对应一个 bot。

曲凯10:30

所以理论上来说 , 如果我们非要去说未来 bot 的数量来讲的话 , 应该所有的主体 , 比如每个人肯定是有一个的 , 对吧 ?

每个公司可能有一个 。

陶芳波10:38

对 。

曲凯10:38

然后这个 bot 应该理论上说是兼具谈需求和给予供给的这个能力的 , 对吧 ?

陶芳波10:44

对 , 对 , 对 。 就每个 bot 会有两个部分 , 一个部分是它跟拥有它的这个主体之间会进行持续性的对齐 , 从而更好地了解我的需求 , 对吧 ?

然后另外一部分能力就是它拥有能够加入这个网络的能力 , 它拥有一套可以跟这个网络里面别的 bot, 或者可能也包含别的传统的像网站这样的服务之间去互动 ,并且把信息进行交换的能力 。

曲凯11:08

嗯 , 然后你刚才讲的 Me.bot 现在是做的就是每个个体 , 每个人。

陶芳波11:12

自己的独特的 。

曲凯11:13

自己的一个 bot, 对吧 ? 但我在想 , 按我们刚才讲的 , 比如一个部门 , 你也可以把它当做一个实体 , 一个实体 , 一个我 , 对吧 ?

一个更大的一个我 。 那这种未来会不会也是一种类似 Me.bot 的一个潜在的用户跟场景 ?

陶芳波11:30

对 , 当然 。 就是我觉得终局就是每个个人一定都会有 ,因为个人是在这个世界里面非常独立的单元 。

对吧 ? 公司和大型的组织肯定也会有 ,因为它也是一个相对独立的单元 。 但是比如说我公司里面的一个团队 、 一个部门 , 或者一条产品线 , 它适不适合产生它的 bot, 这个东西就比较 tricky 了 。

它取决于这个事情到底是否拥有一个独立持续优化的需要 。

曲凯11:58

我感觉理论来说应该是有的 。 但除了这个 , 我还想补充一点 , 我觉得你刚才讲的是 bot 它必须是独立的持续进化 。

陶芳波12:05

对 。

曲凯12:05

我在想另外一个场景 , 它可能就是每天要重复性地工作 , 起一些重复性的作用 。 我觉得这种时候 bot 也是有用的 , 对吧 ?

比如说就是以前一个填表的场景 , 我来填表 , 然后那边有个人审核 。其实这时候 bot 也能持续地产生作用 。

陶芳波12:22

对 。

曲凯12:22

但它不一定是你现在定义的这个 Me.bot 这种最典型的一个场景 。

陶芳波12:26

对 , 它本质上还是供给侧的 。 就供给侧当然也可以存在 ,但是我不会把那种做固定任务的东西当做 bot, 它更像是一个 workflow。

它应该是被 bot 使用的一个类似于一个它的能力 , 或者说它的一个组件 。

曲凯12:40

我刚刚也在想说 , 就是我们刚才提到 SaaS, 后面会不会有 AI 取代 ? 就我在想所有的可被操作的软件 、 服务 、 窗口 ,其实本质上来讲 , 你去操作它的时候 , 就是你作为一个人的意志 , 你知道你的目的是什么 , 对吧 ?

然后你使用一个工具 , 或者说一个 workflow 去完成 。

陶芳波12:57

对 。

曲凯12:57

这个时候如果 AI 是懂你的 , 它知道你要什么 , 它又具备 Agent, 我们讲的我们期待看到的 Agent 的一个多线程的或者多任务的操作能力的话 ,其实这个界面就没有意义了 。

大家之前最早的时候也在聊到底未来应该是一个什么图片 、 图形窗口 , 还是聊天界面 , 还是怎么样的 。

我觉得除非它是一个极简的 , 就只用点那么一两下的 , 这个时候可能 AI 的作用也不一定有那么大 。

但凡是相对复杂一点的窗口 , 需要人操作的 , 那就用 AI 替代就好了 。 就你跟它讲就好了 。 我觉得最典型的场景就是 Excel 这种 , 我可能就是说我想算出来这个月工资的排序 , 对吧 ?

还是过去一年里面一个多复杂的一个怎么样的一个一堆数据得到一个结果 。 那现在你要一个人去操作 , 它得学很多东西 , 对吧 ?

要搞很多函数 , 什么各种操作 。 但你可能你跟 AI 说一下, 它自动就帮你完成了 。 所以未来可能 Excel 的作用也没那么大了 , 或者至少它这么多奇奇怪怪的函数没有那么大作用 , 就用 AI 就好了 。

所以这块我想讲的就是说 , 未来可能一切复杂的系统都会被一个简单的聊天界面的 AI 取代 , 然后它就变成一个单元 。

这个可能更多是偏供给侧的 , 对吧 ? 按照我们刚才讲的 。

陶芳波14:09

对 。

曲凯14:09

然后你讲的是我们仍然也需要一个需求侧的 。 然后需求侧的就是说我更懂这个人日常想要什么东西 , 然后他去跟那个 AI 去沟通交流就好了 。

两阶段14:19

曲凯14:19

我理解就是现在大家第一反应是让 AI 去用这个 workflow,是因为已经有了这么个界面 , 对吧 ? 但其实 AI 出来 , 你完全可以把这界面先破除掉 , 然后让它重新用它的理解去搭就好了 。

但我现在也有很多人讲说 , 之所以觉得 Agent 后面很难达到 ,是因为整个人学习的这个过程是没有数据可以去标注 、 可以去遵循的 。

你觉得这个问题有什么解决方法吗 ?

陶芳波14:42

那这个我举一个很有意思的例子啊 。 我前段时间跟一个做法律的一个大哥聊天 ,他应该是很厉害的一个律师 ,他一直想做一个法律 Agent,他一直就做不到他想要的那个专业律师的水平 。

然后我们就在探讨说你的律师的培训过程到底是怎么完成的 ,他到底是怎么样从一个不懂法律的人变成了今天可能律师行业的一个大佬 , 可能合伙人之类 。

他说其实大概就有分为三大类 。 第一类呢 , 它就是上法学院 。 上法学院的第一步就是不断地疯狂地看 case, 这就有点像是预训练的过程 。

然后老师就会去教他说 , 你这个东西的流程是先去查这个数据库 , 查完了之后把这个 case 拿过来做对比 , 对比完了之后你可能去做一些结论 。

这个就有点像是今天的 AI 的 Agent, 给它一个 workflow, 对吧 ? 去学习 。 但是他说他对他来讲这个东西更有价值的方式 ,其实是他随着跟这些专业律师真的在做 case 的过程当中, 就他会发现很多很多不同的 case 下 ,他的直觉 、 判定 、 方向 , 甚至 workflow 的使用都是完全打破的 。

有的情况下 ,他可能不是马上就进入到一个 evidence 的阶段 ,而是要去跟法官去沟通 。 而这些经验是从哪来的呢 ?

是从真实的过程当中, 通过你去把 workflow deliver 出去 , 拿到了正面或者负面的反馈 , 把这部分反馈当做记忆再拿回来 , 再持续地学习 。

所以它很明显地具有一个两阶段的过程 。 那第一个阶段就是我们现在理解的 AI Agent。 我告诉他法律条文在哪 , 就是这边可能是你要的刑法的整个文案 , 那就是 Reg 的部分 。

同时我再告诉他一堆 workflow, 说他如果是法律咨询 , 你就走 12345 步 ; 他如果是走什么什么 , 你就走 45678 步 。

但是如果一个新的人进来 ,他遇到了这个法律情况的 case 稍微变化一下, 或者他的需求稍微变化一下, 你这些固定东西的组合就解决不了了 。

你依然会先通过这种方式去服务他 , 然后会得到负面的反馈 。他说我这时候不需要这个东西 , 或者说你给我的这个方案我就打完打输了 。

那么他就要把这个反馈拿过来 , 再把他使用这些工具和使用这些内容的方式给打破了之后, 再建立新的连接 。

所以它是分两阶段的 。 那回过头来讲 ,AI Agent 为什么今天所有的 AI Agent 都很笨 ? 我觉得差距并不是在它的初期学习的部分 。

初期学习的部分我们用工具化的方法 、workflow 的方法给它搭建基本的结构 , 完全 OK。 它的差距在于 , 当它真的在实践的时候 , 它大量的实践当中获得的反馈和数据 , 没有办法去改造它的初期给它的这个设计 。

而这个就是我说的 , 它需要有一个持续 learning 的过程 , 只有这样才能达到我们想要的 Agent 的水平 。

曲凯17:33

是 , 就好像你就像我们经常讲脚手架这个词 , 对吧 ? 我觉得就真的是 , 就你就搭了一个骨架出来 ,但是其实在这个脑子上没有给它太多的 。

陶芳波17:44

骨架上没有智能 , 骨架上是外部的工具而已 。 所以现在的一个最关键的点 , 无论我们说是做自己的 AI Agent, 还是说做供给侧的 AI Agent, 我认为都需要去思考 , 或者都需要去尝试第二个阶段怎么做 。

曲凯18:01

那第一个阶段就是脚手架 , 脚手架 。 第二个阶段就是怎么给它更多的智慧跟反馈 。

陶芳波18:06

对 , 从真实的数据当中, 实践当中去获得学习 。

曲凯18:11

但如果按你这么讲的话 , 应该是现存的数据量越大 ,以及说反馈频次越高的地方 , 越容易先把这 Agent 做出来 。

陶芳波18:20

对 , 我同意 。

曲凯18:22

有什么领域是这样的吗 ?

陶芳波18:23

个人生活的领域就是这样的 。

曲凯18:25

这个不是因为你们在做这个 。

陶芳波18:27

我只能说这是一个 , 我并不是说这是唯一的一个 。

曲凯18:30

明白 。

陶芳波18:31

当然还有比如说我觉得销售的这个领域也是这样的 。

曲凯18:33

确实 。

陶芳波18:34

对吧 ? 你一个销售的人员每天要打 30 通电话 。

曲凯18:37

是 。

陶芳波18:37

你到底这话术怎么说 , 这些 workflow 怎么用 , 这些知识怎么使用起来 , 使得我销售成功率可以提升 ? 它如果今天你创造一个销售的 Agent, 当你创建好的那一刻 , 它就不会提升了 , 它的成功率就已经被固定在一个数字上了 。

曲凯18:49

所以你刚才提到你觉得个人生活助理 , 对吧 ? 这个也是类似的这么一个场景 。 原因是什么呢 ? 我其实不太想到这个东西怎么样记高频又给反馈 。其实我们的思考的链路是这样的 , 就是在未来的世界里面 , 它一定每个人会有一个 AI,而且这个 AI 应该是高度地和这个人 align 到一起的 。

但是问题呢 , 就是说个人其实是非常难 align 的 。 就像以前有一句话叫做 " 今天踏进这条河的人和昨天踏进这条河的人其实不是同一个人 "。

陶芳波19:21

对 ,而且我们经常也讲 , 就是每个人其实都不了解自己嘛 。 你还要让一个 AI 了解你 。

曲凯19:27

对 ,他也甚至说不一定那么了解自己 ,但是你至少有些部分你是了解 。 我只能说人的深层次的部分 ,不要说 AI 了 , 连人自己都不一定了解自己 ,但这个是绝对有可能的 。

但是这里面就有一个点 , 就是如果你真的想创造一个 AI, 那么它非常重要的一个点就是 , 它得经历跟你一样在经历的东西 。

也就是说它得拥有你在拥有的这份完整的记忆 。 所以我们现在其实本质上想要解决的就是这个点 。

如果说人是一个高度由记忆决定的动物 , 一种生命体 , 且人每天他的记忆都像一个流一样 ,不断地在有新的记忆灌进来 ,而且他每天新的记忆灌进来的时候 , 我这个人背后的整个思想结构 , 对世界的认识都在默默地发生着变化 , 那这个完整的这个过程就应该被复制到 AI 上 。

然后第二步是什么呢 ? 怎么让 AI 能够像人一样去获取这部分数据里面的真正跟你本质有关的那些学习到的东西 , 对吧 ?

双自我20:34

曲凯20:34

这里面就涉及到一个很有意思的概念 。在认知科学里面 , 它对于自我有一个区分 , 一种叫做 Experiencing self, 就是经历的自我 ; 一种叫做 Remembering self, 叫做记忆的自我 。

它说的是每个人其实都在经历我的这些记忆 , 就像我在经历喂养这些数据一样 。 但是事实上最后那个 Remembering self, 那个真正重要的记住我是谁的那个自己 ,其实是跟你的经历不完全相关的 。

它是通过一套叫做预测的机制来构建出来的 。 有点像什么呢 ? 就是我不断地在经历 , 经历的过程当中 ,其实我人同时背后有一个网络 ,不断地在预测我接下来的经历会是什么 , 我接下来会产生的想法是什么 。

而为了预测得更准 ,并不是完全就是把过去的经历重复一遍就可以了 。 你必须让你的 Remembering self 在这个预测的过程当中学习到 , 我本人是一个 , 举个例子是一个什么样 MBTI 的人, 我真正感兴趣的是什么 , 我的思维结构是什么 。

也就是说你要从这个 Experience 里面抽象出一套真正的人的人格 、 人的思维结构 , 人抽象出来的那一层很复杂的意识 。

这部分就是 Remembering self 在学习的东西 。 然后这部分学到的东西 , 它是高度抽象过的 , 它其实是对于我今天要去做一个创业的决策 、 情感的决策 , 甚至是买一个东西的决策 , 应该喜欢看这部电影还是看那部电影的一个决策 , 真正起到作用的 , 对吧 ?

就是假如说我今天有两部电影在我面前 , 我都没有看过 ,Experiencing self 是没有办法帮我做判断的 ,因为对我来讲都是新数据 , 它不是重复 。

但是 Remembering self, 那个记忆的自我就可以 。 因为记忆自我在训练的过程当中 ,其实训练到的就是我到底是一个喜欢惊悚的人, 还是喜欢爱情的人。

那么如果我是一个喜欢爱情片 、 轻松一点的 , 那么我肯定会去看那个爱情片 。 核心就是我要让一种可预测的机制加入到同样的这个 AI 的训练过程当中 。AI 也形成一个这样的目标 , 使得它我预测接下来的事件和预测我接下来的下一个想法更准确 。

那么这种准确训练的过程 、 持续训练的过程 ,其实就是在构造一个 Remembering self。 所以它训练出来的模型就会非常非常像它不仅是拥有这些记忆 , 它还抽象出了像你一样去理解这些记忆 ,并且把这些记忆投射到未来的一种模式 , 这个模式就对齐了 。

这个听起来挺玄乎的啊 。 所以实际上它在产品上是怎么实现的 ?

记忆训练23:07

陶芳波23:07

这个是训练模型的一个过程 。 因为我们在产品上本身就是做三件事情 。 第一件事情就是刚才讲的共生 。

那共生从现在的角度来讲 , 相当于我们会为每一个用户 , 当然它是为了构造这个 AI,但构造这个 AI 的过程其实就有点像是为每个用户构造一个记忆流 。

那举个例子 , 我现在在跟你发生一段对话 , 我可以让我的 AI 在这里听这段对话 。 那么这个对话就进入到它的记忆流里面去了 。

那我看到了一个很好的东西 , 我也可以把这段图片发给它 , 或者说我脑子里面有一个特别好的想法 , 我也会按着它那个录音的按钮 , 它就自动地开始记录我脑子里的想法 。

所以我在外部看到的信号和我脑子里面的信号 , 都可以尽可能地让我的这个 AI 通过一个记忆流的方式给保留下来 。

这是产品上在共生这一个阶段我们到现在做到的一个程度 。 但是下一个程度一定是把它去变成一个超越于手机的一个形态 , 就是比方说它是一个眼睛 , 那么这时候它的记录就会更加自主 , 它的存在就会更加背景化 。

曲凯24:13

是 , 就是你肯定希望尽可能多的记忆 。

陶芳波24:16

记忆 。

曲凯24:17

就是真的是越共生越好嘛 。

陶芳波24:18

越共生越好 。

曲凯24:19

而且你这个东西 , 你这么说起来就是越早用越好 。

陶芳波24:22

越早用越好 。

曲凯24:23

对吧 ? 其实我刚才想到一个场景 , 我们是不是可以给父母用来带娃 , 让他跟着娃一起长大 。

陶芳波24:28

这也可以 。 因为我觉得共生是一种非常高级的人机交互的一种范式 , 或者说其实所有人 100 年前就有人想要共生 , 只是说一直没有这个好的技术 , 硬件也好 , 软件也好 , 对吧 ?

软件今天有 AI, 我觉得是可以达到共生的 。 那硬件可能现在我们还需要一个更加可传达的设备 。

曲凯24:46

但本身底层的 AI 现在它也有各种问题 , 对吧 ? 比如说大家经常讲的就是你给它一大段东西 , 人知道要记什么不记什么 ,但 AI 可能不一定知道 。

所以你要完成这件事 ,是不是也持续要做很多底层算法的一些东西 ?

陶芳波24:59

你刚才讲的这段话就是典型的我刚才提到的体验自我和记忆自我之间的差别 。 人为什么会知道哪些东西我要记 , 哪些东西我不用记呢 ?

是因为他选择遗忘其中的大部分 , 使得他保留下来的信息对我未来的决策和预测是最有价值的 。

曲凯25:18

真的吗 ? 人有这么聪明吗 ?

陶芳波25:19

它是隐性的发生的 。

曲凯25:21

OK。

陶芳波25:21

隐性的发生的 。 甚至有一个很有意思的理论 , 就是说我们为什么小时候在 3 岁以前是记不住东西的 ,是因为 3 岁的时候我们那个 Remembering self, 就是我们那个模型很差 , 使得它预测的时候错误率极高 。

就小孩子嘛 ,他还不懂世界是怎么运转的 ,他的错误率可能在百分之八九十 , 然后错误率特别高了之后 ,他就记不住这些东西 。

但是 3 岁之后我们就记得越来越多 ,是因为我们那个模型稳定下来了 , 所以我可以预测得非常好 。

然后你就会发现 , 大脑当中我体验经历到的东西 , 主要都是我都会忘掉 。 比如你今天穿的裤子是黄色的 , 我明天一定忘掉 ,因为不重要 。

曲凯25:57

现在说不定就忘不了 。

陶芳波25:58

对 , 现在就忘掉了 。 但是也就是说我们今天通过各种感官得到的绝大部分信号 ,其实是跟我们未来对于这个世界的预测和判断是没有关系的 。

所以我就选择把它忘掉 。

曲凯26:08

对 , 用我们做内容的角度来讲 ,是 , 或者说做访谈 、 做 IFA 之类的都一样 , 就是你应该本身是带着一个框架去跟人聊天 , 对吧 ?

你感觉是在聊天 ,但其实你是在寻找那些信息 , 然后你把它填到你已有的那个框架里面来 , 对吧 ?

然后包括我们经常讲的就是要有假设 , 再去论证 ,其实也是一样的 , 对吧 ? 就我先有一个假设 , 然后我论证了为真 ,OK, 那这块就放到这个框架里面的哪个位置是假 , 那我就再继续验证 。

陶芳波26:37

Exactly, 这就是我们所说的所有的框架本质上都是为了预测未来 。 所以所有的框架都是错的 , 只是有一些预测得不那么错而已 。

曲凯26:45

所以你是想让 AI 也具备这个能力 , 然后也复刻这么一个流程 。

陶芳波26:50

对 。

曲凯26:51

目前是能做到的吗 ?

陶芳波26:53

能做到 , 基本上能做到 。 因为很多人理解的记忆和我理解的记忆是很不一样的 。 我们就说狭义的记忆是什么 ?

狭义的记忆是说它可以记住所有东西 。 这种情况它只有一种场景 , 就是 Needle in a Haystack。 比如说我读一本书 , 我可以记住所有的细节 , 比如 《 西游记 》, 然后我就问三打白骨精 , 第二次打是在什么场景下发生的 , 那它肯定能记住 , 对吧 ?

这是一般人认为的狭义的记忆 。 但其实真正人的记忆啊 , 它有两个点 。 第一 , 它不会记住所有的细节 。

它有的时候会 reference, 就哪怕是一个熟读 《 西游记 》 十遍的人, 它也记不住里面说的每一句话 ,但它手边可能有补 《 西游记 》。

那么它这时候需要的时候 , 它可以去找那个章节那一句话 , 它可以找到它 , 这叫 referencing, 可以用 RAG 来进去 。

但是它留下来的那些记忆是什么呢 ? 留下来的那些记忆是帮它去打开除了回忆之外的更大的场景的 。

这其中第一个场景就是预测 , 就是我们今天想要让 AI 获得的记忆是它这个记忆 , 它不是表象的那些信息 ,而是它抽象的参数 , 或者说抽象的你说的大脑里面的那个框架 , 使得它可以预测 。

举个例子 , 我可以预测我今天跟曲凯来聊 , 我会聊哪些话题 , 我自己肯定能判断出来 。 但是一个只有纯粹 memorizing 能力的 , 就是记忆背能力的人 ,他是没有这个能力的 , 对吧 ?

曲凯28:19

对 , 那个中文是什么呀 ? 海底捞针是吧 ?

陶芳波28:22

大海捞针 。

曲凯28:22

大海捞针 , 对吧 ? 就讲这个 , 就当时大家都用这个测试来去验证模型能力到底怎么样 。 但我听完你讲的意思确实是这样 , 一个正常人他也不会是这么去记东西的 。

陶芳波28:32

对 。

曲凯28:33

对吧 ? 但这里面又有一个延伸的点 , 就是不同的人他记的东西也不一样 , 对吧 ? 就是每个人看一遍 《 西游记 》, 就每个人记起来的东西也都不一样 。

陶芳波28:43

对 。

曲凯28:43

对吧 ? 这个也跟他自己的你刚才讲的那两种记忆可能是很有关系的 。

陶芳波28:47

对 。

曲凯28:47

所以反正 anyway, 我就整体听起来 , 我觉得你真的这个事是 make sense 的 ,但你真的要用 AI 去复刻这个人是挺难的 , 就非常难的一事 。

就你其实相当于是在造人嘛 , 这个事如果成立的话 , 你就是在造人嘛 。

陶芳波29:00

或者说我在做用一个科幻点的概念叫做上传智能 。

曲凯29:04

是 。

陶芳波29:05

Uploading intelligence。

曲凯29:06

对 , 我看了这个美剧 。 而且我刚才在想 , 如果真的把一个 Me.bot 做出来了 , 它最终 ,但这个讲得有点远啊 , 它最终是不是它反而有可能是对人的取代 , 或者至少是比如这个人他是有个工作 ,他现在需要自己干 , 你这个 Me.bot 出来以后真的有那么厉害以后 ,他就不需要自己干这个活了 。

陶芳波29:27

但这种到底是称为是取代还是增强呢 ?

曲凯29:30

对 , 就是对于老板来讲是取代 , 对吧 ? 对他自己来讲是增强 。他万一增强到足够强 , 老板发现不用他了 , 就取代了 。

陶芳波29:40

对 。

曲凯29:40

是 , 我觉得没个几十年应该是达不到真的那么厉害 。

陶芳波29:44

或者技术上也达不到你说的那种程度 , 对吧 ? 但是真的到了那个程度之后, 会不会变成这样我也不知道 。

就刚才那个点我可以稍微再补充一下, 我觉得特别有意思 。 因为我们就做了两组实验 , 一组叫做 Needle in a Haystack, 就是你说的大海捞针 , 就是狭义的对我们对记忆的理解来测试它的方法 。

然后另外一个呢 , 我们叫 Reasoning in a Haystack。 当然这个 Reasoning 可以是预测 , 预测也是一种推理嘛 , 对吧 ? 也可以是一种决策 , 或者说是比如说信息的推荐的准确度 , 对吧 ?

这也都是里面有大量的推理在发生的 。 当我们做 Reasoning in a Haystack 的时候 , 无论是 RAG 还是长上下文都做得非常非常差 , 只有一种方法可以让它做好 , 就是通过我们设计的记忆训练的方法 , 使得它在训练的时候就不断地形成你说的背后的那个思维框架 。

然后这个思维框架的形成本身已经有很多预先发生的推理在里面了 , 然后在它瞬间在使用这个思维框架的时候就会非常准 , 质量就会非常高 。

然后很多带推理的任务只有这种模式能完成 。 所以这个给了我们很大的信心吧 , 就是当我们再说要有一个 AI, 它要达到一个跟人的高度 alignment, 它不可能只靠那种记忆能力 , 就记住的能力就可以 。

它其实是一种广义的记忆 ,其实它这背后就带有学习和理解在里面 。

技术路线31:05

曲凯31:05

对 , 我觉得听起来就你这个是一个非常高精尖的一件事 。 所以你们现在在技术上, 底层技术算法上会有很多投入吗 ?

要为了做这件事 。

陶芳波31:15

有 ,因为我们从成立第一天就有一个部门叫做 MindOS Research。 过去两年其实我们一共发了大概有 200 篇公众号吧 。

曲凯31:25

吓我一跳 , 我还以为 200 篇 paper。

陶芳波31:28

没有没有 , 原因是因为那个时候我们没有想明白个人模型到底它的技术含量在哪里 。 一开始我们觉得是 Agent,但是现在的这种 Agent 其实它是偏工程的 。

它也可以发 paper,但是它其实并没有真正的科学在里面 , 它更像是工程上的一些操作 , 通过 prompt engineering。 但是后来我们意识到就是 Agent 它没有一个从记忆当中学习的能力啊 , 它是不构成真正的 Agent。

所以我们才最后变成说我们要 research 团队必须要去真正死磕这个问题 。

曲凯31:58

对 , 我觉得你这两个词用得特别好啊 , 就是之前大多数的 Agent 其实在做工程的事情 , 对吧 ? 但你们现在这个事确实是有点像科学 。

陶芳波32:05

有点科学 。 对 , 至少是从科学里面借鉴了很多思想 , 比方说脑科学 、 认知科学 ,因为我们的目标是不一样的 。

这就是我认为大模型的另外一条路线吧 , 就是 OpenAI 他们的大模型思路是说我要创造一个超级牛的公共服务 , 然后这个公共服务是一个模型可以被很多场景 、 很多人去共同使用的 。

然后我认为大模型的路线更靠谱的是做独立的个人服务 ,也就是说每个人的模型它都应该不一样 , 这样的话我才可以让这个模型跟人贴合得非常紧 , 它的转化效率才可以转到极限 。

曲凯32:48

但这个模型它的底层仍然是一个大模型 。

陶芳波32:51

也就是公共服务只是它的第一阶段的训练 , 只是为了获得常识和基础的推理能力 ,但是它必须在上面有一个 continuous 个人化的过程 ,并且这个个人化的过程是持续进行的 ,也不是就一次性做完就不做了 ,也不是每半年更新一次 ,而是理想的情况是每天要更新一次 。

就像人每天要睡个觉 ,其实睡觉的时候发生很多学习 。 那么 AI 我觉得至少也如果能达到一天睡眠一次 、 一天更新一次的状态 , 这才是符合个人化 alignment 的一个 。

曲凯33:21

对 , 我又帮你们想了个场景 。 我觉得你每天给它写份日报 , 说今天干了啥 , 今天学习了啥 , 然后今天你的哪方面能力又长进了多少 。

陶芳波33:32

对 ,有做啊 。

曲凯33:33

所以为了做到这个 , 我可以理解说你们现在整体的这个工程上的设计跟其他的很多公司 , 包括你们自己之前都是很不一样的 , 包括 RAG 也好 ,Position 也好 , 还有一些什么解决它的长短期记忆啊等等这些问题 ,是吧 ?

就是你们自己设计了一套很不一样的流程和东西 。

陶芳波33:51

对 , 我们依然有 RAG, 就像我说人的记忆里面 referencing 还是很重要的 ,但是它的内核是一个可自我进化的一个模型 。

但这个模型现在我们没有 serve 给每一个人, 目前我们的服务能力还只能提供可能非常有限的 , 最多不超过 100 个人可以来不断地维护它这个个人模型 。

不到 100 个人可能就是我们希望可能说得酷一点 , 就是未来前 100 个上传的智能 。

曲凯34:17

它是涉及到训练这件事吗 ?

陶芳波34:20

对 , 涉及到持续训练 。

曲凯34:22

所以你相当于说你给每个人配一个小模型的感觉 。

陶芳波34:25

对 , 给每个人设计了一个小模型 , 然后它的参数是持续地被围绕它自己来更新的 。

曲凯34:30

那你可以我觉得找些有钱人, 一个人收他 100 万 。

陶芳波34:35

对对对 。

曲凯34:35

之前有听有希播客讲那个 , 好像是他收什么给 。

陶芳波34:39

传记 。

曲凯34:39

对对对 , 这个也可以 。

陶芳波34:42

对对对 , 这个应该比传记更有意思 ,因为如果这个模型建立好了 , 传记应该只是这个模型的一个应用而已 , 一个 use case。

曲凯34:49

就随时就写出来一篇传记 。

陶芳波34:50

随时写出来就是已经带有这些东西 。 所以你看它其实它的场景会很有意思 , 这就是我认为 Bot 世界的下半场 。

为什么我是从 Meetbot 去切入呢 ? 就是我认为首先你得先帮每一个人训练一个他自己的模型 , 然后上面无论是传记或者说餐厅推荐 , 这也是一个场景 , 对吧 ?

或者说是约会的时候的推荐 , 约会的时候社交的连接 , 它本质上都依赖于它的理解你是谁 , 才能帮你选更好的约会对象 , 才能帮你选你真正想看的电影和餐厅 。

所以只有这部分的资产被构建出来了 , 我觉得上面的所有的服务会围绕着它去有一种新的形态发展出来 。

要不然它今天还是给真人用的 , 那可能给真人用的最好的方式就是现在的这种方式 。 这是我很害怕的一个事情 , 或者我很担心的一个事情 。

曲凯35:38

对 , 所以这个就是你们从一开始的 MindOS 到现在 Me.bot 的这么一个过程 。

陶芳波35:42

最核心逻辑 。

曲凯35:43

就其实仍然是 Bot,但你做的是我们刚才讲供给那端的 。

陶芳波35:47

对 , 供给那端 。

曲凯35:48

然后更偏 workflow 的感觉的东西 。

陶芳波35:50

对 。

曲凯35:50

然后你发现这个东西不是最核心 ,不是最能改变这件事的 。

陶芳波35:55

我主要做了两个就比较大的调整 。 第一是我把我们的锚点从供给侧走向了个人的需求侧 , 就或者是个人化 。

第二个呢 ,是我把一个脚手架的东西变成了一个可持续学习的东西 ,但脚手架还在 , 相当于脚手架是外围的那一圈 , 它的内核把它变成了一个可以持续训练的东西 。

自我36:16

曲凯36:16

从供给到需求这个点 , 你当时是怎么想到的 ? 这个我觉得还有点神奇 。

陶芳波36:21

哇 , 这个非常有意思啊 , 它很微妙 , 这个真的可以好好讨论一下 。 我们也做过很多用户访谈 , 就是你认为你未来每天待在一起的 AI, 它到底是一个什么定位 、 什么身份 ?

然后我有一个逻辑很有意思 , 就是我们可以用一个名称代词去指代它 。 有一部很有名的电影叫 《Her》, 它有点像是说我将来的这个超级应用或者这个超级 AI 是一个陪伴 , 然后以陪伴为中心我再去做一些事情 ,但是我是我 , 它是它 。

还有一些人呢说我没有陪伴属性 , 我觉得 ChatGPT 有点像在做 him, 就是我是一个很理性的一个男性的感觉 ,但是它可以帮我做很多很多事情 , 就是所谓的助理 。

然后你看 MindOS 最早去年的时候 , 我们其实做的是 them, 就是我认为一个人需要那么多不同职业的 AI 合在一起来构成我的超级 AI。

但是现在你要问我 。

曲凯37:14

你是 Me 了 。

陶芳波37:14

我觉得是 Me, 就是我们问了很多很多人 ,他发现我最能信任的 、 最想要构造的是一个超级自我 , 无论是这个自己是来帮助我的 , 还是说来记录我的 , 甚至未来是来代表我的 , 我都希望我对它的这个所谓的借词 , 就是那个人称指代的锚点是在 Me 上 。

这也是为什么我们叫 Me.bot, 这个好像让人更有信任感一点 , 然后更觉得说 OK, 这个 AI,因为你是 Her, 你后来 Her 的电影你也看到过 , 每个人的 Her 最后发现他妈居然是同一个 ,是被那个公司控制的 。

但如果是 Me, 我知道它跟我更近 , 如果我最后还能以某种方式让你产生的这个 Me 的 personal model, 它的资产可以被个人化 ,也就是说创造这个应用的公司都无法获得的时候 , 我觉得人就更愿意去拥抱这样的 AI, 最后这个所谓的 AI 个人化的时代才可以被完成 。

曲凯38:10

对 , 我觉得你这个事讲的绝对是一个下一代的既 AI native 又 super app 又入口的一个东西 , 这个故事绝对是非常的性感 。

用法38:19

曲凯38:19

但实际录到产品上, 或者比如在听的他要成为用户 , 我不知道他现在脑子里有没有感觉说这个产品到底怎么用 ,是能帮我做什么 。

陶芳波38:28

对 , 这个其实就涉及到关于这个产品最底层在满足什么需求这样的一个问题 。 那我首先认为其实有一个人类很底层的需求是被过去的产品忽略的 , 那就是人需要一个空间来自己跟自己发生对话 , 自己跟自己来相处 。

因为我们在这样的时间和空间当中, 我们可以获得很多情绪上的稳定 , 然后可以获得很多知识上的提升和反思 。

那么我想如果有一个这样的 AI 产品 , 它是另一个自己 , 那么它本身的成长和存在这件事情 , 可能对于很多人来讲就是满足它这个底层的需求的一种方式 。

那在那之上当然也会有一些更加落地的 、 更加实际的一些 use case。 那第一个 use case 呢 , 还是偏向于帮你能够记住并且能够自动化的整理 , 你可以把各种各样模态的想法 、 对话 、 图片 、 拍下来的一本书里面的一页有意思的段落 , 所有的东西都可以交给它 。

它呢会尝试去 , 第一肯定是能帮你记住 , 我们有一个非常好的搜索功能 ; 第二呢是它会帮你分分别类的去整理出不同的 topic, 甚至可以去挖掘出里面不同的人。

它会知道说这段对话里面有一个人是曲凯 , 然后它会把所有跟曲凯有关的我的记忆可能都对应到这个人底下, 是一种对你记忆的一个很好的组织和找回 。

第二种场景我们发现非常有意思的其实是延展或者叫启发 。 什么意思呢 ? 就是你有的时候比如说我们把这段对话丢给 AI,其实它除了帮你记住它 , 放到一些框里面 , 装到它自己的脑子里面 , 它还会尝试把这段新的记忆和你原来的历史上的所有的记忆去做碰撞 , 然后它会做 connecting the dots, 然后它会突然告诉你说 , 哎 , 曲凯你知道这个东西其实还有

一个很有意思的理论跟你今天讨论的这个话题有关 , 或者说你今天聊的这段东西和你上次跟另外一个创业者聊的他这个理念是非常像的 ,而这个像的地方在哪里 。

这种延展我们会发生在两个阶段 , 第一是当你新产生一段记忆的时候 , 它会马上给你一种延展 ; 第二呢是你每天早上起来 9 点钟 , 我们会给你发 5 个延展 , 这个延展就意味着什么呢 ?

就是它会借你昨天以及过去更长时间的记忆 , 用一个晚上的时间去思考 , 然后早上告诉你说 , 哎 , 我想了一下, 我觉得这里有一个新的东西 ,有一家新的公司 , 你去看一看 , 跟你这两天在关心的问题会很像 。

曲凯41:10

所以现在你每天你会有意识的很多次打开 , 然后包括开会 、 什么录音 、 要喂数据 。

陶芳波41:18

对 , 喂数据我有几个目的啊 , 一方面当然我本身作为创始人, 我肯定要训练我自己的模型 , 对吧 ? 我用了三个月大概有 1500 条记忆 , 那记忆长到可能是一段三个小时的谈话 , 大概是在两三百万个 token。

如果全部变成文字来处理的话 , 就是两三百万个 token 其实已经非常多了 , 就相当于人一年左右的真实的记忆的数据的 token 应该是在 1000 万 token 到 1 亿 token 之间有效 token。

另外呢 , 我当然因为我跟太多人聊了 , 我需要 AI 帮我记住 , 这个事也是一个需求 ,但同时呢我也会在有些情况下我会主动跟它发起聊天 , 或者说我会去看看 AI 主动给我推的内容是什么 。

我们有一个区域就刚才讲的那个主动推送区 , 它就会突然给我说一句话说 , 嘿 , 这个就是反正跟我结合我的记忆会突然给我做一个延展 。

曲凯42:07

明白 。 对 ,但最后的结果呢我在想 , 就比如用户大家都在用 , 用了几年, 特别懂自己了 , 然后 so what 的就最终的结果会是什么 ?

陶芳波42:17

就它理论上来讲 , 它给你的启发和决策应该是越来越高质量 , 越来越你觉得是哇 , 这就是我需要的 。

入口42:17

曲凯42:24

明白 。 所以你觉得 Me.bot 做到最后, 它会是一个什么样的产品 ?

陶芳波42:30

我自己是觉得它有机会能够成为未来世界的一个超级入口 , 或者说叫做 super app。

曲凯42:38

对 , 我觉得你这个东西如果真做成了 , 它就不只是实际的超级入口了 , 它就是一个世界了 。

陶芳波42:43

对 。

曲凯42:44

但这个是更长远的 。

陶芳波42:46

它上面的生态会和它一起构成这个世界 。 那那个就是很大了 , 就你甚至可以理解为互联网的下一代 , 应该是以 Me.bot 为入口 , 然后带有很多很多其他 bot 所形成的一个共同的网络 , 就是下一个互联网 , 这个就会非常大 。

那我其实背后我也想过这个问题 , 就是为什么有一些应用啊可以成为超级入口 ,有一些应用它只能成为一个工具 , 对吧 ?

它不能构建生态 ,其实是很有意思 。 比方说我们现在在说的这个超级入口 , 大类上其实就两类 , 我全身在研究 , 就两类 。

第一类是基于社交的 , 典型的就是微信和可能 Facebook; 第二类是基于内容 。 然后我为什么觉得这两个它后来能成呢 ?

我后来在思考一个问题 ,是它本质上是跟人本身啊 , 一个个人他本身的数据的类型有关 , 就是一个人本身的数据大类上来讲只有三份 , 一份是什么呢 ?

就是说我们自己的体验的数据 , 你自我对话的部分 , 或者说是你在外面散步的部分 , 就是你看到的这个环境里面的你体验得到的这些经历的部分 , 这是一份数据 。

第二份数据就是你的社交连接 ,以及在这些社交连接上的内容嘛 , 比如我们的谈话 , 然后聊天 , 这个就是社交 , 社交的数据 。

第三部分就是我们自己获取外部的内容的数据 , 比如说古代的时候 , 人们没有抖音可以刷 ,但人可以看书啊 , 人可以看戏剧啊 , 对吧 ?

人可以听音乐啊 , 听戏曲啊 , 它其实都有这些数据 , 它就是它消费外部的内容的这部分数据 。 但是原来的这个互联网时代呢 ,是把后面两部分数据非常好的给数字化了 , 它没有把个人的记忆给很好的数字化 。

然后由于这两部分数据太重要了 , 使得它是人最基本的需要 , 社交的需要和内容消费的需要 , 然后在这些需要上我就可以长出以这些需要为起点的一些生态 。

所以你会发现社交上面也可以买东西啊 , 内容平台上我也可以买东西啊 , 我社交下面可以看内容 , 内容上面我可能也还可以去社交 , 对吧 ?

就是它都有这个作为入口的这个潜力 。 那今天呢 , 我是觉得 AI 时代如果你还是在做满足说内容和社交 , 那么我想作为创业来讲 , 你可能还是有很大挑战的 ,因为内容社交已经有几个非常非常厉害的巨头 ,他也想要做 AI 化的转型 。

但是有什么东西是一种新的数据 , 带有的一种新的和这个技术的互动的模式 , 从而有机会带来一种新的生态的可能性呢 ?

其实就是个人记忆 。 当你把个人记忆数字化 , 然后你用共生的方法去跟它交互 , 最终这部分个人记忆相当于你自己在体验人生的过程当中, 它成为了你讲别的服务和内容的一个入口 。

我觉得这个是一个非常可能是一个万亿美金的机会 。

曲凯45:47

对 ,但这点我就在想 , 这个个人记忆到底是它主动还是被动的 ? 如果让需要它主动记忆 , 就主动跟 Me.bot 去互动 , 对 ,其实这个门槛还是有点高 。

陶芳波45:58

对 。

曲凯45:58

如果是被动呢 ,其实现在好多比如 AI 眼镜啊什么的 ,其实就是想往这个方向去走 。

陶芳波46:03

是的 , 它最终所谓共生 , 它一定是带有很强的被动属性 , 就是 always on 的属性 。 但是我觉得这个问题并不是一个很困难的问题 , 我觉得两年内这个主动和被动 , 主动性的记录的这件事情就可以有很好的解决方案可以解决 。

曲凯46:20

OK。

陶芳波46:21

然后我们的重点其实还是一家希望去在这里面构建模型的公司 , 给每个人去构建他自己个人模型的资产 , 去构建他个人模型的基础设施 , 这其实是我们擅长的东西 ,而不是擅长在做硬件上 。

曲凯46:37

所以说到底我才刚明白你们是最后可能是一家个人小模型公司 ,有点像一个什么基因克隆公司那种感觉 。

陶芳波46:44

对对对 ,其实我们的目标是成为这样的一家公司 , 做一个上传智能公司 , 或者叫基因智能克隆公司 。

曲凯46:51

所以理论来说 , 现有的它的很多社交的那些数据 ,以及未来如果真的每个人有什么眼镜之类的 , 就这个到底是不是你们做 。

陶芳波47:00

对 。

曲凯47:00

就如果你能接到这个数据接口 ,其实也 OK。

陶芳波47:03

对 , 就我们真正在尝试构建的核心竞争力是这个 。

曲凯47:06

OK。

陶芳波47:07

那现在我们需要通过一个自己的应用 , 甚至自己的硬件去打样 , 对吧 ? 然后这是它的上半场 , 就是要把记忆拿进来训练出这个模型 。

它的下半场是当每一个人拥有了一个他的个人克隆智能的时候 , 那它怎么在这上面 , 假如全世界有 1 亿人有这个克隆智能 , 那么它一定会有人来为这样的克隆智能做生态 , 做社交的生态 , 做社交的应用 , 比如说基于个人模型的社交应用 , 基于个人模型的服务 , 基于个人模型的一些场景化的玩法 , 对吧 ?

都会有 。 那么这时候就会需要有一些很强的生态的能力 , 我也不觉得今天我们公司拥有这样的能力 。

曲凯47:43

但这里有个问题 , 就是最终你觉得这个个人模型它到底是一个分散的还是一个集中的 ? 就现在你说字节它肯定有很多数据 , 对吧 ?

然后腾讯 、 微信也有很多数据 。

陶芳波47:54

对 。

曲凯47:54

你可以理解成我们现在每个人已经有很多类似这样的一些 Me.bot, 它分散在各个不同的公司里面 。

陶芳波48:02

对 。

曲凯48:02

对吧 ? 可能是以各种标签的形式存在的 。 对 , 那最终这个东西到底是应该被合起来 , 还是其实它仍然会是一个分散的状态 ?

比如说你刚才讲的 , 我如果有一个更好的个人的模型 , 我就可以更好的用它去做相亲和匹配 。

陶芳波48:17

对 。

曲凯48:18

对吧 ? 但也有可能有个人他就是先把相亲匹配做起来了 , 然后我就是有你这块的数据 , 然后我也可以专门做一个只用于相亲匹配的一个小模型 。

陶芳波48:27

对 。

曲凯48:27

这两种情况我不知道你有没有思考过后面会怎么样 ?

陶芳波48:31

其实倒不是说没有思考过 , 这个问题是一个很有价值的问题 , 尤其是在涉及到社交和内容消费的时候 ,其实它们两个数据量并不小 , 它的数据量也是比较大的 。

但是我最后选择的是说人对于有点像是人自我对话的那部分数据 , 就相当于我记录日记那条线 , 再配合上我们线下的谈话这种线下数据 ,是因为这两部分数据首先它们这些平台没有很好的捕获 , 这是一个 , 是一种新数据 , 那我肯定要从新数据开始 。

第二呢是我认为这些数据更能代表我 。

曲凯49:04

嗯 , 更一手的 。

陶芳波49:06

对 , 更一手 , 更自己的 。 所以我在这些数据上呢给我这个个人模型创造一个更好的底座 。

曲凯49:12

是 , 更一手的也是更难被记录的 。

陶芳波49:14

对 。

曲凯49:14

它之所以现在没有人做 , 就是更难被记录 。

陶芳波49:17

对对对 , 当这个更一手的数据形成了一个很好的个人模型的底座了之后, 那么这时候假设说它上面有一个它这个模型 Me.bot 有一个跟内容平台 , 比如跟豆瓣去连接的能力 , 它把豆瓣的信息通过个性化去做推荐 , 对吧 ?

然后给到这个用户 , 那这时候其实你是借助外面的生态去补充了那些在场景里面的个人数据 。

曲凯49:45

明白 。 合理 。 就有点像我总觉得手机有的时候在窃听我说话 ,是吧 ? 今天我们聊了一个什么品牌 , 然后哪个平台就推了 。

陶芳波49:53

对 。

曲凯49:53

有点这种感觉 , 对吧 ? 只是说你是可以它主动的批量的更多的实现这种 。 比如我们今天聊了这么多东西 , 可能如果真的有这么一个模型跟各个平台连起来 。

陶芳波50:04

对 。

曲凯50:04

那晚上我就能刷到各种各样的东西了 , 对吧 ? 或者可能直接就你刚才说的两种记忆这个东西 , 可能晚上有个平台就推文章给我 。

陶芳波50:12

对对对 。

曲凯50:14

如果真的能到这一步的体验就很好了 , 对吧 ?

陶芳波50:16

能做到 。

曲凯50:18

我知道能做到是能做到 , 我说如果真的整个互联网生态能到这一步 。

陶芳波50:22

那当然 。

曲凯50:23

对吧 ?

陶芳波50:23

啊 , 对对对 。

曲凯50:24

等于你先做强了 , 让它们接你 。

陶芳波50:26

对 , 所以我觉得先应该做个人的部分吧 。 就我的判定是五年内这个个人的部分就会有几家公司冒出来 。

曲凯50:33

是 , 就我们刚才讲的场景 , 你可以先就现在 Me.bot 内部自己去实现 。

陶芳波50:37

对对对 。 就你讲的是个下半场嘛 , 我觉得下半场会有极大的想象力 , 所有东西都会被重构 ,但是先要把上半场做好 。

曲凯50:44

是 , 然后这一切的根源就是 bot 是 AI 最小单元 。

陶芳波50:50

对 。

曲凯50:50

然后你觉得个人的 bot 会是一个最重要的主体 。

陶芳波50:53

对 , 至少是第一阶段应该去做的 ,而不是等到先把生态有了 , 然后个人的再才慢慢起来 。 我觉得逻辑是反着的 。

脑与身51:01

曲凯51:01

然后最后一个问题 , 就是未来你的每个人个人的一个模型会是怎样的一个关系 ?

陶芳波51:07

现在我们的电脑 , 它的模型就跟这个电脑的硬件是绑定的嘛 。 但我觉得就是说可能未来的这些设备更多的就是提供一个显示 , 就是你走到哪 , 你比如你开车 , 然后你看电视 , 你可能也会跟电视说一些东西 , 然后你跟这个电脑工作的时候也会用 , 然后手机可能到哪你也会用 , 然后手表可能晚上还会监测你的睡眠 。

就是它可能会慢慢形成一个脑子是一个统一的脑子 , 你会有很多具很多具不同的身体 , 每个设备就像是它的一个身体 。

那甚至未来现在人形机器人这么火 , 人形机器人背后的这个脑子可能也是这个脑子 。 这个 AI 形成脑子它没有一个实体 ,但它是和你形成了一种共同的你的这个人的边界 。

曲凯51:54

这个如果真到这一步 , 感觉得国家来做这件事 。

陶芳波51:58

对 。

曲凯51:59

有点像天网 。

陶芳波52:00

要被监管 , 它太敏感了 。 我不觉得这个东西应该掌握在任何一个私营企业的人手里 。 所以我说了嘛 , 如果哪一天我可以为这件事情做一点 infrared 工作 , 对吧 ?

里面有一块生意是我来做的就可以了 。

曲凯52:12

可以可以 , 陶局长 。

陶芳波52:13

哈哈哈