开场0:00
There's something there.
我们今天很开心又请到了 Albert。 之前其实 Albert 在我们这边做过两次播客 ,是我们非常受欢迎的嘉宾了 。Albert, 你先再跟大家打个招呼吧 。
大家好 。
你最近在忙啥 ?
最近在研究有没有什么交互上的突破 , 能够更好地释放模型的能力 。
我感觉你这 3 年吧 ,23 年到现在 , 正好 3 年差不多 ,其实试了蛮多产品和走了蛮多方向的嘛 。 然后中间也有些成绩 , 对吧 ?
你上一款产品大概也做到小几千万刀 ARR 嘛 ,是吧 ?
也不能算是做了很多方向吧 。 我们其实到 25 年的 10 月份之前 , 都还是相对来说比较专注在影像方面的产品上, 然后对于智能本身一直在观察 ,但实际上参与的呀 、 思考的呀 、 实际去尝试的是比较有限的 。
其实我们一开始在 24 年前后, 智能方面和想象力方面同时都在做尝试 ,但实际上影像方面 , 就想象力方面的产品更快地 PMF 了 , 智能方面就收缩了 , 所以也错过了很多吧 。
对 , 要不我们从头捋一下吧 。 从 23 年开始 , 你给大家讲讲这 3 年来你在做的一些尝试 , 然后包括一些思路吧 。
赔率追求1:38
我实际上还是经历了两个阶段的变化 。 我觉得我第一个阶段之前还是看赔率大于看胜率 , 就是我去思考一个问题 , 一个商业的产品 , 思考的更多是假设这件事情发生了 , 它能创造多大的价值 , 它能具备多强的壁垒 。其实是从这种视角出发的 。
那自然而然 ,其实你推导出来的结论就是怎么去用好这个技术变化的这个巨大的榔头 , 然后去创造一些基于我们以前经验里面已经被验证过的一些商业的形态 。
然后我一开始其实 23 年初的时候 , 对于整个 AI 的这个变化 , 实际上是相对来说比较乐观嘛 , 然后比较想要去做这种超强的网络效应 、 超强的规模效应这种业态 。
加上我自己之前一直是做连接和内容出身的 , 就一直沿这个视角在往下走 。 所以第一期播客我们录制的时候 , 我那时候一直在探索互动内容的平台嘛 ,23 年前后的时候 。
当时我们认为就是 AI 这一波可能的大机会 , 就你还是得去想想看有没有连接平台的可能性 , 尤其是以内容为核心载体的这种连接平台 。
所以那如果你要去定义这样一种产品形态的话 , 核心你就要去找到一种新的媒介 。 然后我们当时认为互动内容和传统的视频啊 、 图像啊这种消费式的内容 , 实际上还是有一定差别的 。
加上 AI 又解锁了这种 Coding 的能力嘛 , 所以使得这个互动内容背后的这个逻辑可以被更容易地去创造出来 。
所以就开始往这个方向去做 。 但实际上 Coding 的发展是不及我们预期的 。 然后在那个时间点呢 , 我又意识到了几个问题吧 。
我们也做了两个 demo, 一个是偏图像和视频方向的 2D 的交互方式的一个 demo, 然后也做了一个把交互方式改成非 2D 的 , 改成一个手机上的这种摇杆的控制器 , 甚至在 PC 上也做了一个更像游戏的客户互动的空间 。
这两个 demo 然后做完以后, 我最大的体感就是我很难回答为什么我不玩玩弄药 , 为什么不刷抖音 , 就我觉得做出来的东西太烂了 。
这就进一步让我产生一个思考吧 。 我觉得在内容的这个市场里面 , 创造门槛越高的模态 , 实际上它越是供给稀缺的 ,因为用户的时间是有限的 , 大家只会消费最头部的 1% 的内容 。
但是当时的这个 AI 的水平 ,其实你只能去做出 60 分的内容 、70 分的内容 , 甚至 80 分的内容 。 但实际上 80 分的内容其实就是垃圾 。
所以我觉得如果是 for 消费这条线的话 , 这个事情肯定是不 work 的 。 如果是 for 表达的话 , 它可能是有一些价值的 。
这里的区别就是说用户他的创作动机到底是 for 创作 , 还是 for 更功利的这个目的 , 比如说去赚钱或者获得影响力 , 对吧 ?
所以我觉得这个是有很大差别的 。 但是就模态创作的成本 , 参与的成本越高 , 那么实际上它对应的这个供给驱动的这个特性就越强烈 。
所以我当时就觉得在相当长一段时间内 , 即使 AI 可能已经比较 ready 了 , 实际上你也很难去做到完全依赖 AI 的能力让一些人创造出好的内容 。
尤其是如果你的核心目标是以降低门槛为切入口的话 , 那我觉得这个就更不 make sense。 因为你降低的门槛牺牲的是什么 , 对吧 ?
当然有可能 AI 可以突破这个自由度和门槛的 trade off, 那可能这件事情会变得有一些不一样 。 但是我觉得即使在工具这一侧 , 你有一些比较好的解决思路 , 然后 AI 的技术也比较 ready,但实际上你在分发这一侧还是会有比较大的障碍 。
因为我们就拿互动内容这个模态类型来讲 , 那如果它是一个更偏游戏的这种内容形式的话 , 那实际上你很难做出超越比如说 Steam 或者超越 App Store 或者超越 TapTap 的这种价值和体验吧 。
即使就供给爆发了 , 实际我觉得也很难有一个这种平台级的机会 。 然后如果你是一个更偏 2D 的这种影视类的这种参与的方式 , 对吧 , 那你在现有的容器本身去要迭代这个方向 , 我觉得也没有特别大的障碍 。
所以我觉得整体这个机会可能是比较有难度的 。 然后我觉得这个倒不是让我 pivot 去转型的那个核心原因 。
胜率转向6:10
我觉得核心原因是说 , 我觉得之前想要去做连接平台这个整体的思路 , 还是被中国市场的特点所影响 。
就因为中国市场的特点是说 , 你如果没有这种强规模效应 、 强网络效应的这种平台的话 , 实际上你很难在跟巨头的竞争中获得任何优势 。
所以实际上你的这个胜率是非常非常低的 。 但是呢 , 当我去研究一些美国市场的情况以后, 我发现其实它还是有大量的这种 niche market, 还是有很多的这种机会的 。
显然是有一些这种有一定胜率空间的事情存在的 , 即使它不是那么的大 。 所以我觉得到 24 年初的时候 , 我就完成了一个切换吧 , 就是从赔率追问变成了胜率追问 。
我觉得 AI 这个事情是一个非常非常长的赛道 , 然后那你核心还是说要去找一些确定性更高的事情先参与进来 , 然后在这个过程中去锻炼团队 , 积累认知 , 找手感 , 对吧 ?
所以这也就是我们 24 年那期播客我主要讲的那件事情吧 , 就在讲正反馈 、PMF 讲这些东西 。 所以我在 24 年初的时候 , 切换到胜率追问的这个状态下以后, 做的更多的一件事情就是在研究现在有哪些技术已经 ready 了 ,但是有一些存在的用户问题没有被解决 ,也有一些方法吧 。
这个方法我其实在上期播客也讲过嘛 , 就是具体我们怎么去分析 , 怎么去看历史重复的回响 , 然后在这里面找到一些机会点 。
然后我们在 24 年的 6 月份就找到 PMF, 就一路 scale, 然后开始增长 ,也一直都比较顺利吧 , 属于这种状态 。
这个中间其实就没什么可讲的了 , 就 scale 这件事情其实跟传统的互联网公司也没什么区别 , 就该怎么招人啊 、 定义你的核心指标啊等等等等。
AI Coding7:57
然后再到去年的 9 月份前后吧 , 然后我们也遇到一些来自于外部这种挑战和压力吧 , 然后我们自己也在思考说 , 哎 , 可能需要去找一些新的可能性 、 新的机会 。
然后在这个过程中就尝试做一些新项目嘛 。 因为一直以来 , 就是 25 年从那个 Claude 3.5 以后, 实际上就 Coding 这件事情变化还是很大的 。
然后我们一直以来都想要去把公司的组织逻辑更偏向 AI 这个方向去转变 ,但实际上一直推进都不是很顺利 。
因为老项目整体的这个架构和代码量已经很大了 , 然后它只能去让 AI 做一些局部的修改 。 所以这个也搞得我们也很痛苦 , 就是整体想要去提效 ,但实际上历史包袱太大 。
但是我们在做这个新项目的时候 , 我们就定要求嘛 , 就是说这个项目必须要人工代码量 0, 然后完全交给 AI 来写 , 看看会怎么样 。
然后中间所有的需要去设计的东西 、 人需要去参与的东西 、 所有工程化的东西全部交给 AI,并且在职能上也全部不让工程师去参与需求的研发 。
跑得很顺利 ,其实也没什么挑战 。 然后再到整个 25 年底吧 , 然后我们再去回看的时候 ,其实发现 , 包括其实它跟 Claude Opus 的这个模型也有关 。
因为之前如果用一些别的模型的话 , 实际上它也很难去 follow 我们制定的规范 。 但是 Opus 对于规范的 follow 的能力会有大幅度的提升 。
这个事情也使得非工程师去写需求有了一个更明显的提升 。 然后真的我们开始在去完全导向一个 AI 组织逻辑的这个过程中, 我们就发现其实智能的这个发展已经完全超出预期了 。
然后在这里面有非常非常非常多可以做的事情 。 然后我们整体的思考两件事情吧 。 第一件事情是说 , 就是 Coding 本身就代表着提高智能上限的手段 。
然后呢 , 那基于 Coding 这件事情呢 , 我觉得它在用户群和场景的选择上有非常多可以去挖的地方 。 比如 Cursor, 对吧 ?Cursor 其实一开始就是做给程序员的 , 它是一个 IDE 的工具 。
然后再像 Laubo, 对吧 ?Laubo 可能就是做给设计师的 , 就实际上你不用去操控一个 IDE。 然后再往后, 比如像 Replit, 可能是做给产品经理的 。其实你看在 Coding Agent 的这个方向里面 , 实际上就可以不断地往下切 , 切出来很多东西 。
那实际上这件事情的本质是什么呢 ? 其实它就是 Coding 能力的平权 , 就是 Coding 的这个权利可以被掌握给很多很多不同的群体 ,而挖到这个群体 , 然后为它设计一个好的容器 ,并且对应去解决除了 Coding 以外你要去解决的问题 。
我觉得这就是一个非常核心的第一个视角 。 然后第二个视角跟第一视角有点相关 , 就是说在不同的任务类型上, 围绕着交付 , 实际上是会有不同的交付形式的 。
核心是你不能让这个交付本身成为模型的限制 ,而应该去让交付来放大在这个场景上模型的能力 。
所以围绕这个视角呢 , 实际上你又是可以去找到很多 , 就是是所有的 Coding Agent 都应该是 chat base 的吗 ? 我觉得这个是不一定的 。
所以沿着这两个思路呢 , 我们其实就在试图去尝试 , 就是什么样的一个人群应该拥有这个 Coding 平权 , 然后并且它是有极高价值的 ,并且什么样的交付形式能够最大化地释放在这个场景服务于这个人群这个模型的能力 。
现在我们其实就是在探索这件事情 , 然后我们也有一个产品正在这个研发过程中 。 然后在一些特定的这个任务类型下 ,也完全超出我们的预期 , 就是它的无论是从易用性也好 , 还是从智能表现出来的效果也好 ,是比传统的 , 比如说我们用 Cursor 也好 , 对吧 ?
或者我们用一些其他的可以解决这个任务的工具也好 , 会有比较好的效果的提升 。 所以我觉得这是我们现在整体研制的一个主要的方向吧 。
所以你观察我们过去这几年的整个一个 loop, 我觉得其实就是一个交往必须过境的一个状态 。 就是你从一开始 , 对吧 , 完全优化赔率 , 然后切换到超级接地气 , 对吧 ?
可能也有一些行业里的人知道我做了一个什么样的产品 , 大家都觉得不可思议 , 为什么会做一个这样的产品 , 对吧 ?
很奇怪 。 但实际上对我们来说 ,其实就是无尽优化胜率的一个结果 。 我们就是想利用现在已经成熟的技术 , 然后去找一个非常 niche 的 market, 然后去科学 scale 它 , 然后把 scale 的方式做到理论上应该做到的样子 , 去看它会怎么样 。
那这其实就是一个交往过境的状态 。 然后再到我们去年说 , 我们说啊 , 这个东西好像不太对 , 对吧 ?
我们要现在导向智能 , 然后去看看有什么样的可能性 。 就是又一竿子抽到底 , 就是把我们之前可能一些积累啊 , 一些东西全部忘掉 , 然后重新开始 。
所以整体就是一个这样在极端中间游走的一个过程 。
我觉得你这个信息量非常大 , 讲得很长 。
我捋了一下 ,其实你讲的里面有几个点我们可以再拿出来讨论啊 。 一个点是你在很多次都讲过 , 你们把 AI 分成想象力跟智能 , 对吧 ?
这两个大的方向 。
对 。
我觉得这个是一个我们可以讨论的 。 然后就是那个胜率跟赔率 ,其实你也提过很多次 , 对吧 ? 我们也可以讨论一下 。
想象力与智能13:00
然后我们可以再讲讲新的一些产品和方向的东西 。 先讲想象力和智能 。其实你所谓的想象力就是更偏图像呀 、 视频呀 , 这些互动类的内容 , 对吧 ?
这个是画在想象力里面 。
我一开始去思考想象力和智能这个问题的时候 , 我实际上是在回答 AI 在 Qtime 和 Save time 这两件事情上的差异 。
就是如果你最终服务的目的是希望帮助用户杀时间 , 然后获得某种过程性的体验和乐趣的话 , 这是一种类型的场景和目的 。
然后另外一种类型是说帮助用户省时间 , 对吧 ? 帮助用户去节约成本 , 帮助用户去完成任务 , 尤其是一些纯结果向的任务 。
它不是个过程体验 , 它是个结果性的体验 。 那么这实际上又是另外一种目的和类型 。 然后我觉得在这样的一个角度下, 它刚好呼应了在当时那个阶段模型的两个方向嘛 , 就是 language model 和多模态的模型 。
我觉得这其实是 video 的这个 model 和这个 image 的 model, 它其实呼应了这两个模型 。 然后在当时那个节点下呢 , 实际上我们还没有看到这两个模态有很好的交汇 , 甚至在今天可能也还不够好 。
当然 Gemini 其实也有一些尝试嘛 , 就是它实际上 Nano 可能就是在 Gemini 的这个底模上把 decoder 改了一下, 结合了一下, 可能 Gemini 拥有了极强的理解能力 。
因为这个理解能力变好 , 使得图像生成能力也有更大的提升 。 所以这两个模型本身会不会交汇 , 我觉得这个不好说 。
我也不是专家 , 很难回答这问题 。 但是我觉得长期来看 , 我们去把 Save time 和 Qtime 去分开 , 我觉得这个还是 make sense 的 。
所以实际上就我们过去而言 ,因为模型本身有比较大的差异 , 就是你到底是个 language model 还是个 image 或者 video 的 model, 然后导致我们的创业机会往往在这里面可能要去做选择 。
这个是一个现实的不得已的问题 。 但是在今天这个多模态的能力已经有一个比较大的变化的情况之下, 这两件事情是否会交汇 , 这正是我们此刻正在探索的一件事情 。
就是我们现在就是在试图找到智能更好地运用在多模态的这样一个场景下, 就这种结合方式 , 这就是我们现在正在做的 。
嗯 , 明白 。 对 , 那我们还是先分开讨论一下, 就是至少当下这两个还是能分开的 , 对吧 ? 我们先说想象力这一块 。
就是如果我们把多模态更多地归到想象力的话 , 现在其实多模态也分成两条线 , 对吧 ? 一条线是也是工具产品 , 比如说给营销的人用的 , 给什么专业创作者用的 , 它其实也是一种省时间 。
然后另外一条线就是现在大家也做得比较多的 , 像什么陪伴类的呀 , 或者一些这个互动类内容啊等等。
这两条线你是怎么看的 ? 首先 。
我觉得陪伴现在肯定是一个很真实的方向 ,但是我很难评价它的这个商业化效率到底怎么样 。 接下来会怎么演化 , 我觉得这件事情很难讲 。
然后工具肯定是目前确定性最高的 , 对吧 ? 然后商业化你整体也非常清晰 。 只是它的产品形态还是上个时代这种产品形态 , 就是它其实是把提供服务的能力从干换成了 diffusion。
然后我觉得肯定是说整个模型发展的方向是我总是会提供更好的模型能力 , 然后售卖更高的价格 。
就此刻现在是这样的发展 , 上一代的模型能力到底会不会降价 , 打个问号 ,不知道 。 这可能是平台自己的这个商业决策 ,但实际上它的真正的这个推理成本有没有下降 ,其实也没有 。
所以核心是说好的效果的溢价一直存在 , 一直存在 。 那么到今天为止 , 真正你想去做一个娱乐型产品 , 就非工具非生产力向的一个产品 , 实际上你想用最好的模型效果 , 几乎是不可能的 。
就是你 business model 是站不起来的 。 所以我觉得在今天去看 , 实际上陪伴 , 呃 ,不能讲陪伴吧 , 就是整个泛娱乐这个方向 , 我认为距离真的有一些有影响力的东西出来 , 可能还需要些时间 。
然后那工具肯定是现在最确定的 ,而且我觉得也会持续一段时间 。
嗯 , 就是工具里面其实已经跑出来非常多了 ,不管是 Higgsfield 的 Opus 还是 Higgsfield 的等等 ,其实是我觉得已经被验证的一条路径 。
你们之前那个产品几千万到 AR 其实也算是工具产品嘛 , 对吧 ?
是的 。
对 , 然后互动类的我们之前就讨论过 , 它的问题就是你再怎么做 , 可能也很难超过当下抖音啊或者王者这种的体验 , 对吧 ?
因为从 AI 角度来讲 , 大家可能觉得说 , 哎 , 模型能力涨了很多 , 我已经从比如说二三十分涨到七八十分 , 对吧 ?
已经做出来挺好的东西 ,而且它很新 ,但用户其实不太 care 这个东西 。 就好像我用最传统的手段 , 你别管我怎么做的 ,但我最后 deliver 的那个结果可能是一个 90 分的东西 。
那你不管用多新的方法 , 你做出来一个 80 分的东西 , 从用户角度它就是不如 90 分的好 , 对吧 ?
所以可能大家还是仍然在 2C 的这种泛娱乐吧 , 互动内容啊等等这个方向上, 还没有达到那个转捩点 。
嗯 ,因为时间是有限的 , 用户的时间始终是有限的 。 然后这个好内容的竞争它就是持续的 , 所以最终它是一个左脚踩右脚啊 , 就是大家对于内容的需求越来越高 。
当然如果你的容器类型能够在这里面起到助攻作用的话 , 那其实就很好 。 比如你看短视频就标准的嘛 , 实际上你每一刷的内容它都是足够优质的吗 ?
那不一定 , 对吧 ? 它可能是有一些是非常好的内容 ,有一些可能也就那么回事 。 但这个容器本身可以帮你形成这个习惯 , 然后 hack 你的行为 , 使得你可能更容易沉迷 。
但如果在容器上你没有找到一些很好的方法 , 对吧 ? 尤其是这种长时间的内容 , 对吧 ? 需要占据用户时间的内容 , 那它的参与成本其实很高呀 , 如此之高的参与成本 , 对吧 ?
那用户的决策心智决策负担也很大 。 那最后使得这种内容的竞争是极为激烈的 。 就是传统的 , 比如像游戏这种内容 , 就越沉浸的内容 , 它参与成本越高 , 它的竞争越激烈 , 那你最后就越是一个供给稀缺的这种 , 可能就是 0.0001% 的人在创造最好的东西 。
嗯 , 所以现在也很多人讲说要做下一个抖音 。
现在还有人很多人讲 。
还是有的 , 还是有的 。
好的好的 。
就或者说至少大家还在想说下一个抖音是什么嘛 。 但目前这么捋下来 ,其实重点可能不在于说我能生成个好内容 , 对吧 ?
我哪怕最后生成内容比现在人制造内容更好 , 你仍然大家会去抖音里消费 , 或者是会上传上去 。
所以更多的是像你刚才提的那个容器的概念 , 就我需要一个很新的交互 , 然后这个交互和我的内容是契合的 ,而且我这个内容呢只能在这里面体验 , 所以大家才不会把这个内容上传跟去其他地方去消费 。
这个其实是个重点 。
对对对 。 然后补充一点吧 , 我觉得核心是说最好的内容一定会流向变现效率最高的地方 , 对吧 ?
那变现效率被什么决定呢 ? 被你的规模效率 , 被你的网络效率决定 。 那所以已经存在的平台天然有一个巨大的优势 , 对吧 ?
如果你不能创造出新的形态 , 只是说你在工具侧有了一些制作好内容的能力 , 那你其实也是没用的 。
就是哪怕你现在做了一个非常好的剪辑软件 , 对吧 ? 这个剪辑软件做出来的内容去哪了 ? 哪来去抖音 , 对吧 ?
去 Netflix,不会去别的地方 。 所以我觉得这个是一个致命的影响吧 。
嗯 , 所以我还想再回顾一下, 你看我们回到抖音早期的时候 ,其实它的交互没有做多大的创新 , 对吧 ?
它就是上下滑 , 只不过可能是因为各种 , 比如说网络基础设施啊 , 流量成本啊等等这些在发生变化 , 对吧 ?
然后它发现了某一个大家之前因为各种原因不能做的事情 , 然后它把这个东西定义出来 , 然后推广出来 , 这个模式就起来了 。
可以这么理解吗 ?
我觉得其实我们对于过去的这个媒介类型这件事情 , 我觉得今天依然是这样的啊 。 就是说最终你找的这个闭合的商业模型 , 闭合的这个产品体验 , 它应该首先是你的用户 , 对吧 ?
然后第二是你的这个模态类型 , 然后第三是你的内容类型 。 这三个东西同时交互聚集在一起 , 然后它才能够定义出一个成功的一个产品形态 。
那比如说对于小红书 , 对吧 ? 那它就是用图文来承载有用内容 , 然后给一二线城市的女性 , 对吧 ?
那这个东西就闭合了 。 然后呢 , 比如说抖音当时, 对吧 ? 它就是短视频 , 它的内容就是那些啊炫酷的运镜卡点这种 , 通过剪辑时间轴的这种玩法 , 分段拍摄的方法 , 然后来体现出一种剪辑的差异化的消费的体验 , 加上音乐的 BGM, 对吧 ?
那它给的是这帮唱跳很好的这些啊 , 长得也很好 , 摄像头权利很高的人, 对吧 ? 那它这个东西也是闭合的 。
然后包括内涵段子当时, 对吧 ? 它的这种啊图文的混拍 , 就是去讲这种搞笑内容 , 这种段子 , 然后这种低俗笑话 , 对吧 ?
它可能是对于十八线城市这种个体户 , 这它是闭合的 。 所以你总是要找到每模态和这个用户和你的内容类型上的一个闭合 , 然后它才能够比较容易的完成轮启动 ,以及向后去 scale, 然后再进一步的去尝试这个东西的泛化 。
你比如说像内涵段子这个东西的泛化 ,其实就很难 , 对吧 ? 你只能从那个娱乐的内容你向下一步走 , 你走短视频 , 对吧 ?
单纯的这个内容题材的垂类 , 实际上是抵挡不住模态的垂类的牵引的 , 对吧 ? 那这个就尴尬了 。
那你像抖音 , 对吧 ? 它其实就是把短视频这个媒介占下来 , 然后你像小红书 , 对吧 ? 它就把图文有用这个媒介给占下来了 。
因为你当时的那些购物的这种分享呀 , 它可以演化成后面的一些化妆呀 , 求助呀等等等等 , 它其实都是在图文这个形态下, 它的表现效率就是显著比短视频更高导致的结果 。
所以我觉得最终我们去看这件事情 , 它的发展实际上它是有很多很多的巧合和很多很多的设计叠加在一起的 。
也许一开始你找到一个形态很好 , 对吧 ? 我记得当时有一个产品叫火银 , 还叫什么 , 就一开始它应该是行业内第一个在中国做全屏体验的一个产品 , 一度跌有很高 。
它的那个用例是什么 ? 好像就是动态桌面的分享社区 , 大概是个这样的东西 。 那它这个内容形式就跟它的这个用户和模态就不 match。
它虽然当时一度 , 对吧 ? 有一定规模 ,但最后其实也没用 。 所以当时其实有很多这种短视频产品 ,其实都是没有很好的去定义这三者的交汇 , 然后导致后面实际上基本都消失在历史舞台中了 。
嗯哼 , 所以你现在相信会有下一个 AI 时代的抖音吗 ? 还是你觉得其实就是抖音 ?
我觉得你要看你要怎么定义抖音了 。 就是我当时从字节离开的时候 , 原因是我发现整个 mobile app 移动互联网 , 除了微信以外, 没有任何一个 DAU 超过 1 亿的 native mobile app, 没有 , 对吧 ?
那我觉得这个东西一定会有啊 , 你怎么可能没有呢 ? 我当时那个时间点 , 对吧 ? 中国的手机的这个活跃量 78 亿 DAU 吧 , 微信大概有个 6 亿 DAU, 大概就是这样 。
然后那你这中间有巨多的机会啊 , 你理论上是每一个人都应该是一个活跃的手机设备 , 对吧 ? 然后理论上每一个活跃的手机设备都应该有一个通讯软件 , 然后理论上每一个活跃的设备上也应该会有一些娱乐产品 。
所以你怎么算这个娱乐产品都是有一定空间的 ? 所以我就离开字节 , 对吧 ? 去寻找一些可能性 。
但是我当时并不认为短视频这件事情会有那么大 , 就其实这是一个错误判断嘛 。 但是再到其实短短两三年后, 对吧 ?
那其实就已经发现了短视频肯定就是一个全面级的产品 , 然后我就觉得那可能这个战役就结束了 。
所以在今天我觉得是一样的 。 就是说智能水平本身啊已经很强了 , 然后智能在整个娱乐里的应用 , 就你很难讲 , 对吧 ?ChatGPT 现在 6 亿 DAU, 我觉得就核心合理的应该是说在未来所有的活跃设备上, 大家都应该在跟智能交互 。
那假定我们认为这个事情是 ChatGPT, 那 ChatGPT 才首先有巨大的空间 , 对吧 ? 然后呢 , 第二呢 , 那就是跟 ChatGPT 的这个重合的情况下, 你应该会有很多娱乐的场景应该是被智能啊带来的 , 对吧 ?
那你从这个角度来讲 , 那到底是抖音带来的 , 还是豆包带来的 , 还是 ChatGPT 带来的 , 我不知道 , 对吧 ?
这个事情你很难讲 。 但是你能够确定的就是说在整个泛娱乐这个用户需求的场景下, 实际上一定智能在里面会是一个极为重要的玩家 , 甚至是一个不可或缺的玩家 。
但是到底是什么样的产品在提供这个智能带来的娱乐体验 ,不知道 。 所以你问我相不相信 , 我现在只能说我认为通过智能来提供娱乐的方式 , 它会非常非常非常大 。
但是呢 ,是不是被这些老的产品拿掉 , 我觉得老的产品在里面一定也会是呃重要的参与者 。 但是有没有新的公司和新的产品形态的机会 , 我觉得它的概率是很高的 。
嗯 ,QTab 这块算大概聊完 , 然后另外聊一下多模态里面的像 Higgsfield 这样的公司 。 因为其实你们是同步的跟 Higgsfield 在做算是大方向类似的东西吧 , 对吧 ?
就也是偏视频生成啊 , 这个模态的东西 , 然后它就起来的非常快 。 当然你们做到小几千万美金也很厉害了啊 ,但你觉得这里面的区别是什么 ?
就 Higgsfield 在那个时间节点 , 它做对了什么事情 , 让它能起来这么快 ?
影像竞争26:10
首先你看 Higgsfield 这个事情 , 它也是从一个非共识然后转向到共识 。 我们 25 年年中的时候去美国交流的时候 , 我当时觉得 Higgsfield 很好嘛 ,但实际上它的收入啊 , 包括它的这个在资本市场的口碑啊 ,其实都很差 。
大家都觉得这个东西不就是一个特效工具吗 ?
对 , 我觉得也不至于很差 ,但大家的看法就是说这种东西见太多了 , 对吧 ? 总是一波一波的 , 就是起来就下去 , 起来又下去的 。
事实上也确实是这样嘛 ,因为大家都觉得它如果是一个视频特效类的东西 , 它就是一个增长型产品 。
包括像 Pika, 对吧 ? 一开始的时候其实也是有点这个方向啊 , 然后当时也很多人做了各种节日的特效啊什么的 。
对 , 它就确实是起来又下去啊 。 所以 Higgsfield 的区别是什么 ?
呃 , 我觉得你不能讲 Higgsfield 的区别是什么 , 我觉得其实你回答这个问题 , 要回答影像领域的模型的能力和竞争的格局是什么样的 。
我觉得首先模型领域现在是易超多强的格局啊 ,也不能叫易超多强 , 多超多强吧 , 对吧 ? 你第一梯队有 Sora 2,有 Vue 3,有可灵 , 然后大家都是分别在不同的试镜上 ,在不同的阶段骚塔 , 对吧 ?
那一旦会有这种啊分布不均的情况出现 , 那么就使得啊聚合战和全家桶这种产品是有机会的 。
因为用户总是会想要用更少的钱享受更多的模型服务 , 那这件事情我觉得它是必然的 。 然后呢 , 第二呢 , 影像领域本身它的需求太大了 , 就是你从社媒的创作者 , 对吧 ?
这是一个完全独立的职业 , 然后再到在不同的商业体中的应用 , 对吧 ? 那每个公司甚至大部分的个体都有影像内容的需求 , 这样的一个分散的需求 , 使得一个更加通用的产品也是必然的 。
再往下一件事情是说模型能力再强 , 能够把这个有限的 idea 用好的这个人也是有限的 , 对吧 ? 以及叠加了一件事情是说 , 对于任何多模态内容的创造语言和你想象的图像之间一定有巨大的 loss, 这都是几条约束 。
然后在这两个约束的叠加之下, 你就会知道那一定有人可以通过模板的方式来定义审美 , 然后能够降低大量的用户成本 。
所以你这几个事情一叠加 , 你马上就会知道在今天你要去抓住机会的话 , 这个产品应该长什么样子 , 那就是一个 Higgsfield 长的样子 。其实这个事情在我们一开始一步步迭代的时候 , 就已经完全想明白了 。
就是我们当时就列出来 , 就我刚刚说几条约束 , 然后我们当时定出来一个方向 , 就是说如果你想在这个赛道里长期做下去 , 那阶段性的一个赢家应该就是一个全家桶 。
然后它应该解决的问题就是模板化的定义审美的社区 。 但是就即使你定义出来这样产品形态都不够重要 ,因为这样的产品其实在行业内也有很多个 。
然后真正核心的是 Higgsfield 总能以更好的方式去把模型的能力卖出来 。 就是我们去看整个行业的发展 ,因为整个多模态不能叫多模态 , 我觉得就是 video 模型和 image 模型 , 它的发展速度太快了 , 然后导致一个现象 , 就是说总有一些任务和效果是一个月之前不行的 ,但一个月之后可以了 , 对吧 ?
那针对这样的情况 , 你会发现整个行业我们去把它分为两个重要的指标 , 一个是说用户的意愿有多强 , 一个是说交付的能力有多强 。
那整体这个意愿的上升是随着整个 AI 的大家都在渲染嘛 , 说我这东西很好很好 , 对吧 ? 那整个这个大 beta 就是让所有的人都认为说 AI 确实很牛逼了 。
但是呢 , 交付水平这个东西 , 它是一个不断在迭代的 , 对吧 ? 很有可能用户现在觉得说我考虑东西很好 , 我要去试一下, 结果一试发现这不行 , 你是垃圾 , 对吧 ?
然后呢 ,他可能第二次再去想要去尝试的时候难度就高了 。 那 Higgsfield 做最好的一件事情是什么 ? 它总是能够很好的去分装一个能力来把这个交付表现出来 。
比如说一开始 , 对吧 ? 我们这个一致性做的很差 , 那 Higgsfield 推出了那个 soul, 哎 , 那其实之前做 LoRA 的做的最好的在海外那个产品叫 Retake,但它其实卖这个能力就卖的不好 , 对吧 ?
那 Higgsfield 就卖的很好 。 然后再到它后来一系列的这种 drag to video, 然后再到最近的那个灯光控制 , 对吧 ?
它其实一系列的在社媒上的表现 , 它是能够比较好的把交付能力这件事情给卖出去的 。 但是你仔细去看它卖的东西 , 它卖的东西依然是三分真七分假 。
就是因为他们团队的对于内容理解的 sense 实在是太好了 ,以至于他在 showing 这个能力的时候 ,他能够非常好的知道我要怎么去 show, 能够扬长避短 。
然后同样的用户再想要去试用这个能力的时候 , 会发现 , 哎 , 我怎么好像怎么都用不出来它 show 出来的这种效果 , 对吧 ?
它这不是一个 cherry picking, 甚至就是一个对于内容理解的 sense, 使得它能够比较好的选择 show 的素材 , 然后让你觉得 amazing。
所以我觉得这个是今天可能很重要的一个差异点 。
所以我觉得就是现在大家其实已经不会去讨论说套壳是不是好的 , 听讲就是关键在于说谁能套的好 , 对吧 ?
就套壳本身是没问题 ,但套的好坏是有区别的 。
我一直以来都觉得套壳这个是完全就是工程师视角啊 ,因为用户不知道你是壳还是不是壳 , 就用户只在意就是说你这东西是不是最好的 , 对吧 ?
是不是解决了我的问题 。 所以永远是你模型能力越好 , 对于应用来说就越好嘛 。 核心是说你能不能够把这个模型能力拿出来用好 , 然后你不仅能用好 , 你还能 show 好 , 那我觉得这个你就很牛逼了 , 对吧 ?
你至少在这个阶段下很牛逼 。
套壳建议31:47
嗯 , 所以你做的这几年做起来 , 如果让你给 AI 创始人建议的话 , 说到底怎么样能把一个壳套好 , 你会怎么讲 ?
首先我没有发言权 ,因为我觉得我们自己在这一波里做的很差了 。 就是我们就处于矫枉过正的那个状态里面 , 然后你就生意太好做了呀 , 对吧 ?
你在一个非常 niche market 里 , 对吧 ? 大家复利供应 , 我们有利润 , 那你你这怎么搞呀 ? 你这肯定就自我麻痹啊 。
然后你其实对于行业的整个的 follow 啊和这个交易程度其实没那么高啊 。 然后我们自己对智能这个事情的理解 , 我觉得就是慢慢才补起来的 。
我觉得今天还是说 , 就是如果你想做个生意的话 , 那我觉得这件事情是很简单的 , 就它一点都不复杂 。
但是如果你想真的要去干一个事业的话 , 我觉得这件事情其实还是要回归本质思考 , 就是你不能去有太多的投机取巧 。
嗯 ,但我觉得现在能看到的几个点 , 一个是说你肯定是要对模型有特别深的理解 , 对吧 ? 它新出了什么东西 , 或者它马上要出什么东西 , 你是能够判断的 , 能够有感知的 。
然后呢 , 就是你提的审美的这个点 , 对吧 ? 就是怎么样把这个模型能力 ,不管是对内容的审美还是对产品的审美 , 把这个模型能力能用起来 ,以及就是执行力啊 。
所以这两年大家都很强调执行力 ,因为模型肯定是持续在变化 , 持续在升级的 。 那你套壳的话 , 你的速度就也很重要 。
就因为大家一般往往都是第一个先能用到的 , 它就是能怎么讲 , 就是最大化的去获取这个新模型的价值的吧 。
所以这几个点应该是挺重要的 。
嗯 , 我觉得行业现在随着你的技术变化的这个发展吧 , 我觉得其实整体的这个焦虑指数是越来越高的 。
首先这个焦虑指数它是因为有一些事实 , 就这个行业因为这个 beta 太强了 , 使得它会有一些随机性 。
这个随机性就使得在一些偶然的情况下, 一些并非相对比较本质的东西 , 可能在阶段性会表现出不错的结果 。
但如果把时间尺度拉长 , 可能它就最终潮水会退去嘛 。 所以我觉得核心是这个焦虑 , 使得大家更多的想要去优化这种随机 , 你理解我意思吗 ?
就是可能在这里面中间会有很多的信号 , 比如说像那个之前 minus 行业总是会去说他们怎么去搞营销呀 , 然后怎么去拍视频呀 , 怎么去弄 , 大家就会去学习嘛 。
学习这种其实是随机的结果 ,但可能去忽略掉它就是一些更本质的东西 。 所以我觉得其实在今天这个也也很难讲吧 , 我很难去描述到底你拥有更强的定力 , 试图去找到那些更本质的东西是正确的 , 还是说你今天就是像一个这种啊随机漫步的傻瓜一样 , 对吧 ?
你可能在这里面去 random 到一些东西 , 你的执行力要更强 , 你的速度要更快 , 我不好说 。 对 , 我觉得可能如果你整体对于商业本身有更多的理解和思考的话 ,也许你的这种优化随机性这件事情会成为你的冷起步的助力 。
但是如果你本身在商业 sense 上和在整个经营的节奏上不够好的话 , 那也许最终靠运气赚的钱会靠本事输掉 。
嗯 , 我觉得至少从过去几年来看 , 非常明确的一件事情就是谁能套壳套的又好又快 , 谁就能赢 。
而且每一波都得是套的又好又快 。
赢怎么定义赢啊 ?
赢就是你你至少阶段性的数据和估值都涨得最快嘛 。
就是获得了更多资源 。
嗯 , 资源和客户跟收入嘛 。 啊 , 然后包括你如果再做点动作的话 , 你就补贴点 token, 对吧 ? 就是能加大你这个赢的杠杆 。
然后未来几年来看的话 , 就是其实在过去几个月里面 , 或者过去半年到一年里面的核心问题是大家觉得模型的智能的提升没有那么明显啊 。
但目前其实因为最近的包括 CloudBot 什么的火 ,其实我觉得有点打破了这个逻辑 。 嗯 , 所以我是感觉未来一两年, 首先多模态领域肯定会继续的 , 模型会发展很快 。
所以仍然在这个领域里面 , 谁能套壳套的又好又快 , 就是能赢啊 。 我们如果就是用赢这个字来定义的话 。
然后在智能这块 , 我感觉大家现在套壳呢会有些变化 , 就大家现在套的不是那个 Chatbot 的壳了啊 , 反而是因为 AI Coding 的 agent 能力已经很强了 , 大家去套这个壳 , 对吧 ?
就你刚才提到怎么样把 AI Coding 套成个壳 , 让更多 C 段能用起来 , 对吧 ? 怎么把 agent 套个壳 , 可以用在各种垂直的领域 。
Coding 不是套壳 ,是 Coding 平权 。
套壳的结果就是平权嘛 。 就是之前比如说 AI 陪伴这件事 , 对吧 ? 大家其实不 care 你是用的什么模型 , 就你只要能跟我聊好就行了 。
我觉得后面也是一样 , 就是用户不 care 说我这里面用到了什么 AI Coding, 还用到什么东西 , 它就是那个结果能 deliver 就 OK 了 。
嗯 。
智能展望36:19
对 , 所以我们多模态跟想象力聊完 , 那正好再聊到智能吧 。 刚才其实也讲了一些了啊 。 你现在对智能怎么看 ?
因为虽然你说你过去几年可能这块关注比较少 ,但我知道你最近也是在看这块嘛 。 包括你说多模态跟智能一些结合啊什么的 , 就你当下的一些认知跟想法是怎么样的 ?
我觉得首先你看我刚才就一直尽力在避免你说多模态的时候 , 我一直在说这个 video model 和 image model。 我其实不想说多模态 ,因为我觉得多模态代表的是理解能力 , 就不是生成能力 。
所以我认为现在这个理解能力的这个大的进展已经看到了嘛 。 就 Gemini 3 的这个理解能力的突飞猛进 。
然后 。
对 , 我我先打断一下 。 我觉得你说这个说的很有道理 , 就是理解其实是一种智能 , 对吧 ? 生成就是生成能力 。
对啊对啊 , 所以我觉得那只是 video model 和 image model 而已 。 当然大家现在在说世界模型 , 可能就是另外一件事啊 。
然后就是传统的这个 , 我也跟一些朋友在交流吧这个问题 。 然后目前来说 , 可能在这个理解能力的大的提升上, 可能也就只有 Google 在算力上和主要是算力上吧 , 这个优势是比较明显的 。
然后并且也找到了一些能够 scale 的方法 , 对吧 ? 然后把它的这个理解能力有比较大的提升 。 然后呢 , 这个理解能力能不能反向提升智能呢 ?
我就说除了传统的这个多模态的理解以外, 反向提升它的这个模型本身的智能 。 啊 , 我觉得这个也是大家可能会相对比较乐观的 。
所以我是认为这个事情反正随着理解能力的越来越强 , 我觉得可能能解锁场景会越来越多 。 然后我记得上一次我就一直在思考一个问题嘛 , 就是我说当眼睛戴了脑子会怎么样 , 这个问题也是现在我还在去想的问题 。
我觉得这个会非常非常不一样 。
OK, 那我觉得像你刚才讲的矫枉过正这个点 , 确实过去几年里面肯定智能是最大的杠杆 ,但你们没有最好的用到嘛 , 对吧 ?
就 minus 其实是最好的用到的典型例子嘛 。
我觉得反正也不晚 , 就我觉得你不能说过去智能是模型最大的 , 我觉得不是 。 我觉得就是 coding, 它其实跟智能没关系 , 就是智能的显化是要通过 coding 来完成的 , 只有 coding 才能超出本来智能的那个界限 。
所以核心我觉得它有那么神奇吗 ? 它没那么神奇 。 但问题是说你要意识到 , 就是说你想去把 coding 这个能力用好 , 实际上你再早也没用啊 。
就是你至少要到那个 Sonnet 3.5 吧 , 再好一点对吧 ? 你 Opus。 所以我觉得差不多 , 就是从什么时候开始都挺好 , 反正那个你模型能力一天一个样子 。
嗯嗯 , 对 , 晚肯定是不晚啊 。 哎 , 那 coding 有什么想聊的吗 ? 你自己有什么体会吗 ?
Coding 我也不懂啊 。Coding 我觉得反正就很牛逼哈 。 我觉得我对 coding 平权这件事情有比较有经验 ,其实就是因为我自己亲身经历了 , 从就是我啥也不会对吧 , 然后借助 coding agent 的时候 , 然后完成一些自己的任务 。
我觉得这个还是非常 amazing 的 。 我觉得这个权利就应该平权给更多高价值场景 , 更多的人。 我觉得这个是很有意思的 。
而且它显然现在的渗透率严重不足 , 对吧 ? 即使 coding agent 已经在全行业的这个融资水平呀 , 收入规模呀已经很大了 ,但实际上它还是九牛一毫的状态 。
对 , 我们刚录的一些播客也在聊 , 就是 CloudBot 啊什么这些问题 。 我觉得现在不管是 agent 还是 coding, 它的用户应该也就是百万级吧 , 就肯定没到千万级 。
但就像你讲的 , 未来肯定有那种日活商议的产品 。
嗯 。
OK, 那就我们聊一聊胜率跟赔率的问题 。 你之前我觉得你从 24 年吧 ,24 年之前你应该都是在优化赔率 , 对吧 ?
而且这个也是绝大多数创始人在做的事情 。 啊 , 你再讲讲你怎么理解这两个问题 。
绝大多数创始人为什么在优化赔率呢 ? 是因为比较好拿钱 ,因为 VC 是在优化赔率 。
对 , 我感觉是不是尤其是中国创业者喜欢优化赔率 ,因为中间是没有退出渠道的 。
啊 , 对 , 跟这个也有关 。 但是我觉得真正走到这一层的人是比较少的 。 比如说像我刚刚我说的那件事情 , 我是因为被中国的市场改变成我觉得只能优化赔率 ,不然就去死 , 对吧 ?
然后那我认为大多数人他可能只是因为这样好拿钱啊 , 就是他其实也没有意识到自己到底是不是在优化赔率 , 或者在他看起来他也区分不了赔率和胜率 。
所以我觉得这个是一个现实的情况 。
嗯 , 然后实际的体现就是说要讲个大故事 , 对吧 ? 这是最简单的体现了 。
嗯 , 没错 。 但实际上我对这个事情比较深的领悟是从什么时候开始呢 ? 就是说我上次播客也在提嘛 , 就是你看 , 首先我对于张一鸣的理解 , 我就觉得他是一个比较保守的人 ,他是一个标准的胜率驱动的人。
胜率优化40:36
然后我上次不是问他说我我应该怎么选择的时候嘛 ,他就问我为什么不做更有把握的事情 。 然后再到后来 , 我其实感悟了很长时间 , 我就意识到这个问题是说其实你看上一波的这些企业家 , 对吧 ?
他都是在优化胜率啊 , 就很好笑的 。 然后只是有的人运气好 , 对吧 ? 他赛道本身就是个赔率非常非常高的赛道 。
然后你比如说你看一鸣 , 对吧 ? 一鸣首先是在 PC 互联网的尾巴就在做搜索 , 对吧 ? 他对信息分发就一直有一个执念 。
然后再到做这个字节跳动的时候 , 然后先做的是连段子 , 对吧 ? 然后在 14 年已经有那么多有视频产品 , 包括 One 已经在海外很火 , 融了很多钱 。
然后一鸣 say no, 对吧 ? 其实那个时候没有着急做视频 , 然后还是在优化胜率 , 直到所有东西都成熟了 。
然后到 16 年才开始正式下场做视频 。 所以这是个标准的优化胜率的人。 只是他一直以来定义的问题是他在上个时代的尾巴就抓住了 , 然后一直延续下来了 。
然后包括黄峥就更典型了 , 对吧 ?PC 时代的时候做电商 , 对吧 ? 一直在关注供给侧的这些变化 , 供给的情况 , 然后包括流量端的变化 , 对吧 ?
一直在关注这些东西 , 包括他自己在供应链上做很多生意 , 然后也做得非常好 。 再到拼多多这个结构性的机会出现 , 然后抓住也是一样的 , 上个时代积累的一些东西 , 这个时代去搞 , 对吧 ?
然后再到王兴他们却一样 。 这个其实我觉得最奇怪的 , 就是因为他们做了一个跟之前完全不同的事情 。
然后我那次还专门问了一下老王 , 我说哎 , 我说你看你们做的这个美团这事情 , 好像跟你们之前记得完全不一样 , 对吧 ?
这个事情完全不是在优化胜率 。 然后老王说你知道吗 ? 在当时那个时间点里 , 所有做团购的人里 , 所有懂线下的人都没有我们懂线上, 所有懂线上人都没有我们懂线下 。
而我们在做校内的时候 , 手底下就管 200 人 DJ 团队 。 然后我当时啊惊呼说原来是这样 。 就是其实在那个时候他们已经有很多积累了 。
你看这个就很典型嘛 , 就是还是在优化胜率 。 然后再到小红就更典型 , 对吧 ? 小红是个标准的优化胜率的人, 从最早 17 年、18 年吧 ,他就在做浏览器插件的生意 , 然后到 23 年的时候又在做浏览器插件 , 对吧 ?
然后再到后面搞 minus,也是给知识工作者做这个生产力的提效 。他其实一以贯之的就是他一直关注的问题 , 然后他积累的优势 , 包括 minus 的这个整体的这个立项 , 对吧 ?
我还有跟他聊过这个问题 , 对吧 ? 我说哎 , 你这个人不是从来不看赔率吗 ? 都是看胜率的 , 对吧 ?
然后他也觉得他其实在做这件事情就是在看胜率 。 从结果上来看 , 确实他也是在看胜率 , 对吧 ?
所以 anyway, 我想表达的点是说 , 实际上这些真正一流的企业家 ,他其实都是在优化胜率 , 没有人在优化赔率的 。
优化赔率你这个不是赌博吗 ? 对吧 ? 你这个就不合理嘛 。 所以核心还是说 , 我觉得胜率追问是一个很重要的事情 。
哎 ,但如果按你这么讲 , 我本来一直的理解啊 , 就是优化胜率跟优化赔率是不同的选择 。 但按你这么讲 ,其实反而它不是一个选择 , 它是一个很清晰的正确与否的问题了 , 对吧 ?
你觉得就是应该优化胜率 ,而且优化胜率才能最终有可能得到更大的赔率 。
没错呀 , 我们上期播客我聊的最重要一个观点是什么 ? 我就说运气嘛 , 运气的东西到底是什么 ?
运气是你的优势被时间放大的结果 , 就是你的赔率是等来的 。 嗯哼 , 对 , 你的赔率是等来的 。
但我觉得这里的优化赔率它有一个区别 , 就是你当然优化胜率 ,但核心问题是说你在挑选事情的时候 , 你能不能够有拥有一些定义重要问题的直觉 。
我觉得这个是最重要的 。
嗯 , 就是选择了赔率可能会高的优化胜率的方向 。 嗯 , 就是你的路径的行动 , 它一定是个胜率的优化 , 对吧 ?
比如说我不应该在什么什么时间点做什么 。
对 ,但我们讲回来 , 如果这么讲的话 , 那到底什么叫优化赔率 ? 就这个优化赔率是不是本身是个伪概念 ?
嗯 ,不是我要做一个什么什么抖音吗 ? 这不就优化赔率吗 ? 然后我因为什么什么足够大 , 所以我要做什么什么 , 这不就是伪命题吗 ?
不 , 按你讲的就是我要做抖音本身是没问题的 , 只是说我的每一步选择怎么样能够尽量的正确嘛 。
就是我要做下一个抖音是我的大赛道嘛 ,是我的一个选择嘛 , 然后在里面我去优化每一步的胜率嘛 。
我可能不是说一上来就是做一个抖音 , 对吧 ? 我先做一个从别的角度切入的一个产品 , 慢慢的最后做成抖音 。
这是不是就是一种好的方式 ?
嗯 , 我觉得如果你是优化胜率的话 , 你在那一天你是说不出来你要做抖音的 。 你在第一天 , 你应该讲的是一个你要解决什么问题 。
哎 ,但你看张一鸣第一天就说是下一个 Google 嘛 。
没有啊 , 那我记得他流传出来的 , 大家都看过那他 A 轮的 BP 嘛 , 那里面好像提到了就是说要对标 Google。他第一天要说就是信息分发这件事情有巨大的问题啊 , 然后移动端他可以用一些新的形式去解决这个问题啊 。
嗯 , 没事 , 大概可以理解 。 对 , 所以其实你看大家都讲的他是要 , 我觉得正好有正反两个例子啊 , 一个是说大家觉得自己内部 , 包括很多其他的公司经常是赛马 , 对吧 ?
那赛马本身是一个非常有效的优化胜率的方法 , 对吧 ? 因为我看到了一个大的方向 , 我觉得这里面是有机会的 , 那我尽可能做成 , 我就让多个团队来做 。
也没有赛马呀 , 那是现在啊 , 就是内卷的结果呀 , 就是人才太多了 。
不 ,但你觉得赛马是不是一种优化胜率的方法呢 ? 就是我看到这个方向是能赢 , 那我就一定确保这个赢家处在我这里面嘛 。
如果我们现在回答的是字节跳动今天这个阶段的一些决策的话 , 我觉得这件事情它一定就是优化赔率了 。
你也不能叫优化赔率 ,因为它必须是获胜 。 就我很难去在一个这样规模的体量下的公司 ,以他们的视角去思考这个问题 。
我觉得 。
我觉得这个有可能 。 我给一个我的视角的看法 , 我觉得这个就是攻城跟守城的区别和和难度吧 。
就是你要守本身就是难的 , 就是有些事情你是必须要做到 。
守是难的吗 ?
因为你比如说 AI 这件事情 , 就因为今天有可能是 AI, 明天有可能是 VR, 对吧 ? 后天有可能是手机 ,但这个事情只要不是字节做到了 ,他可能就输了 。
所以守的话是你要从各个方面都守住 ,但你攻的话 , 你可能就是从一个切入点攻破就 OK 了 。
对 ,是这样的 。 但实际上正常情况下, 你在军事战争中反而守是有优势的 , 攻是有难度的 。
嗯 , 各有各难度 。
我我是在想它这中间的差异性 , 就是说你就比如说 VR 来了 , 这是攻还是守呀 ? 对于这些大公司来说 。
是守呀 。
真的是守吗 ?
我觉得是守啊 。 比如美团做 AI, 你觉得是攻还是守呢 ? 其实包括 PP 这种 , 就大家害怕的是说我某一天突然被 AI 颠覆嘛 , 突然整个的商业模式跟产品就完全变掉了 , 所以我要用自己的模型 。
但我感觉 , 嗯 , 就是我觉得 AI 的这个变化 , 它已经超离了这个攻守的这个范围了 , 就它可能已经是一个新的问题了 。
没事 , 这个就说远了 。 对 , 我们讲回来 。 对 , 我刚才讲的字节一个例子啊 , 另外一个点就是那个大家经常讲字节的大力出奇迹嘛 ,但是我记得好像是字节内部的人吧 , 还是张一鸣啊 ,他自己其实否认过这个点 , 对吧 ?
他说其实我没有大力出奇迹啊 , 只是外部的视角看起来是这样的 。 所以他的大力出奇迹应该是说他能看到这个胜率已经很高的情况之下 ,他敢去做一个更大投入的事情嘛 , 对吧 ?
本质上是这样的 。
对对对 ,他们也没有大力出奇迹啊 ,他动不动就说 all in 是偷懒啊 ,他其实还是很胜率追问的啊 。 但我觉得还是 for 创业公司啊 , 就是我们在后面的体量很难去单一的一个维度去描绘这个问题了 。
嗯 , 所以你从优化赔率到优化胜率 , 最终实际上的一些行为上的转变是什么 ?
就是做更有把握的事嘛 , 比如说一个事情的要素的就是变量多和少嘛 , 然后我尽可能要控制变量 。
就是我觉得一个事情它的变量太多了 ,不可预测性太多了 , 超出我的能力范围的东西太多了 , 那可能就尽量不选择 , 尽量去选择那些就是我可以控制的东西 。
对 ,因为你企业的阶段和体量也不一样嘛 , 你能控制的东西也不同嘛 。
OK, 然后其实你最近经常跟我讲 , 你现在研究段永平比较多嘛 , 对吧 ? 你如果去比较一下的话 , 就我觉得张一鸣跟段永平也是两种类型的代表人物吧 。
嗯 , 对吧 ? 你从这两个人身上你看到了什么 ? 你在学习的东西 ,以及你觉得这两个人有什么不同的点 ?
其实段永平就优化胜率啊 。
我我我觉得基于我们刚才讲的 , 所有的成功的人其实都应该是优化胜率的 。
对 , 就是做更有把握的事情嘛 。 然后你看他的投资哲学跟他的创业的哲学是一样的嘛 , 投资哲学他就讲 right businessright people 嘛 , 这是从巴菲特那学来的嘛 。
就是核心就两个东西嘛 , 一个商业模式 , 一个是文化嘛 。 对于字节也就是战略和管理啊 ,但这个就扯远了 。
我想表达的点是说 , 你看他在一开始做那个消费电子的时候 ,其实他就意识到那个生意不够好 ,但是手机来的时候 , 对他们来说就不得不去抓手机 , 必须抓手机 。
如果手机不抓的话 , 这个公司就死了 。 但是手机这个业态跟消费电子又又有点不一样 , 它天然有些平台属性 , 所以就这个模式就会好了一点 。
但实际上你看他过程中那么多大浪潮 ,他也没有来回左右横跳 , 对吧 ? 他基本上都一直还是在消费电子这里面 , 然后积累 , 然后去定义到底什么问题是值得解决的 , 哪里能做出一些差异化的价值 。
所以我觉得他核心就是把这种复杂的事物简单化了 , 就是尽可能回归到一个更原点的东西 , 更本质的东西 , 然后去做这个生意 。
嗯 , 所以你从段永平身上学到了什么 ? 你跟张一鸣那边不一样的点 ?
跟一鸣不一样的点啊 , 我觉得核心最大的区别是字节会给你带来巨大的错觉 。 我是觉得字节是个非常不好的学习对象 。
首先在某种阶段下啊 , 它给你带来的错觉是说你对软软语有更强的倾向性 ,但实际上你会发现很多事情都很难做得很完美 , 然后你真的想要去追求把一个事情做到理论上应该的样子 , 这个事情是非常非常困难的 。
但是在字节这件事情可能是一个标准 。 然后另外一件事情是说 , 你可能很难去真正的用第一性原理想问题 ,因为第一性原理需要庞大的资源 , 否则这个条件就不是很成立 。
你可能就更多的还是要再约束下去想问题 。 所以我觉得字节不是一个好的学习对象 。 然后我觉得段永平他整体的哲学还是更加的平常心 , 普通人。
就是你看一鸣他们说我们要跟这个一流的人去做这种有挑战的事情嘛 , 我们要跟一流的人一起协作 , 我觉得这个就很牛逼啊 。
但是实际上你的这个操作难度就很大呀 。 然后但是段永平我觉得实际上他的思路就是另外一种 , 就是他更强调文化 , 就是说大家都是普通人 ,但是在一个好的文化下, 选择一个好的值得去创造价值的方向 , 能找到差异化价值的方向 , 然后普通人也能做出很大的成绩 。
包括你看黄峥他也在强调这件事情嘛 , 所以我觉得这个也是不一样的 。 所以那这两个文化下塑造出来的感觉 , 我觉得就会有比较大的差异 。
我觉得整体字节还是偏强者思维的 ,但是我觉得段永平他的这一套经营哲学是更偏弱者思维的 。
嗯 , 哎 , 我听的时候我还是想再回去再聊一下胜率跟赔率的问题啊 ,因为我觉得优化胜率就是有个概念容易混淆 , 就是你优化胜率是不是会容易让人变得更保守 , 更不愿意改变 ?
因为我在做我已经做的擅长的事情 , 肯定是胜率更高的嘛 。 你会遇到这样的问题吗 ? 比如说当时你如果不做 AI, 你继续做别的 , 那其实因为 AI 在当时是新东西嘛 , 对吧 ?
那它的变量就更多 , 它的胜率其实是反而是变低了 。 嗯嗯 , 那在什么时候应该做这个改变 ?
其实也不是 , 就这里面它会有一些基本的逻辑在里面 。 就是比如说段永平他反复强调一件事情嘛 , 就是你做生意 , 对吧 ?
最重要的是什么 ? 是消费者导向 。 那所以核心点是说你不会不拥抱 AI 的 ,因为你知道这个东西对你的消费者有用 , 它会对你的消费者更好 。
那你就假定一个东西 , 对吧 ? 我们今天认为这个东西对我的消费者是没有好处的 , 我有其他的方法来去放大我的对于消费者的这个服务能够更好的话 , 你可以做呀 。
就它跟保不保守没关系 , 我觉得 。 所以我觉得更多其实我们换句话说吧 , 我们在讲赔率的时候 ,其实很多时候你的优化目标不再是消费者导向 , 对吧 ?
你可能变成了市占率导向 , 对吧 ? 你可能变成了估值导向 , 对吧 ? 那你可能这个生意就是有问题了 。
嗯 , 就是如果你站在自己的角度 , 只想自己擅长什么 ,其实就是比较封闭 , 比较保守的啊 。 但你如果是站在一个结果跟目标导向的话 , 就好了 。
对 , 然后这个结果和目标是消费者导向 。
理论样子53:29
嗯 ,是 。 然后你刚才提了几次 , 然后你最近也一直在提一句话 , 就是把一件事做到理论上应该有的样子嘛 。
我觉得这句话其实越想里面就越有道理 , 越牛逼啊 。 你能不能给大家再解释一下这句话你的一些想法 ?
嗯 ,但这个话就这个只能是一个怎么讲 , 就是一个呃理想国 , 你你懂我意思吗 ? 但是我觉得更重要的是你要接受不完美 。
就它更多是个心态问题 , 就是说你怎么能够在你看到这个事情很不完美的情况下, 然后你又认为我应该尽力的去把它做到理论的样子 。
就是我觉得这个反而是一个指导方针吧 。 但实际上你真实情况下, 你距离它的这个状态是很远的 。
对 , 我在听这句话的时候 , 我就经常想到它有点类似于那个做正确的事 , 对吧 ? 就大家经常会因为各种原因而走弯路 。
啊 , 这个不是做正确的事 , 这个是正确的做事 。 嗯啊 , 这个是把事情做正确 , 这个是 how to, 这个不是 why。
嗯 , 所以你觉得 26 年是一个什么样的时机 , 做什么样的事是正确的 ?
嗯 , 首先我觉得 AI 这件事情还是很长 , 然后其次我觉得还是我刚刚说的那两点吧 。 呃 , 我觉得有几个变化吧 , 就第一我觉得多模态能力 , 对我说的理解啊 , 我觉得这件事情肯定是值得被利用的 。
然后第二呢 , 我觉得就是 coding 平权 , 就是你怎么能 coding 平权与之同步的 , 就是说你怎么找到一个好的交互方式 ,在你 coding 平权的这个场景下, 能够更好的释放模型的能力 。
我觉得这个也是一个很有价值的事情 。 对 , 我觉得这两个肯定都是就指引我们很重要的这个道啊 。
然后至于术呢 , 就非常非常多了 。 比如刚刚我说的你怎么去秀能力 , 对吧 ? 然后你怎么去理解用户对于效果的预期 , 我觉得这些都是很多可以积累的一些对于术的理解了 。
嗯 , 都能够用上 。
OK, 然后你看日常经常有很多人找到我们 , 会问说你觉得有什么好的创业公司可以去的啊 ? 那我就经常会问他们说你到底想要的是什么 , 对吧 ?
就是你到底接受多大的风险 , 你想要什么样的回报 , 就是你最后到底是要赚钱 , 对吧 ? 你还是觉得说钱现在对我不重要 , 我想要赚更大的股份 ,以及说你能不能接受一个创业公司这么高的失败率 。
你们也是一家创业公司嘛 , 对吧 ? 你觉得去你公司的人 ,他到底是在优化胜率还是优化赔率 ? 他这个问题作为一个应聘者 ,他应该怎么思考 ?
我觉得任何一个应聘者 ,他思考的角度 , 我认为都是在优化胜率 , 本质都是在优化自己的能力啊 , 然后优化自己的视野 , 优化自己的信息质量 。其实呢 , 你回过头来看它是什么 ?
它是胜率 , 对吧 ? 但核心我想讲的是说 ,不是说优化胜率就得不到赔率 , 你理解我意思吗 ? 就是你只有在优化胜率的时候 , 你可能得到赔率的概率才会变高啊 。
当然也有一些人 ,他可能就是奔着赔率去的 , 对吧 ?
对 , 我觉得相对应的 ,他不应该的想法就是他自己又不认可这家公司做的事 , 然后他觉得这个公司可能人也不太行 ,但他就觉得说 , 哎 , 这公司好像听说明年要上市 , 对吧 ?
还是这公司现在融资很好 , 所以我要去 。 这个就是典型的优化赔率 ,而不是胜率 。
对对对 , 嗯 , 我觉得关键还是说看他自己在能力上的需求吧 , 就是说他需要获得什么样的能力 , 对吧 ?
想要和什么样的人一起工作 , 想要解决自己的什么问题 。 我觉得这个可能是一个求职者他选择一家公司主要的动机 。
嗯嗯 , 就还是以个人能力发展为基础嘛 , 对吧 ? 就是你只要能力持续发展 , 哪怕不是这家公司 ,也是下一家公司 , 总归你会遇到那个能让你有足够赔率的地方 。
我觉得也哎 ,也不是吧 。 就其实你真正最后我就说段永平的这个思考的方式吧 , 就核心还是放平心态吧 。
就是其实你选择一家公司 , 就是在选择看什么样分解 。OK, 就本身就这个逻辑 , 对吧 ? 最后你的能力到底能不能变现 , 我觉得不重要 , 你看什么样分解 , 就这个很重要啊 。
这个心态就太难了 。 嗯 , 我觉得有这个心态比优化赔率还难 。
我其实觉得这其实是一个原本大家应该有的心态 ,但只不过这个心态呢 , 你看段永平他经常讲嘛 ,他说中国人的文化里多了一些急功近利的东西 。
我觉得美国这样心态的人可能是更多的 , 我认为啊 , 尤其是这些一流的方面 。
你说这种心态是哪种心态 ?
就是看风景啊 。
啊啊 , 就是过程啊 。 嗯 , 所以你觉得现在因为你们也在招人嘛 , 对吧 ? 那你觉得如果一个人去了你们那 ,他能优化的是什么 ?
招人58:01
他能学到的能力是什么 ?
嗯
, 我们可能尽量会让一个人的精神状态处于一个比较合理的状态 。 就这个合理状态是说 , 首先我有很强的信心和信念 , 这个信心和信念是说 , 我认为我们对于创业这件事情本身会更有耐心 。
然后我也认为在刚才我说的这些啊 , 道的这些东西指导下, 我们终将会创造价值 , 终将会变成我们想要变成的样子 。
那我觉得这个信心就会反映到可能很多遇到一些这种极端的情况 , 我会非常淡定 。 我觉得这个是啊 , 我们的一些特点吧 。
然后在遇到一些机会上和对于一些事物的本质到底是什么上, 我们会比较饥渴 。 就 stay hungry stay foolish, 我觉得其实就是这样状态 。
然后再有一个就是 stay peace and love 吧 , 就是你可能遇到一些极端的情况 , 对吧 ? 比如说我们这个老业务 , 对吧 ?
可能假设没了 , 然后你可能突然从一家盈利的公司变成一个亏损很剧烈的公司 , 那我其实心态也会很正常 ,因为我已经经历过很多次这样的时刻了 , 所以我觉得也也没什么呢 。
然后第二呢 , 就是一旦我们觉得一件事情很有意思 , 对吧 ? 我们就试图搞明白它到底本质是什么 , 为什么有意思 , 然后到底能创造什么价值 。
我觉得在这件事情上是不遗余力的 。 对 , 我觉得这就够了 , 对吧 ? 那你可能展现出来的一种状态就是会更加的有耐心 , 然后知道自己要干啥 。
嗯 , 对 , 我觉得这个是更多站在一个心态和公司的视角吧 。 但如果就是实际的从他个人能力的角度来讲呢 , 你觉得就你现在想要招什么样的人 ,他去做什么 , 让他能锻炼哪些能力 ?
我觉得这个心态是最基础的东西 。 然后你如果说术上就是他能够学到锻炼什么能力 , 那你能力是被什么决定的呀 ?
能力是被你的机会决定的呀 。 就是我们公司核心是你只要是一个有想法 、 有这个意愿的人, 你是无穷多的机会啊 , 你想干什么都可以 。
所以实际上在我们这样的一个体系下面 , 你的能力只被你自己的意愿和被你自己的想法决定 。 然后我们在这里面其实就是我刚刚说的 , 就是你遇到困难了 , 我们要接受困难是一定会发生的 。
遇到问题了 , 我们要讨论问题究竟是什么 。 我觉得更多的还是心态上的 , 就心态上是最重要的 , 我认为 。
OK, 好呀 , 那就这样啊 。 谢谢 Albert。
彩蛋1:00:41
好 。
大家跟你聊 , 你都觉得说你很 sharp, 对吧 ? 然后非常强的人性跟用户的感知力 , 然后很容易去找那些用户的需求啊 、 痛点呀 ,而且很擅长用一些很巧妙的方法去解决这些问题 。
你觉得这些是你后天训练出来的还是什么 ? 就怎么形成的这些能力 ?
说话比较极端就容易 sharp。 嗯 , 我觉得 sharp 就是个表达方式 , 它其实没什么特别的 。 你可能是错的呀 , 对吧 ?
一个人满口胡言 ,但是很绝对 , 你也觉得很 sharp。
那不一定 。
对 ,不是 , 你很容易像 AI 一样嘛 , 就是说你说了很多听起来很有道理的东西 ,但实际执行下来发现根本不是这样的 。
我觉得这个倒没什么特别的 。 然后找用户场景这件事情 , 首先我们肯定也不是说我主要在找用户场景 , 我觉得很多方法都是团队一起讨论出来的 。
那团队要讨论这个问题呢 , 那就得有一个人一直在提重要的问题 。 对 , 我觉得核心还是提问嘛 , 然后这个问题 push 你去评价自己的方案到底 O 不 OK, 然后再去修正这个方案 。
那再往下推一步 , 就是说你怎么样去训练 , 那不就又回到了同理心和想象力了 。 就核心还是意愿吧 , 主要是你要愿意提问 , 这件事情很关键 。
我们公司的人可能都不想跟我聊天 , 为什么 ? 因为我总是拉着他们 , 对啊 , 问题太多了 , 就总是拉着他们说我觉得这个可能有问题 , 哈哈哈 , 我觉得这个可能不对 , 我觉得这个不是最终的样子 。
就是这个有问题跟提问题 , 你不完全是一件事情 。
没有 ,但这就是我的开场白嘛 。 嗯 , 实际上我就会说 , 哎 , 我又想到一个什么什么什么事情 。
你有想象过 , 就是假设技术是成熟的 , 假设投影成本足够低的 , 然后能做一个什么样的一个很酷的产品 ?
比如说你就当写科幻小说 。
写科幻小说啊 。 嗯
, 我觉得再造一个 AI 的社会吧 。 就我前面在想象 , 就你就说科幻小说启发到我 。 就我现在在想 , 假设有一个科幻小说是这样写的 , 我觉得这个故事蛮有意思的 。
就是说有一个人 ,他是一个 AI 的信徒 ,他相信一切都是注定的 , 一切都是被证明的 。 然后他试图用集合全世界的算力 , 构建所有被证明的约束 , 比如说所有的第一性原理 , 对吧 ?
就其实你可以推嘛 , 脑科学 、 生物学等等等等 , 都有一些第一性原理 ,有些约束 。 然后你把这些约束 , 物理学所有的约束全部都注入到这个模型里面 , 然后开始让它演化 , 然后在适当的时候借助一些外力改变它的参数 , 使得它逐渐能够对齐地球整个发展的过程 。
你可能从第一个生物出现 , 然后再到怎么怎么样 , 然后人类出现 , 对吧 ? 然后它可能就是有一些证明的路径 , 然后终于有一天 , 它的那个演化对齐了人类的今天 。
就终于有一天跟现在这个时代一样 , 然后他们在那地方发展的很好 , 然后大家开始观察 , 然后回到这个人去 build 这个事情的动机 , 为什么他要做这个演化 ?
因为他想要穷尽更多的算力 , 预知未来会怎么样 ,因为约束是没变化的 , 对吧 ? 然后 OK,他就开始暴力计算到底会怎么样 , 然后他会发现这个发展停留在了一刻钟 , 就是他发现在那个世界中也有一个人构建了所有的算力 , 然后去预测未来会怎么样 , 然后循环 。
你能理解我的意思 ? 嗯 , 就是对未来的所有的想象都是在预测未来中 。 嗯 , 所以比如说我们想科幻小说就是这样 , 那我们把它往前提一点 , 如果我们就完全去想 , 那我觉得就是再造一个社会出来 , 然后我们就像一个观察员一样 , 甚至一个参与者 。
这就是一场直播 。 嗯 , 里面有人在赚钱 ,有人在生活 ,有人在发生各种各样的事情 , 它就是虚拟世界 ,但没有关系 ,因为虚拟世界跟线下其实基本差不太多了 。
我觉得这就是一个很有意思的事情啊 , 你可以在任意一个角落 ,以任意的方式扮演一个角色 , 你可以在那个世界中成为一个演员 , 然后重新过一遍人生 。
你可以在那个世界中创业 , 那没有问题 。 这是一个世界 , 对吧 ? 那 what if 两个 、 三个 、 四个 、 五个 、 六个 、 七个 、 八个 、 九个 、 十个 、 五百个 , 每个那个世界里都有自己的经济系统 , 对吧 ?
然后有无穷无尽的人在这些世界中获得收益 , 这些收益反哺在我们这个世界里 。
嗯 , 这个我记得好像马斯克还是谁讲过一个 , 就是他讲现实世界是虚拟的概率非常高 。
非常高啊 , 就是我刚刚那个推论嘛 。 对 , 你最后的结果就是虚拟世界 。 对啊 , 最后就是你预测世界的方式 , 未来的显化其实就是不断在预测未来 。
嗯
。
