为何发声0:00
There's something there.
今天很开心我们现在在创新工场的办公室 , 邀请到了汪华来一起做一期播客 。 汪华老师 , 我其实一直是你的粉丝 。
我很早之前其实就写过一篇文章 , 里面就引用了两个人的观点 , 一个是您的那个 2011 年的演讲 , 讲的是移动互联网的发展的三个阶段 , 然后另外就是王昕当时她早期有一个 " 四纵三横 " 的理论 。
你们都是特别早就看到了移动互联网的这波机会 ,而且也是预估得特别准的 。 所以我觉得今天我们就可以聊一下移动互联网跟现在的 AI 的一些对比 , 包括对未来的一些看法 。
非常荣幸能在 43 章经里面做播客 。 我印象中你也是从移动互联网早期就参与到这个领域里面 ,是蛮有意思的 。
你看你最近你开始出来讲比较多 AI 相关的东西 。
我们做 AI 在国内是很早 , 从 2012 年开始做 。
我知道你们做得很早 , 我觉得这波 AI 你出来讲其实是今年出来讲得稍微多一点 , 比前几年对吧 ?
然后当年移动互联网你大概是 2011 年开始出来讲得比较多 ,是吧 ?2011、2012 年 。
对 。
所以你是今年最近有看到什么 ?
我本身是比较宅 。
这个听说过 。
2011 年出来讲了很多 。 我说实话 , 当时是逼得没办法 ,因为那时候基本上很少有人信移动互联网这件事 ,不得不出来讲 。
去年我是觉得所有人都信 ,而且信得比我还狠 。在我看来甚至都已经信到科幻的地步了 。 我反而出来讲会变成保守派了 。
但今年我觉得好像很多人又开始莫名地悲观起来 。
这跟刚才讲的那个移动互联网当年可能有点像 , 对吧 ? 大家一开始的时候就是很相信 ,但后来发现有些事落不了地 , 它就又回去了 。
对 。 移动互联网跟事实这样的一个状况 , 就是最早的时候 , 比如说回到 2010 年、2011 年的时候 , 大部分人都不信 。
然后从 2012、2013 年开始的话 , 大家又开始相信了 。 但是到了 2013 年的时候又开始有很多人对它开始降温 , 直到 O2 或者大规模的商业 。
然后它实际上是没有大家不信的第一阶段 , 直接就进入到了甚至第二 、 第三阶段 , 就是极度相信的阶段 。
但今年的话 ,其实这个事才一年半 , 大家就觉得好像又没有看到那么多的进展 , 然后今年突然大家又开始有很多怀疑的东西 。
早期回顾2:52
因为我是 2013 年入行 , 我当时记得在 2013 年左右的时候 , 或者至少是 2011、2012 年的时候 , 大家对于移动互联网这个事其实还是有非常多的争议的 。
包括我记得当时大家说 , 经纬投了很多移动互联网的公司 , 大家都在讨论说到底有没有价值 , 对吧 ?
然后包括真格和奇石创新工场也都是那个时候开始出来 , 开始投很多移动互联网的公司 。 然后在同期好像其他很多机构都并没有认可这件事情 。
我不知道你还记得当时大概是一个什么样的市场环境 。
对 。 我记得大家其实都不信这个东西 。 第一个原因就是大家没有意识到事物的发展规律 。 比如说我当时三阶段之所以能比较准确地预估 ,因为有些事情确定了 。
一个真正高性能的智能手机 , 当时卖得很贵 , 都 2000 块钱以下 , 两年内降到 1500。 然后运营商和手机的贷款公司费确定地会下来 。
然后智能手机的渗透率非常确定地在几年之内能达到百分之多少 。其实当时我的三个阶段完全是根据这些物理和工程的确定事实来推演的 。
很多人当时是蛮看现在的这个状况 , 资费那么贵 , 贷款那么低 , 手机那么贵 , 所以静态地看问题 , 的确感觉当时好像很多东西不成熟 。
第二个我个人觉得还是被从 2003、2004 年开始的那些旧模式 , 就是以前说移动互联网其实就是运营商的政治服务 。
当时认为移动互联网不可能摆脱运营商的控制 , 然后增值业务这个东西就算升级了又能怎么样 , 完全没有意思 , 完全自由开放的互联网的商业态 。
第三个我觉得大家忽视了一个全新的应用平台 , 大家要在这个平台上找到一个 Latex 的应用 , 需要的时间周期 。
比如说 2008 年 iPhone 刚出来 , 甚至 App Store 刚出来的时候 , 大家当时忙的事情都是把 PC 上的 。
搬过去 。
对 , 既没有利用到移动上的原生新场景 ,也没有符合移动端的特点 。 我都不说那些 O2 或者是 BD 这样只有手机上能出现的东西了 , 哪怕是比如说视频这样的一个东西 , 对吧 ?
最早大家干的是把 YouTube、 爱奇艺搬到手机上 ,但实际上你看版本的正确答案 , 抖音一直应该是在我记得 2001 年才开始出现的 ,而且它的形态会非常不一样 , 无论是分发渠道 , 还是甚至内容本身的性质 ,并不是那种版权的长视频 ,其实都是根本性的不一样 。
所以大家也需要很多的时间去探索 。2001 年的时候 , 大家可能看到的很多的应用也只是先搬硬套 , 所以很多的时候就是被这些认知偏差给束缚住了 。
另外还有可能也不够有耐心度过典型的增长曲线的第一个阶段 。
明白 。 但其实当时的聪明人应该还是非常多的 。 我们现在回头来看 , 觉得好像不可思议 , 说有移动互联网这么大的机会 , 当时这么多年大家都不认可 ,但放在那个环境之下, 你觉得其实是一个很正常的事情 ,是吧 ?
我回忆到我当时 2011 年、2012 年去做了很多演讲活动 , 见了很多聪明人, 或除我刚说的三个认知偏差还是 。
很难 。
有时候有的聪明人可能破除了第一个认知偏差 ,但是过了一段时间看看 , 这个应用上好像也没出什么特别东西 , 很快又白嗑了 。
或者是甚至破除了两个应用偏差 ,但是会怀疑第三件事之类的 ,而真的坚信不疑的人没有想要的那么多 。
但在 2013 年左右应该是市场相对比较认可的 。
我们都 2013 年左右开始有共识了 。
这个共识是怎么来的呢 ? 当时大家看到了什么点 , 就一下子市场相信了 ?
其实我刚说的三个问题 , 到了 2013 年的时候 ,其实很大程度上都已经解决了 , 所以这个都已经不叫达成共识 ,而是事实 。
所以大家其实还是看到了那些事情已经发生了 , 然后大家才去相信 。
对 。 就是你说的一个有意思的话 ,因为看到而相信 , 和因为相信而看到是两个区别 。
三阶段7:26
明白 。 然后在这波 AI 里面 ,其实还跟当时的移动互联网有蛮多的区别的 。 比如当时虽然早期可能没有形成共识 ,但是还是很多人出来创业 , 然后也有很多人能拿到投资 。
但现在我觉得反而是大体上好像大家对 AI 有个大的共识 ,但具体落地上跟投资上好像反而市场没有跟上当年那个节奏 。
我不知道你的感受是怎么样 ?
我的感受是会非常的凶猛 ,因为早年移动互联网这个经历 , 所以反而是 AI 这件事在一开始阶段就取得了超出它应有阶段的共识 。
移动互联网从 2008 年开始到你说的 2013 年取得初步共识 , 中间整整花了 5 年的这时机 ,而这次的大模型从第一天开始就达到了共识 。
因为当年移动互联网经历 , 甚至包括大厂这些事 , 从第一天所有开发者都怕错过 , 认为这是一个至少移动互联网级别的机会 。
所以哪怕它在很多程度的情况下, 就已经给了甚至都不是 2013 年, 而是 2014、2015 年移动互联网的待遇 。 但实际上它的成熟度甚至不如 2010 年的移动互联网 。
因为 2010 年的移动互联网不存在做不出来的问题 ,也不存在成本的问题 ,因为互联网 PC 互联网已经是铺了十年的技术基础了 。
但是 AI 到现在为止 , 连技术栈还在快速变化 , 都还在演进过程中 ,而且你也并不知道现在的模型本身的能力的边界在哪里 。
是 。 所以大家现在都在讨论 ,有一拨人拿移动互联网去比较 AI, 对吧 ? 然后有的人用电脑的发明来比喻 AI, 又有互联网 ,也有人讲说它是不是更像云或者像什么的 。
我不知道你的这块的观点是什么 ?
因为现在阶段不成熟 , 所以我用什么来比喻它完全取决于 AI 模型能达到的技术边界 。其实现在对于 AI 模型能力边界 , 你可以给它做不同层次的假定 。
比如说第一层是非常确定的假定 , 就是交互层的革命 。 这就意味着现在大模型其实只需要现在 GPT-4 级别的语言能力 ,并且拥有比较好的多模态能力 。
这个是现在我们百分百可以在接下来一年时间 、 两年时间里面来实现的 。 基于这一层的话 , 它适合的比较对象是移动互联网 。
现在我们也确定至少可以做到比 GPT-4 要再强一个级别的一些能力 , 它可以取代现在移动互联网的交互层革命 , 完全智能的交互层革命 , 可以把现在所有的应用重写一遍 。
而且它很大程度上还可以让任何有人在循环的 , 无论是工作也好 、 交互也好 、 应用也好 、 前台后台也好 , 提升很多的效率 , 百分之几十的级别不等的效率 。
这是 AI 的低层技术边界或者低层技术特性 。 但 AI 还有第二层的技术特性 ,是需要更进一步的模型上限的提升的 , 叫可泛化的广义自动化 。
我还不说 AGI, 只要现在的模型智能上限真的能更进一步的突破 , 比如突破我们现在期待的 GPT-5, 能对非常复杂的指令有很好的指令遵循能力 , 能解好模型换语言 , 能实现在大部分情况下比较长的任务跟踪执行 , 那就意味着它可以很大程度上实现广义自动化了 。
这样的话 ,其实用移动互联网来比较 , 它可能就不合适了 。 因为移动互联网很大程度上其实是两件事 , 一件事是大量的场景的连接 , 第二件事情是前端交互的革命 。
然后这两件事导致了移动互联网的一个巨大的提升 , 它重组了很多商业模式 , 重组了很多人和商业之间的界面 。
但是它实际上移动互联网并没有实现广义的可泛化的大规模的自动化 。 所以如果大模型能做到第二个阶段的话 , 它既能做到前端的革命 , 又能做到后端的广义自动化 , 那这个就可以说用蒸汽机比拟它了 。
对 , 那这个的话 , 第一个可能是能与移动互联网 , 第二个可以说是数倍的移动互联网 。 如果真达到 AGI 的话 , 人类历史上除了走出非洲这个事能批准以外, 人类历史上就没有任何东西可以媲美了 。
我记得你早年有一篇文章 , 你有提到说你觉得移动互联网的机会是 PC 互联网的十倍 。 所以你现在觉得其实 AI 是又比移动互联网更大了 。
对 。 如果达到我刚说的第二阶段的话 , 那我个人觉得也近乎是比移动互联网提升一个数量级 。 这个的话 , 我个人觉得不确定是不是能百分之百达到 。
但是基于现在的传送路外的技术栈 , 再加上外围的工程实现 , 实现可泛化的自动化 , 我个人觉得还是有蛮大机会的 ,50% 的机会吧 。
演进路线13:02
你看移动互联网 , 像我知道你说 AI 我们要类比很多 , 对吧 ? 但因为你讲的 AI 还是比移动互联网机会还要大几倍 。
但移动互联网其实它具备几个特性 , 一个是它其实智能手机本身的保有量是一个从很低到非常高的一个过程 , 然后这个过程当中也拉了很多之前其实跳过了 PC 的下沉市场的人上来 。
就是整个市场有巨大的增量 , 然后是一个新的硬件的迁移 , 然后这个硬件又具备移动性 、 摄像头等等各种东西 。
但 AI 好像跟这些比起来 , 目前我们没有看到这么多的新的变化跟红利吧 ?
移动互联网两个特性 , 联网增加新场景 , 扩容这个特性 。 目前来说的话 , 这个特性 AI 是不太具备的 。
然后第二个移动互联网的当时的特性 , 就是我刚说的创造新界面的这个特性 。 这个的话其实 AI 是有的 ,但可能需要两个前提条件 , 当然这也是确定的 , 就是模型的英程成本会变得非常低 ,并且多模态的能力也完全建立 。
这样的话 , 将来所有的应用 , 即使都是在手机上跑 ,也可以拥有全新的前端的交互界面 。 而且我再说一点 , 如果更进一步 , 多模态做得足够的好 、 足够便宜的话 ,其实具身智能还可以把界面甚至是执行从纯的数字世界扩展到很多的物理世界的人去 。
所以交互界面这个特性是有的 。 然后大量的场景拓展的确是注意移动互联网 ,但是 AI 有第二个特性 , 就是实现广义的自动化 。
这个的话 , 哪怕是当年的移动互联网做到今天这么多规模 , 除了我刚说的两个特性以外, 这个也是有自动化在里面起到的作用的 。
大家在 C++ 里面最熟悉的就是推加算法 , 对吧 ? 它把新浪几千个小编都给干没了 ,而且做得还更好 ,而且还 scale up 到电商 、 除了抖音所有这些领域 。
但是第一代 AI 实际上是实现了一些非常 narrow 的 、 非常窄的 , 基于一些特定任务的自动化 。 而 AI 的话 ,其实是可以实现广义的可泛化的自动化 。其实移动互联网界面上算是革命了 ,但是在后端 , 你看到是互联网公司雇了无数人在那里做审核 , 然后做流程 , 做 fulfillment, 然后无数的外卖员骑着电动车在那里面 , 前端是在国 , 后端是朋克的 。
对 ,但是 AI 可以在前端交互 , 比如用智能化给用户全新的交互体验 , 后端的 fulfillment 通过广义自动化重新定义后端的流程 。
所以产品扩充上不如移动互联网 ,但是在自动化强于移动互联网 , 可以重构非常多的野谈 。
当年你 2009 年的时候应该是百分百地相信移动互联网这件事 ,是吧 ? 它的机会是足够大的 。 但现在其实你是把 AI 分两层 , 就第一层是前端交互的改变是肯定会发生 ,但是是不是能有更大的一个它解决任务的自动化的能力 ?
你其实现在是 50% 的信心 。
对 。 这个的话主要是当年移动互联网本身 。 移动互联网本身当时的话是技术栈都是确定的 , 所以我百分百确定的意思就是 , 我知道它只是一个时间问题 , 只是一个工程问题 。
对 , 现在之所以把它分两块的话 ,其实就是因为
多模态 、 降低成本 , 还有就是简单任务自动化 , 这个是百分百确定的 。 复杂问题 、 长链路任务的完全自动化 , 没有人的完全自动化 , 还并不能说百分百实现 。
对 , 我觉得讲得非常清晰 。 我们今天可能可以得到个答案 , 就是它不是一个单纯的去对标移动互联网还是对标什么的 , 就是它同时存在至少两件事情 。
一件事情是大家能看到可达到的 , 另外一件事情还是在从 0 到 1 的一个过程当中 。
复杂任务的自动化本身如果真实现的话 , 还有一个附带就是意味着完整的具身智能也可以实现 。
然后物理世界的真正意义上的可交互 、 可自动化 , 和真正意义上的可联网 。 因为我们移动互联网号称把物理世界联网 ,其实是通过手机和网络的联网 ,并不是说移动互联网真能跟真实世界发生可输入 、 可输出 、 可交互 、 自动化的一个状态 。
所以复杂任务的能力的话 , 完全是一个不同的事情 。
这件事我觉得要能做到 ,AI 就不是几倍移动互联网 。
十倍吗 ?
是 。 但这件事情我们只能说持续地关注各种 paper。
我个人比较相信基于现在 transformer 做 scaling, 高概率 。
做不出来 。
做不出来 。 AGI 能不能做到复杂任务的自动化 , 我个人认为其实也不需要太长时间 , 观察 3 到 4 年 。
基于现在的 transformer 和 scaling 的这条进步路线 , 或者广义的 , 包括什么 Mamba 之类的基于现有的模型进步路线 , 加上外围的各种各样的工程 , 如果 3 年到 4 年做出来 , 那基于现有的基础上, 那就做不出来 。
如果能做出来 , 我相信 3 到 4 年之内大家就肯定能做出来 。
明白 。 所以如果现在要给 AI, 我们也给它一个 roadmap, 当年你说移动互联网是先是工具 , 再是娱乐社交 , 然后再是一些电子商务 2B 相关的东西 。
这个跟移动互联网当年会稍微有点区别 ,因为当年移动互联网的话 , 跟着系统成熟度和普及率走的 , 所以它是这样的一个应用顺序 。
但现在因为有一个具体成本的问题 , 所以有些东西反而会走得更晚一点 。 比如说像为什么现在都是先做到生产力 ,因为生产力是用户会付钱 , 可以 cover 这个具体成本 ,而且生产力的用量小 。
比如说用户一天做搜索最多做个七八次 , 最多做个十来次 。ChatGPT 人均用户使用时长其实也就是七八分钟到十几分钟之间 。
但是如果你拿大模型去做娱乐的话 , 比如说 001 有一个测试 , 就是拿 001 的模型让别人做 chatbot, 平均用户使用时长一般 50 分钟 , 这还是文字 。
如果你指望用模型去带图片 , 那现在做长用户时长的应用 , 现在模型推理成本都受不了 。 所以现在的话跟当年移动互联网不一样的是 , 维度上要增加推理成本和模型的能力边界两个制约因素 。
所以现在的顺序你觉得是怎么样的 ?
先是高价格的生产力和 2B, 然后是一些大用户量的工具类的产品 , 然后是图文级别的社交 、 用户时长类的产品 , 然后才能是真正的海量的多媒体的娱乐产品 。
同时的话 , 商业化的 , 类似当年 O2 商业的重构的阶段 , 大概也是在这些 。其实到了工具类的产品 , 推理成本大概明年年底就应该能降到现在的将近 1%。在这个基础上 ,其实 E 级别略活的 , 甚至几亿级别的略活的长时长应用就已经出现了 。
这个就跟当时看移动互联网的硬性条件数据有点像 。 我在想就是移动互联网的时候 , 大家其实也讨论了一段时间 , 说到底什么是移动的 native 的产品 。
你觉得 AI 这波的 native 产品会出现吗 ? 大概是什么样子 ?
肯定会出现 。 我刚说的第一阶段的话 , 我就是基于 AI 来重构现有的应用的前端交互和重构现有应用的整个的用户需求 。
这一波的话 , 我个人觉得有一半 , 甚至一半以上还都会是传统的大厂 。 然后可能只有一小半会是全新的 native 的应用 。
然后原因也很简单 ,因为如果只是基于现有的应用重构前端交互 , 现有的大厂是百分之百这样优势的 ,因为它现有的用户群 。
当现在的很多的重构还太简单了 , 像微软这些典型的坏的例子 , 现有的产品加一个对话框 ,Office 加个对话框就这样 。
全是 Pilot。
对 , 这个东西 。 然后更深一层次的就是产品形态完全变了 , 然后只是用户需求是一样的 。 这些的话 , 新的创业公司能拿下的会更多一些 。
然后再下一个阶段 , 就是依赖前端后端共同革命 , 甚至 AI 有了全新的自动化技术的时候 , 那时候的话 , 新的公司的比例会更高 。
因为那时候有可能买的应用压根移动互联网也不存在了 , 就有点像 DD, 对吧 ?DD 在 PC 互联网压根是一个不存在的一个场景 。
或者是它整个的构建方式跟大厂原来的生意模式就是矛盾冲突的 。 就像拼多多打的那个打款 , 对于阿里就会非常难受 ,是同一个道理 。
第二阶段的话会更多一些 。
第二阶段就是你说的复杂任务能力如果实现了的话 。 但如果没有实现 , 或者说至少短期内可能还是现存的玩家跟大厂的机会会多一点 。
越早期越是搬运式的 ,其实现有的大厂的优势越大 。 越摸索到晚期一些全新的东西出来的时候 , 现有的大厂的使用会小 。
是 , 明白 。 然后如果我们回头来看 , 就是如果回到十几年前 , 就你基于现有的所有的经验和认知 , 然后让你重新抓一波移动互联网的机会 , 你会怎么做 ?
创业之道23:36
你会做哪些跟之前不一样的事情吗 ?
我觉得当时我对于语言的研究还是不够的 。 这点我个人觉得在 AI 这个阶段来说就更加重要 。 因为在很多事情都不确定的情况下, 甚至比移动互联网当年都更依赖创始人本身的这个能力 。
同意 。
因为你现在做的 , 比如说事情 , 跟将来谁让你成的事情其实 。
大概就不是一件事 。
举个例子 , 王昕最早做的产品 ,其实在现有的业务板块里面其实压根就没有那么重要 。
是 。 拼多多一开始其实也是拼好货什么的 ,其实都挺不一样的 。
其实 AI 这波就更加是这样 ,因为它比移动互联网早期甚至还变得更大 ,因为竞争战甚至都不稳定 。
这就带来一个问题 , 就是现在很多人说因为技术还在很早期 , 所以大家倾向于投一些技术背景的人。
我不知道你怎么看这个 。
这个倒是有提出一个 point。 整个互联网最早期也是一样 , 整个互联网最早期最值钱的公司是 Cisco,是 Netscape,因为在技术栈都没有成熟的时候 , 做基础设施和有技术挑战的公司的确比较有价值 。
别的公司甚至都起不来 。 对 , 所以第一个在早期阶段什么东西都没有的情况下, 没技术你就做不出东西 。
第二个一开始阶段往往是做基础设施的阶段 ,而基础设施往往都偏技术 。 但随着时间越往后走 ,
模式和商业合并越来越重要 ,因为技术逐渐变成大白菜 。 到明年就不一样了 。 看这事儿最直观的标准就是推理成本 。
当然推理成本本身很低 , 本身就代表一个 signal。 现在的计算扩散已经非常的厉害 , 做应用本身其实技术栈的障碍也越来越小 。
所以我觉得最晚也是到明年初的某个时候 , 你不需要那么强技术 , 这些都是完全 OK 的 。
OK。 我们回头来看 ,其实最好的一批移动互联网公司在 2010 到 2012 年之间其实已经成立了 。 当然后面有可能它产品会不断地迭代变化 。
这里面其实涉及到一个问题 , 就是先发优势在这个领域里面到底有多重要 。 现在大家可能都会遇到一个问题 , 就是像你刚才讲的 , 我如果现在想做 , 我得自己去开发很多底层的基础的东西 ,但这个东西同时各种开源的也在发展 , 会不会一年以后我做这些事儿其实就市场本身就追上了 。
比如一年后两年后再进来入场的创业者 ,他可以享受这个红利吗 ? 今天进场跟一年后两年后进场的区别会是什么 ?
移动互联网早期的时候 , 大家在探索什么才是正确的 native mobile 应用的形态的时候 , 很多人其实是做了先烈的 。
而后来的人可以总结前的产品形态的 。
对 , 就不仅没有先发优势 , 还成为了先烈 。
对 。其实 TikTok 之前有很多移动互联网视频的产品形态 , 比如说什么小哈秀 、 智子 , 还有美妲之类的 ,其实也是的 。
是 , 非常多 。
但没有完全走通 ,但是也成为了后来比如说大家去做探索 TikTok 的一些养料 ,有几个其实是相对来说比较明确的先发优势 。
现在的模型其实高度依赖于一些数据 , 所以数据积累本身其实就是一些优势 。 第二个偏交互层的 2C 的这些应用 , 如果你早点做的话 , 你可以先获得一部分的用户群 。
你如果早期有一个有用户群的一个应用 , 或者是有一定的数据积累的应用 , 把它后来去做转型 , 你也会比较好 。
比如说字节一开始接着头条流量基础 , 为后来发抖音还是提供了不少的一些基础 。
是 ,而且它之间其实还有内涵段 。
所以先发的模样优势肯定也是有的 。 然后还有一个就是在现在自动环境不好的情况下, 如果你能率先去做到一些事儿 , 更好地吸引到一些钱 , 那你还可以有一些先发的资本优势 。
这个在之前的没有那么明显 , 移动互联网里面资本是非常充足的 , 所以你哪怕是二发 , 你往往也能融到不少钱 。
但是在现在这种环境下, 你先发如果你先打响一些名声 , 可以先多拿到点钱 , 这也是很实在的先发优势 。
所以你带着之前十多年的一些经验也好 , 财力坑也好 ,在现在当下这波 AI 里面 , 你会怎么做后面一段时间 ?
如果从创业者的角度来讲的话 , 现在往前的时间点的话 , 实际上本质上来讲的话 , 都是偏技术和资本的游戏 ,因为这是第一阶段基础设施的阶段 。
而应用的质加的时间点其实都不是去年, 而是从现在往后 。 但本身各种各样东西起备的时间点 , 我个人认为是明年上半年, 因为推理成本会更低 ,而且多模态会正式进入到可用的状态 。
但考虑到你得打提前量 , 所以其实接下来几个月是开始只能把你做 2C 应用比较好的一个起始时间点 。
就大家听到我们这期播客就差不多可以考虑入场了 。
差不多了 。 因为你想等到明年上半年的话 ,其实推理成本我指的还是 D4 级别的模型的推理成本 ,不管是开源的还是闭源的还是什么的 , 相当于降到了几毛钱每百万 token, 对吧 ?
那你成本所以你做 3D 应用已经不是一个问题了 , 就相当于你维持一个日活可能只要几分钱人民币 , 哪怕一个用户用量你 10 万个 token, 对吧 ?D4O 级别的多模态 , 包括语音 、 视频 、 图片 , 等到了明年上半年甚至开源的时候 , 多模态能力也足够的强 ,而整个的市场也不会是 AI 在多模态一直出现 , 各家都会有这个下落圈 。
所以其实成本基础站其实明年上半年就已经是完全的成熟了 。
明白 。 当年移动互联网的时候其实也有安卓跟 iOS 的一个怎么讲 ,也算竞争 ,也算慢慢的逐渐走出来他们各自的道路 , 对吧 ?
模型生态30:28
还是不是有点像现在开源跟闭源模型之间的一个感觉 ? 你觉得未来模型层 , 包括整个模型产业链会是一个什么样的局势 ?
我觉得在早期大家说模型其实还是挺重要的 ,但是如果模型形成到了一个软的天花板 , 那时候开源模型 、 闭源模型本身在我看来只不过是一个工具而已 。
如果到了那个阶段的话 , 就是模型性能发展开始变缓 , 进入到模型性能瓶颈期的话 , 那时候最重要的是应用了 。
所以可能变成的一个情况是 , 反而是很多特别小的公司和常用应用公司不一定用开源模型 , 它反而有可能用的是闭源模型 , 或者是第三方 serving 的基于开源模型的微调和基础站 ,因为这样的话最便宜 、 最灵活 。
然后反而你自己去 serving 和模改开源模型 , 它反而还更需要一些技术能力 , 中上的公司才会选择自己去模改开源模型 , 去做应用 。
但真正的大型应用 , 高概率还会做很多自由的闭源模型 ,其中一部分用开源模型也会做模改 ,因为真正最大的那些应用是要做出更新的时候差异性的 。
所以既不会简单的用别人的开源模型 ,因为我用 OpenAI 的模型的话 , 那别人也用 OpenAI 的公开 PR, 我的差异化从来来 。
我很多私有的用户数据可能合并或者是连上去 , 对吧 ? 我也不会简单的只用开源模型 , 用开源模型也会模改 。
而且我高概率我一个产品里面很多的模型组合里 , 我肯定还会去做自己的一些私有模型 。 尤其是我要做一级日活的时候 , 我肯定是要把模型跟应用一体化 , 保证我在 serving 更大的日活的时候用定制模型才会最有效 。
所以在那时候的话 , 大家就不会简单的把自己去分为我是开源模型阵营还是闭源模型阵营那件事儿 。
你觉得未来整个的应用生态会发生更剧烈的变化吗 ? 比如说现在大家也在讨论未来会不会所谓的 Apple's, 就是手机直接进来就把所有事都做了 , 然后其他的 APP 变成了一个可能后端的服务 。
或者其实刚才你也提到可能未来 APP 不需要分这么细的一些具体的方向 ,AI 会让它能做的事情更多吧 , 单一 APP。
我们现在如果要投的话 , 或者要创业的话 , 还是要想这个问题吗 ? 还是就是我还是做一个 APP, 或者做个什么东西 ?
我觉得现在很多东西都会变化 ,但人性是不变的 。在没有实现大规模自动化的之前 , 为了达到最高的效率 , 都不完全是按人的需求量来做的 ,而是把它做成一个个标准化的公司 。
比如说我做的搜索本身是一个最大化的一件事儿 ,因为做很多事情都要用到搜索 。 我要去收集研报也需要做一次搜索 , 我要去了解一下我的糖尿病生活下也要做搜索 。
搜索是很多任务的潜质组合 , 它其实并不是任何一个 task 本身 ,但是把它集中起来做实际上是最有效率的 。
这是过去世界定义 APP 的方式 ,但有 AI 了之后, 实际上你是可以把任务按人的目的和按人的不同的需求层次分 。
实际上在移动互联网时代 , 搜索已经被消减了很多了 ,因为很多的搜索其实被一些垂直 APP 给分食了 , 对吧 ?
比如说有些被抖音吃掉了 ,有些被今年糖尿病吃掉了 ,有些被 。
手工书 、 直播 。
对 ,但 AI 时代就更是这样了 。
投资建言34:35
所以创新工场现在的投资逻辑 , 现在未来可能想投的一些公司是什么样子的 ? 可以跟大家讲一讲 。
其实几个事儿也都是在投的 。 第一个基于底层的基础站的那些同学 , 我们依然还是在投 。 因为就像我刚说的 ,其实技术本身迭代还没有停 , 所以无论是多模态 、 应付还是更好的这些东西本身 , 我们依然还是在投的 。
然后另外从今年上半年开始 , 我们很大部分中年也都是在投可应用了 。 传统的生产力工具 , 包括 2B 的这些事儿 , 我们也在投 。2C 我们觉得也在起来 。
我们去年还投技术背景的人比较多 ,但是今年的话 , 技术产品商业背景的同学都在看 。
明白 。 所以如果是基于之前你经历的整个移动互联网周期 , 你当下给创业者 , 包括甚至其他投资人一些建议的话 , 你会给他们什么 ?
我觉得大家现在都过于焦虑了 ,而且过于随着市场的变化太快的改变自己的想法 。 这个事儿本身其实才一年半的时间 ,但是大家对它的期待值却超级的高 。
大家也都是跟着 OpenAI 某个技术好像出来的要晚一点还是早一点 , 就变得很兴奋或者很沮丧 。 有时候太过于看重我要做出什么 AI 的东西或者大模型怎么怎么样 ,而并没有真正的去做我刚说的用户的需求或者用户的人性的东西 。2B 也是一样 , 企业的需求 , 企业的人性 。
所以虽然看起来好像大家做 AI 做得很多 ,但是过多的都做在 AI 本身 。其实这次的 AI 如果换个角度来说 , 本质上只是提供了你一次重新洗牌的机会 。
巨头挑战36:49
最小还是那些 , 只是谁来供给 , 供给形式的变化 。 但这个我其实正好又有个问题 , 就当年上一波移动互联网的时候 , 大家会 challenge 说你这个事儿百度 、 腾讯哪里做的怎么办 , 对吧 ?
现在不只是有这几家了 , 又有新的什么自提美团之类的 。 我觉得这个就好像大家在爬个金字塔 , 然后塔尖的人越来越多 , 越来越多 , 然后下面的人就越来越难做 , 越来越重新去你说洗牌也好 , 还是去掀桌子也好 。
我不知道你怎么看这个问题 。
第一阶段 , 基础设施阶段的角度来说的话 , 跟小创业公司来说基本上没啥关系 。 所以一个新兴的小创业公司不会想特别多的去解决这方面的事情 。
包括你说在一开始这个阶段 , 人都看好的那些应用 ,其实也都是比较红的 。 传统的大公司业务 、 价格框这些 ,其实跟创业公司也没什么太大的关系 。
但这个问题移动互联网早期其实也是一样的 , 哪怕是 infrastructure 的阶段 ,其实大型的创业公司 , 然后在构建最大的那些事儿的时候 ,其实它依然有很多的上游和下游 , 你依然是可以 。
我举个简单的例子 , 哪怕是 infra 这块 , 对吧 ?IB 电办那么多 , 南卡全市构建那么多数据中心 , 它里面大厂做完之后, 它是不是也需要很多上游的供应商 ?
所以在这种情况下, 本来就已经有不少的创业公司在里面去做一些软硬件的上游冲游 ,其实也已经挣到钱了 。
甚至你在看到早期的 AI 阶段 ,也有一些做出海的公司 ,其实现在哪怕是第一年, 也挣到了不少的用户量和现金的 。
所以这个公司也不是没有 。 尤其是在第一阶段 ,2B 和工具类就更是这样 ,因为 2B 和工具类大部分情况下都不是大厂真的去做的这些东西 。
我随便举个例子 , 比如说之前去做视频语音合成的那家公司 , 你还能叫什么来着 ?
黑镇 。
黑镇 , 对 。 类似这样的公司其实是有很多家的 。 而这样的机会其实以后会越来越多 ,因为 AI 本身就是一个对于很多东西是可以重复一遍的 。
而大厂第一个要看的事情是守住现有的主营业务 , 第二个是去拿最大的战场 。 这个的话就意味着有非常多的市场是大厂是注定不会去做 , 或者即使是做 ,也是团队里面很少的几个人根本得不到老板一线的资源 。
然后这个跟当年什么搜索和垂直搜索不一样 ,因为搜索和垂直搜索就是一件事儿 , 你做搜索的时候顺便把垂直搜索都做了 。
然后第二个角度是往后走的话 , 就更加是这样 。 往后走的话就会有全新的 AI native 的应用了 。 全新的 AI native 的应用其实对于大厂来讲的话 , 就是它现有业务以外原来不存在的这些新需求 , 这些对大厂来说实际上是很麻烦的一件事儿 。
因为全新的业务早期看上去非常的小 , 甚至有很多情况下是有法律的 controversial 或者内部的运营组织压力 。
所以全新的 , 包括现在就已经是这样了 ,Google 当年 Google V6 曾经输给 YouTube, 包括现在比如说在美国一些 DominoTails 的应用 ,其实大厂推进的速度不如创业公司 ,因为大厂对于版权 、 运营 、 警惕性都非常高 ,其实国内大厂也是 。
而一些业务模式又全新的一些应用 ,其实就很像是当年的滴滴快递 , 大厂做起来其实也是束手束脚 。
所以越往后面 , 如果更加偏 native 的应用 , 还不是现有的应用的改造的话 ,其实在早期阶段 , 尤其是这业务市场还不大 , 刚出现的这阶段 , 大厂也没有什么太大的优势 , 当时也不会特别像大家想象的那么快 。
明白 。 有一个我自己个人好奇感兴趣的问题 , 就是一级市场它其实本身特性决定了它有个问题 , 就是它其实是本身就追求小概率成功 , 它是一个低样本的世界 , 然后它长周期反馈 。
一级市场41:39
所以其实会不会就越聪明 , 你反而在这个里面并不能发挥最大的效率 ? 我不知道你自己会不会有这个困惑和问题 。
一级市场你说的问题其实是的确存在的 , 认知对象的不确定非常的强 。 你就算认知对了 ,是不是能押对正确的团队 ?
就算你押对了正确的团队了之后, 你又是不是能正确的度过周期 ? 所以实话客观的跟你说 , 认知变现从二级市场的速度比一级市场要快 。
所以最后大家都去炒股 。
对 , 举个简单的例子 。
就买英伟达 。
然后就是你像说的 , 比如说我非常明确这个事儿的时候 , 我自己也买了英伟达 , 这个兑现的速度比一级市场的兑现速度要快得多得多 。
所以如果没有其他的一些因素的话 , 比如说你在一级市场里面可以获得一些更多的认知 , 更深的去了解这市场是不是市场 , 或者是其他的东西的话 , 一级市场这件事儿的确从变现的角度来讲 , 尤其是对于认知变现角度来讲 ,是不如二级市场的 , 准备一点都不错 。
而且现在在国内的一级市场 ,其实已经没法像你说的那样去追求小概率变现了 ,因为这个是更多的是一个美元基金的风格 。
国内的市场本质上现在美元基金都已经走宽了 , 尤其是像 LP, 所以国内哪怕是一级市场 ,其实已经人民币化了 。
一级市场追求的也是确定性回报 。 所以名义上是做一级市场 , 实际上大家在现有的 LP 的结构上也是要追求可见的 、 有利润的 、 稳妥的商业模式 。
这个可能是 AI 比起当年移动互联网在中国发展遇到的 ,在我看来最大的障碍 。
印记44:14
然后最后一个问题 , 最后一个问题 , 我觉得在你的整个的从业生涯里面 , 最印象深刻的一个 moment 是什么 ?
过去的 moment 其实在我看来也过去了 。其实我现在虽然我刚刚说得很保守 , 说现在的基础站或者什么之类的可能 50/50 之类的 ,但我现在其实在期待的那个极点 。
内心还是很火热的感觉 。
对 。 哪怕没有 AGI, 哪怕能达到我说的复杂任务自动化 , 那个是可能我有生以来 , 甚至我在不近代时以来可能都不会经历的对整个人类社会的一个巨大的 transform。
那个可能会比我以前经历的所有的事情都 exciting。
好 , 谢谢 , 谢谢
。
