4242章经2024年6月10日· 56:39

英伟达的阳谋、破绽与野心 | 对话行云创始人 Mackler 季宇

行云创始人季宇深度解析英伟达的竞争策略:通过6个月翻倍性能的迭代速度和CUDA软件生态,英伟达成功将计算机系统从纯CPU体系拉入CPU+GPU格局,完成对英特尔的阳谋。他指出当前英伟达的全能化既是壁垒也是破绽——当芯片功能越综合,越可能被解构为开放体系。面对英伟达的闭环野心,产业需要重新激活开放生态来制衡。

  1. 0:00开场
  2. 4:21破局之道
  3. 15:48顶级阳谋
  4. 23:41软件生态
  5. 35:56单点打爆
  6. 38:07无敌之姿
  7. 44:01全家桶
  8. 49:20大模型与市场
  9. 54:16终局推演

转录文稿

开场0:00

季宇0:03

There's something there.

曲凯0:19

今天我们很开心请来了行云集成电路的创始人季宇 。 你在知乎上是个芯片领域大 V, 对吧 ? 你知乎上叫 Mackler。

季宇0:28

对 , 对 ,是的 。

曲凯0:29

我听好几个人都讲过 , 就很多人给我推荐 , 说你是最懂英伟达的人。 你之前是 —— 你在清华就是学的这块东西 ?

季宇0:36

嗯 , 我原来在清华计算机系 , 做芯片架构这一块 。

曲凯0:40

然后你毕业了就是去做芯片 ?

季宇0:42

其实也不是 , 我毕业了是去了海思 , 做的也是 AI 编译器这一块 。 所以这其实也给了我更多的视角 , 就是说一方面有做芯片架构的视角 , 我知道就是说今天 AI 芯片到底面临的挑战是什么 , 对吧 ?

做硬件的人会怎么考虑这个事情 , 做架构的人会怎么考虑这个事情 ,但同时也给了我更多软件的视角 , 比如说今天的开发者会怎么考虑今天一款新的 AI 芯片我到底怎么去用 。

这个行业里面其实你会发现 ,因为软件 、 硬件 、 包括编译器 、 包括开发者 , 行业的隔阂是非常非常大的 。

所以呢 , 我也比较有幸能够从上到下都有一定的认知 , 能更好地看清楚这里面的问题 。

曲凯1:20

明白 。 首先 , 大家可能看过很多其他的科普文章 , 花了非常大的精力在讲 CPU、GPU、CUDA 这几个东西 , 对吧 ?

我们开头先用最简单的话给大家解释清楚这几个点 。CPU 其实就是中央处理器 。

季宇1:31

对 , 它就是一个通用的计算机的基础 , 对吧 ? 你所有的通用计算机都是因为有了这么一颗 CPU, 你才能搭建出这么一个通用的计算机 。

然后 GPU 有两个概念 , 一个是 GPU, 一个是 GPGPU。 它之所以叫 GPU,是因为它最开始面向的是 3D 图形加速的场景 , 图形嘛 , 就是 graphics, 对吧 ?

所以它叫 GPU。 所以当时它是作为 CPU 在游戏或者渲染这个方面的补充 ,因为那块非常吃算力 。 那后来演化成 GPGPU,其实就是说 ,其实 GPU 这套范式也可以做通用计算 , 都是类似于游戏那些场景有高度并行度的那么一些计算 。

那今天所有的 AI 确实也都是在上面做计算的 。

曲凯2:13

就是 CPU 其实里面也具备一定的 GPU 的能力 ,但是就相对弱一点 。GPU 就是把其中的这部分能力就是扩大化 。

季宇2:21

对 ,因为计算其实分很多种嘛 。 就像我们经常讲的 , 就是说 CPU 它可能擅长的是解一个非常复杂的高等数学的东西 , 对吧 ?

然后 GPU 擅长干的事情呢 , 可能是做很多小学这个数学题 , 对吧 ?

曲凯2:35

对 , 就是 CPU 是这个串联的这个结果 , 然后 GPU 是更多是并行的结果 。 就是一边是几个教授去解题 。

季宇2:43

对 , 几个老教授 , 另外一边是一堆小学生 , 对吧 ? 那几个老教授能不能去做一大堆几万个小学生干的事情呢 ?

也能干 ,但是会比一万个小学生去干要慢得多 。

曲凯2:54

对 ,CUDA 呢 , 就是一套类似于就让你能做一套系统 , 能调度这几万个小学生 。

季宇2:59

CUDA 其实是怎么让上面的开发者去利用这样的计算能力 , 对吧 ? 去开发类似这一类算一堆小学数学题的这个事情的一套通用的开发方式 。

曲凯3:10

对于 CPU 来讲 ,CPU 有一个类似 CUDA 的东西吗 ?

季宇3:13

CPU 今天所有的软件开发工具 , 大家的 ——

曲凯3:15

就 411++ 什么 ?

季宇3:16

411++ 就是基于 ——

曲凯3:18

你可以认为就是 CPU 的 CUDA。

季宇3:20

嗯 , 对 。

曲凯3:22

哎 ,但 ——

季宇3:22

只不过 CPU 因为它太通用了 , 所以它的语言会非常非常丰富 。

曲凯3:25

对 ,但你看 CUDA 是英伟达出的 。

季宇3:28

对 。

曲凯3:28

对吧 ?

季宇3:28

对 。

曲凯3:29

但 411++ 什么的是英特尔出的吗 ?

季宇3:31

不是 。

曲凯3:32

就英特尔没有做过任何这样的事情 。

季宇3:34

对 。

曲凯3:34

就大家自发地基于 CPU 就做了很多语言 。

季宇3:37

对 ,因为 CPU 是计算机的基础 。 硬件出来了之后, 自然会有上面的人把这一层一层建起来 。 所以为什么我讲说其实英伟达很牛逼 , 就英特尔其实它还是一个偏半导体精英的公司 。

曲凯3:52

嗯 , 就是很多别人在帮它做事情嘛 。

季宇3:54

对 ,因为在那个时间段 ,因为只有 CPU, 所以大家才会自己去自发地建这个东西 。 英伟达它要克服的势能是非常非常大的 , 它要自己去建很多东西 。

曲凯4:02

对 , 我觉得我们可以快速地从你的视角给大家捋一下 。 因为其实很多人可能大概知道英伟达的历史 ,有很多人讲过了 , 对吧 ?

所以我觉得我们不一定完全是按照一个事情不推演什么这样的逻辑去讲 。 对 , 我觉得按照你自己研究的视角来讲一下英伟达到底你怎么看这家公司的一些历史啊 、 发展啊 、 战略啊等等。

破局之道4:21

季宇4:21

其实 90 年代的时候确实有一波这个做 3D 图形加速的一波热潮 。 所以当时英伟达也不是最早开始做 3D 图形加速的 。

但是我觉得英伟达能跑出来其实有两方面的原因 。 一方面就今天很多人会认为说英伟达是押中了一个非常好的赛道 , 对吧 ?

然后并且坚持投入 。 但我觉得其实这个把老黄个人的战略破例想小了 。

曲凯4:45

嗯 , 这个讲法更靠运气的感觉 。

季宇4:48

对 , 这个好像是说这个太选了一个赛道 , 那这个东西自然而然就会变成这样 , 只不过恰好是它 。

嗯 ,在整个计算机的发展历史上, 英特尔作为 CPU 最中央的这个概念 , 它其实有一整套的逻辑 。 就是历史上除了 3D 图形加速卡之外 ,也出现过很多其他的扩展卡 。

这个是本身英特尔这个处理器的开放体系 。 它的开放体系的目的是为了让围绕 CPU 的计算机系统能够用到所有的行业 。

每个行业都有自己独特的需求 ,CPU 如果不能在短时间内快速满足 , 那可以让这些加速卡来去快速地满足它 。

但是一旦这些加速卡把这些需求做收敛了 ,CPU 会集成 。 集成完了之后, 加速卡的这个市场就没了 。3D 图形加速其实在那个阶段也是面临这样类似的过程的 。

就在那个阶段 , 可能 CPU 它确实没有办法很好地 cover,但是其实 3D 图形加速的市场也在快速地做 PMF, 对吧 ?

找到到底我的硬件上要做什么样的功能单元来更好地支持 3D 图形的各种需求 。 所以如果没有英伟达去把这个事情深刻洞察这一点的话 ,也有可能 3D 图形加速过个几年慢慢大家做好了 , 然后 CPU 就集成了 , 然后 3D 图形加速从此就消失了 , 对吧 ?

那英伟达其实当时提了一个很重要的点 , 这个市场都始终坚持的 , 就是说英特尔是按照摩尔定律去演进的 ,18 个月翻一番 , 我们要做到 6 个月翻一番 。

英伟达在当时就意识到一点 , 就是说如果按照这样的速度去走 , 我很有可能快速地会被 CPU 给集成 。

我必须跑得比 CPU 跑的速度要快得多 , 我才能避免被它集成 。 前几天大家也在算 , 说英伟达过去 10 年大概提了 1000 倍的性能 ,但这个事情其实在当时它做成了 , 所以 GPU 变成了一个独立的品类 。

所以今天我们会认为今天的 PC 集成显卡是垃圾 , 对吧 ? 独立显卡是你打高端游戏必须的 。 大家会默认觉得今天的计算机形态就应该长这样 ,但实际上这个事情是在人为 。

如果当时它没有这么激进地去推这个 3D 图形加速的这个性能 , 包括去更快地满足游戏市场对这个东西的需求 ,因为说实话 , 需求其实是无穷无尽的 。

到今天大家都对画质有更进一步的需求 , 所以它实际上还是看硬件厂商谁满足得更快 。

曲凯7:11

对 , 这个点我觉得是我一直觉得英伟达做得比较有意思的一点 。 就是一般来讲 , 你看我们做互联网都是已经有海量的需求 , 然后我做这个东西去满足 。

但我总觉得英伟达做东西它是有点领先于市场需求的 。

季宇7:25

其实这个事情是这样的 , 首先从软件的角度来讲 , 你不可能做一个硬件满足不了你的软件 。 所以硬件确实是所有软件的边界条件 ,但是谁的硬件 , 这个是可以选的 。

只要市面上存在一个能更快地满足用户需求的硬件 , 那它一定会把满足得更慢的给淘汰掉 , 或者至少这样的一个硬件一定会成为主流的形态之一 。

所以我讲的就是说 , 咱们回过来看大家在 AI 芯片这个领域 , 大家其实卷的速度是没有英伟达快的 , 或者说你跟它做得一样快 ,在今天看起来已经非常不容易了 ,但是还是没有什么意义 。

因为它如果能按照这个速度满足 , 那它永远是至少第一梯队的产品 。 那大家其实没有必要去从一个主流的第一梯队产品去切换到一个其他的产品上去 。

所以这个动力是不足的 。

曲凯8:14

这个我觉得就是追赶者跟创新者之间的那么一个区别吧 。

季宇8:17

对 , 所以这个事情第一个是说从战略意识上, 你首先得重视这个事情 , 对吧 ? 所以老黄当时其实讲说为什么他们要 6 个月迭代一块 , 对吧 ?

曲凯8:26

但最后它之所以能 6 个月迭代一块 , 你觉得是因为它的战略选择 , 说它逼着大家必须要做到这件事 , 然后就做到了 , 还是说因为它具备一批很好的人, 或者它有一个很好的什么技术的一个开始 ?

季宇8:37

我觉得技术永远是非常难的 。 今天大家对技术的这个认知没有问题 ,但是我想讲的是说 , 就这件事情想要做成 ,不只是技术上要面临难题 。

宏观的战略层面是更重要的一件事情 。 所以我更多地强调是说 , 如果你没有这样的认知 , 哪怕你有技术 , 你也不会去追求 10 年 10 万倍 , 对吧 ?

但是呢 , 我有了这样的认知 , 你追求 10 年 10 万倍在技术上仍然是非常非常难的 。 因为英伟达它也没有什么 magic, 它也是在按照摩尔定律去演进的半导体工艺上去跑出了比别人更快的曲线 。

那这个确实有代价 , 比如说它功耗越多越大 , 对吧 ? 大家都说它是核弹嘛 , 就是这个它的 GPU 功耗大 ,但功耗大对它来讲其实也不是什么坏事 。

因为它能做这么激进 ,CPU 能不能做这么激进 , 对吧 ?CPU 想集成它也得吃那么大的功耗 。 那这时候 CPU 就会陷入一个两难的选择 。

但它如果做得不激进 , 它的功耗很友好 , 然后性能也没提那么激进 , 那这时候它跟集显是拉不开显著的差距的 。

那到时候英特尔一集成 ,GPU 的市场就没了 。 所以这个才导致了 GPU 成为了一个独立的生态位 。

曲凯9:54

对 , 所以你讲就是说它一开始就定了一个很明确的战略 , 它知道它要做什么事情才能最后存活下来 。

季宇10:02

才能突破英特尔或者 CPU 的这套裁判的逻辑 。

曲凯10:06

对 , 就当年的那个时候 , 比如说 2000 年左右的英特尔 , 可能就是类似于现在的英伟达一样的一个位置 。

季宇10:12

对 ,是的 。 甚至比今天还要可怕 。 因为你想想 , 今天大家好歹还知道有英伟达 ,有英特尔 ,有 ARM, 对吧 ?

有很多家 。 当时其实说实话 , 整个计算机系统全是建立在整个 X86 的生态上的 , 对吧 ? 所有的软件都是长在它上面的 。

曲凯10:27

所以我们回到刚才讲的 , 就是你觉得英伟达能做得好 , 第一个原因就是说它选择了 GPU, 然后并且它有一个预期是说我未来的多少年要做到 1000 倍 。

季宇10:38

因为是这样的 ,CPU 呢 , 它是一个很全功能的东西 。 全功能呢 , 你想想当时小到 PC, 大到这个超算 , 全是用的英特尔的处理器 ,而且英特尔也在不断地集成越来越多的功能 。

那在这个过程中呢 , 确实你说计算的种类其实会变得非常差异化 , 对吧 ? 有些计算强调的是这个分支啊 , 或者这种逻辑面的事情 , 对吧 ?

有些计算强调的就是算力本身 , 我就是要堆很强的算力 , 对吧 ? 所以不同的计算类型今天集成在一颗芯片上, 所以看起来这颗芯片是很全能的 , 很无敌的 。

然后那英伟达它选择的是把这个功能解构开来 , 就是说我并不需要在所有的计算类型上比这个 CPU 要强 , 我只要在部分类型的应用上比它强 。

等于说你可以认为所有的场景可能对芯片有 ABCD 几种需求 , 对吧 ? 那今天这颗芯片 ABCD 都很强 , 对吧 ?

但是其他一些场景呢 , 可能要的是 BCDE, 对吧 ? 所以这个时候大家更关注的可能是说我把 BCD 这些维度做得比这个通用的芯片要强 。

今天那按照这个品类来 , 当然最开始肯定挑的是 3D 图形了 。 当然其实它也是从 3D 图形的整个做的过程中发现了这种更好的范式 , 对吧 ?

然后希望把它推广到通用计算领域 , 然后不管是挖矿还是这个高性能计算 , 包括后来的 AI, 它一直在找这样的超级应用来符合就很需要硬件这几块的指标 。

那别的指标它可以放弃掉 。

曲凯12:09

是 , 对 , 所以就是我总结一下就是 CPU 里面其实是具备多项功能的 , 然后也具备一定的这个算力啊相关的这些东西 , 对吧 ?

就比如说像你刚才讲的 , 就是 CPU 可能是一个有 ABCDE 各种功能的一个东西 , 然后英伟达相当于典型的一个杀手技把它解构掉 , 我就只把其中的一部分拿出来 , 然后把它做到足够好 。

季宇12:29

对 ,是的 。

曲凯12:30

对 ,而不是说我还仍然做整个的 CPU, 然后我去怎么怎么做 , 对吧 ? 所以很多人可能之前不太了解的一点就是说 GPU 不是 CPU 的一个替代 , 一个升级 ,而是类似于 CPU 的一个外挂 , 一个延展 , 对吧 ?

就是它这两个还是要合在一起去使用才可以 。 所以英伟达做得比较好的地方就在于说它把 CPU 的其中一部分做得足够强 , 然后让大家觉得说我就是要这两个合起来一起用 。

季宇12:54

对 , 这其实是一个非常有智慧的做法 。 因为其实在芯片行业里面呢 , 你说真正想要把整个计算机系统彻底颠覆掉 , 这件事情其实是非常难发生的 。

因为计算机行业有非常大的惯性 , 这个系统说白了是整个前人, 包括这么多年一代一代人大家积累出来的一整套系统 。

所以大家不可能说今天为了一个新兴的需求 , 就把整个计算机系统直接替换掉 , 对吧 ? 出现这种更替式的这种变化 。

所以从这个角度来看 , 你会觉得英特尔当时是 king, 那今天一定还是 king。 因为哪怕它在各方面不一定能做得最好 ,但是这个惯性会很重 。

那英伟达选择的竞争方式不是说做一个 CPU 去取代 GPU, 甚至这句话可以更激进地讲 , 它不是做了 GPU 去取代了 CPU, 它实际上是把 CPU 计算机系统的形态从纯 CPU 的体系拖到了 CPU 加 GPU 组合的这么一个体系里面来 。

那这个东西其实是平滑的 ,因为它没有把 CPU 扔掉 , 对吧 ? 它只不过说做了一个 CPU 的协处理器 。 那做了这个协处理器 ,而且让大家依赖这个协处理器 , 使得整个计算机系统变得比纯 CPU 更好 , 这是它的做法 。

这个无论是从整个生态的惯性的角度来讲 , 还是从它作为一家小公司去面对当时的这个巨无霸 , 对吧 ?

来讲 , 都是一个很好的以小博大的一个方式 。

曲凯14:21

对 , 就是它没有说我要做一个更好的 CPU, 它也没有说我要做一个全新的东西完全替代 CPU。

季宇14:27

对 ,但它是做了一个补充的东西 。

曲凯14:29

对 , 融入到里面 。其实这个很有意思的地方 , 相当于是说英特尔跟 NVIDIA 有一定的竞争关系 , 对吧 ?

它们竞争的不是说这个设备到底是买英特尔的还是买英伟达的 , 它竞争的是在计算机系统里面谁更重要 。

所以呢 , 这种竞争其实更有意思的地方在于英伟达不做 CPU, 对吧 ? 英特尔当时也不做 GPU, 对吧 ? 它们相互不做对方的东西 。

甚至呢 , 这个英伟达想推的这种主流的系统的形态 ,是站在它的竞争对手英特尔的基础之上, 对吧 ?

做了它的系统的一个扩展 。 所以这种竞争模式其实可以大量地借鉴你的竞争对手做的所有的工作 。 等于说英特尔把 CPU 做得更好了 , 那 CPU 加 GPU 的这么一个体系也会变得更好 。

然后英伟达把 GPU 做得更好了 , 这个体系也会变得更好 。

季宇15:20

我想一下, 它其实有点像就是当时的英特尔是一个绝对领先的一个生态 , 对吧 ? 就像现在的这个英伟达是一样的 。

所以英伟达想的是说我不是要彻底颠覆你 , 我是先进入到你的生态里面 , 然后我再慢慢地把你蚕食掉 。

最后相当于说形成了一个宿主的转化的这种感觉 。

曲凯15:37

对 , 黄其实在过去 , 尤其在零几年的那段时间 ,其实有很多采访可以看到 , 就是说他其实也在不断地强调 ,其实这是关于计算机系统的灵魂到底是这个 。

顶级阳谋15:48

季宇15:48

你说这个我特别好奇 , 我在想他一开始到底他是更 , 比如说类似于韬光养晦 ,他说我们不重要 , 还是 CPU 厉害 , 我们只是一个附属一个生态位 , 还是说他从一开始他就一直会讲说 GPU 其实是更好的 。他会一直讲 GPU 是更好的 , 那他不会怕说那英特尔听到说 OK, 那我来打你或者怎么怎么样 , 我把你从我生态里隔离出去 。

曲凯16:12

英特尔一定会打他 ,但是英特尔本身它最开始为了保证围绕 CPU 的这样的计算机系统能变成各行各业的这个可以使用的东西 。

今天大家看到就是说计算机系统已经成为人类生活当中就是完全不可分割的一部分 , 所有地方基本上都要用 。

这个其实也有当时这样一个开放体系带来的一个巨大的好处 。 要不然的话 , 可能大家觉得这个计算机本来就是用来用在比如说军事啊 , 或者一些特定的航天啊这样的领域 , 那普通人根本不需要这样的一个设备 , 对吧 ?

它其实也是因为足够开放 , 所以使得别人可以更好地通过做一些加速卡的形式 , 让这样的一个计算机系统能推到所有的行业去 。

那所以在这样的一个基础上, 英特尔也没有办法去把这样的一个门关上 ,因为它关上了它整个计算机系统的可扩展性也破坏了 。

季宇16:58

所以就是一个阳谋 , 类似于我就是说我是好的 , 你也知道我在做什么 ,但你拿我没办法 。

曲凯17:04

对 ,但为啥就一定拿他没办法呢 ? 就英特尔为什么做不到跟他类似的事情 , 或者市场里没有别人做类似的事情 ?

季宇17:12

因为这个阳谋其实有几层啊 , 第一层是说那么不管是英特尔还是英伟达 , 你都可以去想一个问题 , 你希望的是未来的计算机系统变成是一个纯 CPU 的系统 , 还是一个 CPU 加 GPU 的系统 ?

那英伟达答案一定是 CPU 加 GPU 的系统 。

曲凯17:29

我觉得有几层啊 , 英伟达肯定是想 CPU 加 GPU,但我觉得对于英特尔来讲的话 , 它最简单的对它来讲没有变化 , 肯定就是 CPU 还是 GPU, 对它来讲是最简单的 。

然后其次就是如果是 CPU 加 GPU, 那它自己能不能把 GPU 做了 ?

季宇17:44

对 。

曲凯17:45

对吧 ? 我大概捋到这个逻辑啊 , 你继续讲 。

季宇17:48

对 , 所以其实从这个角度来讲 , 第一个争夺的关键是说到底是单一 CPU 还是 CPU 加 GPU, 对吧 ? 那从这个角度来讲 ,因为毕竟是不同的形态 ,CPU 加 GPU 它就是站在 CPU 的基础上做扩展 , 所以只要做得扩展这个点能做得非常非常亮眼 , 那它一定能更好地去把纯 CPU 的这个体系取代掉 , 对吧 ?

这也是为什么我讲的说其实 CPU 加 GPU 是一个非常非常有智慧的一个做法 。

曲凯18:16

在任何其他领域里面有没有这类的东西 ? 你有想过这个问题吗 ?

季宇18:21

这个问题我好像还没有认真想过 ,但我觉得其实一定可以找到非常多这样的例子 。 对 , 然后另外一种就是说英特尔如果 OK 觉得从这个顶层的逻辑上来讲确实竞争不过 , 那它也做一个 GPU, 那至少在 GPU 这个赛道它是后发者 , 对吧 ?

曲凯18:39

我想啊 , 首先就是 CPU 本身不能把 GPU 集成进来 , 就是因为你刚才我们讲的就 GPU 本身的发展非常快 , 然后它可能更多的算力啊 , 更多的什么功耗之类的 , 所以它不适合被集成到 CPU 里面去 ,是吧 ?

可以这么理解 。 对 , 所以它一定是单独的 。 然后单独的话 ,但英特尔在当年是那么领先的一个位置 , 它为什么不能把 GPU 做出来 , 或者不能把英伟达干掉 ?

季宇19:08

它并不是说不能把 GPU 做出来 , 所以我讲的说这个逻辑是一层一层的 。 最顶层呢 , 就是说咱们站在英特尔的角度 , 首先如果你选 CPU 加 GPU, 英伟达已经赢了第一步了 , 对吧 ?

它已经把你拖到这个体系里面来了 , 甚至拖到说你不是在 CPU 上跟它竞争 ,而是在 GPU 上跟它竞争 。其次呢 , 就是说如果你也开始跟它卷 GPU,OK, 那大家就一起推动 GPU 往前飞速地发展 , 让整个 CPU 加 GPU 的体系里面 GPU 变得越来越重要 。

你这个时候又出了一道 , 对吧 ?

曲凯19:38

又出了一道阳谋的感觉 。

季宇19:39

对 ,在第三步才是说谁的 GPU 才是主流 。 那这个时候本身这个赛道就是英伟达在主推的 , 它是有先发优势的 。

它把你拉到一个你不擅长 ,也不叫不擅长吧 , 就是说英特尔的这个基本盘是在 CPU 的 ,在 CPU 领域没有人打得过它 。

对 , 它把你拖到一个你完全陌生的赛道 , 就你到底是加入它一起把你原来的赛道给干没了 , 还是说还是拖回到原来赛道里面 , 对吧 ?

所以它确实是一个阳谋 。

曲凯20:03

对 ,但它又不像是软件 ,因为我在想它又不像是纯软件产品 。 软件产品呢 , 它会有那个 cannibalize 的那个 , 就是自己出个产品打自己的问题 , 对吧 ?

比如说 Google 现在如果要出一个 Perplexity 的搜索 , 它其实完全在打自己原本的份额 。 但你说对于硬件来讲呢 , 它是 CPU 加 GPU, 对吧 ?

它反而是扩充了它的实力 。

季宇20:23

其实也有这种方面的因素 ,因为这个其实 CPU 加 GPU 不只是单纯地做一个补充 , 它其实也在解构 CPU 的作用 ,在今天这个系统里面的作用 。

因为如果是纯 CPU 的这个计算机系统 , 那这个 CPU 是全能的 , 所有的东西全是要它来负责的 。 所以不同的领域 , 反正不管你的市场有多大 , 需求有多大 , 你最后都是要转换成要买多少个 CPU。

但是一旦说整个计算机系统变成 CPU 加 GPU 了 , 那这时候 CPU 的功能就不再是全部的所有的功能 。 从负责的角度 , 它可能只负责控制的事情 , 然后 GPU 负责计算的事情 。

曲凯21:00

明白了 , 明白了 。 所以在你看 99 年出了 GPU, 你觉得英特尔在哪个节点开始认了我们刚才讲第一层逻辑 , 说这个事是得 CPU 加 GPU?

季宇21:10

我觉得从 CPU 加 GPU 的逻辑来讲 , 从这个可能 99 年之后吧 , 首先 3D 图形加速的这个 GPU, 英特尔已经基本上认了 ,但那个市场很小 。

这时候从英特尔的角度 , 反正我还是最终要你还你只是个显卡嘛 ,也不是所有人都要显卡 , 对吧 ?

而且我还在数据中心里面赚很多很多的钱 。 对 ,但是数据中心里面什么时候开始重视 , 我觉得就是 AI 真正爆发了之后 。

所以你看到最近几年其实英特尔也开始做什么高低这种加速卡 , 包括做这个 GPU, 对吧 ?

曲凯21:45

你说的 AI 真正爆发是指的 14、15 年左右那波 ?

季宇21:49

我觉得 12 年那个时候是应用开始爆发 , 然后英伟达迅速抓住这样的一个机会 , 让它自己在整个数据中心的份额变得越来越大 , 顺便也把整个 AI 这块的软件的生态在它上面高速积累起来 。

然后等其他家开始回过神了 , 我觉得差不多要到 16 年、17 年了 。 对 , 大家到那个时间发现了 ,也不叫发现不对劲吧 , 就是慢慢重视了 , 说这个赛道开始变得越来越重要了 , 我好像纯做 CPU 已经扛不住了 。

对 ,但直到今天其实英特尔也都没有完全放弃说今天这个系统必须是 GPU 做计算 , 我做控制 , 我就是个打杂的 , 虽然我叫 CPU。

它到今天其实还是希望去不断地提升 CPU 的算力 , 来把计算这个事情从英伟达那儿去抢回来 。

曲凯22:35

这个听起来非常的有违常识啊 。 那就仍然我们如果现在今天站在英特尔的视角 , 你说这件事它还是这么认为 , 这么打的原因是它的一个理性决策的必然结果吗 ?

还是就是因为它站在之前这么多的历史身上的一个决策 ?

季宇22:49

因为它做 GPU 打不过英伟达 , 那它 CPU 它还是相对比较垄断的 。 那么它一定希望谁更重要这个事情还是要让 CPU 变得更重要 , 才更符合它的利益 。

对 , 所以这个确实存在很多纠结 。 所以这一点也导致了其实是说大厂在这个事情上不会 , 尤其面对这么顶级的一个阳谋面前 ,其实是毫无招架之力的 。

曲凯23:12

在这个过程当中有没有任何一个时刻是英特尔说 OK, 你 GPU 做得好 , 然后呢 ,GPU 的重要性我也认 , 然后我就花最多的钱 , 我组个团队 , 我也要做一个比你更好的 GPU?

季宇23:24

如果是这样的话 , 这个时候英伟达已经是一个在 GPU 领域绝对就是跑得足够快的一个公司了 。 这个时候哪怕是你是一个大厂 , 你去追它的软件生态啊 , 包括这些东西 , 就是英特尔守住自己江山的这些方式 , 对吧 ?

一样会阻挡它去抢别的市场 。

软件生态23:41

曲凯23:42

对 , 这里面最主要阻挡你觉得是硬件的那一块 , 还是 CUDA 的软件整个生态这一块 ?

季宇23:48

其实是软件生态 。

曲凯23:49

还是生态这一块吗 ?

季宇23:50

对 , 就是那个时候就 CUDA 整个的生态就已经起来了 。

曲凯23:53

对 ,因为是这样的 , 计算芯片很不一样 ,因为计算芯片的算力是有形态的 , 对吧 ? 你的算力芯片会涉及你的指令集 , 你的编程模型 , 对吧 ?

你的编程模型会影响你的上面的编程语言 ,以及上面所有开发的东西 。 那么如果上面已经积累了大量的软件的情况下, 下面这个算力的芯片的这个形态 , 就是它的指令集 、 编程模型这些东西 , 就会成为一个事实标准 。

这个时候你要撼动它 ,不只是说你要把算力的指标做得比它强 , 你这个算力形态其实你也很难去撼动它 。

所以这个形成了一个隐性的护城河 , 这个护城河其实也守护了英特尔整个 X86 的体系 。 就哪怕英特尔在这么多年可能犯了很多错 ,但是无所谓 , 就是它在这个领域还是很难被动摇的 。

所以今天你看有很多做 ARM 的 , 做 RISC-V 的 , 都想去取代英特尔 , 还是很难 , 非常非常难 。

季宇24:45

所以反过来讲 , 包括英伟达其实它现在的这个地位 , 它反过来把 CPU 那一套东西干了一夜 。

曲凯24:52

也非常难 。

季宇24:54

明白 。在整个这个过程当中,AMD 在干嘛 ?

曲凯24:58

我觉得其实 。 因为英伟达不是一个常规意义上的就是标准的半导体公司的画像 。

季宇25:05

怎么讲 ? 你觉得常规意义上的是什么 ? 然后英伟达是什么 ?

曲凯25:08

常规意义上的半导体公司就像 AMD, 就是它会跟英特尔去竞争 CPU, 它会跟这个英伟达去竞争 GPU。 就是大家其实很擅长做半导体技术 ,但是大家很难去定义新的半导体品类 。

定义新的半导体品类是一个非常特殊的能力 ,也只有英伟达有这样的能力 。 就像苹果发明了这个智能手机 , 那后面一堆厂商都可以去卷这个智能手机的品类 。

但是真正你说要发明一个像智能手机这种完全新的东西 , 就跟你在计算机行业里面说 , 我今天这个计算机系统里面应该要增加一种新的设备 , 这种设备是解决什么需求的 , 对吧 ?

它是什么形态的 , 跟今天的体系怎么组织起来 , 这个事情呢 ,其实会非常非常难 。 因为它不是一个 , 它更重要的是它的产品怎么去面向你的开发者 , 面向计算机行业的软件的这些人, 对吧 ?

怎么去撬动他们来投入到类似于 CPU 加 GPU 这样一个体系里面 。 所以这个时候呢 , 这样的一个东西 , 它跟半导体技术啊或者研发其实没有太强的关系 。

当然也有关系 , 就是说你其实塑造出来这个 GPU, 它为什么能在这些点上跑得比 CPU 要强得多 , 这个跟半导体的技术边界有很大的关系 。

所以这个事情不是半导体公司擅长做的 。 半导体公司擅长做的是 OK, 已经有一些新的品类了 ,不管是 CPU 还是 GPU, 还是其他的一些品类 , 比如说像内存条 , 或者各种各样的控制器 , 或者网卡 , 这种品类已经出现了 , 就行业里面已经接受了 , 然后我去卷这个品类 。

这些品类里面你会发现大部分品类还是比较好竞争的 ,因为大部分品类都是相对比较标准化的 。 标准品就意味着说你只要技术做得足够强 , 价格做得足够好 , 大家就快速地把半导体行业的这个毛利率打下来嘛 , 对吧 ?

打到一个非常便宜的一个价格 。 但是你会发现算力芯片这个领域 , 它为什么是高度垄断的 , 就是因为你没有办法靠这种方式去取代掉它 。

你看到英特尔做了 CPU 成了 , 你想取代它 , 你做一个 CPU, 根本竞争不过它 。 然后你看到英伟达 GPU 做成了 , 你想去取代它 ,也根本做不成 , 很难做成 。

所以呢 , 英伟达其实是唯一一个能在这种游戏规则下去玩得非常顺畅 , 甚至把今天英特尔做成一个边角料的一个状态 。

季宇27:21

我在想有点像是一个细胞分裂的感觉 , 本来可能是一个单细胞 , 对吧 ? 单细胞完全就是英特尔 , 然后呢 , 单细胞开始慢慢地分裂出来一些东西 , 就是英伟达开始从这里面慢慢地分裂出来 , 然后最后变成了两个细胞 , 对吧 ?

这两个细胞当然中间可能还是连在一起的啊 , 这种感觉 。 所以 CPU 那块呢 , 英特尔仍然是老大 ,也很难去搞它 ,但英伟达在慢慢去尝试啊 。

然后 GPU 这块呢 , 英伟达确实是老大啊 , 然后 CPU 也很难搞它 。 然后在这个两个之外呢 , 可能 AMD 就是我都提供一套方案 , 然后我纯硬件层面去拼 , 去跟你们有些竞争 , 然后我也能吃到一些市场 。

我可以简单这么理解啊 , 大概是这个概念 。

曲凯28:01

对 ,因为就是半导体这一块 , 它最难的就是一个产品定义 。 所以一旦这个产品定义能标准化 , 那半导体公司就可以进去卷 。

那像 AMD 之所以还能吃到一些 CPU 的市场 , 确实也是因为它在 X86 这套标准的 CPU 的算力形态下, 它是有交叉授权的 , 所以它可以做 X86 的 CPU。

那这个时候形态已经一致了 , 这个时候它可以去按照纯半导体的这个竞争的方式去竞争 。 包括呢 ,ARM 公司也给大家塑造了一个说 ARM 整个就是一个标准的形态 , 然后我可以 license 给你 , 可以 license 给它 。

所以今天有一大堆 ARM 芯片的公司 , 对吧 ?

季宇28:36

我觉得就听讲 , 我觉得那个英伟达其实跟苹果挺像的 , 对吧 ? 就是然后 CUDA 那个呢 ,有点像 iOS 那个系统 。

然后 ARM 那个 , 我可以理解成它是类似于安卓的一个开源的一个系统吗 ? 还是什么 ?

曲凯28:49

这个我觉得还不是 。

季宇28:50

之前那个 AMD 出过一个是吧 ? 叫什么 ?

曲凯28:53

ROCm。

季宇28:54

对 , 那个是不是有点像一个开源的一套了 ?

曲凯28:56

我觉得其实还是一个替代品 , 就是看到英伟达在这块吃肉了 , 然后想做一个替代品 ,但这个事情很难 。

就它难是难在什么呢 ? 就是今天从软件行业的角度来讲 , 已经过了那个说我今天对一个新兴的需求有巨大的诉求 , 然后我愿意在这个位置去疯狂造轮子的这个阶段 。

这个阶段大概率是出现在从 12 年深度学习突然爆发了之后, 深度学习爆发了之后, 大家一下子对算力有很了巨大的需求 , 然后那个阶段有大量的开发者在写框架 , 对吧 ?

写算子 , 折腾框架到底应该什么形态 。 但这个需求一旦过了这个阶段 , 它就稳定了 。 你甭管现在稳定的形态有没有别的可能性 ,但至少它是一个稳定工作的东西 。

然后今天大家愿意折腾的也不是这个层面的东西了 。 那这个时候你再去推任何这类的东西 ,其实就比较难了 。

季宇29:49

CUDA 是哪年出的来着 ?

曲凯29:50

CUDA 很早 , 大概 05 年 。

季宇29:53

我刚才听你在讲 , 我其实我在想个问题啊 , 我可以理解为什么英特尔或者 AMD 没有把这个东西做好 ,但我现在有问题的一个点是说 , 它就好像英伟达当年仍然是一家偏创业公司的感觉的公司嘛 , 对吧 ?

然后它把 GPU 出来 , 把 CUDA 出来 , 然后已有的巨头没有看到这个市场 , 或者因为各种现存的原因没有去做 。

我觉得这个是可以理解的 。 为什么没有其他的类似英伟达这个体量跟阶段的公司来去跟英伟达竞争呢 ?

最后变成说让英伟达有这么长的时间把 CUDA 整个体系建立起来 。

曲凯30:27

因为本身塑造这个阳谋就不是一个大势所趋的这种事情 , 它其实是一个事在人为的事情 。 大势所趋是计算机行业保持现状 , 继续往前走 , 然后现状里面哪块有痛点 , 哪块就提升 。

然后它塑造的阳谋是要把借着一些新兴的需求的变化来改造这个行业 。 所以这个东西不会变成一个说 。

季宇30:51

对 , 我当我说的就是说 , 比如它已经改造了 , 大家已经看到了 , 那可能比如比它落后个一年、 两年, 然后再进来就已经来不及了吗 ?

曲凯30:59

对 ,因为这个有意思的地方就在哪呢 ? 你如果没有改造成功 , 大家也不会觉得这是行业所需趋势 , 对吧 ?

你改造成功了 , 你也垄断了 。

季宇31:08

OK, 这个还真跟软件市场不太一样 ,是吧 ? 因为我在想 , 软件市场你领先个一两年, 后面人花更多的钱进来给你抢市场 。

曲凯31:18

软件因为毕竟它的整个周期 , 包括迭代速度 , 包括需求的变化 , 包括它满足的面嘛 , 都比较窄 。 就是你越往下 ,其实这个东西是越 fundamental 的东西 , 芯片是最 fundamental 的东西 , 包括计算机系统的形态 。

所以这个东西一旦发生了改变之后, 是很难往其他方向去改正的 。 它不像软件 , 软件可能今天这波需求过了 , 它可能这个东西重要性就快速下滑了 。

本质上是在于整个计算机系统 , 你越接近应用 , 你的稳定性越差 ,但是呢 , 你可能短期内越赚钱 , 对吧 ?

然后越往下, 你可替代性是越难被搬动的 。

季宇31:55

是 , 这个事情你觉得老黄他是真的一开始就想得非常清楚 , 就像我们今天复盘一样 。

曲凯32:00

我觉得一定是想得非常清楚的 ,因为你回头去看他过去的一些采访 , 包括去看他过去讲的一些事情 , 你发现其实他在那个时候就已经有这样的认知 。

就比如说我刚刚讲的 ,他要六个月翻一翻 , 包括他讲的今天这是一个关于 PC 的灵魂的之争 , 对吧 ?

不是一个设备的争夺 , 对吧 ? 这些都是他在很早之前就讲的 。

季宇32:23

对 ,而且我看他在所有地方他都会讲很重要一个点 , 就是他说我们要做别人没做过的事情 , 对吧 ? 不要去在同个维度上跟已有的东西去竞争 。

曲凯32:32

对 。

季宇32:34

所以这个确实还是牛 。

曲凯32:37

对 , 所以我就是说他是一个非常擅长去卷这个上层这套逻辑的 。

季宇32:44

上层你说的上层是指的 ?

曲凯32:45

软件生态 , 包括怎么调动开发者 , 包括调动需求 , 往一个他想要去推动的计算机系统的一个方向 。其实你刚刚讲了一个比方 , 就是说单细胞啊 ,其实我还是觉得可能倾向于讲一个生物怎么在进化 , 对吧 ?

其实说白了 , 大家最开始所有的生物都是从最开始的单细胞开始的 , 对吧 ? 就是计算机系统也是一样的 , 计算机系统可能最开始也是一个很普通的 、 很简单的一个这个生物形态 。

但是呢 , 计算机系统到底可以走向什么形态 ,其实说白了 , 今天所有存在在这个世界上的动物都是有可能的形态 , 对吧 ?

大家都有自己活下去的方式 。 那么计算机系统会往哪个方向走 , 至少在一个很大的行业里面 , 最多只会有一到两种可能性 。

所以呢 , 到底往哪个方向去进化 ,其实就会变成大家去争夺的重点 。 所以其实英伟达就是在不断地塑造这个进化的方向 , 往着对它更有利的方向去动 。

对 , 就好比比如说今天你这个生物面临的一些新的竞争压力 , 比如说这个大海已经要你要走上陆地了 , 对吧 ?

你要去探索计算机系统能服务的新兴的行业了 , 对吧 ? 那这个时候你可能要长出脚 , 对吧 ?

季宇33:58

对 , 英伟达就好像是带大家走上陆地 , 然后英特尔呢 ,是觉得我要往更深海的区域去走 , 就类似于这种感觉 。

曲凯34:05

对 , 或者就是说走上陆地 , 我可以靠我原有的这个棋去演化出来 , 我也可能单独长出一个新的器官来满足这个事情 。

就说白了 ,是长出一个新器官 , 还是原有的器官发生一些这个量变 , 对吧 ? 来满足这个需求 。

季宇34:20

对 ,但这个事我觉得首先它赌很大 , 对吧 ? 然后其次就是这事难在于说它确实是软硬件结合的 , 都得往前统一走的一个事情 。

曲凯34:29

对 , 它这个东西就不是说这个器官到底怎么做出来 , 然后怎么让它具有我们想要的能力 , 对吧 ?

更重要的反而是进化的压力到底来自于哪 , 对吧 ? 我们希望把这个计算机系统或者这个有机体走向一个什么样的生存方式 , 对吧 ?

这就是我讲的说这个芯片产品很难定义的 。 一方面它涉及到很多上面 , 你对上面的这个需求 , 包括计算机系统演化的整个演进的大的逻辑 , 对吧 ?

这个是跟半导体完全没关系的 。 但确实这个产品它很难做好的一点 , 它软件公司绝对做不了这样的东西的事情 ,是因为你得知道硬件的边界在哪 , 对吧 ?

不是说我今天要做一个比 CPU 做得更强 , 今天你看英伟达 GPU, 你会发现哇 , 它所有的维度都比我强 , 对吧 ?

你要算力它很强 , 你要互联要网络 , 你会觉得它是所有维度都垄断的 。 那其实英伟达当时看英特尔也是一样的 , 对吧 ?

英特尔当时 5 还比台积电要强 , 对吧 ? 那个时候它的垄断性比今天英伟达还要强得多 。 所以这个时候会涉及到你半导体边界怎么去定 。

那这个时候你想想 , 一个小公司怎么去在资源跟各方面都不如大公司的情况下, 怎么去跟它补 。 就是说它的劣势 , 它没有劣势 , 它唯一的劣势是它要所有的维度都兼顾 。

那么如果你什么都不能放弃 , 你跟它一样去所有的维度兼顾 , 你其实就是在做它的替代品 , 你一定打不过它 。

但是如果你选择在其中一个点上去跑得比它快得多 , 然后你去放弃到别的点 , 这个时候你才有机会跑得更快 。

单点打爆35:56

曲凯35:56

所以我们讲得更具体一点 , 就是说英伟达的 GPU, 它 all in 的是吞吐 , 对吧 ?

季宇36:03

吞吐能不能用一句这个人话大家都能理解的解释一下, 它是一个什么意思 ?

曲凯36:07

吞吐就是比如说我今天要算

1000 个小学数学题 , 英特尔是一个大学教授 ,他可能擅长解微积分 , 对吧 ? 但是他没有办法在很短的时间内把这几万道题全部都快速做完 。

但是如果你找 1 万个小学生 ,他可以在很短的时间内快速把这些东西全部做完 。 对 , 所以其实是类似这样的一个 。

季宇36:30

其实就是并行计算的意思 。

曲凯36:31

对 , 就是并行计算 。 对 ,但是这个英特尔呢 , 它很多业务是单线程的 , 它并不是说有 100 套题 , 它可能是一个串行的一个任务 。

那它希望这个串行的任务做得非常快 , 它不能找一个小学生来做 , 它得找一个非常资深的教授来做 。

那英伟达选择的就是说我完全不要单线程的延迟 , 我就是把小学生数量堆得无限得多 , 这样我在做这种简单的并行的大规模计算的时候 , 我可以跑得比你快得多 。

它用的技术说实话英特尔也都有 , 比如说多核 , 对吧 ? 多核今天的处理器也都是多核的 , 然后它一个核会跑很多的线程 。

那英特尔的处理器大家今天也会讲 4 核 8 线程 , 对吧 ? 就是这个也是一个核跑多个线程 。 所以类似的技术都有 。

那英特尔只要改改参数 , 比如说我改成 4 核 16 线程 ,4 核 32 线程 , 我也可以往那个方向去演进 , 把我的 CPU 逐渐演化成一个 GPU 的形态 。

但是呢 , 这么做单线程的延迟就崩了 。 所以它没有办法 , 它今天阻止它去做 4 核 16 线程甚至 32 线程的主要原因 ,是因为它要保证单线程的延迟要足够低 。

对 , 就是我解一道非常复杂的数学题的那个速度我要足够快 , 这两个东西会相互冲突 。 所以这个其实是以小博大的机会 。

季宇37:48

对 , 或者说它选了一个自身一定是要有矛盾和有博弈的那种点 , 就逼着对方如果你要打我 , 你就得做选择 。

曲凯37:56

对 。

季宇37:57

或者又是回到我们刚才讲的 , 就是个阳谋 。

曲凯37:59

对 , 它一定塑造的是一个阳谋 。 对 , 就是你会发现英伟达其实整体塑造了一系列的阳谋 。

季宇38:07

对 , 所以总结一下, 从这个角度来讲 , 那英伟达现在就是一个当年类似于英特尔的一个无敌的状态了 。

无敌之姿38:07

曲凯38:13

对 ,是的 。

季宇38:14

所以你在知乎上提到好几次你是这个英伟达吹 ,是吧 ?

曲凯38:19

对 。

季宇38:20

所以你是对它看好到什么程度大概 ?

曲凯38:22

首先我觉得就是说它的这个能力确实是在半导体行业独一无二的 ,而且它也确实今天不光它有这样的能力 , 它能以小博大 , 它今天还是一个巨无霸 , 对吧 ?

所以它的垄断性比大家想象的还要难打破得多 。 虽然今天有很多人去讲说这个今天 transformer is all you need, 对吧 ?

这个模型收敛了 ,是不是我这方面的护城河变薄了 , 或者 whatever。 但实际上你可以想一个很简单的道理 , 今天大家对于 X86 的 CPU 还有多少需求 ?

没有多少需求 。 但是 X86 CPU 今天连英伟达想去扳倒它 , 今天英伟达都要花很大的精力去布局 , 这个能不能做成还有待于未来几年的整个情况 。

季宇39:03

就英伟达我觉得按我们刚才讲的 , 它更多的是一个产品定义 , 加上软硬件生态一体化 , 加上它的一个对市场的很强的信心跟预判结合的一个结果 。

曲凯39:17

对 。

季宇39:18

所以它其实不是说我技术多创新 , 就有个什么东西 , 我有个什么 PhD,有个专利 , 这个事只有我能做 , 别人做不了 。其实不是这么样的一个东西 。

曲凯39:27

对 ,因为其实从技术的角度很难塑造真正意义上这个护城河 。 就是说其实如果是这样的护城河的话 , 这个市场会变得 ,因为永远不可能只有你一家是巨头嘛 。

你今天世界上巨头也很多 ,有钱有资源 , 对吧 ? 有半导体研发能力的公司还是有的 。 你说这个多确实也没那么多 ,但还是有的 。

那它的市场格局一定会演化成有多家巨头 。 举个典型例子 , 就像内存条 , 对吧 ? 今天就有三家巨头 , 对吧 ?

而不是说一家高度垄断 。

季宇39:55

那英伟达 , 英伟达现在应该是 1100 多 , 对吧 ? 最新的股价 。 你买了吗 ? 自己 ?

曲凯40:02

其实我自己对于二级市场的判断没有那么准 ,因为我可能对英伟达很有信心 ,但我不知道别人对英伟达的信心到底建立在什么基础之上, 对吧 ?

它这个溢价有没有包含大家在跟我一样对它的这个信心的预期上 。

季宇40:15

但以我们刚才讲的逻辑呢 , 就是英伟达就是如果仍然是 GPU 这个市场 , 整个环境不变的话 , 它可以永远垄断下去 。

曲凯40:22

但这个事情放到 20 年前也是一样的 , 就是说如果整个计算机系统就是 CPU 为主 , 那其实没有任何半导体公司的机会 , 对吧 ?

那计算机系统永远是全是 CPU 的天下 ,因为 CPU 就是已经覆盖了所有的行业 , 它已经成功把计算机变成了一个人类社会的必需品 。

季宇40:40

是 , 所以以我们刚才谈的那个逻辑 , 如果现在是要说英伟达还有什么破绽啊 、 缺点啊 , 或者后面要怎么 ?

曲凯40:47

其实这些破绽并不是说所谓它从大势所趋上有什么缺点 , 它有什么缺点它一定会改正 。 我觉得今天如果想要跟英伟达竞争的话 , 本质上还是要像英伟达当年一样 , 你要给英伟达塑造一整套的阳谋 。

季宇41:02

你是来个 CPU 加 GPU 再加个什么东西 。

曲凯41:06

对 ,但这个东西就得去仔细地看今天的你怎么去解构它 。 这个解构 ,因为今天很多人也可能讲说那除了 GPU 我再加个 NPU, 对吧 ?

我专门针对 AI。 但是我觉得这个事情是不现实的 ,因为 AI 是 NV all in 的优势 , 就是大家以前讲的这个 AI 芯片嘛 。NPU 就是 neuron, 对 ,neuron network 的这个 NPU。

季宇41:31

神经网络的东西 。

曲凯41:32

对 , 当然这个名字大家取得五花八门了 ,TPU、IPU、LPU、whatever, 一大堆 。 对 ,但这个呢 ,其实还是一个针对场景的选择 。 这个就有点像什么呢 ?

比如说这个互联网蓬勃发展的时候 , 对吧 ? 英特尔的 CPU 在数据中心里面大把捞钱 。 这时候你说我要做一个专门针对 ,因为大家看到当时互联网企业主要跑的什么数据库啊 , 什么这个 web 服务啊 , 对吧 ?

这样的一些这个应用嘛 , 对吧 ? 这时候你说我做一个针对数据库的专用处理器 , 你会发现其实是没有机会的 ,因为英特尔的处理器在这种 I/O 啊或者控制上面 , 它就是很强的 , 它也没有什么太强的弱点 。

当然你也可以选择去拉爆它 ,但是那本身就是它 all in 的一个市场 ,也是它最大的一个市场 。 所以呢 ,在这个点上你其实是很难去说我基于场景我去把它拉爆的 。

对 , 所以你想想那个时候英伟达它虽然有这样的战略眼光 , 它选择的还是在吞吐这个维度上去搞 。

那其实整个互联网产业很长一段时间跟英伟达的 GPU 是没有任何关系的 。 那个阶段老黄肯定也天天在想到底有没有什么样的机会能让我这个 GPU 或者我像 all in 的这个点上 ,在互联网里面也很重要呢 ?

但放眼望去没有 。 所以我觉得其实说塑造这个东西 , 你一定要按最保守的方式去充分考虑你们的所有的可能性 ,而不是说今天只要是 GPU 加上一个新的东西 , 它就一定能成为行业的未来 。

季宇43:00

所以你现在有什么大概的结论吗 ? 应该是要怎么 ?

曲凯43:03

我觉得今天英伟达想往 AI factory 上去走 , 那意味着它的 GPU 今天承担的功能在整个计算机系统里面也变得非常的庞大 , 对吧 ?

它可能要计算 、 要显存 、 要互联 , 什么都要 。 所以这个时候其实也有了进一步去解构这个它的可能性 。其实这个事情很反直觉啊 , 就是说当一个芯片它越全能的时候 , 反而是它越有可能被解构的时候 ,因为它全能意味着它要兼顾的东西会变得非常非常多 。

所以其实核心还是怎么找到一个解构的方式 , 对吧 ? 其实还是重新定义 , 就是说以前英伟达定义的是说 CPU 做控制面的事情 , 那我做计算面的事情 。

那计算面的事情今天又变得非常非常的庞大 , 对吧 ? 它涉及到包括网络互联 , 包括这个分布式计算 , 包括这个巨大的显存需求 , 包括巨大的算力需求 ,也变得非常综合 。

这个时候有没有机会去把它拆开来 , 这个说实话还是事在人为 。

季宇44:00

对 ,但我有点不太理解啊 。 对 , 就是你刚才讲那些所有的组成部分 , 它现在是当一个解决方案去全套的去卖 , 对吧 ?

全家桶44:01

季宇44:12

但如果把它拆开来 ,其实它现在是不是也能拆着单独去卖 ?

曲凯44:16

当然它也可以拆 , 它也会讲说我可以拆 。

季宇44:18

对 , 如果它能拆的话 , 那是不是它自己就是本身具备了解构这个属性了 ?

曲凯44:22

它这个拆呢 ,其实不是说像当时英特尔那种开放体系的那种拆 , 它实际上还是说今天你的数据中心到底要几比几的一个配比 , 对吧 ?

你交换机跟 GPU 的配比到底是什么样 ,但是反正这个 。

季宇44:35

就是一定是在它那个体系之内的 。

曲凯44:37

对 , 它是那个体系里面给你了你很多 option。

季宇44:40

对 , 所以它为的就是说你买一个东西就得买我其他东西 。

曲凯44:43

它希望是 。

季宇44:44

它就是 。

曲凯44:44

对 , 它希望的是整个计算机系统演化成 NV 全家桶 。 这个全家桶里面我可以给你不同的套餐 , 可以给你不同的组合的方式 ,但是你逃不开我这个全家桶 。

季宇44:53

这个是不是商业演进的必然啊 ? 感觉软件系统其实也都是这样的 , 对吧 ? 就是我一个做得好了 , 我就要带其他的 , 我就一定最后是个全家桶 。

然后呢 , 你一旦是个全家桶 , 大家总归觉得有的东西用得不爽 。

曲凯45:06

这个一定是符合英伟达的利益的 。 就它能做成这件事 , 它一定会往这个方向去做 。 你包括当时英特尔也是一样的嘛 , 它虽然是开放体系 , 对吧 ?

但是它的逻辑是你帮我试错 , 试完了我就帮你集成 , 集成完了我又是一个全能的东西 , 对吧 ?

它是这么一个逻辑 。 那英伟达的逻辑是我干脆不给你开放这个东西 , 对吧 ? 你就直接买我的全家桶 。

对 ,但我其实讲的很多破绽呢 , 更多是这样的 , 就是说你要给它塑造一个阳谋 , 它并不是全方位无敌的 。

就是事情总有两面性 , 就当你选择往一个各方面都很强的角度去做的时候 , 你同时也其实在做的是一个各方面都兼顾的事情 。

只不过说今天大家很多半导体的惯性的思维都是说你各方面都兼顾 , 我也要去照着你这个品类去做一个各方面都兼顾的产品 , 那自然而然打不过它 ,而且觉得很绝望 , 对吧 ?

同样就是说它今天把整个体系搞得越来越封闭 , 实际上就是说整个计算机的系统呢 , 它其实是一个有机体嘛 , 对吧 ?

你如果去操纵这个有机体 , 操纵一个开放体系 , 往你想要的方向去走 , 那这个开放体系说白了还是你说了算的 。

但如果你现在想从这个开放体系里面来 fork 出一个封闭体系出来 , 那这个开放体系今天就被大家扔到一边了 , 对吧 ?

但是你也给了别人机会说我去把这个开放体系重新激活 。 所以其实我们一定程度上会充分利用这样的一些特点去给英伟达来塑造一些就是让它难受的地方 。

这个说起来其实非常非常的夸张 , 等于说你作为一家小公司 , 你怎么去给今天市值最高的这个半导体公司给它创造一个难受的事情 。

对 ,但我觉得其实这里面是充满机会的 。 因为我举个例子 ,其实你想想对英伟达而言 , 它往 CUDA 上去走 , 那其实整个行业是受损的 , 对吧 ?

只有它获取了很高的溢价 。 所以这个时候你能去把白盒的体系去推动起来 , 那其实全行业会有第二选择 。

季宇47:01

白盒的体系是指 ?

曲凯47:03

就类似于英特尔的这套开放体系 。 就整个计算机系统最开始是英特尔这套开放体系奠基的 , 对吧 ?

英伟达加入进来 , 融入进去 , 然后把自己做得越来越重要 , 重要到一定程度它开始做私有化改造 , 对吧 ?

往它的私有体系上去改 。 今天它想做最后临门一脚 , 把英特尔的 ,也不是英特尔 ,其实今天的 X86 处理器也有 AMD 的 , 包括跟英伟达很多这个处理器都是用的 AMD 的 。

但我们讲的就是这个 X86, 想把 X86 也踢掉 , 对吧 ? 真正完成这个整个计算机系统的闭环 , 对吧 ? 这个对于整个产业的发展其实是不利的 。

所以这些都是今天就是说你如果你想去塑造一个阳谋 , 你可以去利用的 。 因为如果它今天还是驾驭着这套开放体系 , 你要跟它这个体系里面去争方向盘 , 这个是很难的 。

但它今天越来越想往它私有体系里面去搞 , 它相当于证明了私有体系才是王道 , 这个开放体系不行 。

那如果有别人能把开放体系给重新拉起来 , 那别人可以去 , 就它从这个车上跳下来了 , 对吧 ?

季宇48:04

明白 。

曲凯48:05

我们其实整体来讲 , 宏观上也是希望去塑造一些新的芯片品类 , 来让今天的这个开放体系能重新变得有竞争力 。

因为这个也符合今天这个大模型这个产业 , 或者任何一个产业吧 ,PC 产业也好 , 互联网产业也好 , 它的硬件底座一定要是一个白盒的开放的体系 , 一个高度垄断的体系 , 最终会导致大家投入产出比完全算不过来账的一个这个事情 。

季宇48:29

对 , 所以总结一下就是英伟达在 GPU 这场仗吧 ,其实早就打完了 。

曲凯48:34

对 。

季宇48:34

对吧 ? 而且 GPU 你按我们刚才讲法 , 就是如果只是看 GPU 这块 , 未来也不会有人能去跟它竞争 , 除非整个的体系变化或者出来跟新的东西 。

曲凯48:45

我觉得这个事情是这样的 , 就是算力芯片这个市场是一个垄断的市场 , 垄断的企业都是独一无二的 。

它一定不是说大势所趋 , 然后出现一堆公司去卷一个垄断的机会 , 对吧 ? 垄断的机会一定是每个公司自己去创造出来的 。

就像我讲的就是说 ,其实在今天这个市场环境下, 如果你希望的是去在这个市场上去分一杯羹 , 你最终目标一定是走向垄断 , 至少在某一个芯片品类上你要走向垄断 。

那怎么能塑造这样一个市场 , 一定是一个独一无二的策略 。

季宇49:20

嗯 , 对 ,OK。 我看你之前文章写的 , 就是你对那个大模型本身的那些算法技术什么的也写过一些东西嘛 , 对吧 ?

大模型与市场49:20

季宇49:28

就我想问问就是你怎么看现在大模型的一些发展 , 然后以及跟它跟芯片啊等等这些结合 , 包括比如最新的 MOE 啊什么这样的 。

曲凯49:38

首先我觉得大模型从算法的角度来讲 , 它也是又往上走了一个台阶 。其实我觉得这个算法的演进也跟我们刚刚讲的是一样的 , 就是其实过去很多人说深度学习不行 , 然后想打破或者搞一些新的算法来解决深度学习的很多问题 , 这个 somehow 可能是对的 ,但是我觉得深度学习的潜力其实远不止今 , 就过去大家看到的这样 , 未来的把深度学习

取代掉或者就是说革命掉的 , 它往往不一定是说从另起炉灶做的一套东西 , 它有可能是基于深度学习演化出来 ,在别的维度又产生了一些新的东西 。

所以大模型其实也确实是这样的 , 只不过我过去可能想得更复杂一点 , 我没想到这么简单的方式就可以产生一些新的东西 。

但我后来反思了一下 ,其实大模型相对于深度学习 , 它有一个新的变化 , 就是它的 one shot 的能力 。

这个能力呢 , 就是在于它可以理解你的上下文 , 它可以从你的上下文里面快速学东西 ,而不像过去的深度学习只能从数据集里面学东西 。

这个呢 , 一定程度上是来自于语言 。 就是说其实像 OpenAI 的那个首席科学家一样嘛 ,其实他说这个压缩嘛 , 对吧 ?

说这个 ,但我觉得压缩其实是深度学习的能力 。 就是说你给一个数据集 , 然后给一个深度学习模型 , 它其实都可以做压缩 。

但是呢 , 大模型产生的新的东西是什么 ? 是它把语言的抽象 , 包括 one shot 的能力给压缩到这么一个模型里面了 , 使得这个模型又获得了语言本身附带的这个 one shot 的能力 。

这个能力其实是没有 cover 在今天这个 scaling law 里面的 , 所以我觉得它也有更多的扩展空间 。 对 , 那其实这个算法继续往前发展 , 我觉得它不一定是说大模型被颠覆掉了 , 或者大模型又换了一种别的算法 , 我觉得可能也会发生这样的一些变化 。

但是呢 , 更有可能发生的呢 ,是大家今天在语言模型 , 比如说像这个上下文啊或者模型尺度上发展到一定阶段之后, 可能因为某些尺度变得非常非常的庞大 , 导致它又产生了一些新的去雕花的一些方式 , 对吧 ?

雕着雕着可能又出现了一种新的平台化的东西 , 给它又叠加了一些新的能力 。 所以这个是我觉得未来有可能会发生的 ,但这个一定是更长时间尺度了 。

季宇51:54

嗯 , 所以你觉得英伟达后面它的出货和它的这个整体的 revenue 啊什么的会怎么变化 ? 你大概觉得 。

曲凯52:01

我觉得这个其实挺有意思的 ,因为首先英伟达是一个很知道怎么去把整个市场做得越来越大的一个公司 ,但从它自己的商业利益上来讲 , 包括它讲 AI factory 的概念嘛 ,其实也是为了让自己的整个芯片产品 , 包括整个最终的这个产品能卖得越来越贵 , 对吧 ?

它的溢价也越来越高 , 对吧 ? 它讲的 the more you buy, the more you save 嘛 , 对吧 ? 我帮你把规格提升 100 倍 , 然后我收你 10 倍的价格 , 对吧 ?

就是始终这么一个逻辑 。 所以我觉得这个事情挺有意思的 , 就是说说实话 , 我们也不知道英伟达将来是说 , 当它的这个高溢价真正意义上开始伤害到这个行业 , 让这个行业开始冷下来的时候

, 那它其实会有很强的动力想把这个行业重新变得大 , 把整个市场变大 , 对吧 ? 但是在这个市场还愿意高度投入的阶段呢 , 我觉得它又肯定还是希望自己能把溢价做得足够高 ,并且借着这样的趋势 , 对吧 ?

把自己做成一个计算机系统完全封闭的一个形态 。

季宇52:59

对 , 这个很 tricky, 就有点像英伟达在跟自己打仗 , 或者在跟它自己所在的这个行业 。

曲凯53:05

对 ,因为就它在很早之前已经完成了说今天自己就是计算机不可或缺的一部分 , 那剩下的就是说怎么让这样的一个计算机系统 , 就跟当时英特尔一样 , 英特尔也要让计算机系统 。

季宇53:17

让市场足够大 , 它现在就 。

曲凯53:18

对 , 能覆盖到各行各业 ,而不是只是给算什么这个弹道 、 算航天这些领域去用 , 对吧 ? 你要变成全行业 、 全人类用的一个东西 。

季宇53:28

所以就是市场又得变大 , 自己又要赚到更多的钱 ,但这两个之间呢 , 又是很微妙的一个关系 。

曲凯53:34

我觉得其实可能有多方面 , 一方面它想借着这样的机会 , 让自己真正成为这个计算机系统唯一的就全家桶 , 变成它的全家桶 , 这个我觉得是符合它的利益的 。

季宇53:43

这个事你信吗 ? 你觉得它最后能做到吗 ?

曲凯53:45

我觉得事在人为 , 就是如果就今天 , 比如说它其实一直在找这样的契机 , 它找到一个契机它就会试一次 。

它只要发现 CPU 跟 GPU 之间有瓶颈 , 它就会立刻鼓吹这个东西很重要 , 然后也把这个行业往这个东西越来越瓶颈的方向去推 , 对吧 ?

推着推着 , 如果软件上找不到好的解决办法 , 那它就能推成 , 对吧 ? 但是如果说大家就是有别的方式 , 那它就推不成 。

就这是个博弈的过程 。

季宇54:11

所以如果今天你是老黄 , 你后面你觉得你最重要的要做的事情是什么 ?

终局推演54:16

曲凯54:16

今天站在老黄的角度 , 第一个是把大模型这个产业真正推向落地 , 这个肯定很重要 , 对吧 ? 只有市场变得真正变得 。

季宇54:24

那就是我们在做的事 。

曲凯54:26

我觉得这个事情肯定是大家都想努力的目标 ,但是呢 , 实现这种目标有很多方式 , 哪种能更好的去满足 ?

我相信其实白盒一定会比黑盒更能满足这个事情 。 然后第二个是怎么让自己在就是那套游戏规则里面真正变成全家桶 , 把今天的计算机系统真正改造成 NB 的全家桶 , 我觉得这可能是它另外一个非常重要的事情 。

因为这个可以获得更大的生态壁垒 ,因为你想想 , 如果今天可能还存在很多种博弈的可能性 , 如果大家在它的封闭体系里面演进了 10 年以上 , 整个软件体系跟它这个东西就绑定得非常死了 。

所以那个时候你再想去突破它 , 就会变得非常非常困难 。

季宇55:07

它就是皇帝了 。

曲凯55:08

对 , 基本上就是 。 就这个护城河会比今天大家想象的护城河还要深得多 。

季宇55:13

嗯 , 哎 , 如果你是 AMD 或者英特尔呢 ?

曲凯55:17

我觉得站在英特尔的角度 , 今天英特尔其实是很矛盾的 ,因为英特尔一方面又不希望承认 CPU 只做控制的事情 , 还是希望计算的事情还是能拿到 CPU 上来做 。

但是从现实的角度来讲 , 可能对它更好的做法反而是它把 PCIe 这些带宽能提升起来 , 让它围绕它的这套开放系统能够重新变得有竞争力 。

它可以拉全行业做 GPU、 做 AI 芯片的人去跟英伟达卷 , 对吧 ? 至少自己在这个体系上能做得跟英伟达有一样的竞争力 。

但我觉得现在它还是存在这样的矛盾的 。 对 , 它还是不愿意承认自己在争夺计算到底在谁上面去做这个事情上已经失败了这个现状 。

季宇55:58

嗯 ,AMD 呢 ?

曲凯56:00

AMD 就这样吧 ,是吧 ?

季宇56:01

AMD 本身它其实就是两边在 follow 嘛 ,因为 AMD 毕竟也是 X86 的很重要的一环嘛 , 对吧 ? 那它如果能去牵引整个系统 , 至少它的 CPU 围绕着这个系统能更好的做 ,但我觉得 AMD 又面临另外一个问题 , 就是它还是做 GPU 的 。

所以对它来讲 , 看起来更诱人的做法反而可能是从 GPU 这个角度入手去直接跟英伟达竞争 , 虽然这个事情在我看来几乎不可能能推成 。

曲凯56:27

OK, 好 。

季宇56:28

好呀 , 差不多 。 感谢感谢 。

曲凯56:29

哎 , 感谢