Nvidia的Jensen Huang在今年GTC的问答环节中表示,依赖全栅 (GAA) 晶体管的下一代工艺技术可能会为该公司的处理器带来20%的性能提升。然而,Nvidia GPU最显著的性能提升来自于公司的架构和软件创新。

当被问及未来一代NVIDIA GPU架构(如预计将在两代之后(2028年)推出的 Feynman)时,Huang提到,如果NVIDIA过渡到依赖GAA晶体管的工艺技术,应该会带来 20% 的性能提升。
我们自己的Jarred Walton也参加了问答环节,他表示Huang似乎淡化了工艺节点变化的重要性,强调摩尔定律的放缓意味着未来全新的工艺技术只会带来大约20%的改进——在密度、功率和/或效率方面。这并不是NVIDIA打算使用哪个节点的明确声明,尽管答案是在回答一位分析师的问题,该分析师希望他对NVIDIA特别使用三星代工厂的可能性发表看法。
黄仁勋还指出,虽然由尖端工艺技术带来的改进是受欢迎的,但它们不再具有变革性。“我们会接受它,”他说,但表示其他因素更为重要。随着人工智能系统的扩展,管理大量处理器的效率变得比每个处理器的原始性能更为重要。詹森说,数据中心越来越关注每瓦性能,而不是“我们处于物理极限”。
与苹果不同,苹果是台积电所有尖端节点的alpha客户,而NVIDIA通常不是首先采用台积电最新工艺技术的公司。相反,它使用成熟的技术。 NVIDIA已使用台积电 4nm 级工艺技术的定制版本(4N和4NP)为客户端PC和数据中心生产Ada Lovelace、Hopper 和 Blackwell GPU。台积电的4nm级生产节点属于该公司的5nm级工艺开发套件,本质上是该代工厂5nm技术的精炼版本。
该公司的下一代AI GPU(代号 Rubin,带有定制的 Vera CPU)预计将于明年推出,预计将使用台积电的3nm级制造工艺(可能是N3P,或“3NP”等定制版本)。为此,可以合理地预期NVIDIA将为Feynman采用基于GAA的工艺技术,预计该技术将于2028年推出。
台积电本身预计其首款基于GAA的工艺技术N2将使性能提高10%至15%与N3E相比,N3E是该公司在N3P之前推出的第二代3nm级工艺技术。同样,NVIDIA的黄仁勋可能甚至没有提到台积电N2或三星的替代品,甚至英特尔的18A,而只是暗示他预计总体上会有20%的提升。
值得注意的是,由于NVIDIA不使用第一代工艺技术(或至少多年来没有使用过),我们预计Feynman GPU将采用N2P(如果它继续使用台积电),它可以提高性能、降低阻力并稳定电力输送,甚至A16会增加背面电力输送,并承诺与N2相比性能提升8%至10%。N2P和A16预计都将在2027年实现量产。
如果NVIDIA在其2028年产品中采用N2P或A16,那么该公司有理由预期其Feynman GPU 在N2P或A16上的每瓦性能将比Rubin GPU在N3P上的每瓦性能提高20%。实际性能可能还会更高,不过考虑到目前对AI计算的巨大需求,NVIDIA似乎有时追求的是最高性能而不是最高效率。
虽然NVIDIA是当今领先的处理器开发商之一,但黄仁勋多次强调,他的公司不再只是一家半导体公司。相反,他将公司描述为大型 AI 基础设施的提供商。他还将其描述为算法开发的领导者,尤其是在计算机图形学、机器人技术和计算光刻等领域。
然而,尽管NVIDIA已逐渐从开发“单纯”计算GPU转向开发AI服务器,现在又转向开发服务器机架和集群,但黄仁勋认为NVIDIA并不一定与自己的客户竞争。据他介绍,NVIDIA 并不为最终用户构建实际的解决方案,而是提供基础技术。
黄仁勋的九大预测
一、他预计GAA晶体管将使性能提升约20%
当被问及未来两代Feynman GPU是否会使用台积电N3以外的工艺,从而使用GAA晶体管时,黄仁勋表示,“如果我们使用新晶体管”,他预计性能提升将在20%左右。
“它不会改变世界,但我们会接受它——我们会接受一切,”他说。
虽然每个处理器 20% 的性能提升当然很重要,但在黄仁勋设想的 AI 部署规模中,管理所有处理器的开销成为最重要的事情,他说。
二、他预计贸易关税对NVIDIA的业务影响不大
“我们有一个敏捷的供应商网络,他们不只在台湾、墨西哥或越南,”黄仁勋说。“这涉及很多方程式,这取决于哪个国家或地区征收关税。在短期内,我们预计 [潜在关税] 不会对我们的前景或财务产生重大影响。”
从长远来看,如果NVIDIA能够在今年年底前增加更多的本土制造能力,那么该公司将处于“相当不错的状态”,他补充道。
三、他重视美国的中国工程人才
黄仁勋被反复问及中国的情况,特别是关于美国出口管制限制了 NVIDIA 在该地区的市场。
他说,虽然人工智能常常看起来像是魔法,但它实际上只是软件,每个国家都有能力以某种方式运行它。
“在可能的范围内,我们希望能够用美国的技术和美国标准来支持每个国家,”他说。“我认为这对需要获得社会所需计算能力的国家和美国都有好处。”
在回答后来关于出口管制和中国市场的问题时,他的回答不那么圆滑。
“我们有基本义务遵守法律,尽最大努力竞争和服务客户,”他说,并指出 NVIDIA 在这方面并不是独一无二的。 “随着世界变得越来越复杂,这些都不是我们的公司应该考虑的问题。我们只是明智地确保我们始终遵守法律,并尽最大努力为我们的客户和市场服务……这是我们在这件事上需要做到的最周到的。”
黄还指出,世界上 50% 的人工智能研究人员最初来自中国,“迄今为止,中国是最大的人工智能研究人员群体”,他说道。“因此,中国将对人工智能研究做出巨大贡献,这是有道理的,因为美国的每个人工智能实验室都有许多优秀的中国研究人员,无一例外。”
“不管中国如何培养出这么多优秀的计算机科学家,不管你们怎么做,请继续这样做”,他补充道。
四、他不认为NVIDIA是一家芯片公司
黄仁勋曾多次将自己曾经是一家芯片公司的经历比作“过去的美好时光”,他表示,NVIDIA 实际上是一家基础设施公司。
“我们现在所做的是构建 AI 基础设施,每次部署都要花费数十亿美元,”他说。
在回答有关NVIDIA软件员工的另一个问题时,黄仁勋再次表示,NVIDIA不是一家芯片公司。
“NVIDIA制造芯片,但我们不是一家芯片公司,我们实际上是一家算法公司,”他说。“我们是当今世界领先的计算机图形算法创造者。”
他指出,NVIDIA为机器人和计算光刻技术开发了基于物理的AI模型,并拥有数百名 AI研究人员。
“我们在技术传播之前就已经开始研究,你可能已经看到了NVIDIA最早的渐进式GAN或变分自动编码器,”他说。“芯片CEO不会谈论这些事情。”
他补充说,以算法为中心体现在 NVIDIA 的全系统能力中,并指出 NVIDIA 硬件和系统创新的快速步伐是可能的,“因为我们首先了解算法。”
“我认为芯片设计几乎是次要的,”他补充道。“我们对此感到非常自豪,我们制造非常复杂的芯片,但我们擅长解决算法。”
关于NVIDIA是或不是什么类型的公司的进一步澄清来自后来的一个问题,即全系统公司如何避免与客户竞争。他说,NVIDIA不是一家解决方案公司。
“我们制造一切,但我们以他们想要的方式将其提供给世界,”他说。“原因是我们不是一家解决方案公司……我们建立原始技术,并与我们的生态系统合作创造解决方案。”
“我们毫不费力地与任何以他们的方式合作,”他说。 “如果 [客户] 决定做更多,从我们这里拿走更少,我不会介意。这就是为什么我们将我们的技术构建在多个堆栈中 — 只有芯片、只有系统、只有软件、只有算法 — 您来决定。”
“我们的理念是:购买您想从我们这里购买的任何东西,但请务必从我们这里购买,”他笑着说。
五、他认为推理与训练是不同的问题
黄仁勋的主题演讲主要集中在未来的AI工厂 — 大规模制造tokens。
“工厂帮助客户赚钱 — 我们的工厂直接转化为客户的收入,”他说。“这不仅仅是一个芯片和这个和那个……整个工厂非常复杂,处于物理极限。我们所做的一切都被扩大到最大。”
随着市场转向竞争性tokens生成(推理而不是训练),性能与客户功率限制的重要性从未如此重要。
“AI工厂的最大收益取决于每瓦特的最佳性能——性能可以直接转化为每秒tokens数量,”他说。“对于我们所有的客户来说,业务门槛比以前高得多,竞争门槛也高得多,风险承受能力也比以前低得多。”
六、争夺市场份额不是NVIDIA的风格
“我们不会争夺竞争,这不是NVIDIA的风格,”他说。“请注意,当你来找我们谈话时,没有一个员工会说我们争夺市场份额——为什么要争夺市场份额?为了做什么?创造新的东西!”
他说,为了用相对较小的员工队伍(按大型科技公司的标准)创造新的东西,NVIDIA 依靠其合作伙伴的卓越表现。
“如果他们开发出非常棒的产品,我们就会使用,我不在乎是哪家公司,”他说,并指出 NVIDIA 在某些领域与其竞争的公司合作,包括 AMD、英特尔、博通、Marvell、联发科等。
“我们试图与每家公司合作,这样我们就可以把非常稀缺的精力集中在开发世界上没有的东西上,”他说。
七、关于NVIDIA收购英特尔的传言被大大夸大了
黄仁勋直接驳斥了最近有关NVIDIA是财团成员的报道,该财团曾组建一个竞标小组来收购陷入困境的芯片制造商英特尔。
“我不知道这个传言是从哪里来的,但没有人邀请我们加入财团,”他说。“没有人邀请我……也许还有其他人参与其中,我不知道。也许有一个我没有被邀请参加的聚会。”
八、他认为谁先实现 AGI 并不重要
当被问及他是否认为投资最多的人会首先实现 AGI,考虑到最近美国、欧盟和中国对人工智能的投资公告,黄仁勋说这并不重要。
“你知道世界上最聪明的人是谁吗?你在乎吗?”他说。“我相信我们需要实现 AGI,这样我们才能让人工智能解决我刚才描述的问题 [可以应用推理和使用工具的人工智能]。最聪明的AGI可能并不那么重要。”
他说,比拥有最聪明的AGI或首先实现AGI更重要的是战略——赋予人工智能正确的使命和目的。
九、他认为tokens生成的重要性与制造相当
“人工智能不仅仅是数据中心,人工智能就是制造业,”黄仁勋说。“你在制造一种叫做智能的东西,如果你重构它,它就会变成文字、故事、法律文件、分析师报告……音乐、电影、影片、广告活动。如果你以不同的方式重构它,它就会变成机器人动作或方向盘激活。”
黄仁勋将人工智能与电力基础设施和能源行业进行了比较,后者又彻底改变了所有其他行业。他说,全球 GDP 的“很大一部分”应该用于制造智能。“这是我的希望,也是我的信念,”他说。
“我希望这会发生,因为我相信,当一个叫智能制造的行业出现时,我们所有人都会过得更好,”他补充道。
Read More