1、GTC 2025 正在进行时,大咖云集探索未来
GTC 大会十年磨剑,AI 进入快跑赛道。GTC 大会是英伟达产品重磅发布的盛会,见证了英伟达成长的历程。2014 年,英伟达发布了 Pascal 架构。2016 年发布了基于 Pascal 架构的 P100 芯片。并于 2017 年发布 V100 芯片。2020 年,A100 芯片发布,采用了台积电7nm 制程,超过 540 亿个晶体管。
英伟达硬件更新节奏趋紧,2022 年开始密集发布产品。硬件发布节奏看,英伟达 2022 年发布了重磅 H 系列产品,并且针对大模型做了硬件端的设计和优化,同步发售了Quantum-X400 Infiniband 交换机。2024 年英伟达发布了 Blackwell 架构系列产品,并在2025 年进一步发布 Blackwell Ultra 系列产品更新。至于新一代 Rubin 架构系列产品则有望在 2026-2027 年推出。
2025 年 GTC 大会在 3 月 17 日~3 月 21 日于美国加州圣何塞举行。英伟达 CEO 黄仁勋于北京时间 2025 年 3 月 18 日举行主题演讲。此外,GTC 大会还有 1000 多场深具启发性的会议,更有 400 多项展示、技术实战培训和大量独特的交流活动,许多业界和学术界的翘楚也将参加会议。
2、GTC2025 发布多项产品,软硬件共振推动 AI 发展
硬件层面
Blackwell Ultra 架构系列产品:Blackwell Ultra 搭配 12 层堆叠的 HBM3e 内存,显存达到 288GB,可实现 1.8TB/s 的片间互联带宽。在此基础上,英伟达也将推出 BlackwellUltra NVL72 机柜。GB300 NVL72 的 AI 性能是 NVIDIA GB200 NVL72 的 1.5 倍,这使得建造 AI 工厂 的收入机会与基于 NVIDIA Hopper™ 构建的系统相比增加了 50 倍。合作伙伴预计将从 2025 年下半年开始推出基于 Blackwell Ultra 的产品。
Rubin 架构系列产品:2026 年英伟达将推出 Rubin 架构,并将机柜的节点进一步扩展,推出 Vera Rubin NVL144 和 Vera Rubin NVL576。Rubin 将基于 TSMC 3nm 制程构造,提供令人难以置信的 50 PFLOP 密集 FP4 计算,是 B300 的三倍多。
CPO 交换机: GTC 英伟达推出了 Quantum-X 硅光共封芯片、Spectrum-X 硅光共封芯片以及衍生出来的三款交换机产品:Quantum 3450-LD、Spectrum SN6810 和Spectrum SN6800。NVIDIA 硅光交换机是全球领先的网络解决方案。它们创新地集成了光器件,减少了 4 倍的激光器数量,与传统方法相比,能源效率提高到 3.5 倍,信号完整性提高到 63 倍,大规模组网可靠性提高到 10 倍,部署速度提高到 1.3 倍。
产品节奏:Blackwell Ultra 系列产品及 CX8 等将于 2025 年推出;Rubin/Rubin Ultra 及配套的 CX9 等产品将在 2026~2027 年推出。2028 年则将推出 Feyman 相关产品。
软件层面
Dynamo:这是一款开源推理软件,用于以最低的成本和最高的效率加速和扩展 AI 工厂中的 AI 推理模型。在 GB200 NVL72 机架的大型集群上运行 DeepSeek-R1 模型时,Dynamo 的智能推理优化还将每个 GPU 生成的 token 数量提高了 40 倍以上。
GROOT N1:英伟达宣布开源全球首个人形机器人基础模型 GROOT N1。GROOT N1基础模型采用双系统架构,灵感来自人类认知原理。“系统 1”是一种快速思考的行动模型,反映了人类的反应或直觉。“系统 2”是一种慢速思考的模型,用于深思熟虑、有条不紊的决策。
Llama Nemotron:由 Llama 系列模型衍生而来,相较于 Llama 本体,这款模型仅有48B。模型系列分为三档:入门级的 Nano、中端的 Super 和旗舰 Ultra,每一款都针对不同规模的企业需求。
更多行业研究分析请参考思瀚产业研究院官网,同时思瀚产业研究院亦提供行研报告、可研报告(立项审批备案、银行贷款、投资决策、集团上会)、产业规划、园区规划、商业计划书(股权融资、招商合资、内部决策)、专项调研、建筑设计、境外投资报告等相关咨询服务方案。