在 AIGC 算力架构中,高性能网络基础设施扮演着至关重要的角色。网络瓶颈可能导致 GPU 集群的利用率降低、大模型训练时间延长及训练成本增加。因此,为了满足 AIGC 计算的需求,尤其是在大规模GPU 集群中,亟需大量高效的网络交换设备,以支持高速率、低时延、高吞吐量和高能效的数据传输。800G/1600G 网络技术的发展,能够提供更高的数据传输速率和更低的传输时延,从而加速 AIGC 模型的训练与推理过程。
AI 集群的快速发展正推动光模块需求的迅速增长。随着GPU 性能提升和AIGC 应用扩展,对光模块的数量和速率需求持续增加。以英伟达DGXH100的二层网络架构为例,每个 H100 SuperPOD 包含4 个SU 扩展集群,每个SU扩展集群由 32 个 H100 服务器和 8 个 Leaf 交换机组成,整个SuperPOD共有1024个 GPU、32 个 Leaf 交换机和 16 个 Spine 交换机。
在Leaf 层,服务器侧采用400G 光模块,交换机侧采用 800G 光模块,总共需1024 个400G 光模块和512个 800G 光模块。在 Spine-Leaf 层采用 800 光模块互联,共需1024个800G光模块。在该架构下,GPU 与 400G 光模块的比例为1:1,与800G 光模块的比例为 1:1.5。当系统升级到 DGX H100 三层网络架构时,GPU 升级至800G网卡,Leaf 和 Spine-Leaf 层均采用 800G 光模块互联,导致光模块需求显著增加,GPU 与 800G 光模块的比例增至 1:6。
随着英伟达新一代Blackwell架构平台的发布,无论是小型 GB200 集群还是大型 GB200 集群,对800G 光模块的需求比例均有所上升:小型集群的 GPU 与 800G 光模块比例达到1:2,而大型集群则为 1:4.5。
AIGC 技术的迅速发展正在引领光模块市场的扩张。2023 年5 月,谷歌和英伟达成为首批显著增加光模块采购以支持AIGC 数据中心的大客户,随后其他领先的云计算公司也纷纷加入光模块竞争。根据LightCounting的预测,用于 AI 集群的光模块市场预计将从 2023 年的20 亿美元增长至2029年的120亿美元,年均复合增长率达到 34.8%。在 2025 至2029 年间,该市场规模将超过520 亿美元。
随着 AIGC 大模型训练对更快数据传输的需求不断上升,高速光模块的需求随之激增。预计到 2024 年,800G 光模块将成为市场主流,1.6T光模块也将进入试产阶段。预计到 2029 年,1.6T 和 3.2T 光模块的市场规模将达到100亿美元,成为 AI 集群光模块市场的主要组成部分。
中国厂商在全球光模块市场中表现卓越。根据LightCounting的数据,2023 年,全球前十大光模块厂商中,中国企业占据了7个席位,合计市场份额超过 50%。多家中国厂商已成功进入英伟达的供应链。其中,中际旭创的市场份额位居全球第一,华为、光迅科技、海信、新易盛、华工正源、索尔思光电分别排名第三、第五、第六、第七、第八和第九位。
进入2024 年,全球主要光模块厂商业绩的变化进一步显示出市场份额向中国厂商的集中趋势。尽管中国厂商在光模块制造领域取得了显著进展,然而在光芯片和电芯片等关键原材料方面,仍然依赖进口,国产化程度亟待提高。
更多行业研究分析请参考思瀚产业研究院官网,同时思瀚产业研究院亦提供行研报告、可研报告(立项审批备案、银行贷款、投资决策、集团上会)、产业规划、园区规划、商业计划书(股权融资、招商合资、内部决策)、专项调研、建筑设计、境外投资报告等相关咨询服务方案。