英伟达推出 Spectrum‑XGS 以太网技术

英伟达推出 Spectrum‑XGS 以太网技术

英伟达正式发布Spectrum-XGS以太网技术,标志着全球AI算力基础设施正式迈入“跨区域扩展”新纪元。该技术通过革命性的跨区域扩展架构,将分散在全球不同地域的数据中心整合为十亿瓦级AI超级工厂,突破传统数据中心在物理空间、电力容量及网络性能上的多重限制,为超大规模AI训练与推理任务提供前所未有的算力支撑。

从技术架构层面看,Spectrum-XGS基于NVIDIA Spectrum-X以太网平台构建,采用“跨区域扩展”设计理念,通过算法实现网络与数据中心设施间距离的动态适配。其核心突破在于结合先进的远距离拥塞控制、精准延迟管理及端到端遥测技术,使NVIDIA集合通信库性能提升近一倍,尤其在处理大消息时,AI训练工作负载的同步稳定性与效率得到显著增强。该技术支持长距离连接超过500米,甚至可实现跨城市、跨州乃至跨国的连接,同时保持低延迟和高带宽密度——较传统以太网高出1.6倍,为超大规模多租户AI工厂提供无缝扩展、超低延迟的专用网络平台。

在硬件实现层面,Spectrum-XGS采用与Spectrum-X相同的交换机和ConnectX-8 SuperNIC硬件组合,并沿用支持数据中心内横向扩展连接的软件架构与库堆栈。这种统一的设计确保了从横向扩展到跨区域扩展的平滑过渡,使数据中心能够在任意距离下实现高效通信且不牺牲性能。例如,通过自适应路由和噪声隔离技术,该技术优化了数据传输效率和可靠性;结合CPO共封装光学技术,端口功耗从30W降至9W,单台交换机带宽密度提升至409.6Tb/s,同时支持1.6T光模块,满足短距高速传输需求。

性能优势方面,Spectrum-XGS在跨区域连接中表现出色。实测数据显示,在相距10公里的多个站点之间运行NCCL基元测试时,其性能较商用现成以太网提升高达1.9倍,尤其在AI训练典型的大消息场景下,性能提升更为显著。这种性能飞跃直接缩短了AI应用的作业完成时间,使跨区域AI集群的协同效率得到质的提升。此外,该技术支持动态距离适应算法,优化跨区域通信的稳定性;保偏光纤器件技术确保长距离传输中的低抖动与信号完整性;高密度连接器如32芯MPO连接器,则满足了1.6T光模块对高密度互联的需求。

应用场景层面,Spectrum-XGS解决了传统数据中心在扩展性上的物理限制。单个数据中心受电力基础设施限制,通常仅能支持约20万颗Blackwell GPU,难以匹配AI算力需求的指数增长。而通过跨区域扩展,该技术可将分布在不同地域的数据中心整合为统一算力资源池,支持大规模单作业AI训练与推理任务。例如,CoreWeave等超大规模云提供商已开始部署该技术,将其多个数据中心组合成统一的超级计算机,为客户提供十亿瓦级AI系统,推动材料科学、药物研发、人工智能等领域的突破。在材料科学领域,百万量子比特芯片可模拟复杂分子结构,加速自修复材料、高性能催化剂的研发;在药物研发领域,量子计算可模拟蛋白质折叠过程,缩短新药研发周期。

行业影响层面,Spectrum-XGS推动了AI基础设施的灵活性提升与生态重构。其统一架构支持全局网络可视化,通过遥测数据实现基于距离的拥塞管理,避免深度缓冲区带来的抖动风险。同时,该技术使服务器行业从单纯的硬件供应商向提供全局优化算力解决方案的角色转变,要求服务器厂商在硬件设计、软件生态和运维服务上进行革新。在供应链层面,光库科技等企业通过技术适配与生态绑定,成为英伟达1.6T光引擎的核心供应商,其薄膜铌酸锂调制器全球市占率约15%,高端市场占比超30%,形成“器件-模块”的深度绑定。

技术挑战与未来展望层面,尽管Spectrum-XGS取得了突破性进展,但仍面临技术迭代、地缘政治等风险。硅光技术若突破成本瓶颈,可能挤压传统光纤市场;美国对华高端光器件出口限制,可能影响供应链安全。然而,随着全球AI算力需求向“行星级”规模演进,Spectrum-XGS通过持续的技术创新与生态合作,有望推动全球算力网络向更高效、更可持续的方向发展。英伟达计划通过每年推出新的Spectrum-X产品,提供更高的带宽、更多的端口、更强大的软件功能集与可编程能力,不断提升AI以太网网络性能,巩固其在AI算力时代的领导地位。

本内容为作者独立观点,不代表32度域立场。未经允许不得转载,授权事宜请联系 business@sentgon.com
如对本稿件有异议或投诉,请联系 lin@sentgon.com
👍喜欢有价值的内容,就在 32度域 扎堆
(0)

猜你喜欢

发表回复

登录后才能评论