英伟达在2026年的CES上发布了Rubin架构平台，预计将把推理算力提升5倍，成本降低10倍

2026年CES展会上，英伟达正式推出Rubin架构平台，以推理算力5倍提升、推理成本降低10倍的技术突破，引发全球算力产业链深度变革。该平台通过CPU-GPU异构集成、HBM4内存革命、CPO光模块技术及液冷散热系统四大创新，重新定义AI算力基础设施标准，标志着AI从“生成式”向“物理行动”转型的关键节点。

Rubin平台采用六芯片协同设计，核心GPU算力达50PFLOPS（FP4精度），是前代Blackwell的5倍。其HBM4内存带宽提升至819GB/s，容量翻倍至48GB，配合第六代NVLink实现3.6TB/s带宽，能效比突破200TOPS/W。针对万亿参数大模型推理需求，平台创新采用“高速HBM+大容量SSD”分层存储体系，单GPU对应SSD容量达16.6TB，较前代提升5倍，有效解决KV缓存瓶颈。在互联层面，CPO技术规模化应用使光模块用量减少75%，信号延迟降低60%，功耗下降30%-40%，推动光模块产业向硅光集成转型。这一全链路重构直击当前AI算力瓶颈，为长上下文推理、智能体AI等前沿应用提供硬件支撑。

单机柜功耗密度突破100kW，传统风冷失效，Rubin平台首次实现100%常温液冷方案。采用45°C冷却液配合L2A风冷机循环，散热系统能耗降低60%，同时省去高能耗冷水机组。该设计推动液冷产业规模化，预计2028年全球市场规模将达120亿美元。电源系统同步升级，服务器功率从20kW提升至50kW，高压直流（HVDC）渗透率加速，倒逼电力基础设施向超高压、高能效方向演进，数据中心正从“电子设备”向“电力重工业”转型。

Rubin平台带动存储、互联、液冷三大产业链升级。SSD需求预计2028年达384万PB，推动AI级高带宽、高耐久存储标准；CPO技术普及使单模块速率向3.2T迈进，激光器、调制器等核心器件技术迭代加速。全球AI芯片市场规模预计从2025年1200亿美元跃升至2030年5000亿美元，年复合增长率超30%。微软、谷歌、OpenAI等头部厂商已确认采用，生态壁垒巩固其行业标准地位，形成“技术-产能-应用”的正向循环。

黄仁勋指出，Rubin的推理成本降低10倍特性，使AI服务商业化成为可能，尤其在机器人、自动驾驶等具身智能领域。平台支持长上下文推理和智能体AI，赋能千亿参数模型实时运行，推动AI从虚拟走向物理世界。行业专家评价，Rubin不仅是性能升级，更是系统级优化与成本控制的大规模应用铺路石，其技术革新引发的供应链重构将持续释放增长动能，为全球数字经济发展注入强劲动能。

随着全球算力需求爆发式增长，Rubin平台通过重构存储、互联与散热系统，破解AI大模型瓶颈，开启“算力重工业时代”。这场由技术革新引发的基建革命，正推动数据中心向超高压、高能效方向演进，重塑全球AI产业链竞争格局，为物理AI时代的到来奠定坚实基础。

本内容为作者独立观点，不代表32度域立场。未经允许不得转载，授权事宜请联系 business@sentgon.com
如对本稿件有异议或投诉，请联系 lin@sentgon.com

👍喜欢有价值的内容，就在 32度域扎堆