英伟达在人工智能基础设施领域再度发力,其下一代AI系统Vera Rubin的研发与上市计划引发行业高度关注。这款系统预计于今年晚些时候正式亮相,凭借每瓦性能较上一代Grace Blackwell产品提升10倍的显著优势,在人工智能基础设施能效优化方面实现重大突破,为AI产业迈向绿色高效发展提供了坚实的技术支撑。
在加州总部举办的媒体采访活动中,英伟达AI基础设施负责人迪翁·哈里斯向外界展示了Vera Rubin完整机架的内部构造及供应商详情。据介绍,该系统堪称全球供应链协同合作的典范,由130万个零部件精心组装而成。其核心硬件部分,72颗Rubin图形处理器(GPU)和36颗Vera中央处理器(CPU)主要由台积电负责制造;而液冷组件、供电系统、计算托盘等其余零部件,则来自全球至少20个国家的80多家供应商,中国也参与其中,充分彰显了全球产业链在高端科技领域的紧密协作。
能效提升无疑是Vera Rubin的一大核心亮点。英伟达方面透露,该系统功耗约为上一代产品的两倍,但得益于每瓦性能10倍的巨大提升,整体算力的能效比实现了质的飞跃。在当前能耗问题成为人工智能基础设施建设关键挑战的背景下,这一突破有效化解了AI算力提升与能源消耗之间的矛盾,为行业的可持续发展提供了新的思路。
为满足功耗提升带来的技术需求,Vera Rubin成为英伟达首款实现100%液冷散热的系统。迪翁·哈里斯介绍,英伟达已向客户建议,未来人工智能工厂应大规模采用液冷架构。与传统散热方式相比,液冷闭环设计不仅散热效率更高,还能有效节约水资源,实现了技术性能与绿色环保的完美平衡。
在数据传输方面,Vera Rubin同样实现了技术升级。其搭载的NVLink芯片和机架主干数据传输速度翻倍,达到每秒260TB。为保障海量算力下的数据高速交互,单个机架内部需通过5000根铜缆完成设备连接,总长度约两英里,确保了数据传输的稳定与高效。
英伟达还展示了下一代大型机架Kyber的原型产品。该机架在GPU搭载数量上实现了大幅提升,从现有的72块增加至288块,算力承载能力显著增强,而重量仅增加约50%。这一优化得益于布线设计的精简升级。据悉,英伟达Vera Rubin Ultra系统将采用Kyber机架,预计于明年正式上市,有望进一步提升AI超算的算力密度与运行效率,为AI产业的未来发展注入新的动力。

