郭明錤:NvidiaVeraRubin/VR200NVL72重点更新,整合

丹萱谈生活文化 2026-01-07 00:11:08

郭明錤:Nvidia Vera Rubin/VR200 NVL72重点更新,整合我的最新产业调查与Nvidia CEO黄仁勋的2026 CES演讲 1. Nvidia将AI服务器VR200 NVL144 (die-based) 改名为VR200 NVL72 (package-based)。我的调查指出,VR200 NVL72将分为Max Q与Max P两种power profile。 ➢  黄仁勋提到了NVL72,而非先前的NVL144 ➢  Max Q与Max P硬件设计相同 ➢  Max Q GPU/机柜功耗 (TGP/TDP):约1.8/190 (kW) ➢  Max P GPU/机柜功耗 (TGP/TDP):约2.3/230 (kW) ➢  两者均显著高于GB300 NVL72的1.4/140 (kW) ➢  因应资料中心供电规格,不同power profile提升安装弹性。此改变也意味着Nvidia开始注意到物理世界对建置AI服务器的限制,并将其反映在产品规格上 2. VR200 NVL72 Max Q与Max P的GPU散热设计升级。 ➢  两者均采用微通道冷板 (micro-channel cold plate;MCCP) 搭配镀金散热盖 (gold-plated lid) ➢  市场高度期待GPU TGP达2.3kW后开始采用微通道盖板 (micro-channel lid;MCL),但MCL最快需至2H27才会量产 3. 受益于GPU、HBM与NVLink Switch规格升级,VR200 NVL72的AI训练/推理算力约是GB300 NVL72的3.5/5倍,机柜的供电也因此大幅提升。 ➢  VR200 NVL72的power shelf升级到3*3U 110kW (6×18.3kW PSU) (vs. GB300 NVL72最普遍的8*1U 33kW (6×5.5kW PSU)) ➢  VR200 NVL72 power shelf采3+1备援设计 ➢  VR200 NVL72的电力进线 (power whip) 提升到100A (vs. GB300 NVL72的60A),这对资料中心供电要求更高 (如母线 (busway) 与插接箱 (tap-off box)  等设计)。 4. VR200 NVL72的散热设计更依赖液冷方案。 ➢  Compute & NVSwitch tray均采用无风扇设计 (fanless) ➢  机柜冷却液流量 (TCS flow) 几乎增加100% (vs. GB300 NVL72),有利CDU、分歧管、水冷版与QD规格与/或数量升级 ➢  机柜风量 (Air flow) 需求则降低约80% (以CFM计) (vs. GB300 NVL72)。 5. VR200 NVL72的Compute tray首度采用midplane,落实无线设计 (cableless)。 ➢  Midplane关键规格包括:44层 (22+22)、M9 CCL (EM896K3)、尺寸约420*60 (mm)。 ➢  黄仁勋提到,受益于此设计,Compute tray的组装时间可由2小时显著降低到5分钟 (vs. GB300 NVL72)。 6. 2026年Rubin CoWoS投片量约30-35万片,预计在1Q26初开始小量试产并于2Q26末量产。VR200 NVL72的机柜组装量产预计在3Q26底,考虑到良率爬坡,预计2026/2H26机柜出货量约5,000-7,000柜。 7. 当机柜功耗达约200kW,54V配电会开始遭遇显著的空间占用 (铜排/线材) 与转换效率瓶颈,故VR200 NVL72可视为Oberon机柜的最后一代方案;后续面对AI算力提升带来的挑战,将采用支援800V HVDC的次世代Kyber机柜设计因应。

0 阅读:17
丹萱谈生活文化

丹萱谈生活文化

感谢大家的关注