北美CSP大举购置NVIDIA GB/Rubin整柜式方案,2026年AI推论算力将跃升1.2倍
根据TrendForce最新AI产业研究,北美五大云端服务供应商(CSP)为扩大AI训练和推论应用部署,2026年对整柜式(rack-scale)AI server的采购意愿明显提高,不仅有望占据全球60%以上的NVIDIA GB/VR需求量,更将同步带动五大业者总AI训练算力年增逾56%、总AI推论算力年成长高达122%左右。
TrendForce预估,2026年AI server出货将年增28%以上,仍以高阶AI训练机种为主力,占比约55%。然中长期内将改由AI推论机种主导,主因是CSP将积极推展AI应用以加速实现AI云端服务商用化,另像是NVIDIA也将拓展更多AI推论方案或使用情境,包括推动今年主力AI server方案GB/VR系统除AI训练用途外,也特别强调该方案可支援AI推论相关工作负载。
据TrendForce估计,2026年Google、Amazon、Microsoft、Meta、Oracle的合计资本支出将逾7,700亿美元,年增近87%。分析北美五大CSP购置NVIDIA GB/VR系列获得的运算能力,针对AI训练部分,若以FP16/BF16为估算基础,2025年五大业者的总算力达逾9 ExaFLOPS,2026年另将成长56%以上。
针对AI推论,若以FP4/NVFP4运算效能为估算基础,2025年五大CSP的总算力逾37 ExaFLOPS,预计2026年将大幅成长近122%,显著高于AI训练,反映出NVIDIA此次软硬体系统调校特别著重AI推论效能,并落实在新一代的GB300、VR200整柜式方案中。
除GPU方案外,CSP业者同步推进自研ASIC整柜产品,以Google布局最积极。TrendForce预估,2026年Google对自家TPU晶片需求量将年增近80%,并于下半年后将从v7逐渐升级至v8世代。Amazon自研ASIC的力道仅次于Google,预计2026年其Trainium系列于自家AI server占比将达40%以上。
TrendForce表示,NVIDIA、AMD和CSP自研ASIC的新世代机柜皆整合液冷散热系统,有助降低AI server的U数(server机架单位),提高单一机柜可容纳的加速器数量。在单颗AI GPU或ASIC的热设计功耗(TDP)同步提高的情况下,AI server系统功耗呈结构性放大。
据TrendForce估算,2023年北美五大CSP的server功耗合计年增2.8GW,至2026年跃升至18GW,2025至2026年的年成长率高达116%,主因即AI竞赛白热化,NVIDIA GB300、AMD Helios和CSP自研ASIC平台将同步放量。



