地缘政治推动AI晶片自主浪潮,中美云端巨头齐拼自研ASIC,市场版图重塑
根据TrendForce最新研究,AI server需求带动北美四大CSP加速自研ASIC晶片,平均1~2年就会推出升级版本。中国AI server市场则受四月美国新晶片出口管制影响,预料外购NVIDIA、AMD等晶片比例会从2024年约63%下降至2025年约42%,而中国本土晶片供应商(如华为等)在国有AI晶片政策支持下,预期2025年占比将提升至40%,几乎与外购晶片比例分庭抗礼。
TrendForce表示,CSP为因应AI工作负载规模逐步扩大,同时计画降低对NVIDIA、AMD的高度依赖,因此积极投入ASIC开发进程,以便能达到控制成本、性能和供应链弹性,进一步改善营运成本支出。
观察美系四大CSP在AI ASIC进展,居领先地位的Google已推出TPU v6 Trillium,主打能效比及针对AI大型模型的最佳化,预计2025年将大幅取代既有TPU v5。针对新一代产品开发,Google从原先与Broadcom的单一伙伴模式,新增与MediaTek合作,转为双供应链布局。此举将提升设计弹性、降低依赖单一供应链的风险,也有助增加高阶先进制程布局。
AWS目前以与Marvell协同设计的Trainium v2为主力,其主要支援生成式AI与大型语言模型训练应用,AWS也和Alchip合作Trainium v3开发。TrendForce预估2025年AWS的ASIC出货量将大幅成长,年增表现为美系CSP中最强。
Meta成功部署首款自研AI加速器MTIA后,正与Broadcom共同开发下一代MTIA v2。由于Meta对AI推论负载具高度客制化需求,MTIA v2设计特别聚焦能效最佳化与低延迟架构,确保兼顾推论效能与运营效率。
Microsoft目前在AI server建置仍以搭载NVIDIA GPU的解决方案为主,但也加速ASIC开发,其Maia系列晶片主要针对Azure云端平台上的生成式AI应用与相关服务进行优化,下一代Maia v2的设计也已定案,并由GUC负责后段实体设计及后续量产交付。除了持续与GUC深化合作外,Microsoft也引入Marvell共同参与设计开发Maia v2进阶版,藉此强化自研晶片的技术布局,并有效分散开发过程中的技术与供应链风险。
中国AI供应链自主化加速
分析中国自主化AI方案,华为积极发展升腾晶片系列,主要面向内需市场,应用层面包含LLM训练、地方型智慧城市基础建设、大型电信运营商的云网AI应用等。在国家型专案支持,及互联网、DeepSeek相关LLM AI应用蓬勃发展下,长期将撼动NVIDIA等在中国AI市场的领先地位。
寒武纪的思元(MLU)AI晶片系列,亦瞄准云端业者的AI训练与推理等应用。观察寒武纪2024年陆续与在地大型CSP进行前期测试验证可行性后,2025年将逐步推进思元AI方案至云端AI市场中。
TrendForce表示,随著美国对出口中国的高阶AI晶片限制持续升级,中系CSP也加速发展自研AI ASIC。阿里巴巴旗下平头哥(T-head)已推出Hanguang 800 AI推论晶片,Baidu继量产Kunlun II后,已著手开发Kunlun III,主打高效能训练与推论双支援架构。腾讯除了自家AI推论晶片Zixiao,亦采用策略投资的IC设计公司Enflame解决方案。
在地缘政治与供应链重构的背景下,将凸显中国晶片供应商如华为、寒武纪,以及各CSP投入自研ASIC的必须性与重要性,并带动AI server市场朝向中国和非中国(Out-of-China)两大生态体系发展。