图片来源:
AMD
超微半导体(AMD)于本周四(10/10)发表了Instinct MI325X加速器,宣称其记忆体容量与频宽都超越Nvidia H200,在推论表现上亦优于Nvidia H200。
AMD Instinct MI325X加速器是基于AMD CDNA 3架构,专为基础模型训练、微调与推论等AI任务而设计,配备256GB HBM3E记忆体,提供6.0TB/s的频宽,分别是Nvidia H200的1.8及1.3倍,FP16和FP8运算性能的峰值亦是Nvidia H200的1.3倍。
应用在FP16格式的Mistral 7B模型上,Instinct MI325X提供了1.3倍的推论性能,FP8的Llama 3.1 70B模型上,有1.2倍的推论性能,若是在FP16的Mixtral 8x7B模型上,亦有1.4倍的推论性能。
基于Hopper架构的H200是目前市场上最高阶的Nvidia AI GPU,Instinct MI325X预计于今年底出货,尽管后者晚了一年问世,但至少出现了足以与Nvidia媲美的GPU产品,而且价格可能更低廉。
AMD并未公布Instinct MI325X的售价,但说包括Dell、Eviden、技嘉、HP、联想及超微在内的业者,都会在明年第一季采用Instinct MI325X。
为了赶上AI晶片龙头Nvidia,AMD已规画加快产品脚步,每年都会发表新晶片,例如明年将发表MI350,2026年则会有MI400。