AMD新一代EPYC处理器及AI加速器、PC处理器下周五亮相,强化资料中心到边缘运算、PC市场AI布局

图片来源: 

AMD

生成式AI带动全球AI应用兴起,各产业也希望应用AI提高生产力、竞争力,除了带动资料中心对大量AI算力的需求,在终端方面也带动AI PC趋势,提升PC的AI算力,让AI应用的执行能在不需公有云或资料中心的情形下,可以在PC端执行,保障隐私、降低企业机敏资料外泄风险。AMD即将在下周五(10/11)发表新一代AI运算产品及最新的厂商合作,包括新一代EPYC伺服器专用处理器、Instinct系列加速器、Ryzen AI处理器,强化资料中心、边缘运算到PC市场的AI运算布局

目前AMD在资料中心的主力产品是第4代EPYC处理器,相较于前一代产品,2022年下半年先推出第4代产品是代号Genoa的处理器,锁定通用计算需求,率先采用Zen 4核心,并且延续多核心的策略,将核心数增至96个核心、192个执行绪,已获得AWS、Google Cloud的采用。

然而,直到2023年,才算是AMD第4代EPYC大军进攻的关键一年,去年7月AMD在美国旧金山一口气发表更完整的第4代EPYC处理器家族,包括锁定技术运算代号为Genoa X处理器,以及针对云原生需要的Bergamo处理器,还有去年下半年推出针对电信及边缘运算设计代号Siena处理器。

AMD第4代EPYC处理器包括Genoa、Genoa X、Bergamo、Siena四个成员到齐,各自对应不同资料中心需求,其中比较特别的是Bergamo,看准企业IT采用云原生技术的趋势,Bergamo采用Zen 4c的CPU核心,将核心数提高至128个核心、256个执行绪,透过CPU核心数的增加以满足微服务、小应用的弹性运算资源使用需要,单颗处理器拥有更多的核心,提供更高的vCPU密度,更好的能源效率,还可以简少实体伺服器数量,降低多台伺服器管理的复杂度,有助于企业追求净零转型的目标。

不让AMD专美于前,英特尔也在2024年6月发表Xeon 6处理器,分为采用E-Core效率核心(代号Sierra Forest)及P-Core两个版本(代号Granite Rapids)。英特尔先推出E-Core版本的Xeon 6700E处理器,其核心数提高至144个核心,提高单一机柜可容纳的CPU核心数,以采用第二代Xeon处理器的200个机柜为例,如果采用Xeon 6700E,机柜数大幅减少至66个机柜。英特尔核心数上超越AMD,还计划整合2个Xeon 6 E-Core,推出288个效率核心Xeon 6900系列。

英特尔近期发表采用P-Core的Xeon 6处理器,主要锁定密集型工作、AI及高效能运算需求,最多拥有128个核心,因应AI运算需求,记忆体频宽加倍,并且将AI加速功能嵌入每个核心,使其具备AI运算加速的能力。

不论是AMD或英特尔,伺服器专用处理器的核心数增加,提高单一机柜内的CPU核心数量,对空间有限的资料中心提高运算密度,也能满足企业采用现代化IT,例如云原生技术的资源弹性运用需求,并满足企业追求净零转型,在有限的机柜空间下提高CPU核心数量,提高能源使用效益。

随著企业采用AI应用,AI成为企业提高生产力重要科技,特别是窜起的生成式AI,企业内部署生成式AI,除了提高本地资料中心对AI的算力需求,也可能借助大型公有云业者提供的工具及训练资源,再在本地端部署推论,因此无形中也会提高企业上云及采用云原生技术的意愿

为了和Nvidia H100竞争,两大X86处理器业者也纷纷推出AI加速器。AMD去年发表第4代EPYC处理器同时,也发表资料中心GPU方案,Instinct MI300系列AI加速器,相较于前代的MI200系列,MI300采用3D封装及小晶片(Chiplet)技术,内建CDNA 3矩阵核心技术,改善指令平行处理来提升运算的输送量,搭配HBM3记忆体、AMD Infinity高速互连技术,分为MI300A及MI300X,其中MI300A采用APU架构,拥有24个Zen 4的CPU 核心,而MI300X则具有304个CDNA 3运算单元,支援192GB的HBM3记忆体。

英特尔则是在近期更新AI加速器Gaudi 3,强调为生成式AI需求设计,内建64个张量处理器核心,搭配8个矩阵乘法引擎,内建128GB HBM2e记忆体,支援24个200Gb的网路埠,提升20%的吞吐量。

AMD将发表资料中心到PC新一代AI产品

英特尔推出E-Core版Xeon 6,CPU核心数超越AMD第4代EPYC处理器后,AMD已在今年Computex预告代号为Turin的第5代EPYC处理器,采用Zen 5 核心,一举将CPU核心数增加至192个核心、384个执行绪,使用SP5插槽,可相容于第4代EPYC处理器Genoa,并强调在AI推论应用上的表现优于英特尔处理器。相较于第4代EPYC处理器为台积电5奈米制程,第5代EPYC处理器可望采用4奈米或3奈米制程,但AMD尚未揭露详细的规格、效能表现。

今年10月11日AMD将在美国旧金山举行Advancing AI 2024,预告将发表资料中心到PC的AI方案,包括第5代EPYC处理器、Instinct系列AI加速器、AI PC处理器等AMD新一代AI各式运算产品。

为了扩大进攻AI应用,不只硬体产品,AMD积极地透过合作或并购等方式,提高旗下AI运算方案对开发者社群的支援,包括提供工具、函式库、模型,例如与Hugging Face合作,AI运算产品对其AI模型的优化,去年10月AMD还并购AI软体新创Nod.ai,以提升AMD旗下Instinct系列、EPYC处理器、Versal SoC、Ryzen AI处理器的AI部署速度,Nod.ai可透过自动化编译器软体,降低资料中心到边缘运算、PC的AI模型部署。

今年8月AMD另一个大动作是,投入49亿美元并购AI系统业者ZT Systems,ZT Systems专门设计、整合、制造、部署能AI系统,也是Open AI的系统供应商,这项并购案可望强化AMD在资料中心的AI基础架构,如系统设计、整合能力。