应对GenAI浪潮!国网中心揭露未来AI超级电脑算力扩展蓝图,目标5年内整体总算力达280 PFlops

图片来源: 

摄影/余至浩

除了今年7月上线的此外,另有两座超级电脑将于2026和2027年启用,采用GPU和CPU的混合架构,分别提供80 PFlops和35 PFlops的算力。

长远来看,到2028年,国网中心将整合量子运算,使超级电脑的整体算力可达280 PFlops,未来可用于量子AI等技术的开发与应用。

国网中心大力拥抱云端翻新架构打造新一代高速运算主机,建立云端基础的服务环境,让使用者能够透过云端平台以容器化方式存取运算资源,简化开发流程及后端计算管理。并分两阶段推动,第一阶段采用先导服务主机,以GPU伺服器为主,优化服务大型语言模型开发、AI共用运算服务与大型科学运用应用,第二阶段则将导入云端AI运算主机,配备更强大的GPU伺服器、资料储存和高速网路设施,提供高效能运算能力,支援更多异质环境的应用研究及开发需求。

除了国网中心的超级电脑之外,在国科会提出的「大南方计划」建置计划中,将于2029年在沙仑部建一座算力可达200 PFlops的AI超级电脑,未来启用后将提供南部学研界和业界开发使用。

不只国网中心建置超级电脑,民间企业积极布局AI算力服务市场

不只国网中心建置超级电脑,企业积极布局AI算力服务市场,许多业者纷纷投入大型AI算力建设。例如,Nvidia推出的Taipei-1,搭载512个H100 GPU,算力达22.3 PFlops,而鸿海则计划在高雄打造一座算力超过90 exaflops的超级电脑。

配合AI算力的发展,国网中心在网路与资料中心建设方面也有相关建置计划,包括将在南科建置IDC云端资料中心,预计于明年初完工,并于年中陆续进驻HPC、GPU等设备,未来IDC启用后除了可供AI研究,国网中心将拓展更多服务模式,如主机代管服务等。

在网路建设方面,在2022年启用FOX网路交换中心后,国网中心规画未来3~4年分阶段完成南北骨干网路光纤的建置,强化全国的资料传输能力。

国网AI云服务将成为新一代云端服务平台

除了扩增算力之外,国网中心聚焦的另一大重点就是云端服务。张朝亮表示,云端在AI发展中扮演著重要角色,不仅提供便利的云端入口和友善的使用介面,让所有人都能很容易介接使用,还能提供强大运算资源,处理AI开发所需的大量数据。

他坦言,过去HPC主要集中于科学和工程计算,但在过去五年中,AI已成为主流。因此,每个HPC中心都在扩展GPU算力,并思考如何提升云端服务以更好地满足客户需求。

国网中心将以国网AI云服务(NCHC AI Cloud service, NAICS)作为新一代云端服务平台。他指出,这套平台不仅具备更强大的运算服务,支援多元AI试算环境与应用场景,还整合更多资源,介接主流公云。

根据国网中心的规画,初期将建构包括IaaS和PaaS云端基础服务,到2025年将进一步提升并整合HPC与云端服务,新增更多云端功能选项,同时推出HPC高速运算与HFS高速储存整合服务,以提升效能。

国网中心还计划于2024至2027年建置一套云端资料分析平台,针对资料的机敏性建立可信环境,强化资料保护与隐私保障。

在设计上,张朝亮表示,此平台将依据资料敏感程度分为隐私工作区和公共工作区。考虑到资料机敏性,使用者未来可以选择隔离的隐私工作区,强化云端服务的安全性。在这个隔离的云端环境中,外部资料交换仅限于唯读模式,所有资料将储存在国网中心的机敏商用储存系统中。他提到说,未来包括生医、国土治理、国防科技、科学计算等都能运用这个平台来进行开发、数据存取,确保资料的完整性。

此外,国网中心近期将启动新计划,将在云端环境中打造国产晶片技术PoC实验平台。张朝亮也说,未来,国内晶片设计业者在开发Edge晶片或AI ASIC晶片时,就可以用这个平台进行测试与验证,加速产品开发进程。