台智云总经理吴汉章认为,主权AI包涵两个角度,一个是由国家主导建立具有在地语言、文化价值的AI技术,另一个角度则是建构环境,协助民间产业发展自主的AI技术及应用。(图片来源/台智云)
国内较早投入在地语言模型发展的台湾智慧云端服务(简称台智云),曾与国网中心合作,以超级电脑台湾杉二号算力资源,建置TWCC台湾计算云,在大型算力支援下,台智云从2022年开始研究训练LLM模型的平行运算技术,2023年发表福尔摩沙模型,在当时与国科会TAIDE计划为少数较早投入在地化LLM模型开发的团队。
对于各国发展主权AI,台智云总经理吴汉章分享他的观察,各国推动主权AI常见4个作法,第一个是建立国内自有的算力资源,第二个是建立自主、可控的模型,第三个是政府与民间公私合作,第四个是建立创新机制,「AI发展必须可长可久,没有创新就没有应用,没有落地,就是空谈」,他认为建立创新机制相当重要,才能让AI长期发展,应用能够落地。
吴汉章认为,主权AI除了运用当地的语言资料建立反映在地价值观点、文化的语言模型之外,更重要的目的是建立自主可控的AI技术,在DeepSeek模型出现,带来新的模型塑造方式,即使资源不如跨国大型科技公司,仍可以较低的门槛来建立具有一定能力的语言模型。
建立自主可控技术以配合本地需求调整
吴汉章指出,主权AI可从两个角度来看,第一个是政府主导建立符合在地语言、文化价值的AI技术,第二个角度则是建构基础架构环境,提供资源协助民间发展AI自主技术及应用。
他认为,所谓主权AI不一定是政府自己发展AI技术,由民间产业来做也是一种主权AI,第二个角度是政府扩建公共算力基础建设,建构环境鼓励民间发展自主可控的AI。
吴汉章指出,虽然使用国际公有云的算力服务相当方便,但长期租用的成本相当可观,而企业采购GPU建置私有算力,一台AI主机可能要价上千万,不论是租用公云算力服务或自建私有算力,都不是一般企业或新创公司所能够负担,所以需要政府出面建置算力,作为发展AI的数位公共基础建设。
主权AI重要的是掌握自主可控的AI模型或技术,如果只依赖国外开源模型,开源模型通常仅针对全球市场开发,不会针对在地需求作调整,而公云上的模型更新也不会通知企业,使用较好的模型通常收费也会比较高,国家或企业难以发展自主可控技术。
不只要建大型公共算力,还要易于被企业使用
但是,政府推动主权AI建立自主算力,支援在地化模型的开发,只要花钱建置超级电脑提升算力,这样就够了吗?
吴汉章表示,过去的超级电脑是一种共用的概念,一群老师带领研究团队共用超级电脑算力,这些团队有深厚的技术背景,能够自己写程式调用超级电脑的算力,现在开发大型语言模型需要更多算力,可能需要调度多片GPU加速运算,政府投资扩建超级电脑提高算力之外,也应该降低使用算力资源的门槛,让新创或企业容易使用算力资源。
「提供算力并非直接提供给企业,企业就会自己使用,需要有人从旁协助及辅导他们使用超级电脑的算力」,吴汉章说。
台智云过去曾协助国网中心维运管理超级电脑的算力资源,对外服务学研及产业,现在也协助数发部数产署维运管理算力池,这个算力池开放新创及软体资服业者申请,提供免费的算力资源供他们开发测试AI产品服务。
政府目前正积极建置超级电脑扩建算力,每年分期建置,以采用最新GPU,预估2029年公共算力将提高至480PF,吴汉章表示,很难评论政府建置的算力够不够,更重要的是如何分配这些算力资源,过去很少有工作负载需要使用大量GPU算力资源,现在大型语言模型需要大量GPU算力,就需要妥善的分配。
由于GPU相当昂贵,购买更多GPU组成大型算力的成本,远非一般企业能够负担,不能单靠自由市场机制提供的商业服务,他认为,政府必需建置公共算力帮助新创或企业,尤其是研发阶段,要经过不断测试找出最好的方法,新创业者可能空有想法或技术,但是缺少足够的算力资源,让他们去测试验证,众所皆知,「发展语言模型就是需要实验」,愈早拥有算力,愈早进行实验,就能不断优化模型,早一步推出服务抢占市场商机。
目前各国发展主权AI,积极投入经费扩建算力,例如韩国通过AI法规立法,要建置国家级算力中心,日本计划投入10兆日元,补助企业购买GPU,降低企业建构算力的资本支出。吴汉章指出,台湾的优势在于较早发展在地的语言模型,因此台湾的服务模式、实验经验,吸引其他国家来台取经。
不过,他的观察是尽管台湾现在约有5支团队发展繁中大语言模型,但是大多数团队仅在社群释出模型,提供给外界使用,他认为只有提供开源模型还不够,还要有商业化服务协助企业实际使用,如同企业使用开源软体,开源软体就像黑盒子,如果实际使用上发生问题,该由谁提供支援,红帽就提供Linux的商业服务,负责解决企业遭遇的问题。「如同Linux有红帽一样,开源模型也要有商业服务支援,企业才敢放心使用」。