数发部要从算力、资料等5策略著手加速国内AI产业生态发展

数发部政务次长林宜敬说明国内算力现况。

图片来源: 

数发部

为促进国内AI产业生态的有利发展,数发部今天(2/27)宣布将从算力、资料、人才、行销、资金5项策略著手,除了开放数产署的GPU算力资源,供软体、新创业者免费申请使用外,还将研拟资料创新利用发展条例,建立主权AI训练语料资料库,由政府公部门先带头开放资料供AI研发运用,鼓励私部门民间产业跟进。

首先在算力方面,目前政府所建置的公共算力,是以国科会底下国家实验研究院的国网中心规画建置超级电脑为主,去年底建置的新超级电脑,算力达16PF,国科会预计5月将会开放算力服务,预计今年底再增加100PF算力。

数产署的算力池今年将开放3梯次供外界使用

数发部为扶植AI产业发展,数产署去年建置GPU算力池,共有32Nvidia H1008AMD MI300X,算力约1.58PF,去年已开放部分软体、新创业者申请免费使用,今年预计开放三个梯次申请,第1梯次已在213日举办说明会,预计4月开放50家业者免费使用,后续两个梯次将分别在7月、10月各开放70家业者使用。

由于数发部的预算遭删减,日前数发部长黄彦男指出,数产署提供的算力服务未来难以再增加采购GPU

数发部政务次长林宜敬表示,民间企业可使用商业的算力服务,大型企业甚至自建算力资源,来开发AI模型及应用,但是只供企业自己使用,如果其他企业各自建立AI模型及应用,则需要耗费大量算力资源,目前全球算力资源相当昂贵,一张GPU价格在百万元,数产署提供的算力资源也有限,依各产业需求开发AI产品,主要开放扶植软体或新创业者用于PoC概念验证,证明技术、商业化可行性后,再使用其他算力服务。

鼓励资料创新利用、建立主权AI训练语料资料库

在资料方面,考量到开发AI模型需要高品质、大量的资料,但是国内可开放使用的繁体中文资料不足,因此数发部今年将研拟促进资料创新利用发展条例(草案),提交给行政院审议。

促进资料创新利用发展条例主要以非个资的资料为主,包括判别式AI训练需要的结构化资料,以及用于生成式AI训练的非结构化语意资料;数发部资料创新司副司长陈怡君表示,发展条例将鼓励政府拥有著作权的资料,将公部门资料开放供AI等创新利用,此外,数发部也将建置台湾主权AI训练语料库,以高品质、繁中、台湾观点,提供训练语料给国内外的LLM使用。

建置台湾主权AI训练语料库的目的,数发部目的为降低国内外LLM取得训练资料的成本,因此免费提供资料,以鼓励LLM使用来自台湾的训练资料,并且减少AI业者和内容拥有者间的著作权纠纷。

按照数发部的规画,这个主权AI训练语料库的资料来源,包括政府拥有著作权的非机密性文件,例如政府机关的施政计划、施政报告、研究报告、政府出版品,另一部分是民间的著作权内容,鼓励民间捐赠的散文、小说、论文、新诗、传记等等。

林宜敬表示,目前国外LLM大型语言模型在训练资料,因著作权等种种问题,缺乏台湾观点的资料,主要使用简体中文资料,因此训练出的模型缺乏台湾观点,建立台湾主权AI训练语料库,即是希望透过降低LLM使用台湾语料成本,不只台湾自主发展的LLM模型,也希望让国外大型语言模型具有台湾观点。

不只是非个资的资料,对于政府各部会拥有含有个资的结构化资料,数发部揭露资料汇流与隐私强化计划,数发部今天概略说明资料汇流与隐私强化机制,由数发部建置资料汇流的Proxy连结各个部会,由各部会提供资料目录,当AI研究人员可向数发部提出资料需求,数发部再转向管理资料的部会提出需求,部会将资料经过去识别化处理后,传送给数发部,再由数发部进一步强化隐私处理,再将处理后的资料提供AI研究人员。

目前数发部先展示资料汇流与隐私强化机制的概念,尚未实际和各部会展开合作,但数发部表示,未来透过这个机制,将让政府部会拥有的含个资资料,也有机会供AI研发使用,促进AI产业发展。

推动公务机关AI认知及人才,与其他部会共同培育AI产学研人才

至于培养AI相关人才,目前数发部正在推动公务机关导入AI,诱过线上课程、实体课程,培养一般公务人员运用AI提升效率,针对公务机关的管理阶层培养其AI应用的规画能力,针对公部门的资讯人力,培养其简易开发AI应用的能力。

在产官学的AI人才发展上,依照AI学术研究、产业的AI开发、企业内的AI开发需要,由国科会、教育部、数发部、经济部分别推动计划,鼓励学校、产业、企业培养AI人才,以培育不同方面的人才。

例如数发部也与人工智慧学校等民间单位合作,依电脑视觉、自然语言等应用,制定AI开发人才指引及标准,建立人才基础,以加速AI产业的发展。

举办AI产业媒合活动、与国发会联手砸百亿预算与民间创投共同投资AI新创

在行销策略方面,数产署与软体业者合作,举办多场Demo Day或需求媒合会,让软体或AI业者可展示依据不同产业需求开发的AI产品或服务,让无法自己开发AI的中小型企业也能导入AI

资金方面,数发部也与国发会合作,匡列100亿元的预算,为期10年,与民间创投业者联手共同投资具有潜力的AI业者,或是还未上市柜的数位经济领域公司。