GovTech月报第38期:数发部拟推动建立主权AI训练语料资料库;TAIDE释出Llama 3.1版8B模型

数发部长黄彦男日前说明今年该部3大工作重点,分别为强化数位韧性、发展数位经济及打诈,其中数位经济中为扶植国内AI发展,数发部算力、资料、人才、资金4方面提供支援,开放政府资料供AI新创公司及研发单位训练AI模型。

图片来源: 

数发部

重点新闻(0121~0220)

资料治理 AI

强化我国主权AI发展,数发部:今年将建立AI训练语料资料库

为保护本国语言、文化、本地价值,各国竞相发展主权AI,台湾也不落人后,日前数发部揭露最新资料治理作法,包括为活化资料运用,将研拟促进资料创新利用发展条例草案,并且今年将建立主权AI训练语料资料库。

数发部指出,去年底数发部参考国际趋势,研拟促进资料创新利用发展条例草案,目的为促进机关与产业资料共享,以建立资料的利他环境,今年第1季预计先跟利害关系人、各部会、地方政府与专家学者沟通,再进行草案预告。草案涵盖资料基础工程,为发展AI提供高品质、可信赖的资料供民间运用,提出资料创新措施,促进资料开放运用。

另外,今年将建立的台湾主权AI训练语料资料库,经盘点,有1千多笔文化部国家记忆、客委会客语资料、原民会原民资料,未来希望开放外界运用,去年底已邀请语料建置机关讨论,优化语料申请、收费与授权方式,以因应TAIDE的语料训练需求,并且提供外界运用。

主权 AI

TAIDE释出基于Llama 3.1的TAIDE 8B模型

由国科会主导推动的可信任人工智慧对话引擎TAIDE,标榜台湾在地语言、文化价值,自去年5月更新后,已有一段时间未发布更新,终于在近期释出基于Llama 3.1的TAIDE 8B模型,并强调TAIDE的应用发展,例如在地语言学习、医疗等等。

新的TAIDE模型以Meta释出的Llama 3.1 8B为基础,参数规模为8.5B,采用Nvidia H100运算,训练时间共2896个小时,最大内容长度可到131K,以45B的繁中训练资料Token训练,正体中文解码速度提升20%,并具备台湾国情、在地文化及用语等知识,具备多轮对话问答能力,并且提升长文处理能力。

根据网页上的说明,新释出的模型采正体中文资料预训练(continuous pretraining),并以指令微调(instruction tuning)强化摘要、写信、写文章、中翻英、英翻中等办公室常用工作、多轮问答对话能力,适合于对话或任务协助的使用情境。 

该网页也公布摘要、写信、写文章、中翻英、英翻中5项工作中,TAIDE 8B和基于Llama 3的TAIDE 8B-Apha1以及Llama 3.1 8B的评测结果,显示TAIDE 8B在5项工作的评分都要比Llama 3.1 8B来得高,但是和TAIDE 8B-Apha1在5项工作中评分互有优劣。

算力 AI

提升我国AI算力,国科会估2029年我国公共算力可达480PF

为发展AI,各国积极提升AI算力,国科会近期指出,政府加速建置超级电脑,公共AI算力在2029年可望达到480PF,如加上民间建置的算力,公私部门合计算力可望超过1,200PF,大幅提升我国算力基础建设。

为推动国内AI发展,包括稳固AI主权、深化AI自主发展,国科会报告正著手推动三大策略,建置大型算力、建置大型云端资料中心、发展本土特色的繁体中文大型语言模型。其中在算力方面,国网中心正分期建置新的超级电脑,以提升国内的AI算力资源,去年底已完成算力达16PF的超级电脑,预期在今年5月开放使用,今年底将再增加100PF,未来5年总算力可望达到480PF。

资料中心方面,国网中心也规画建置大型云端资料中心,作为AI算力机房及国家关键资料基地,可达60PB的储存量,今年先完成南科的云端资料中心,2029年再完成沙仑的AI运算资料中心。国网中心计划针对开发者痛点,今年推出生成式AI技术应用的一站式AI开发云端服务平台。

至于繁中模型方面,发展具有本土特色的繁体中文大型语言模型TAIDE,持续精进模型,并且加速多元应用模型落地。

超级电脑 AI

韩国今年将建置国家级AI运算中心,打造韩版ChatGPT服务

韩国宣布AI国家战略,原本将在2030年完成的国家级AI运算中心,将提前在2025年完成并启用,未来透过AI运算基础设施,宣示打造韩国版的ChatGPT,加速政府与民间合作,目标为让韩国成为全球AI的3大强国。

韩国代理总统崔相穆,同时也是韩国「AI运算基础设施特别委员会」委员长,日前召开会议,崔相穆表示,全球各国竞相投入巨资建置AI基础建设,韩国也不落人后,计划打造韩国版ChatGPT,投入资金及资源,让韩国成为全球AI的3大强国。

会议检讨韩国的国家AI运算中心计划,从原定的2030年完成,提前到2025年完成启用,韩国政府希望透过公部门与私部门合作的方式,先采购1万个GPU,包括Nvidia的H100及H200,早期先建立AI运算中心服务,并在2026年上半年再建置8千个GPU的超级电脑,以支援研究机构使用。

无人机 犯罪

控制毒品泛滥,美、墨联手以无人机揪出贩毒集团走私及毒品实验室

墨西哥总统Claudia Sheinbaum近期实证在墨西哥领土上空侦察的无人机,为美国应墨西哥政府要求,利用无人机在空中监察,找出墨西哥境内毒品集团的实验室。

美国总统川普上任后,对墨西哥的毒品集团采取更严格的政策,除了可能将特定的贩毒集团视为外国恐怖组织,为日后两国合作打击毒品制造、贩售的毒品集团祭出更严厉犯罪打击措施;近期媒体报导,在墨西哥境内无人机,为美国中央情报局所有,其目的在侦测墨国境内毒品芬太妮实验室及走私活动,但是中情局一直不愿多作说明,Claudia近期则证实这是美国与墨西哥政府两国合作的成果。

这项无人机打击犯罪计划,目的在找出墨国境内西北部地区的芬太妮实验室,现在中情局监控墨国贩毒集团的无人机也是MQ-9,该款无人机先前也被用于打击国外的恐怖组织。在此之前,美国海关及边境保护局也使用MQ-9死神无人机加强美、墨两国边境的监控。

数位皮夹 数位身分

英国拟推出数位皮夹,让民众在手机端储存政府核发文件及身分证件

英国政府近期宣布,准备在今年推出GOV.UK皮夹,以储存管理政府所核发虚拟文件及身分证件,首波将先以退伍军人证件、数位驾照,让民众可透过手机内的数位皮夹使用。

这项政策并非强制,而是在传统文件、身分证件之外新的选项,今年稍晚英国政府计划先推出退伍军人文件、数位驾照,在2027年底让所有政府服务都能提供数位证明。英国政府表示,民众使用GOV.UK皮夹,当购买酒类饮料或特殊的物品时,可提出数位证明验证符合身分资格,特别是让民众管理自己的身分资料,并且更容易和公共服务互动。

英国政府进一步表示,GOV.UK皮夹的使用安全性将支援脸部辨识或手机内建的身分安全验证功能,并支援GOV.UK One login的单一身分登入机制。

AI 数位转型

马来西亚政府与Google联手,扩大开放44万名公务员用GAI工具

马来西亚政府大力拥抱AI,该国近期宣布和Google合作,开放超过44万名公务人员全面使用AI工具Gemini,撰写文件、会议纪录摘要、制作影片、民众服务等等,提高公务运作效率。

马国政府024年12月试办AI at Work,将AI工具运用于公务运作,经过试办后,9成7的参与者反应每周每人约节省 3.25个小时,约9成表示生成式人工智慧有助于提高工作品质。近期马国数位部再与Google宣布启动AI at Work 2.0,扩大马来西亚政府超过44.5万名公务人员使用Google Workspace及Gemini,以提高公务员的生产力及效率,相对地,Google先前承诺投资20亿美元,于马来西亚建置资料中心、云端区域,并且提供AI技能培育工作。

在公务使用中,利用生成式AI撰写文件内容,例如起草政策文件或书面回应,产生会议纪录摘要,或是根据多种资料源,让AI提出分析见解,以及促进更有公务员与民众的互动沟通。

 

图片来源/数发部、国科会、TAIDE

 更多GovTech动态 

1.传马斯克力促以区块链提高美国联邦政府效率

2.韩国禁止政府部门使用DeepSeek

资料来源:iThome整理,2025年2月