多家欧洲研究机构启动OpenEuroLLM专案,获欧盟资助推动AI透明度与多语言支援

欧盟也积极推动人工智慧发展,强化语言模型技术透明度与多语言研究,由欧洲多家顶尖研究机构及企业组成的OpenEuroLLM专案,在欧盟Digital Europe Programme资助下正式展开。该专案目标是打造新一代开源大型语言模型,期望借此巩固欧洲在人工智慧领域的竞争力,同时维持法遵与技术透明度,回应欧盟在人工智慧技术自主与数位主权上的需求。

OpenEuroLLM由捷克查理大学(Charles University)与芬兰AMD Silo AI等单位共同带领,包含多家欧洲高等院校、人工智慧研究机构及EuroHPC超级计算机中心。专案内容特别强调两个方向,其一是对外完全透明,也就是从资料收集、模型训练到评估指标都遵循欧盟隐私与安全标准,并尽可能向社群开放;其二是聚焦多语言能力,除了欧盟官方语言,也涵盖欧洲内部其他常被忽略但同样重要的区域性语种,并考虑在经贸或文化层面具备潜力的语言,期望降低当地产业或公共单位导入人工智慧的门槛。

在开源方向上,OpenEuroLLM提出真正开放的目标,强调会公开训练与测试程式码、资料处理过程、评估方法及中间成果,并同时号召社群参与。这种合作模式可扩大开发者基础,也替未来人工智慧应用提供更透明与法遵环境。由于欧盟正推动人工智慧法案(AI Act)等法规,专案也强调将遵守法规要求,设置安全评估、使用者隐私保护及其他配套措施,在技术与监管之间取得平衡。

欧洲多个国家已具备超级运算、自然语言处理与深度学习的丰富研究能力,像是德国的Fraunhofer研究机构、义大利Cineca高效能运算中心、西班牙巴塞隆纳超级运算中心等,都已在各自领域具有相当基础。这次欧洲多方共同投入OpenEuroLLM专案,试图在硬体资源与技术上合作,以更大规模的资源来训练语言模型。同时,欧盟Digital Europe Programme也承诺投入资金与政策支援,包括资料开放、运算力强化、模型安全检测等领域。

依照OpenEuroLLM的计划,未来这些基础模型都能透过开源管道被微调或扩充,适用于专业领域如医疗文本处理、法律咨询等,同时也会保留对隐私与资料保护的设计,以符合欧盟强调的隐私原则。开发者与企业得以在不违反欧盟法规的前提下,取得高品质的多语言模型基础,并进一步客制化出符合自身需求的人工智慧解决方案。