Google DeepMind团队开发一套AI系统AlphaGeometry,可解国际数学奥林匹克(IMO)难题,并在最新的30道题目中,在规定时间内解出25题。不只比过往最佳的AI模型高出15题,还与人类金牌表现相当。
Google DeepMind
Google DeepMind最近发表最先进的AI系统解几何学难题,仍是个挑战
为何AI解几何学题目很重要?
因为,几何学是数学最古老、最基础的分支之一,也是电脑科学、建筑、艺术、工程、天文等领域的重要工具。就电脑科学来说,几何学因涉及空间属性,例如距离、形状、大小和相对位置等,是重要的处理工具,尤其能用来设计和分析演算法,执行常见的AI任务,如图像处理、电脑视觉和动作规画等。
几何学也是国际数学奥林匹克竞赛的重要课题。这个竞赛旨在测验逻辑推理和发现新知识的能力,每年吸引全球各地优秀的高中生,来挑战数学难题。
然而,就算是目前最先进的AI系统,都还难以证明数学猜想(Conjecture)的真伪。AI界普遍认为,能证明数学定理,是发展通用AI(即AGI)的关键一步,但它有个大挑战:训练资料的缺乏。因为,专为AI建立数学证明资料,既困难又昂贵,专家们很难收集到足够的训练资料,来打造AI解题模型。
根据IMO规则生成1亿笔训练资料,最终解出25道题
为解决这个挑战,Google DeepMind研究团队Trieu Trinh和Thang Luong先是根据IMO规则,生成了1亿个不同复杂度的数学定理和证明,并用这些合成的训练资料,从头训练出一套AI系统AlphaGeometry。在这个过程中,完全没使用人工范例。
而在架构上,它是一套神经符号(Neuro-symbolic)系统,采混合式架构,由神经语言模型(NLL)和符号推论引擎(Symbolic deduction engine)2大部分组成。
其中,神经语言模型扮演引导角色,来指导符号推论引擎,如何在IMO等级的问题中,从几何构造的无限可能中找出解决方案(如下图)。这是因为,IMO几何问题以图形呈现,需要添加新的几何结构(如点、线、面)才能解题,而AlphaGeometry的语言模型,可以从无数个可能性中,预测出添加哪些新结构最有用。这些线索,能帮助符号引擎进一步推导图形,找出最接近的解答。
AlphaGeometry如何解决一个简单问题:首先,给定问题图形和定理(左),AlphaGeometry(中)接著用符号引擎,来推导图形的新陈述,直到找到解决方案或新陈述用完为止。若未找到解决方案,AlphaGeometry 的语言模型会添加一个可能有用的构造(蓝色部分),给符号引擎新的推导方向。这个循环会一直出现,直到找到解决方案为止(右)。
AlphaGeometry也成功在最新的IMO竞赛中,在规定时间内解出25道题(共30题),能力与世界上最聪明的高中数学生相当,媲美历届金牌的平均成绩25.9道题。
Google认为,这个成功,不只是数学推理上的突破,还能运用到更广泛的科学领域问题。而且,AlphaGeometry解决专家级的复杂数学问题,未来还能帮助人类更理解世界运作的过程。