離通用AI更近了！Google DeepMind新AI媲美國際數學奧林匹克金牌的解題能力

Google DeepMind团队开发一套AI系统AlphaGeometry，可解国际数学奥林匹克（IMO）难题，并在最新的30道题目中，在规定时间内解出25题。不只比过往最佳的AI模型高出15题，还与人类金牌表现相当。

图片来源:

Google DeepMind

Google DeepMind最近发表最先进的AI系统解几何学难题，仍是个挑战

为何AI解几何学题目很重要？

因为，几何学是数学最古老、最基础的分支之一，也是电脑科学、建筑、艺术、工程、天文等领域的重要工具。就电脑科学来说，几何学因涉及空间属性，例如距离、形状、大小和相对位置等，是重要的处理工具，尤其能用来设计和分析演算法，执行常见的AI任务，如图像处理、电脑视觉和动作规画等。

几何学也是国际数学奥林匹克竞赛的重要课题。这个竞赛旨在测验逻辑推理和发现新知识的能力，每年吸引全球各地优秀的高中生，来挑战数学难题。

然而，就算是目前最先进的AI系统，都还难以证明数学猜想（Conjecture）的真伪。AI界普遍认为，能证明数学定理，是发展通用AI（即AGI）的关键一步，但它有个大挑战：训练资料的缺乏。因为，专为AI建立数学证明资料，既困难又昂贵，专家们很难收集到足够的训练资料，来打造AI解题模型。

根据IMO规则生成1亿笔训练资料，最终解出25道题

为解决这个挑战，Google DeepMind研究团队Trieu Trinh和Thang Luong先是根据IMO规则，生成了1亿个不同复杂度的数学定理和证明，并用这些合成的训练资料，从头训练出一套AI系统AlphaGeometry。在这个过程中，完全没使用人工范例。

而在架构上，它是一套神经符号（Neuro-symbolic）系统，采混合式架构，由神经语言模型（NLL）和符号推论引擎（Symbolic deduction engine）2大部分组成。

其中，神经语言模型扮演引导角色，来指导符号推论引擎，如何在IMO等级的问题中，从几何构造的无限可能中找出解决方案（如下图）。这是因为，IMO几何问题以图形呈现，需要添加新的几何结构（如点、线、面）才能解题，而AlphaGeometry的语言模型，可以从无数个可能性中，预测出添加哪些新结构最有用。这些线索，能帮助符号引擎进一步推导图形，找出最接近的解答。

AlphaGeometry如何解决一个简单问题：首先，给定问题图形和定理（左），AlphaGeometry（中）接著用符号引擎，来推导图形的新陈述，直到找到解决方案或新陈述用完为止。若未找到解决方案，AlphaGeometry 的语言模型会添加一个可能有用的构造（蓝色部分），给符号引擎新的推导方向。这个循环会一直出现，直到找到解决方案为止（右）。

AlphaGeometry也成功在最新的IMO竞赛中，在规定时间内解出25道题（共30题），能力与世界上最聪明的高中数学生相当，媲美历届金牌的平均成绩25.9道题。

Google认为，这个成功，不只是数学推理上的突破，还能运用到更广泛的科学领域问题。而且，AlphaGeometry解决专家级的复杂数学问题，未来还能帮助人类更理解世界运作的过程。

离通用AI更近了！Google DeepMind新AI媲美国际数学奥林匹克金牌的解题能力