DeepMind新模型专解几何问题,能力与奥林匹亚数学金牌相当

DeepMind在《自然》期刊的新研究论文,展示了人工智慧在数学推理上的最新进展。AlphaGeometry此一新模型能解决复杂的几何问题,其程度接近高中生国际数学奥林匹亚竞赛(IMO)金牌得主。在30道几何问题基准测试中,于标准比赛时限过去即便是最先进的系统,也只能解决10道问题,AlphaGeometry则能够解决25道题目,而人类金牌得主平均可解决25.9道。

过去人工智慧系统在解决几何和数学的复杂问题常会遭遇困难,主要是因为缺乏推理技能和训练资料。AlphaGeometry系统结合了神经语言模型的预测能力,以及规则推理引擎,两者协同工作高效寻找问题解法。

AlphaGeometry是一个神经符号(Neuro-Symbolic)系统,这是一种结合神经网路和符号推理的人工智慧技术,目的在于结合这两种系统的优势,以解决传统人工智慧方法没办法克服的挑战。研究人员解释,这是类似《快思慢想》书中的方法,一个系统提供快速直观的想法,另一个系统则提供深思熟虑,经理性思考的决策。

神经语言模型擅长辨识资料中一般模式和关系,可以快速预测对解决问题有用的结构,但通常缺乏严谨的推理能力和解释其决策的能力。而符号推理引擎则能以逻辑和明确规则得出结论,结果理性且可解释,但在独立处理大型、复杂问题时,又显得过于迟缓不够灵活。AlphaGeometry特殊之处在于能够有效结合两种不同方法,利用神经语言模型快速直觉预测,加上符号推理引擎的严谨和逻辑性推理,解决原本需要人类解题者才能处理的高难度几何问题。

研究人员运用大规模合成资料生成方法训练AlphaGeometry,使其能够从零开始学习,而且不需要仰赖人类的示范。AlphaGeometry借由高效能平行运算,创建了10亿个随机几何图形,并从中推导出点与线之间的所有关系。接著,从这些庞大的资料中,筛选出1亿个独特且难度各异实例,作为最终的训练资料集,其中包含9百万个新增结构的实例。经过这些实例学习,AlphaGeometry在面对奥林匹亚级的几何问题时,能够提供有效的结构建议。

AlphaGeometry每道奥林匹亚问题的解法,都经过电脑的检查和验证,这些成果不仅足以和之前的人工智慧方法以及人类在奥林匹亚比赛中的表现相比较,研究人员也请来前奥林匹亚金牌得主,数学教练Evan Chen进行评估。

Evan Chen给予AlphaGeometry的输出高度评价,认为其解答清晰可验证,过去人工智慧解决方案的解答可能并非总是正确,而AlphaGeometry没有这个弱点,其解题方式与人类相似,使用了经典的几何规则,而非单纯的代数计算。

AlphaGeometry不仅是技术上的突破,在实际应用也呈现高度实用性。虽然AlphaGeometry只能解决国际数学奥林匹亚竞赛中几何部分的题目,但在几何领域已经达到IMO金牌得主水准。而研究团队从零开始训练人工智慧系统的方法,有望在未来也能用于建构探索各种新知识的人工智慧系统。DeepMind现已开源AlphaGeometry程式码、模型,以及合成资料集,推进数学、科学和人工智慧领域的研究。