不让OpenAI专美于前,Google DeepMind团队也在周一(7/21)宣布,他们以Gemini Deep Think进阶版来挑战今年的国际数学奥林匹亚(International Math Olympiad,IMO)竞赛,同样在官方要求的时间内解决了5道题目,得到与OpenAI同样的35分,一起得到金牌。
IMO是一项针对高中生的全球性数学竞赛,在两天的竞赛中各提供4.5小时的时间来解决涵盖不同领域的3道数学题目,每道题最高为7分,金牌门槛每年不一,今年数奥甫于上周结束,金牌门槛为35分。
其实DeepMind早在去年就曾挑战IMO,当时同时运用专门解几何题的AlphaGeometry,以及负责代数、数论等其它题型的AlphaProof两个模型。由于这两个模型都无法直接处理自然语言题目,需要人类专家先将题目转换成如Lean等形式语言,再喂给模型处理,因此整个过程通常得花上两到三天。
今年的Gemini Deep Think进阶版则能以自然语言端到端运行,直接从官方问题描述中生成严格的数学证明,并在4.5小时的比赛时限内完成。
Google解释,Gemini Deep Think进阶版为一针对复杂问题的增强推理模式,融合某些最新研究技术,例如平行思维,它让模型在给出最终答案之前同时探索及组合多种可能的解决方案,而非追求单一的线性思维链;亦采用创新的强化学习技术,提升 Gemini处理多步推理、解题与定理证明的能力;还让Gemini学习一套精选的高品质数学解题资料,并补充针对IMO题目的提示与策略建议。
此一Gemini Deep Think进阶版将率先开放给数学家等有限的测试者,之后才会开放给Google AI Ultra订阅者。相较之下,OpenAI用来挑战数奥的模型仍只是个实验性的研究模型,至少在几个月内都不会释出。