Google Gemini Deep Think也突破今年數奧金牌門檻

图片来源:

Google

不让OpenAI专美于前，Google DeepMind团队也在周一（7/21）宣布，他们以Gemini Deep Think进阶版来挑战今年的国际数学奥林匹亚（International Math Olympiad，IMO）竞赛，同样在官方要求的时间内解决了5道题目，得到与OpenAI同样的35分，一起得到金牌。

IMO是一项针对高中生的全球性数学竞赛，在两天的竞赛中各提供4.5小时的时间来解决涵盖不同领域的3道数学题目，每道题最高为7分，金牌门槛每年不一，今年数奥甫于上周结束，金牌门槛为35分。

其实DeepMind早在去年就曾挑战IMO，当时同时运用专门解几何题的AlphaGeometry，以及负责代数、数论等其它题型的AlphaProof两个模型。由于这两个模型都无法直接处理自然语言题目，需要人类专家先将题目转换成如Lean等形式语言，再喂给模型处理，因此整个过程通常得花上两到三天。

今年的Gemini Deep Think进阶版则能以自然语言端到端运行，直接从官方问题描述中生成严格的数学证明，并在4.5小时的比赛时限内完成。

Google解释，Gemini Deep Think进阶版为一针对复杂问题的增强推理模式，融合某些最新研究技术，例如平行思维，它让模型在给出最终答案之前同时探索及组合多种可能的解决方案，而非追求单一的线性思维链；亦采用创新的强化学习技术，提升 Gemini处理多步推理、解题与定理证明的能力；还让Gemini学习一套精选的高品质数学解题资料，并补充针对IMO题目的提示与策略建议。

此一Gemini Deep Think进阶版将率先开放给数学家等有限的测试者，之后才会开放给Google AI Ultra订阅者。相较之下，OpenAI用来挑战数奥的模型仍只是个实验性的研究模型，至少在几个月内都不会释出。

Google Gemini Deep Think也突破今年数奥金牌门槛