银牌组最高分,谷歌DeepMind捅破AI数学推理上限:6道国际奥数题解出4道
7 月 26 日消息,组最谷歌 DeepMind 团队昨日(7 月 25 日)发布博文,高分谷歌表示其研发的捅破推理 AlphaProof 和 AlphaGeometry 2 模型可以解决数学中的高级推理问题,在解答国际数学奥林匹克竞赛难题方面达到银牌标准。数学上限数题
AI 模型简介
AlphaProof:基于强化学习的道国道全新数学形式推理系统。
AlphaGeometry 2:几何解题系统的际奥解出改进版。
DeepMind 团队结合两个 AI 模型,银牌协作解决了今年国际数学奥林匹克(IMO)6 道题目中的组最 4 道,首次在竞赛中取得与银牌得主同等的高分谷歌成绩。
评分团队
DeepMind 团队两位专家,捅破推理根据 IMO 的数学上限数题评分规则进行评分,这两位专家分别为:
蒂莫西・高尔斯教授(Prof Sir Timothy Gowers):著名数学家、道国道IMO 金牌得主和菲尔兹奖得主。际奥解出
约瑟夫-迈尔斯博士(Dr Joseph Myers):两届 IMO 金牌得主、银牌IMO 2024 年问题遴选委员会主席
AI 模型推理
AI 会将 IMO 的 6 道题目翻译成为模型可以理解的数学语言。
AlphaProof 通过确定答案并证明其正确性,解决了两个代数问题和一个数论问题,而其中解决的 1 个问题是比赛中最难的,在今年的 IMO 中只有 5 位选手解决了这一问题。
相关文章: