DeepMind首个猜想库开源,获陶哲轩力挺!
创始人
2025-06-12 13:40:46
0

新智元报道

编辑:桃子

【新智元导读】 谷歌DeepMind重磅出击,开源首个形式化数学猜想库,获陶哲轩力挺!从解析数论的兰道猜想开始,这个开源项目将为AI破解数学难题的未来铺路。

形式化猜想,再次获陶哲轩认可!

最近,谷歌DeepMind正式开源了「形式化猜想」GitHub项目,在业内引发巨大的反响。

项目地址:https://github.com/google-deepmind/formal-conjectures

尤其是,一直以来对此关注度最高的菲尔兹奖得主陶哲轩,发长文进行了点评。

这一公开数据库将数学猜想用形式化语言重新表述,让AI工具能读懂并尝试解决这些问题。

目前,这个库已经收录了一些重量级猜想,比如解析数论中的4个「兰道猜想」Landau problem)。

更激动人心的是,DeepMind正向全球数学家和研究者征集更多猜想,让这个库成为一个不断扩展的「数学宝库」。

陶哲轩:AI攻克数学猜想第一步

你可能好奇,为什么不直接让AI去解决数学问题,非要搞什么「形式化」?

这里有个关键点:数学猜想通常是用自然语言描述,对人来说很直观,但对计算机来说却像「天书」。

陶哲轩表示,「提出一个数学猜想容易,证明它却难如登天」。

若想借助自动化工具在这些问题上取得进展,建立一种标准化的表述形式是关键的第一步。

如果直接让AI去处理这些模糊的表述,它很可能只是在技术细节上「钻空子」。

举个栗子,AI可能构造出一个正式陈述,但其包含了一个原本并非意图中的边界情况,如把关键参数设为零,绕过真正的问题,从而给出一个看似正确但毫无意义的答案。

形式化的意义,就在于把这些模糊的表述变成「精确无误」的数学语言。

只有这样,AI才能真正理解问题,尝试给出有意义的解答。DeepMind的这个库,就是为AI提供这样的「标准答案模板」。

接下来,一起看看这个库中都有哪些要点。

数学猜想库上线,破解世纪难题钥匙

GitHub项目主页中介绍,形式化猜想——一份使用mathlib在Lean中形式化表述的猜想集合。

目标

尽管包含证明的形式化定理库日益增长,但仅陈述形式化的开放猜想仍十分匮乏。填补这一空白将具有多重意义:

• 为自动定理证明器和形式化工具提供优质基准测试集

• 通过形式化澄清猜想的精确含义

• 通过突显缺失定义,促进mathlib的扩展

形式化准确性

无证明的数学陈述形式化具有固有挑战性,原始猜想的微妙之处可能在形式化表述中失真。为缓解该问题,DeepMind将采取两项措施:

1 对贡献内容进行严格人工审核

如何参与贡献

DeepMind在此诚邀各方大佬前来贡献,每个人可添加最喜爱的猜想(或创建issue描述)。

贡献方式

本仓库接受多种形式的贡献:

1. 新增问题形式化

不同于千禧难题、斯梅尔问题列表等传统猜想集,本仓库鼓励多元来源的贡献,包括但不限于:

· 数学教材

· 研究论文(含arXiv预印本)

· MathOverflow提问

· 专题问题集(如埃尔德什问题、维基百科未解决问题列表、苏格兰咖啡馆问题集等)

2. 提交形式化需求,创建issue时请提供:

· 可靠参考文献链接

· 精确的非形式化猜想陈述

3. 完善现有内容

· 补充参考文献指针

· 增加AMS数学主题分类标签

4. 修正错误形式化

提交PR修复错误或创建issue指正问题

用法、结构与特性

这是一个基于lake管理、依赖mathlib的Lean 4项目。使用前需安装:

1. elan + lake + Lean

2.(可选)VSCode及相关插件

初始化命令:

lake exe cache get lake build

目录结构

按猜想来源类型组织,包含两个特殊目录:

· Util/:存放工具组件• 分类属性标签系统• answerelaborator• 代码检查器

· ForMathlib/:可向上游提交至mathlib的代码(遵循mathlib目录结构)

核心特性

1. 分类属性标签

用于标记问题陈述的类别,当前支持:

· research open:学界未解决的数学问题

· research solved:学界已公认解决的问题(不要求形式化证明)

· graduate:研究生级别问题

· undergraduate:本科级别问题

· high_school:中学级别问题

· API:围绕新定义的基础理论构建

· test:用于测试定义的「单元测试」

使用示例:

@[category research open] theorem foo : Transcendental ℚ (rexp 1+ π) := bysorry @[category research solved] theorem bar : FermatLastTheorem := bysorry

2. AMS数学主题标签

采用AMS MSC2020主分类号标注数学领域,例如:

@[AMS 11] -- "数论"分类 theorem flt : FermatLastTheorem := bysorry

• 在Lean文件中可用#AMS命令查看所有可选值

• VSCode中悬停标签可显示对应学科

• 支持多标签组合:@[AMS foo bar]

3. answerelaborator

用于需用户提供答案的开放问题(如Hadwiger-Nelson问题):

@[category research open] theorem HadwigerNelsonProblem : IsLeast {n : ℕ | ExistsColoring n} answer(sorry) := bysorry

重要说明

· 在answer中提供项及证明不意味问题已解决

· 答案的数学意义评估不在本仓库范畴内

风格规范

1. 文件组织

· 每个问题独立成文件(变体与特例可合并)

· 维基百科来源的问题应置于FormalConjectures/Wikipedia/

2. 定义与API

· 允许自定义定义(需有助于阐明问题)

· 鼓励为定义提供基础API以验证行为

3. 陈述格式

· 基准问题使用theorem声明

· 测试用例优先使用example

· 必须包含至少一个AMS标签

5. 问题转译

· 英语疑问句形式:

/-- 原文: "Does P hold ?"-/ theorem myConjecture : P ↔ answer(sorry) := by sorry

· 已解决问题替换为answer(True/False)

· 非疑问句形式:

/-- 原文: "P holds"-/ theorem myConjecture : P := by sorry

· 反例情况应陈述为¬ P

版本

· 跟踪mathlib月度发布版本(而非master分支)

· 若问题需mathlib未收录的定义,可暂存于ForMathlib/目录

参考资料:

GitHub - google-deepmind/formal-conjectures: A collection of formalized statements of conjectures in

相关内容

热门资讯

以媒:以色列一架政府专机从本-... 【环球网报道】据《以色列时报》当地时间13日援引航班跟踪网站信息报道,以色列政府专机“锡安之翼”此前...
《临江仙》热度暴涨,白鹿曾舜晞... 《临江仙》真是够争气的。虽然开播第一天,就被全网嘲太难看。但三天的时间过去,热度已经突破9500。热...
给《亮剑》演员的演技排座次:何... 说起国产抗日剧中的“天花板之作”,那《亮剑》绝对配得上这个称号,从上映至今一直都处于爆火的状态,吸引...
曝杜兰特预计下周被交易 马刺领... 北京时间6月13日,据美国媒体消息,杜兰特预计将在下周被太阳队交易出去,目前太阳队正在和多支对杜兰特...
哈梅内伊证实多名军事指挥官和核... △哈梅内伊(资料图) 当地时间13日,伊朗最高领袖哈梅内伊称,以色列将受到严厉惩罚。哈梅内伊同时证实...
《护宝寻踪》要不是黎远光报仇!... 电视剧《护宝寻踪》原来燕小五替穆见晖坐牢,就是为了妻儿能够摆脱贫穷,但是当妻子把92万摆在燕小五面前...
开源神器!Windows 11... IT之家 6 月 13 日消息,科技媒体 Windows Latest 昨日(6 月 12 日)发布...
《护宝寻踪》大结局:一抓二死三... 电视剧《护宝寻踪》即将大结局了,而这部剧的大结局可以说是令人既期待又疑惑,新的剧情中穆见晖被拘留了,...
3C数码市场京东份额远超天猫淘... 随着越来越多带有AI功能的3C数码产品的出现,人们的生活开启了全新的智能体验。根据近日《时代周报》发...
破局500万AI人才荒!传智教... AI浪潮奔涌而至,百万AI人才缺口已成制约产业发展的关键瓶颈。在此背景下,传智教育旗下高端品牌黑马程...
宿迁职业技术学院:全专业AI选... 随着人工智能技术的迅猛发展,AI正逐步渗透到各行各业,成为未来职场不可或缺的核心技能。复旦大学推行“...
如何用豆包音乐生成功能创作AI... 导语 在音乐创作的世界里,借助 AI 工具能让灵感快速落地。接下来就为你详细介绍如何用豆包音乐生成...
AMD 发布下一代开源软件栈技... IT之家 6 月 13 日消息,在今日凌晨的 AMD Advancing AI 2025 活动中,A...
CentOS 系统内置常用命令... CentOS以其出色的稳定性和强大的企业级特性,在服务器领域备受赞誉。掌握系统内置的默认命令,是每位...
人民网发长文点评《长安的荔枝》... 《长安的荔枝》,央视八套黄金档播出。而且还被人民日报多次推荐。按理来说,它应该成为理所应当的爆剧。可...
短剧抢滩大IP 文|LABUBU‍‍‍‍‍‍‍‍‍‍‍不久前《还珠格格》改编短剧《还珠》开机的消息掀起了一阵波澜,上...
打了多少人的脸!黄晓明从被骂“... 前言虽然《潜渊》后几天开播,还是在湖南台这样的地方卫视开播。但是在热度上,却碾压了央视播出的《长安的...
“镂空鞋”今年夏天爆火!不张扬... 花样百搭的缤纷夏日,一双好看、时髦、夏日感的凉鞋,是一切穿搭的起始和风格导向。编织镂空,这种带有典型...
《护宝寻踪》结局:华南王落网,... 不知不觉,《护宝寻踪》大结局了。最新的剧情中,穆见晖跟赵佑林的大战结束,穆见晖把老肖给捅出去,进而证...
TVB视帝新剧演出大获好评,盼... 由TVB双视帝林保怡、张振朗主演新剧《刑侦12》早前在内地已经播出大结局,而TVB翡翠台方面也即将大...