陶哲轩转发!DeepMind开源「AI数学证明标准习题集」
创始人
2025-05-31 12:26:42
0

陶哲轩转发,AI搞数学证明的标准习题集来了!

DeepMind最新开源形式化数学猜想库

猜想库收录了经典的形式化表述的数学猜想集合,例如,解析数论中的四个朗道问题。

不仅如此,资源库中还提供了各种代码函数,以方便用户对自然语言的数学猜想进行形式化的表述。

陶哲轩曾用Lean形式化证明了PFR猜想(多项式Freiman-Ruzsa猜想),这项成就的第一步就是将猜想的核心概念转化为计算机可验证的形式化版本。

目前,这位“数学界的计算机推广大神”已转发此项目,并表示:

DeepMind的形式化数学猜想库一经建成,团队就表示所有人都可以将数学猜想添加到资源库中,呼吁大家积极参与。

感兴趣的数学家们可以行动起来了。

形式化数学猜想库有什么用

虽然带证明的形式化定理语料库不断扩充,但仅陈述开放式猜想的形式化资源却十分稀缺。

这类资源有望成为自动定理证明或形式化工具的测试基准,来帮助AI模型提升数学推理及证明能力。

DeepMind此次开源的猜想库在一定程度上缓解了这个问题。

它收录了使用Lean形式化表述的数学猜想集合,这些猜想来源于各个途径,并且类型多样。

下图展示了题目类别统计。

这个猜想库相当于为计算机写了一套形式化的“习题集”,还是能够随时扩充并且自带审核的那种!

有了这个“习题集”,传统ATP(自动推理证明)就可以直接基于里面的命题进行证明搜索,比如使用归结法尝试推导矛盾或验证等。

除此之外,将猜想库作为训练数据,就能让模型学习数学猜想的模式,AI就有可能提出新猜想。

例如,AlphaGeometry(DeepMind开发的专门用于自动解决奥林匹克几何题的AI系统)就能够依赖合成几何猜想训练模型。

可以说,形式化数学猜想库是AI+ATP范式的关键前置步骤。

目前,该猜想库刚刚起步,团队希望更多人能参与其中,丰富猜想库的内容。

所有感兴趣的用户都可以通过以下这几种方式参与其中:

1. 添加新的问题形式化:猜想可以来自各种地方,包括数学教科书、研究论文、专用问题列表等。

2. 提出你希望的形式化问题:建议包含参考文献链接和精确的非正式表述。

3. 改进问题的引用和标记:为现有命题添加参考文献或补充AMS学科分类标签。

4. 修复错误的形式化:鼓励通过提交PR修复不准确的表述,或提交issue反馈潜在缺陷。

那么如何操作呢?

接下来,让我们给大家解答。

流程大致分为这样几个步骤:

首先,你要在在GitHub上创建问题,清晰描述计划贡献的内容,包括对要添加的数学猜想的概述、相关背景信息以及自己对该猜想的初步理解等,然后将问题分配给自己,以便跟踪和管理贡献进度。

并且,可以从官方仓库Fork一份到自己的GitHub账户下进行修改。

然后,按照仓库的目录结构和组织方式,确定猜想应该放置的具体的位置,再将你的形式化猜想添加到适当的文件/目录结构中。

下一步就是在本地运行lake build命令,避免出现语法错误或其他导致系统无法正常运行的问题,确保添加或修改后的代码能够成功构建。

完成上述步骤就可以向官方仓库提交拉取请求了,随后等待即可~

并且,由于无证明的数学猜想的形式化过程中可能出现细微错误,猜想库将通过人工审核和AlphaProof(通用数学自动证明系统,结合了LLM和符号推理引擎)辅助识别。

DeepMind与陶哲轩

说来,陶哲轩与DeepMind也是互动颇多。

早在2023年,DeepMind提出FunSearch——一种能够为数学和计算机科学问题搜索解决方案的方法。

陶哲轩就曾称赞FunSearch是“利用LLM进行数学发现的有前途的范式”

该方法首次证明LLMs可以生成用计算机代码编写的函数,相关工作发表在《Nature》杂志上。

就在前不久,谷歌DeepMind与陶哲轩等一众顶尖科学家一起共同打造了AlphaEvolve——一个LLM驱动的进化编码Agent,用于通用算法的发现与优化。

几百年未曾解决的几何挑战接吻数(Kissing Number)问题,也都因为它的出现前进了一大步。

它发现了一个由593个外球体组成的结构,直接刷新了11维空间中的下限。

AlphaEvolve团队将其应用于数学分析、几何学、组合学和数论等多个领域。

在大约75%的案例中,它能够重新发现最先进的解决方案。

在20%的案例中,它改进了之前已知的最佳解决方案。

可以说,这是AI与数学的一次里程碑式碰撞。

陶哲轩表示AlphaEvolve的数学潜力仍在开发之中,让我们一起期待更多进展吧。

形式化数学猜想库:https://google-deepmind.github.io/formal-conjectures/

项目地址:https://github.com/google-deepmind/formal-conjectures

参考链接:https://mathstodon.xyz/@tao/

相关内容

热门资讯

紫牛热点|“上海迪士尼园区一对... 转自:扬子晚报5月31日,有网友发视频称,上海迪士尼有一对情侣和一家三口发生肢体冲突,此事引发热议。...
杭州公布首批夜间餐饮示范街区 原标题:杭州公布首批夜间餐饮示范街区来源:杭州日报5月25日,杭州市商务局公布首批夜间餐饮集聚示范街...
居庸关闪现“数字守城人”,“长... 转自:北京日报客户端今年端午假期,登上居庸关长城的游客收获了一个“数字惊喜”:一位会讲故事、能写藏头...
把矿坑和工业废墟改造为生物乐园... 转自:生态环境部编者按为贯彻落实习近平总书记关于生物多样性保护工作的重要指示批示,推动实施“昆明—蒙...
呈现“新大众文艺”面貌,7月《... 5月29日,由陕西省作家协会、《延河》杂志社主办的延河·新大众文艺2025年重要项目发布会暨传播顾问...
南昌大悦城沸腾启幕:首日客流量...   5月31日,南昌大悦城正式开业,政府领导、大悦城控股高层、品牌商户代表及媒体齐聚现场,共同见证南...
端午假期第二天预计全社会跨区域... 转自:经济日报6月1日(端午假期第2日),全社会跨区域人员流动量预计21264万人次,环比下降7.9...
美国北卡罗来纳州发生大规模枪击... 转自:北京日报客户端当地时间6月1日,美国北卡罗来纳州西部当日凌晨发生一起大规模枪击事件,造成1人死...
粽叶裹温情 海事驻村包“住爱与... 转自:中国水运网5月30日,涪陵区龙潭镇万寿村便民服务中心广场上人头攒动、欢声笑语不断,首届“粽情端...
儿童节安全大作战!网警叔叔教你... 转自:公安部网安局六一国际儿童节,这是属于孩子们的欢乐盛宴,承载着家庭的期待与社会的关怀。在这个充满...
美延长对华豁免期 XBIT护航... (转自:辰珵)美国贸易代表办公室(USTR)突然宣布延长对中国301条款关税的部分豁免期限,原定于5...
镜头 | 东城:粽叶飘香话清廉... 为深入贯彻落实中央八项规定精神,持续纠治“四风”问题,保障风清气正、欢乐祥和的节日氛围,东城区纪委监...
中国航天今年前五个月已完成发射... IT之家 6 月 1 日消息,据央视新闻报道,中国航天今年前五个月已完成发射 32 次、入轨超 14...
百姓看联播丨“医码”通行京津冀 转自:河北新闻网 新新:哎,怎么办呀这事?雅楠:咋了?新...
第一观察丨总书记要求这些事“从... 6月,万物并秀,生机勃发。孩子们迎来属于自己的节日。几天前,“六一”国际儿童节即将到来之际,习近平总...
端午档上新13部影片 转自:天津广播电视台天津北方网讯:端午假期,相继有13部影片登陆大荧幕。  端午节遇上儿童节,这13...
破解A股“上市难”,消费企业扎... 作者 | 《财经》特约撰稿人 胡苗 编辑 | 余乐  消费投资进入低潮有两个主要障碍:一是退出难;二...
美国一州发生大规模枪击事件 据央视新闻消息,当地时间6月1日,美国北卡罗来纳州西部当日凌晨发生一起大规模枪击事件,造成1人死亡、...
IMF 要求巴基斯坦就划拨 2... 据 Samaa News 报道,国际货币基金组织(IMF)对巴基斯坦近期宣布划拨 2000 兆瓦电力...
以国防军:黎以停火以来超180... 转自:北京日报客户端以色列国防军当地时间6月1日下午发布消息称,当天上午,一名黎巴嫩真主党特工在以色...