网易首页 > 网易号 > 正文 申请入驻

DeepMind首个猜想库开源,获陶哲轩力挺!

0
分享至

新智元报道

编辑:桃子

【新智元导读】谷歌DeepMind重磅出击,开源首个形式化数学猜想库,获陶哲轩力挺!从解析数论的兰道猜想开始,这个开源项目将为AI破解数学难题的未来铺路。

形式化猜想,再次获陶哲轩认可!

最近,谷歌DeepMind正式开源了「形式化猜想」GitHub项目,在业内引发巨大的反响。

项目地址:https://github.com/google-deepmind/formal-conjectures

尤其是,一直以来对此关注度最高的菲尔兹奖得主陶哲轩,发长文进行了点评。

这一公开数据库将数学猜想用形式化语言重新表述,让AI工具能读懂并尝试解决这些问题。

目前,这个库已经收录了一些重量级猜想,比如解析数论中的4个「兰道猜想」Landau problem)。

更激动人心的是,DeepMind正向全球数学家和研究者征集更多猜想,让这个库成为一个不断扩展的「数学宝库」。

陶哲轩:AI攻克数学猜想第一步

你可能好奇,为什么不直接让AI去解决数学问题,非要搞什么「形式化」?

这里有个关键点:数学猜想通常是用自然语言描述,对人来说很直观,但对计算机来说却像「天书」。

陶哲轩表示,「提出一个数学猜想容易,证明它却难如登天」。

若想借助自动化工具在这些问题上取得进展,建立一种标准化的表述形式是关键的第一步。

如果直接让AI去处理这些模糊的表述,它很可能只是在技术细节上「钻空子」。

举个栗子,AI可能构造出一个正式陈述,但其包含了一个原本并非意图中的边界情况,如把关键参数设为零,绕过真正的问题,从而给出一个看似正确但毫无意义的答案。

形式化的意义,就在于把这些模糊的表述变成「精确无误」的数学语言。

只有这样,AI才能真正理解问题,尝试给出有意义的解答。DeepMind的这个库,就是为AI提供这样的「标准答案模板」。

接下来,一起看看这个库中都有哪些要点。

数学猜想库上线,破解世纪难题钥匙

GitHub项目主页中介绍,形式化猜想——一份使用mathlib在Lean中形式化表述的猜想集合。

目标

尽管包含证明的形式化定理库日益增长,但仅陈述形式化的开放猜想仍十分匮乏。填补这一空白将具有多重意义:

• 为自动定理证明器和形式化工具提供优质基准测试集

• 通过形式化澄清猜想的精确含义

• 通过突显缺失定义,促进mathlib的扩展

形式化准确性

无证明的数学陈述形式化具有固有挑战性,原始猜想的微妙之处可能在形式化表述中失真。为缓解该问题,DeepMind将采取两项措施:

1 对贡献内容进行严格人工审核

2 定期使用AlphaProof识别潜在错误形式化

如何参与贡献

DeepMind在此诚邀各方大佬前来贡献,每个人可添加最喜爱的猜想(或创建issue描述)。

贡献方式

本仓库接受多种形式的贡献:

1. 新增问题形式化

不同于千禧难题、斯梅尔问题列表等传统猜想集,本仓库鼓励多元来源的贡献,包括但不限于:

· 数学教材

· 研究论文(含arXiv预印本)

· MathOverflow提问

· 专题问题集(如埃尔德什问题、维基百科未解决问题列表、苏格兰咖啡馆问题集等)

2. 提交形式化需求,创建issue时请提供:

· 可靠参考文献链接

· 精确的非形式化猜想陈述

3. 完善现有内容

· 补充参考文献指针

· 增加AMS数学主题分类标签

4. 修正错误形式化

提交PR修复错误或创建issue指正问题

用法、结构与特性

这是一个基于lake管理、依赖mathlib的Lean 4项目。使用前需安装:

1. elan + lake + Lean

2.(可选)VSCode及相关插件

初始化命令:

lake exe cache get
lake build

目录结构

按猜想来源类型组织,包含两个特殊目录:

·Util/:存放工具组件• 分类属性标签系统•answer()elaborator• 代码检查器

·ForMathlib/:可向上游提交至mathlib的代码(遵循mathlib目录结构)

核心特性

1. 分类属性标签

用于标记问题陈述的类别,当前支持:

·research open:学界未解决的数学问题

·research solved:学界已公认解决的问题(不要求形式化证明)

·graduate:研究生级别问题

·undergraduate:本科级别问题

·high_school:中学级别问题

·API:围绕新定义的基础理论构建

·test:用于测试定义的「单元测试」

使用示例:

@[category research open]
theorem foo : Transcendental ℚ (rexp 1 + π) := by sorry
@[category research solved]
theorem bar : FermatLastTheorem := by sorry

2. AMS数学主题标签

采用AMS MSC2020主分类号标注数学领域,例如:

@[AMS 11] -- "数论"分类
theorem flt : FermatLastTheorem := by sorry

• 在Lean文件中可用#AMS命令查看所有可选值

• VSCode中悬停标签可显示对应学科

• 支持多标签组合:@[AMS foo bar]

3.answer()elaborator

用于需用户提供答案的开放问题(如Hadwiger-Nelson问题):

@[category research open]
theorem HadwigerNelsonProblem :
    IsLeast {n : ℕ | ExistsColoring n} answer(sorry) := by sorry

重要说明

· 在answer()中提供项及证明不意味问题已解决

· 答案的数学意义评估不在本仓库范畴内

风格规范

1. 文件组织

· 每个问题独立成文件(变体与特例可合并)

· 维基百科来源的问题应置于FormalConjectures/Wikipedia/

2. 定义与API

· 允许自定义定义(需有助于阐明问题)

· 鼓励为定义提供基础API以验证行为

3. 陈述格式

· 基准问题使用theorem声明

· 测试用例优先使用example

· 必须包含至少一个AMS标签

5. 问题转译

· 英语疑问句形式:

/-- 原文:"Does P hold ?" -/
theorem myConjecture : P ↔ answer(sorry) := by sorry

· 已解决问题替换为answer(True/False)

· 非疑问句形式:

/-- 原文:"P holds" -/
theorem myConjecture : P := by sorry

· 反例情况应陈述为¬ P

版本

· 跟踪mathlib月度发布版本(而非master分支)

· 若问题需mathlib未收录的定义,可暂存于ForMathlib/目录

参考资料:

https://mathstodon.xyz/@tao/114586574834318736

GitHub - google-deepmind/formal-conjectures: A collection of formalized statements of conjectures in

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
哈登版骑士首败:雷霆的冠军课

哈登版骑士首败:雷霆的冠军课

张佳玮写字的地方
2026-02-23 09:04:59
沉迷情色的美国跨性别男子,枪杀了前妻、长子

沉迷情色的美国跨性别男子,枪杀了前妻、长子

中国新闻周刊
2026-02-23 18:16:39
融创房地产集团杭州项目破产

融创房地产集团杭州项目破产

地产微资讯
2026-02-22 21:07:38
相当糟糕,森林狼主帅对兰德尔的伤情做出“相当严重”的解释

相当糟糕,森林狼主帅对兰德尔的伤情做出“相当严重”的解释

好火子
2026-02-24 01:01:40
你最爽的经历是什么?网友:约过一个比我大好几岁的姐姐

你最爽的经历是什么?网友:约过一个比我大好几岁的姐姐

带你感受人间冷暖
2026-02-16 01:10:39
奇观!英超三大豪门积分相同,静等曼联,4队争3个欧冠名额

奇观!英超三大豪门积分相同,静等曼联,4队争3个欧冠名额

嗨皮看球
2026-02-23 15:56:20
让春晚导演给全国道歉,入美国籍回中国捞金,她到底有什么来头?

让春晚导演给全国道歉,入美国籍回中国捞金,她到底有什么来头?

顾史
2026-01-20 15:03:39
澳大利亚军舰穿越台湾海峡,台军“广播驱离”,解放军用11字回应

澳大利亚军舰穿越台湾海峡,台军“广播驱离”,解放军用11字回应

钦点历史
2026-02-23 19:50:16
2026独生子女父母奖励已启动,申领条件与流程全说明

2026独生子女父母奖励已启动,申领条件与流程全说明

趣味萌宠的日常
2026-02-23 22:44:17
发不出工资了,这3个行业的人要趁早做打算

发不出工资了,这3个行业的人要趁早做打算

复转这些年
2026-01-19 23:12:25
房子够住14亿人两遍,为何年轻人却买不起?中国房地产30年真相

房子够住14亿人两遍,为何年轻人却买不起?中国房地产30年真相

流苏晚晴
2026-02-11 18:25:16
欧洲小偷,都传疯了,达成了一个行业共识,中国人的钱包,随便拿

欧洲小偷,都传疯了,达成了一个行业共识,中国人的钱包,随便拿

西楼知趣杂谈
2026-02-14 18:35:51
梅西在美待遇曝光:年薪超6000万美元 持有俱乐部35%股份

梅西在美待遇曝光:年薪超6000万美元 持有俱乐部35%股份

星耀国际足坛
2026-02-23 22:00:21
2014年,北京女博士李香蓉因接受不了新郎身份,在车内将其几刀刺死

2014年,北京女博士李香蓉因接受不了新郎身份,在车内将其几刀刺死

红豆讲堂
2024-10-14 15:30:03
陆正耀预制菜大败局:瑞幸神话,为何在舌尖英雄彻底崩盘?

陆正耀预制菜大败局:瑞幸神话,为何在舌尖英雄彻底崩盘?

流苏晚晴
2026-02-23 12:16:16
中央明确!退休新规实施后,公务员及事业编制,不能延迟退休吗?

中央明确!退休新规实施后,公务员及事业编制,不能延迟退休吗?

另子维爱读史
2026-02-08 21:13:03
外国人感叹中国日常生活的奢侈,纷纷表示想留下!

外国人感叹中国日常生活的奢侈,纷纷表示想留下!

特约前排观众
2026-02-24 00:05:07
周扬青旗袍 “好大好圆”,小猪当年吃的太好了

周扬青旗袍 “好大好圆”,小猪当年吃的太好了

飛娱日记
2026-02-22 07:53:48
中日关系再变,13年来日本首次被拒,高市不服:当众喊出1个名字

中日关系再变,13年来日本首次被拒,高市不服:当众喊出1个名字

历史求知所
2026-01-08 14:59:21
两性关系:女人可以让你搂、让你亲,但别全信她说的话

两性关系:女人可以让你搂、让你亲,但别全信她说的话

青苹果sht
2026-02-13 06:20:11
2026-02-24 03:51:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14577文章数 66635关注度
往期回顾 全部

科技要闻

智谱、MiniMax合计蒸发近千亿市值,为何?

头条要闻

墨西哥最大毒枭被击毙:喜欢杀人灭门 几乎没人看见过他

头条要闻

墨西哥最大毒枭被击毙:喜欢杀人灭门 几乎没人看见过他

体育要闻

哈登版骑士首败:雷霆的冠军课

娱乐要闻

那艺娜账号被禁止关注,视频已清空!

财经要闻

美国海关将停止征收被裁定违法的关税

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

房产
数码
艺术
旅游
公开课

房产要闻

窗前即地标!独占三亚湾C位 自贸港总裁行宫亮相

数码要闻

PC鲜辣报:显卡显存回归8GB配置,微星推芙丽莲联名显卡

艺术要闻

十大名家画春,送给春天的你!

旅游要闻

文化中国行|在祖国最北的地方 过温暖团圆年

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版