网易首页 > 网易号 > 正文 申请入驻

AI 什么时候才算能用?3 亿估值团队给出两个字:“验收”

0
分享至

全文 3,000字 | 阅读约 8 分钟


(对话 Axiom Math 创始人:AI 最重要的品质)

2025 年,几乎每一场 AI 发布会都在说“我们能做什么”。

但企业真正卡住的,是另一个问题:AI 做出来的结果,怎么证明是对的?

很多 AI 产品上线前 demo 演示得很好,一上线就出问题:

错误定位不了,

责任追不清楚,

结果复现不了。

最后只能说:没法验收。

Axiom Math,一家总部在旧金山的 AI 初创公司,换了个思路:不是追求 AI 能做什么,而是证明它做对了什么。

这家刚在 2025 年 10 月完成种子轮融资(6400 万美元,估值 3 亿美元,B Capital 领投)的公司,在做一个 AI 数学家,能独立给出答案,也能自己验证对错

也因此,这个团队吸引了一批技术背景极深的人: Meta FAIR、Google Brain的前核心研究员, 还有创始人Carina Hong 在 MIT 的导师、知名数学家Ken Ono。

Carina Hong,24岁。

2025 年 12 月 21日,有媒体问她如何招人,她的回答很简单:

问题够难,人自然会聚过来。

这不是空话。她的方法就是找到一个值得花十年去解的难题,然后等那些真正的高手主动找上门。

24 岁,6400 万美元,估值 3 亿。

她在赌的不是一个产品,而是 AI 的下一个及格线。

第一节|24岁,3亿估值,她要让 AI 学会自证

她叫 Carina Hong,出生在广州。

小时候做奥数题的时候,她并不知道未来会站在硅谷讲 AI。但她记得,每解决一道题,就像小孩通关游戏,停不下来。

她一路从广州考到MIT,再拿到罗德奖去牛津学神经科学, 最后跑去斯坦福读数学博士+法学博士联合项目。

在MIT,她修了 20 门研究生数学课程,发表了9篇论文,还研究过神经网络如何理解函数。在牛津,她待在UCL盖茨比研究所(DeepMind 的诞生地),第一次近距离看到 AI 在解决真实问题:图像、序列、控制模型。

她开始问自己:如果 AI 能玩游戏、能写代码,为什么不能做数学?

真正的转折发生在硅谷。

她在斯坦福念博时,常去一家咖啡馆写论文。 一次偶然的机会,她认识了 Meta FAIR团队的 AI 科学家Shubho Sengupta。

一个是数学家,想让 AI 理解数学。

一个是工程师,想找到 AI 真正值得解决的问题。

他们聊了两个小时,没谈项目,也没讲融资。只是围绕一个假设展开:能不能造一个AI 数学家?

那次对话之后,她开始认真思考这件事。不久后,她退学了。

她说:有些问题,在学校解决太慢了。

她要做的,不是聊天机器人,也不是代码助手,而是一个能验证定理、甚至提出新猜想的 AI 系统。

这个系统叫 Axiom,公理的意思,也就是数学理论最基本的起点。

从这个起点出发,开发一整套系统,让 AI 也能探索数学的边界。

第二节|Putnam考试9/12,但重点不是分数

大多数人理解 AI 学数学,想到的可能是考试、给答案。

但 Carina说,那只是第一步。真正重要的,是它知不知道自己答得对不对。

这不仅是数学问题,也是工程问题。 AI 的答案如果不能被验证,就没法用在关键场景。

人类做数学题,有个天然优势:我们能回头检查, 证明有没有逻辑漏洞,推理有没有跳步,细节前后一不一致。

Carina 把这个检查的过程,叫做“验收”。

但大模型不行。

它们会生成很多内容,却很难自己确认这些内容是不是对的。尤其在数学里,哪怕多一个字母出错,整个结论就不成立。

要解决这个问题,就要靠形式化语言。

Carina 的团队用的是一种叫 Lean 的数学编程语言。 所有的公式、步骤、证明,必须像程序一样写清楚,而且要能被机器验证通过。

这意味着,不是 AI 说对就对,而是它每走一步都要留下可检查的痕迹,最后像软件测试一样通过验证。

为了证明这套方法可行,他们做了个测试。

2025 年 12月,美国 Putnam 数学竞赛刚结束,这是全美最难的本科生数学竞赛,参赛者约 4000 人。Carina 团队在 X 上发布结果:AxiomProver 自主解决了其中 9 道题,在 Lean 语言中给出形式化证明,并全部通过了验证。

这不仅仅是做对了 9 题,而是 AI 自己做题、自己检查、自己确认通过。

Carina 说:

“我们不是追求一个能抄答案的 AI,而是一个能完成所有数学细节的合作者。”

验收的真正含义是什么?

就是 AI 不仅要给出答案,还要证明答案是对的。

在芯片设计、科学研究、金融系统这些容错率低的场景里,模糊的答案没有任何价值。AI 得能给出过程、解释思路、接受检查。

能被验收,才意味着能被信任。

第三节|Meta、Google的人为什么离职来这里

要做到这一点,需要什么样的团队?

这个团队不大,现在也只有 17 人,但每一个加入的人,都是各自领域的顶尖研究者。

CTO Shubho Sengupta,是 Carina 在斯坦福附近的咖啡馆偶遇的。 他原本在Meta FAIR,带队开发过OpenGo和CrypTen,也参与过早期的CUDA GPU架构。他知道大模型的问题,也知道数学领域为什么难。

但在大公司,目标太分散。他想找一个地方,专注解决一个极限难题。

另一位核心成员 François Charton,早在 2019 年就在研究怎么用 Transformer解决积分问题。他不放过任何一个细节,不看大模型能写出多少,而是看它会不会走错哪一步。

还有Hugh Leather,做的是深度学习与编译器的结合。 他不是传统意义上的数学家,但在用代码表达复杂逻辑上,他有深厚的积累。

他们都从 Meta、Google 这样的地方走出来,放弃了更稳定的研究路径。

Carina 提供的不是职位,而是一种愿景: 用 AI 做出可验证的数学成果,每一步清晰,每个结论都能站得住。

而这个愿景吸引来的,不只是业界的 AI 研究员。

2025 年 12 月初,57 岁的数学家 Ken Ono 也辞掉了弗吉尼亚大学的终身教职,全职加入 Axiom 。

他曾是 Carina 的导师,领导过多个数学奥林匹克研究项目,是拉马努金理论的专家,也上过超级碗的广告,是个把数论带进大众文化的人。

他说,作为纯数学家,他很少有机会参与改变世界的事。 这一次,他不想错过,带着家人搬到硅谷, 成了 Axiom 的第15位成员, 身份是创始数学家。

他的任务不是写代码, 而是设计难题,测试模型推理的极限。

Carina 说,这些人之所以愿意来,并不是为了赶热潮,而是想做一件真正值得做的事

“我们不是在做一个产品,是在定义一套新标准:每个公式都可检查,每道推理过程都可追溯。AI 不是生成一个答案,而是展示完整的思考过程。”

这就是他们 17 个人正在做的事。

第四节|不是解题,而是教 AI 提问

定义新标准,只是 Carina 的第一步。

她真正想做的,是让 AI 学会发现问题本身。

他们最近在研究一个数学界著名的未解难题:Collatz 猜想。 这个问题简单得像小学生游戏,却困住了研究者几十年。

Axiom 的研究员用 Transformer 模型去学这个问题, 模型没能直接给出证明, 但展现出了另一种能力:

它在预测 Collatz 序列时,对万亿级数字的准确率达到了99.8%。

更重要的是,它为什么错、错在哪,都能被清楚地解释。这些错误背后有明确的规律,而不是随机的幻觉。

这意味着什么?

意味着 AI 不是在记忆答案,而是在学习数学思维。

在 Carina 看来,他们不是让 AI 找已知答案,而是训练它像一个真正的数学家一样去思考,去探索。

她所说的探索,主要分成三个阶段:

  • 第一步,用形式语言表达定理,模仿已有的逻辑结构。

  • 第二步,验证旧问题的不同解法,提出新的证明路线。

  • 第三步,提出新猜想,创造从未出现过的问题并给出数学依据。

整个过程,不是 ChatGPT 式的随机对话,而是在证明空间里有规则地探索,不断尝试,直到找到新的路径。

这种探索为什么重要?

因为数学是人类最严密的语言,也是现实世界运转的底层逻辑。每一个数学突破,都可能带来这些领域的飞跃。

Carina 相信,数学研究曾经以十年一进展的速度运行, 现在 AI 可以把这个周期缩短到几个月。

而 AI 数学家未来能做的,不只是解题,更是和人一起重新定义问题本身。

这不只是数学领域的事。无论是密码学、芯片结构、物理建模,背后都依赖于能被精确描述与检验的数学原理。一旦 AI 能做到可验证,它就能从“只能试试看”的辅助工具,变成“可以放心用”的合作者。

这,正是 Carina 在押注的那条线:

AI 的下一个及格线,不是能力,是可信度。

结语|能被验收的,才叫AI

Carina 的想法很简单。

她只给出一个判断标准:AI 说得对不对,不是看有没有人信,而是看它能不能自己交代清楚。

Axiom Math 在做的,就是让 AI 必须讲明白。 不是让模型更像人,而是让它能被信任。

真正能用的 AI,不靠 Demo,靠验收。

这个标准一旦成立,AI 走进科研、金融、芯片、法律,才算真正开始。

而她,只是把这扇门推开了一点点。

识自AI

本文由AI深度研究院出品,内容基于Carina Hong公开采访视频翻译整理,并结合公开报道进行分析解读。翻译力求准确传达原意,分析内容为编辑部观点。未经授权,不得转载。

星标公众号, 点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标

https://www.youtube.com/watch?v=b_UMhn8E8lI&t=264s

https://e.vnexpress.net/news/tech/personalities/building-math-ai-startup-how-24-year-old-stanford-dropout-carina-hong-is-attracting-big-tech-talent-4993367.html

https://www.businessinsider.com/axiom-math-stanford-dropout-meta-ai-researchers-startup-2025-12

https://www.turingpost.com/p/carina

来源:官方媒体/网络新闻,

排版:Atlas

编辑:深思

主编:图灵

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
没想到,会拉胯成这样...

没想到,会拉胯成这样...

燕梳楼频道
2025-12-30 21:10:43
罗永浩科技春晚迟到50分钟后现身,200多万网友在线围观,本人发声:出现了一些状况,后续会解释

罗永浩科技春晚迟到50分钟后现身,200多万网友在线围观,本人发声:出现了一些状况,后续会解释

极目新闻
2025-12-30 20:28:55
买来的出口数据:耗费地方财政,对经济无实质带动

买来的出口数据:耗费地方财政,对经济无实质带动

第一财经资讯
2025-12-29 13:24:09
被军演逼急了,台当局送大陆6个字,美日的反应果然如我们所料

被军演逼急了,台当局送大陆6个字,美日的反应果然如我们所料

千里持剑
2025-12-29 12:10:42
凌晨3点屏东以南发生激烈对峙,052D不顾阻扰,强行压向台护卫舰

凌晨3点屏东以南发生激烈对峙,052D不顾阻扰,强行压向台护卫舰

闻识
2025-12-30 13:32:14
杭州一女游客就餐时遭男子言语骚扰,警方通报

杭州一女游客就餐时遭男子言语骚扰,警方通报

界面新闻
2025-12-30 20:10:45
普京揪出身边最大“内鬼”,原来总理是敌方间谍,给中方敲响警钟

普京揪出身边最大“内鬼”,原来总理是敌方间谍,给中方敲响警钟

花花娱界
2025-12-29 20:25:38
美女老板跑路!删光所有视频 承诺永州夺冠就送车 铁了心反悔耍赖

美女老板跑路!删光所有视频 承诺永州夺冠就送车 铁了心反悔耍赖

念洲
2025-12-30 20:21:50
翻脸比翻书快!泽连斯基突然通知中国,准备迎接乌克兰的最新制裁

翻脸比翻书快!泽连斯基突然通知中国,准备迎接乌克兰的最新制裁

小莜读史
2025-12-30 16:33:33
致7学生死亡,付某某、朱某某被执行死刑

致7学生死亡,付某某、朱某某被执行死刑

中国新闻周刊
2025-12-30 18:40:22
林俊杰女友被扒了!父亲涉经济案卷款13亿,本人还给赌场发广告

林俊杰女友被扒了!父亲涉经济案卷款13亿,本人还给赌场发广告

萌神木木
2025-12-30 15:42:56
成龙新片口碑大爆,演技被称赞,有望成金像奖影帝,票房剑指20亿

成龙新片口碑大爆,演技被称赞,有望成金像奖影帝,票房剑指20亿

影视高原说
2025-12-30 14:19:26
窦文涛《圆桌派》不嫌丢人吗

窦文涛《圆桌派》不嫌丢人吗

智识漂流
2025-12-30 18:31:38
永州美女老板彻底拒绝送车!悄悄清空社媒+删除承诺 球迷:不要脸

永州美女老板彻底拒绝送车!悄悄清空社媒+删除承诺 球迷:不要脸

风过乡
2025-12-30 20:54:18
6国宣布出兵!中方不低头也得低?扬言和中方斗到底 咱妈动真格了

6国宣布出兵!中方不低头也得低?扬言和中方斗到底 咱妈动真格了

花花娱界
2025-12-30 20:11:35
12月30日俄乌:精心包装的谎言,远比不上泽连斯基的睿智

12月30日俄乌:精心包装的谎言,远比不上泽连斯基的睿智

山河路口
2025-12-30 17:48:08
高市早苗“吓傻了”,我国正式宣布这一决定!网友:早该这样了

高市早苗“吓傻了”,我国正式宣布这一决定!网友:早该这样了

瞳哥视界
2025-12-30 20:19:20
这次庾澄庆的爆料,没给王菲留一丝体面,难怪李亚鹏选择和她离婚

这次庾澄庆的爆料,没给王菲留一丝体面,难怪李亚鹏选择和她离婚

白面书誏
2025-12-30 17:03:48
36岁网红“卡车西施”雪天行车不幸遇难!家里有植物人父亲和两孩

36岁网红“卡车西施”雪天行车不幸遇难!家里有植物人父亲和两孩

火山詩话
2025-12-30 13:28:04
2026央视跨年晚会正式官宣!最被期待明星排名出炉,周深仅排第4

2026央视跨年晚会正式官宣!最被期待明星排名出炉,周深仅排第4

洲洲影视娱评
2025-12-30 17:11:13
2025-12-31 03:40:49
AI深度研究员 incentive-icons
AI深度研究员
AI时代刚刚到来,一切才刚开始,我们正当其时!
346文章数 158关注度
往期回顾 全部

科技要闻

估值150亿的智元,开始批量"制造"小独角兽

头条要闻

轰-6K飞行员:已到达任务空域导弹准备完毕 可以发射

头条要闻

轰-6K飞行员:已到达任务空域导弹准备完毕 可以发射

体育要闻

联盟第一人倒下了!掘金还有底牌吗?

娱乐要闻

林俊杰女友被扒 父亲涉经济案卷款13亿?

财经要闻

朱光耀:美关税政策正使WTO名存实亡

汽车要闻

标配华为乾崑ADS 4 Pro 华境S明年上半年上市

态度原创

艺术
家居
教育
本地
公开课

艺术要闻

惊艳世界的她,不仅美丽无双,更用实力颠覆传统!

家居要闻

当归之宅 三胎圆满居所

教育要闻

初中三年,哪一步错都不行

本地新闻

即将过去的2025年,对重庆的影响竟然如此深远

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版