网易首页 > 网易号 > 正文 申请入驻

日本AI王者,CTO是Transformer之父,刚拿下世界编程竞赛冠军

0
分享至


新智元报道

编辑:艾伦

【新智元导读】在ICFP 2025编程大赛中,日本Sakana AI的「Team Unagi」以人机共创模式夺冠。其AI系统「ShinkaEvolve」通过迭代优化让代码性能提升近十倍,并反向启发人类思维。Sakana AI以自然进化为理念,正开创AI自我进化与人机协作的新范式。

今年的国际编程竞赛ICFP(International Conference on Functional Programming)的冠军队伍名为「Team Unagi」,团队来自日本初创AI研究公司Sakana AI,其中的AI系统不仅帮助他们加速解决方案,更为人类队友带来了全新的解题思路。


ICFP 2025编程大赛高度开放,「任何手段皆可」,鼓励各路奇思妙想和工具(包括AI)自由登场。

Sakana AI团队选择了一条独特的「人机共创」道路。

在这场要求参赛者利用有限线索探索迷宫结构的竞赛中,人类开发者与AI算法并肩作战,谱写了一出科技与智慧交融的精彩戏码。

与此同时,Sakana AI近期将融资1亿美元,估值将达25亿美元。

人类策略遇上瓶颈

AI进化来破局

参赛者需要根据模糊提示,用最少的询问次数勾勒出一个未知迷宫的全貌。


Sakana AI团队起初采用的是一个颇具创意但复杂的方案:将迷宫问题转化为逻辑约束,使用SAT求解器(布尔可满足性问题求解器)来一次性算出符合所有条件的解。

这种策略理论上可以充分利用有限线索,提高解题效率。

然而,正如团队所料,方案的瓶颈也随之而来:SAT求解器的性能高度依赖于问题编码的质量。

编码得当,求解器才能高效工作;编码不佳,再简单的问题也可能算不出结果。

如何设计高效的编码既需要深厚洞见,又免不了反复试错。


逻辑公式的一个示例。SAT问题的目标是找到一个能满足这些公式的变量赋值

尽管队内一位成员精心构造了初始的逻辑公式,仍发现随着迷宫规模增大,求解器耗时呈爆炸式增长,成为制约进度的性能瓶颈。

就在团队绞尽脑汁试图优化代码时,他们把目光投向了自家研发的AI工具——一个名为ShinkaEvolve的进化式代码优化框架。

Shinka在日语中意为「进化」,这个开源框架不负其名:它能够利用大型语言模型(LLM)来不断「进化」代码,以优化算法性能。

Sakana AI团队决定让ShinkaEvolve试一试,替他们来攻克SAT编码的难关。

他们将团队原本用Rust语言编写的迷宫SAT求解代码交给ShinkaEvolve,并设置计算开销(求解器运行时间)为需要最小化的目标函数,让AI自主改进代码。

演化算法遇上生成式AI

ShinkaEvolve的工作原理颇有几分「遗传算法+人工智能教练」的味道。

它先生成一批代码改写候选,对每个候选运行测试评估性能,然后优胜劣汰、融合改进,生成新一代的代码版本,再重复这个循环。


ShinkaEvolve框架示意图

ShinkaEvolve并非盲目地随机修改代码,它由一组大型语言模型共同驱动,相当于给进化算法配备了「AI大脑」,能够基于已有的编程知识与上下文智能地产生有潜力的改进方案。

这种结合了生成式AI和进化式探索的方法,被视为Sakana AI的核心技术灵感之一,让AI从自然进化中汲取灵感,像生物进化那样不断试错,但又借助强大的预训练模型作为「经验指导」,从而大幅提高探索效率。

ShinkaEvolve框架示意图:AI通过迭代试错来进化优化程序代码。左侧由人类提供初始代码和问题评估器,中间AI生成变种代码进行性能测试,右侧不断筛选出更优方案。整套流程如同「人工智能的进化论实验」。

ShinkaEvolve在此次迷宫挑战中的表现堪称一场精彩的进化实验。

根据团队公布的数据,他们让AI对代码进行了约320次迭代尝试,耗费的云端算力成本仅约60美元。

随着每一代代码的演进,求解速度稳步提升,中途还出现了几次「灵感大爆发」式的重大跃升。


每一代的得分都会提升,并且在此过程中可以看到几个显著的突破

最终,AI产出的一版优化代码令性能实现了飞跃式增长:

针对中等规模的迷宫(18个房间),代码运行时间从原来的2.86秒缩短到0.44秒,加速约6.5倍;

而在大型迷宫(24个房间)上,执行时间更是从127秒骤降至13秒,提升近10倍!


这意味着许多原本因耗时过长而「遥不可及」的更大规模问题,如今在可接受的时间内也能解决了。

Sakana AI团队立刻将这份AI优化产物整合进了他们的最终参赛方案里,大幅提高了解题效率和成绩。

Sakana AI团队参赛过程中使用的源代码和Prompt也已开源:

https://github.com/icfpc-unagi/icfpc2025

AI不仅提速

更带来人类未及的创意

性能飙升带来了胜利的希望,而更出乎意料的是,AI在优化过程中学到的「窍门」反过来启发了人类。

团队发现,ShinkaEvolve给代码动的很多「手术」其实都带有深刻洞见。

例如,其中最关键的一项改进涉及迷宫连接关系的表示方式。

原本人类编码直接将「房间A的门1连接房间B的门2」硬编码为约束,而AI却引入了一个巧妙的中间变量,将关系拆分为「两步」:先标记「房间A的门1连接到了房间B」,再进一步细化具体是B的哪扇门。

这个额外的抽象层次让求解器可以先在更高层面决定「哪些房间相连」,再着手处理具体门对门的对应关系,从而大大降低了搜索难度。

这一点石成金的辅助变量策略,本质上是一条具有普适性的建模原则。

团队成员们恍然大悟,甚至在后续解决其他难题时也手动借鉴了同样的思路,可谓AI教学、人类受益。

更重要的是,这次「AI发现→人类领悟」的良性循环绝非昙花一现。

Sakana AI团队总结道,他们成功实践了一种人机协作的新范式:

人类擅长制定整体战略、搭建初始解决方案,而AI则在此框架内进行定向、密集的搜索优化,挖掘出人类可能忽略的改进空间。随后,人类对AI产出的成果进行分析提炼,将其中的洞见融会贯通,再用于新的挑战。

这样的合作关系使得AI不再只是冰冷的工具,而俨然成为科研团队中的一位「头脑风暴」伙伴。

此次ICFP项目的成功正是建立在这种互补互助的模式之上。

它预示着未来解决复杂问题的一种强大范式:人机携手,各展所长。

Sakana AI

从自然中汲取灵感的AI新锐

这场在编程竞赛中的亮眼表现背后,是一家年轻却雄心勃勃的AI研究公司:Sakana AI。

Sakana在日语中意为「」,该公司的Logo正是由一群鱼组成的图案,其中一条红色小鱼逆向游动,象征着勇于打破常规、特立独行。


这个名字和标志背后折射出Sakana AI的技术哲学:从大自然汲取智慧,追求群体智能和进化等自然启示,同时不盲从当下主流,而是大胆探索AI发展的下一程。

Sakana AI于2023年在日本东京创立,短短时间已汇聚了一支星光熠熠的创始团队。

公司由前谷歌大脑研究科学家David HaTransformer架构共同作者Llion Jones前日本首家独角兽Mercari欧洲分部CEO伊藤錬(Ren Ito)联合创立,分别担任CEO、CTO、COO。

David Ha以在谷歌大脑开展前沿创意研究闻名,转投AI之前曾是高盛的交易员;

Llion Jones则是机器学习史上里程碑论文「Attention is All You Need」(Transformer模型)的合著者之一。

Ren Ito也在加入Sakana AI前曾担任Stability AI的COO。

此外,创始团队成员也有来自谷歌DeepMind等机构的资深研究人士。

这样的豪华阵容,加上对理念的坚持,使Sakana AI在成立之初便获得了顶级投资机构的青睐。

2024年初公司宣布完成3000万美元种子轮融资,由美国硅谷的Lux Capital和Khosla Ventures领投,多家日本本土巨头企业也参与其中。

而公司的A轮融资达约2亿美元,股东中包括英伟达,并官宣与英伟达的合作。

目前,Sakana AI的估值约15亿美元。

显然,资本市场也在寄望这支「AI鲶鱼」来搅动行业风潮。


技术愿景:进化智能,开拓AI新范式

Sakana AI的愿景可用一句话概括:以自然为师,开创AI新范式。

与当下诸多公司热衷于追逐超大规模Transformer模型不同,Sakana AI立志开发的是从自然机制中获得启发的新型基础模型。

正如其投资方所评价的那样:

如今大多数AI团队还在沿用昨天的Transformer架构,拼命扩大参数规模,而Sakana AI已经在探索进化和复杂自适应系统启发的下一代基础模型。

Sakana AI的研究范式强调「开放式进化」和「持续自我改进」。

他们希望构建出的AI系统不再像传统模型那样训练完毕就固化不变,而是能像生物一样在运行中不断学习、优化,甚至改写自身代码,实现无终止的进化。

这一理念听起来近乎科幻,却有坚实的学术根基可循。

早在上世纪,AI研究者就提出过能自我修改代码、不断学习提高的「哥德尔机」(一种理论上的自我完善AI)构想。

不过哥德尔机要求AI在改自己代码前能证明这一定会带来优化,实操上难以实现。

Sakana AI的团队则另辟蹊径,与学界合作提出了一个更可行的框架,巧妙地引入「达尔文式进化」的思路:让AI不停尝试修改自身,通过实验验证哪些改动能提升性能,然后保留优胜劣汰,周而复始地自我强化。

这一系统称为「达尔文-哥德尔机」(Darwin Gödel Machine,DGM),团队在技术报告中展示了其雏形:一个能改进自身代码的编程智能体。


https://arxiv.org/abs/2505.22954

DGM利用预训练的基础模型来提议代码改进,再通过开放式的进化算法在庞大的程序版本库中搜索更优解。

实验结果表明,这种AI算力越充足就越聪明,性能随着自我改写次数的增加不断提升,甚至超越了由人类手工设计的传统算法。

可以看出,无论是此次ICFP竞赛中的ShinkaEvolve,还是「达尔文-哥德尔机」概念,Sakana AI始终围绕着一个核心理念在探索:让AI像生命体一样进化。

这种范式突破了经典AI的桎梏,将生成式AI的强大直觉与进化算法的求异探索结合起来,使AI能够自行发现更优的解决方案。

正因如此,Sakana AI的研究更像是在模拟「人工界的自然进化」,充满了开创性和想象力。

提出DGM的论文两位共同一作是UBC在读博士张卓婷胡圣然


胡胜然是南方科技大学计算机专业2021届毕业生。


另一位作者是谷歌DeepMind陆聪,参与了Genie 3的研发。

他是牛津大学计算机博士,之前在UBC做博士后。


进化式AI的崛起

Sakana AI在ICFP 2025上的夺冠预示着进化式AI与自动编程的巨大潜能。

第一,这次「人机协同」破题的案例证明了生成式AI可以成为人类程序员的放大器:AI并非简单取代开发者,而是担当探索者和助手的角色,帮助人类突破瓶颈。

在生成式AI浪潮席卷编程领域的当下,大多数代码生成工具还只能充当听话的「代码翻译」或「自动补全」工具,而Sakana AI展示了一种更新颖的模式——让AI主动出击、反复试验,去改良和优化人类编写的代码。

这类似于软件开发中的重构过程由AI来自动执行,而且AI还能从中总结出优化规律反馈给人类,实现了双向的知识流动。

第二,Sakana AI的ICFP项目凸显了进化算法在AI时代的重生。

曾几何时,进化算法和遗传编程是在AI早期就提出的概念,但随着机器学习(特别是深度学习)的崛起,这类基于随机试错和自然选择的方法一度淡出了主流视野。

然而,如今借助强大的算力和预训练模型,进化方法正焕发新生。它不再是低效的盲目搜索,而成了可以结合模型智慧的智能探索。

通过大量快速的迭代,AI能够在复杂的解空间中找到人类直觉未曾涉足的解决方案。

正如Sakana AI团队所总结的,这种人机分工模式让AI承担了高强度的搜索优化工作,人类则专注宏观策略和结果判断,最终效果远超单打独斗。

第三,这一成果对自动编程领域也是一剂强心针。

自动编程一直是AI研究的圣杯之一。

而Sakana AI的实践表明,我们离这个目标又近了一步:借由演化式的反复完善,AI已经能在特定任务上显著优化代码性能,甚至自主发现新的算法思路。

这暗示着未来的软件开发可能将发生范式转变,程序不再仅仅由人类一次性编写完毕,而是由人类与AI共同演化而来。

开发者或许更像园丁,培育和引导AI代码的生长;

AI则如同茁壮成长的「数字生物」,在不断迭代中进化出更优雅高效的代码。

当我们回望这次ICFP夺冠历程,可以说Sakana AI用一次精彩的实战为业界上了一课:AI的潜力不止于模仿人类智能,它还能与人类协作,共同创造出远超各自单独能力的成果。

从自然进化中获得灵感的「Sakana模式」,为生成式AI和自动编程指明了一条新路。

或许在不久的将来,我们将看到更多「AI+人类」协作的创新场景:从难题攻关、软件优化,到科研探索、工程设计。

当AI学会了进化和自我改进,整个人工智能产业也将随之迈入一个充满生机与变革的新纪元。

正如Sakana AI那条逆流而上的红色小鱼所寓意的,真正的变革往往源自那些敢于另辟蹊径的探索者。

Sakana AI和他们的ICFP项目,正在用实践证明,进化的力量,足以开创AI的下一段传奇。

参考资料:

https://sakana.ai/icfp-2025/

https://github.com/icfpc-unagi/icfpc2025

https://icfpcontest2025.github.io/

https://arxiv.org/abs/2509.19349

https://arxiv.org/abs/2505.22954

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
神舟二十号最新消息显示:飞船遭撞击问题不大,或仍用该飞船返回

神舟二十号最新消息显示:飞船遭撞击问题不大,或仍用该飞船返回

科普大世界
2025-11-11 16:30:58
优酷的会员数跌破一亿,不是因为没剧,而是没人愿意为平庸买单了

优酷的会员数跌破一亿,不是因为没剧,而是没人愿意为平庸买单了

现代春秋
2025-11-10 15:40:04
录音事件升级!警方通报秦雯袭警事件,又有录音曝光,有人要凉了

录音事件升级!警方通报秦雯袭警事件,又有录音曝光,有人要凉了

叨唠
2025-11-11 21:53:58
争议!全运会王曼昱4-3险胜,不和谐一幕:球迷一边倒加油至破音

争议!全运会王曼昱4-3险胜,不和谐一幕:球迷一边倒加油至破音

大秦壁虎白话体育
2025-11-11 18:00:45
汉堡王也卖了,外资巨头怎么了?

汉堡王也卖了,外资巨头怎么了?

中产先生
2025-11-11 12:23:39
连美驻日大使都出动了,薛剑总领事遭围攻,若被驱逐必对等回应

连美驻日大使都出动了,薛剑总领事遭围攻,若被驱逐必对等回应

潮鹿逐梦
2025-11-11 16:17:12
赵鸿刚参加扇耳光大赛后公布病历 医生:完全恢复已不可能

赵鸿刚参加扇耳光大赛后公布病历 医生:完全恢复已不可能

看看新闻Knews
2025-11-11 13:52:04
留给赖清德时间不多了!大陆巷战演习,繁体字一出,台媒舆论大变

留给赖清德时间不多了!大陆巷战演习,繁体字一出,台媒舆论大变

时时有聊
2025-11-11 20:55:04
湖南人民医院事件后续,偷拍者身份已曝光,曾医生有口难辩

湖南人民医院事件后续,偷拍者身份已曝光,曾医生有口难辩

平老师666
2025-11-10 23:42:34
欧委会要求欧盟成员排除中兴、华为设备,外交部:损人不利己

欧委会要求欧盟成员排除中兴、华为设备,外交部:损人不利己

澎湃新闻
2025-11-11 15:38:26
外卖大战太惨了:阿里亏360亿、美团亏200亿,拉低中国互联网盈利三成?

外卖大战太惨了:阿里亏360亿、美团亏200亿,拉低中国互联网盈利三成?

开柒
2025-11-11 18:30:46
中国银行等多家银行宣布将关停部分App

中国银行等多家银行宣布将关停部分App

每日经济新闻
2025-11-11 08:36:48
集中开展一次大排查、深挖背后腐败问题!省委书记部署,聚焦这一重要工作

集中开展一次大排查、深挖背后腐败问题!省委书记部署,聚焦这一重要工作

政知新媒体
2025-11-11 22:10:54
南京大学历史学院研究生教务员徐明娟病逝,年仅41岁

南京大学历史学院研究生教务员徐明娟病逝,年仅41岁

澎湃新闻
2025-11-11 20:54:29
一年狂飙21万公里,电池仅衰减5%,小米SU7车主刷新了科学

一年狂飙21万公里,电池仅衰减5%,小米SU7车主刷新了科学

木蹊说
2025-11-11 16:06:19
全运男篮第一合同没了!周琦600万包含夺冠奖金 最低目标为第三名

全运男篮第一合同没了!周琦600万包含夺冠奖金 最低目标为第三名

狼叔评论
2025-11-11 20:14:04
古二打脸警方通报,直接曝出新录音,捞人者的背景和名字均已公开

古二打脸警方通报,直接曝出新录音,捞人者的背景和名字均已公开

芊手若
2025-11-11 17:56:30
赖清德喊话韩国瑜声援沈伯洋,蓝营回呛:关他什么事

赖清德喊话韩国瑜声援沈伯洋,蓝营回呛:关他什么事

海峡导报社
2025-11-11 21:31:02
专家解读“阿坝红旗桥因边坡滑坡垮塌”:桥梁建设选址前会进行充分地质勘察,此类事故不常见

专家解读“阿坝红旗桥因边坡滑坡垮塌”:桥梁建设选址前会进行充分地质勘察,此类事故不常见

极目新闻
2025-11-11 21:46:04
央视网揭"远洋捕捞"实质:地方政府没钱了,抓商人搞钱

央视网揭"远洋捕捞"实质:地方政府没钱了,抓商人搞钱

爆角追踪
2025-11-11 12:15:25
2025-11-12 04:23:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13845文章数 66242关注度
往期回顾 全部

科技要闻

苹果新品惨败,产线拆光、二代搁浅!

头条要闻

携6.1万枚比特币出逃英国 富婆奢靡生活披露

头条要闻

携6.1万枚比特币出逃英国 富婆奢靡生活披露

体育要闻

一个14岁的小男孩,决定了谁能晋级世界杯

娱乐要闻

古二曝秦雯多次炫耀袭警经历

财经要闻

南昌三瑞智能IPO:委外代工模式存疑

汽车要闻

盈利"大考",汽车智能化企业的中场战事

态度原创

健康
艺术
教育
本地
家居

超声探头会加重受伤情况吗?

艺术要闻

美得令人窒息!印度美女照片震撼上线!

教育要闻

老师们不奢望减轻什么负担,只希望能实行8小时工作制!

本地新闻

云游安徽 | 凌滩玉魄淬千年,诗意钢城马鞍山

家居要闻

国美学子 打造筑梦空间

无障碍浏览 进入关怀版