网易首页 > 网易号 > 正文 申请入驻

“日本版OpenAI”创下估值新高!Transformer八子之一创办

0
分享至

来源:市场资讯

(来源:量子位)

刚刚,创下日本估值新高的AI初创公司诞生了!

它就是Sakana AI,由Transformer论文八子之一创办,老黄的英伟达也投了。


帮大家快速回忆一下,这家公司其实就是史上首位“AI科学家”背后的出品方——

当时他们发布的The AI Scientist,一登场就一口气生成了十篇完整学术论文,而且每篇成本才15美元左右(约107.62元),一时吸引大量关注。


根据Sakana AI公告,最新B轮融资筹集了200亿日元(约合1.35亿美元、9亿多人民币),总估值来到约4000亿日元(约合26.35亿美元、184亿人民币),创下日本非上市初创企业的估值纪录。

而且它的投资方阵容也堪称豪华——除英伟达(参与A轮)之外,还有一众美国顶级风投(如Khosla Ventures、NEA)和日本产业与金融巨头(如三菱日联、四国电力)等。

所以,Sakana AI为什么能获得如此高估值?

Transformer八子之一创办、要做基于自然启发的AI模型

Sakana AI成立于2023年7月,至今不过短短两年。

之所以一开始就受到巨大关注,毫无疑问离不开它的两位明星创始人。

联创兼CTO Llion Jones,大名鼎鼎的Transformer论文8位作者之一。


他本硕毕业于伯明翰大学,在Delcam、油管、谷歌都工作过,创办Sakana AI之前在谷歌工作了8年之久。

据FourWeekMBA介绍称,在他之前的工作经历中,“曾两度与谷歌的工作擦肩而过”。

第一次是他刚毕业找工作时,虽然投了谷歌伦敦软件工程师的简历,并通过了两轮电话面试,但最终相比谷歌,他选择了位于英国的CAD/CAM软件公司Delcam。

第二次是工作18个月后,他又接到了谷歌的招聘电话,询问他是否想重新申请,但他依旧没去谷歌,而是随后加入了YouTube。

在Youtube做软件工程师的三年期间,他对人工智能产生兴趣,于是自学了Coursera的机器学习课程,并终于在2015年的时候加入谷歌研究院,担任里面的高级软件工程师。

也正是在此期间,他与其他七名作者一起发表了那篇著名的Transformer论文《Attention Is All You Need》。


而之所以选择离开谷歌,是因为公司目前已经发展到一定规模,使得他无法继续进行自己想做的工作。

按他自己的话来说就是,谷歌确实让他有种“被困住的感觉”。

于是潇洒一转身,他选择联合另一位谷歌前员工开始创业,而这位谷歌前员工就是如今身为Sakana AI联创兼CEO的David Ha。

David Ha(右图)曾是谷歌大脑的高级科学家,也曾领导过图像生成模型独角兽公司Stability AI的研究部门。

今年8月,他还入选了《时代》杂志评选的2025年人工智能领域百大人物榜单。


有了这二人,base东京的Sakana AI可谓自带光环。

(注:之所以选择东京,是因为北美那边的生成式AI研究人员竞争非常激烈(手动狗头),而在日本这边竞争相对小一点而且也不乏高质量AI人才。)

而且比较新奇的是,Sakana AI并不是要在日本再造一个OpenAI或Anthropic,而是一开始就要走一条“不一样的路”——

他们希望放弃Transformer架构,并从自然进化中汲取灵感,以降低模型的计算成本并提升其性能 。

概括而言,他们的想法可以基本归纳为:

1)日本是个资源有限的国家,AI发展到后面肯定会受到电力等资源的限制,所以从一开始就要考虑如何提效;

2)通过从自然进化中汲取灵感,他们能够实现这一目的。

至于究竟是怎样的自然灵感,这可以从他们给公司起的名字“Sakana AI”(sakana是日语“魚”(さかな)的罗马读音)一窥。


就像大自然中的鱼会基于某种简单的规则成群活动。因此,AI们也能借鉴它们的思想,无需更大的体积就能完成很复杂的任务。

具体来说,Sakana AI计划开发一种基于自然启发智能(nature-inspired intelligence)的基础模型,借鉴自然领域中的“进化”和“集体智慧”思想,让一群AI协作,类似于当前AI领域的生物启发计算方向。

据《金融时报》介绍称,Llion Jones认为,当前的AI模型之所以存在局限性,是因为它们被设计成无法改变的结构,这种结构往往是脆弱的。

相比之下,发挥“集体智慧”的自然系统,对于周围的变化非常敏感。基于此原理搭建的AI也会具有更好的安全性、更低的搭建成本。

等等,这不就是AI科学家吗?

造出史上首个AI科学家、各项研究库库发

2024年8月,Sakana AI以造出首个“AI科学家”走红一时。

他们推出了第一个用于自动化科学研究和开放式发现的综合AI系统——The AI Scientist。

这个系统能够一口气自动完成从提出研究想法、检查创新性、设计实验、编写代码,到在GPU上执行实验并收集结果,最后完成论文撰写等全过程(一般会交由不同模型分工负责)。

而且当时还放出了由它撰写的十篇完整学术论文,一时令无数网友惊叹“是时候让AI帮我们写论文了”。

p.s.:后来有研究员受其中一篇论文想法的启发,还真的写出了一篇论文并在arXiv上公开了~


实际上,The AI Scientist的出现并非偶然,而是Sakana AI对更早之前的一项研究的验证。

当时他们想出了一个进化合并模型的妙招——

把Huggingface上的现成模型拿来“攒一攒”,直接就能组合出新的强大模型。

具体来说,他们受自然界的自然选择启发,引入“进化模型合并”(Evolutionary Model Merge)的概念,提出一种可以发现最佳模型组合的通用方法。

采用相关方法,他们得到的一个70亿参数的日语数学大模型,直接在相关基准测试上取得了SOTA,打败了700亿参数的Llama-2等前辈。

而且关键是,得出这样的模型不需要任何梯度训练,因此需要的计算资源大大减少。


基于此,他们后来在The AI Scientist研究里想到,是否能用大模型发现新的目标函数来调整其他模型。

而这,正是“首位AI科学家”能够成功运行的根本原理。

再到后来,Sakana AI的AI科学家不断进化,其AI Scientist 2.0版本所生成的论文甚至通过了顶会ICLR workshop评审。

今年4月,Sakana AI向ICLR提交了三篇完全由AI Scientist v2生成的论文。(仅告知43篇评审论文中有3篇出自AI,但不告诉具体是哪一篇)。

结果,其中一篇论文《组合正则化:增强神经网络泛化的意外障碍》获得了6/7/6评审分数,超过平均人类接收门槛。


再之后,围绕“AI协作”这一核心命题,Sakana AI基本以“一月一发”的快节奏推出多项研究:

至此,Sakana AI当下能够斩获日本AI创企最高估值也就不难理解了——创始人自带光环、AI科学家研究出圈、各种研究一月一发。

即使创始人无意再造一个日本版OpenAI,但就其估值和成长轨迹而言,它已然是最接近“日本版OpenAI”的存在。


好好好,美国有OpenAI、日本有Sakana AI,那咱中国呢?

这里我们快速看一下国内主要明星大模型公司的最新估值情况:

智谱AI,“AI六小虎”中首家启动IPO的企业,据中关村杂志9月报道其最新估值已超400亿元RMB;

MiniMax,传闻计划今年赴港IPO,据晚点7月报道其投后估值超过40亿美元(约284亿人民币);

月之暗面,10月传出数亿美元新融资,若属实估值有望突破33亿美元(约234亿人民币);

看来这股AI热潮,已经蔓延到了全球每一个角落(手动狗头)。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
镜报:13人缺战阿森纳vs切尔西,包括梅里诺、埃斯特旺、库库

镜报:13人缺战阿森纳vs切尔西,包括梅里诺、埃斯特旺、库库

懂球帝
2026-02-28 16:36:41
内蒙古一200斤男子欠5000万不还,被债主装进铁笼沉入80米水库,谁料,2年后才被捞出...

内蒙古一200斤男子欠5000万不还,被债主装进铁笼沉入80米水库,谁料,2年后才被捞出...

品读时刻
2026-02-11 17:18:30
伊朗发起反击!5大美军基地被打击,巴林基地仓库和枢纽全被炸

伊朗发起反击!5大美军基地被打击,巴林基地仓库和枢纽全被炸

Ck的蜜糖
2026-03-01 02:37:49
美以动手了!明明伊朗已经怂到了家,为何还要打?原因其实很简单

美以动手了!明明伊朗已经怂到了家,为何还要打?原因其实很简单

刚哥说法365
2026-02-28 18:42:47
轴承可能是机器人产业中最赚钱的赛道,大摩预测25年内增长300倍

轴承可能是机器人产业中最赚钱的赛道,大摩预测25年内增长300倍

DeepTech深科技
2026-02-27 19:30:17
斯诺克赛程:产生决赛席位,吴宜泽PK霍金斯,小司机进账180万?

斯诺克赛程:产生决赛席位,吴宜泽PK霍金斯,小司机进账180万?

刘姚尧的文字城堡
2026-02-28 07:49:06
不可错过!2月28日晚19:30!中央5套CCTV5、CCTV5+直播节目表

不可错过!2月28日晚19:30!中央5套CCTV5、CCTV5+直播节目表

林子说事
2026-02-28 20:51:47
全球警戒!美军疯狂换装M7,一场针对大国的火力革命,已经开始!

全球警戒!美军疯狂换装M7,一场针对大国的火力革命,已经开始!

璠爷财事通
2026-02-26 19:00:04
宋佳:我脸上的痣,从来不让人遮,我觉得特别美,它能帮到我许多

宋佳:我脸上的痣,从来不让人遮,我觉得特别美,它能帮到我许多

秀语千寻
2026-02-28 21:39:35
恭喜!香港名模突然宣布怀上双胞胎,结婚七年终于造人成功

恭喜!香港名模突然宣布怀上双胞胎,结婚七年终于造人成功

収起了底线
2026-02-27 12:18:35
意外:台湾56岁女主持吴中纯昏迷3天去世,死因曝光

意外:台湾56岁女主持吴中纯昏迷3天去世,死因曝光

悠悠说世界
2026-03-01 02:52:25
4500亿华润银行正式更名

4500亿华润银行正式更名

21世纪经济报道
2026-02-28 15:18:07
5-2,利物浦4连胜,反超切尔西,追平曼联,逼近前三,埃基蒂克2传1射

5-2,利物浦4连胜,反超切尔西,追平曼联,逼近前三,埃基蒂克2传1射

侧身凌空斩
2026-03-01 00:56:03
感谢美国:五毛一度的中国电,换个姿势就能卖11元

感谢美国:五毛一度的中国电,换个姿势就能卖11元

星海情报局
2026-02-28 18:00:35
秦桧32世孙发声:让祖宗跪岳飞我认了,凭什么还要跪岳飞的母亲?

秦桧32世孙发声:让祖宗跪岳飞我认了,凭什么还要跪岳飞的母亲?

不八卦掌门人
2026-02-23 13:35:25
世界第一高楼迪拜哈利法塔进行人员疏散

世界第一高楼迪拜哈利法塔进行人员疏散

环球网资讯
2026-02-28 21:14:19
网传阿塔最高领导人阿洪扎达在空袭中身亡

网传阿塔最高领导人阿洪扎达在空袭中身亡

头条爆料007
2026-02-28 06:29:13
比亚迪官宣大招,6 万的车又 “ 变相降价 ”

比亚迪官宣大招,6 万的车又 “ 变相降价 ”

新浪财经
2026-02-28 15:52:34
扎心!农村二三代已无形中陷入到天伦绞杀局,已无回头路了!

扎心!农村二三代已无形中陷入到天伦绞杀局,已无回头路了!

装修秀
2026-02-28 11:45:03
赚大了!网友网购一条32GB DDR5内存 打开包裹目瞪口呆:竟收到十条

赚大了!网友网购一条32GB DDR5内存 打开包裹目瞪口呆:竟收到十条

快科技
2026-02-27 09:37:04
2026-03-01 03:51:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2301377文章数 5605关注度
往期回顾 全部

财经要闻

冲突爆发 市场变天?

头条要闻

伊朗媒体公布反击美军军事行动结果

头条要闻

伊朗媒体公布反击美军军事行动结果

体育要闻

球队主力全报销?顶风摆烂演都不演了

娱乐要闻

周杰伦儿子正面照曝光,与父亲好像

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

健康
游戏
教育
时尚
房产

转头就晕的耳石症,能开车上班吗?

所有人保持嘴角不变!生化危机:安魂曲里昂骚话大盘点

教育要闻

初三不安排春假,最多可连休10天!一地率先公布!

这6款发色居然这么火?50张图可以直接给tony

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

无障碍浏览 进入关怀版