网易首页 > 网易号 > 正文 申请入驻

挑战Transformer,前OpenAI研究VP宣布创业,拟融资10亿美元

0
分享至


编辑|Panda

Transformer 是当前 LLM 大发展的核心基础,但也有不少顶尖研究者更愿意探索其它道路。在这其中,甚至包括 Transformer 的创造者之一、Sakana AI 创始人联创兼 CTO Llion Jones。他今天还在 Sakana 的官推上发了一篇博客,题目便赫然是《为什么 Transformer 的这位创造者受够了 Transformer》。



https://x.com/SakanaAILabs/status/2016844349188034922

「我不是说我们应该扔掉 Transformer。但就我个人而言, 我正在大幅减少研究它们的时间。我明确地在寻找下一个目标。」他写道,「让我们一起加大探索力度。别再纠缠于同一个地方,去寻找下一座高峰吧。」

也恰在今天,The Information 报道揭示了前 OpenAI 研究 VP Jerry Tworek 创立的一家正在探索「下一座高峰」的新创业公司Core Automation。



在效力 OpenAI 期间,Tworek 曾担任研究副总裁,负责强化学习领域的工作。此外,他还是 OpenAI 推理模型、编程工具和 AI 智能体开发的关键贡献者。

据知情人士透露,Core Automation 刚成立几周时间,目前正寻求 5 亿至 10 亿美元的融资。

报道说,根据向潜在投资者展示的材料,Tworek 计划采用一种与 OpenAI、Anthropic 等大厂截然不同的路径来开发 AI 模型。知情人士称,他希望打造具备「持续学习」(Continual Learning)能力的模型,即能够从现实世界的实践中即时获取知识。而现有的 AI 模型尚不具备这种「边练边学」的能力。

目前,这位研究员的创业计划尚处于早期阶段,其融资规模和产品路径仍可能发生变动。如果成功,或许我们可将 Core Automation 与 Safe Superintelligence 和 Thinking Machines Lab 并称为探索非 Transformer 方向的「OpenAI 三子」。

事实上,Core Automation 不是孤例,而是代表了业内一个规模虽小但日益壮大的群体。这些研究人员认为 AI 领域需要一场「彻底的变革」。

在他们看来,当前主流的模型开发技术虽然流行,但很难让 AI 在生物、医学等领域取得重大突破,且无法根除 AI 经常犯低级错误的顽疾。

据了解,Tworek 本月初离开 OpenAI,并在 X 上写道,此举是为了「探索那些在 OpenAI 内部难以推进的研究方向」。



在融资材料中,Core Automation 表示仍会使用大型神经网络 —— 这是当今前沿模型底层的数学基础。但公司将重新审视模型开发的每一个环节,甚至包括训练神经网络的最基本方法「梯度下降」(Gradient Descent)。

知情人士表示,Tworek 计划开发一种对数据量和计算资源需求更低的模型。他们将通过构建全新的架构来取代目前统治市场的 Transformer 架构。此外,Tworek 还希望将原本割裂的模型训练步骤整合为单一的流程。



Transformer 架构

在追求「持续学习」这一目标上,Core Automation 与另一家实验室 Safe Superintelligence(由前 OpenAI 首席科学家 Ilya Sutskever 共同创立)不谋而合。Sutskever 此前也表达过类似的愿景,即希望模型能够通过在现实世界中的部署来不断进化。此外,从 Meta 离职的 Yann LeCun 也在探索类似的方向。

当然,OpenAI 和 Anthropic 等巨头也并未忽视「持续学习」。

一些研究者认为,通过对现有基于 Transformer 的模型进行微调,同样可以实现类似的学习特性,而无需彻底推倒重来。

媒体表示,Tworek 宏大的融资目标反映了资本市场对「新实验室」的持续狂热。近几个月来,尽管许多此类公司尚无收入甚至没有产品,但动辄就能拿到数亿美元的投资。

例如:初创公司 Humans& 本月以 44.8 亿美元的估值拿下了 4.8 亿美元种子轮融资,投资者包括英伟达和贝佐斯;Mira Murati 的 Thinking Machines Lab 最近也在洽谈一笔 40 亿至 50 亿美元的融资,投后估值预计超过 500 亿美元。不过相比之下,Thinking Machines 进展更快,去年已推出了模型定制产品并产生了部分收入。

Tworek 早在 2019 年就加入了 OpenAI。在他的构想中,Core Automation 的研究团队将围绕一个名为「Ceres」(取自罗马谷物女神及矮行星之名)的单一算法和模型展开工作。这与主流厂商的做法大相径庭。通常,大型模型的训练会分为预训练(使用海量互联网数据)、中期训练和针对编程、医疗等领域的后期微调。

按照 Tworek 的目标,这款模型所需的数据量将比现有最先进模型少 100 倍。

模型研发成功后,公司将开发 AI 智能体来自动化生产自己的产品。其远景规划首先是工业自动化,最终目标甚至包括建造「自我复制工厂」、研制自动生成定制设计的生物机器,乃至于改造地外行星的生态。

你看好这些新方向的探索吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
关乎台湾问题,中国对美国摊牌了,当着特朗普面,中方把话说死了

关乎台湾问题,中国对美国摊牌了,当着特朗普面,中方把话说死了

今墨缘
2026-05-14 15:21:43
买车半年维修9次!蔚来车主:不敢开了,要求退车

买车半年维修9次!蔚来车主:不敢开了,要求退车

深圳晚报
2026-05-14 08:45:16
1972年尼克松访华时,向毛主席索要了一幅墨宝,这幅墨宝只有12个字,但尼克松却始终不明白毛主席是什么意思

1972年尼克松访华时,向毛主席索要了一幅墨宝,这幅墨宝只有12个字,但尼克松却始终不明白毛主席是什么意思

年代回忆
2026-05-13 20:03:59
亲历者回忆:邓公去世前几周表现异常,火化时秘书接到一密令

亲历者回忆:邓公去世前几周表现异常,火化时秘书接到一密令

凉州辞
2026-05-14 13:45:03
特朗普访华团五路人马各怀心思,鲁比奥必须在场,但牌面最薄

特朗普访华团五路人马各怀心思,鲁比奥必须在场,但牌面最薄

漫川舟船
2026-05-14 19:54:52
20岁的越南女孩嫁到南京,7年后第一次回家,丈夫给了她15万块钱

20岁的越南女孩嫁到南京,7年后第一次回家,丈夫给了她15万块钱

流萤叙情
2025-04-27 09:55:18
4300家个股下跌,中国长城、中国卫星直接跌停,大盘要做头了吗?

4300家个股下跌,中国长城、中国卫星直接跌停,大盘要做头了吗?

长风价值掘金
2026-05-14 15:36:38
恭喜!陈思诚又当爹!26岁小女友晒生日照,一脸孕相得到父母认可

恭喜!陈思诚又当爹!26岁小女友晒生日照,一脸孕相得到父母认可

八卦王者
2026-05-14 11:39:43
王曼昱首盘输球,马琳冲上去一把抱住她,全场没人看懂。邓亚萍一句话点透:这不是技术,是心态出了要命的问题

王曼昱首盘输球,马琳冲上去一把抱住她,全场没人看懂。邓亚萍一句话点透:这不是技术,是心态出了要命的问题

乒乓助手
2026-05-14 00:07:37
瓜岛战役日军为何会惨败?美国军医:他们人均排便量是美军1.5倍

瓜岛战役日军为何会惨败?美国军医:他们人均排便量是美军1.5倍

小莜读史
2026-04-28 07:14:32
贝莱德联手淡马锡和阿布扎比主权基金 豪掷300亿美元投资中东基建

贝莱德联手淡马锡和阿布扎比主权基金 豪掷300亿美元投资中东基建

财联社
2026-05-14 16:47:16
半决赛上海VS北京!赛前3个好消息1坏消息,G1开门红稳了

半决赛上海VS北京!赛前3个好消息1坏消息,G1开门红稳了

生活新鲜市
2026-05-14 17:09:35
河南信阳警方:一小轿车发生剐蹭后失控致1死5伤,司机涉嫌醉驾

河南信阳警方:一小轿车发生剐蹭后失控致1死5伤,司机涉嫌醉驾

澎湃新闻
2026-05-14 02:24:09
700万?!勇士第一笔补强敲定!?可以,双赢

700万?!勇士第一笔补强敲定!?可以,双赢

贵圈真乱
2026-05-14 14:48:18
霍尔木兹海峡,传来大消息!黄金、白银、原油突变!

霍尔木兹海峡,传来大消息!黄金、白银、原油突变!

证券时报e公司
2026-05-14 12:26:16
“还没成年,脖子就有草莓了!”原来穷人富养女,才是悲剧的祸根

“还没成年,脖子就有草莓了!”原来穷人富养女,才是悲剧的祸根

妍妍教育日记
2026-05-11 19:20:59
大数据分析,在中国,找个身高1米7年入20万的老公,到底有多难?

大数据分析,在中国,找个身高1米7年入20万的老公,到底有多难?

深度报
2026-04-18 23:37:27
两性关系:男性过了75,不管跟谁处,牢记4句话,余生少心酸

两性关系:男性过了75,不管跟谁处,牢记4句话,余生少心酸

匹夫来搞笑
2026-05-14 00:32:20
腾讯AI一号位姚顺雨被传因算力资源将离职 官方回应:太恶劣 还编出各种搞笑情节 严正辟谣

腾讯AI一号位姚顺雨被传因算力资源将离职 官方回应:太恶劣 还编出各种搞笑情节 严正辟谣

快科技
2026-05-14 15:47:35
俄宣发布虚假消息,称苏-57战机在乌克兰上空击落萨博-340预警机

俄宣发布虚假消息,称苏-57战机在乌克兰上空击落萨博-340预警机

走进乌克兰2022
2026-05-14 19:48:01
2026-05-14 20:27:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12996文章数 142648关注度
往期回顾 全部

财经要闻

李强会见美国工商界代表

头条要闻

外媒询问中方对鲁比奥的制裁是否已经解除 外交部回应

头条要闻

外媒询问中方对鲁比奥的制裁是否已经解除 外交部回应

体育要闻

争议抽象天王山,和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸!全程不提孩子妈

科技要闻

马斯克说会谈很顺利 黄仁勋点赞 库克比耶

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

本地
时尚
旅游
房产
公开课

本地新闻

用苏绣的方式,打开江西婺源

T恤+低腰阔腿裤、衬衫+低腰半裙,今年夏天最时髦的搭配,谁穿谁好看!

旅游要闻

半价or免票?5月17日-19日,崇明这些景点参与优惠活动

房产要闻

海南楼市新政要出!拟调公积金贷款额度,最高可贷168万!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版