网易首页 > 网易号 > 正文 申请入驻

Transformer作者:DeepSeek才有搞头,OpenAI指望不上了

0
分享至

Jay 发自 凹非寺
量子位 | 公众号 QbitAI

“闭源人工智能在阻碍我们探索真正的科学。”

说这句话的不是别人,是大名鼎鼎的Transformer发明者——Ashish Vaswani



大佬之所以这么说,是因为他觉得OpenAI等闭源厂商被商业化冲昏了头脑,没心思做基础研究。

在Scaling Law碰壁后,独角兽们越来越搞不清技术方向。

迫于投资者压力,不得不亲自下场探索落地场景,更没精力去搞科研了。

为了填补这块空白,一路从Google到Adept再到Essential AI三次搬家的Vaswani,今年再度迎来巨大转折点——

All in基础研究,并且坚持要走开源路线。



万万没想到,大佬三迁,只为打造西方世界的DeepSeek

“我们很乐意成为西方世界的DeepSeek”

2017年,还在Google Brain工作的Vaswani与团队共同写出了《Attention Is All You Need》,这篇论文在5年后开启了如今的GenAI大航海时代。



可惜的是,老东家不太给力,各种条条框框把人束缚得动弹不得,这让Vaswani心灰意冷。

2022年,他离家出走,与Niki Parmar(Transformer八子之一)和David Luan(当时的Adept CEO)创办了Adept AI

可惜好景不长,据BloomBerg报道,Vaswani在Adept与某位联合创始人爆发了一次严重冲突。

这次争执让他意识到:

  • 只有创立一个完全属于自己的公司,才能有绝对的自由。

于是2022年底,他再次挥手告别,拉起新团队创立了Essential AI



最开始,Essential AI还走的是务实派路线——主要业务就是帮企业做财务分析自动化。

结果,就在今年年初,Vaswani突然对董事会宣布:

放弃公司现有业务,并将精力全部投入基础研究。

What!?

这不是把商业模式直接推翻重来吗?



要知道,对于一家原本服务于企业客户的初创公司来说,这可是一个风险性极高的Bet。

出乎意料的是,董事会和资方居然都在一定程度上对Vaswani表示了支持。

参与Essential AI上一轮融资的AMD在采访中表示:

这个路线确实有点不太寻常,但人工智能领域需要更开放的替代方案。

看来,三次迁居的努力没有白费,Vaswani终于如愿以偿,集结了一帮理念同频的大佬。



为商业化四处奔波的这么多年,与资本和客户打了无数次交道,Vaswani真的累了。

蓦然回首,在他的精神世界中,其实一直有一块能承载他一切美好期许的土地,这片伊甸园的名字叫做——开源

他在Essential官网上写道:

在教育和医疗等领域,有真正的科学需要追求,我们不能让封闭的人工智能阻碍人类探索这些新方向。

是不是听着很耳熟,没错,Vaswani在与Economics Time的采访中直接承认了:

“短期内,我们想要成为西方世界的DeepSeek。”



Vaswani认为,要想推动AI的边界绝不能靠OpenAI、Anthropic等依靠闭源模式盈利的独角兽。

在他的设想里,AI不该只服务于商业,而是要真正进入教育、医疗等关乎大众的场景,让普通人也能享受到技术红利。

比如,一个偏远地区的孩子也能用开源AI上到最好的课;一个小诊所也能借助开源工具做出最准确的诊断。

更重要的是,Vaswani可不光是喊口号,Essential在转型后的确下了不少真功夫

提出转型后的不久,2025年4月,Essential AI团队发表了一篇题为《Rethinking Reflection in Pre-Training》的论文。

这篇论文提出了一个颠覆性观点:

大型语言模型的反思能力其实在预训练阶段就开始萌芽。

简单来说,相较于用RL在后训练打补丁,他们在预训练中取得了突破,并且这个技术可能大幅降低训练成本。

要真能成,那对整个开源社区绝对是大利好。

Vaswani看到了什么?

为什么Vaswani说不能把希望寄托在独角兽公司身上?

Vaswani担心,这些模型性能最优异的独角兽正在阻碍人工智能进步。



有几家公司关闭了长期的研发工作,以便将所有资源用于商业化,这种现象在市场环境恶化时更加明显。

自Scaling Law迎来边际收益递减的拐点后,AI独角兽的产品化倾向已是众人皆知。

Anthropic做浏览器,OpenAI派出著名产品经理Kevin Weil…….各大模型厂商纷纷下场,亲自探索商业模式。

这折射出来的一个问题是创新者窘境

Scaling Law兴起后,暴力美学的砝码使得AI研究的天平从学术机构几乎完全向企业实验室倾斜。

不过,产业界虽垄断了最稀缺的生产要素,他们真的可以All in创新吗?

绝大多数时候不能。因为那可能烧掉几个亿,而且不一定能看到回报。

关键在于,无论公司成立的初衷是什么,创始人最终都得优先对投资人负责。

因此,探索商业模式和利益最大化是闭源模型的最终归宿,这从一开始就注定了。

如今,这把热烈的商业化之火同样烧到了硅谷这批天之骄子身上

今天等着小扎买买买,明天听说OpenAI搞收购,下个月又去创业。



△由AI生成

这种节奏很适合追热点,但科研不一样——要搞出突破性的成果,你得花几年甚至十几年死磕一个方向。

而频繁的流动,让团队很难静下心来。

Vaswani叹息道,这不是科学应有的进步方式。

那Vaswani想要怎么做?开源阵营能够拯救AI吗?

老生常谈的话题——人多力量大,知识共享才是推动AI技术发展的关键动力。

闭源公司虽手握顶级资源和技术成果,但为了维护投资人的利益,不得不把这些秘密藏起来,以阻碍竞争对手。

但如果有成千上万的研究者和开发者一起贡献代码,整个生态齐心协力,并行推进,也许能克服开源阵营资源匮乏的问题。

当然,开源最重要的问题在于资金来源,毕竟咱不能总靠“用爱发电”。

对此,Vaswani参考了互联网产品的解法

交叉补贴大法好

什么是交叉补贴呢?

这是互联网时代很常见的一种商业模式,典型案例就是浏览器:Google搜索对用户完全免费,取得市场份额后依靠广告回血。

简单来说,就是一部分业务赚钱,用来补贴另一部分业务



Vaswani对于Essential AI的计划是这样的:

先构建一个开源的垂直领域模型,这个基座本身不收钱。

但如果有客户想用这个基座搭建自己的AI,可以向Essential AI购买训练数据和相关产品。

通过这个途径赚来的钱,正好能用来反哺开源社区。

这样,既能保证技术开放,又能让公司活下去。



此外,Vaswani还指出闭源不一定代表更高的投资回报率。

虽然闭源模型看起来更容易变现,但实际上也面临巨大的成本压力。

实际上,如果按照之前科技互联网的发展来看,开源通常是更赚钱的一方,毕竟构建起了一整个生态。

One More Thing

最后,关于Ashish Vaswani,或许还有一点点可以多说的。



作为《Attention Is All You Need》论文的“一作”,他博士师承的两位导师,都是华人。

在2011年的南加州大学,有两名活跃在自然语言处理(NLP)前沿的教授——蒋伟(David Chiang)与黄亮(Liang Huang)。

他俩都是Ashish Vaswani的导师。



△图左为蒋伟教授,图右为黄亮教授

蒋伟教授的学士和硕士均就读于哈佛大学,后到宾夕法尼亚大学攻读博士,他提出的分层短语翻译模型曾被Google Translate采用。

黄亮教授本科毕业于上海交通大学计算机系,同样是在宾夕法尼亚大学进修的PhD,主要研究方向是开发高效算法来加速NLP任务,Vaswani是他指导的第一名博士生。

怎么说呢,虽然Transformer八子里没有华人作者,但“功劳簿”里,也并非全然没有华人贡献。

这实际也是另一个维度的开源之力。AI也好、深度学习也好,之所以可以站上浪潮之巅,根本上就在于始终有一个持续交流、开放互助的生态环境。

开源是一种选择,更是一种精神和信仰。

参考链接
[1]https://www.bloomberg.com/news/features/2025-09-03/the-ai-pioneer-trying-to-save-artificial-intelligence-from-big-tech
[2]https://www.communicationstoday.co.in/ashish-vaswani-the-mind-behind-the-transformer-that-powers-genai
[3]https://economictimes.indiatimes.com/tech/artificial-intelligence/we-would-like-to-be-deepseek-in-the-west-says-essential-ai-cofounder/articleshow/121891250.cms
[4]https://www.forbesindia.com/article/ai-special-2025/ashish-vaswanis-essential-ai-wants-to-use-powerful-ai-to-solve-humanitys-biggest-challenges/96148/1
[5]https://www.wired.com/story/eight-google-employees-invented-modern-ai-transformers-paper/
[6]https://www.essential.ai/
[7]https://viterbischool.usc.edu/news/2023/03/attention-is-all-you-need-usc-alumni-paved-path-for-chatgpt/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
关于S妈和小S不看小玥儿小菻菻,马筱梅这样回应,这样说!

关于S妈和小S不看小玥儿小菻菻,马筱梅这样回应,这样说!

振华观史
2026-01-03 10:17:08
樊振东欧洲首冠!一天4赛独得4分,樊振东帮助球队夺得德国杯冠军

樊振东欧洲首冠!一天4赛独得4分,樊振东帮助球队夺得德国杯冠军

莼侃体育
2026-01-05 01:00:50
03年湖南一女教师莫名离世,6次尸检后得出结论:特殊性方式导致

03年湖南一女教师莫名离世,6次尸检后得出结论:特殊性方式导致

历来都很现实
2024-11-23 16:03:32
湖南包工头与女幼师结婚,婚后25年,意外得知妻子的真正身份

湖南包工头与女幼师结婚,婚后25年,意外得知妻子的真正身份

红豆讲堂
2024-12-09 17:55:03
第1现场|“反对向委内瑞拉开战”,美国超百城抗议霸凌战争

第1现场|“反对向委内瑞拉开战”,美国超百城抗议霸凌战争

澎湃新闻
2026-01-04 17:32:29
明起,宁波这个路段永久封闭

明起,宁波这个路段永久封闭

鲁中晨报
2026-01-04 17:45:02
她是国家一级演员,离婚23年至今跟前夫住对门,还参加前婆婆葬礼

她是国家一级演员,离婚23年至今跟前夫住对门,还参加前婆婆葬礼

小熊侃史
2026-01-02 09:23:52
秋冬穿衣别太闷,针织毛衣搭配黑色打底裤,舒适不失自在感

秋冬穿衣别太闷,针织毛衣搭配黑色打底裤,舒适不失自在感

灼灼小齐
2026-01-04 00:15:03
美日真正惧怕的,不是中国的东风导弹、福建舰航母,17国谈之色变

美日真正惧怕的,不是中国的东风导弹、福建舰航母,17国谈之色变

趣文说娱
2025-12-15 16:15:06
风向真的变了!各国媒体纷纷承认,中国已无需再向世界证明其实力

风向真的变了!各国媒体纷纷承认,中国已无需再向世界证明其实力

铁锤简科
2025-11-04 11:31:17
火箭队新签约:后场奇兵还是锦上添花?

火箭队新签约:后场奇兵还是锦上添花?

麦咪熊熊
2026-01-05 02:39:05
中国三大布局,让美国永无翻盘机会,美官员:远超巅峰时期的苏联

中国三大布局,让美国永无翻盘机会,美官员:远超巅峰时期的苏联

小莜读史
2025-12-26 17:50:50
这还是大S爱过的那个美男子周渝民吗?什么时候变得这么油腻了

这还是大S爱过的那个美男子周渝民吗?什么时候变得这么油腻了

原梦叁生
2026-01-05 02:45:59
美军突然意识到问题的严重:中美2国军队,都不是30年前的战斗力

美军突然意识到问题的严重:中美2国军队,都不是30年前的战斗力

通文知史
2025-12-08 20:50:07
蒋介石晚年评价朱德:他最大的本事,就是让人永远看不出他的本事

蒋介石晚年评价朱德:他最大的本事,就是让人永远看不出他的本事

史之铭
2025-12-31 03:37:21
给人养了7年闲人,广汽终于要关闭洛杉矶的研发中心

给人养了7年闲人,广汽终于要关闭洛杉矶的研发中心

与车同乐
2025-12-04 10:05:02
想多活几年?这张“保命清单”请锁死!别等躺在病床上才后悔

想多活几年?这张“保命清单”请锁死!别等躺在病床上才后悔

男女那点事儿儿
2026-01-03 11:04:37
特朗普:将深度介入委内瑞拉石油产业!他实时观看了抓捕马杜罗行动,“就像看一场‘电视秀’”!马杜罗夫妇熟睡中被美军从卧室拖走

特朗普:将深度介入委内瑞拉石油产业!他实时观看了抓捕马杜罗行动,“就像看一场‘电视秀’”!马杜罗夫妇熟睡中被美军从卧室拖走

每日经济新闻
2026-01-04 00:11:07
中国贸易顺差都快摸到一万亿美元了,可为啥外贸厂还一批批倒闭?

中国贸易顺差都快摸到一万亿美元了,可为啥外贸厂还一批批倒闭?

我心纵横天地间
2025-12-12 12:37:03
北京将为企业退休人员提供电子退休凭证

北京将为企业退休人员提供电子退休凭证

新京报
2026-01-04 15:26:06
2026-01-05 05:20:49
量子位 incentive-icons
量子位
追踪人工智能动态
11967文章数 176356关注度
往期回顾 全部

科技要闻

雷军:骂小米汽车有流量,但别故意抹黑

头条要闻

拘押马杜罗的拘留中心"环境令人作呕" 内部画面披露

头条要闻

拘押马杜罗的拘留中心"环境令人作呕" 内部画面披露

体育要闻

女子世界第一,9年前在咖啡店洗碗

娱乐要闻

《小城大事》上星央八 热血筑梦正当时

财经要闻

李迅雷:扩内需必须把重心从"投"转向"消"

汽车要闻

最高续航310km 岚图泰山8或将上半年发布

态度原创

游戏
旅游
本地
时尚
公开课

自走棋火了6年后,我才玩了《王者万象棋》

旅游要闻

一票“畅玩”京津冀

本地新闻

即将过去的2025年,对重庆的影响竟然如此深远

这才是中年女人该有的打扮,不扮嫩、不穿花,简约大方还显贵

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版