网易首页 > 网易号 > 正文 申请入驻

所有实验室都怕字节,所有人都在夸DeepSeek!美国研究员中国AI行

0
分享至

来源:市场资讯

(来源:量子位)

这是艾伦研究所(Ai2)的研究员Nathan Lambert,在最近结束中国之行后,发自内心的一番感慨。

在Nathan眼里,国内的LLM圈子简直是天堂,大家彼此尊重、即便立场不同也客客气气的。

反观大洋彼岸的御三家,他突然有点没眼看。

天天激情互喷,跟部落争霸似的……


并非场面客套话。

这次来中国的36小时,Nathan几乎把国内AI圈打卡了个遍,月之暗面、智谱、清华、美团、小米、千问……都有深度交流。

在和大量一线AI研究员、学生聊完天后,Nathan得出了这个结论:

这里的AI玩家,在合作共赢。

基于此,Nathan写下长文,分享了他此次中国行期间令他印象深刻的种种事迹——

实在太真诚了,连MiniMax都跑来前排围观,表示希望下次Nathan的「中国行」能把上海和深圳也安排上。


以下是整理后的文章节选。

Enjoy。

Nathan在文中花了大篇幅聊一个事:为什么中国实验室这么擅长追赶前沿?

他的核心判断是,文化。

今天做一个好的LLM,靠的是从数据到架构到RL算法,全栈每个细节的打磨。每个环节都能榨出一些提升,但怎么把这些提升拼到一起,是一个极其复杂的多目标优化问题。

有时候某个天才研究员的工作,需要为模型的整体工作让路。

在美国,这种事经常引爆冲突。

Nathan透露了个瓜:Llama团队据传就是因为内部政治斗争过重而崩盘的。

大家都想让别人按自己的想法做事,有实验室需要花钱安抚顶级研究员,才能让他们别再抱怨自己的想法没被采纳。

据此,他得出一个结论:

过强的Ego和野心,会妨碍做出最好的模型。

而中国这边,他观察到一个微妙差异:

中国实验室的核心贡献者有大量都是在读学生,在这里,学生被当成同事直接参与核心研发。

他们会愿意做那些不那么Sexy的工作,无所谓,只要能让模型变好就行。

反观美国呢?OpenAI、Anthropic、Cursor这些顶级公司干脆就不开实习。

Google这类公司名义上会有和Gemini相关的实习,但事实上,大家会担心实习生会被隔离在边缘区域,接触不到核心工作。

但中国经验证明,学生的参与,反而能大幅加快行进速度。

除此之外,这些学生还带来了一个意想不到的优势:全新的视角。

过去几年LLM的关键范式从Scaling MoE,到Scaling RL,再到Agent,每一次转换都需要疯狂吸收新的上下文。

学生恰恰最擅长这个。他们擅长快速学习,也乐于放下一切预设,一头扎进去。

Nathan还注意到一件有意思的事。当他问中国研究员对AI的经济影响或长远社会风险有什么看法时,很多人的反应是——

愣了一下。

不是不想回答,是真的觉得不关他们事。他们的任务就是做出最好的模型,其他的事,不是他们操心的范围。

相比之下,美国文化更强调为自己发声。

作为科学家,你越能为自己的工作发声,就越容易成功。

而硅谷文化也在推动一种新的成名路径,也就是成为明星AI科学家。所以大家乐忠于上Dwarkesh、Lex Fridman这种超级播客节目。

一位研究员引用了Dan Wang那个经典说法,很精辟:中国是工程师治国,美国是律师治国。

工程师考虑的是解决问题,而律师考虑的,是定义问题。


概括一下,Nathan觉得有四点比较重要的文化差异:

1、更愿意做那些不那么光鲜,但能提升最终模型的工作。

2、刚进入AI构建领域的人,不受上一轮AI炒作周期的路径依赖束缚,因此能更快适应新的现代技术。

3、更少的自我意识,让组织结构能稍微更好地扩张,因为更少有人试图钻组织系统的空子。

4、大量人才非常适合解决那些已经在别处有概念验证的问题。

Nathan的北京游挺有意思。

他说北京简直像湾区。随便走两步就是一个竞争对手的办公室。

他下了飞机,去酒店的路上顺便就拐进了阿里巴巴北京园区。然后在36个小时内,他依次去了智谱、月之暗面、清华、美团、小米、零一万物。

线下交流中,他向研究员们八卦中国的人才争夺情况怎么样。回答是:

跟美国差不多。

跳槽很正常,主要看当前哪个团队氛围最好。

但有一点跟美国很不一样。

在中国的AI圈,实验室之间更像是一个生态,而不是互相厮杀的部落。在很多私下交流中,大家对同行都是尊重的。

所有实验室都对字节跳动和豆包保持高度关注,在Nathan看来,字节是中国少数走闭源路线推进的大模型玩家。

所有人都敬佩DeepSeek,认为它是研究品味最好的实验室。

这让Nathan很惊讶,和美国研究员的线下对话,火药味可比这浓多了。

但在中国,大家似乎冥冥中形成了一种默契的共识。


还有一点他觉得很奇怪——

中国研究员谈到商业化的时候经常耸耸肩,说:那不是我的事。

而美国这边,从数据供应商到算力到融资,人人都对各种生态级别的产业趋势如数家珍。

聊完文化,Nathan接着聊了聊产业层面他观察到的几个关键差异。我挑几个最有意思的说。

1、国内AI需求的早期信号

一直有一种说法:中国AI市场会比较小,因为中国公司不太愿意为软件付费。Nathan认为这个判断只对了一半。不愿意花钱的部分对应的是SaaS生态,这在中国确实很小。但中国有一个庞大的云计算市场。

关键问题在于:企业在AI上的花费,最终会走SaaS的路线还是云的路线?

Nathan的感受是,AI更接近云,而且没有人在担心围绕新工具是否能长出市场。

2、中国公司的技术自研执念

为什么美团、蚂蚁集团这种公司也在自己做大模型?

西方人可能会觉得奇怪。

但在Nathan看来,中国人的逻辑是:LLM显然会成为未来科技产品的核心,所以必须自己掌握。

不过,虽然自研,但也开源。

先训一个通用底座,开源出去让社区帮忙打磨,内部再微调一个版本用到自己的产品里。

开源不是信仰,是实用主义——它能获得社区反馈,能回馈开源生态,也能帮助他们更好地理解自己的模型。

3、算力不足

英伟达仍是训练的黄金标准,每个实验室都因为芯片不够而受限。

4、数据产业不够成熟

Nathan听说过Anthropic和OpenAI动辄花1000万美元以上买单个RL训练环境,每年累计花费数亿美元来推动前沿。

他很好奇,中国实验室是不是也在从美国公司买这些环境?或者有镜像的国内供应链?

答案是:有数据产业,但质量参差不齐。

所以自己做更靠谱。一般来说研究员们会亲自花大量时间搭RL训练环境,字节和阿里这种大公司则有内部数据标注团队。

Nathan文章最后的一段话,关乎「了解」。

Nathan表示,来之前就知道自己对中国了解甚少,走了一圈之后反而更强烈地感受到,自己根本不了解这块土地。

在Nathan跟几乎所有中国领先AI实验室交谈后,他发现中国有很多特质和直觉,是很难用西方的决策框架去建模的。

他不明白,为什么这些实验室要开源自己好不容易训练出来的模型。

它们不会认为自己构建的每一个模型都必须开源,但都非常有意愿支持开发者、支持生态,并且把开源进一步了解模型的一种方式。

这些公司构建LLM,并不是因为追逐热点,想在新潮技术里刷存在感。

这一切的背后,是一种Nathan没有想过强烈的深层愿望:

把技术栈掌控在自己手中。

这也让Nathan在文章结尾,直言自己有些许焦虑:

归根结底,依旧是在谈中国开源文化这件事。

关于这一点,Nathan说了一句非常有画面感的话,很适合用作结尾:

这跟中国的开源精神,显然是一脉相承的。

Nathan报告原文: https://www.interconnects.ai/p/notes-from-inside-chinas-ai-labs

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗强烈谴责美国

伊朗强烈谴责美国

扬子晚报
2026-05-08 21:48:35
侯友宜正式向大陆摊牌:将统一模式强加于台湾人,主流民意不接受

侯友宜正式向大陆摊牌:将统一模式强加于台湾人,主流民意不接受

杰丝聊古今
2026-05-06 14:10:21
太解气了!韩媒力挺央视怒怼国际足联:中国没进世界杯就好欺负吗

太解气了!韩媒力挺央视怒怼国际足联:中国没进世界杯就好欺负吗

社会日日鲜
2026-05-08 04:10:42
16岁女孩景区内坠亡,目击者发声,赔偿金额曝光,景区运营仅49天

16岁女孩景区内坠亡,目击者发声,赔偿金额曝光,景区运营仅49天

温柔看世界
2026-05-06 11:48:44
市值仅戴尔的1/8,留给联想和杨元庆的时间不多了

市值仅戴尔的1/8,留给联想和杨元庆的时间不多了

新商业派
2026-05-08 15:04:19
67岁毕福剑近况曝光!下乡酒席被嘲落魄,一场出场费竟高达20万

67岁毕福剑近况曝光!下乡酒席被嘲落魄,一场出场费竟高达20万

子芫伴你成长
2026-05-07 22:10:39
新引擎轰鸣:潍柴动力强势开启第二增长曲线

新引擎轰鸣:潍柴动力强势开启第二增长曲线

第一财经资讯
2026-05-08 08:02:35
巴拉圭总统访问台湾后中方警告断交

巴拉圭总统访问台湾后中方警告断交

正经的烧杯1
2026-05-07 18:44:48
恩里克:当年我拿到第一份球员薪水后,把钱给了还房贷的父母

恩里克:当年我拿到第一份球员薪水后,把钱给了还房贷的父母

懂球帝
2026-05-08 09:54:18
汽柴油连涨超2.1元/升后,5月8日再次上调,95号汽油进入9元时代

汽柴油连涨超2.1元/升后,5月8日再次上调,95号汽油进入9元时代

油价早知道
2026-05-08 09:03:54
炸裂!女子称被按摩师脱内裤摸隐私部位30分钟,是猥亵还是按摩?

炸裂!女子称被按摩师脱内裤摸隐私部位30分钟,是猥亵还是按摩?

鋭娱之乐
2024-12-15 21:13:25
太意外了!中国小米电视,竟在日本卖疯了,核心原因太现实

太意外了!中国小米电视,竟在日本卖疯了,核心原因太现实

丁丁鲤史纪
2026-05-04 17:13:18
CBA季后赛!上海男篮vs山东男篮,赛前带来上海男篮张镇麟、偰李永炜、怀特塞德以及山东男篮高诗岩的最新消息

CBA季后赛!上海男篮vs山东男篮,赛前带来上海男篮张镇麟、偰李永炜、怀特塞德以及山东男篮高诗岩的最新消息

凯丰侃球
2026-05-09 00:18:35
45岁才明白:微信上基本不发朋友圈的,十有八九是这两种人

45岁才明白:微信上基本不发朋友圈的,十有八九是这两种人

心理观察局
2026-05-08 09:43:07
为什么要“较真”一顶头盔?

为什么要“较真”一顶头盔?

新华社
2026-05-08 17:43:42
豆包搜索黎元洪跳出演员范伟图片,官方回应:系媒体大量报道

豆包搜索黎元洪跳出演员范伟图片,官方回应:系媒体大量报道

PChome电脑之家
2026-05-06 10:22:59
殿堂级传奇神作重制!官方下令 全网禁止直播

殿堂级传奇神作重制!官方下令 全网禁止直播

游民星空
2026-05-08 20:22:11
今明后三天!爱奇艺杀疯了,3部大剧同时开播,你想追哪部?

今明后三天!爱奇艺杀疯了,3部大剧同时开播,你想追哪部?

枫尘余往逝
2026-05-08 09:04:05
泰康人寿全国销冠被拘

泰康人寿全国销冠被拘

菜鸟理财
2026-05-08 11:42:38
“只顾自己纹眉,不管女儿死活?”14岁女孩生日照,脸上全是槽点

“只顾自己纹眉,不管女儿死活?”14岁女孩生日照,脸上全是槽点

蝴蝶花雨话教育
2026-04-25 00:45:03
2026-05-09 02:40:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3154344文章数 7248关注度
往期回顾 全部

科技要闻

SK海力士平均奖金600万 工服成相亲神器

头条要闻

美公布首批UFO文件 视频公开:阿联酋现水母状物体

头条要闻

美公布首批UFO文件 视频公开:阿联酋现水母状物体

体育要闻

他把首胜让给队友,然后用一年时间还清账单

娱乐要闻

古天乐被曝隐婚生子,新娘竟是她

财经要闻

估值3000亿 DeepSeek寻求500亿元融资

汽车要闻

MG 4X实车亮相 将于5月11日开启盲订

态度原创

旅游
数码
时尚
亲子
军事航空

旅游要闻

社评:中国的“Country Walk”何以吸引西方年轻人

数码要闻

华硕京东重磅新品日,华硕天选7系列游戏本开启预约

衣服其实没有必要买很贵,准备这三件基础款,百搭实用又不挑人

亲子要闻

北京儿童配眼镜指南:从看得清到管得住,守住孩子的视力第一条防线

军事要闻

伊朗:最高领袖穆杰塔巴全面掌控局势

无障碍浏览 进入关怀版