网易首页 > 网易号 > 正文 申请入驻

入坑大模型18个月的反思与贩私

0
分享至


作者:[Minogame]Link:[https://zhuanlan.zhihu.com/p/717402693]

前几天开完一个有高层参加的会议,会后组里的技术大佬直接就开喷“要规划没规划,整天只知道对着几个糊弄老板的榜使劲刷”。我下意识地赶紧去拉住他,低声对他讲“你声音太小了,老板听不到的,回头我领你去大厦的保安室,你用紧急通报的喇叭讲给全楼的人听”。他仿佛意识到了什么,便回我若要率十余众攻入保安室需要准备什么样的装备以及后勤物资,于是会议的内容就这么愉快的被遗忘了。

做回工位上,暮然回首发现自己已经入了这个坑一年半了,反思起来也收获确实有一些,例如Megatron/DS/TE/FA等等核心实现,例如强化学习的世界观以及其与最优化领域世界观的融合。但是如果要用一个短语来描述我当下的心境,那必然是“跳坑救不了世界”,弃坑从文也救不了,我们这个业界从底层的逻辑上就被运作成了这样:开源社区成就了一批天命人,天命人自发地凝结成草台班子,草台班子又逐渐被开源社区淘汰。而这个循环过程中,这些本该会被淘汰的班子却会试图通过闭源与商业化立起牌坊,这就形成了我们这个业界遍地是坑的奇观。

如果给“坑”这个描述做一个明确定义,那么大致可以讲成“同质化、模式化、低效率、低创新”的竞争系统,颇有当下低端芯片、商业城区、成人教育、新能源汽车、供应链金融这些领域的感觉。只不过大模型比这些事情多了一层窗户纸——黑盒性质,换句话说他不是被设计出来的,而是一种对自然的探索发现,而且又有着极高的资金门槛,所以对一般公众而言,其有着仿佛大型强子对撞机探索宇宙基本原理一般的隔阂感。然而大语言模型本身又具有极强的人文性,类似于经济学,这便又给了草台班子极大的容错率。

我很早以前就察觉,当下基于qkv attention + next token prediction + scaling的路径几乎已经快走到了尽头,并不是说scaling不能继续发挥作用,而是说scaling带来的收益已经远超出对其的投入。而且我的一个暴论是,scale让大模型更像大模型,丰富且平庸

,这就是之所以你会感觉到一个回答是大模型生成的原因。虽然反过来讲,丰富且平庸的回答并非毫无意义,因为它至少可以被用来做为创作的原材料。但是,于智能本身而言这种性质毫无意义,更不要提草台班子们打着要做智能的旗号最后只做出了一堆丰富且平庸的产品。

当然如果说上面这条路死了,或者有些更悲观的观点说联结主义死了,大模型也不是不能继续往下发展,因为显然除了创作类的需求,在提升生产力的过程中我们也有“理解复杂指令并精确输出”的需求。在我的脑海中,这种需求会促进“联结符号主义”的发展,类似于alpha proof中formalizer network、lean与solver network三者之间的协作,而这便是接下来几年大模型发展最大的一个契机。或许草莓跟猎户座也是类似的玩意,但是只可惜这些都是闭源的,草台班子骨子里是不太敢真的去碰这些东西的,因为他们内心中很清楚什么成就了他们。

所以你们看我黑了这么久草台班子,那么我也给草台班子做一个定性:一套低配的体制圈子。其低配体现在以下三个方面:制度不成熟、更加的人治;神权(开源社区)的影响力更大;王国之间来去比较自由、对人的行为缺乏约束。这里面的诸多问题恕我无法展开来讲,一来太招黑,二来也会冲到塔。我唯一能讲的给小朋友们的建议就是不要把自己活成高瀚文,或者尽量一开始就不要跳这个坑,如果你的理想真的是诗、智能与远方。另外其实我觉得国内做开源的几家都挺好的,比如seek(不是软文,因为他们嫌我年龄大直接挂了我的简历),主要原因是一来他们背靠金融系,有自己特定的存在价值,不需要为钱发愁;二来里面真的有些不错的傻孩子在里面为了梦想而奋斗,技术氛围很好。

事到如今,恍惚间感觉自己仿佛被焊死在零式里面的生体智能,最终不知道会以什么方式陪着大模型这个业界殉葬。希望明天会发生一些好事情吧。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
白人女性与黑人女性的体味差异,网友真实分享引发热议

白人女性与黑人女性的体味差异,网友真实分享引发热议

特约前排观众
2025-12-22 00:20:06
菲律宾人进不来就搞这种东西!中国黄岩岛发现令人无语的装备

菲律宾人进不来就搞这种东西!中国黄岩岛发现令人无语的装备

阿龙聊军事
2026-05-23 18:17:55
中纪委2026严查新方向,这6类岗位首当其冲

中纪委2026严查新方向,这6类岗位首当其冲

职场资深秘书
2026-05-24 20:47:23
太离谱了!江苏女子在公园散步,发现走的石板是由一块块墓碑铺的

太离谱了!江苏女子在公园散步,发现走的石板是由一块块墓碑铺的

川渝视觉
2026-05-24 19:56:10
再次提醒:硒是抗癌、增强免疫力的必需元素,多吃3种食物就能补

再次提醒:硒是抗癌、增强免疫力的必需元素,多吃3种食物就能补

冷眼看世界728
2026-05-22 21:52:14
男子因在自家门口放垃圾和邻居发生冲突 被对方用刀划伤脖颈

男子因在自家门口放垃圾和邻居发生冲突 被对方用刀划伤脖颈

闪电新闻
2026-05-23 17:50:03
美以彻底决裂!以色列紧急对华外交破局,内塔尼亚胡态度变了

美以彻底决裂!以色列紧急对华外交破局,内塔尼亚胡态度变了

壹知眠羊
2026-05-24 07:10:52
时隔8年重返西甲,拉科鲁尼亚:我们要重回精英行列并站稳脚跟

时隔8年重返西甲,拉科鲁尼亚:我们要重回精英行列并站稳脚跟

懂球帝
2026-05-25 06:21:12
克雷桑2球,难救韩鹏昏招!山东泰山郁闷1战,战蓉城:又要惨败?

克雷桑2球,难救韩鹏昏招!山东泰山郁闷1战,战蓉城:又要惨败?

话体坛
2026-05-24 22:20:38
厄德高:夺冠感觉太不真实了,走向奖杯时才意识到真的发生了

厄德高:夺冠感觉太不真实了,走向奖杯时才意识到真的发生了

懂球帝
2026-05-25 05:09:17
海边的风景真美

海边的风景真美

蓝色海洋009
2026-05-24 22:43:44
48票赞成1票反对!美国参议院投票结果深夜出炉,特朗普失算了

48票赞成1票反对!美国参议院投票结果深夜出炉,特朗普失算了

闻识
2026-05-24 09:56:04
向乔-哈特当面道歉,瓜帅:我很抱歉,我犯了一个错误

向乔-哈特当面道歉,瓜帅:我很抱歉,我犯了一个错误

懂球帝
2026-05-25 04:59:03
中国正在成为全球第一个集体抛弃电话的国家。

中国正在成为全球第一个集体抛弃电话的国家。

维纳斯的眼泪
2026-05-22 12:15:47
48小时内连坠两架中国战机!巴基斯坦斩钉截铁:与驾驶员关系不大

48小时内连坠两架中国战机!巴基斯坦斩钉截铁:与驾驶员关系不大

简读视觉
2026-05-24 23:38:27
四川广安一佳人太漂亮了,仙姿玉色,貌美如花,绝世佳人不过如此

四川广安一佳人太漂亮了,仙姿玉色,貌美如花,绝世佳人不过如此

手工制作阿歼
2026-05-18 03:45:48
特斯拉车主第三次把车开进湖里:这次被警察抓了

特斯拉车主第三次把车开进湖里:这次被警察抓了

灰度测试中
2026-05-24 04:18:56
皇马官方:里克尔梅提交的主席候选资格有效

皇马官方:里克尔梅提交的主席候选资格有效

懂球帝
2026-05-25 05:39:08
5月29日发布!新机官宣:搭载10800mAh+三频北斗!

5月29日发布!新机官宣:搭载10800mAh+三频北斗!

科技堡垒
2026-05-23 12:19:53
“无期刑犯”老到不能动,监狱会给他们养老吗?答案真令人心酸

“无期刑犯”老到不能动,监狱会给他们养老吗?答案真令人心酸

宋鶛搞笑配音
2026-05-24 18:41:47
2026-05-25 06:32:49
Ai学习的老章 incentive-icons
Ai学习的老章
Ai学习的老章
3422文章数 11159关注度
往期回顾 全部

头条要闻

山西矿难遇难者家属:父亲年过半百 我们一直劝他别干了

头条要闻

山西矿难遇难者家属:父亲年过半百 我们一直劝他别干了

体育要闻

唐斯发牌,大头逆袭:骑士跌向残忍夏季

娱乐要闻

王鹤棣掉粉超20万!代言和作品遭抵制

财经要闻

什么情况下,本轮AI大行情会结束?

科技要闻

我戴着摄像头上班,正在帮AI抢走我饭碗

汽车要闻

国民家轿再上新 帝豪向上系列限时5.59万起

态度原创

游戏
艺术
数码
家居
时尚

《霍格沃茨之遗》续作或将公布?知名爆料人暗示

艺术要闻

他把葡萄画成了美少女

数码要闻

618游戏本怎么选?ROG魔霸新锐2026来袭,福利秒杀让战力飞

家居要闻

低调传承 温润沉静

《低智商犯罪》一半惊喜,一半可惜

无障碍浏览 进入关怀版