网易首页 > 网易号 > 正文 申请入驻

「LLM」这个名字不好,马斯克怒批太愚蠢

0
分享至

机器之心报道 编辑:陈陈

LLM 应该改名吗?你怎么看。

在 AI 领域,几乎每个人都在谈论大型语言模型,其英文全称为 Large Language Models,简写为 LLM。

因为 LLM 中有「Language」一词,因此,大家默认这种技术和语言密切相关。

然而,知名 AI 大牛 Andrej Karpathy 却对此有着独特的见解:

「大型语言模型(LLM)名字虽然带有语言二字,但它们其实与语言关系不大,这只是历史问题,更确切的名字应该是自回归 Transformer 或者其他。

LLM 更多是一种统计建模的通用技术,它们主要通过自回归 Transformer 来模拟 token 流,而这些 token 可以代表文本、图片、音频、动作选择、甚至是分子等任何东西。因此,只要能将问题转化为模拟一系列离散 token 的流程,理论上都可以应用 LLM 来解决。

实际上,随着大型语言模型技术栈的日益成熟,我们可能会看到越来越多的问题被纳入这种建模范式。也就是说,问题固定在使用 LLM 进行『下一个 token 的预测』,只是每个领域中 token 的用途和含义有所不同。

如果核心问题真的变成了预测下一个 token,那么深度学习框架(例如 PyTorch 及其同类框架, 因为 PyTorch 提供了过于广泛的操作和层的可配置性而显得过于普通)也可能过于普通,无法满足大多数问题随时间推移的需要。如果 80% 的问题只需要使用 LLM 来解决,那么成千上万个可以随意重新配置的操作和层又有什么用呢?我认为这不是真的,但我认为它只对了一半。」

Karpathy 的这番言论引来很多人围观,浏览量高达 20 多万。

Karpathy 曾是 OpenAI 的早期成员之一,之后加入特斯拉领导其自动驾驶的计算机视觉团队。之后他又回到过 OpenAI,领导着一个专注提升 ChatGPT 的 GPT-4 的小团队。今年 7 月,他宣布创立了一家名为 Eureka Labs 的 AI + 教育公司。

作为前排吃瓜群众的马斯克非常赞同的表示:这绝对需要一个新名字,「多模态 LLM(Multimodal Large Language Models)」是一个特别愚蠢的名字,因为第一个词与第三个词相矛盾!

机器学习和 AI 研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 也非常赞同,他表示:如果将 LLM 改为自回归 Transformers 或者其他名字的话,那 Mamba、Jamba、Samba 可以申请加入吗。不管怎样,还是非常赞同 Karpathy 观点。

不过,来自 OpenAI 的研究者 Clive Chan 却表示:另一方面,也许所有可以用自回归方式表达的东西都可以被视为一种语言。任何事物都可以被转化为一串 token 流,因此从这个角度看,一切都是语言!

对于这种说法,Karpathy 回复到:当然,你可以想象说话纹理、说话分子等等。但我所观察到的是,语言这个词误导了人们认为大型语言模型(LLM)只限于文本应用。

在 Meta 从事 PyTorch 研究的 Horace He 表示:确实,深度学习框架可能在某些方面过于普遍。尽管如此,即便只是针对大型语言模型(LLM),实际运行的操作也有很大的变化。这包括新的注意力操作、混合专家模型(MoE)、不同变体的激活检查点、不同的位置嵌入等。

在 Horace He 看来,这些技术的多样性说明,即使是在专注于 LLM 的应用中,深度学习框架的通用性也是有其必要性的,以适应不断发展和变化的模型需求。

「像 LLMs、GPT 和 RLHF 这样的术语现在变成主流,这实在有些奇怪。通常,一个领域向更广泛的世界介绍自己时并不会这样做(在我看来,这也是有些机构品牌推广失败的原因)。」有人发表了这样的观点。

这种情况反映了复杂技术术语的普及可能并不总能有效地代表其真实的应用和影响,有时甚至可能导致公众理解上的困难。

还有网友认为,「Large」这个词用的也不好,因为今天的「大」在未来会显得「小」。

「 同样的情况也适用于电话和计算机领域,看起来最初的术语往往会保持使用。」

这不由得让我们想起 AI 领域各种命名方式,早期的名称往往因为先入为主的效应而被广泛沿用,即使随着技术的演进,这些名称可能已不再准确描述其功能了。

大型语言模型到底应不应该改名,你怎么看,欢迎评论区留言。

参考链接:https://x.com/karpathy/status/1835024197506187617

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
瑞幸被曝多家门店使用鲜果做咖啡 涉及柠檬、草莓、橙子……

瑞幸被曝多家门店使用鲜果做咖啡 涉及柠檬、草莓、橙子……

饮界
2026-03-09 09:57:03
用亲人生命逼她们低头!伊朗女足的“国歌表演”,看哭了全世界

用亲人生命逼她们低头!伊朗女足的“国歌表演”,看哭了全世界

戗词夺理
2026-03-09 16:42:57
伊朗戳破气球链:逼特朗普宣布“赢”得战争!

伊朗戳破气球链:逼特朗普宣布“赢”得战争!

胜研集
2026-03-10 07:33:12
“白宫所有男士都有一双”:特朗普痴迷于一款145美元的皮鞋,不送人一双就不让走

“白宫所有男士都有一双”:特朗普痴迷于一款145美元的皮鞋,不送人一双就不让走

娱乐小可爱蛙
2026-03-10 08:43:46
一枚火箭一天内发射两次,送54颗卫星上天,猎鹰九号越来越牛了

一枚火箭一天内发射两次,送54颗卫星上天,猎鹰九号越来越牛了

科普大世界
2026-03-10 09:44:55
今年两会,14条建议火了,网友:终于有人敢说了

今年两会,14条建议火了,网友:终于有人敢说了

叶初七
2026-03-10 09:05:44
全家愁得睡不着!89年侄女985博士,月薪3万,不结婚养了一堆猫…

全家愁得睡不着!89年侄女985博士,月薪3万,不结婚养了一堆猫…

火山詩话
2026-03-09 05:50:19
小时候课本上猛夸的3个历史人物,长大后才发现:他们坏到骨子里

小时候课本上猛夸的3个历史人物,长大后才发现:他们坏到骨子里

收藏大视界
2026-03-07 18:11:42
2026年3月10日,全国各大银行最新存款利率

2026年3月10日,全国各大银行最新存款利率

星辰宇的不羁
2026-03-10 11:01:02
再无瓜葛!梅西表态:绝不介入巴萨选举!只留传奇不涉权力纷争

再无瓜葛!梅西表态:绝不介入巴萨选举!只留传奇不涉权力纷争

体育闲话说
2026-03-10 14:29:32
感谢澳大利亚中国女足1/4决赛对手敲定,进4强+直通世界杯稳了

感谢澳大利亚中国女足1/4决赛对手敲定,进4强+直通世界杯稳了

林子说事
2026-03-10 15:19:48
特朗普:若伊朗阻断霍尔木兹海峡,美国将施以更猛烈打击

特朗普:若伊朗阻断霍尔木兹海峡,美国将施以更猛烈打击

界面新闻
2026-03-10 09:28:51
NBA历史首现!黄蜂将次轮签送至热火 解决两年前罗齐尔交易纠纷

NBA历史首现!黄蜂将次轮签送至热火 解决两年前罗齐尔交易纠纷

罗说NBA
2026-03-10 06:11:07
王霜进球越位了?国际足联规则给出答案,朝鲜队难逃亚足联重罚

王霜进球越位了?国际足联规则给出答案,朝鲜队难逃亚足联重罚

何老师呀
2026-03-10 00:19:57
午后异动!002281,垂直涨停!“龙虾”概念大爆发

午后异动!002281,垂直涨停!“龙虾”概念大爆发

证券时报e公司
2026-03-10 14:39:11
在医院做检查的尴尬瞬间!网友:在护士眼里那就是块肉

在医院做检查的尴尬瞬间!网友:在护士眼里那就是块肉

带你感受人间冷暖
2026-03-09 00:05:09
美国估计脸都绿了!伊朗揭露:美军被俘,但美方声称他们已阵亡!

美国估计脸都绿了!伊朗揭露:美军被俘,但美方声称他们已阵亡!

青青子衿
2026-03-08 12:28:51
离婚14年恩怨终有回响,董洁坦言后悔,潘粤明的回应更是字字戳心

离婚14年恩怨终有回响,董洁坦言后悔,潘粤明的回应更是字字戳心

素衣读史
2026-03-10 14:35:00
天津停止供暖时间

天津停止供暖时间

天津族
2026-03-09 19:59:41
中国人口绝不能到亿级体量之下

中国人口绝不能到亿级体量之下

文青大叔说
2026-03-08 09:19:26
2026-03-10 17:43:00
Ai学习的老章 incentive-icons
Ai学习的老章
Ai学习的老章
3262文章数 11089关注度
往期回顾 全部

科技要闻

全民"养虾"背后:大厂集体下场疯狂卖Token

头条要闻

伊朗提停火首要条件 伊外长称新最高领袖不会与美谈判

头条要闻

伊朗提停火首要条件 伊外长称新最高领袖不会与美谈判

体育要闻

加兰没那么差,但鲈鱼会用吗?

娱乐要闻

肖战首夺SMG视帝,孙俪四封视后创历史

财经要闻

“龙虾补贴”密集出炉 最高1000万!

汽车要闻

蔚来换电和理想5C,谁能硬刚,比亚迪兆瓦闪充?

态度原创

家居
房产
教育
数码
艺术

家居要闻

自然肌理 温度质感婚房

房产要闻

信号!千亿巨头入局,三亚开启新一轮大征拆!

教育要闻

等高模型和鸟头模型,哪种方法更简单?

数码要闻

英特尔发布XeSS 3 SDK,方便开发者为游戏导入多帧生成支持

艺术要闻

30000亩杏花开了,新疆的春天这么美!

无障碍浏览 进入关怀版