网易首页 > 网易号 > 正文 申请入驻

“小而美”语言模型正崛起

0
分享至

英国《经济学人》9月8日文章,原题:对被“神化”的大语言模型的信仰正在崩塌 当科技圈谈及大型语言模型进展乏善可陈时,常用智能手机作类比:早期OpenAI公司推出ChatGPT带来的革命性影响力堪比2007年iPhone问世,但如今大语言模型的迭代更像普通手机的小幅升级。ChatGPT-5最新发布后,热度甚至不及最新亮相的iPhone 17。
更值得关注的是小型语言模型在企业中的崛起。许多公司更倾向于量身定制的AI模型,以满足自身特定需求。一些企业在人力管理等方面无需大语言模型“全知全能”的能力,小语言模型成本低、易部署,反而更经济高效。万国商业机器公司研究负责人大卫·考克斯表示:“你的‘人力资源’聊天机器人并不需要掌握高深物理知识。”
小语言模型不仅能在公司内部IT系统运行,也适合嵌入智能手机、自动驾驶汽车、机器人等对能耗与速度敏感的设备。小语言模型可靠性逐步提高,可能表明苹果等厂商未大举投资云端大语言模型是明智决策。
何谓“小语言模型”?业内并无明确界定。两者区别主要在于训练参数数量:大语言模型可达数千亿,小语言模型通常在40亿甚至低于1亿。训练方式的改进,使小语言模型逐渐缩小与大语言模型的差距。例如,英伟达最新推出的9亿参数新款AI模型,在多项测试中超过“元”公司今年4月发布的40倍参数的模型。市场研究公司的阿格拉瓦尔表示:“今天的小模型,比去年的大模型更强大。”
企业需求推动了小语言模型发展。信息技术研究和咨询公司高德纳表示,大语言模型的“AI幻觉”等问题导致用户疲劳,企业更青睐在行业数据上微调的专业模型。今年企业对小语言模型的需求增速预计是大语言模型的两倍。
成本考量也促使小语言模型受欢迎:重复、可标准化的任务可用小语言模型完成,而无需调用资源消耗巨大的大语言模型。万国商业机器公司的Docling产品便是例子:仅用约2.5亿参数的小语言模型即可执行转化数据的任务,用大语言模型反而不划算。小语言模型也可以在更便宜的芯片上运行,能降低硬件成本。
小语言模型在AI代理中也具优势。英伟达公司的研究认为,小模型有潜力成为“代理型AI”的核心,能以更低成本完成任务,并支持“乐高式”组合——用多个专业小模型替代单一大语言模型。这一点凸显了小语言模型在经济与灵活性上的吸引力。未来,大语言模型仍将主导如ChatGPT等消费者应用,但企业与设备端AI可能更多采用小语言模型。OpenAI自身也在内部使用不同规模模型,以任务复杂度分配资源。(蒋礼译)

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
男子参加王婆说媒炫富引质疑:自称在机关单位上班 家里有宾利保时捷 房子很多;当地称正核实

男子参加王婆说媒炫富引质疑:自称在机关单位上班 家里有宾利保时捷 房子很多;当地称正核实

大风新闻
2026-02-22 11:23:09
从9亿回升至15亿,《镖人》逆跌夺得亚军,吴京开启漫长回本之路

从9亿回升至15亿,《镖人》逆跌夺得亚军,吴京开启漫长回本之路

电影票房预告片
2026-02-20 22:51:47
贝加尔湖7名遇难中国游客身份全部确认:一家四口中仅一名男性生还,另有4人约团司机同行;接私单司机身份曝光,属非法载客

贝加尔湖7名遇难中国游客身份全部确认:一家四口中仅一名男性生还,另有4人约团司机同行;接私单司机身份曝光,属非法载客

扬子晚报
2026-02-21 22:44:48
彭宇案再现,整个国家的水源被污染了

彭宇案再现,整个国家的水源被污染了

家传编辑部
2026-02-21 15:53:34
宇树CEO王兴兴:当前机器人技术接近10岁孩子水平,大规模应用或需3至5年,最长不超10年

宇树CEO王兴兴:当前机器人技术接近10岁孩子水平,大规模应用或需3至5年,最长不超10年

大象新闻
2026-02-21 20:44:06
特朗普:关税从10%升至15%!但不针对中国

特朗普:关税从10%升至15%!但不针对中国

魏家东
2026-02-22 08:29:23
马刺8连胜送国王队史最长16连败 文班28+15+6+4帽成队史第5人

马刺8连胜送国王队史最长16连败 文班28+15+6+4帽成队史第5人

醉卧浮生
2026-02-22 11:26:11
杨紫真的已经瘦到天赋上限了,这也太牛了…

杨紫真的已经瘦到天赋上限了,这也太牛了…

小椰的奶奶
2026-02-21 23:15:06
和父母一起外出旅游有多难受?网友:亲密关系真的是一生的课题

和父母一起外出旅游有多难受?网友:亲密关系真的是一生的课题

解读热点事件
2026-02-21 11:34:43
75673人见证!迈阿密0-3开门黑:梅西独木难支 孙兴慜助攻

75673人见证!迈阿密0-3开门黑:梅西独木难支 孙兴慜助攻

叶青足球世界
2026-02-22 12:43:01
10岁男孩从北帝山景区悬崖栈道坠下,官方通报

10岁男孩从北帝山景区悬崖栈道坠下,官方通报

现代快报
2026-02-22 10:36:09
人到中年,最佳抗衰老的8种运动,每周2次,越练越年轻!

人到中年,最佳抗衰老的8种运动,每周2次,越练越年轻!

马拉松跑步健身
2026-02-22 06:30:04
万幸!家庭聚会男子中途去屋外透气,抬头见3岁儿子坠楼,立马伸手接住!“后怕极了”

万幸!家庭聚会男子中途去屋外透气,抬头见3岁儿子坠楼,立马伸手接住!“后怕极了”

极目新闻
2026-02-22 11:50:28
妈祖开始惩罚这位姓许的有钱人了

妈祖开始惩罚这位姓许的有钱人了

麦杰逊
2026-02-21 18:12:33
香港身份烂尾潮已来!12万内地中产,正在被精准收割

香港身份烂尾潮已来!12万内地中产,正在被精准收割

社会日日鲜
2026-02-22 04:38:12
林孝埈再次致歉!孙龙自责泪崩+哽咽:做了努力但是,没有办法

林孝埈再次致歉!孙龙自责泪崩+哽咽:做了努力但是,没有办法

风过乡
2026-02-22 11:52:45
阅读破5亿!江苏春晚小品封神,网友:被包那么久的火,露出火苗

阅读破5亿!江苏春晚小品封神,网友:被包那么久的火,露出火苗

火山詩话
2026-02-21 20:44:36
和谈破裂,俄乌将全面开战,英国再援乌229亿美元

和谈破裂,俄乌将全面开战,英国再援乌229亿美元

史政先锋
2026-02-21 16:46:58
男篮出发时间已确定,12人大名单提前曝光,广东球迷看后欣喜若狂

男篮出发时间已确定,12人大名单提前曝光,广东球迷看后欣喜若狂

宏远小师哥
2026-02-22 12:03:47
俄宣布贝加尔湖八名遇难者遗体已打捞出水 官方公布游客遗体画面

俄宣布贝加尔湖八名遇难者遗体已打捞出水 官方公布游客遗体画面

劲爆体坛
2026-02-21 21:54:08
2026-02-22 13:35:00
环球时报国际 incentive-icons
环球时报国际
由《环球时报》社有限公司运营,以优质内容资源为依托,报道多元世界,解读复杂中国。
53955文章数 330526关注度
往期回顾 全部

科技要闻

马斯克:星舰每年将发射超过10000颗卫星

头条要闻

monies巴黎旗舰店员工:王菲同款水滴耳环库存已空

头条要闻

monies巴黎旗舰店员工:王菲同款水滴耳环库存已空

体育要闻

徐梦桃:这是我第一块铜牌 给我换个吉祥物

娱乐要闻

裴世矩养侄为刃 看懂两次放行裴行俨!

财经要闻

特朗普新加征关税税率从10%提升至15%

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

游戏
旅游
亲子
公开课
军事航空

魔兽世界时光服:P2阶段最值得入手的专业极品,你穿上去了吗?

旅游要闻

栖霞:新春剧场游园会 解锁别样年味

亲子要闻

现实版奇迹!女子长途徒步毫不知情,孕晚期当天顺产健康男婴

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

硬核揭秘!福建舰“一马当先”底气何在

无障碍浏览 进入关怀版