网易首页 > 网易号 > 正文 申请入驻

“小而美”语言模型正崛起

0
分享至

来源:环球时报

英国《经济学人》9月8日文章,原题:对被“神化”的大语言模型的信仰正在崩塌 当科技圈谈及大型语言模型进展乏善可陈时,常用智能手机作类比:早期OpenAI公司推出ChatGPT带来的革命性影响力堪比2007年iPhone问世,但如今大语言模型的迭代更像普通手机的小幅升级。ChatGPT-5最新发布后,热度甚至不及最新亮相的iPhone 17。

更值得关注的是小型语言模型在企业中的崛起。许多公司更倾向于量身定制的AI模型,以满足自身特定需求。一些企业在人力管理等方面无需大语言模型“全知全能”的能力,小语言模型成本低、易部署,反而更经济高效。万国商业机器公司研究负责人大卫·考克斯表示:“你的‘人力资源’聊天机器人并不需要掌握高深物理知识。”

小语言模型不仅能在公司内部IT系统运行,也适合嵌入智能手机、自动驾驶汽车、机器人等对能耗与速度敏感的设备。小语言模型可靠性逐步提高,可能表明苹果等厂商未大举投资云端大语言模型是明智决策。

何谓“小语言模型”?业内并无明确界定。两者区别主要在于训练参数数量:大语言模型可达数千亿,小语言模型通常在40亿甚至低于1亿。训练方式的改进,使小语言模型逐渐缩小与大语言模型的差距。例如,英伟达最新推出的9亿参数新款AI模型,在多项测试中超过“元”公司今年4月发布的40倍参数的模型。市场研究公司的阿格拉瓦尔表示:“今天的小模型,比去年的大模型更强大。”

企业需求推动了小语言模型发展。信息技术研究和咨询公司高德纳表示,大语言模型的“AI幻觉”等问题导致用户疲劳,企业更青睐在行业数据上微调的专业模型。今年企业对小语言模型的需求增速预计是大语言模型的两倍。

成本考量也促使小语言模型受欢迎:重复、可标准化的任务可用小语言模型完成,而无需调用资源消耗巨大的大语言模型。万国商业机器公司的Docling产品便是例子:仅用约2.5亿参数的小语言模型即可执行转化数据的任务,用大语言模型反而不划算。小语言模型也可以在更便宜的芯片上运行,能降低硬件成本。

小语言模型在AI代理中也具优势。英伟达公司的研究认为,小模型有潜力成为“代理型AI”的核心,能以更低成本完成任务,并支持“乐高式”组合——用多个专业小模型替代单一大语言模型。这一点凸显了小语言模型在经济与灵活性上的吸引力。未来,大语言模型仍将主导如ChatGPT等消费者应用,但企业与设备端AI可能更多采用小语言模型。OpenAI自身也在内部使用不同规模模型,以任务复杂度分配资源。(蒋礼译)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
保密期限终到期,中央首长透露:毛岸英真相,可以向外界公开!

保密期限终到期,中央首长透露:毛岸英真相,可以向外界公开!

明月清风阁
2025-11-14 15:20:03
归化了13人也没用!亚洲球队钻了国际足联漏洞,仍无缘世界杯

归化了13人也没用!亚洲球队钻了国际足联漏洞,仍无缘世界杯

星耀国际足坛
2025-11-19 23:23:03
台湾民调揭晓,郑丽文给大陆送上一句话特朗普醒悟:再不动手晚了

台湾民调揭晓,郑丽文给大陆送上一句话特朗普醒悟:再不动手晚了

猫眼观史
2025-11-19 15:07:02
湖人3连胜后,詹姆斯确认了,东契奇提出要求,谁注意艾顿一数据

湖人3连胜后,詹姆斯确认了,东契奇提出要求,谁注意艾顿一数据

体坛大辣椒
2025-11-19 15:58:08
万万没想到!江苏科大高薪引进的“假货”博导,手下有很多留学生

万万没想到!江苏科大高薪引进的“假货”博导,手下有很多留学生

火山诗话
2025-11-20 07:04:21
最低调普京女婿被亿万富豪当街暴打:拒绝10亿赔偿,只提一个要求

最低调普京女婿被亿万富豪当街暴打:拒绝10亿赔偿,只提一个要求

贰文
2024-10-31 00:30:11
俄罗斯警告高市早苗

俄罗斯警告高市早苗

极目新闻
2025-11-19 17:31:43
见完美方后,郑丽文送两岸一句话,岛内民调变天,大陆要拔7钉子

见完美方后,郑丽文送两岸一句话,岛内民调变天,大陆要拔7钉子

boss外传
2025-11-19 16:00:03
G20峰会前夕,美俄领袖双双缺席,中方拒见日首相释放强硬信号

G20峰会前夕,美俄领袖双双缺席,中方拒见日首相释放强硬信号

历史求所知
2025-11-19 13:01:26
成都27岁女子家门口遇害案开庭,被告人此前曾携刀具敲门滋扰部分住户

成都27岁女子家门口遇害案开庭,被告人此前曾携刀具敲门滋扰部分住户

澎湃新闻
2025-11-20 16:04:27
一年蒸发了10亿元,从网红白酒到狗都不喝,究竟发生了什么?

一年蒸发了10亿元,从网红白酒到狗都不喝,究竟发生了什么?

法老不说教
2025-11-06 20:45:28
利好突袭,大涨!美联储,降息大消息!

利好突袭,大涨!美联储,降息大消息!

中国基金报
2025-11-20 08:22:25
角逐940万大奖,丁俊晖火箭都0-4出局!赵心童独闯八强附对阵赛程

角逐940万大奖,丁俊晖火箭都0-4出局!赵心童独闯八强附对阵赛程

求球不落谛
2025-11-20 07:05:55
中央批准:中候补任副省级城市市委书记!浙江三地市委书记近期调整

中央批准:中候补任副省级城市市委书记!浙江三地市委书记近期调整

上观新闻
2025-11-20 17:48:08
高市早苗一上任,俄罗斯就高度警惕,派轰炸机绕飞日本海

高市早苗一上任,俄罗斯就高度警惕,派轰炸机绕飞日本海

极目新闻
2025-11-20 13:49:08
日本人评价抗美援朝:中国如果不出兵,美国人不会打到中国去!

日本人评价抗美援朝:中国如果不出兵,美国人不会打到中国去!

柏林观察
2025-09-22 11:15:18
86岁老人随口乱说代号,儿子上报后,国安领导:马上接通中央部委

86岁老人随口乱说代号,儿子上报后,国安领导:马上接通中央部委

知鉴明史
2025-10-23 14:01:49
航天发展连收5个涨停板

航天发展连收5个涨停板

证券时报
2025-11-20 10:35:02
担心打不过以色列,伊朗专家怀疑歼10机动性:要求测试发动机性能

担心打不过以色列,伊朗专家怀疑歼10机动性:要求测试发动机性能

烽火观天下
2025-11-15 23:44:14
那个爆雷的四川信托,昨天有了新名字

那个爆雷的四川信托,昨天有了新名字

楼市全搜索
2025-11-19 18:02:43
2025-11-20 18:11:00
环球网资讯 incentive-icons
环球网资讯
环球网,了解世界,融入世界
1280564文章数 2706387关注度
往期回顾 全部

科技要闻

英伟达单季狂揽570亿美元,手握5000亿订单

头条要闻

"最美光二代"高海纯即将大婚 新郎是霸王茶姬创始人

头条要闻

"最美光二代"高海纯即将大婚 新郎是霸王茶姬创始人

体育要闻

Faker,何以成为Faker

娱乐要闻

胡彦斌易梦玲恋情曝光,相差16岁

财经要闻

霸王茶姬创始人将与“光伏女神”结婚

汽车要闻

换购价15.98万起 广汽丰田全新威兰达上市

态度原创

手机
艺术
家居
房产
数码

手机要闻

曝某厂子新机评估2亿大底方案,或为小米REDMI旗下

艺术要闻

陈洪绶:花鸟册二十开

家居要闻

黑白极简 慵懒通透空间

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

数码要闻

王自如:AI眼镜无法取代手机 它仅仅是手机的延伸

无障碍浏览 进入关怀版