网易首页 > 网易号 > 正文 申请入驻

面壁智能李大海:端侧模型智能水平已追平GPT4,智能体技术仍需冷静对待

0
分享至

“大家对智能体的期待是零差错——但从技术发展曲线来讲,这个预期可能过高,技术仍然需要时间打磨,这是自然规律。”

近日,在2026北京智源大会上,面壁智能CEO李大海在接受澎湃新闻等媒体采访时表示,2025年是智能体元年,未来智能体将迎来爆发式增长,乃至深刻影响人类社会,不过在技术水平上,目前仍然需要冷静对待。

大模型到智能体的结合正在以非常快的速度进化,某些场景已经在落地,不过,谈到智能体的局限性,李大海直言:“哪哪都出问题。”

“模型和Agent(智能体)技术的进化非常快。”李大海认为,“也许今天有些工作10%是错误的,下个月错误率就降到1%,快速进化已经成为核心趋势。”

作为主攻端侧模型的AI公司,相比通用的基座超大模型,面壁智能或许更多着力的是“小模型”。

针对行业内普遍存在的“做好小模型必须从超大规模基础模型蒸馏而来”的观点,李大海明确表示这是一种认知误区。

“蒸馏背后有一个非常具体的前提:蒸馏的客体本身必须是一个好的模型。”李大海解释道,“蒸馏本质上是:对于不具备自研基础模型能力、但希望做应用落地的公司,采用已有的小尺寸基础模型,通过微调获得特定场景能力的过程。这个过程中,确实可能使用其他大模型合成数据来让小模型获得相应能力。”

李大海表示,这是所有大模型训练的范式,并不仅局限于小模型。

“今年以来,随着行业整体把推演转移到国产芯片上,我们也在逐步把训练工作转移到国产芯片和国产集群。”李大海介绍。

这一转变的背后,是对生态配合更高要求的挑战。在李大海看来,国产算力生态的完善正在两条路径上并行推进:第一条路径是自下而上的打磨——大模型公司通过自身的训练实践逐步完善生态,“就像一点一点把石板打湿一样,需要时间”。

第二条路径则是自上而下的顶层规划,例如此前面壁与智源研究院主导的FlagOS软件生态的深度合作:作为大模型公司和芯片公司建立深度合作,在规划下向前推进合作。

在面壁智能AIInfra负责人李宇轩看来,推理对精度的要求其实比训练更高,而面壁智能提出的模型缩放技术成为破局关键:实现用很小的模型预测大模型的效果,在国产芯片上提供深度评测,将实验细节与海外厂商对齐,确认训练精度可用。

据披露,面壁智能已经在华为平台上实现极低位宽量化感知训练,达到普通训练95%的效率。李大海解释,5%损失来自量化器本身的开销,通过与华为深度合作,这一开销已经被优化到极小。

在小模型性能方面,面壁智能公布最新进展:MiniCPM小钢炮第五代1B版本在ArtificialAnalysis(AA)权威评测中获得17.9分。开源社区研究人员对比发现,2024年5月发布的GPT-4o(200B参数)在同类评测中得分为18.3-18.6分,二者仅相差0.4-0.7分。

“2024年我们曾预测,到2026年底端侧模型智能水平可达到GPT-4级别。从目前数据看,这一目标已经提前实现。”李大海表示。

值得注意的是,在此前的“面壁智能开源周”上,面壁智能接连发布 MiniCPM5-1B、BitCPM-CANN 两款端侧大模型。其中,MiniCPM5-1B 再次刷新模型的智能密度上限:仅以 1B 参数规模,在国际知名榜单 AA-Index 上超越了所有 2B 参数以下模型;相比 3 个月前发布的 Qwen3.5-2B,MiniCPM5-1B 不仅效果更优,参数量还减少了一半。

该模型由面壁智能自主研发的 AI 训练框架 ForgeTrain 预训练完成,其是全球*完全由 AI 编写的生产级大模型预训练框架,无人类程序员参与,训练速度比英伟达 Megatron 快10%。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
票房从22亿跌到58万,我感慨:梁朝伟这块金字招牌算是砸了

票房从22亿跌到58万,我感慨:梁朝伟这块金字招牌算是砸了

探长读财
2026-06-21 23:29:14
1951年海南剿匪,横行11年女匪首被捕,老政委看了一眼耳环当场吓跪

1951年海南剿匪,横行11年女匪首被捕,老政委看了一眼耳环当场吓跪

睡前讲故事
2026-06-18 19:33:01
雷军再谈与董明珠打赌:只是开玩笑,没想到被激怒了就从头到尾批评我和小米

雷军再谈与董明珠打赌:只是开玩笑,没想到被激怒了就从头到尾批评我和小米

澎湃新闻
2026-06-21 20:06:26
离婚三年,前夫每月来我家睡一晚,昨晚他照例来,这回我没让他碰

离婚三年,前夫每月来我家睡一晚,昨晚他照例来,这回我没让他碰

千秋文化
2026-06-21 19:55:40
高盛大幅下调2026年黄金目标价

高盛大幅下调2026年黄金目标价

界面新闻
2026-06-21 19:06:31
老同志们反对撤销中顾委:薄一波:小平同志发了话,我们只有执行

老同志们反对撤销中顾委:薄一波:小平同志发了话,我们只有执行

帝哥说史
2026-06-21 16:48:19
《中餐厅10》黄晓明十季坚守,王俊凯回归开启十年环游之旅

《中餐厅10》黄晓明十季坚守,王俊凯回归开启十年环游之旅

流云随风去远方
2026-06-21 17:48:43
4-0!日本取世界杯首胜,森保一却高兴不起来,末轮或故意输球‍

4-0!日本取世界杯首胜,森保一却高兴不起来,末轮或故意输球‍

禾三千体育
2026-06-21 15:34:00
金价6月21日,大家要有心理准备了,下周,金价或将重现15年历史

金价6月21日,大家要有心理准备了,下周,金价或将重现15年历史

生活新鲜市
2026-06-21 03:31:54
这很科学:89%的人幻想过同时和多人发生性行为,算精神出轨吗?

这很科学:89%的人幻想过同时和多人发生性行为,算精神出轨吗?

宇宙时空
2026-05-26 18:20:10
小沈阳女儿沈佳润,彻底翻车了,跟李雪琴聊天,前言不搭后语

小沈阳女儿沈佳润,彻底翻车了,跟李雪琴聊天,前言不搭后语

西楼知趣杂谈
2026-06-18 16:38:47
6月22日发布!新机官宣:搭载11000mAh+10000nits!

6月22日发布!新机官宣:搭载11000mAh+10000nits!

科技堡垒
2026-06-20 11:56:24
二十余年遗憾终圆满!陈伟霆首个父亲节,一双定制亲子鞋戳哭全网

二十余年遗憾终圆满!陈伟霆首个父亲节,一双定制亲子鞋戳哭全网

繁华羽淡洛
2026-06-21 16:05:36
戏混子又来嚯嚯央视大剧?演技浮夸、呲牙咧嘴,毛晓彤也带不动

戏混子又来嚯嚯央视大剧?演技浮夸、呲牙咧嘴,毛晓彤也带不动

丁丁鲤史纪
2026-06-21 23:29:03
明天,深交所史上最大规模IPO来了

明天,深交所史上最大规模IPO来了

新浪财经
2026-06-21 18:38:26
镰田大地:我答应恩凯蒂亚,在世界杯进球就做他的庆祝动作

镰田大地:我答应恩凯蒂亚,在世界杯进球就做他的庆祝动作

懂球帝
2026-06-21 15:16:43
央视曝光私域直播卖茶骗局

央视曝光私域直播卖茶骗局

环球网资讯
2026-06-21 23:47:39
他们骗38人吃虫子,结果受试者居然真香了?

他们骗38人吃虫子,结果受试者居然真香了?

理性之光啊
2026-06-20 22:23:32
特斯拉宣布大量地区上架 FSD 订阅服务,价格有点意外

特斯拉宣布大量地区上架 FSD 订阅服务,价格有点意外

XCiOS俱乐部
2026-06-21 12:41:19
古巴通过大规模经济社会改革方案

古巴通过大规模经济社会改革方案

参考消息
2026-06-21 11:49:19
2026-06-22 00:16:52
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
908907文章数 5092871关注度
往期回顾 全部

科技要闻

马斯克拿下7800亿元天价薪酬 2028年可兑现

头条要闻

媒体:两大核武国家“水仗”升级 巴基斯坦陷入恐慌

头条要闻

媒体:两大核武国家“水仗”升级 巴基斯坦陷入恐慌

体育要闻

德国的超级替补,10年前还在工厂上班

娱乐要闻

原来她就是张颂文老婆

财经要闻

“床垫界的特斯拉”破产了

汽车要闻

惊出冷汗!重庆实测奥迪A5L,华为智驾这波操作绝了…

态度原创

健康
教育
数码
本地
公开课

吃粽子的3条保胃法则,消化科医生推荐

教育要闻

做上位机,这些专业比计算机更香

数码要闻

极摩客EVO-X3 4T桌面AI超算中心即将预售 Lisa SU亲签

本地新闻

龙腾资江 韵动邵阳

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版