网易首页 > 网易号 > 正文 申请入驻

李彦宏揭开认知误区:开源解决不了效率问题,大模型差距越来越大

0
分享至

白小交 发自 凹非寺
量子位 | 公众号 QbitAI
大模型之间的差距会越来越大!

李彦宏最新内部讲话曝光,一时间引发行业热议。

毕竟在当前各种大模型横扫榜单测试集、多项得分超过GPT-4o的现象中,很容易给人一种假象:下一个GPT-4o、下一个OpenAI就要诞生了

为什么会这么说?李彦宏进一步解释道,大模型的天花板很高,现在距离理想情况还相差非常远,所以模型要不断快速迭代、更新和升级。

这背后需要能几年、十几年如一日地投入,不断满足用户需求,降本增效。

除此之外,他还表示开源模型效率不高,解决不了算力问题,而智能体是大模型最重要的发展方向。

百度一直以来作为大模型应用的先行者,掌舵人李彦宏此次谈话无疑也是给行业带来一份实际意义上的参考。

一起来看看他到底说了什么。

李彦宏内部谈话曝光:三个大模型认知误区

内部谈话中李彦宏提出了三点思考,正好回应了当前正受关注的认知误区:大模型之间的差距在缩小吗?大模型技术已经接近天花板了吗?为什么说商业化模型更有性价比?

首先,大模型差距不是越来越小,而是越来越大。

一上来,李彦宏就反对了外界对大模型能力差距缩小的看法,认为模型之间的差距仍然显著,并且会越来越多。他指出,尽管新发布的模型在测试集上表现良好,但这并不能证明它们与最先进的模型如GPT-4o之间的差距已经缩小。

他解释说,很多模型在发布后,通过打榜、猜测试题目、答题技巧,从榜单上看 ,也许模型的能力已经很接近了,“但到实际应用中,实力还是有明显差距的。”

一方面,模型之间的差距是多维的。模型能力的评估除了包括理解、生成和逻辑推理等多维度,以及相应的成本和推理速度。此外,对测试集的过度拟合可能导致对模型能力的误解。

如今大模型已经来应用阶段,他认为,真正的衡量标准应是模型在实际应用中能否满足用户需求和产生价值。因此在百度实际使用过程中,他不允许技术人员去打榜。

另一方面,模型天花板很高。今天能做到的,距离想要实现的效果还很远,所以模型还需要不断去迭代更新。只有持续几年甚至十几年地投入,才能让模型满足用户需求、满足场景、满足提升效率或降低成本等需求。这也是保持竞争力的关键

由此李彦宏认为,所谓的领先12个月或者落后18个月没有那么重要。哪怕你能保证永远领先竞争对手6个月,那就赢了

其次,开源模型解决不了商业应用中的效率问题

在讲话中,李彦宏强调,开源模型需要用户自行部署和维护,这导致其GPU使用率低,无法有效分担推理成本。而闭源模型通过用户共享资源和分摊研发成本,实现了更高的效率与效果。

目前文心大模型3.5、4.0,GPU使用率都能达到90%多。

正如前面所言,评价一个模型,维度是多方面的,不仅是看到榜单上的多项能力,也要看效果看效率。当大模型加速驶入商业应用之后,在追求高效率和低成本的情况下,开源模型并没有优势。

李彦宏明确表示,在大模型时代,算力的高效利用是决定模型成败的关键,而开源模型无法解决这一问题。

最后,智能体是大模型最重要的发展方向,低门槛让应用转化变得更加直接和高效。

大模型发展过程主要会经历哪几个阶段?在内部讲话中, 李彦宏给出了明确的答案。

首先是的Copilot阶段,辅助人类进行操作;接着是Agent智能体阶段,具备自主使用工具和自我进化能力;最后是AI Worker阶段,能够独立完成多种工作。

其中智能体作为大模型最重要的发展方向,相比于大家都在关注的多模态,尚未形成行业共识。但在百度的产品中,比如文心智能体平台AgentBuilder已经让智能体的潜力已经开始被认可。

而其中低门槛这一特性,让从模型到应用的转化变得简单,促使大量新智能体在百度平台上被创造。

李彦宏强调,借助百度的用户基础和需求,智能体可以更好地满足市场需求,推动其进一步发展。

百度智能体实践已进入深水区

总结下来,李彦宏谈到的这几点思考,如果说前两点,还说的是现在,说的是当下,那么智能体就代表着未来。而这一切的背景前提,正好同当前大模型发展驶入深水区阶段不无关系。

如今随着基础模型更新速度放缓,大模型应用逐渐深入产业,企业面临着更复杂的市场环境和技术挑战。简单的技术迭代已不足以满足市场的多样化需求。

人们对大模型的期待与看法也随之改变,模型的参数量以及榜单分数不再作为模型能力的核心指标,开源不开源其实也并不重要。

产业界对AI的需求,已经不仅仅是单纯的技术追求,解决实际问题才是衡量大模型的唯一标准。在这一过程中,更多问题和挑战不容忽视,比如推理与算力的成本问题,以及处理业务效率等。

那么本身在行业长期且持续投入的百度,面对当前这一命题,自然是给中国众多大模型提供了一份发展参考。

答案就是智能体

所以这次李彦宏内部谈话,其实也不仅仅是关于行业认知,还有来自百度智能体实践的有力验证和体现。

在此之前,李彦宏在多次讲话中强调,智能体代表了AI时代的未来趋势。

作为一个几乎“放之四海而皆准”的大模型应用,智能体不仅门槛低,甚至不需要编程技能,就能让用户轻松开发出功能强大的应用。李彦宏形象地将智能体比作“AI时代的网站”,预示着它将形成一个数百万量级的庞大生态。这种广泛的应用潜力使得智能体成为各行各业的“Super APP”,推动了AI技术的普及和应用。

与之相应的,是百度在智能体领域的布局显著。

通过文心智能体平台AgentBuilder,百度已经吸引了20万开发者和6.3万企业入驻,并在2023年7月免费开放文心大模型4.0。这一举措使得开发者在构建智能体时可以灵活选择适合的模型版本,大大降低了开发的门槛。

并且在短短时间内,百度智能体展现出大模型应用强大的潜力。据百度2024年Q2季度财报,智能体在百度生态的分发量正在快速上升,7月日均分发次数超800万,较5月翻倍。

热门智能体包括内容创作、性格测试和日程规划等,涵盖教育、法律及B2B等多个行业。百度的智能体生态吸引了1.6万家商户参与,形成了用户、开发者和服务商共赢的局面。

李彦宏强调,智能体的发展不仅依赖于技术创新,更需紧密结合用户需求。随着用户对智能体的需求不断上升,使得这些智能体能够快速迭代。而只有智能体生态持续扩展,才能推动AI技术在各个领域的深入应用。

在大模型应用逐渐深入的当下,百度的智能体实践无疑为行业提供了重要的借鉴和启示。

大模型热潮进入洗牌期

今年以来已经明显感知到的是,随着大模型技术的不断发展和应用的深入,行业正在进入一个新的阶段。这个阶段的特点是,大模型玩家格局已基本形成:有自研和可持续研发大模型能力的玩家开始向头部聚集

与此同时,大模型应用和落地开始进入生态建设期

越来越多看好大模型前景的创业者,不再会纠结是不是要自研或者自建大模型的问题,而是更加关注如何利用现有的大模型解决实际的痛点需求和问题。

在这个过程中,智能体作为最小的AI应用实现方式,展现出了巨大的潜力。它低门槛轻量化,能够快速在行业中铺开并实现覆盖,满足效率和成本两大需求。随着基础模型的不断增强,智能体应用可以变得更加简单和广泛。

这也是李彦宏看好智能体的核心原因所在。

通过李彦宏讲话,我们可以看出百度的战略重点正在发生转向。卷基础模型的阶段已经过去,现在更加重要的是如何通过智能体构建起丰富多彩的应用生态,让生态成为百度大模型、文心的护城河。

这意味着,百度将更加重视智能体在应用生态中的价值和意义,通过不断完善智能体平台和工具,吸引更多开发者和企业加入,共同打造一个繁荣的AI应用生态。

未来,智能体将不仅限于内容创作和日程规划等基本功能,会拓展到更多专业领域,如医疗、金融和法律服务等,为用户提供个性化和高效的解决方案。

为了实现这一愿景,企业需要持续投入资源进行技术创新与迭代,不断优化算法和提升用户体验。

当然,在这个过程中也会面临一些重要的课题,比如数据隐私与安全性,智能体的管理和维护等。但是,任何一项技术应用驶入深水区都会面临这样那样的挑战。

随着智能体生态的不断壮大,百度正引领行业走向一个更加智能化和高效的未来,为各行业带来新的机遇与挑战。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
09国少刚输印尼!浮岛敏就有可能做出重要决定,事关邝兆镭复出

09国少刚输印尼!浮岛敏就有可能做出重要决定,事关邝兆镭复出

振刚说足球
2026-05-06 10:48:26
离大谱!世界杯开赛在即,中印或被国际足联“踢出”直播圈?

离大谱!世界杯开赛在即,中印或被国际足联“踢出”直播圈?

利刃号
2026-05-05 22:44:20
帅论|首战惜败上海,邱彪:每个人已拼尽全力,末节细节处理不足

帅论|首战惜败上海,邱彪:每个人已拼尽全力,末节细节处理不足

齐鲁壹点
2026-05-06 23:16:33
酒局持续4小时,从下厨招待到拿刀拼命,妻子到底经历了什么

酒局持续4小时,从下厨招待到拿刀拼命,妻子到底经历了什么

笑谈历史阿晡
2026-05-04 12:02:08
两性关系,女人说“我想要上厕所”大多是给你暗示,男人别不懂

两性关系,女人说“我想要上厕所”大多是给你暗示,男人别不懂

游戏收藏指南
2026-05-06 12:38:53
女生主动起来有多黏人?网友:这些女的太开放了

女生主动起来有多黏人?网友:这些女的太开放了

带你感受人间冷暖
2026-01-27 00:20:06
赵丽颖和缅北导演分手有内幕!?

赵丽颖和缅北导演分手有内幕!?

八卦疯叔
2026-05-06 11:15:44
有人说:打麻将和性生活是县城的底色?

有人说:打麻将和性生活是县城的底色?

灯锦年
2026-04-21 12:32:46
特斯拉 Model Y 将大改款?网传有 5 项升级,每个都是车主想要的!

特斯拉 Model Y 将大改款?网传有 5 项升级,每个都是车主想要的!

新浪财经
2026-05-04 22:51:52
外交部:中方一贯反对没有国际法依据的单边制裁,已向英方提出严正交涉

外交部:中方一贯反对没有国际法依据的单边制裁,已向英方提出严正交涉

新京报
2026-05-06 16:00:05
官方通报“广西一酒店谎称老板离世要求女子退房后随即大幅涨价”:涉嫌违反法律法规

官方通报“广西一酒店谎称老板离世要求女子退房后随即大幅涨价”:涉嫌违反法律法规

齐鲁壹点
2026-04-28 07:37:21
多名院士调查发现:吃一口放久发酵的腐乳,或等于进一次毒?真假

多名院士调查发现:吃一口放久发酵的腐乳,或等于进一次毒?真假

健康科普365
2026-04-27 16:15:12
女子在高速上开车化妆、吃东西、双手随音乐舞动,被查后称“作为女司机,我觉得它比我开得好”……

女子在高速上开车化妆、吃东西、双手随音乐舞动,被查后称“作为女司机,我觉得它比我开得好”……

金融界
2026-05-06 16:47:15
特朗普访华前先降调!要跟中方交底2件大事,还想拿台海换帮忙?

特朗普访华前先降调!要跟中方交底2件大事,还想拿台海换帮忙?

孤酒老巷QA
2026-05-07 03:19:20
猪看了都掉眼泪!台军老兵分享军营日常,反响为啥这么大?

猪看了都掉眼泪!台军老兵分享军营日常,反响为啥这么大?

军武次位面
2026-05-06 12:56:34
霍伊伦德确定转会那不勒斯,曼联锁定B费替代者

霍伊伦德确定转会那不勒斯,曼联锁定B费替代者

乐道足球C
2026-05-06 17:19:47
C罗前女友走红毯,上半身只靠几块手表遮挡,大胆造型引全网热议

C罗前女友走红毯,上半身只靠几块手表遮挡,大胆造型引全网热议

钟厨娘
2026-05-05 21:53:59
以色列人做梦都想不到,一场战争打掉了自己未来50年的国运?

以色列人做梦都想不到,一场战争打掉了自己未来50年的国运?

小嵩
2026-04-08 16:09:20
打脸了,《恐龙快打》石头传言是真的,BOSS加强的证据找到了

打脸了,《恐龙快打》石头传言是真的,BOSS加强的证据找到了

街机时代
2026-05-04 22:47:23
浑身都是雷达,中国100式坦克首次公开,混动和智能颠覆西方认知

浑身都是雷达,中国100式坦克首次公开,混动和智能颠覆西方认知

混沌录
2026-05-06 23:01:06
2026-05-07 04:03:00
量子位 incentive-icons
量子位
追踪人工智能动态
12578文章数 176461关注度
往期回顾 全部

科技要闻

“马斯克不懂AI”:OpenAI当庭戳老底

头条要闻

特朗普:伊朗可能将其高浓缩铀运往美国

头条要闻

特朗普:伊朗可能将其高浓缩铀运往美国

体育要闻

活塞1比0骑士:坎宁安不再是一个人了

娱乐要闻

谢娜演唱会暗藏惊喜 何炅瞒天过海现身

财经要闻

估值450亿美元 大基金被曝将投资DeepSeek

汽车要闻

领克10/领克10+ 无论能源形式 领克都要快乐

态度原创

游戏
本地
教育
旅游
手机

LPL第二赛段:滔搏排名迅速滑落!JDG三局战胜TES

本地新闻

用青花瓷的方式,打开西溪湿地

教育要闻

女学霸发明“咯噔字体”,老师低分警告:别用个性挑战考试底线

旅游要闻

“旅游兴趣班”开启文旅经济新赛道

手机要闻

“iPhone Ultra”或将成为业内最易维修的折叠屏手机

无障碍浏览 进入关怀版