网易首页 > 网易号 > 正文 申请入驻

大模型竞争的下半场,为何场景为王?

0
分享至

图片系AI生成

场景的深度与广度正成为大模型价值的真正标尺。

2025年4月发布的斯坦福AI指数报告,揭示了一些有趣的事实。2024年,TOP1和TOP10的模型的差距为12%,但如今,它们的差距已经锐减至5%。

这说明头部模型的效果没有本质差别,大模型的进化已经到达瓶颈期,与此同时,顶级模型能力也不再被小部分人垄断。随之变化的还有成本和参数等层面。与两年前相比,38亿参数的小模型就能实现之前5400亿参数模型的效果。

在大规模多任务语言理解(MMLU)基准测试中达到GPT-3.5水平(MMLU准确率64.8%)的AI模型调用成本,已从2022年11月的20美元/每百万token,骤降至2024年10月的0.07美元/每百万token(谷歌DeepMind的Gemini-1.5-Flash-8B模型),18个月内成本下降280倍。

当模型能力不再是壁垒,场景穿透力成为新的竞争维度。单纯刷榜失去意义,不论大厂还是初创,都在寻找垂直场景深度、逻辑可靠性与终端适配性,本质上是在某一个具体的场景中,验证“效率-性能-安全”的三角平衡。

而就钛媒体接触和收集到的场景来看,过去三年,也呈现出明显从「技术试水」到「价值深耕」的过渡。

2023-2024年是通用场景的探索期,以技术验证为主,主流大模型聚焦通用能力测试,文本生成、多模态交互等,主要应用于内容创作等场景,而在一些亟需确定性的场景,能力稍显不足。

某银行引入通用模型后,反欺诈误报率居高不下,反映出早期模型在专业场景水土不服;某医院的人工辅助诊疗,强依赖人工标注数据,且 NMPA 审批周期长,商业化进程缓慢;大模型的训练需高额投入,导致多数企业处于观望状态,仅头部机构能承担技术验证成本。

大模型场景的闭环系统尚未跑通,诸多要素不健全,这也是技术发展的必经之路,到了今年则有很大不同。

“空有模型无用,甚至一些企业认为模型应该是免费的,他们开放了核心生产场景和模型厂商共创,模型厂商才是需求更迫切的一方。”一位大型企业高管表示。“无场景支撑的通用模型,正面临用户留存低、付费意愿弱的商业化困局。”

在刚刚落幕的2025年全球数字经济大会上,北京正式揭晓了2025年人工智能应用场景“揭榜挂帅”名单,共涉及12个领域,包括制造业、教育、医疗、金融、环境、能源、文旅、智慧水厂、街道安全、建筑以及智慧城市等,总预算金额高达1.1亿元。

上至政策制定方,下至业务需求方,大模型产业要向前,都在把大模型推到千行百业的场景中。

钛媒体App将大模型应用场景分成三类,首先是短期收益明确的“效率型”场景,例如私有化部署+ RAG(检索增强生成)做企业知识库,解决数据安全与幻觉问题,再如之前已有的算法场景优化,供应链的周转优化,智能制造的预测性维护等,这些场景入手容易,产出可见,是多数企业小规模试验的优先选择。

其次是需求爆发中的“创造力型”场景,例如多模态生成技术(文生图、文生视频),可将游戏素材制作成本大幅降低,AI Agent驱动游戏NPC动态交互,提高玩家留存率

最后是最难的,长周期高门槛的“复杂系统型”场景,比如医疗健康的辅助诊断,需跨域融合基因数据、影像学知识,政策合规要求高,再如自动驾驶,依赖VLM(视觉语言模型)与端到端算法融合,技术成熟度与法规滞后制约商业化,价值足够大,却也是难啃的骨头。

钛媒体从2023年初,就持续关注场景应用,创设《创新场景50》栏目,挖掘、报道市面上真正有价值的技术场景。综合去年「创新场景50」系列榜单,钛媒体发现了几个趋势,首先,大模型创新场景处于浅层、实验性、内部场景居多,深层、规模化、外部场景较少。

但也有一些不错的场景出现。例如首旅用大模型为6300家酒店客房精准定价;大模型智能体应用“闺蜜AI医生”,女性用户问答准确率达80%;借助大模型技术,货运物流智能接单效率提升75%;基于大模型的深基坑风险管理Agent,提高管控效率和准确率;大模型落地场外衍生品交易场景,撮合成功率增长 3 倍,等等创新场景。

此外,我们明显看到了中大型企业和政府等行业的进展,在宏观经济的逆周期,以及所处行业环境的大背景下,更多企业迫于外力加速了创新场景的实践,论投入产出比,论直接和间接效果,数字化投入带来的回报都在优先级之列。

最后,创新场景领先者给与我们的反馈是,场景创新其实一直都在发生,应当成为企业的数字化惯性,而不是数字化冲动,不论创新场景的大和小、深和浅,及早实践最重要。

在我们看来,变化的是技术,不变的是需求,大模型必然会走向场景为王,并将在千行百业中兑现价值,这将是未来较长一段时间的主线。大模型时代的创新场景应该是什么样?行业都在摸索中前行,我们希望听到更多真实的声音。

2024创新场景的获奖企业各有各的特色,集合往年优秀创新场景参与方的后续发展来看,除了能得到广阔的曝光,还有机会登上更大的舞台。例如去年创新场景获奖企业中能坤域,旗下低空全自动充电机器人开创性地实现了“机器人找车”的主动服务模式,入选央视《赢在AI+》并晋级全国总决赛。

创新场景的评审方包括各大企业CXO级别技术和管理层,他们将为行业厘清真实的发展脉络。钛媒体将链接更多渠道和资源推广创新场景,让更好的创新场景,先一步被看见、发掘和变现。在评选中脱颖而出的获奖创新场景,更将获得钛媒体矩阵持续曝光,包括内容层面的宣传,以及参与钛媒体全年各种含金量极高活动的潜在合作机会。

2025年度「创新场景 TOP 50」榜单评选征集启动 将面向国内从事企业数字化与人工智能相关的技术/服务/产品应用的企业或科研机构,征集场景解决方案。 备注说明:场景案例对应的产品或服务需已实际落地,并具有创新性和示范性。 【评选周期】 申报日期: 2025年7月8日起~8月22日止 公开投票及专家评审: 2025年8月23日起~8月31日止 申报链接:https://m.tmtpost.com/post/cj50 申报相关问题请扫码添加工作人员微信

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
盘点岛国十位下过马的现役女老师

盘点岛国十位下过马的现役女老师

碧波万览
2026-02-02 00:24:55
齐沃:我绝对不希望看到大家习惯于维持一种低强度的比赛节奏

齐沃:我绝对不希望看到大家习惯于维持一种低强度的比赛节奏

懂球帝
2026-02-02 06:39:11
海上金矿南极磷虾:储量10亿吨,全球疯狂捕捞,中国或成最大黑马

海上金矿南极磷虾:储量10亿吨,全球疯狂捕捞,中国或成最大黑马

肖兹探秘说
2026-01-31 12:49:39
上海怎么得到他?卢伟:古德温有效助攻至少10次以上表现非常好

上海怎么得到他?卢伟:古德温有效助攻至少10次以上表现非常好

狼叔评论
2026-02-01 23:02:08
岛国暗黑界第一盛世美颜 —— 桃谷绘里香

岛国暗黑界第一盛世美颜 —— 桃谷绘里香

碧波万览
2026-01-28 00:55:03
山东莒南县:专项资金被挪用导致上百名农民工资无钱发放

山东莒南县:专项资金被挪用导致上百名农民工资无钱发放

闲敲棋子落
2026-02-01 16:23:01
为何输青岛?许利民给出答案,很实在但没啥用,球迷:佩服这张嘴

为何输青岛?许利民给出答案,很实在但没啥用,球迷:佩服这张嘴

萌兰聊个球
2026-02-01 22:11:04
回国了我才敢说:委内瑞拉,是我去过的所有国家中,最被看轻的!

回国了我才敢说:委内瑞拉,是我去过的所有国家中,最被看轻的!

阿纂看事
2026-01-09 09:48:35
蒙古国首都骚乱再起,社会矛盾愈发尖锐,反华到底图啥

蒙古国首都骚乱再起,社会矛盾愈发尖锐,反华到底图啥

素衣读史
2026-01-24 17:12:53
欠李嘉诚一个道歉?巴拿马强行收回两个港口,怪大公报?

欠李嘉诚一个道歉?巴拿马强行收回两个港口,怪大公报?

数字财经智库
2026-02-01 17:05:08
郭台铭栽了?富士康郑州厂恐停产,苹果严令调查

郭台铭栽了?富士康郑州厂恐停产,苹果严令调查

牛锅巴小钒
2026-02-01 17:07:56
华西村那头1吨金牛,15年后竟成最成功的投资?

华西村那头1吨金牛,15年后竟成最成功的投资?

财经保探长
2026-01-30 18:38:42
重庆一中学家委会负责人要求每人交263.3元,再换成现金给班主任且使用明细不公示 ,家长报警

重庆一中学家委会负责人要求每人交263.3元,再换成现金给班主任且使用明细不公示 ,家长报警

扬子晚报
2026-01-31 20:22:18
27岁男星宣布退圈,妻子是大9岁李心艾,混不出头要回家当老总了

27岁男星宣布退圈,妻子是大9岁李心艾,混不出头要回家当老总了

大铁猫娱乐
2026-02-01 12:49:39
龙赛罗:面对巴列卡诺这样的对手,皇马实在不该踢得如此狼狈

龙赛罗:面对巴列卡诺这样的对手,皇马实在不该踢得如此狼狈

懂球帝
2026-02-02 01:10:09
赵露思肉肉回来了,气血充盈了,珠圆玉润的超级美

赵露思肉肉回来了,气血充盈了,珠圆玉润的超级美

TVB的四小花
2026-01-31 16:08:39
侍卫救了乾隆的命,乾隆问他要何赏赐?侍卫:就赏我一个宫女吧

侍卫救了乾隆的命,乾隆问他要何赏赐?侍卫:就赏我一个宫女吧

铭记历史呀
2026-01-26 19:47:25
申花多名球员号码变化:李可穿8号,徐皓阳穿回21号

申花多名球员号码变化:李可穿8号,徐皓阳穿回21号

懂球帝
2026-02-01 22:00:20
个人股东分红,不用缴个税了!

个人股东分红,不用缴个税了!

审计之家
2026-01-28 19:58:41
豪掷 1.73 亿!曼城瞄准世界最佳中场 巴萨要慌了?

豪掷 1.73 亿!曼城瞄准世界最佳中场 巴萨要慌了?

澜归序
2026-02-01 06:16:46
2026-02-02 07:04:49
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
129210文章数 861746关注度
往期回顾 全部

科技要闻

10亿元宝红包突袭 复刻微信支付还是微视?

头条要闻

特朗普又有疯狂想法:白宫格斗赛 首都飙赛车

头条要闻

特朗普又有疯狂想法:白宫格斗赛 首都飙赛车

体育要闻

德约大度祝贺阿卡 幽默互动逗笑纳达尔

娱乐要闻

春晚第三次联排阵容曝光:全是实力派

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

游戏
教育
亲子
旅游
公开课

末期癌症玩家圆梦《毁灭战士》!id公开致敬

教育要闻

语不惊人死不休,立刚反对学英语有些着魔了,又出新谬论

亲子要闻

兰姐带玥儿看北京新学校,玥儿一待俩小时,筱梅的话终于有人信了

旅游要闻

“你好!中国”亮相2026马德里国际旅游展 | 新民侨梁

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版