网易首页 > 网易号 > 正文 申请入驻

集体押注世界杯,AI为何要扮演“懂球佬”

0
分享至

2026年美加墨世界杯才刚刚拉开帷幕,而赛场外的AI(人工智能)赛事研判、实力比拼,早已先行开启。

日前,国产大模型Kimi(月之暗面)称将通过Agent(智能体)集群同时调度300个子Agent,公开预测104场世界杯赛事结果,并提出德国队或爆冷夺冠。Kimi同时上线了一场“押注”活动:奖池中有1万亿Tokens(词元),用户选队后球队赢了就可以瓜分Token,将体育赛事与AI用户运营深度绑定。

《每日经济新闻》记者(以下简称每经记者)注意到,千问也紧随其后上线了相关活动。每经记者实测发现,豆包、元宝、DeepSeek(深度求索)、文心一言等国产大模型在被问及“2026年世界杯谁会夺冠”时,多数预测答案为“西班牙队”,判断逻辑也高度趋同。

热闹之下,Kelly Bench(一个大模型评估测试平台)最新数据却显示,包括ChatGPT等在内的顶级模型在足球赌盘上表现惨淡。

Kimi、千问等AI大模型为何要“押注”世界杯?这背后,实际上是AI大模型行业的集体焦虑:当写诗、做题、对话的极致竞争走到尽头,各家厂商急于证明自己的产品能够理解复杂、动态、充满不确定性的现实世界。

借高关注度赛事制造用户体验入口

面对世界杯的巨大流量,一众品牌早已摩拳擦掌,这一次下场“押注”除了传统赞助商,还有手握万亿Tokens的AI大模型。

近日,Kimi发文称,将通过Agent集群同时调度300个子Agent公开预测赛事结果,并在每轮赛前公开预测、赛后复盘。

Kimi的预测策略并没有完全随大流。它并未否认当前多数主流模型将西班牙队和法国队列为夺冠最大热门,同样认为两者的夺冠概率位居前列,但它提出了另一个关注点:德国队的夺冠概率可能被市场低估。

当网友们热议“AI预测究竟准不准”“AI懂不懂球”时,Kimi在一 开始就坦承“我们的预测很可能是错的”,并称希望通过这次尝试,把分析过程、预测结果和赛后复盘放在同一个透明框架中。

此外,Kimi还拿出1万亿Tokens,用户预测冠军队、挑选的球队每次获胜就可以参与瓜分Token。截至6月11日18时,Kimi App(应用程序)显示,实时排行的队伍支持率TOP5分别为阿根廷、法国、西班牙、巴西、葡萄牙,有43.33%的参与用户选择了阿根廷。

那么,Kimi“押注”世界杯并豪掷万亿Tokens,究竟是能力展示,还是一次品牌营销?

长期关注世界杯等知名赛事的体育咨询专家、关键之道创始人张庆告诉每经记者,Kimi此次活动类似于春晚抢红包、集福瓜分奖金等互联网平台常用打法,更像一种营销活动。

“每一届世界杯都是巨大的流量池,各个企业都希望有机会参与,获得更多曝光、引流机会。而大模型天然适合做这类数据分析和预测。”张庆向每经记者指出,当下,大模型竞争激烈,尤其是用户注意力和使用频次的竞争,通过世界杯一方面会加持品牌声量,另一方面也有利于提升大模型的数据用户积累和活跃度。

深耕人工智能产业多年的技术专家王岩(化名)在接受每经记者采访时坦言,大模型预测世界杯冠军,是体育热点、Token补贴和Agent展示叠加形成的传播事件。

王岩认为,热点借势只是入口,真正的竞争点在于谁能把抽象模型能力转化为用户可感知的结果。这意味着,AI大模型企业在品牌传播上,不再只发布参数、榜单和技术报告,转为借高关注度赛事制造用户体验入口。而在商业竞争上各家模型争夺的则是用户心智、使用频次、社交传播和开发者注意力。

截至目前,多少用户参与了Kimi“押注”世界杯的活动?通过用Agent集群预测世界杯冠军,Kimi又将获得哪些方面的能力提升?Kimi方面向每经记者表示:“暂无回应”。

多款大模型预测西班牙队夺冠

不只Kimi,其他AI大模型玩家也试图“分一杯世界杯的羹”。例如,千问也推出“决战美加墨,与千问一起预测,赢万元现金”的活动,加入这场AI“秀肌肉”争夺战。

“我前两天也用DeepSeek、豆包预测了今年世界杯冠军,想对比它们谁分析的有道理,但我看到它们给出的预测结果和相关理由都有明显局限性。”张庆向每经记者分享道。

在国产大模型眼中,谁是今年的冠军队伍?每经记者实测DeepSeek、Kimi、豆包、元宝、千问、文心一言、智谱清言后发现:DeepSeek押宝法国队,Kimi看好阿根廷队,而千问、豆包、元宝、文心一言、智谱清言5款国产大模型则均支持西班牙队。

每款AI大模型给出的理由略有不同。值得注意的是,支持西班牙队的AI大模型判断逻辑高度趋同,核心理由之一均为“权威数据模型、机构高度一致看好”。

大模型的预测到底准不准

上海财经大学特聘教授胡延平向每经记者表示,AI大模型已经初步展露出基于全局动态信息和深度复杂推理的特定预测能力。“但足球是圆的,预测的成功率、精准度方面还有待观察。”

“世界杯冠军预测无疑是展示模型与智能体水准的一个绝佳机会,不过预测的效果也是一把双刃剑。个人预期这届世界杯,水准最高的预测模型,成功率能达到60%~80%。”胡延平说。

不过,Kelly Bench在2023~2024年赛季英格兰超级联赛的模拟中显示,其评估的每个前沿模型在整个赛季都亏损了,并且许多都经历了破产。

“AI更多的是一个辅助工具,基于战队历史战绩、世界杯排名、赔率、国际足联等大量数据的多维度预测,AI大模型呈现了客观数据统计,所以作为参考工具还是有意义的,但我不会完全依赖它的结果。”一位长期关注世界杯的资深球迷告诉每经记者。

在上述球迷看来,相比大模型的预测,每个球迷都更青睐自己喜欢的球队,喜好也会占一大部分判断,而且越到决赛越是球员临场发挥和心理上的博弈,不确定性太多了。

预测冠军是Agent能力的公开测试

当大模型争先恐后地给出夺冠热门队伍时,这场看似娱乐化的“AI押注战”背后,大家究竟想“秀”什么?又在集体“卷”什么?

“本轮大模型预测世界杯冠军,是生成式AI从问答工具走向公共事件运营的典型样本。”王岩向每经记者指出,公众看到的是冠军预测,企业展示的是Agent协同、长上下文处理、实时检索、概率解释和高并发服务能力,商业上争夺的则是用户时长、付费转化和资本叙事。

当下,AI大模型的竞争早已不局限于单纯的参数榜单,而是从“会聊天”转向“能办事”,从“比模型”转向“比场景”。然而,一项全球研究显示,在调研全球1250多家企业后,仅5%的公司实现了AI价值的规模化应用。Gartner(美国一家信息技术研究分析公司)数据也显示,截至2025年底,嵌入真正AI Agent的企业应用占比不足5%。

胡延平观察到,大模型和智能体正从对话走向任务,从预训练走向持续学习,从数据语料走向持续多维的现实感知。“预测世界杯冠军这类探索项目会加速这个进化过程。未来行动智能体所需要的能力体系,也是在走向‘感知—交互—决策—协同’这个方向。”

不过,王岩坦言,世界杯冠军预测可以成为Agent能力的公开压力测试,但不能自动证明Agent能力提升,大模型在这场“押注”中训练和检验的是长任务组织、概率校准和用户交互能力。

“Kimi的300个Agent代表分析覆盖面增加,不直接代表预测准确率提升。相关Agent任务Token消耗研究显示,同一任务的Token消耗可相差几十倍,更多Token并不必然带来更高准确率。”王岩向每经记者进一步分析。

正如王岩所言:“当前Agent的最大缺口,正在从‘能否给出合理计划’转向‘能否稳定完成长周期真实任务’。”这意味着,谁能率先落地“实战能力”,谁就将有机会在愈发激烈的争夺赛中脱颖而出。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
我照顾过一位93岁老太太,问她长寿秘诀,她说我这辈子没碰过男人

我照顾过一位93岁老太太,问她长寿秘诀,她说我这辈子没碰过男人

蝉吟槐蕊
2026-06-19 09:39:11
福耀科技大学王树国:各院系自负盈亏。自己都养不活,没真本事

福耀科技大学王树国:各院系自负盈亏。自己都养不活,没真本事

鬼菜生活
2026-06-20 01:57:13
杨幂,性感妖娆

杨幂,性感妖娆

TVB的四小花
2026-06-20 08:59:54
武契奇辞职前视察中企工地:我们将继续努力,感谢中国朋友

武契奇辞职前视察中企工地:我们将继续努力,感谢中国朋友

极目新闻
2026-06-19 10:29:51
猫喜欢在你身边睡觉,并非是它冷,而是它的灵眼看到了这3样东西

猫喜欢在你身边睡觉,并非是它冷,而是它的灵眼看到了这3样东西

古怪奇谈录
2026-06-17 10:59:29
陈冲回国真相曝光,不是婚姻破裂不是缺钱,无数人看哭了

陈冲回国真相曝光,不是婚姻破裂不是缺钱,无数人看哭了

一盅情怀
2026-06-19 08:44:57
C罗只是普通球员!葡萄牙1.4亿天才采访惹众怒 遭网暴+女友被波及

C罗只是普通球员!葡萄牙1.4亿天才采访惹众怒 遭网暴+女友被波及

我爱英超
2026-06-19 17:45:54
被追债36亿,万达没了,首富没了,王健林还剩什么?

被追债36亿,万达没了,首富没了,王健林还剩什么?

李云飞Afey
2026-06-02 16:32:32
老板娘你穿成这个样子,存心不让顾客好好吃饭吗,看都看饱了!

老板娘你穿成这个样子,存心不让顾客好好吃饭吗,看都看饱了!

那年秋天
2026-06-20 09:00:17
没有一个巨物恐惧症患者,能平静地走出广西......

没有一个巨物恐惧症患者,能平静地走出广西......

中科院物理所
2026-06-18 11:10:20
丈夫20亿年收竟推妻子下海?人气女优夏希栗改名回归挑战豪门人设

丈夫20亿年收竟推妻子下海?人气女优夏希栗改名回归挑战豪门人设

孤独的独角兽影视
2026-04-28 09:30:16
刚跌0.41-0.44元/升后,下次调价时间确定,汽柴油“补跌”开端!

刚跌0.41-0.44元/升后,下次调价时间确定,汽柴油“补跌”开端!

猪友巴巴
2026-06-19 17:25:03
帕斯与穆帅风波不会影响国米!若签帕莱斯特拉,将成队史第二高价

帕斯与穆帅风波不会影响国米!若签帕莱斯特拉,将成队史第二高价

国际足球冷雪
2026-06-20 08:35:11
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
社保大局已定?今明两年,灵活就业或断缴过社保的人,认准3不做

社保大局已定?今明两年,灵活就业或断缴过社保的人,认准3不做

临云史策
2026-06-19 14:45:36
上午好好的,中午送医院了,下午火化了,晚上别人开始吃席了

上午好好的,中午送医院了,下午火化了,晚上别人开始吃席了

医学原创故事会
2026-06-19 16:19:03
布伦森凭什么疯狂砍分?詹姆斯深度拆解:他是防守者的噩梦

布伦森凭什么疯狂砍分?詹姆斯深度拆解:他是防守者的噩梦

峰云峰雨
2026-06-20 07:18:39
72公里续航电摩只卖1398元?立马莱米这波清仓有点猛

72公里续航电摩只卖1398元?立马莱米这波清仓有点猛

摸鱼算法
2026-06-20 03:08:10
中国移动党组副书记王利民,履新司法部

中国移动党组副书记王利民,履新司法部

澎湃新闻
2026-06-19 13:03:10
斯皮尔伯格新片刚上映,UFO圈子全炸了

斯皮尔伯格新片刚上映,UFO圈子全炸了

影视情报室
2026-06-20 00:44:37
2026-06-20 09:32:49
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1595292文章数 2726680关注度
往期回顾 全部

科技要闻

Anthropic被禁,智谱却涨疯了

头条要闻

酷炫跑车在杭州深山里趴窝近半年 车主现身披露原因

头条要闻

酷炫跑车在杭州深山里趴窝近半年 车主现身披露原因

体育要闻

世界杯最不知名球员,没上场先涨粉600万

娱乐要闻

官媒发文,张柏芝终迎一大喜讯

财经要闻

Token低价陷阱

汽车要闻

惊出冷汗!重庆实测奥迪A5L,华为智驾这波操作绝了…

态度原创

教育
手机
数码
公开课
军事航空

教育要闻

今年高考一本线下降,二本线或上升,预测河南8大校分数线是多少

手机要闻

苹果也玩芯片游戏?20周年纪念版iPhone独享台积电全新先进制程

数码要闻

制造商Alogic推出一系列苹果Mac专用触控显示器产品

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

霸气!端午节最硬核的“龙舟”竞渡来了

无障碍浏览 进入关怀版