网易首页 > 网易号 > 正文 申请入驻

全球首个AI投资大赛结果出炉:阿里千问夺冠,美国四大模型均亏损

0
分享至

界面新闻记者 | 宋佳楠

11月4日,界面新闻获悉,全球首个AI大模型实时投资比赛“Alpha Arena”落下帷幕。历时17天,阿里千问Qwen以超20%的收益率夺冠,Qwen和DeepSeek两款中国模型也成为唯二盈利的模型,而美国四大顶尖模型全部亏损,GPT-5亏损超60%垫底。


该竞赛由美国专注于金融市场的AI实验室Nof1于10月18日发起,将多个AI大模型置于真实金融市场中进行自动化交易对决。首季竞赛邀请了包括GPT-5、Gemini 2.5 Pro、Grok 4、Claude 4.5 Sonnet、Qwen3 Max和DeepSeek V3.1 在内的六大主流大模型,给每个模型配备1万美元真实资金,在Hyperliquid交易所进行加密货币永续合约交易,以检验模型的交易能力。

竞赛采用统一输入方式,所有模型接收相同的市场数据和提示词,交易记录、持仓和账户价值实时公开,以保证比赛的公平性和透明度。此外,Nof1还允许AI模型“聊天互动”,让它们在模拟对话中辩论市场走势,展示决策逻辑,最终根据盈亏情况决出冠军。

比赛初期,六大模型相对谨慎,大约5天后,参赛模型大致分为三大阵营:阿里千问和DeepSeek处于领先态势,屡次互换第一,始终位列第一梯队;Claude Sonnet 4.5和Grok 4在相近策略驱动下,维持在第二阵营,略有盈利,整体仍亏损;GPT-5、Gemini 2.5 Pro两大模型则长期亏损垫底。


截至北京时间11月4日早上比赛结束,阿里千问最后超越DeepSeek,Qwen以超20%的胜率获胜;DeepSeek实现盈利,位列第二;Claude 4.5 Sonnet、Grok 4、Gemini 2.5 Pro和GPT-5四大海外模型均亏损,Gemini 2.5 Pro和GPT-5亏损尤为明显,截至最终持仓总市值仅为初始资金的三四成。

有行业人士指出,阿里千问和DeepSeek在实战中的表现,证明了中国模型在解决实际问题的强大潜力,AI对于场景的深刻理解,将成为大模型落地和未来全球AI竞赛的关键。

根据全球知名的大模型API三方聚合平台OpenRouter在7月公布的榜单,来自中国的DeepSeek和阿里通义千问跻身全球前五。其中,通义千问以10.4%的市场份额,超越OpenAI的4.7%,位列第四。

OpenRouter推文显示,当下成长最快前10大模型中有9个是开源的。其中,Qwen3-Coder调用量以近500亿Tokens高居第一,通义千问包揽前三,并在前十中占据五席。

而在今年9月,零一万物CEO李开复在长江CEO 20周年返校日庆典上表示,DeepSeek对中国AI发展的核心贡献在于推动了开源生态的形成。“如果十年后,我们回顾DeepSeek怎么让中国没有落后于美国,答案并非其技术能力本身,而是它带来了中国(大模型)开源时代。”

李开复提到,自DeepSeek开源以来,国内多家企业相继开源大模型,形成了“既开源、又比拼速度”的良性竞争局面。他认为,开源模式高度契合中国企业的学习特性,有望助力中国在AI领域缩小与美国的差距。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
演员蒋欣为穿礼服控制饮食到痛哭,称从小就健壮!“爸妈做的好吃的,我都没怎么吃”

演员蒋欣为穿礼服控制饮食到痛哭,称从小就健壮!“爸妈做的好吃的,我都没怎么吃”

鲁中晨报
2025-11-06 09:15:10
中国十强城市之争!南京坐稳第十,宁波领先天津

中国十强城市之争!南京坐稳第十,宁波领先天津

城市生态圈
2025-11-07 16:36:18
这回真是互扯头花了,辛芷蕾深夜发文怼“郝蕾”,网友:狐狸装纯

这回真是互扯头花了,辛芷蕾深夜发文怼“郝蕾”,网友:狐狸装纯

妙知
2025-11-07 15:00:30
先是图瓦总统,再是库页岛一把手,远东各地对中国,心态完全变了

先是图瓦总统,再是库页岛一把手,远东各地对中国,心态完全变了

混沌录
2025-10-07 23:43:17
太突然!广东一律师事务所被吊销执照!

太突然!广东一律师事务所被吊销执照!

知肇分子
2025-11-07 20:39:04
我退休52岁,找个48岁农村光棍,洞房夜他的一个举动,我泪流不止

我退休52岁,找个48岁农村光棍,洞房夜他的一个举动,我泪流不止

宝哥精彩赛事
2025-11-08 04:13:46
英国教授疑惑:我实在想不通,中国凭什么维持数千年的文明统一?

英国教授疑惑:我实在想不通,中国凭什么维持数千年的文明统一?

知鉴明史
2025-11-06 21:02:00
女主播找冷门发型师洗头,遭泼硫酸,发型师:我是老师,我不该死

女主播找冷门发型师洗头,遭泼硫酸,发型师:我是老师,我不该死

罪案洞察者
2025-11-07 14:05:29
中方就安世半导体事件表态后,欧盟高官公开发声,局面或许马上就要迎来反转了!

中方就安世半导体事件表态后,欧盟高官公开发声,局面或许马上就要迎来反转了!

健身狂人
2025-11-08 06:50:22
苹果发布 macOS 26.2 Tahoe 的首个公测版

苹果发布 macOS 26.2 Tahoe 的首个公测版

IT之家
2025-11-08 07:14:08
广东夫妻冷战,晒5天晚餐对比,网友笑喷了:太真实了

广东夫妻冷战,晒5天晚餐对比,网友笑喷了:太真实了

小鬼头体育
2025-11-08 03:49:56
1-3爆冷,张本智和仰天长啸,比输球可怕的是,日乒一哥地位悬了

1-3爆冷,张本智和仰天长啸,比输球可怕的是,日乒一哥地位悬了

大秦壁虎白话体育
2025-11-07 22:25:51
南宁市一栋评估值831万的别墅第三次拍卖,才532万还是流拍

南宁市一栋评估值831万的别墅第三次拍卖,才532万还是流拍

天天话事
2025-11-06 20:56:37
詹姆斯复出,湖迷们焦虑

詹姆斯复出,湖迷们焦虑

林子说事
2025-11-08 06:20:20
男子用2条毒蛇泡酒,12年后打开本想品尝美酒,谁知出现惊人现象

男子用2条毒蛇泡酒,12年后打开本想品尝美酒,谁知出现惊人现象

诡谲怪谈
2025-04-01 17:37:59
俄外长拉夫罗夫缺席俄罗斯内部会议,成为美俄峰会失败的罪魁祸首

俄外长拉夫罗夫缺席俄罗斯内部会议,成为美俄峰会失败的罪魁祸首

山河路口
2025-11-06 23:02:10
成都警方:男子造谣“龙泉山荒野求生大赛征集令”博取关注,被行拘

成都警方:男子造谣“龙泉山荒野求生大赛征集令”博取关注,被行拘

澎湃新闻
2025-11-08 00:36:03
你和异性最亲密的一次接触是啥?网友:相互勾引,在一起结婚生娃

你和异性最亲密的一次接触是啥?网友:相互勾引,在一起结婚生娃

解读热点事件
2025-10-06 00:10:03
1.5亿欧悍将回归!利物浦2大新援齐上阵,斯帅或笑傲光头德比

1.5亿欧悍将回归!利物浦2大新援齐上阵,斯帅或笑傲光头德比

锐评利物浦
2025-11-07 23:03:42
和老伴在香港住了半个月,我实话实说:跟网上说的真不太一样

和老伴在香港住了半个月,我实话实说:跟网上说的真不太一样

冬天来旅游
2025-10-26 12:11:41
2025-11-08 08:04:49
界面新闻 incentive-icons
界面新闻
只服务于独立思考的人群
958809文章数 1326523关注度
往期回顾 全部

科技要闻

75%赞成!特斯拉股东同意马斯克天价薪酬

头条要闻

媒体:一份非官方的美国就业数据 把美国投资者吓坏了

头条要闻

媒体:一份非官方的美国就业数据 把美国投资者吓坏了

体育要闻

是天才更是强者,18岁的全红婵迈过三道坎

娱乐要闻

王家卫的“看人下菜碟”?

财经要闻

荷兰政府:安世中国将很快恢复芯片供应

汽车要闻

美式豪华就是舒适省心 林肯航海家场地试驾

态度原创

艺术
手机
数码
家居
游戏

艺术要闻

Eric Drummond:加拿大90后年轻画家

手机要闻

iPhone18 Pro系列新进展:可变光圈+透明后盖,还有啥惊喜?

数码要闻

Ayaneo即将推出搭载Ryzen AI Max+ 395 APU的下一代掌机

家居要闻

现代自由 功能美学居所

海的那边是什么?我会自己去看"/> 主站 商城 论坛 自运营 登录 注册 海的那边是什么?我会自己去看 廉颇 2025-11-07 返回专栏首页 作者:...

无障碍浏览 进入关怀版