网易首页 > 网易号 > 正文 申请入驻

全球首个AI投资大赛结果出炉:阿里千问夺冠,美国四大模型均亏损

0
分享至

界面新闻记者 | 宋佳楠

11月4日,界面新闻获悉,全球首个AI大模型实时投资比赛“Alpha Arena”落下帷幕。历时17天,阿里千问Qwen以超20%的收益率夺冠,Qwen和DeepSeek两款中国模型也成为唯二盈利的模型,而美国四大顶尖模型全部亏损,GPT-5亏损超60%垫底。


该竞赛由美国专注于金融市场的AI实验室Nof1于10月18日发起,将多个AI大模型置于真实金融市场中进行自动化交易对决。首季竞赛邀请了包括GPT-5、Gemini 2.5 Pro、Grok 4、Claude 4.5 Sonnet、Qwen3 Max和DeepSeek V3.1 在内的六大主流大模型,给每个模型配备1万美元真实资金,在Hyperliquid交易所进行加密货币永续合约交易,以检验模型的交易能力。

竞赛采用统一输入方式,所有模型接收相同的市场数据和提示词,交易记录、持仓和账户价值实时公开,以保证比赛的公平性和透明度。此外,Nof1还允许AI模型“聊天互动”,让它们在模拟对话中辩论市场走势,展示决策逻辑,最终根据盈亏情况决出冠军。

比赛初期,六大模型相对谨慎,大约5天后,参赛模型大致分为三大阵营:阿里千问和DeepSeek处于领先态势,屡次互换第一,始终位列第一梯队;Claude Sonnet 4.5和Grok 4在相近策略驱动下,维持在第二阵营,略有盈利,整体仍亏损;GPT-5、Gemini 2.5 Pro两大模型则长期亏损垫底。


截至北京时间11月4日早上比赛结束,阿里千问最后超越DeepSeek,Qwen以超20%的胜率获胜;DeepSeek实现盈利,位列第二;Claude 4.5 Sonnet、Grok 4、Gemini 2.5 Pro和GPT-5四大海外模型均亏损,Gemini 2.5 Pro和GPT-5亏损尤为明显,截至最终持仓总市值仅为初始资金的三四成。

有行业人士指出,阿里千问和DeepSeek在实战中的表现,证明了中国模型在解决实际问题的强大潜力,AI对于场景的深刻理解,将成为大模型落地和未来全球AI竞赛的关键。

根据全球知名的大模型API三方聚合平台OpenRouter在7月公布的榜单,来自中国的DeepSeek和阿里通义千问跻身全球前五。其中,通义千问以10.4%的市场份额,超越OpenAI的4.7%,位列第四。

OpenRouter推文显示,当下成长最快前10大模型中有9个是开源的。其中,Qwen3-Coder调用量以近500亿Tokens高居第一,通义千问包揽前三,并在前十中占据五席。

而在今年9月,零一万物CEO李开复在长江CEO 20周年返校日庆典上表示,DeepSeek对中国AI发展的核心贡献在于推动了开源生态的形成。“如果十年后,我们回顾DeepSeek怎么让中国没有落后于美国,答案并非其技术能力本身,而是它带来了中国(大模型)开源时代。”

李开复提到,自DeepSeek开源以来,国内多家企业相继开源大模型,形成了“既开源、又比拼速度”的良性竞争局面。他认为,开源模式高度契合中国企业的学习特性,有望助力中国在AI领域缩小与美国的差距。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
王中磊破产,携全家搬出庄园住进别墅,老婆愁眉苦脸被迫接受降级

王中磊破产,携全家搬出庄园住进别墅,老婆愁眉苦脸被迫接受降级

老吴教育课堂
2025-11-14 13:49:16
官方公布小米汽车最新奖项:获得2025最佳结构奖

官方公布小米汽车最新奖项:获得2025最佳结构奖

手机中国
2025-11-13 10:46:03
突发 | “峰哥”被禁止关注!昨日发文称“无限期退出互联网”!

突发 | “峰哥”被禁止关注!昨日发文称“无限期退出互联网”!

天津广播
2025-11-14 18:12:05
当陈松伶和小李琳同框,才发现女人到中年,幸不幸福都写在脸上

当陈松伶和小李琳同框,才发现女人到中年,幸不幸福都写在脸上

喵喵娱乐团
2025-11-14 16:05:23
万万没想到,打败彩礼的竟然是社保

万万没想到,打败彩礼的竟然是社保

诗词中国
2025-11-11 20:03:55
杨兰兰案最新后续:第四次开庭否认所有指控,最后可能是不了了之

杨兰兰案最新后续:第四次开庭否认所有指控,最后可能是不了了之

热风追逐者
2025-11-14 15:02:09
性生活最值钱的7分钟,做对了爽到不行!老夫老妻也秒回热恋期

性生活最值钱的7分钟,做对了爽到不行!老夫老妻也秒回热恋期

小飞爱生活1987
2025-11-14 10:36:31
不出意外的话!苏林会成为第二个黎笋

不出意外的话!苏林会成为第二个黎笋

近史谈
2025-11-02 18:54:35
来中国?J罗正在紧急寻找下家:曾传出青岛西海岸想引进他!

来中国?J罗正在紧急寻找下家:曾传出青岛西海岸想引进他!

邱泽云
2025-11-14 12:28:51
钱再多有什么用?57岁李克勤“家丑”被曝,给中年夫妻提了个醒

钱再多有什么用?57岁李克勤“家丑”被曝,给中年夫妻提了个醒

书雁飞史oh
2025-11-14 19:12:25
向佑彻底没救了!现身南昌酒吧,新交的女友又胖又颓,烟酒不离手

向佑彻底没救了!现身南昌酒吧,新交的女友又胖又颓,烟酒不离手

喜欢历史的阿繁
2025-11-12 01:28:08
吉林小卖店老板娘奸杀案:体内只有嫌疑人唾液,犯罪动机令人崩溃

吉林小卖店老板娘奸杀案:体内只有嫌疑人唾液,犯罪动机令人崩溃

易玄
2025-11-02 12:09:58
《鬼灭之刃》首映,好评如潮,看完我只想说:日漫这样拍才对味!

《鬼灭之刃》首映,好评如潮,看完我只想说:日漫这样拍才对味!

青橘罐头
2025-11-14 16:19:39
董路:U22国足踢韩国队输不了 安东尼奥怕球盲骂才不敢打541

董路:U22国足踢韩国队输不了 安东尼奥怕球盲骂才不敢打541

桃叶渡春
2025-11-14 14:07:32
比邓文迪还狠!她离婚拿走亿万豪宅,光古董就5000w美金…

比邓文迪还狠!她离婚拿走亿万豪宅,光古董就5000w美金…

陈天宇
2025-11-09 00:09:24
55岁大妈不顾女儿劝阻,与网恋男友相见,7天后去医院检查身体愣住

55岁大妈不顾女儿劝阻,与网恋男友相见,7天后去医院检查身体愣住

罪案洞察者
2025-08-14 14:56:33
年终奖我一毛没有,打卡离开,退公司群,老板:八千万订单只认你

年终奖我一毛没有,打卡离开,退公司群,老板:八千万订单只认你

朝暮书屋
2025-11-07 18:22:47
这个发现必将震惊世界!黄土高原的地下,埋藏着这个璀璨的遗迹

这个发现必将震惊世界!黄土高原的地下,埋藏着这个璀璨的遗迹

小莜读史
2025-11-14 15:38:00
有人喊郑丽文下台后,在两岸关系上,马英九心腹亮出郑丽文的底牌

有人喊郑丽文下台后,在两岸关系上,马英九心腹亮出郑丽文的底牌

DS北风
2025-11-14 14:58:15
离婚1年后,浙江29岁CEO现身相亲市场,被吐槽惨了!公司年营业额过亿

离婚1年后,浙江29岁CEO现身相亲市场,被吐槽惨了!公司年营业额过亿

鲁中晨报
2025-11-13 20:27:06
2025-11-14 20:31:00
界面新闻 incentive-icons
界面新闻
只服务于独立思考的人群
963147文章数 1326749关注度
往期回顾 全部

科技要闻

京东“失去的五年”后,找到新增长了吗?

头条要闻

荒野求生赛唯一女选手"冷美人"退赛 本人表示"不甘心"

头条要闻

荒野求生赛唯一女选手"冷美人"退赛 本人表示"不甘心"

体育要闻

40岁C罗肘击染红 离场时怒骂对手主帅

娱乐要闻

王家卫让古二替秦雯写剧情主线?

财经要闻

统计局:前10月房地产开发投资下降14.7%

汽车要闻

小鹏X9超级增程动态评测全网首发 高速实测车内65分贝

态度原创

教育
房产
亲子
健康
本地

教育要闻

“小学生选大队委,堪比考公”,宝妈分享题库,网友:时代不同了

房产要闻

共话产业变革下的投资新思维与新机遇|蓝湾财富论坛精华

亲子要闻

突发!3岁幼童疝气小肠坏死,爸爸执意拔氧气管,妈妈跪地哀求

金振口服液助力科学应对呼吸道疾病

本地新闻

云游安徽 | 江声浩荡阅千年,文脉相承看芜湖

无障碍浏览 进入关怀版