网易首页 > 网易号 > 正文 申请入驻

全球首个AI投资大赛结果出炉:阿里千问夺冠,美国四大模型均亏损

0
分享至

界面新闻记者 | 宋佳楠

11月4日,界面新闻获悉,全球首个AI大模型实时投资比赛“Alpha Arena”落下帷幕。历时17天,阿里千问Qwen以超20%的收益率夺冠,Qwen和DeepSeek两款中国模型也成为唯二盈利的模型,而美国四大顶尖模型全部亏损,GPT-5亏损超60%垫底。


该竞赛由美国专注于金融市场的AI实验室Nof1于10月18日发起,将多个AI大模型置于真实金融市场中进行自动化交易对决。首季竞赛邀请了包括GPT-5、Gemini 2.5 Pro、Grok 4、Claude 4.5 Sonnet、Qwen3 Max和DeepSeek V3.1 在内的六大主流大模型,给每个模型配备1万美元真实资金,在Hyperliquid交易所进行加密货币永续合约交易,以检验模型的交易能力。

竞赛采用统一输入方式,所有模型接收相同的市场数据和提示词,交易记录、持仓和账户价值实时公开,以保证比赛的公平性和透明度。此外,Nof1还允许AI模型“聊天互动”,让它们在模拟对话中辩论市场走势,展示决策逻辑,最终根据盈亏情况决出冠军。

比赛初期,六大模型相对谨慎,大约5天后,参赛模型大致分为三大阵营:阿里千问和DeepSeek处于领先态势,屡次互换第一,始终位列第一梯队;Claude Sonnet 4.5和Grok 4在相近策略驱动下,维持在第二阵营,略有盈利,整体仍亏损;GPT-5、Gemini 2.5 Pro两大模型则长期亏损垫底。


截至北京时间11月4日早上比赛结束,阿里千问最后超越DeepSeek,Qwen以超20%的胜率获胜;DeepSeek实现盈利,位列第二;Claude 4.5 Sonnet、Grok 4、Gemini 2.5 Pro和GPT-5四大海外模型均亏损,Gemini 2.5 Pro和GPT-5亏损尤为明显,截至最终持仓总市值仅为初始资金的三四成。

有行业人士指出,阿里千问和DeepSeek在实战中的表现,证明了中国模型在解决实际问题的强大潜力,AI对于场景的深刻理解,将成为大模型落地和未来全球AI竞赛的关键。

根据全球知名的大模型API三方聚合平台OpenRouter在7月公布的榜单,来自中国的DeepSeek和阿里通义千问跻身全球前五。其中,通义千问以10.4%的市场份额,超越OpenAI的4.7%,位列第四。

OpenRouter推文显示,当下成长最快前10大模型中有9个是开源的。其中,Qwen3-Coder调用量以近500亿Tokens高居第一,通义千问包揽前三,并在前十中占据五席。

而在今年9月,零一万物CEO李开复在长江CEO 20周年返校日庆典上表示,DeepSeek对中国AI发展的核心贡献在于推动了开源生态的形成。“如果十年后,我们回顾DeepSeek怎么让中国没有落后于美国,答案并非其技术能力本身,而是它带来了中国(大模型)开源时代。”

李开复提到,自DeepSeek开源以来,国内多家企业相继开源大模型,形成了“既开源、又比拼速度”的良性竞争局面。他认为,开源模式高度契合中国企业的学习特性,有望助力中国在AI领域缩小与美国的差距。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
4连败,从争冠热门到西部鱼腩,双赢交易如今变成单方面血亏

4连败,从争冠热门到西部鱼腩,双赢交易如今变成单方面血亏

毒舌NBA
2025-11-09 21:40:07
打出加盟奇才后的最强之战,前火箭侧翼新星终于开始回暖了?

打出加盟奇才后的最强之战,前火箭侧翼新星终于开始回暖了?

稻谷与小麦
2025-11-09 22:20:37
医疗圈再爆大瓜,网友态度意外反转,评论区真相惊人!

医疗圈再爆大瓜,网友态度意外反转,评论区真相惊人!

麦芽是个小趴菜
2025-11-09 11:33:00
赵露思印堂发黑!劈叉女星让女主持爆哭!

赵露思印堂发黑!劈叉女星让女主持爆哭!

八卦疯叔
2025-11-09 14:10:03
1966年傅雷夫妇选择自缢,儿子傅聪多年后回忆:父亲之死是必然,母亲本不该是这样的结局

1966年傅雷夫妇选择自缢,儿子傅聪多年后回忆:父亲之死是必然,母亲本不该是这样的结局

花开无田
2025-10-27 23:37:04
西贝一个月闭店近10家,工作人员称系“统一安排”;也有门店大排长龙,接连发放100元、50元券,顾客消费205元实付5元

西贝一个月闭店近10家,工作人员称系“统一安排”;也有门店大排长龙,接连发放100元、50元券,顾客消费205元实付5元

极目新闻
2025-11-09 21:23:34
排名赛首冠,22岁吴宜泽10-6夺斯诺克国锦赛冠军,中国时代快来了

排名赛首冠,22岁吴宜泽10-6夺斯诺克国锦赛冠军,中国时代快来了

真理是我亲戚
2025-11-09 21:39:25
古二再放录音,《繁花》剧组正式回应,但评论区直接炸了

古二再放录音,《繁花》剧组正式回应,但评论区直接炸了

妙知
2025-11-08 22:56:25
颠覆认知!美国发明新型人工神经元,或从物理上复刻人类大脑

颠覆认知!美国发明新型人工神经元,或从物理上复刻人类大脑

徐德文科学频道
2025-11-07 22:26:50
莫迪变脸!印度4艘军舰闯进南海,不料中方直接“上硬菜”

莫迪变脸!印度4艘军舰闯进南海,不料中方直接“上硬菜”

谷盟1
2025-11-08 11:40:35
寿命长短与喝酒有很大关系?调查11558名饮酒者,终于得出答案

寿命长短与喝酒有很大关系?调查11558名饮酒者,终于得出答案

39健康网
2025-11-06 10:34:05
2万人膜拜!38岁梅西奔袭20米,1V4不讲理低射破门,3场连斩轰4球

2万人膜拜!38岁梅西奔袭20米,1V4不讲理低射破门,3场连斩轰4球

风过乡
2025-11-09 09:58:47
11月18日上市!华为旗舰大6座SUV,库里南外观+迈巴赫同款设计

11月18日上市!华为旗舰大6座SUV,库里南外观+迈巴赫同款设计

芭比衣橱
2025-11-09 10:02:06
郭台铭做梦也没想到,第二个富士康诞生!净利润百亿,员工24万

郭台铭做梦也没想到,第二个富士康诞生!净利润百亿,员工24万

哄动一时啊
2025-11-09 19:27:29
马筱梅挺孕肚带继女外出,小玥儿驼背揪衣角,这是缺乏安全感了吧

马筱梅挺孕肚带继女外出,小玥儿驼背揪衣角,这是缺乏安全感了吧

娱乐顺风车666
2025-11-08 09:30:48
不装了?大陆回应武统后,郑丽文语出惊人,公开喊出“武力保台”

不装了?大陆回应武统后,郑丽文语出惊人,公开喊出“武力保台”

泠泠说史
2025-11-08 17:17:23
本届全运会东道主粤港澳代表团一起入场

本届全运会东道主粤港澳代表团一起入场

环球网资讯
2025-11-09 21:53:05
人民网评:“人民咖啡馆”打着“人民”的旗号招摇过市 不妥!人民咖啡馆发文致歉:迅速调整!

人民网评:“人民咖啡馆”打着“人民”的旗号招摇过市 不妥!人民咖啡馆发文致歉:迅速调整!

闪电新闻
2025-11-08 15:09:12
荷兰人自己都看不下去了

荷兰人自己都看不下去了

牛弹琴
2025-11-09 10:45:18
湖南发现一株“极品”兰花,被人50元买走,却在兰展卖出了天价

湖南发现一株“极品”兰花,被人50元买走,却在兰展卖出了天价

单手搓核弹
2025-11-08 09:53:26
2025-11-09 23:32:49
界面新闻 incentive-icons
界面新闻
只服务于独立思考的人群
959116文章数 1326559关注度
往期回顾 全部

科技要闻

黄仁勋亲赴台积电“讨要更多芯片”

头条要闻

两位欧洲政要将同日访华:一人曾被誉为欧洲"最帅王子"

头条要闻

两位欧洲政要将同日访华:一人曾被誉为欧洲"最帅王子"

体育要闻

他只想默默地拿走最后一亿美元

娱乐要闻

《繁花》事件影响:唐嫣工作被取消

财经要闻

10月CPI同比涨0.2% PPI同比下降2.1%

汽车要闻

钛7月销破2万 霜雾灰与青峦翠配色正式开启交付

态度原创

健康
家居
本地
艺术
公开课

超声探头会加重受伤情况吗?

家居要闻

现代自由 功能美学居所

本地新闻

这届干饭人,已经把博物馆吃成了食堂

艺术要闻

她眼中的世界丰富多彩 | Erin Hanson 2025作品

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版