网易首页 > 网易号 > 正文 申请入驻

中国大模型赢下AI投资大赛:阿里千问、DeepSeek盈利领跑,GPT-5垫底

0
分享至

六款全球顶尖AI(人工智能)大模型参与的实盘投资比赛落下帷幕,阿里千问最终反超DeepSeek获得冠军。

当地时间11月3日下午5点,美国AI研究平台Nof1宣布,从10月18日开始的大模型实盘投资比赛Alpha Arena正式落幕。六名参赛者中,阿里千问Qwen3-Max最终凭借突破20%的收益率拿下了本届大赛的冠军,DeepSeek v3.1位居第二,账户金额比第三名高出3000多美元,两款中国模型也是全场唯二盈利的大模型。而来自美国的四款大模型全线亏损,OpenAI的GPT-5亏损超60%垫底。

本次比赛集合了Qwen3-Max、DeepSeek v3.1、OpenAI的GPT-5、谷歌Gemini 2.5 Pro、Anthropic的Claude Sonnet 4.5和xAI的Grok 4这六大全球顶尖模型。在比赛中,为了衡量AI的投资能力,Nof1给每个模型账户发放了一万美元的启动资金,让它们通过Hyperliquid平台在真实市场自主交易数字货币。

由于在整个比赛过程不能有人插手,意味着大模型需要自己识别买入机会、决定买入仓位、判断买点卖点,并且实时管理风险。在过程中,系统会不断向模型输入当前的账户状态、持仓情况、市场价格和技术指标,模型需要依靠这些信息做出动态判断。

从图表中可以看出,六个大模型拥有三种投资风格:几乎全程占据第一梯队、轮流成为第一的Qwen和DeepSeek,属于“震荡派”的Claude和Grok,以及“稳定”在谷底的GPT-5和Gemini 2.5 Pro。


比赛结果。来源:Nof1

在比赛过程中,DeepSeek的表现一直很“稳”,历史最高收益率一度达到惊人的130%。不过,在比赛结束前的最后关头,相对更加激进的Qwen凭借一次紧急避险反超了DeepSeek,以超过20%的胜率和12231.82美元的账户总额获得冠军。同时,GPT-5和Gemini 2.5 Pro的一万美元本金只剩下了40%左右。

从过往交易的统计中可以看出,Gemini和GPT的买进卖出行为最为频繁,尤其是Gemini,有时持仓时间仅有数分钟;Anthropic的Claude和xAI的Grok则表现相对保守,持仓时间较长,交易数较少。

Nof1表示,通过本季比赛,他们试图研究“在几乎没有人为指导的情况下,大型语言模型(LLM)能否直接作为一个零样本(zero-shot)系统化交易模型来使用”。

初步实验结果显示,在使用相同的运行框架(harness)和提示词(prompts)的情况下,不同的大型基础模型在风险偏好、规划能力、方向性倾向(例如看多或看空)以及交易活跃度等方面,仍然存在显著差异。同时,团队还发现,这些模型“对看似微小的提示词改动非常敏感”。

Nof1表示,很快将会举办下一季比赛,团队将引入多提示词、多实例、交易历史等机制,以增强模型的稳定性与评估深度。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
3:3!亚马尔独造2球,巴萨逃过绝杀+欧冠爆冷,4轮7分跌出晋级区

3:3!亚马尔独造2球,巴萨逃过绝杀+欧冠爆冷,4轮7分跌出晋级区

阿超他的体育圈
2025-11-06 06:09:11
37岁李易峰现状!又胖又秃颜值崩塌,性需求太大,女朋友控制不住

37岁李易峰现状!又胖又秃颜值崩塌,性需求太大,女朋友控制不住

八星人
2025-11-03 14:53:00
文晏回应争奖!直言不认识白百何否认沪圈投资,白百何再次内涵

文晏回应争奖!直言不认识白百何否认沪圈投资,白百何再次内涵

萌神木木
2025-11-05 22:51:26
同学聚会每人出9800元,我没去,隔天警察上门:昨夜你同学出事了

同学聚会每人出9800元,我没去,隔天警察上门:昨夜你同学出事了

红豆讲堂
2025-11-05 16:50:03
杨瀚森方回应近期争议:不存在暴饮暴食,食谱都是由队内专门制订,杨瀚森很珍惜征战NBA的机会

杨瀚森方回应近期争议:不存在暴饮暴食,食谱都是由队内专门制订,杨瀚森很珍惜征战NBA的机会

环球网资讯
2025-11-05 19:38:05
“神仙租户”退租时房内锃亮反光,房东落泪收房:出租五年多,感觉像失恋了,失去这么好一个租户

“神仙租户”退租时房内锃亮反光,房东落泪收房:出租五年多,感觉像失恋了,失去这么好一个租户

极目新闻
2025-11-05 16:08:13
美财长称中国是“不可靠的伙伴”,外交部:中国对美政策保持稳定性

美财长称中国是“不可靠的伙伴”,外交部:中国对美政策保持稳定性

澎湃新闻
2025-11-05 15:18:30
上海地铁“霸腿”老人身份曝光!有网友自称是邻居,爆料更多内幕

上海地铁“霸腿”老人身份曝光!有网友自称是邻居,爆料更多内幕

不写散文诗
2025-11-06 00:01:13
龚正会见格鲁吉亚总理科巴希泽

龚正会见格鲁吉亚总理科巴希泽

澎湃新闻
2025-11-05 21:42:28
爸爸去哪儿6个孩子现状:有人进国家队,有人出家,有人出国断联

爸爸去哪儿6个孩子现状:有人进国家队,有人出家,有人出国断联

观察鉴娱
2025-11-04 09:35:35
果敢四大家族残害中国人14年,因一神秘女子失踪遭同盟军清剿

果敢四大家族残害中国人14年,因一神秘女子失踪遭同盟军清剿

真实故事汇
2024-10-05 11:35:24
普京不想再打了,俄军打下来的领土,足够给1亿俄罗斯人一个交待

普京不想再打了,俄军打下来的领土,足够给1亿俄罗斯人一个交待

博览历史
2025-10-27 08:20:12
少年被打放狠话“等我20岁杀你全家”,五年后男子除夕将仇家灭门

少年被打放狠话“等我20岁杀你全家”,五年后男子除夕将仇家灭门

易玄
2025-11-05 07:01:40
坏消息,勇士队库里在战胜太阳队后立即被宣布缺席打国王队的比赛

坏消息,勇士队库里在战胜太阳队后立即被宣布缺席打国王队的比赛

好火子
2025-11-05 23:52:39
黄金税改让整个实物黄金市场进入到了一种极度恐慌的状态

黄金税改让整个实物黄金市场进入到了一种极度恐慌的状态

流苏晚晴
2025-11-05 18:15:33
她是我见过且认为在整个东亚最漂亮的女人

她是我见过且认为在整个东亚最漂亮的女人

小椰的奶奶
2025-11-03 14:38:30
英国抢走了中国5块土地,只收复了香港,哪4块还没有收回?

英国抢走了中国5块土地,只收复了香港,哪4块还没有收回?

百态人间
2025-11-06 05:10:03
当下的经济下行什么时候会复苏?解决方案是什么呢?

当下的经济下行什么时候会复苏?解决方案是什么呢?

流苏晚晴
2025-09-27 17:48:01
北京团结湖街道帮“猛火炒饭”开档口 “地摊厨神”告别东躲西藏

北京团结湖街道帮“猛火炒饭”开档口 “地摊厨神”告别东躲西藏

新浪财经
2025-11-05 00:55:46
人气小生被掰弯了?王传君示好白百何?王祖蓝当大学教授?欧弟将移民日本?姨太问答

人气小生被掰弯了?王传君示好白百何?王祖蓝当大学教授?欧弟将移民日本?姨太问答

毒舌扒姨太
2025-11-05 22:35:21
2025-11-06 07:40:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
855632文章数 5083642关注度
往期回顾 全部

科技要闻

何小鹏连发四大黑科技!人形机器人走猫步上台

头条要闻

外媒:中方强硬抨击荷兰 安世半导体僵局持续发酵

头条要闻

外媒:中方强硬抨击荷兰 安世半导体僵局持续发酵

体育要闻

赢下皇马,会是利物浦的转折点吗?

娱乐要闻

港星林尚武突发心脏病去世

财经要闻

事关加快建设金融强国 中央金融办发声

汽车要闻

智己LS9入局"9系"混战 全尺寸SUV市场迎来新变量

态度原创

艺术
数码
教育
健康
公开课

艺术要闻

Michal Lukasiewicz:木刻般的绘画

数码要闻

小米POCO X1平板现身Geekbench 搭载骁龙7+ Gen 3

教育要闻

规律探究题,一个视频学明白!

超声探头会加重受伤情况吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版