网易首页 > 网易号 > 正文 申请入驻

中国大模型赢下AI投资大赛:阿里千问、DeepSeek盈利领跑,GPT-5垫底

0
分享至

六款全球顶尖AI(人工智能)大模型参与的实盘投资比赛落下帷幕,阿里千问最终反超DeepSeek获得冠军。

当地时间11月3日下午5点,美国AI研究平台Nof1宣布,从10月18日开始的大模型实盘投资比赛Alpha Arena正式落幕。六名参赛者中,阿里千问Qwen3-Max最终凭借突破20%的收益率拿下了本届大赛的冠军,DeepSeek v3.1位居第二,账户金额比第三名高出3000多美元,两款中国模型也是全场唯二盈利的大模型。而来自美国的四款大模型全线亏损,OpenAI的GPT-5亏损超60%垫底。

本次比赛集合了Qwen3-Max、DeepSeek v3.1、OpenAI的GPT-5、谷歌Gemini 2.5 Pro、Anthropic的Claude Sonnet 4.5和xAI的Grok 4这六大全球顶尖模型。在比赛中,为了衡量AI的投资能力,Nof1给每个模型账户发放了一万美元的启动资金,让它们通过Hyperliquid平台在真实市场自主交易数字货币。

由于在整个比赛过程不能有人插手,意味着大模型需要自己识别买入机会、决定买入仓位、判断买点卖点,并且实时管理风险。在过程中,系统会不断向模型输入当前的账户状态、持仓情况、市场价格和技术指标,模型需要依靠这些信息做出动态判断。

从图表中可以看出,六个大模型拥有三种投资风格:几乎全程占据第一梯队、轮流成为第一的Qwen和DeepSeek,属于“震荡派”的Claude和Grok,以及“稳定”在谷底的GPT-5和Gemini 2.5 Pro。


比赛结果。来源:Nof1

在比赛过程中,DeepSeek的表现一直很“稳”,历史最高收益率一度达到惊人的130%。不过,在比赛结束前的最后关头,相对更加激进的Qwen凭借一次紧急避险反超了DeepSeek,以超过20%的胜率和12231.82美元的账户总额获得冠军。同时,GPT-5和Gemini 2.5 Pro的一万美元本金只剩下了40%左右。

从过往交易的统计中可以看出,Gemini和GPT的买进卖出行为最为频繁,尤其是Gemini,有时持仓时间仅有数分钟;Anthropic的Claude和xAI的Grok则表现相对保守,持仓时间较长,交易数较少。

Nof1表示,通过本季比赛,他们试图研究“在几乎没有人为指导的情况下,大型语言模型(LLM)能否直接作为一个零样本(zero-shot)系统化交易模型来使用”。

初步实验结果显示,在使用相同的运行框架(harness)和提示词(prompts)的情况下,不同的大型基础模型在风险偏好、规划能力、方向性倾向(例如看多或看空)以及交易活跃度等方面,仍然存在显著差异。同时,团队还发现,这些模型“对看似微小的提示词改动非常敏感”。

Nof1表示,很快将会举办下一季比赛,团队将引入多提示词、多实例、交易历史等机制,以增强模型的稳定性与评估深度。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
米兰冬奥奖牌榜:21国获牌,挪威居首,东道主第3,我国力压韩国

米兰冬奥奖牌榜:21国获牌,挪威居首,东道主第3,我国力压韩国

湘楚风云
2026-02-12 11:26:15
美籍华裔冬奥花滑冠军刘美贤,曝系代孕儿,曾登上“吉米秀”,真实又可爱

美籍华裔冬奥花滑冠军刘美贤,曝系代孕儿,曾登上“吉米秀”,真实又可爱

爆角追踪
2026-02-12 10:30:32
罕见!6名共和党议员“倒戈”,反对特朗普

罕见!6名共和党议员“倒戈”,反对特朗普

扬子晚报
2026-02-12 12:29:06
儿子将爸爸的骨灰丢进垃圾桶!网友:爱丢哪丢哪吧,活时不亏就行

儿子将爸爸的骨灰丢进垃圾桶!网友:爱丢哪丢哪吧,活时不亏就行

火山詩话
2026-02-11 11:32:13
金正恩同志教大家如何赢了又赢!

金正恩同志教大家如何赢了又赢!

微微热评
2026-02-12 12:44:23
杨兰兰不认罪

杨兰兰不认罪

蓝钻故事
2026-02-11 16:19:23
全网群嘲的“私房早餐”事件:新型智商税,收割盲目自信的神人

全网群嘲的“私房早餐”事件:新型智商税,收割盲目自信的神人

小椰子专栏
2026-02-11 13:00:12
【特稿】炫耀“开5枪留7个洞” 美执法人员枪击美国公民并涉嫌撒谎

【特稿】炫耀“开5枪留7个洞” 美执法人员枪击美国公民并涉嫌撒谎

新华社
2026-02-12 18:38:03
他们谴责马斯克星链的逻辑有多荒唐

他们谴责马斯克星链的逻辑有多荒唐

李未熟擒话2
2026-02-12 16:50:06
浙江嘉兴一阿姨拿17克旧金1:1换新仅得9克金项链?老庙黄金:理解有误,所谓“换新”并非克重1:1,而是价值1:1

浙江嘉兴一阿姨拿17克旧金1:1换新仅得9克金项链?老庙黄金:理解有误,所谓“换新”并非克重1:1,而是价值1:1

扬子晚报
2026-02-12 07:21:53
纽约时报:不要相信那些把中国大学排在第一位的排名

纽约时报:不要相信那些把中国大学排在第一位的排名

朗威谈星座
2026-02-12 08:13:40
2026年的春运,长途大巴结结实实给了“智能时代”一记耳光

2026年的春运,长途大巴结结实实给了“智能时代”一记耳光

老特有话说
2026-02-09 23:34:10
米兰冬奥|中国速滑名将廉子文被取消成绩,虽尊重判罚但仍感意外

米兰冬奥|中国速滑名将廉子文被取消成绩,虽尊重判罚但仍感意外

文汇报
2026-02-12 07:39:26
性商训练营乱象调查:3天要价近五千,还兜售“缩阴”凝胶

性商训练营乱象调查:3天要价近五千,还兜售“缩阴”凝胶

南方都市报
2026-02-12 11:46:15
中国人均GDP已达日本的41%,30年前是1.3%

中国人均GDP已达日本的41%,30年前是1.3%

凯利经济观察
2026-02-12 00:14:45
59岁宋祖英现身活动状态惊艳!短发利落大气,黑色套装优雅端庄

59岁宋祖英现身活动状态惊艳!短发利落大气,黑色套装优雅端庄

琴声飞扬
2026-02-12 11:51:25
中芯国际这次真够抢风头的

中芯国际这次真够抢风头的

蔚然先声
2026-02-12 08:33:06
大孤山幕后大佬疑为姜育恒,名单曝光被质疑洗钱,秦岚遭深扒!

大孤山幕后大佬疑为姜育恒,名单曝光被质疑洗钱,秦岚遭深扒!

古希腊掌管月桂的神
2026-02-12 16:03:29
马筱梅突然提前报喜,宝宝意外降生,汪小菲专程赴曼谷还愿超暖心

马筱梅突然提前报喜,宝宝意外降生,汪小菲专程赴曼谷还愿超暖心

做一个合格的吃瓜群众
2026-02-12 18:25:01
在日华人直言:如今中国要是再和日本发生冲突,根本撑不过14年!

在日华人直言:如今中国要是再和日本发生冲突,根本撑不过14年!

南权先生
2026-02-12 15:39:07
2026-02-12 20:35:00
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
876839文章数 5088060关注度
往期回顾 全部

科技要闻

10倍速的一夜:三大模型春节前的暗战

头条要闻

女子返乡"打顺风车却打到大货车"视频爆火 当事人发声

头条要闻

女子返乡"打顺风车却打到大货车"视频爆火 当事人发声

体育要闻

31岁首次参加冬奥,10年前她是个水管工

娱乐要闻

体操运动员坠楼涉事教练被立案调查

财经要闻

“影子万科”如何掘金万科?

汽车要闻

开212 T01柴油版去穿越 连牧马人都跟不上

态度原创

艺术
本地
房产
手机
军事航空

艺术要闻

泰国学霸:身材好,颜值高!

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

房产要闻

999元开线上免税店?海南爆出免税大骗局,多人已被抓!

手机要闻

逆势独涨!苹果成1月中国手机市场唯一增长品牌 市占率近20%

军事要闻

特朗普:若美伊谈判失败 或再派一支航母打击群

无障碍浏览 进入关怀版