网易首页 > 网易号 > 正文 申请入驻

中国大模型赢下AI投资大赛:阿里千问、DeepSeek盈利领跑,GPT-5垫底

0
分享至

六款全球顶尖AI(人工智能)大模型参与的实盘投资比赛落下帷幕,阿里千问最终反超DeepSeek获得冠军。

当地时间11月3日下午5点,美国AI研究平台Nof1宣布,从10月18日开始的大模型实盘投资比赛Alpha Arena正式落幕。六名参赛者中,阿里千问Qwen3-Max最终凭借突破20%的收益率拿下了本届大赛的冠军,DeepSeek v3.1位居第二,账户金额比第三名高出3000多美元,两款中国模型也是全场唯二盈利的大模型。而来自美国的四款大模型全线亏损,OpenAI的GPT-5亏损超60%垫底。

本次比赛集合了Qwen3-Max、DeepSeek v3.1、OpenAI的GPT-5、谷歌Gemini 2.5 Pro、Anthropic的Claude Sonnet 4.5和xAI的Grok 4这六大全球顶尖模型。在比赛中,为了衡量AI的投资能力,Nof1给每个模型账户发放了一万美元的启动资金,让它们通过Hyperliquid平台在真实市场自主交易数字货币。

由于在整个比赛过程不能有人插手,意味着大模型需要自己识别买入机会、决定买入仓位、判断买点卖点,并且实时管理风险。在过程中,系统会不断向模型输入当前的账户状态、持仓情况、市场价格和技术指标,模型需要依靠这些信息做出动态判断。

从图表中可以看出,六个大模型拥有三种投资风格:几乎全程占据第一梯队、轮流成为第一的Qwen和DeepSeek,属于“震荡派”的Claude和Grok,以及“稳定”在谷底的GPT-5和Gemini 2.5 Pro。

比赛结果。来源:Nof1

在比赛过程中,DeepSeek的表现一直很“稳”,历史最高收益率一度达到惊人的130%。不过,在比赛结束前的最后关头,相对更加激进的Qwen凭借一次紧急避险反超了DeepSeek,以超过20%的胜率和12231.82美元的账户总额获得冠军。同时,GPT-5和Gemini 2.5 Pro的一万美元本金只剩下了40%左右。

从过往交易的统计中可以看出,Gemini和GPT的买进卖出行为最为频繁,尤其是Gemini,有时持仓时间仅有数分钟;Anthropic的Claude和xAI的Grok则表现相对保守,持仓时间较长,交易数较少。

Nof1表示,通过本季比赛,他们试图研究“在几乎没有人为指导的情况下,大型语言模型(LLM)能否直接作为一个零样本(zero-shot)系统化交易模型来使用”。

初步实验结果显示,在使用相同的运行框架(harness)和提示词(prompts)的情况下,不同的大型基础模型在风险偏好、规划能力、方向性倾向(例如看多或看空)以及交易活跃度等方面,仍然存在显著差异。同时,团队还发现,这些模型“对看似微小的提示词改动非常敏感”。

Nof1表示,很快将会举办下一季比赛,团队将引入多提示词、多实例、交易历史等机制,以增强模型的稳定性与评估深度。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
坑完布克后,又要坑字母哥?NBA第一数据刷子,热火千万不要上当

坑完布克后,又要坑字母哥?NBA第一数据刷子,热火千万不要上当

兵哥篮球故事
2026-07-01 15:07:19
德国爆发全国铁路故障后,德媒刊文:这更证明不能用中国设备

德国爆发全国铁路故障后,德媒刊文:这更证明不能用中国设备

王嚾晓
2026-06-30 22:16:32
白俄高层已经意识到,卢卡申科访华一旦“托孤”,将改变俄乌大局

白俄高层已经意识到,卢卡申科访华一旦“托孤”,将改变俄乌大局

春之韵
2026-07-01 13:27:24
生吃对皮肤好,熟吃对肠胃好!不愧是蔬菜界的维C之王

生吃对皮肤好,熟吃对肠胃好!不愧是蔬菜界的维C之王

下厨房
2026-07-01 13:12:59
今晚开播!张嘉益董洁年代大剧登陆天津卫视,三代女性宿命太好哭

今晚开播!张嘉益董洁年代大剧登陆天津卫视,三代女性宿命太好哭

小椰的奶奶
2026-07-01 15:33:39
160架战斗机就位 2000枚导弹下发 1400名空军飞行员等候战斗令

160架战斗机就位 2000枚导弹下发 1400名空军飞行员等候战斗令

聚峰军评
2026-06-30 13:01:28
卢卡申科出席儿子北大毕业礼

卢卡申科出席儿子北大毕业礼

俄罗斯卫星通讯社
2026-07-01 16:05:24
三岁被拐1050天,六岁一眼认出爸爸,如今彭文乐保研直博送祝福

三岁被拐1050天,六岁一眼认出爸爸,如今彭文乐保研直博送祝福

削桐作琴
2026-06-08 14:05:14
美国解除海上封锁后 伊朗已出口超过4000万桶原油

美国解除海上封锁后 伊朗已出口超过4000万桶原油

财联社
2026-07-01 17:19:30
两天连赢4场!18岁温瑞博打疯了!零封前世界第一,下轮战日本

两天连赢4场!18岁温瑞博打疯了!零封前世界第一,下轮战日本

白面书誏
2026-07-01 15:39:56
无忧传媒曝天价违约金!张大大被索要3000万,十万小达人进退两难

无忧传媒曝天价违约金!张大大被索要3000万,十万小达人进退两难

雷科技
2026-06-30 22:21:23
状态封神!夺冠大势已定?仅四支劲旅可拦法国世界杯登顶之路!

状态封神!夺冠大势已定?仅四支劲旅可拦法国世界杯登顶之路!

田先生篮球
2026-07-01 09:21:37
克罗斯:德国队目前没有任何一名世界级球员

克罗斯:德国队目前没有任何一名世界级球员

懂球帝
2026-07-01 18:05:24
问界M5买两年异味不散:门店两次测甲醛超标,厂家一测就“合格”!市监局回应:当年没抽检同批次车辆

问界M5买两年异味不散:门店两次测甲醛超标,厂家一测就“合格”!市监局回应:当年没抽检同批次车辆

中国山东网
2026-06-29 09:25:07
我今年56岁发现了一个怪现象:50岁以后的中年女人,能活到90岁的,基本上在50岁的时候,就不再做这件事了

我今年56岁发现了一个怪现象:50岁以后的中年女人,能活到90岁的,基本上在50岁的时候,就不再做这件事了

心理观察局
2026-07-01 07:58:17
太厉害了!俄罗斯最新战报!

太厉害了!俄罗斯最新战报!

故事终将光明磊落
2026-07-01 14:02:43
68岁马秋华:丈夫金铁霖走后4年,儿子33岁未婚成她最大心病

68岁马秋华:丈夫金铁霖走后4年,儿子33岁未婚成她最大心病

飘飘然的娱乐汇
2026-07-01 09:55:09
博格丹签火箭!斯玛特将加盟 休媒还盼追欧文:出范乔丹芬尼首轮

博格丹签火箭!斯玛特将加盟 休媒还盼追欧文:出范乔丹芬尼首轮

颜小白的篮球梦
2026-07-01 12:16:23
六代机,就这么明晃晃的官宣了

六代机,就这么明晃晃的官宣了

侠客栈
2026-06-30 13:35:58
富婆龚心如(小甜甜)留给吕良伟的1400亿遗产,被人截胡了?

富婆龚心如(小甜甜)留给吕良伟的1400亿遗产,被人截胡了?

南万说娱26
2026-07-01 09:22:49
2026-07-01 19:28:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
911681文章数 5093312关注度
往期回顾 全部

科技要闻

Claude Code被曝“植入木马”识别中国用户

头条要闻

副行长借朋友名义贷款470万 400万自用70万给朋友用

头条要闻

副行长借朋友名义贷款470万 400万自用70万给朋友用

体育要闻

卖球衣救子的门将,把德国扑出了世界杯

娱乐要闻

张凌赫:我连心疼你都隔着时差

财经要闻

新氧贷款:宣传年化15%,实际顶格24%

汽车要闻

半程收官 上汽集团销量突破200万辆

态度原创

游戏
数码
旅游
教育
军事航空

2026最新解读!KK对战平台官方盘点:仙剑奇侠传1完整剧情解析与遗憾弥补 (1)

数码要闻

零刻ME Pro四盘位H255新品NAS迷你主机发布,2739元起

旅游要闻

洋面孔成旅游推介官,三亚的“朋友圈”为何越扩越大?

教育要闻

已知AB-A=58, 求A=?B=?

军事要闻

美伊代表前往多哈 谈判方式出现"重大倒退"

无障碍浏览 进入关怀版