网易首页 > 网易号 > 正文 申请入驻

AI大模型投资比赛落幕,阿里通义千问 Qwen 以 22.32% 收益率夺冠

0
分享至

IT之家 11 月 4 日消息,美国研究机构 Nof1 最近发起了一项实盘测试:他们将六大顶级 AI 大语言模型(LLM)分别注入 1 万美元作为起始资金,令其在真实市场中自主交易。

今日,第一届 Alpha Arena 正式宣布结束,阿里旗下通义千问 Qwen3-Max 在最后关头保持领先,以 22.32% 收益率夺得投资冠军。


Alpha Arena 目标是在一个动态、竞争的真实环境里检验这些模型在“量化交易”领域的能力。

虽然 AI 模型可以完成指定任务,但研究者指出:在风险管理、交易行为、持仓时长、方向偏好等方面,模型表现出显著差异。


研究团队强调,这并不是为了“选出最强模型”,而是为了推动 AI 研究从静态、考试式的基准测试转向对“真实世界”、“实时决策”的考察。

实验设计

  • 每款模型均拥有 1 万美元(IT之家注:现汇率约合 71218 元人民币)起始资金,用于在 Hyperliquid 交易平台上交易加密货币永续合约(包括 BTC、ETH、SOL、BNB、DOGE、XRP)。
  • 模型只能基于数值市场数据(价格、成交量、技术指标等)进行决策,不允许查阅新闻或时事信息。
  • 每个模型的目标为“最大化 PnL(盈亏)”,并给出了夏普比率(Sharpe Ratio)作为风险调整后的指标。
  • 交易动作被简化为:买入(做多)、卖出(做空)、持有、平仓。所有模型使用相同提示词(prompt)、相同数据接口、无特定微调。


初步结果

报告指出,虽然每个模型都在同样结构下运作,但它们的交易风格、风险偏好、持仓时间、交易频率存在明显差异。例如:某些模型短仓(做空)次数较多,而另一些几乎不做空。某些模型持仓时间长、交易频率低,而另一些交易频繁。

在数据格式敏感性方面,团队观察到:提示中若将“数据顺序”由“新 → 旧”改为“旧 → 新”,即可修复部分模型因误读数据而产生的错误。

研究也指出,此次测试存在诸多局限:样本有限、运行时间短、模型无往绩历史、无累积学习能力。团队表示会在下一季引入更多控制、更多特性、更强统计实力。

意义与观察

该项目试图回答一个基本问题:“大型语言模型在无特定微调、仅凭数值数据输入、在真实交易环境中,能否作为零样本(zero-shot)系统交易模型?”

通过该实验,Nof1 旨在促进 AI 研究转向“举办真实、动态、风险驱动的基准”,而非仅仅静态数据集。

虽然实验尚未得出“哪款模型最强”的结论,但已揭示:即便是最先进的 LLM,在实际交易中仍面临“动作执行”“风险控制”“市场状态理解”“提示格式敏感性”等多方面挑战。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
奉劝所有中国人,必须做好心理准备,俄罗斯外交部发言人说出事实

奉劝所有中国人,必须做好心理准备,俄罗斯外交部发言人说出事实

百态人间
2025-11-06 05:15:03
欧冠爆发内讧!意甲刺头不满被换下 与主帅发生口角

欧冠爆发内讧!意甲刺头不满被换下 与主帅发生口角

球事百科吖
2025-11-06 11:39:03
中美俄飞船载重差距断崖:美国6.3吨、俄罗斯2.5吨、中国令人意外

中美俄飞船载重差距断崖:美国6.3吨、俄罗斯2.5吨、中国令人意外

南宗历史
2025-11-04 14:37:13
英国抢走了中国5块土地,只收复了香港,哪4块还没有收回?

英国抢走了中国5块土地,只收复了香港,哪4块还没有收回?

百态人间
2025-11-06 05:10:03
北约果然是急眼了,北约官员:宁肯倾家荡产,也不许买中国制造

北约果然是急眼了,北约官员:宁肯倾家荡产,也不许买中国制造

原来仙女不讲理
2025-11-05 21:56:43
重大突破!以色列成功植入人工眼角膜,又一次走在全球科技前沿!

重大突破!以色列成功植入人工眼角膜,又一次走在全球科技前沿!

霜风如刀
2025-11-03 16:17:25
新魔兽诞生?杜伦22岁前已砍3次20+20,仅次于奥尼尔和霍华德

新魔兽诞生?杜伦22岁前已砍3次20+20,仅次于奥尼尔和霍华德

懂球帝
2025-11-06 11:26:14
统一信号如此强烈!推进速度越来越快,已有数十万人更换身份证!

统一信号如此强烈!推进速度越来越快,已有数十万人更换身份证!

李博世财经
2025-11-05 09:56:07
《依依向北风》大结局:暖暖是破局者,乔正君和俞乐山各归其位

《依依向北风》大结局:暖暖是破局者,乔正君和俞乐山各归其位

感影的世界
2025-11-06 11:06:34
NBA|开拓者队记:开拓者与混音队同馆不同队,杨瀚森所谓下放只是一起训练

NBA|开拓者队记:开拓者与混音队同馆不同队,杨瀚森所谓下放只是一起训练

台州交通广播
2025-11-06 10:49:28
一位72岁靠运送垃圾为生的老人,却在租住的简陋地下室里,研究哥德巴赫猜想!完全是“竞赛级别”

一位72岁靠运送垃圾为生的老人,却在租住的简陋地下室里,研究哥德巴赫猜想!完全是“竞赛级别”

观威海
2025-11-04 09:58:04
18中5连场低迷,杜兰特破不了包夹 火箭看走眼 谢泼德打无球12分

18中5连场低迷,杜兰特破不了包夹 火箭看走眼 谢泼德打无球12分

替补席看球
2025-11-06 11:29:23
国民党内斗升级?吴敦义怒批郑丽文,背后黑手竟是它!

国民党内斗升级?吴敦义怒批郑丽文,背后黑手竟是它!

爱下厨的阿酾
2025-11-06 10:35:32
震惊!深圳一学校取消统一采购校服,家长成功让校服“消失”了

震惊!深圳一学校取消统一采购校服,家长成功让校服“消失”了

火山诗话
2025-11-06 04:36:57
9℃!雨雨雨!江苏天气最新预测!

9℃!雨雨雨!江苏天气最新预测!

世态百晓生
2025-11-06 09:24:26
哇太漂亮了,俄罗斯顶级女神,五官绝美,完全符合东方的审美

哇太漂亮了,俄罗斯顶级女神,五官绝美,完全符合东方的审美

陈意小可爱
2025-10-11 15:05:05
董璇庆生现场曝光,挽着老公主动示好笑得超甜,张维伊颜值大变

董璇庆生现场曝光,挽着老公主动示好笑得超甜,张维伊颜值大变

八怪娱
2025-11-06 10:14:38
人民财评:“巨型吊牌防退货”是一个“上策”

人民财评:“巨型吊牌防退货”是一个“上策”

人民资讯
2025-11-05 14:40:10
少年被打放狠话“等我20岁杀你全家”,五年后男子除夕将仇家灭门

少年被打放狠话“等我20岁杀你全家”,五年后男子除夕将仇家灭门

易玄
2025-11-05 07:01:40
baby新男友已获小海绵认可?街头带娃遛大型犬,像幸福的一家三口

baby新男友已获小海绵认可?街头带娃遛大型犬,像幸福的一家三口

八星人
2025-11-05 15:55:40
2025-11-06 12:00:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
313724文章数 606717关注度
往期回顾 全部

科技要闻

苹果“认输”!曝每年10亿美元租用谷歌AI

头条要闻

东山精密收购法国知名企业:和安世半导体有很大不同

头条要闻

东山精密收购法国知名企业:和安世半导体有很大不同

体育要闻

送走两位全明星,公牛成了东部第一

娱乐要闻

白百何好友揭露争奖细节

财经要闻

特朗普关税遭美国高院大法官轮番质疑

汽车要闻

方向盘?不存在的 特斯拉 Cybercab亚太首秀

态度原创

教育
时尚
本地
数码
军事航空

教育要闻

惊!初三女孩大疆被老师没收,家长打电话也不还

中国色特别策划 | 故宫技艺与古意新生

本地新闻

这届干饭人,已经把博物馆吃成了食堂

数码要闻

华为WATCH Ultimate 2官宣:11月7日10:08开启预售

军事要闻

美国发射洲际弹道导弹 俄方回应

无障碍浏览 进入关怀版