网易首页 > 网易号 > 正文 申请入驻

首届AI交易大赛,6个AI炒币2周:Qwen、DeepSeek赚钱,GPT-5血亏

0
分享至




机器之心报道

机器之心编辑部

6 个顶级 AI 炒币 2 周,结果出人意料……

经过两周的厮杀,首届 nof1 AI 模型交易大赛终于落下帷幕。

这是第一个专为衡量 AI 投资能力而设计的基准测试,被誉为「币圈版的图灵测试」,由美国人工智能研究实验室 Nof1.ai 于 2025 年 10 月 17 日正式启动,一直持续至 11 月 3 日结束。

参赛选手是 6 款大模型,分别是 DeepSeek Chat V3.1(DeepSeek)、Grok 4(xAI)、Gemini 2.5 Pro(Google)、GPT-5(OpenAI)、Qwen3 Max(阿里巴巴)、Claude Sonnet 4.5(Anthropic)。

这些模型代表了中美两国闭源和开源供应商的最新技术水平。除 Qwen3-Max 外,所有模型均启用最高可配置的推理设置,且报告的是开箱即用的性能,未进行任何针对特定任务的微调。

每款大模型获得 1 万美元初始资金,使用相同的市场数据和技术指标,自主在 Hyperliquid 上进行加密永续合约交易,全程无人类干预,最终评估哪些模型能够在投资上获得最优回报。



他们将操作空间限制为:买入(做多)、卖出(做空)、持有或平仓。可交易的加密货币范围限于 Hyperliquid 上的六种流行加密货币:BTC、ETH、SOL、BNB、DOGE 和 XRP。之所以选择加密资产的三个实际原因是:市场全天候开放,能够持续观察决策,而不是只在工作时间内;数据丰富且易于获取,这支持分析和透明的审计;Hyperliquid 快速、可靠,并且极易集成,Hyperliquid 和加密货币是全球性的,它们不太依赖于特定国家或公司。这些模型进行的是中低频交易(MLFT),其决策间隔为几分钟到几个小时,而非微秒级别。

按照比赛规则,所有交易记录、持仓、决策日志和账户余额变化实时公开,观众可通过 Nof1.ai 平台查看动态图表,透明度极高。

比赛结果已出炉,两个国产大模型打了漂亮的一仗。

Qwen3 Max 排名第一,收益率为 22.3%,胜率为 30.2%,总盈亏为 $2232,总交易次数为 43 次。DeepSeek Chat V3.1 排名第二,收益率为 4.89%,胜率为 24.4%,总盈亏为 $489.08,总交易次数为 41 次。

其余模型均大幅亏损,Claude Sonnet 4.5 亏损 30.81%、Grok 4 亏损 45.3%、Gemini 2.5 Pro 亏损 56.71%、GPT 5 亏损 62.66%。



赛事自启动以来引发广泛关注,连币安创始人赵长鹏也公开评论。

他认为,传统上交易策略通常依赖于独特性,最好是别人没有的策略,这样才能获得优势。如果所有人都用相同的 AI 模型进行交易,可能会导致大家在同一时刻买入或卖出,影响市场动态。

不过,如果足够多的人使用同一 AI 模型,它的购买力可能会通过市场需求本身推动价格上涨。

他还预测,由于 AI 交易的表现引起了关注,未来可能会有更多人开始研究 AI 在交易中的应用,预计交易量会大幅增加。



六款模型交易「个性」各异

从披露的「成绩单」可以看出,这六款模型有着不同的交易「个性」。

Qwen3 Max 整体偏「进攻型」,其回报率高达 22.32%,总盈亏为 2232 美元。尽管费用较高(1654 美元),显示其交易频率适中且仓位较大,Qwen3 Max 凭借 30.2% 的胜率和最大盈利 8176 美元,展现了「高风险高回报」的进取型交易策略。其 Sharpe 值为 0.273,证明其风险调整后收益稳定。

紧随其后,DeepSeek Chat V3.1 凭借稳健的表现获得了第二名,回报率为 4.89%,总盈亏为 489 美元。相对较低的交易费用(690 美元)表明其交易次数不多但效率较高。虽然其胜率为 24.4%,但最大盈利高达 7378 美元,表现出其理性、稳健的策略型特点。Sharpe 值为 0.359,为所有模型中最高,显示其出色的风险控制能力。

Claude Sonnet 4.5 表现较为平淡,回报率为 - 30.81%,总亏损为 3081 美元。其较低的交易频率(36 次)和仅 25% 的胜率反映出它偏向谨慎的策略,但最大盈利 2112 美元与最大亏损 1579 美元显示出其单笔交易的差异性较小。Sharpe 值为 - 0.057,意味着其收益波动较大,风险控制不足。

Grok 4 则以 - 45.3% 的回报率和 4530 美元的总亏损,位居第四。它的交易频率为 47 次,Sharpe 值为 - 0.118,最大盈利 1356 美元和最大亏损 657 美元表明其操作较为保守,难以抓住市场的大趋势。

Gemini 2.5 Pro 在大赛中表现不佳,回报率为 - 56.71%,总亏损为 5671 美元。其 238 次交易次数为所有模型中最高,极度活跃,但胜率仅为 25.6%,Sharpe 值为 - 0.566,反映出其过度交易,回报低效。这个模型更像是一个典型的「高频操盘手」,缺乏稳定的策略。

GPT-5 以 - 62.66% 的回报率和 6266 美元的总亏损,成为表现最差的模型。它的 116 次交易次数虽然较多,但收益极低。胜率为 26.7%,Sharpe 值为 - 0.525,表明其交易存在较大波动且亏损严重。最大盈利仅为 270 美元,最大亏损 621 美元,说明其缺乏有效的市场判断和风险管理。

总体来说,来自中国的 Qwen3 Max 与 DeepSeek 在风险控制与趋势识别上更为领先,而 GPT-5、Claude、Grok、Gemini 美国系模型则普遍亏损严重。

https://nof1.ai/leaderboard

https://nof1.ai/blog/TechPost1

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
北京这晚,郭晶晶用凸起的“小肚子”,给内娱审美上了生动的一课

北京这晚,郭晶晶用凸起的“小肚子”,给内娱审美上了生动的一课

娱乐圈笔娱君
2025-11-11 16:06:53
网友吐槽:进了一批新国标电动车,根本没人买,又是赔本的生意

网友吐槽:进了一批新国标电动车,根本没人买,又是赔本的生意

你食不食油饼
2025-11-11 06:00:03
河南省纪委监委:文海周涉嫌严重违纪违法

河南省纪委监委:文海周涉嫌严重违纪违法

鲁中晨报
2025-11-11 18:31:02
警惕:4000点成股市天花板,韭菜太多镰刀不够用

警惕:4000点成股市天花板,韭菜太多镰刀不够用

微评社
2025-11-11 13:18:43
苹果新配件iPhone Pocket亮相:将手机“随身穿戴”,1299元起售

苹果新配件iPhone Pocket亮相:将手机“随身穿戴”,1299元起售

IT之家
2025-11-11 17:26:06
卖茅台低于市场价将被罚?抖音电商回应

卖茅台低于市场价将被罚?抖音电商回应

新京报
2025-11-10 23:57:29
三角恋?陷害曾医生和副院长的人遭曝光?是一个叫汤淑珍的女人

三角恋?陷害曾医生和副院长的人遭曝光?是一个叫汤淑珍的女人

汉史趣闻
2025-11-11 19:40:24
高市早苗涉台言论后,急盼美国支持,特朗普:日本也不算美国朋友

高市早苗涉台言论后,急盼美国支持,特朗普:日本也不算美国朋友

临云史策
2025-11-11 22:00:26
资本大撤退,英雄联盟迎来了最危险的时刻?

资本大撤退,英雄联盟迎来了最危险的时刻?

圈内师老师
2025-11-10 18:07:03
中国商业火箭再次失手,和SpaceX差距在哪?

中国商业火箭再次失手,和SpaceX差距在哪?

财视传播
2025-11-11 17:07:39
广东92-73辽篮!球员评分:3人表现完美,3人满分,2人不合格

广东92-73辽篮!球员评分:3人表现完美,3人满分,2人不合格

多特体育说
2025-11-12 00:38:58
祖某某与曾某都在一起7年了?网友曝更多细节,祖某曾酒后吐真言

祖某某与曾某都在一起7年了?网友曝更多细节,祖某曾酒后吐真言

十九妹
2025-11-11 15:38:20
哨兵被队友遗忘,深埋地下9年,发现时仍坚守军需库,双目已失明

哨兵被队友遗忘,深埋地下9年,发现时仍坚守军需库,双目已失明

兴趣知识
2025-11-11 21:20:51
山西一女老板实名举报国企负责人后被打 该负责人已被撤职

山西一女老板实名举报国企负责人后被打 该负责人已被撤职

上游新闻
2025-11-11 21:27:04
中国国防部正式通告全球:决不允许日本军国主义卷土重来

中国国防部正式通告全球:决不允许日本军国主义卷土重来

一个有灵魂的作者
2025-09-13 09:38:07
全运会乒乓球!男单8强赛对阵出炉 林诗栋剃光头 梁靖崑1-4爆冷淘汰

全运会乒乓球!男单8强赛对阵出炉 林诗栋剃光头 梁靖崑1-4爆冷淘汰

刘哥谈体育
2025-11-12 00:21:41
解放军72小时行动后,民进党内讧加剧,矛头指向赖清德

解放军72小时行动后,民进党内讧加剧,矛头指向赖清德

阿筀田间生活
2025-11-10 19:56:26
争议!全运会王曼昱4-3险胜,不和谐一幕:球迷一边倒加油至破音

争议!全运会王曼昱4-3险胜,不和谐一幕:球迷一边倒加油至破音

大秦壁虎白话体育
2025-11-11 18:00:45
深圳湾部分区域临时管控!最新通告

深圳湾部分区域临时管控!最新通告

深圳晚报
2025-11-10 23:47:00
集中开展一次大排查、深挖背后腐败问题!省委书记部署,聚焦这一重要工作

集中开展一次大排查、深挖背后腐败问题!省委书记部署,聚焦这一重要工作

政知新媒体
2025-11-11 22:10:54
2025-11-12 01:59:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
11694文章数 142501关注度
往期回顾 全部

科技要闻

苹果新品惨败,产线拆光、二代搁浅!

头条要闻

携6.1万枚比特币出逃英国 富婆奢靡生活披露

头条要闻

携6.1万枚比特币出逃英国 富婆奢靡生活披露

体育要闻

一个14岁的小男孩,决定了谁能晋级世界杯

娱乐要闻

古二曝秦雯多次炫耀袭警经历

财经要闻

南昌三瑞智能IPO:委外代工模式存疑

汽车要闻

盈利"大考",汽车智能化企业的中场战事

态度原创

教育
时尚
手机
家居
房产

教育要闻

老师们不奢望减轻什么负担,只希望能实行8小时工作制!

舒淇,东亚女孩的恨海情天

手机要闻

小米10000mAh电池量产落地,REDMI中端机率先搭载,你期待吗?

家居要闻

国美学子 打造筑梦空间

房产要闻

海口湾,1300亩巨无霸地块登场!

无障碍浏览 进入关怀版