网易首页 > 网易号 > 正文 申请入驻

首届AI交易大赛,6个AI炒币2周:Qwen、DeepSeek赚钱,GPT-5血亏

0
分享至




机器之心报道

机器之心编辑部

6 个顶级 AI 炒币 2 周,结果出人意料……

经过两周的厮杀,首届 nof1 AI 模型交易大赛终于落下帷幕。

这是第一个专为衡量 AI 投资能力而设计的基准测试,被誉为「币圈版的图灵测试」,由美国人工智能研究实验室 Nof1.ai 于 2025 年 10 月 17 日正式启动,一直持续至 11 月 3 日结束。

参赛选手是 6 款大模型,分别是 DeepSeek Chat V3.1(DeepSeek)、Grok 4(xAI)、Gemini 2.5 Pro(Google)、GPT-5(OpenAI)、Qwen3 Max(阿里巴巴)、Claude Sonnet 4.5(Anthropic)。

这些模型代表了中美两国闭源和开源供应商的最新技术水平。除 Qwen3-Max 外,所有模型均启用最高可配置的推理设置,且报告的是开箱即用的性能,未进行任何针对特定任务的微调。

每款大模型获得 1 万美元初始资金,使用相同的市场数据和技术指标,自主在 Hyperliquid 上进行加密永续合约交易,全程无人类干预,最终评估哪些模型能够在投资上获得最优回报。



他们将操作空间限制为:买入(做多)、卖出(做空)、持有或平仓。可交易的加密货币范围限于 Hyperliquid 上的六种流行加密货币:BTC、ETH、SOL、BNB、DOGE 和 XRP。之所以选择加密资产的三个实际原因是:市场全天候开放,能够持续观察决策,而不是只在工作时间内;数据丰富且易于获取,这支持分析和透明的审计;Hyperliquid 快速、可靠,并且极易集成,Hyperliquid 和加密货币是全球性的,它们不太依赖于特定国家或公司。这些模型进行的是中低频交易(MLFT),其决策间隔为几分钟到几个小时,而非微秒级别。

按照比赛规则,所有交易记录、持仓、决策日志和账户余额变化实时公开,观众可通过 Nof1.ai 平台查看动态图表,透明度极高。

比赛结果已出炉,两个国产大模型打了漂亮的一仗。

Qwen3 Max 排名第一,收益率为 22.3%,胜率为 30.2%,总盈亏为 $2232,总交易次数为 43 次。DeepSeek Chat V3.1 排名第二,收益率为 4.89%,胜率为 24.4%,总盈亏为 $489.08,总交易次数为 41 次。

其余模型均大幅亏损,Claude Sonnet 4.5 亏损 30.81%、Grok 4 亏损 45.3%、Gemini 2.5 Pro 亏损 56.71%、GPT 5 亏损 62.66%。



赛事自启动以来引发广泛关注,连币安创始人赵长鹏也公开评论。

他认为,传统上交易策略通常依赖于独特性,最好是别人没有的策略,这样才能获得优势。如果所有人都用相同的 AI 模型进行交易,可能会导致大家在同一时刻买入或卖出,影响市场动态。

不过,如果足够多的人使用同一 AI 模型,它的购买力可能会通过市场需求本身推动价格上涨。

他还预测,由于 AI 交易的表现引起了关注,未来可能会有更多人开始研究 AI 在交易中的应用,预计交易量会大幅增加。



六款模型交易「个性」各异

从披露的「成绩单」可以看出,这六款模型有着不同的交易「个性」。

Qwen3 Max 整体偏「进攻型」,其回报率高达 22.32%,总盈亏为 2232 美元。尽管费用较高(1654 美元),显示其交易频率适中且仓位较大,Qwen3 Max 凭借 30.2% 的胜率和最大盈利 8176 美元,展现了「高风险高回报」的进取型交易策略。其 Sharpe 值为 0.273,证明其风险调整后收益稳定。

紧随其后,DeepSeek Chat V3.1 凭借稳健的表现获得了第二名,回报率为 4.89%,总盈亏为 489 美元。相对较低的交易费用(690 美元)表明其交易次数不多但效率较高。虽然其胜率为 24.4%,但最大盈利高达 7378 美元,表现出其理性、稳健的策略型特点。Sharpe 值为 0.359,为所有模型中最高,显示其出色的风险控制能力。

Claude Sonnet 4.5 表现较为平淡,回报率为 - 30.81%,总亏损为 3081 美元。其较低的交易频率(36 次)和仅 25% 的胜率反映出它偏向谨慎的策略,但最大盈利 2112 美元与最大亏损 1579 美元显示出其单笔交易的差异性较小。Sharpe 值为 - 0.057,意味着其收益波动较大,风险控制不足。

Grok 4 则以 - 45.3% 的回报率和 4530 美元的总亏损,位居第四。它的交易频率为 47 次,Sharpe 值为 - 0.118,最大盈利 1356 美元和最大亏损 657 美元表明其操作较为保守,难以抓住市场的大趋势。

Gemini 2.5 Pro 在大赛中表现不佳,回报率为 - 56.71%,总亏损为 5671 美元。其 238 次交易次数为所有模型中最高,极度活跃,但胜率仅为 25.6%,Sharpe 值为 - 0.566,反映出其过度交易,回报低效。这个模型更像是一个典型的「高频操盘手」,缺乏稳定的策略。

GPT-5 以 - 62.66% 的回报率和 6266 美元的总亏损,成为表现最差的模型。它的 116 次交易次数虽然较多,但收益极低。胜率为 26.7%,Sharpe 值为 - 0.525,表明其交易存在较大波动且亏损严重。最大盈利仅为 270 美元,最大亏损 621 美元,说明其缺乏有效的市场判断和风险管理。

总体来说,来自中国的 Qwen3 Max 与 DeepSeek 在风险控制与趋势识别上更为领先,而 GPT-5、Claude、Grok、Gemini 美国系模型则普遍亏损严重。

https://nof1.ai/leaderboard

https://nof1.ai/blog/TechPost1

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
华野各大纵队司令盘点:粟裕真正铁杆支持者有几位?事实令人叹惋

华野各大纵队司令盘点:粟裕真正铁杆支持者有几位?事实令人叹惋

兴趣知识
2026-01-31 10:39:06
中美俄罕见同仇敌忾!只为"干掉"她?欧盟外长如何惹怒全世界?

中美俄罕见同仇敌忾!只为"干掉"她?欧盟外长如何惹怒全世界?

铁锤简科
2026-01-30 12:22:45
莱巴金娜“复仇”萨巴伦卡 四年磨练告别“一满贯”

莱巴金娜“复仇”萨巴伦卡 四年磨练告别“一满贯”

体坛周报
2026-01-31 20:45:16
广东队支付给四川队买萨纳姆优先续约权的钱,已用去支付上赛季本土球员的工资!

广东队支付给四川队买萨纳姆优先续约权的钱,已用去支付上赛季本土球员的工资!

廣東篮球掂
2026-01-31 13:42:08
别管有钱没钱,过年逛超市这10种年货不要碰,全是“冤种专供”

别管有钱没钱,过年逛超市这10种年货不要碰,全是“冤种专供”

梦史
2026-01-31 18:37:03
女子旅途中花12元买两桶泡面意外中1克金条,品牌客服:定制金条投放2026份,无法计算准确中奖概率

女子旅途中花12元买两桶泡面意外中1克金条,品牌客服:定制金条投放2026份,无法计算准确中奖概率

极目新闻
2026-01-31 14:54:10
中方捅破窗户纸,菲律宾禁航70天,中方反将一军,罕见说了重话

中方捅破窗户纸,菲律宾禁航70天,中方反将一军,罕见说了重话

肖兹探秘说
2026-01-31 12:50:17
68岁大妈喜欢睡前泡脚,不久脑梗去世,医生怒斥:太无知了

68岁大妈喜欢睡前泡脚,不久脑梗去世,医生怒斥:太无知了

医学科普汇
2025-12-13 16:40:05
半天票房28万,预计亏损1000万,谢苗巨星梦要碎了

半天票房28万,预计亏损1000万,谢苗巨星梦要碎了

影视高原说
2026-01-30 13:04:35
1939年,李德返回苏联后,对在中国的老婆和年幼的儿子不管不顾

1939年,李德返回苏联后,对在中国的老婆和年幼的儿子不管不顾

古书记史
2026-01-12 21:59:25
山东男篮3分险胜,陶汉林16+8高诗岩14+7,郭艾伦6分徐昕6+7!

山东男篮3分险胜,陶汉林16+8高诗岩14+7,郭艾伦6分徐昕6+7!

中国篮坛快讯
2026-01-31 21:42:26
4377亿市场洗牌!又一户外巨头跌落神坛被抛弃了?中产:新欢来了

4377亿市场洗牌!又一户外巨头跌落神坛被抛弃了?中产:新欢来了

品牌观察官
2026-01-30 17:59:31
1945年日本投降,斯大林无视天皇投降宣言,直接下令苏军继续进攻

1945年日本投降,斯大林无视天皇投降宣言,直接下令苏军继续进攻

唠叨说历史
2026-01-31 14:50:35
决裂!38岁本泽马气炸:太侮辱人了 通知高层将继续罢赛+永不出场

决裂!38岁本泽马气炸:太侮辱人了 通知高层将继续罢赛+永不出场

风过乡
2026-01-31 06:33:33
钻石女星的开房记录曝光!沈腾成为惊弓之鸟!

钻石女星的开房记录曝光!沈腾成为惊弓之鸟!

八卦疯叔
2026-01-31 13:26:27
婆婆当了近四十年的老师,今年刚好退休,我还以为退休金最多4000

婆婆当了近四十年的老师,今年刚好退休,我还以为退休金最多4000

五元讲堂
2026-01-26 11:26:26
身价百亿,坐拥北京一条街,出门私人飞机,京圈顶级富婆天团来了

身价百亿,坐拥北京一条街,出门私人飞机,京圈顶级富婆天团来了

泠泠说史
2026-01-26 14:19:11
高中生扶老人被讹50万,15年后老人孙子考上清华,在校门口跪下求饶

高中生扶老人被讹50万,15年后老人孙子考上清华,在校门口跪下求饶

红豆讲堂
2025-07-14 17:21:43
动真格了!解放军军机闯入菲军演划定区,菲律宾敢乱来可直接摧毁

动真格了!解放军军机闯入菲军演划定区,菲律宾敢乱来可直接摧毁

军武咖
2026-01-31 12:35:40
奥尼尔:我不想詹姆斯打全明星替补,应为“国王”留一份体面

奥尼尔:我不想詹姆斯打全明星替补,应为“国王”留一份体面

懂球帝
2026-01-30 17:36:06
2026-01-31 22:24:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12225文章数 142559关注度
往期回顾 全部

科技要闻

SpaceX申请部署百万卫星 打造太空数据中心

头条要闻

夫妻买房2年后才得知发生过两起坠楼:不敢在家里住了

头条要闻

夫妻买房2年后才得知发生过两起坠楼:不敢在家里住了

体育要闻

新时代得分王!东皇37+三双刷7纪录怒吼释放

娱乐要闻

李维嘉、吴昕、汪涵现身魏文彬追悼会

财经要闻

白银,暴跌!黄金,40年最大跌幅!

汽车要闻

新款宾利欧陆GT S/GTC S官图发布 V8混动加持

态度原创

手机
游戏
本地
健康
公开课

手机要闻

iPhone Fold配备5500mAh电池:苹果手机史上最大电量

LPL春季赛:TABE怪圈,赢一场输一场!AL三局战胜JDG

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

耳石症分类型,症状大不同

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版