网易首页 > 网易号 > 正文 申请入驻

中国大模型赢下AI投资大赛:阿里千问、DeepSeek盈利领跑,GPT-5垫底

0
分享至

六款全球顶尖AI(人工智能)大模型参与的实盘投资比赛落下帷幕,阿里千问最终反超DeepSeek获得冠军。

当地时间11月3日下午5点,美国AI研究平台Nof1宣布,从10月18日开始的大模型实盘投资比赛Alpha Arena正式落幕。六名参赛者中,阿里千问Qwen3-Max最终凭借突破20%的收益率拿下了本届大赛的冠军,DeepSeek v3.1位居第二,账户金额比第三名高出3000多美元,两款中国模型也是全场唯二盈利的大模型。而来自美国的四款大模型全线亏损,OpenAI的GPT-5亏损超60%垫底。

本次比赛集合了Qwen3-Max、DeepSeek v3.1、OpenAI的GPT-5、谷歌Gemini 2.5 Pro、Anthropic的Claude Sonnet 4.5和xAI的Grok 4这六大全球顶尖模型。在比赛中,为了衡量AI的投资能力,Nof1给每个模型账户发放了一万美元的启动资金,让它们通过Hyperliquid平台在真实市场自主交易数字货币。

由于在整个比赛过程不能有人插手,意味着大模型需要自己识别买入机会、决定买入仓位、判断买点卖点,并且实时管理风险。在过程中,系统会不断向模型输入当前的账户状态、持仓情况、市场价格和技术指标,模型需要依靠这些信息做出动态判断。

从图表中可以看出,六个大模型拥有三种投资风格:几乎全程占据第一梯队、轮流成为第一的Qwen和DeepSeek,属于“震荡派”的Claude和Grok,以及“稳定”在谷底的GPT-5和Gemini 2.5 Pro。


比赛结果。来源:Nof1

在比赛过程中,DeepSeek的表现一直很“稳”,历史最高收益率一度达到惊人的130%。不过,在比赛结束前的最后关头,相对更加激进的Qwen凭借一次紧急避险反超了DeepSeek,以超过20%的胜率和12231.82美元的账户总额获得冠军。同时,GPT-5和Gemini 2.5 Pro的一万美元本金只剩下了40%左右。

从过往交易的统计中可以看出,Gemini和GPT的买进卖出行为最为频繁,尤其是Gemini,有时持仓时间仅有数分钟;Anthropic的Claude和xAI的Grok则表现相对保守,持仓时间较长,交易数较少。

Nof1表示,通过本季比赛,他们试图研究“在几乎没有人为指导的情况下,大型语言模型(LLM)能否直接作为一个零样本(zero-shot)系统化交易模型来使用”。

初步实验结果显示,在使用相同的运行框架(harness)和提示词(prompts)的情况下,不同的大型基础模型在风险偏好、规划能力、方向性倾向(例如看多或看空)以及交易活跃度等方面,仍然存在显著差异。同时,团队还发现,这些模型“对看似微小的提示词改动非常敏感”。

Nof1表示,很快将会举办下一季比赛,团队将引入多提示词、多实例、交易历史等机制,以增强模型的稳定性与评估深度。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
白人女性与黑人女性的体味差异,网友真实分享引发热议

白人女性与黑人女性的体味差异,网友真实分享引发热议

特约前排观众
2025-12-22 00:20:06
蓝莓再次被关注?研究发现:蓝莓或可在30小时内清除体内45%因子

蓝莓再次被关注?研究发现:蓝莓或可在30小时内清除体内45%因子

垚垚分享健康
2026-03-29 11:55:24
32岁女生自述得艾滋病过程,原因是见了一次网友,如今十分后悔

32岁女生自述得艾滋病过程,原因是见了一次网友,如今十分后悔

千秋文化
2026-03-29 20:59:49
当不成总统了?美国迎三大噩耗,百万人逼宫,他承认对中国上头了

当不成总统了?美国迎三大噩耗,百万人逼宫,他承认对中国上头了

知法而形
2026-03-29 11:53:37
伊朗自己都没想到,摸了这么大个奖!美军出现大战损,E3G被毁?

伊朗自己都没想到,摸了这么大个奖!美军出现大战损,E3G被毁?

共工之锚
2026-03-29 14:26:08
气温回暖,猝死的人越来越多?医生强调:宁睡到中午,也别做5事

气温回暖,猝死的人越来越多?医生强调:宁睡到中午,也别做5事

垚垚分享健康
2026-03-30 11:09:57
A股分红派息转增一览(3月30日):1股今日股权登记

A股分红派息转增一览(3月30日):1股今日股权登记

每日经济新闻
2026-03-30 07:59:53
央国企降薪第一刀:取消证书补贴

央国企降薪第一刀:取消证书补贴

新浪财经
2026-03-30 04:41:15
澳门世界杯:国乒连赢4场不败!王曼昱开门红3-0大胜欧洲冠军

澳门世界杯:国乒连赢4场不败!王曼昱开门红3-0大胜欧洲冠军

全言作品
2026-03-30 15:02:05
清明节为何都是提前上坟,不是当天!广东一女子发帖,评论区炸锅

清明节为何都是提前上坟,不是当天!广东一女子发帖,评论区炸锅

火山詩话
2026-03-28 10:10:07
67岁王朔现状:只能死在这儿了,女儿不让死屋里,怕房子不好卖

67岁王朔现状:只能死在这儿了,女儿不让死屋里,怕房子不好卖

谈史论天地
2026-03-27 17:05:03
国家一级女演员陈丽云被逮捕!

国家一级女演员陈丽云被逮捕!

许三岁
2026-03-28 09:24:30
主持人沈南参加张雪峰告别式,落泪回忆细节:他就像睡着了一样

主持人沈南参加张雪峰告别式,落泪回忆细节:他就像睡着了一样

萌神木木
2026-03-29 11:50:49
修旧如旧,网友为E3预警机定制修复方案

修旧如旧,网友为E3预警机定制修复方案

三叔的装备空间
2026-03-29 20:57:33
李荣浩怒斥单依纯不到24小时,薛之谦罕见发声,赢得全网好感

李荣浩怒斥单依纯不到24小时,薛之谦罕见发声,赢得全网好感

往史过眼云烟
2026-03-30 14:36:04
广州机场大面积延误,深圳机场 多航班备降

广州机场大面积延误,深圳机场 多航班备降

每日经济新闻
2026-03-30 14:42:30
内存价格断崖式下跌!网友捡大漏:48元买到64GB DDR5套装

内存价格断崖式下跌!网友捡大漏:48元买到64GB DDR5套装

快科技
2026-03-30 11:26:10
速效救心丸、硝酸甘油、阿司匹林,关键时刻用哪个?答案跟你想的不一样

速效救心丸、硝酸甘油、阿司匹林,关键时刻用哪个?答案跟你想的不一样

人民日报健康客户端
2026-03-27 21:12:30
儿子自杀六年后,母亲在人体展看到具剥皮尸体,秒认出:那是我儿子

儿子自杀六年后,母亲在人体展看到具剥皮尸体,秒认出:那是我儿子

新欧洲
2025-11-28 21:21:41
恐无缘世界杯!利物浦9000万神锋3次吐饼 单刀不传让拜仁巨星暴怒

恐无缘世界杯!利物浦9000万神锋3次吐饼 单刀不传让拜仁巨星暴怒

我爱英超
2026-03-30 06:59:54
2026-03-30 18:00:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
885975文章数 5089259关注度
往期回顾 全部

科技要闻

一句谎言引发的硅谷血案

头条要闻

尹正发文恭喜张雪夺冠 张雪:没钱请您做代言人 送台车

头条要闻

尹正发文恭喜张雪夺冠 张雪:没钱请您做代言人 送台车

体育要闻

想进世界杯,意大利还要过他这一关

娱乐要闻

单依纯凌晨发长文道歉!李荣浩再回应

财经要闻

本轮地缘冲突,A股凭什么走出独立行情

汽车要闻

理想i9要来了!外形似小号MEGA 能冲击高端纯电市场?

态度原创

健康
本地
手机
公开课
军事航空

干细胞抗衰4大误区,90%的人都中招

本地新闻

用Color Walk的方式解锁城市春日

手机要闻

小米澎湃OS 3上新密码App!自动抓取、一键填充:跨设备加密同步

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

第三艘航母出动数千名士兵抵达 美军大举增兵中东战场

无障碍浏览 进入关怀版