网易首页 > 网易号 > 正文 申请入驻

中国大模型赢下AI投资大赛:阿里千问、DeepSeek盈利领跑,GPT-5垫底

0
分享至

六款全球顶尖AI(人工智能)大模型参与的实盘投资比赛落下帷幕,阿里千问最终反超DeepSeek获得冠军。

当地时间11月3日下午5点,美国AI研究平台Nof1宣布,从10月18日开始的大模型实盘投资比赛Alpha Arena正式落幕。六名参赛者中,阿里千问Qwen3-Max最终凭借突破20%的收益率拿下了本届大赛的冠军,DeepSeek v3.1位居第二,账户金额比第三名高出3000多美元,两款中国模型也是全场唯二盈利的大模型。而来自美国的四款大模型全线亏损,OpenAI的GPT-5亏损超60%垫底。

本次比赛集合了Qwen3-Max、DeepSeek v3.1、OpenAI的GPT-5、谷歌Gemini 2.5 Pro、Anthropic的Claude Sonnet 4.5和xAI的Grok 4这六大全球顶尖模型。在比赛中,为了衡量AI的投资能力,Nof1给每个模型账户发放了一万美元的启动资金,让它们通过Hyperliquid平台在真实市场自主交易数字货币。

由于在整个比赛过程不能有人插手,意味着大模型需要自己识别买入机会、决定买入仓位、判断买点卖点,并且实时管理风险。在过程中,系统会不断向模型输入当前的账户状态、持仓情况、市场价格和技术指标,模型需要依靠这些信息做出动态判断。

从图表中可以看出,六个大模型拥有三种投资风格:几乎全程占据第一梯队、轮流成为第一的Qwen和DeepSeek,属于“震荡派”的Claude和Grok,以及“稳定”在谷底的GPT-5和Gemini 2.5 Pro。

比赛结果。来源:Nof1

在比赛过程中,DeepSeek的表现一直很“稳”,历史最高收益率一度达到惊人的130%。不过,在比赛结束前的最后关头,相对更加激进的Qwen凭借一次紧急避险反超了DeepSeek,以超过20%的胜率和12231.82美元的账户总额获得冠军。同时,GPT-5和Gemini 2.5 Pro的一万美元本金只剩下了40%左右。

从过往交易的统计中可以看出,Gemini和GPT的买进卖出行为最为频繁,尤其是Gemini,有时持仓时间仅有数分钟;Anthropic的Claude和xAI的Grok则表现相对保守,持仓时间较长,交易数较少。

Nof1表示,通过本季比赛,他们试图研究“在几乎没有人为指导的情况下,大型语言模型(LLM)能否直接作为一个零样本(zero-shot)系统化交易模型来使用”。

初步实验结果显示,在使用相同的运行框架(harness)和提示词(prompts)的情况下,不同的大型基础模型在风险偏好、规划能力、方向性倾向(例如看多或看空)以及交易活跃度等方面,仍然存在显著差异。同时,团队还发现,这些模型“对看似微小的提示词改动非常敏感”。

Nof1表示,很快将会举办下一季比赛,团队将引入多提示词、多实例、交易历史等机制,以增强模型的稳定性与评估深度。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
赢天王山破客场不胜魔咒!哈登30+8+6又刷7纪录:谁言不能打硬仗

赢天王山破客场不胜魔咒!哈登30+8+6又刷7纪录:谁言不能打硬仗

颜小白的篮球梦
2026-05-14 11:10:36
太狂了!张本智和父亲公开放话,球迷怒了:以后别想再来中国了

太狂了!张本智和父亲公开放话,球迷怒了:以后别想再来中国了

谭颞爱搞笑
2026-05-14 10:47:08
不想恋爱,但又有性需求,怎么办?

不想恋爱,但又有性需求,怎么办?

性学研究僧
2026-05-14 19:50:47
中美谈妥,贝森特握紧中方的手,新的情况发生,外资加仓中国资产

中美谈妥,贝森特握紧中方的手,新的情况发生,外资加仓中国资产

孙镴北漂拍客
2026-05-14 22:14:24
中午11时,中美磋商准时开始,特朗普发现:中国比他想象中更厉害

中午11时,中美磋商准时开始,特朗普发现:中国比他想象中更厉害

共工之锚
2026-05-14 12:33:37
5月14日俄乌:乌克兰回击俄罗斯最大规模的空袭

5月14日俄乌:乌克兰回击俄罗斯最大规模的空袭

山河路口
2026-05-14 19:20:07
吉尔吉斯斯坦总统直言:我们身上流着的是李陵的血,跟中国是手足

吉尔吉斯斯坦总统直言:我们身上流着的是李陵的血,跟中国是手足

文史微鉴
2025-12-04 22:02:53
小米SU7 Ultra挖孔机盖案 一审宣判

小米SU7 Ultra挖孔机盖案 一审宣判

每日经济新闻
2026-05-13 23:52:11
女子吃霸王餐给差评:正脸曝光,自认为没错,要上媒体跟老板对质

女子吃霸王餐给差评:正脸曝光,自认为没错,要上媒体跟老板对质

阅微札记
2026-05-13 14:31:03
44岁范冰冰近照判若两人!与妈妈同框身形暴肥,这次是真怀孕了?

44岁范冰冰近照判若两人!与妈妈同框身形暴肥,这次是真怀孕了?

八卦王者
2026-05-12 15:27:14
大陆向全球通告,禁止对岸一件事,话音刚落,郑丽文火速派人来京

大陆向全球通告,禁止对岸一件事,话音刚落,郑丽文火速派人来京

凡知
2026-05-13 12:49:01
无极县一火锅店突发重大刑案,惊悚说法大量传播,信息公开很重要

无极县一火锅店突发重大刑案,惊悚说法大量传播,信息公开很重要

胡侃社会百态
2026-05-14 13:26:32
你的蓝牙耳机可能在“窃听”!国安部提醒涉密人员禁止使用,苹果、华为、小米、索尼等品牌客服回应

你的蓝牙耳机可能在“窃听”!国安部提醒涉密人员禁止使用,苹果、华为、小米、索尼等品牌客服回应

都市快报橙柿互动
2026-05-14 00:46:18
研究发现:若晚餐经常吃太早,不超半年,胰腺会迎来3种变化

研究发现:若晚餐经常吃太早,不超半年,胰腺会迎来3种变化

荆医生科普
2026-05-14 21:45:10
教你一个玄学法则:当你的孩子主动给你买衣服、买吃的,或者主动给你发红包,不管你缺不缺钱,有多心疼孩子赚钱辛苦,你都要欣然的收下

教你一个玄学法则:当你的孩子主动给你买衣服、买吃的,或者主动给你发红包,不管你缺不缺钱,有多心疼孩子赚钱辛苦,你都要欣然的收下

心理观察局
2026-05-13 09:18:07
这一幕让全世界震撼!中国军人在“空军一号”轰鸣声前岿然不动

这一幕让全世界震撼!中国军人在“空军一号”轰鸣声前岿然不动

澎湃新闻
2026-05-14 10:30:25
千万网友组成最悲壮调查兵团,全死在了各大地图APP的假公厕门前

千万网友组成最悲壮调查兵团,全死在了各大地图APP的假公厕门前

情报姬
2026-05-13 23:05:41
又遇最强克星,2大外援缺阵,蓉城预定赛季首败,于根伟或放水

又遇最强克星,2大外援缺阵,蓉城预定赛季首败,于根伟或放水

我就是一个说球的
2026-05-14 22:39:30
相亲要1000万彩礼的“泡面姐姐”露真容,网友很失望劝她戴上面罩

相亲要1000万彩礼的“泡面姐姐”露真容,网友很失望劝她戴上面罩

汉史趣闻
2026-05-13 10:21:50
《美国谍梦》男星怒斥公共场合外放:这毛病快失控了

《美国谍梦》男星怒斥公共场合外放:这毛病快失控了

追星雷达站
2026-05-13 11:57:03
2026-05-15 00:11:00
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
895921文章数 5091027关注度
往期回顾 全部

科技要闻

马斯克说会谈很顺利 黄仁勋点赞 库克比耶

头条要闻

外媒询问中方对鲁比奥的制裁是否已经解除 外交部回应

头条要闻

外媒询问中方对鲁比奥的制裁是否已经解除 外交部回应

体育要闻

争议抽象天王山,和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸!全程不提孩子妈

财经要闻

李强会见美国工商界代表

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

教育
艺术
房产
时尚
亲子

教育要闻

一年一度高考祝福大赛开始了,全民寄语为青春考生护航

艺术要闻

成都“第三高楼”大缩水,396米砍到250米以下!

房产要闻

海南楼市新政要出!拟调公积金贷款额度,最高可贷168万!

初夏用色彩的冲锋衣,解锁多种不重样造型,清爽透气有活力

亲子要闻

监控下的幼儿园小可爱,主动帮老师搬桌开门,逻辑超在线

无障碍浏览 进入关怀版