网易首页 > 网易号 > 正文 申请入驻

国外办了场AI投资实盘大赛,国产大模型目前断档式领先

0
分享至

点击上图▲立即收听


如果说DeepSeek是巴菲特的投资信徒,那Gemini2.5pro则像极了心神不宁的散户,它是所有大模型中操作最频繁的选手,平均持仓时间仅有2小时29分钟。


文 / 巴九灵(微信公众号:吴晓波频道)

“谁如果把这个AI交易工具给做出来了,我马上投!”

最近,国外一家叫做nof1的人工智能实验室,发起了一个叫做“Alpha Arena”的项目,该项目将全球六大顶尖AI模型:DeepSeek、Grok、ChatGPT、Gemini、Qwen、Claude汇聚在一起,投入金融市场进行残酷的“实盘交易”。

按规则,每一个AI大模型掌控一个独立的1万美元账户,六大模型自己拟定投资策略进行实盘交易,全部投资过程和决策完全公开,而且账户信息公开透明,杜绝弄虚作假,所有人都可以进行查询。

比赛一开始就引发了AI和数字货币圈层的热议。

截至10月25日凌晨1点,参赛的两款国产大模型在比赛中碾压四款国外大模型。Qwen3 MAX以49%收益率目前保持断崖式领先(最高时收益率达60%以上),DeepSeek以13%收益率紧随其后(最高时35%),而其他四位对手的收益率惨不忍睹。

Claude Sonnet 4.5收益率为-14%,马斯克的Grok 4为-17%,谷歌的Gemini 2.5 Pro录得-67%,垫底的GPT-5最惨,账户净值暴跌-75%。


截至10月24日,账户收益率实时变动中

这场AI大模型的“实弹演习”可谓极富戏剧性。从整个过程来看,开赛当天大家波澜不惊,随后DeepSeek开始领先,而GPT-5、谷歌Gemini则出现大溃败。近日,Qwen3 MAX上演了强势逆袭。


金融,智能的终极测试

本次投资比赛中,六大参赛模型是基于完全相同的市场数据和初始指令,自行掌控10000美元的初始资金,在去中心化交易所上,进行永续合约交易。

评判标准有且只有一个:收益率。

在前置条件完全相同的情况下,影响投资收益率的主要原因,在于这些大模型的“思维方式”。

我们先来回顾下这几天的交易情况。

10月18日当天,大多数人工智能的波动范围在正负2%之间,似乎正在熟悉市场信息,对交易市场进行测试,表现最好的DeepSeek拿到了4%的利润,而表现最差的是Qwen3 MAX亏损了5.26%。

但到了10月20日,DeepSeek净值曲线一路走高,收益率飙升到25.33%,而表现最差的谷歌Gemini暴跌-39.38%,两者收益率相差60%,市场出现巨大分化。


10月20日,DeepSeek异军突起

转折点出现在10月22日。当时,六只大模型的收益率全部告负,号称最强大模型的GPT-5的亏损率超过60%,AI驱动交易的实验一度要接近失败。

而就在这时,DeepSeek和以及此前表现不佳的Qwen3 MAX纷纷自动改写了投资策略,在其他4个大模型持续亏损的情况下脱颖而出,净值曲线波动上涨,Qwen3 MAX更是趁机超过DeepSeek,暂时问鼎收益冠军。


Qwen3 MAX超过DeepSeek


六大模型

有“巴菲特”也有“大韭菜”

仔细分析六大模型的投资风格,就会发现AI也和人类一样,拥有自己鲜明的投资风格。

首先我们来看“量化老兵”,也就是母公司幻方量化研发的DeepSeek。

DeepSeek的投资策略可以说是“大道至简”。它从参赛开始就买入BTC、ETH等主流虚拟货币,然后就如老僧入定一般以10倍杠杆坚定持有,像极了巴菲特的“价值投资”。

截至10月24日,DeepSeek持仓时间中位数长达38小时32分钟,排名六大模型第一。


截至10月24日,账户收益率实时变动中

如果说DeepSeek是巴菲特的投资信徒,那Gemini2.5pro在K线图前显得有些心神不宁,它是所有大模型中操作最频繁的选手,平均持仓时间仅有2小时29分钟。

它的投资策略像散户一样摇摆不定,时而做多,时而做空,短短几天时间就完成了60多笔交易,不仅被围观群众戏称为“微操大师”,而且收益率表现也非常难看。


截至10月24日,账户收益率实时变动中

此外,还有两个“激进大模型”Grok-4和Qwen3 MAX。

马斯克旗下的Grok,风格如其主人一般不羁,满仓多个标的,高杠杆跟踪趋势,收益曲线大起大落,像一个风险偏好极高的对冲基金经理。

10月21日,Grok-4的收益率一度高达50%,这个收益率距离排名第一的DeepSeek仅有1美元的差距。然而,激进的策略导致其在市场回调中迅速回吐利润,甚至目前还亏损中。


截至10月24日,账户收益率实时变动中

Qwen3 MAX则更为极端,每天都在“All in”一个标的,它目前是满仓BTC,但杠杆高达20倍。

在这种策略下,方向对了,一夜暴富不是梦想;方向错了,便损失惨重,这种孤注一掷的风格,让它的净值曲线充满了让人心惊肉跳的猛烈波动。


截至10月24日,账户收益率实时变动中

尽管如此,在唯结果论的前提下,Qwen3 MAX目前的表现无疑是最优秀的。

最后再来看名声在外的大模型GPT-5和Claude Sonnet 4.5。

Claude Sonnet 4.5极少开单,杠杆为10倍,谨慎得就像一个保守的基金经理。最近几天战绩互有胜负,但波动不大。


截至10月24日,账户收益率实时变动中

而GPT-5表现则极度糟糕,从10月19日开始,它的净值便持续下跌且其胜率低得可怜,仅有6%。由不得网友调侃,它可能是最像人的大模型,毕竟韭菜味儿十足。


截至10月24日,账户收益率实时变动中

nof1让六大模型在金融市场竞争的真正目的并非赚钱,而是进行一场大型“金融图灵测试”。

团队认为,人类的金融市场是“智能的终极考验”。若AI能在市场中持续盈利,则证明了它在真实且高度不确定的环境中,拥有超越人类金融专家的能力,这将被视为AI领域的又一座“圣杯”。

换言之,nof1想通过实验回答一个问题:人类社会当下最聪明的AI大模型,能否在残酷的金融市场存活下来?


人均量化交易员来了?

“Alpha Arena”项目的出现,意味着AI驱动的交易将走上历史舞台。在未来,顶尖的金融大模型,会比顶尖的交易员更加重要。

nof1曾经在项目文件中提出了一个问题“我们是否需要用新的架构来训练投资模型,或者LLMs就足够了?等到美东时间2025年11月3日比赛结束,我们或许就能知道答案。

不过,无论哪个大模型在这次比赛中胜出,或都意味着一个新的时代到来:“技术将决定资本。”

数据显示,2023年全球加密货币算法交易量高达94万亿美元,其中70%的交易量是由机器人完成,数字货币市场,已成为全球自动化交易算法最普及的市场。

而在美股市场,程序化交易占比在50%以上,高频交易方面,美国达到50%左右,欧洲在35%左右。在国外,量化交易是一个早就习以为常的老旧名词。

就算在程序化交易相对保守的A股,量化交易占比也在大幅提升:截至2024年7月份,我国程序化交易占比已经从2020年的20%上升至目前的34%,高频交易占比从10%上升到21%。

此外,今年以来,已有二十多家国内券商也已经开通面向投资者的“T0算法”服务,这种日内回转交易算法,将AI和量化交易能力内嵌到APP之中,让普通投资者也可以享受到到机构交易同等级别的自动化交易工具。


图源:网络

相比于传统的量化交易,AI驱动交易可以看成是量化交易的“进阶形态”。

量化交易的核心逻辑是执行预设的、固定的数学模型与交易规则,策略相对固定,在市场风格转变时可能失效,无需人工干预调整。

而AI驱动交易则是让AI大模型从在接入市场数据后自主学习市场规律,甚至能够根据新闻报道、社交媒体、机构研报自主动态调整交易策略,极大减少人工干预。

与此同时,随着比赛的出圈,个人投资者开始思考:如果我用同样的提示词,选择一个“冠军AI大模型”,那么它是否能够代替我进行投资?

答案并没有那么简单,金融大鳄乔治·索罗斯很早就提到了一个著名的概念:反身性。

在索罗斯看来,市场参与者的认知会影响市场本身,而市场的变化又反过来影响参与者的认知,所以当AI进行交易的同时,就会改变市场,从而影响其他AI的交易决策。

因此,尽管“Alpha Arena”项目能够决出一个经过金融市场考验的AI大模型,但当越来越多的人用相同的提示词去训练同样大模型的时候,这个必胜的“AI驱动策略”就会因为使用的人越来越多而失效。

比如,如果所有人都预期DeepSeek会买入某个投资产品而进行提前布局,那么其策略的有效性便会大打折扣。

举个例子,2010年,美国道琼斯工业指数就出现了一次“闪电崩盘”,一家资产管理公司发出的量化交易卖盘“触发”了其他的量化交易的算法,导致各大机构纷纷抛售股票,短时间内指数便暴跌9%,道琼斯指数蒸发7000亿美元。


图源:网络

基于同样的逻辑,如果未来的AI交易模型都基于相同的大模型,拥有了相似的训练数据和策略逻辑,那么一旦市场出现了黑天鹅,触发了所有AI的卖出指令,是否会出现比2010年更严重的踩踏危机?

很显然,交易的圣杯或许会短暂存在,但它绝不是永恒的。

所以对普通人而言,跟着AI抄作业,甚至是让AI代替自己进行投资,仍然是一件值得商榷的事情。

毕竟,所有人都知道的财富密码,就不再是密码了。


本篇作者| 王振超|责任编辑|何梦飞

主编|何梦飞|图源|VCG、网络

吴晓波年终秀十年止于当止

“AI闪耀中国”开启新的篇章

12月敬请期待

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
民进党当局纽约设宴,美官员一个没到,岛内嘲讽:“零存在感”

民进党当局纽约设宴,美官员一个没到,岛内嘲讽:“零存在感”

环球网资讯
2025-11-03 06:47:46
天涯神贴:普通人家孩子的最好出路

天涯神贴:普通人家孩子的最好出路

前沿天地
2025-11-03 07:42:49
央视力荐却遭全民抵制!《澎湖海战》因历史观争议,60亿票房梦碎

央视力荐却遭全民抵制!《澎湖海战》因历史观争议,60亿票房梦碎

麦大人
2025-11-01 22:53:33
“要把最坏的时代变成最好的时代”,郑丽文就任,承诺缔造两岸和平

“要把最坏的时代变成最好的时代”,郑丽文就任,承诺缔造两岸和平

环球网资讯
2025-11-03 07:01:21
杭州婚宴翻车了:新娘换装85分钟,22桌宾客走了一半,网友:活该

杭州婚宴翻车了:新娘换装85分钟,22桌宾客走了一半,网友:活该

刘哥谈体育
2025-11-02 14:32:38
知名品牌突发:将关闭全部门店

知名品牌突发:将关闭全部门店

鲁中晨报
2025-11-03 07:11:03
女子欲望强有2个情夫,因阻止情夫和其妻缠绵,2013年被情夫杀死

女子欲望强有2个情夫,因阻止情夫和其妻缠绵,2013年被情夫杀死

汉史趣闻
2025-11-02 16:20:42
只要几十块就能解决油皮烦恼?异维A酸软胶囊真的适合你吗

只要几十块就能解决油皮烦恼?异维A酸软胶囊真的适合你吗

益药健康
2025-10-22 17:25:51
自称“昆仑童子”“玉皇大帝”“紫薇圣人”,敛财超500万、奸淫妇女10人!起底“天道鸿元”

自称“昆仑童子”“玉皇大帝”“紫薇圣人”,敛财超500万、奸淫妇女10人!起底“天道鸿元”

新京报
2025-11-03 07:53:33
原北京市国家税务局党组书记、局长吴新联被查

原北京市国家税务局党组书记、局长吴新联被查

新京报
2025-11-03 10:07:06
赖清德称“台湾不属于中国”,蒋万安再次亮明立场,反对两岸统一

赖清德称“台湾不属于中国”,蒋万安再次亮明立场,反对两岸统一

寻途
2025-11-02 16:31:10
蔡奇在人民日报撰文

蔡奇在人民日报撰文

澎湃新闻
2025-11-03 09:04:04
中产真没钱!孩子的国际学校退费潮来了,全家都在“教育降级”

中产真没钱!孩子的国际学校退费潮来了,全家都在“教育降级”

阿器谈史
2025-11-02 21:47:50
开拓者官宣召回杨瀚森!未来下放只训练不比赛?队记解析核心原因

开拓者官宣召回杨瀚森!未来下放只训练不比赛?队记解析核心原因

罗说NBA
2025-11-03 08:35:00
工信部突然鼓励燃油车?给燃油车补贴,释放什么信号?

工信部突然鼓励燃油车?给燃油车补贴,释放什么信号?

大道微言
2025-11-01 08:58:16
好消息:乌克兰援军来了,红军村反击战取得初步胜利

好消息:乌克兰援军来了,红军村反击战取得初步胜利

史政先锋
2025-11-02 13:40:39
“史上最寒酸”的凯里动物园收到大量捐款,70岁园长喊话爱心网友:别捐了,我们现在有能力把动物养好

“史上最寒酸”的凯里动物园收到大量捐款,70岁园长喊话爱心网友:别捐了,我们现在有能力把动物养好

极目新闻
2025-11-02 22:09:14
古二再爆王家卫录音,被蛐蛐明星达8人,最惨的是唐嫣和金靖

古二再爆王家卫录音,被蛐蛐明星达8人,最惨的是唐嫣和金靖

小海娱计
2025-11-01 11:20:41
美国政府都“关门”一个多月了,为啥美国人却一点都不慌呢?

美国政府都“关门”一个多月了,为啥美国人却一点都不慌呢?

翻开历史和现实
2025-11-02 23:09:19
难怪特朗普抛弃欧洲,美方终于公开真相:美军的真正目标是中国

难怪特朗普抛弃欧洲,美方终于公开真相:美军的真正目标是中国

空天力量
2025-11-03 13:07:28
2025-11-03 15:47:00
吴晓波频道 incentive-icons
吴晓波频道
“巴九灵”们运营的知识平台
7429文章数 431514关注度
往期回顾 全部

科技要闻

余承东内部信:鸿蒙下一步要实现上亿覆盖

头条要闻

中纪委"三连发" 三"虎"同日被开除党籍

头条要闻

中纪委"三连发" 三"虎"同日被开除党籍

体育要闻

开拓者官宣召回杨瀚森 队记解析核心原因

娱乐要闻

录音彻底揭露知名导演王家卫的体面

财经要闻

马斯克:未来5-6年传统手机与App将消失

汽车要闻

超跑同款磁流变减振 深蓝L06包你开得爽

态度原创

手机
房产
游戏
公开课
军事航空

手机要闻

华为 Mate 70 Air 真机曝光:居中单孔等深四曲屏、居中大圆镜头

房产要闻

中粮(三亚)国贸中心ITC首期自贸港政策沙龙圆满举行

玩家发文请愿暗黑4新装备常驻:数值的魅力!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美总统威胁对尼日利亚动武 尼方回应

无障碍浏览 进入关怀版