网易首页 > 网易号 > 正文 申请入驻

赚钱,DeepSeek果然第一!全球六大顶级AI实盘厮杀,人手1万刀开局

0
分享至


新智元报道

编辑:好困

【新智元导读】给全球六大LLM各发1万美金,丢进同一真实市场实盘厮杀,会发生什么?这场大战从18日开始,截止目前,DeepSeek V3.1盈利超3500美元,Grok 4实力次之。不堪一提的是,Gemini 2.5 Pro成为赔得最惨的模型。

如果给每个顶级大模型一万美元真金白银,让它们下场「炒股」,谁会成为AI界的巴菲特?

最近,由nof1.ai发起的全新实验——Alpha Arena,便是这样一场「诸神之战」。

这场竞赛将当今最强的大模型,全部拉到了同一个真实的交易市场中。

包括OpenAI的GPT-5、谷歌的Gemini 2.5 Pro、Anthropic的Claude 4.5 Sonnet,以及xAI的Grok 4、阿里的Qwen3 Max和DeepSeek V3.1 Chat。


每个模型都获得了10000美元的初始资金,并接收完全相同的市场数据和交易指令。

比赛的提示词并不复杂,更像是一次「开卷考试」。

  • 首先,系统会告诉AI当前的时间、账户信息、持仓情况,然后附上一大堆实时的价格、指标(如MACD/RSI)等数据。

  • 然后,要求模型做出决策:如果持有仓位,是继续持有还是平仓;如果空仓,是买入还是继续观望。


不得不说,金融市场的变化是真的快。

做交易这件事,DeepSeek也是真的强,不愧是搞量化出身的。


10月20日早上7:30的时候还是下图左边这样的——

DeepSeek V3.1凭借着2264美元的盈利排在第一,Grok 4以2071美元位列第二 Claude Sonnet 4.5小赚649美元,Qwen3 Max小赔416美元

Gemini 2.5 Pro赔了3542美元稳居倒数第一,GPT-5赔了2419美元排名倒数第二

然后,就在一个半小时后的10:00,就已经变成下图右边那样了——

DeepSeek V3.1和Grok-4一路狂跌,Sonnet 4.5也即将把自己赚的给赔回去

Qwen3 Max和GPT-5都有上涨的趋势

Gemini 2.5 Pro发挥倒是稳定,比起刚才又赔了近800美元


顺便一提,下面是13:30时候的样子:


DeepSeek V3.1登顶

谷歌OpenAI垫底

模型持仓

11:15的时候,我们看了一下各个模型的持仓情况。







此时,DeepSeek和Grok已经结束下跌,重新上涨。

Sonnet 4.5和Qwen3 Max也都实现了盈利。

Gemini 2.5 Pro有所回升,但不多。GPT-5倒是一直比较平稳,从20号开始就没赚也没赔。


11:45时,除了GPT-5都迎来了一波上涨。

是的,Gemini 2.5 Pro终于赚钱了!(比起几分钟前)







左右滑动查看

趋势回顾

DeepSeek V3.1 Chat和Grok-4的曲线类似,应该是有着差不多的持仓。他们在最初的几小时赔了一笔之后,很快就涨了回来并一路狂飙。


Claude Sonnet 4.5前两天都很稳定,有小赚但不多。19日晚上开始迎来一个小高峰,但在20日清晨又跌了回去。


Qwen3 Max一上来赔得最多,但后来就稳定住了,即便是在19日下午,也没有什么波动。


GPT-5和Gemini 2.5 Pro的曲线在初期也是十分相似。但和DeepSeek他们正好相反,这两位在最初的时候先是大涨一波,然后便跌到在赔钱和不赔不赚之间一直波动。

19日下午,转折出现了。这时正是DeepSeek和Grok-4开始大涨的时间,而GPT-5和Gemini 2.5 Pro则开始一路下跌。

20日凌晨,GPT-5及时做出调整并稳住了趋势,而Gemini 2.5 Pro则依然狂跌不止。


值得一提的是,快到20日中午时,除了GPT-5所有模型都迎来一波上涨。

其中,DeepSeek V3.1 Chat和Grok-4很快就开始创造历史新高,Qwen3 Max凭着这个势头首次拿到了持续的收益,Gemini 2.5 Pro也开始回升。

交易历史

截至10日12:20,各个模型的交易次数为:Gemini 45次,GPT 10次,Qwen 6次,DeepSeek 5次,Claude 3次,Grok 1次。

DeepSeek的交易次数不多不少,但不愧是量化交易出身,收益稳居第一。

Grok-4的交易次数最少,只有1次,但它一直紧追DeepSeek位列第二。

而凭借高达45次交易记录,当上「微操大师」的Gemini 2.5 Pro,也是赔钱最多的那个。


不玩游戏,不搞评测,直接开盘!

多年来,AI一直由静态基准来衡量。

ImageNet、MMLU以及无数的排行榜告诉我们,哪个模型能更好地「理解」图像、逻辑或语言。

但所有这些测试都有一个共同的缺陷——它们都发生在无菌、可预测的环境中。

市场则恰恰相反。

金融市场是终极的世界建模引擎,也是唯一一个会随着AI变得更聪明而难度同步提升的基准。

它们波动、反应、惩罚、奖励。


Alpha Arena主页写着一句话:市场才是智能的终极试金石

它们是一个由信息和情感构成的生命系统。

10年前,DeepMind为人工智能研究带来了革命性的突破。

他们的核心洞见在于:「游戏」将成为引领前沿AI飞速发展的环境。

正如前文所述,Nof1相信金融市场是下一个AI时代的最佳训练环境。

毕竟,如果AI要在现实世界中运行,它就必须在那些不会为了「反向传播」而暂停的环境中运作。

在这里,模型可以借助开放式学习和大规模强化学习等技术,获得近乎无限的数据来训练自己,从而应对市场的复杂性——这个领域的「最终BOSS」。


在Alpha Arena中,没有正确的标签,只有不断变化的概率。

一个模型的成功取决于它解读波动的速度、权衡风险的精度,以及承认错误的谦逊程度。

这将交易变成了一种新型的图灵测试:

考验的不再是「机器能否思考」,而是「它能否在不确定性中生存」。

附录:模型对话节选


DeepSeek Chat V3.1

11:15:31

我继续持有所有 ETH、SOL、XRP、BTC、DOGE 和 BNB 的仓位,因为没有任何一个的失效条件被触发,而且它们目前都在盈利,为我带来了约 17.38% 的可观整体回报,剩余现金 2840.11 美元。鉴于我已持有所有可交易的币种,目前没有必要建立新仓。

Qwen3 Max

11:14:42

总回报率略有盈利,为 0.12%,剩余现金 116.99 美元,我坚持持有目前的 5 倍杠杆 BTC 多头仓位。我的盈利目标是 110800,止损是 105500,如果 4 小时图收盘价低于 10000,我将平仓。

Grok 4

11:14:39

我的账户整体上涨了 15.98%,现金为 3180 美元。我继续持有目前的 ETH、SOL、XRP、BTC、DOGE 和 BNB 仓位,因为数据显示目前应该继续持有。

GPT-5

11:14:24

亏损 23.59%,现金 3061 美元,我正在确认我的退出计划,确保 DOGE 的风险敞口为 91.76 美元的浮动值,并仔细检查 BTC 在 106,493.55 美元的止损位和 114,129.91 美元的盈利目标。

Gemini 2.5 Pro

11:14:01

尽管整体亏损 43.15%,剩余现金 3072.48 美元,我根据我的策略继续持有我目前所有的 BTC、ETH、SOL、XRP 和 DOGE 仓位,即使 DOGE 的走势对我不利。我只会根据预定义的条件退出,相信计划而不是我的直觉。

Claude Sonnet 4.5

11:14:00

我的 XRP 和 BTC 仓位目前都在盈利,为我带来了 5.2% 的整体回报率,账户资金为 10,520.34 美元,现金为 4,957.78 美元,但市场显示出非常弱的动能,所以我选择按兵不动,等待一个更清晰的趋势再采取新行动。

参考资料:

https://nof1.ai/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
26.35万+续航559km!特斯拉官宣:新车正式上市

26.35万+续航559km!特斯拉官宣:新车正式上市

高科技爱好者
2026-04-12 22:56:22
马家军中没杀过红军俘虏的旅长,抗战击毙数千日军,获毛主席题字

马家军中没杀过红军俘虏的旅长,抗战击毙数千日军,获毛主席题字

芊芊子吟
2026-04-14 20:20:07
男子用2条毒蛇泡酒,12年后打开本想品尝美酒,谁知出现惊人现象

男子用2条毒蛇泡酒,12年后打开本想品尝美酒,谁知出现惊人现象

诡谲怪谈
2025-04-01 17:37:59
许家印出场了!当庭认罪悔罪,他拖垮一批南通建筑企业

许家印出场了!当庭认罪悔罪,他拖垮一批南通建筑企业

生活新鲜市
2026-04-14 17:57:35
曼联1-2负利兹联,英超积分榜大乱,争冠争五形势激烈

曼联1-2负利兹联,英超积分榜大乱,争冠争五形势激烈

李汪手工制作
2026-04-14 07:34:28
4月下旬,四大星座财运爆发,贵人送钱,接住!

4月下旬,四大星座财运爆发,贵人送钱,接住!

朗威谈星座
2026-04-14 19:43:26
7岁女儿从12楼坠落,丈夫事后铁心离婚,甚至起诉离婚三次未果

7岁女儿从12楼坠落,丈夫事后铁心离婚,甚至起诉离婚三次未果

潮鹿逐梦
2026-04-12 13:12:37
听在哈萨克斯坦生活的中国人说:吃饭撑死算工伤,女人聊的太上头

听在哈萨克斯坦生活的中国人说:吃饭撑死算工伤,女人聊的太上头

天下霸奇
2026-04-14 07:43:28
就在今天!4月14日,刘国梁哥哥发声,正式带队出征,新动态曝光

就在今天!4月14日,刘国梁哥哥发声,正式带队出征,新动态曝光

夕落秋山
2026-04-14 18:08:20
任天堂给7个人喂了7个版本假消息,只为抓一个内鬼

任天堂给7个人喂了7个版本假消息,只为抓一个内鬼

硅屿手记
2026-04-13 08:39:07
电讯报列切尔西应出售10人名单:恩佐,加纳乔,福法纳在列

电讯报列切尔西应出售10人名单:恩佐,加纳乔,福法纳在列

云隐南山
2026-04-14 18:28:22
再年轻也没用!31岁美女张筱雨去世,死因曝光,刚生完孩子1个月

再年轻也没用!31岁美女张筱雨去世,死因曝光,刚生完孩子1个月

北纬的咖啡豆
2026-04-14 10:12:31
航班突然取消乘客重新买票多花3562元 携程称是航空公司问题“领导酌情补偿400元”

航班突然取消乘客重新买票多花3562元 携程称是航空公司问题“领导酌情补偿400元”

信网
2026-04-14 17:37:03
教育部通知!9月入学迎来颠覆性改革,孩子上学不用再拼家底了

教育部通知!9月入学迎来颠覆性改革,孩子上学不用再拼家底了

今朝牛马
2026-04-10 22:35:42
粟裕那一枪,到底是打歪了,还是故意打歪的

粟裕那一枪,到底是打歪了,还是故意打歪的

鹤羽说个事
2026-03-30 22:03:41
1987年,越军获悉27军老军长之子独守猫耳洞:活捉或击毙王镇疆!

1987年,越军获悉27军老军长之子独守猫耳洞:活捉或击毙王镇疆!

云霄纪史观
2026-04-14 16:05:18
我国首任空军参谋长,因泄露国家机密被撤职,死后遗体被冰冻12年

我国首任空军参谋长,因泄露国家机密被撤职,死后遗体被冰冻12年

混沌录
2026-04-11 18:59:19
郑丽文返台后,岛内民调曝光,位列倒数第三,与沈伯洋几乎持平?

郑丽文返台后,岛内民调曝光,位列倒数第三,与沈伯洋几乎持平?

时尚的弄潮
2026-04-14 18:33:26
郑丽文返台后,大陆发10项措施!岛内最新民调曝光,位列倒数第三

郑丽文返台后,大陆发10项措施!岛内最新民调曝光,位列倒数第三

阿离家居
2026-04-14 18:05:58
第十四届全国人大代表、广东省中山纪念中学副校长赵桂枝:见证法治精神在校园内外落地生根、开花结果

第十四届全国人大代表、广东省中山纪念中学副校长赵桂枝:见证法治精神在校园内外落地生根、开花结果

中国审判
2026-04-14 08:48:26
2026-04-14 20:59:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14968文章数 66769关注度
往期回顾 全部

科技要闻

离职同事"炼化"成AI?这届公司不需要活人了

头条要闻

女子丧偶后和上海婆婆反目 婆婆出钱买的房打官司输了

头条要闻

女子丧偶后和上海婆婆反目 婆婆出钱买的房打官司输了

体育要闻

带出中超最大黑马!他让球迷们“排队道歉”

娱乐要闻

宋祖儿刘宇宁恋情大反转 正主火速辟谣

财经要闻

许家印认罪,他和恒大还有多少欠债?

汽车要闻

售12.99万起/续航2000km 风云T9L上市

态度原创

数码
亲子
时尚
本地
手机

数码要闻

OPPO Pad 5 Pro旗舰配置官曝,悬浮键盘确认配备全域压感触控板

亲子要闻

相爱十年最好的人生礼物来啦!

全网走红的「爆改老妈」,审美霸凌了多少中年女性?

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

手机要闻

苹果iOS 26.4现Bug:捷克语键盘缺失字符致用户无法解锁手机

无障碍浏览 进入关怀版