网易首页 > 网易号 > 正文 申请入驻

谁家AI更会赚钱?大模型投资竞赛中国AI包揽前二

0
分享至

历时17天,AI大模型投资比赛“Alpha Arena”结果出炉,两个中国大模型夺得冠亚军,也是所有模型中唯二两个赚钱的,四大美国头部模型均亏损,GPT-5亏损超62%垫底。


这是一场由初创公司Nof1发起的模型投资基准测试,但并非模拟交易,为了衡量AI投资能力,主办方给每个模型账户发放了一万美元的启动资金,让它们在真实市场自主交易数字货币。Alpha Arena直播整个过程,价格实时波动,并对实时收益进行排名,还可以看到每个模型的交易思路。

参与这次比赛的有六大模型,按最终盈利能力排名,阿里通义的Qwen3 Max在最后阶段反超,排名第一,收益率22.32%,账户余额 12232 美元。DeepSeek chat v3.1紧随其后,收益率4.89%,余额 10489美元 。

Claude Sonnet 4.5、Grok 4、Gemini 2.5 pro、GPT 5排在第三至第六位,亏损幅度均超过30%。尤其是GPT-5亏得最多,账户余额只剩 3734 美元 。

真实市场交易有趣的地方在于,市场永远有波动,是不可预测的,即便最先进的AI也无法保持稳定的收益。这一投资交易竞赛开始于10月18日,持续约两周,排名也持续波动。

例如,Grok 4一度收益排在二位,但最后亏损达45%,排在倒数第三位而DeepSeek交易较为稳定,大部分时间领跑,但就在最后阶段被通义的Qwen3 反超。


就像真正的交易员一样,大模型也有自己的交易风格。

对于DeepSeek的稳定表现,行业将其归因为“专业对口”,毕竟DeepSeek的母公司幻方是量化机构。在持仓方面,DeepSeek覆盖了各个标的,策略简单直接,不换手、不止损、不止盈,属于理性派。

有趣的是Qwen3 Max,每天都在 “All in”一个标的,多倍杠杆,策略出奇地简单,此前方向错误便损失惨重,但从最终结果看反而是盈利最多的一种方向。

Grok 4则被认为交易风格激进,满仓多个标的,高频跟踪趋势,波动较大并不稳定。Claude 最大特点是非常会分析,但太讲逻辑,下手时却犹豫不决,经常调仓失败、反复止损。

亏损较多的Gemini 2.5被网友调侃“交易风格神似散户”,策略反复更改,例如一会做多一会做空,其交易次数远高于前几名的模型,交易费也更高。

对于这次竞赛,发起方Nof1在博客里提到,十年前 DeepMind 用游戏推动了前沿AI 的快速发展,现在他们认为金融市场是下一个AI 时代的最佳训练环境,也是唯一一个随着AI越来越智能而变得越来越难的一个基准。

“我们用市场来训练新的基础模型。”在博客里团队表示,他们想AI 通过开放式学习和大规模强化学习不断进化,最终解决终极复杂挑战。

将投资交给AI真的靠谱吗?有金融行业人士持保留态度,AI并不了解用户真实的资产状况、家庭、工作现状,不知道投资偏好,单纯给出投资建议是危险的行为。此外,AI的底层逻辑是归纳、总结、复现人类社会中已有的信息,而不涉及任何对未来的预测。理性的工具与人的智慧或许才是最佳组合。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
原油飙涨!黄金、白银下跌,美股突变!特朗普威胁!霍尔木兹海峡,最新消息!

原油飙涨!黄金、白银下跌,美股突变!特朗普威胁!霍尔木兹海峡,最新消息!

证券时报e公司
2026-03-26 22:23:23
“两物不送人,子孙人上人”:这2样东西别送人,关系再好也不行

“两物不送人,子孙人上人”:这2样东西别送人,关系再好也不行

白浅娱乐聊
2026-03-17 17:13:11
演员朱珠疑似塌房?照片流出,惊呆网友!

演员朱珠疑似塌房?照片流出,惊呆网友!

大眼妹妹
2025-12-15 10:39:19
100只整装待发!量产机器狼“-20℃极寒测试”现场曝光

100只整装待发!量产机器狼“-20℃极寒测试”现场曝光

中国网
2026-03-26 15:55:11
6-2血洗欧冠德比!巴萨狂轰6球,皇马孤将双响难挡崩盘

6-2血洗欧冠德比!巴萨狂轰6球,皇马孤将双响难挡崩盘

林子说事
2026-03-26 09:42:20
德转列世预赛附加赛球队身价排行:意大利8.39亿欧居首

德转列世预赛附加赛球队身价排行:意大利8.39亿欧居首

懂球帝
2026-03-26 15:59:41
NBA正式扩军!狂砸100亿啊,再见,森林狼or灰熊,东部见

NBA正式扩军!狂砸100亿啊,再见,森林狼or灰熊,东部见

球童无忌
2026-03-26 11:34:27
5月起生效!俄罗斯关闸,8000吨黄金不卖了,全球金市变天

5月起生效!俄罗斯关闸,8000吨黄金不卖了,全球金市变天

瑛派儿老黄
2026-03-26 10:43:45
张靓颖“零透光”裙惊爆热搜,性感曲线令全场屏息,时尚女王?

张靓颖“零透光”裙惊爆热搜,性感曲线令全场屏息,时尚女王?

娱乐领航家
2025-10-28 22:00:07
美媒大胆预测:快船季后赛4-3胜骑士队

美媒大胆预测:快船季后赛4-3胜骑士队

刘笤说体坛
2026-03-27 00:09:38
1981年,彭真狱中见江青,江青出言不逊提出:我要见华国锋邓小平

1981年,彭真狱中见江青,江青出言不逊提出:我要见华国锋邓小平

微野谈写作
2026-01-27 06:00:03
以色列打不动了想停火,伊朗说不,47年的账,今天得好好算清

以色列打不动了想停火,伊朗说不,47年的账,今天得好好算清

花寒弦絮
2026-03-26 23:11:22
三分命中率64.1%,断层全联盟第一!郭士强该给他一个国家队名额

三分命中率64.1%,断层全联盟第一!郭士强该给他一个国家队名额

弄月公子
2026-03-26 11:03:13
德黑兰街头忽然空了:巴斯基帐篷被遗弃,民兵连夜跑了,为什么?

德黑兰街头忽然空了:巴斯基帐篷被遗弃,民兵连夜跑了,为什么?

老马拉车莫少装
2026-03-24 22:55:20
张雪峰遗产纷争的内幕!

张雪峰遗产纷争的内幕!

八卦疯叔
2026-03-26 11:05:04
太阳报:大量枪迷想抢票见证夺冠,西汉姆联严查主队看台购票

太阳报:大量枪迷想抢票见证夺冠,西汉姆联严查主队看台购票

懂球帝
2026-03-26 13:21:13
玄学提醒:如果一个人还在穿着10年前的衣服,只说明3个问题

玄学提醒:如果一个人还在穿着10年前的衣服,只说明3个问题

洞读君
2026-03-04 14:30:12
10万亿美债将要到期,早已资不抵债,美国财政部已经宣布破产?

10万亿美债将要到期,早已资不抵债,美国财政部已经宣布破产?

史行途
2026-03-26 14:06:29
101枚导弹砸向美国航母:伊朗打出了开战以来最强一拳

101枚导弹砸向美国航母:伊朗打出了开战以来最强一拳

闻识
2026-03-27 01:19:31
这就是钱学森后人真实的样貌,女儿定居美国,儿子长孙精忠报国!

这就是钱学森后人真实的样貌,女儿定居美国,儿子长孙精忠报国!

旧史新谭
2026-03-25 13:15:22
2026-03-27 02:00:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
248338文章数 621905关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

数码
旅游
教育
公开课
军事航空

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

旅游要闻

河南开封万岁山武侠城,游客买300元门票:给妻子拍照被保安阻拦

教育要闻

精准研判,提质增效丨我校召开2026届毕业生就业工作研判会

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版