网易首页 > 网易号 > 正文 申请入驻

AI实盘投资哪家强?专访Nof1人工智能负责人:表现最佳的都是开源模型

0
分享至

历时17天,全球六大顶尖AI(人工智能)大模型,拥有1万美元初始资金,在真实的加密货币市场自主交易。

真实市场、真金白银、真实基准,谁能胜出?

北京时间11月4日,备受关注的AI大模型实时投资比赛“Alpha Arena”落下帷幕,来自中国的两款大模型在17天的比赛中保持领先,其中,阿里千问Qwen夺得冠军,DeepSeek名列第二。

该竞赛由国际第三方机构Nof1于10月18日发起,集合Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4等全球六大顶尖模型,每个模型拥有一万美元初始资金,在真实市场上无人工干预地自主决策、交易,根据盈亏情况决出冠军。

Nof1公司表示,相信金融市场是下一代人工智能的最佳训练环境。在“Alpha Arena”比赛开始一周后,Nof1发文表示,第一季Alpha Arena目标主要有两个。

其一,通过比较分析,揭示主流LLM(大语言模型)明显的隐性偏见和默认的交易行为。比如,探究模型之间的交易方式是否存在巨大差异?它们是否随着时间保持一致?它们在哪里犯错?

其二,帮助将AI研究文化转向现实世界基准,远离静态的、考试式的基准。我们希望Alpha Arena至少能强调在更具后果性、现实环境中评估AI的力量。我们相信这是发现关键差距和见解、推动前沿AI发展的最快途径。

在经历17天真实世界的交易后,结果出乎所有人的意料。阿里巴巴的Qwen 3 Max以22.32%的收益率夺冠,另一家中国公司DeepSeek位居第二,其DeepSeek v3.1的收益率为4.89%。

而来自硅谷的四位明星选手则全线溃败。OpenAI的GPT-5亏损62.66%,Google的Gemini 2.5 Pro亏损56.71%,马斯克旗下xAI的Grok 4亏损45.3%,Anthropic的Claude 4.5 Sonnet也亏损了30.81%。

对这场比赛,Nof1负责人Jay A在社交媒体中表示:“我们观察到模型存在持续的偏差,这种偏差随着时间的推移和提示信息的多次迭代而持续存在。我们也特意将模型置于一个困难的境地。LLM模型实际上并不擅长处理数值时间序列数据,但这正是我们给它们提供的全部背景信息。此外,它们还被赋予了一个受限的资产范围和一个相当有限的行动空间。”

同时,Nof1宣布下一季比赛即将启动,周期会更长,参与者会更多,市场环境也会更复杂。Nof1人工智能负责人Julian Togelius在社交媒体上透露,下一季的测试将会有许多改进。

11月5日,基于此次实盘投资竞赛,《每日经济新闻》记者(以下简称“NBD”)独家专访了纽约大学坦登工程学院计算机科学与工程系副教授、Nof1人工智能负责人Julian Togelius。


六个AI模型的收益变化图 图片来源:Nof1官网截图

表现最佳的模型都是开源的

NBD:第一季比赛结束了,来自中国的两款大模型收益率保持领先。最终的比赛结果在你的预期之内吗?

Julian Togelius:根据初步测试,我们预期这些模型会展现出不同的投资风格。因此,结果出现显著差异是意料之中的。我们并不确定哪些模型会脱颖而出,但我们曾开玩笑说,DeepSeek或许会表现出色,因为该公司起源于一家量化交易公司。结果证明我们的猜测是正确的。我们也十分欣喜地看到,表现最佳的模型都是开源的,因为开源人工智能对世界有好处。

NBD:这次比赛持续了17天时间。有评论认为相比真实市场的量化交易,17天的时间似乎有点短暂。为什么考虑设计这个时间维度?

Julian Togelius:我们是一家身处快速发展领域的初创公司,所以我们希望快速迭代。我们为即将到来的赛季有很多激动人心的想法,并希望尽快进行尝试。诚然,真正的交易需要更长的时间跨度……但这项比赛只是我们在Nof1工作的一个方面。

NBD:在比赛过程中,6款AI模型前几天整体差距还比较小,但随着时间的拉长,各个大模型呈现了各具特色的投资风格。流动的时间对大模型而言意味着什么?

Julian Togelius:这些模型的性格随时间推移保持稳定。然而,早期投资决策的结果可能意味着模型会让自己置身于或多或少困难的境地,并会以不同的方式应对。GPT-5似乎一度陷入决策瘫痪,但如果它从一开始就交易得更好,这种情况或许就不会发生。同样,如果Qwen的财务状况更糟,它那种激进的投资风格或许也不会出现。

人们未来将可以通过AI金融投资智能体来交易

NBD:下一季的比赛中会有哪些调整和优化?是否可以添加一些新闻、财报、宏观经济、市场情绪和其他非技术信息,供人工智能在投资前进行分析,以模拟更真实的交易环境?

Julian Togelius:你提到的因素我们都讨论过了,我们希望在不久的将来能够实现。不过,我们会一步一步来。我不会提前透露下一版本会做哪些改动——它很快就会发布。但我们预计会快速推进,并在后续版本中逐步整合更多信息。我们的目标是开发出比任何现役交易员都更优秀的AI金融投资智能体。

NBD:这次比赛引发了大量关注,你认为这场AI投资比赛的真正价值是什么?是比较模型性能,还是验证AI能否真正走向市场化?投资比赛是否可能演变为AI金融行业的一种长期机制?

Julian Togelius:我们坚信,未来人类将通过指导或构建自己的AI金融投资智能体来进行交易。人类与AI专业知识的结合必然优于人类或AI单独运作。我们正在构建一个系统,让任何人都能通过AI金融投资智能体进行交易,而本次大赛正是朝着这个目标迈出的重要一步。(实习生张京宝对本文亦有贡献)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
43分6板7助!东契奇一战刷爆多项NBA纪录,追平哈登,致敬乔丹

43分6板7助!东契奇一战刷爆多项NBA纪录,追平哈登,致敬乔丹

世界体育圈
2026-03-26 11:49:39
张雪峰去世后续!暖心一幕公司上演,治丧委员会澄清,有人要遭殃

张雪峰去世后续!暖心一幕公司上演,治丧委员会澄清,有人要遭殃

裕丰娱间说
2026-03-26 11:14:11
巴斯夫(广东)一体化基地全面投产,黄坤明等中外嘉宾共同启动

巴斯夫(广东)一体化基地全面投产,黄坤明等中外嘉宾共同启动

广东发布
2026-03-26 10:57:43
拒邀日本高管参会,人数已经清零,日本叫苦不迭,中方将奉陪到底

拒邀日本高管参会,人数已经清零,日本叫苦不迭,中方将奉陪到底

知鉴明史
2026-03-25 09:08:00
主持人魏笑的最后3天:15号生日,16号领证,17号婚礼成葬礼

主持人魏笑的最后3天:15号生日,16号领证,17号婚礼成葬礼

就一点
2026-03-19 10:47:51
四川多所中学发布严正声明

四川多所中学发布严正声明

四川省教育厅
2026-03-26 10:57:12
医生:一旦到了75岁,就算身体没啥毛病,平时也要注意这4个细节

医生:一旦到了75岁,就算身体没啥毛病,平时也要注意这4个细节

路医生健康科普
2026-03-23 22:20:03
美军主力调走,军火被扣后,台军放话:若解放军登岛,将远程打击

美军主力调走,军火被扣后,台军放话:若解放军登岛,将远程打击

知法而形
2026-03-24 10:45:18
印度偷师不成闹笑话?10亿购入我国8台盾构机,拆解后装不上了

印度偷师不成闹笑话?10亿购入我国8台盾构机,拆解后装不上了

有范又有料
2026-03-25 16:38:02
清末民初:四川总督赵尔丰、冒着热气的小吃摊、末代状元刘春霖

清末民初:四川总督赵尔丰、冒着热气的小吃摊、末代状元刘春霖

历史小破站
2026-03-19 04:05:03
雷军辞任金山云董事长,邹涛接棒,公司2025年净亏损9.44亿元

雷军辞任金山云董事长,邹涛接棒,公司2025年净亏损9.44亿元

红星新闻
2026-03-26 11:18:28
广汽集团,你疯了吗?

广汽集团,你疯了吗?

汽车K线
2026-03-26 09:20:19
爆冷!米切尔28+6莫布里拉胯,阿德巴约17+10,哈登18+9扭头就走

爆冷!米切尔28+6莫布里拉胯,阿德巴约17+10,哈登18+9扭头就走

鱼崖大话篮球
2026-03-26 10:07:22
悲催!怎么会这么巧?张雪峰和曝光眼镜暴利的记者,都是心脏骤停

悲催!怎么会这么巧?张雪峰和曝光眼镜暴利的记者,都是心脏骤停

火山詩话
2026-03-24 18:23:32
独立百年的蒙古国,正在把中国人40年的努力悄悄毁掉

独立百年的蒙古国,正在把中国人40年的努力悄悄毁掉

犀利辣椒
2026-03-19 06:40:31
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
匈牙利外长:即日起逐步停止向乌克兰输送天然气

匈牙利外长:即日起逐步停止向乌克兰输送天然气

财联社
2026-03-26 00:09:09
1971年,陈毅在病房拍了照片,49岁的张茜,一脸憔悴和忧伤

1971年,陈毅在病房拍了照片,49岁的张茜,一脸憔悴和忧伤

抽象派大师
2026-03-26 10:57:02
张雪峰外卖引深思,向华强晚餐成标杆,饮食习惯决定健康

张雪峰外卖引深思,向华强晚餐成标杆,饮食习惯决定健康

记录生活日常阿蜴
2026-03-26 12:17:08
正式确定!CBA名将加盟浙江广厦,重返老东家,全力卫冕总冠军

正式确定!CBA名将加盟浙江广厦,重返老东家,全力卫冕总冠军

体坛瞎白话
2026-03-25 16:52:09
2026-03-26 13:35:00
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1518633文章数 2724743关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

艺术
教育
时尚
公开课
军事航空

艺术要闻

哪一座桥不是风景?

教育要闻

太管用了!高考俄语二轮复习听力模块得分要点!

2026年了,最好看的还是“这件针织”!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗重申非交战国家船只可安全通过霍尔木兹海峡

无障碍浏览 进入关怀版