网易首页 > 网易号 > 正文 申请入驻

AI实盘投资哪家强?专访Nof1人工智能负责人:表现最佳的都是开源模型

0
分享至

历时17天,全球六大顶尖AI(人工智能)大模型,拥有1万美元初始资金,在真实的加密货币市场自主交易。

真实市场、真金白银、真实基准,谁能胜出?

北京时间11月4日,备受关注的AI大模型实时投资比赛“Alpha Arena”落下帷幕,来自中国的两款大模型在17天的比赛中保持领先,其中,阿里千问Qwen夺得冠军,DeepSeek名列第二。

该竞赛由国际第三方机构Nof1于10月18日发起,集合Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4等全球六大顶尖模型,每个模型拥有一万美元初始资金,在真实市场上无人工干预地自主决策、交易,根据盈亏情况决出冠军。

Nof1公司表示,相信金融市场是下一代人工智能的最佳训练环境。在“Alpha Arena”比赛开始一周后,Nof1发文表示,第一季Alpha Arena目标主要有两个。

其一,通过比较分析,揭示主流LLM(大语言模型)明显的隐性偏见和默认的交易行为。比如,探究模型之间的交易方式是否存在巨大差异?它们是否随着时间保持一致?它们在哪里犯错?

其二,帮助将AI研究文化转向现实世界基准,远离静态的、考试式的基准。我们希望Alpha Arena至少能强调在更具后果性、现实环境中评估AI的力量。我们相信这是发现关键差距和见解、推动前沿AI发展的最快途径。

在经历17天真实世界的交易后,结果出乎所有人的意料。阿里巴巴的Qwen 3 Max以22.32%的收益率夺冠,另一家中国公司DeepSeek位居第二,其DeepSeek v3.1的收益率为4.89%。

而来自硅谷的四位明星选手则全线溃败。OpenAI的GPT-5亏损62.66%,Google的Gemini 2.5 Pro亏损56.71%,马斯克旗下xAI的Grok 4亏损45.3%,Anthropic的Claude 4.5 Sonnet也亏损了30.81%。

对这场比赛,Nof1负责人Jay A在社交媒体中表示:“我们观察到模型存在持续的偏差,这种偏差随着时间的推移和提示信息的多次迭代而持续存在。我们也特意将模型置于一个困难的境地。LLM模型实际上并不擅长处理数值时间序列数据,但这正是我们给它们提供的全部背景信息。此外,它们还被赋予了一个受限的资产范围和一个相当有限的行动空间。”

同时,Nof1宣布下一季比赛即将启动,周期会更长,参与者会更多,市场环境也会更复杂。Nof1人工智能负责人Julian Togelius在社交媒体上透露,下一季的测试将会有许多改进。

11月5日,基于此次实盘投资竞赛,《每日经济新闻》记者(以下简称“NBD”)独家专访了纽约大学坦登工程学院计算机科学与工程系副教授、Nof1人工智能负责人Julian Togelius。


六个AI模型的收益变化图 图片来源:Nof1官网截图

表现最佳的模型都是开源的

NBD:第一季比赛结束了,来自中国的两款大模型收益率保持领先。最终的比赛结果在你的预期之内吗?

Julian Togelius:根据初步测试,我们预期这些模型会展现出不同的投资风格。因此,结果出现显著差异是意料之中的。我们并不确定哪些模型会脱颖而出,但我们曾开玩笑说,DeepSeek或许会表现出色,因为该公司起源于一家量化交易公司。结果证明我们的猜测是正确的。我们也十分欣喜地看到,表现最佳的模型都是开源的,因为开源人工智能对世界有好处。

NBD:这次比赛持续了17天时间。有评论认为相比真实市场的量化交易,17天的时间似乎有点短暂。为什么考虑设计这个时间维度?

Julian Togelius:我们是一家身处快速发展领域的初创公司,所以我们希望快速迭代。我们为即将到来的赛季有很多激动人心的想法,并希望尽快进行尝试。诚然,真正的交易需要更长的时间跨度……但这项比赛只是我们在Nof1工作的一个方面。

NBD:在比赛过程中,6款AI模型前几天整体差距还比较小,但随着时间的拉长,各个大模型呈现了各具特色的投资风格。流动的时间对大模型而言意味着什么?

Julian Togelius:这些模型的性格随时间推移保持稳定。然而,早期投资决策的结果可能意味着模型会让自己置身于或多或少困难的境地,并会以不同的方式应对。GPT-5似乎一度陷入决策瘫痪,但如果它从一开始就交易得更好,这种情况或许就不会发生。同样,如果Qwen的财务状况更糟,它那种激进的投资风格或许也不会出现。

人们未来将可以通过AI金融投资智能体来交易

NBD:下一季的比赛中会有哪些调整和优化?是否可以添加一些新闻、财报、宏观经济、市场情绪和其他非技术信息,供人工智能在投资前进行分析,以模拟更真实的交易环境?

Julian Togelius:你提到的因素我们都讨论过了,我们希望在不久的将来能够实现。不过,我们会一步一步来。我不会提前透露下一版本会做哪些改动——它很快就会发布。但我们预计会快速推进,并在后续版本中逐步整合更多信息。我们的目标是开发出比任何现役交易员都更优秀的AI金融投资智能体。

NBD:这次比赛引发了大量关注,你认为这场AI投资比赛的真正价值是什么?是比较模型性能,还是验证AI能否真正走向市场化?投资比赛是否可能演变为AI金融行业的一种长期机制?

Julian Togelius:我们坚信,未来人类将通过指导或构建自己的AI金融投资智能体来进行交易。人类与AI专业知识的结合必然优于人类或AI单独运作。我们正在构建一个系统,让任何人都能通过AI金融投资智能体进行交易,而本次大赛正是朝着这个目标迈出的重要一步。(实习生张京宝对本文亦有贡献)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
前NBA球员贝弗利被捕,涉重罪袭击

前NBA球员贝弗利被捕,涉重罪袭击

鲁中晨报
2025-11-19 09:40:11
大批中国人依然去日本旅游,被日媒看了笑话,记者采访道出心声

大批中国人依然去日本旅游,被日媒看了笑话,记者采访道出心声

奇思妙想草叶君
2025-11-18 01:27:22
已确认!是知名演员周润发

已确认!是知名演员周润发

大象新闻
2025-11-18 13:14:07
排面!40岁C罗造访白宫+微笑握手特朗普,美国总统宣布:他是GOAT

排面!40岁C罗造访白宫+微笑握手特朗普,美国总统宣布:他是GOAT

我爱英超
2025-11-19 07:10:18
又反转!曝喻恩泰出轨美女律师,两人挽手回酒店,女方美照曝光!

又反转!曝喻恩泰出轨美女律师,两人挽手回酒店,女方美照曝光!

娱圈小愚
2025-11-19 10:13:42
几十万香港人到广东买社保医保!参保人:月交898元,退休后领4年就能回本;公立医疗排队动辄两三年,自费比内地贵几倍

几十万香港人到广东买社保医保!参保人:月交898元,退休后领4年就能回本;公立医疗排队动辄两三年,自费比内地贵几倍

每日经济新闻
2025-11-18 23:38:06
靠农业农村部来解决农民规模性返乡返贫?让城市民营经济重焕活力才是唯一解决之道

靠农业农村部来解决农民规模性返乡返贫?让城市民营经济重焕活力才是唯一解决之道

虎说八道1
2025-11-19 07:04:50
半小时收费4170元!女大学生网购“上门开锁”遭遇天价账单

半小时收费4170元!女大学生网购“上门开锁”遭遇天价账单

潇湘晨报
2025-11-18 23:47:14
上海赴日男子在日媒前声称,不在乎政府的呼吁,花钱是自己的自由

上海赴日男子在日媒前声称,不在乎政府的呼吁,花钱是自己的自由

我心纵横天地间
2025-11-18 19:01:13
突发特讯!日本演员矢野浩二通告全球:永远支持一个中国罕见措辞

突发特讯!日本演员矢野浩二通告全球:永远支持一个中国罕见措辞

TVB的四小花
2025-11-19 10:07:55
最能干活的那批人回来了 孟婆汤的质量越来越差了

最能干活的那批人回来了 孟婆汤的质量越来越差了

夜深爱杂谈
2025-11-18 21:23:05
于东来卸任胖东来总经理,多名高管退出

于东来卸任胖东来总经理,多名高管退出

极目新闻
2025-11-19 09:23:08
“高中生院士”骗局,折射的是高校系统性腐败

“高中生院士”骗局,折射的是高校系统性腐败

凯利经济观察
2025-11-19 09:33:39
最年轻的美女董事长上任了!

最年轻的美女董事长上任了!

微微热评
2025-11-08 13:47:08
45金!41金!39金!19日凌晨全运会最新金牌榜:山东+江苏单日3金

45金!41金!39金!19日凌晨全运会最新金牌榜:山东+江苏单日3金

大秦壁虎白话体育
2025-11-19 09:41:19
把这篇文字,发给你身边的日本人

把这篇文字,发给你身边的日本人

柴差说
2025-11-18 21:53:19
中日打不起来——实力、舆论与“打嘴炮”的深层逻辑

中日打不起来——实力、舆论与“打嘴炮”的深层逻辑

郑说
2025-11-19 11:08:49
赵丽颖方发文:希望大家停止传播!不要把镜头对准未成年人!

赵丽颖方发文:希望大家停止传播!不要把镜头对准未成年人!

极目新闻
2025-11-19 07:43:17
世界太魔幻,高中学历骗子成我国大学首席科学家,学术圈怎么了?

世界太魔幻,高中学历骗子成我国大学首席科学家,学术圈怎么了?

李将平老师
2025-11-18 20:28:43
左宗棠60岁抬棺西征,见孩童在井边玩泥巴,他下令:把这口井填了

左宗棠60岁抬棺西征,见孩童在井边玩泥巴,他下令:把这口井填了

不易一字
2025-11-18 14:27:05
2025-11-19 12:31:00
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1405305文章数 2720094关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

女子参加模特大赛夺"广东冠军" 因突破大众审美引争议

头条要闻

女子参加模特大赛夺"广东冠军" 因突破大众审美引争议

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

又反转!曝喻恩泰出轨美女律师

财经要闻

黄金税改两周,水贝低价神话终结?

汽车要闻

脱胎换骨的优秀底盘Get 新款享界S9动态驾驶体验

态度原创

本地
时尚
旅游
教育
公开课

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

拍照不用露脸也很美!4个心机pose学起来,朋友圈狂收赞

旅游要闻

嘿重庆丨一踏上这条悬空栈桥,要出片的心马上稳了

教育要闻

家里欠债百万,学霸用刷题方法写网文还清债务?这才是降维打击!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版