网易首页 > 网易号 > 正文 申请入驻

AI 交易员“面试”集体翻车:交易过频、策略混乱……算法模型仍难看懂市场

0
分享至

人工智能正在叩响华尔街交易室的大门,但目前的成绩单并不好看。

一系列公开交易竞赛的早期结果显示,主流大型语言模型(LLM)在自主交易中普遍表现欠佳——大多数系统亏损,交易过于频繁,且在接收相同指令时作出截然不同的决策。这些结果引发了一个核心问题:LLM与真实市场运作之间,究竟存在多深的鸿沟。

其中最具代表性的案例来自科技初创公司Nof1运营的Alpha Arena竞赛。该竞赛将Anthropic的Claude、谷歌的Gemini、OpenAI的ChatGPT以及Elon Musk的Grok等八大前沿AI系统投入四轮独立比赛,每轮赛前各获1万美元资金,在两周内自主交易美国科技股。最终,整体投资组合亏损约三分之一,32组结果中仅有6次实现盈利。

Nof1创始人Jay Azhang直言:"现在把钱直接交给LLM让它自己去交易,这条路还走不通。"

竞赛结果:亏损、过度交易与决策分歧

Alpha Arena的数据揭示了当前LLM在交易场景中的多重缺陷。在相同提示词下,阿里巴巴的Qwen在一轮竞赛中共执行了1,418笔交易,而表现最佳的Grok 4.20仅下单158笔。Grok的最佳成绩出现在其能够观察竞争对手表现的那一轮赛事中。

AI博客Flat Circle追踪了11个市场相关竞技场,结果显示,所有竞技场中至少有一个模型实现盈利,但仅有两个竞技场的中位模型为正收益,说明大多数模型难以跑赢市场。

各模型之间的决策差异同样引人关注。据Azhang介绍,在Alpha Arena最新一轮测试中,Claude倾向于做多,Gemini对做空毫无抵触,而Qwen则乐于使用高杠杆承担风险。"它们各有'个性',管理起来几乎像管理一位人类分析师,"运营LLM驱动基金的Intelligent Alpha负责人Doug Clinton表示,通过告知模型其存在某种偏差,可以在一定程度上改善结果。

能力边界:LLM擅长研究,但不擅长择时

Jay Azhang指出,LLM在研究和调用正确工具方面具备优势,但在交易执行层面存在系统性短板:它们尚不清楚分析师评级、内部人交易、情绪变化等众多影响股价的变量各自的权重,因而容易出现交易时机错误、仓位规模不当以及买卖过于频繁等问题。

Intelligent Alpha的基准测试提供了相对积极的参照。该测试为10个AI模型提供财务文件、分析师预测、财报电话会议记录、宏观经济数据及网络搜索权限,聚焦于盈利预测方向的判断。结果显示,2025年第四季度,OpenAI的ChatGPT正确预测盈利预测方向的准确率达68%,创下迄今最佳成绩。Clinton表示,随着每次新版本发布,模型表现总体呈改善趋势。

方法论困境:回测失效,实盘测试成唯一选项

评估AI交易能力面临一个根本性的方法论障碍。传统量化策略依赖历史回测验证有效性,但这一框架对LLM几乎完全失效——一个在2026年被问及如何交易2020年3月行情的模型,早已"知道"那段历史的走向。这种被称为"前瞻偏差"(lookahead bias)的污染问题,迫使研究者只能通过实盘市场对AI进行评估,由此催生了当前各类基准测试和竞技场的大量涌现。

Flat Circle博客作者、前另类数据提供商YipitData联合创始人Jim Moran认为,目前大多数公开实验周期过短、噪音过大,尚不足以支撑确定性结论。这些竞技场还存在天然劣势,包括无法获取专有股票研究资源以及执行质量较低。"如果把这些竞技场里的某个AI代理直接移植到一家顶级对冲基金内部运行,它的表现应该会更好,"他说。

行业前景:真正有效的策略,或将悄然消失于公众视野

前Coatue Management数据科学主管、现就职于NX1 Capital的Alexander Izydorczyk近期撰文指出,他所追踪的AI交易机器人中,目前尚无一个展现出持久的超额收益能力。他认为,这些竞技场的局限性在于其训练数据中缺失了秘密交易机构所使用的实用量化技术。

然而,Izydorczyk也留下了一个耐人寻味的判断:"初学者有时能看到老手看不到的东西。"他在个人博客中写道,"当LLM代理交易策略真正开始奏效时,你不会马上听到任何消息。"

Nof1正在筹备Alpha Arena第二季,计划赋予每个AI模型网络搜索、更长思考时间、更多数据来源以及多步骤执行能力。但该公司的核心商业模式,是为散户交易者提供构建AI交易代理的系统工具——而非直接将AI推上交易席位。这一定位本身,或许已是对当前AI交易能力最务实的注脚。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
完爆胡明轩+碾压徐杰!广东第一克星确认到位,杜锋争冠计划落空

完爆胡明轩+碾压徐杰!广东第一克星确认到位,杜锋争冠计划落空

绯雨儿
2026-05-06 12:42:48
打什么电话比12345更管用?这些电话比它管用100倍,建议收藏好

打什么电话比12345更管用?这些电话比它管用100倍,建议收藏好

细说职场
2026-04-28 10:39:02
太寒心!盐城龙凤胎事件,孩子早产,老公把彩礼8.8万骤降至3.8万

太寒心!盐城龙凤胎事件,孩子早产,老公把彩礼8.8万骤降至3.8万

魔都姐姐杂谈
2026-05-06 13:19:53
山东曹县男子出轨嫂子多年,全家默许唯独瞒着原配,原配透更多

山东曹县男子出轨嫂子多年,全家默许唯独瞒着原配,原配透更多

天天热点见闻
2026-05-06 13:06:23
5种废品价格暴涨,家里有这5样东西的,提醒身边人别乱扔了

5种废品价格暴涨,家里有这5样东西的,提醒身边人别乱扔了

小谈食刻美食
2026-05-06 07:39:22
巴萨震怒!18岁亚马尔输球后飞米兰,和前任彻夜狂欢被实锤!

巴萨震怒!18岁亚马尔输球后飞米兰,和前任彻夜狂欢被实锤!

罗氏八卦
2026-05-06 18:15:03
5天百万内地人涌向香港,并看到了香港的另一面

5天百万内地人涌向香港,并看到了香港的另一面

港你知
2026-05-06 21:44:51
一批年轻女性靠 “崩老头” 赚快钱,而80、90后成为被崩的“老头”!

一批年轻女性靠 “崩老头” 赚快钱,而80、90后成为被崩的“老头”!

品牌新
2026-05-06 16:28:30
沪苏浙皖共同出资,长三角基础研究联合基金将正式推出

沪苏浙皖共同出资,长三角基础研究联合基金将正式推出

上观新闻
2026-05-06 21:14:04
王毅部长最新照片令网友心酸,73岁的他为何仍奋战在外交一线?

王毅部长最新照片令网友心酸,73岁的他为何仍奋战在外交一线?

李昕言温度空间
2026-05-06 20:34:07
47岁高圆圆在公园被抓拍,麒麟臂、凉拖鞋,活脱脱一个买菜大姐

47岁高圆圆在公园被抓拍,麒麟臂、凉拖鞋,活脱脱一个买菜大姐

嘴角上翘的弧度
2026-05-06 19:51:52
“出海”与“入海”:海尔全球化布局背后的战略定力与长期主义

“出海”与“入海”:海尔全球化布局背后的战略定力与长期主义

智谷趋势
2026-04-30 18:58:41
曝国际足联要价不是20亿而是40亿!央视最多只给5.5亿 差距悬殊

曝国际足联要价不是20亿而是40亿!央视最多只给5.5亿 差距悬殊

念洲
2026-05-06 23:06:44
吐槽4只皮皮虾1035元贵的游客已获赔付,市监局称绝不姑息

吐槽4只皮皮虾1035元贵的游客已获赔付,市监局称绝不姑息

映射生活的身影
2026-05-06 19:29:52
王心凌演唱会突然大叫一声,被激光打到腿!观众不满:大面积扫射致手机等损坏

王心凌演唱会突然大叫一声,被激光打到腿!观众不满:大面积扫射致手机等损坏

上观新闻
2026-05-06 15:14:07
国际足联真急了 重量级高管访问中国 国内赞助商已砸5亿美元+逼宫

国际足联真急了 重量级高管访问中国 国内赞助商已砸5亿美元+逼宫

风过乡
2026-05-06 21:59:24
杭州同学聚会吃了32万,请客的人付完钱走后,剩下的人翻脸了

杭州同学聚会吃了32万,请客的人付完钱走后,剩下的人翻脸了

纸鸢奇谭
2025-12-19 14:19:59
苹果新品上架,5月8日,正式开售

苹果新品上架,5月8日,正式开售

科技堡垒
2026-05-06 12:16:23
王心凌演唱会意外!遭强力雷射「直射大腿」痛叫出声…主办被骂爆

王心凌演唱会意外!遭强力雷射「直射大腿」痛叫出声…主办被骂爆

ETtoday星光云
2026-05-06 13:02:26
港股交易量堪比乞丐,香港还能算国际金融中心吗?

港股交易量堪比乞丐,香港还能算国际金融中心吗?

凯利经济观察
2026-05-06 12:11:17
2026-05-07 03:19:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
145700文章数 2653478关注度
往期回顾 全部

科技要闻

“马斯克不懂AI”:OpenAI当庭戳老底

头条要闻

特朗普:伊朗可能将其高浓缩铀运往美国

头条要闻

特朗普:伊朗可能将其高浓缩铀运往美国

体育要闻

活塞1比0骑士:坎宁安不再是一个人了

娱乐要闻

谢娜演唱会暗藏惊喜 何炅瞒天过海现身

财经要闻

估值450亿美元 大基金被曝将投资DeepSeek

汽车要闻

领克10/领克10+ 无论能源形式 领克都要快乐

态度原创

健康
房产
数码
公开课
军事航空

干细胞治烧烫伤面临这些“瓶颈”

房产要闻

遥遥领先!这个澄迈顶流红盘,凭什么持续霸榜

数码要闻

全球内存告急!苹果被卡脖子:多款Mac设备惨遭下架

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

实施不到48小时 特朗普紧急喊停"霍尔木兹自由计划"

无障碍浏览 进入关怀版