![]()
2025 年 10 月,美股经历了一轮典型的震荡行情:月初科技股强势反弹,月中通胀数据扰动市场,10 月 10 日前后纳指单日波动超过 3%。
就在这波谲云诡的市场环境中,港大黄超教授团队的开源 AI-Trader 项目正式启动实盘测试。
该项目上线一周时间在 GitHub 上获得了近 8K 星标,展现了社区对 AI 自主交易技术和金融市场分析的能力高度关注。
- 开源项目地址: https://github.com/HKUDS/AI-Trader
- 实时交易监控: https://hkuds.github.io/AI-Trader/
六位大模型 AI 交易员,每人手握 1 万美元启动资金,被独自投入纳斯达克 100 的激烈战场。
规则严苛:不能求助、不能预知、不能重来。
它们只能凭借自己的「智慧」——看新闻、查价格、分析数据、执行交易,在真实的市场风暴中求生存、求盈利。在 10 月一整月的实盘交易后,它们交出了截然不同的答卷:
![]()
作为参照,同期 QQQ(纳斯达克 100 ETF)仅上涨 +2.30%。
![]()
这并非单纯的智力较量,而是一场深度的行为金融学实验。
实验核心在于测试 AI 系统的三项关键能力:
交易纪律:能否严格执行既定策略,不被短期波动左右
市场耐心:在高频噪声中保持冷静,等待真正的交易机会
信息过滤:从海量市场数据和新闻中筛选出真正有价值的信号
这种设计反映了现代量化交易的核心挑战:技术分析已经高度同质化,真正的竞争优势往往来自于行为控制和信息处理的差异化能力。
震荡中的六种 AI 的「生存策略」
10 月 10 日的市场震荡为这场 AI 交易实验提供了一个理想的压力测试场景。各 AI 系统的反应模式,清晰地展现了其底层算法架构和决策框架的本质差异。
DeepSeek-Chat-V3.1:在恐慌中看见机会,反向思维的量化体现
策略特征:逆向情绪交易在市场普遍减仓时,DeepSeek 于 10 月 11 日反向加仓 NVDA 和 MSFT。其决策逻辑基于基本面分析:「财报季临近,龙头公司基本面未变,短期波动提供更好入场点。」
分析要点:这种策略成功的关键在于其对市场情绪与基本面价值的区分能力。13.89% 的领先收益验证了 contrarian 策略在震荡市中的有效性。
MiniMax-M2:稳如磐石的「平衡术」,低频交易的风险控制优势
策略特征:组合平衡 + 低换手率 MiniMax 在震荡期间基本未调整仓位,月度总交易次数仅 28 次。其预先构建的均衡投资组合(科技 + 消费 + 半导体)有效分散了单一板块风险。
分析要点:该模型体现了噪音与信号分离的核心理念。10.72% 的稳定收益说明,在高波动环境下,策略一致性往往比灵活性更重要。
Claude-3.7-Sonnet:长期主义者的胜利
策略特征:长期持有 + 基本面导向 Claude 自 10 月 1 日起持续增持 NVDA、AAPL、MSFT,即使在 10 月 10 日的暴跌中也未减仓。其决策框架明确基于企业长期价值:「现金流强劲、AI 业务增长可见。」
分析要点:7.12% 的收益率虽不突出,但其低回撤、高一致性的表现体现了经典价值投资理念在 AI 交易中的可行性。
GPT-5:灵活但略显犹豫
策略特征:适应性调仓 GPT-5 试图通过 10 月 8 日减持 MSFT、10 月 12 日回补的操作实现「动态优化」,但两次调仓均未能精确把握市场时点。
分析要点:7.11% 的收益与 Claude 基本持平,但其策略执行中暴露的时机判断偏差问题,反映了高频调整策略在实际交易中面临的执行成本。
Qwen3-Max:等待「完美时机」的代价
策略特征:择时等待 Qwen3 前两周保持空仓状态,直到 10 月 18 日才开始建仓 NVDA 和 META,试图等待「完美入场时机」。
分析要点:3.44% 的收益率揭示了择时策略的根本性挑战:市场最佳机会窗口往往稍纵即逝,过度等待的机会成本可能超过风险收益。
Gemini-2.5-Flash:被噪声淹没的「高频战士」
Gemini 月度交易 73 次,仅 10 月 10 日就执行 5 次买卖操作。更关键的是,其 10 月 22 日的全仓清仓决策产生了显著的市场冲击成本。
分析要点:-0.54% 的负收益主要源于两个结构性问题:过度交易导致的摩擦成本累积和情绪化决策导致的时机错误,这正是传统高频交易策略在小资金规模下的典型失效模式。
真正的智能,是克制「做点什么」的冲动
这场实验揭示了一个反直觉的事实:在复杂系统中,行动力未必是优势,有时反而是负担。
Gemini 拥有最快的推理速度和最丰富的参数,却因「过度反应」而失败; Qwen 追求绝对安全,却因「过度等待」而错失良机; 而 DeepSeek 和 MiniMax 的成功,恰恰源于它们知道何时该动,何时该静。
这让人想起巴菲特那句老话:
「别人恐惧时我贪婪,别人贪婪时我恐惧。」
但 AI 没有「恐惧」或「贪婪」——它们有的,是对信息的过滤机制、对目标的锚定能力,以及对自身策略的忠诚度。
DeepSeek 不是预测了市场, 而是拒绝被市场牵着鼻子走。
开源平台:
不只是炒股,更是研究「智能行为」
AI-Trader 已在 GitHub 开源(MIT 协议),支持:
- 多模型并行回测(现支持 DeepSeek、Claude、GPT、Qwen、Gemini、MiniMax)
- 自定义市场环境(可模拟 2020 年熔断、2022 年加息等极端场景)
- 决策日志全透明回溯(查看 AI 每一步推理链)
- 未来将支持 A 股、港股、加密货币等多市场接入
你甚至可以:
- 给 Claude 加上「价值投资」人格提示,看它是否更保守;
- 让 Gemini 接入情绪过滤插件,测试能否减少噪声干扰;
- 或训练一个「宏观 AI」,结合美联储利率路径做资产配置。
但请记住:这仍是实验,不是投资工具。当前 AI 尚无法稳定战胜市场,且极端行情下可能放大风险。
结语:
AI 交易的镜像效应
通过观察六个 AI 系统在股市中的表现差异,我们不仅看到了算法架构的不同,更重要的是,它们映射出了人类投资者的典型行为模式:
- 过度交易冲动:如 Gemini 在市场波动时的频繁操作
- 择时焦虑:如 Qwen 过度等待「完美时机」的决策延迟
- 情绪化决策:在不确定性面前的纪律性缺失
实验的深层价值
AI-Trader 项目的意义并非在于创造超额收益,而在于提供了一个决策行为的分析框架。通过量化不同策略在相同市场环境下的表现,我们能够更客观地理解:
有效的投资决策往往来自于对不确定性的合理管理,而非对市场的完美预测。
中国 AI 的实践进展
值得注意的是,本次实验中表现领先的 DeepSeek 和 MiniMax 均为中国开发的大模型。这表明中国 AI 技术正在从对话交互能力向实际任务执行能力演进,在金融决策这类复杂场景中展现出了可观的应用潜力。
技术应用的前景展望
金融交易作为一个标准化、数据丰富的应用场景,为 AI 决策能力提供了理想的验证环境。随着模型能力的持续提升,类似的 AI 系统有望在供应链优化、医疗资源配置、城市管理等更多复杂决策场景中发挥作用。
当然,从实验室到实际应用,仍需要在监管合规、风险控制、系统稳定性等维度进行更深入的验证和优化。
团队介绍
![]()
范天宇,香港大学博士二年级学生,研究方向为检索增强生成 (RAG) 与大语言模型智能体。学术成果发表在 ICLR 会议,并主导开源项目 MiniRAG (约 1.5k GitHub 星标),在学术与产业界获得广泛应用与关注。
![]()
蒋扬钦,香港大学博士四年级学生,研究方向涵盖大模型智能体、图学习与推荐系统。其研究成果入选 KDD 2022 最有影响力论文榜单,并获 ACM MM 2024 Best Paper Honorable Mention Award。
![]()
杨雨豪,香港大学博士四年级学生,谷歌学术引用 1800+。主要研究方向为大模型智能体、图学习与推荐系统。其成果多次入选顶级会议最有影响力论文榜单 (KDD 2022/2023、WWW 2023、SIGIR 2022)。其开源多模态 GUI 智能体 Aria-UI 在学界与业界获得关注。
![]()
黄超,香港大学博士生导师,研究方向大语言模型、智能体与图机器学习,Google Scholar 引用 1.3 万+。其团队推出 LightRAG、RAG-Anything、DeepCode、AutoAgent、AI-Researcher、MiniRAG、VideoRAG 等开源项目,累计 6 万余 GitHub 星标、50 次登上 GitHub Trending。曾获 WAIC「璀璨明星」、2024 前沿科学奖,并入选 2025 AI100 青年先锋与 AI 2000 全球最具影响力学者。其多项成果在 KDD、WWW、SIGIR、AAAI 等顶会被评为最具影响力研究之一,并于 ACM MM、WWW、WSDM 等获得最佳论文提名。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.