网易首页 > 网易号 > 正文 申请入驻

GIM和港大这篇ACL主会,把量化因子挖掘重做了一遍

0
分享至



如果把量化投资里最难的一件事挑出来,很多人都会指向同一个词:Alpha。

说白了,就是那些能提前告诉你"这只股票后面大概率怎么走"的有效信号。

问题也恰恰出在这里。市场噪声太大,数据维度太高,真正有用的信号又少得可怜。人手搓因子,慢;遗传编程容易在局部打转,产出一堆长得差不多、经济意义也不强的东西;深度学习虽然猛,但很多时候你知道它有效,却说不清它为什么有效,换个市场、换个周期,就不一定稳了。

现在,一篇来自香港大学和 Grace Investment Machine(GIM)的工作想把这件事换个做法。

他们做了一个叫 CogAlpha 的框架,入选 ACL 2026 推荐 Oral。

一句话概括:不再让大模型只当"写公式的助手",而是把它当成会分工、会反思、会迭代、还会自己改代码的研究员团队,去自动挖掘 Alpha。

在来自中美港三个市场的 5 个数据集上,这套方法稳定跑赢了 21 个基线方法。主实验 CSI300、10 天预测任务上,年化超额收益达到 16.39%,信息比率1.8999

这事有点意思了。



  • 论文标题:
  • Cognitive Alpha Mining via LLM-Driven Code-Based Evolution
  • 论文作者:
  • Fengyuan Liu, Yi Huang, Sichun Luo, Yuqi Wang, Yazheng Yang, Xinye Li, Zefa Hu, Junlan Feng, Qi Liu, Grace Investment Machine
  • 论文链接:
  • https://arxiv.org/abs/2511.18850

这篇论文到底做了什么?

CogAlpha 的第一个关键变化,是把 Alpha 从"公式"升级成了"代码"。

这不是小改动。用公式表达因子,表达能力受限。一旦换成 Python 代码,因子的搜索空间会一下被打开——大模型不再只是吐一个数学表达式,而是能写出带注释、带逻辑、能执行、能检查的候选因子程序。

然后,作者又在这个基础上,给大模型搭了一个"研究组织架构"。

整个系统里最抓眼球的部分,是一个7 层、21 个智能体的探索体系。这 7 层不是随便分的,而是按量化研究的思考方式,从宏观到微观一路拆下去:

  • 第 1 层看市场结构与周期,比如长期趋势和阶段切换;
  • 第 2 层盯极端风险和脆弱性,比如尾部风险和崩盘前兆;
  • 第 3 层研究价量关系,流动性、买卖失衡;
  • 第 4 层看趋势延续、短期反转、波动聚集;
  • 第 5 层处理多尺度复杂性,比如回撤结构和分形粗糙度;
  • 第 6 层做稳定性和状态门控,让信号按不同市场状态决定要不要激活;
  • 第 7 层负责几何特征和融合,K 线形态、多因子合成、非线性改写。



你可以把它理解成:不是让一个大模型闷头想因子,而是让一整个分工明确的研究团队,同时从不同角度去挖。

它不是生成一次就完了,而是会"进化"

这篇论文最像人类研究流程的地方,不在生成,而在后面那套迭代机制。

CogAlpha 走了一条很像研究员反复打磨的路径:先生成一批候选 Alpha,再检查代码能不能跑、逻辑有没有问题,然后用 IC、RankIC、ICIR、RankICIR 和互信息 MI 五个指标做筛选,接着把好的候选拿去做变异、交叉和进化,最后不断迭代,把差的淘汰,把更有潜力的留下来。

筛选分两档:超过同代 65 分位的算合格因子,超过 80 分位的算精英,后者进入下一轮演化。

为了防止系统越来越保守、最后只会围着几个套路打转,作者还设计了多样化提示策略:轻度改写保证稳定,中度改写引入自然变体,创造性改写则鼓励模型从不同研究角度重新理解同一个方向。

这个设计很关键。Alpha 挖掘最怕的,不是找不到一个好因子,而是老在同一类因子里绕圈。

结果有多强?消融实验说得很清楚

论文最硬的一组结果,来自 CSI300 成分股、10 天预测任务。

在这里,CogAlpha 相比 21 个基线方法拿到了最好的整体表现。



换句话说,CogAlpha 在这项核心实验里,年化超额收益大约翻倍,IR 也明显拉开。

值得一提的是,论文里有个不符合直觉的发现:闭源模型并没有天然更强,推理型模型表现甚至偏弱。Alpha 挖掘不是单纯比"谁更聪明",而是比谁的结构更适合探索、筛选和演化。真正拉开差距的,是这套认知式工作流本身,而不是底层模型的能力上限。

可解释性,量化圈真正在意的

量化圈一个老问题是:很多因子能跑,但解释不清。

CogAlpha 生成的每个 Alpha 不只是一个数字结果,而是附带详细注释、完整代码实现,解释这个因子的逻辑和想法。论文展示的一个例子,是用"价格上行幅度除以成交量"衡量流动性冲击——如果股票价格冲得快但成交量并不大,意味着流动性很薄、价格冲击更大,短期收益也许更值得关注。

不复杂,但讲得通。

对机构来说,这点很重要。真正能进研究流程、进交易流程的,不只是高分因子,而是能被理解、能被复核、能被追责的因子。



这篇 ACL,真正有价值的地方是什么?

如果只把它理解成"又一篇用大模型做量化的论文",有点低估它了。

这篇工作更大的价值,可能在于它给出了一种新范式:让大模型不只是生成内容,而是参与研究流程本身;不只是给答案,而是组织探索、筛选、反思和进化。

放在量化里,这叫自动化 Alpha 发现。再往外看,更像一种 Agentic Research 的落地案例——把研究任务拆成层级化认知单元,给每个单元设定职责,再让系统通过反馈做持续演化。

如果这套方法能在 Alpha 挖掘里成立,那别的高噪声、低信号、需要创造性探索的研究任务,是不是也可以这么干?材料发现、策略生成、实验设计、复杂工业优化,这个问题值得继续看。

当然,作者自己也写得比较克制:回测全在 Qlib 框架里完成,和真实交易环境还有距离;LLM 输出有随机性,数据规模越大执行时间越长。CogAlpha 现在更像一个很强的研究引擎,而不是能无脑接到交易端的即插即用系统。

但这不妨碍它的重要性。很多真正改变行业的东西,第一步都不是立刻商用,而是先证明一件此前没人证明清楚的事:

原来这条路,真的走得通。

量化投资过去几十年,一直在和同一个问题缠斗:怎么在充满噪声的市场里,持续找到新信号。现在,大模型以另一种身份加入了这场游戏——不是聊天机器人,也不是写摘要的工具,而是一个会分工、会写代码、会自查、会进化的研究系统。

CogAlpha 让人第一次比较具体地看到:AI 也许真的可以参与"发现"本身,而不只是参与"表达"与"执行"。

About GIM

在 GIM(Grace Investment Machine)我们相信,AI技术正处在在重塑资本市场的关键节点。因此,我们致力于融合最前沿的AI与大模型技术,打造新一代智能投资范式——不仅是量化方法的升级,更是投资决策逻辑的重构。

我们希望通过智能分析师与交易系统,将金融市场洞察与执行效率提升至全新量级。 我们核心团队来自全球顶尖对冲基金、DeepMind、Meta、Anthropic 等前沿AI实验室,以及牛津、清华、北大、港大等知名高校。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
承认了,但都是下面人干的,不干我事啊……

承认了,但都是下面人干的,不干我事啊……

家传编辑部
2026-06-28 17:13:52
有人60岁就脑梗,有人一辈子不会脑梗,医生直言:关键在于5件事

有人60岁就脑梗,有人一辈子不会脑梗,医生直言:关键在于5件事

健身狂人
2026-06-26 02:16:28
赛力斯,我又没忍住!63元先干为敬,剩下的交给工资和问界M8了!

赛力斯,我又没忍住!63元先干为敬,剩下的交给工资和问界M8了!

沙雕小琳琳
2026-06-22 11:34:08
“每周末是我的噩梦! ”男子控诉妻子要求令人崩溃,吵过多次无果!网友:换个小房子吧

“每周末是我的噩梦! ”男子控诉妻子要求令人崩溃,吵过多次无果!网友:换个小房子吧

新民晚报
2026-06-28 19:41:42
6.29早评|形势突变!重大警告!A股要爆!

6.29早评|形势突变!重大警告!A股要爆!

龙行天下虎
2026-06-29 01:17:22
五年少了近一半幼儿!北京幼儿园从一位难求到空教室遍地……

五年少了近一半幼儿!北京幼儿园从一位难求到空教室遍地……

一口娱乐
2026-06-29 00:07:32
记者:梅西是历史第一人!C罗很强、但他落后一个档次!

记者:梅西是历史第一人!C罗很强、但他落后一个档次!

历史第一人梅西
2026-06-27 23:28:40
完美适配文班亚马!马刺全力争抢湖人季后赛爆发的2700万侧翼

完美适配文班亚马!马刺全力争抢湖人季后赛爆发的2700万侧翼

夜白侃球
2026-06-28 23:00:39
新型出轨太会了:不发消息不打电话,只靠这两种方式联系,真藏得太深了

新型出轨太会了:不发消息不打电话,只靠这两种方式联系,真藏得太深了

心理观察局
2026-06-26 07:37:08
「TVB薛凱琪」做運動俯身騷本錢極吸睛 網民:玩波出神入化

「TVB薛凱琪」做運動俯身騷本錢極吸睛 網民:玩波出神入化

粤睇先生
2026-06-26 22:45:03
同一箱牛奶为何实体店卖60元,网上只卖35元呢?内行人说出了实话

同一箱牛奶为何实体店卖60元,网上只卖35元呢?内行人说出了实话

平说财经
2026-06-26 19:31:07
酒杯腿,真的是一种赞美吗?

酒杯腿,真的是一种赞美吗?

VOGUE中国
2026-06-17 12:50:45
测量319位中国女性外阴,他们发表全球首例研究

测量319位中国女性外阴,他们发表全球首例研究

医学界妇产科频道
2026-06-27 19:51:42
哈佛展出王羲之《道德经》真迹,全卷一字未损,专家:无价之宝

哈佛展出王羲之《道德经》真迹,全卷一字未损,专家:无价之宝

幸福娃书画苑
2025-05-10 10:53:03
紧急!2026税务大稽查全面开打!这3类行为一查一个准

紧急!2026税务大稽查全面开打!这3类行为一查一个准

细说职场
2026-06-28 17:34:38
丢球11+送点!曼城铁卫首次世界杯之旅虎头蛇尾 新赛季或丢主力

丢球11+送点!曼城铁卫首次世界杯之旅虎头蛇尾 新赛季或丢主力

雪狼侃体育
2026-06-28 21:38:26
对战日本!男篮首发五虎展望:廖三宁或替补,赵继伟联手杨瀚森

对战日本!男篮首发五虎展望:廖三宁或替补,赵继伟联手杨瀚森

童叔不飙车
2026-06-29 01:51:01
“抓特务” 现在变成了揪韩红,高管年薪 61万,摆拍作秀全被扒

“抓特务” 现在变成了揪韩红,高管年薪 61万,摆拍作秀全被扒

TVB的四小花
2026-06-28 15:15:21
冯小刚新片彻底扑街!袁立犀利发文不留情面:你的时代已经结束了

冯小刚新片彻底扑街!袁立犀利发文不留情面:你的时代已经结束了

白面书誏
2026-06-28 23:15:33
广东男篮换帅内幕,杜锋两方面引陈海涛不满,两大外教团队二选一

广东男篮换帅内幕,杜锋两方面引陈海涛不满,两大外教团队二选一

中国篮坛快讯
2026-06-28 14:40:15
2026-06-29 02:31:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13379文章数 142681关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

四川宜宾市高县发生5.5级地震 震中距宜宾28公里

头条要闻

四川宜宾市高县发生5.5级地震 震中距宜宾28公里

体育要闻

两周飞5万公里!因凡蒂诺遭环保人士猛批

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

省钱,我只服梁文锋

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

艺术
手机
数码
本地
公开课

艺术要闻

她不用笔,她用刀

手机要闻

iOS 27 Beta 2曝光百度视觉搜索组件,新机蓄势待发中

数码要闻

古尔曼:预计苹果今年发布搭载M5 Ultra芯片的Mac Studio

本地新闻

世界杯球迷节:比球赛更好玩的派对

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版