网易首页 > 网易号 > 正文 申请入驻

GIM和港大这篇ACL主会,把量化因子挖掘重做了一遍

0
分享至

来源:市场资讯

(来源:机器之心Pro)


如果把量化投资里最难的一件事挑出来,很多人都会指向同一个词:Alpha。

说白了,就是那些能提前告诉你"这只股票后面大概率怎么走"的有效信号。

问题也恰恰出在这里。市场噪声太大,数据维度太高,真正有用的信号又少得可怜。人手搓因子,慢;遗传编程容易在局部打转,产出一堆长得差不多、经济意义也不强的东西;深度学习虽然猛,但很多时候你知道它有效,却说不清它为什么有效,换个市场、换个周期,就不一定稳了。

现在,一篇来自香港大学和 Grace Investment Machine(GIM)的工作想把这件事换个做法。

他们做了一个叫 CogAlpha 的框架,入选 ACL 2026 推荐 Oral。

一句话概括:不再让大模型只当"写公式的助手",而是把它当成会分工、会反思、会迭代、还会自己改代码的研究员团队,去自动挖掘 Alpha。

在来自中美港三个市场的 5 个数据集上,这套方法稳定跑赢了 21 个基线方法。主实验 CSI300、10 天预测任务上,年化超额收益达到 16.39%,信息比率1.8999。

这事有点意思了。


这篇论文到底做了什么?

CogAlpha 的第一个关键变化,是把 Alpha 从"公式"升级成了"代码"。

这不是小改动。用公式表达因子,表达能力受限。一旦换成 Python 代码,因子的搜索空间会一下被打开——大模型不再只是吐一个数学表达式,而是能写出带注释、带逻辑、能执行、能检查的候选因子程序。

然后,作者又在这个基础上,给大模型搭了一个"研究组织架构"。

整个系统里最抓眼球的部分,是一个7 层、21 个智能体的探索体系。这 7 层不是随便分的,而是按量化研究的思考方式,从宏观到微观一路拆下去:


你可以把它理解成:不是让一个大模型闷头想因子,而是让一整个分工明确的研究团队,同时从不同角度去挖。

它不是生成一次就完了,而是会"进化"

这篇论文最像人类研究流程的地方,不在生成,而在后面那套迭代机制。

CogAlpha 走了一条很像研究员反复打磨的路径:先生成一批候选 Alpha,再检查代码能不能跑、逻辑有没有问题,然后用 IC、RankIC、ICIR、RankICIR 和互信息 MI 五个指标做筛选,接着把好的候选拿去做变异、交叉和进化,最后不断迭代,把差的淘汰,把更有潜力的留下来。

筛选分两档:超过同代 65 分位的算合格因子,超过 80 分位的算精英,后者进入下一轮演化。

为了防止系统越来越保守、最后只会围着几个套路打转,作者还设计了多样化提示策略:轻度改写保证稳定,中度改写引入自然变体,创造性改写则鼓励模型从不同研究角度重新理解同一个方向。

这个设计很关键。Alpha 挖掘最怕的,不是找不到一个好因子,而是老在同一类因子里绕圈。

结果有多强?消融实验说得很清楚

论文最硬的一组结果,来自 CSI300 成分股、10 天预测任务。

在这里,CogAlpha 相比 21 个基线方法拿到了最好的整体表现。


换句话说,CogAlpha 在这项核心实验里,年化超额收益大约翻倍,IR 也明显拉开。

值得一提的是,论文里有个不符合直觉的发现:闭源模型并没有天然更强,推理型模型表现甚至偏弱。Alpha 挖掘不是单纯比"谁更聪明",而是比谁的结构更适合探索、筛选和演化。真正拉开差距的,是这套认知式工作流本身,而不是底层模型的能力上限。

可解释性,量化圈真正在意的

量化圈一个老问题是:很多因子能跑,但解释不清。

CogAlpha 生成的每个 Alpha 不只是一个数字结果,而是附带详细注释、完整代码实现,解释这个因子的逻辑和想法。论文展示的一个例子,是用"价格上行幅度除以成交量"衡量流动性冲击——如果股票价格冲得快但成交量并不大,意味着流动性很薄、价格冲击更大,短期收益也许更值得关注。

不复杂,但讲得通。

对机构来说,这点很重要。真正能进研究流程、进交易流程的,不只是高分因子,而是能被理解、能被复核、能被追责的因子。


这篇 ACL,真正有价值的地方是什么?

如果只把它理解成"又一篇用大模型做量化的论文",有点低估它了。

这篇工作更大的价值,可能在于它给出了一种新范式:让大模型不只是生成内容,而是参与研究流程本身;不只是给答案,而是组织探索、筛选、反思和进化。

放在量化里,这叫自动化 Alpha 发现。再往外看,更像一种 Agentic Research 的落地案例——把研究任务拆成层级化认知单元,给每个单元设定职责,再让系统通过反馈做持续演化。

如果这套方法能在 Alpha 挖掘里成立,那别的高噪声、低信号、需要创造性探索的研究任务,是不是也可以这么干?材料发现、策略生成、实验设计、复杂工业优化,这个问题值得继续看。

当然,作者自己也写得比较克制:回测全在 Qlib 框架里完成,和真实交易环境还有距离;LLM 输出有随机性,数据规模越大执行时间越长。CogAlpha 现在更像一个很强的研究引擎,而不是能无脑接到交易端的即插即用系统。

但这不妨碍它的重要性。很多真正改变行业的东西,第一步都不是立刻商用,而是先证明一件此前没人证明清楚的事:

原来这条路,真的走得通。

量化投资过去几十年,一直在和同一个问题缠斗:怎么在充满噪声的市场里,持续找到新信号。现在,大模型以另一种身份加入了这场游戏——不是聊天机器人,也不是写摘要的工具,而是一个会分工、会写代码、会自查、会进化的研究系统。

CogAlpha 让人第一次比较具体地看到:AI 也许真的可以参与"发现"本身,而不只是参与"表达"与"执行"。

About GIM

在 GIM(Grace Investment Machine)我们相信,AI技术正处在在重塑资本市场的关键节点。因此,我们致力于融合最前沿的AI与大模型技术,打造新一代智能投资范式——不仅是量化方法的升级,更是投资决策逻辑的重构。

我们希望通过智能分析师与交易系统,将金融市场洞察与执行效率提升至全新量级。 我们核心团队来自全球顶尖对冲基金、DeepMind、Meta、Anthropic 等前沿AI实验室,以及牛津、清华、北大、港大等知名高校。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
领导平江起义的滕代远,建国后为何被逐渐边缘化?

领导平江起义的滕代远,建国后为何被逐渐边缘化?

星河逍遥游
2026-04-30 20:01:55
30万人突然没活干!烟花厂全链停产,饭碗断了,出路在哪?

30万人突然没活干!烟花厂全链停产,饭碗断了,出路在哪?

三农雷哥
2026-05-08 07:59:35
山高水远 忠诚作答

山高水远 忠诚作答

人民网
2026-05-08 09:11:15
文斯·卡特将寄希望于2026年NBA选秀抽签,为篮网的重建注入动力

文斯·卡特将寄希望于2026年NBA选秀抽签,为篮网的重建注入动力

好火子
2026-05-08 23:58:25
受到多方青睐,名记:AJ-迪班萨NBA选秀状元概率已升至76%

受到多方青睐,名记:AJ-迪班萨NBA选秀状元概率已升至76%

懂球帝
2026-05-08 22:29:06
名记:科尔已和勇士管理层达成共识

名记:科尔已和勇士管理层达成共识

体坛周报
2026-05-08 08:39:12
火箭队传闻:凯文·杜兰特交易可能性极低

火箭队传闻:凯文·杜兰特交易可能性极低

好火子
2026-05-09 03:54:11
央视和FIFA的转播权之争,结局会如何?

央视和FIFA的转播权之争,结局会如何?

观察者网
2026-05-08 13:45:35
AI记账软件怼用户159元给父亲买寿衣,“寿衣是死人穿的,你爸穿的蓝白衫确实像”,官方回应:系AI话术漏洞所致,非人为恶意,已紧急修复

AI记账软件怼用户159元给父亲买寿衣,“寿衣是死人穿的,你爸穿的蓝白衫确实像”,官方回应:系AI话术漏洞所致,非人为恶意,已紧急修复

扬子晚报
2026-05-06 20:50:03
一觉醒来,中国油轮在波斯湾遇袭!这不是误炸,是有人想“破窗”

一觉醒来,中国油轮在波斯湾遇袭!这不是误炸,是有人想“破窗”

闫树军论评
2026-05-08 18:11:21
詹金斯:字母哥和我的关系很好 目前沟通非常顺畅

詹金斯:字母哥和我的关系很好 目前沟通非常顺畅

北青网-北京青年报
2026-05-09 07:30:18
0-2!骑士输球,哈登却看清一大事实,想要夺冠恐只剩下唯一选择

0-2!骑士输球,哈登却看清一大事实,想要夺冠恐只剩下唯一选择

鸣哥说体育
2026-05-08 16:36:59
国际原油期货结算价收涨 本周累跌超6%

国际原油期货结算价收涨 本周累跌超6%

每日经济新闻
2026-05-09 06:23:06
湖人全队抱怨裁判,雷霆队记用数据回怼,联盟力争助雷霆快速出售

湖人全队抱怨裁判,雷霆队记用数据回怼,联盟力争助雷霆快速出售

大漠风光
2026-05-09 07:31:32
无法逾越的“中国长城” 韩媒:韩乒12年来首次在团体赛中无缘奖牌

无法逾越的“中国长城” 韩媒:韩乒12年来首次在团体赛中无缘奖牌

衔春信
2026-05-09 03:23:49
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
台电弃用于右任题字改用新标识,王鸿薇:“蔡英文御用设计师”连中公家标案

台电弃用于右任题字改用新标识,王鸿薇:“蔡英文御用设计师”连中公家标案

海峡导报社
2026-05-09 07:56:06
今晚 利物浦复仇之战!赢球基本锁定前5进欧冠 标王复出

今晚 利物浦复仇之战!赢球基本锁定前5进欧冠 标王复出

叶青足球世界
2026-05-09 08:16:55
56岁汪峰又换新欢,凌晨别墅相会,森林北清空账号划界限

56岁汪峰又换新欢,凌晨别墅相会,森林北清空账号划界限

科学发掘
2026-05-07 10:32:29
巡抚好比省委书记,但不管从哪个方面比较,前者的权力都远超后者

巡抚好比省委书记,但不管从哪个方面比较,前者的权力都远超后者

鹤羽说个事
2026-05-06 22:59:42
2026-05-09 08:32:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3154958文章数 7253关注度
往期回顾 全部

科技要闻

Meta疯狂拥抱人工智能:员工苦不堪言

头条要闻

美公布首批UFO文件 视频公开:阿联酋现水母状物体

头条要闻

美公布首批UFO文件 视频公开:阿联酋现水母状物体

体育要闻

他把首胜让给队友,然后用一年时间还清账单

娱乐要闻

古天乐被曝隐婚生子,新娘竟是她

财经要闻

估值3000亿 DeepSeek寻求500亿元融资

汽车要闻

MG 4X实车亮相 将于5月11日开启盲订

态度原创

艺术
游戏
房产
亲子
军事航空

艺术要闻

清风拂面,心旷神怡

《GTA6》首发无PC遭玩家批评:主机是付费测试版

房产要闻

豪掷6.8亿拿地!何猷君大手笔投资三亚!

亲子要闻

小锐锐会走路后笑得很开心

军事要闻

伊朗:最高领袖穆杰塔巴全面掌控局势

无障碍浏览 进入关怀版