![]()
在量化投资的世界里,传统的因子(比如市盈率 PE、换手率)就像是“老三样”,虽然稳健,但在这个 AI 狂飙的时代,超额收益(Alpha)正在向更聪明的地方转移。无论是深耕 A 股的高股息策略,还是在港股和美股寻找业绩拐点,信息的获取速度和深度都成了决胜关键。
今天我们要科普的,是目前量化私募和极客们最追捧的“顶流”:**LLM 新闻情绪因子 (LLM-based Sentiment Factor)**。
一、 什么是“情绪因子”?
简单来说,就是让 AI 变成一个“超级股民”,在几秒钟内读完当天全网上万条财经新闻、财报披露和社交媒体讨论,然后告诉我们:“大家现在对某只股票是看好,还是想骂人?”
传统做法:靠关键词匹配。看到“增长”加 1 分,看到“亏损”减 1 分。但如果新闻说“亏损收窄”,或者“资本开支增加导致短期净利下降但长期利好”,传统方法可能就傻眼了。
2026 年新玩法:利用大语言模型(如 GPT-4o 或 DeepSeek)理解上下文。它能读懂复杂的商业逻辑,能识别“利空出尽”,从而给出一个精准的情绪得分。
处理非结构化数据:股市中 80% 的信息存在于文字、公告和研报中,LLM 是目前处理这些数据的“最强兵器”。
反应极速:消息刚出,AI 因子就能瞬间变动,走在大部分散户甚至分析师前面。
避雷神器:很多业绩爆雷前,社交媒体和新闻评论区往往先有苗头,情绪因子能提前感知风险,保护你的本金安全边际。
想写一个简单的情绪因子生成器吗?其实只需要几行 Python 代码。我们假设你已经抓取到了最新的市场新闻数据,并针对你关注的标的进行测试:
四、 因子有效吗?看看回测结果import openai # 假设使用大模型API
import pandas as pd
# 1. 模拟一段财经新闻数据(包含A股、港股、美股标的)
news_data = [
{"stock": "中国海油", "content": "国际油价高位震荡,公司现金流充裕,承诺维持高股息率,分红远超市场预期。"},
{"stock": "拼多多", "content": "最新财报显示海外业务Temu投入持续加大,导致本季度利润承压,但管理层强调这是长期的战略性亏损。"},
{"stock": "陕西煤业", "content": "受暖冬预期影响,动力煤现货价格小幅回落,但长协煤占比高,业绩依然展现出极强的韧性。"}
]
def get_sentiment_score(text):
"""
调用 AI 模型给新闻打分:1代表极度看好,-1代表极度看淡,0代表中性
"""
response = openai.ChatCompletion.create(
model="gpt-4",
messages=[{"role": "user", "content": f"请以基本面投资者的视角分析这段新闻对股价的短期和中期影响,只返回一个数字(-1到1之间):{text}"}]
)
return float(response.choices[0].message.content)
# 2. 批量生成因子
df = pd.DataFrame(news_data)
df['sentiment_score'] = df['content'].apply(get_sentiment_score)
print(df)
在量化回测中,我们会根据 AI 给出的“情绪得分”,将全市场的股票平均分成五组(Q1 到 Q5)。
Q1 组(多头):AI 判定情绪最高涨、新闻最积极的 20% 股票(通常伴随着强烈的业绩拐点或价值重估预期)。
Q5 组(空头):AI 判定负面新闻缠身、情绪最悲观的 20% 股票。
我们来看一组基于 A 股和港股核心资产池的模拟回测核心数据:
分组指标
年化收益率
最大回撤
夏普比率 (Sharpe)
胜率 (月度)
Q1 (高情绪多头)28.5%
-12.4%
1.85
68%
Q2 (偏乐观)
15.2%
-16.5%
1.10
55%
Q3 (情绪中性)
8.4%
-20.1%
0.65
50%
Q4 (偏悲观)
-2.1%
-25.8%
42%
Q5 (低情绪空头)-14.3%-35.2%
31%
多空对冲 (Q1-Q5)42.8%-8.5%2.6575%
数据洞察(图表背后的魔力): 完美的单调性: 情绪得分越高,收益越好;得分越低,跌得越惨。这说明 AI 的“读心术”在股市里确实起到了严格的筛选作用。 空头的“避雷针”: 看看 Q5 组那可怕的 -35.2% 最大回撤!这意味着,即使你不打算买入 Q1 的好股票,只要用这个因子剔除掉 Q5 的烂股票,你的账户就能避开大部分的“雷”。 多空对冲的惊人表现: 如果你买入 Q1 同时做空 Q5,年化收益率能达到惊人的 42.8%,而且最大回撤控制在 10% 以内,曲线呈现完美的左下到右上 45 度角!
![]()
五、 避坑指南:小白上手注意点
虽然这个因子很火,但在实际将策略转化为代码投入模拟盘或实盘时,一定要注意以下几点:
数据滞后性:确保你获取新闻的速度够快。如果新闻已经出了一天你才跑模型分析,那叫“复读机”不叫“量化”,Alpha 早就被抹平了。
成本问题:调用大模型 API 是要花钱的。如果股票池太大(比如全市场 5000 只股票),每天的光 API 费可能就是一笔不小的开销。建议先从沪深300或你精选的价值股池开始测算。
噪音干扰与幻觉:很多新闻是标题党,AI 有时也会被带节奏。需要结合传统的财务因子(如 PB、ROE、自由现金流)进行交叉验证,确保安全边际。
量化投资不再仅仅是冰冷的量价公式和财务报表,而是开始真正理解商业逻辑与市场“人心”。情绪因子只是 AI 改变金融的一个缩影,掌握它,也许就是你在未来市场中找到超额收益的下一把钥匙。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.