来源:固收彬法
2026
作者:孙彬彬/隋修平/付耕阳(联系人)
重要提示
本微信号推送的内容仅面向财通证券客户中符合《证券期货投资者适当性管理办法》规定的专业投资者。本微信号建设受限于难以设置访问权限,为避免不当使用所载内容可能带来的风险,若您并非专业投资者,请勿订阅、转载或使用本微信号的信息。
摘 要
择时框架能否应用于股指?前期我们发布了海内外债券、商品的择时框架,为更好覆盖大类资产及组合构建,我们搭建万得全A、中证红利全收益、恒生科技、科创50、万得微盘、国证2000指数六大权益指数的择时模型,分别覆盖A股整体市场、红利、科技、小微盘等市场方向。
需要注意的是,权益指数波动更大,相较于债券和商品其动量效应相对偏弱,往往趋势变化较快,模型“看错”的概率更高,即区间内部的回撤幅度更大,因此需要相对复杂度更高的模型,以及因子的进一步优化。
基本面因子频率较低,同时近年来权益市场的交易与基本面逐步脱钩,为更好捕捉拐点的出现,我们在因子方面大幅减少基本面因子,聚焦于主要由量价因子和技术指标构成的模型。
因子的具体调整,首先是进一步减少低频因子数量。第二是丰富高频因子。对于债券和商品,因子的扩充更多是简单增加高频技术指标数量,对于构建技术指标的参数没有进行细化。对于宽基指数等高波动资产,选择不同参数的技术指标可以使模型学习到更多信息。
模型结构上,对于类别平衡机制、隐藏层和隐藏单元维度以及相应的窗口长度、正则化系数、学习率也做了相应调整。
指数择时结果:自2023年6月至今的样本外区间,万得全A择时模型共形成23个正确区间,9个错误区间,区间胜率71.88%。中证红利全收益择时模型共形成22个正确区间,4个错误区间,区间胜率84.62%。恒生科技择时模型共形成23个正确区间,6个错误区间,区间胜率79.31%。科创50择时模型共形成19个正确区间,4个错误区间,区间胜率82.61%。万得微盘指数择时模型共形成21个正确区间,5个错误区间,区间胜率80.77%。国证2000指数择时模型共形成20个正确区间,8个错误区间,区间胜率71.43%。
总体来看,30年国债的区间胜率(87.50%)比宽基指数更高一些,主要原因是债券有明显的动量效应,波动小于权益,区间稳定性和持续性更强。而权益指数虽然区间胜率相对不占优,但敏感性更高,单日信号的反转对于拐点的出现更具有指导意义。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
报告核心图表(点击可查看大图,完整图表详见正文)
风险提示:模型失效风险;因子失效风险;数据质量风险。
报告目录
![]()
01
宽基指数择时怎么做?
1.1
择时框架能否应用于股指?
前期我们发布了海内外债券、商品的择时框架,为更好覆盖大类资产及组合构建,我们搭建万得全A、中证红利全收益、恒生科技、科创50、万得微盘、国证2000指数六大权益指数的择时模型,分别覆盖A股整体市场、红利、科技、小微盘等市场方向。
需要注意的是,权益指数波动更大,相较于债券和商品其动量效应相对偏弱,往往趋势变化较快,模型“看错”的概率更高,即区间内部的回撤幅度更大,因此需要相对复杂度更高的模型,以及因子的进一步优化。此外,指数的编制会天然压缩部分个股的噪声,因此可以构建类似的模型来捕捉指数的波段和趋势。
基本面因子频率较低,同时近年来权益市场的交易与基本面逐步脱钩,为更好捕捉拐点的出现,我们在因子方面大幅减少基本面因子,聚焦于主要由量价因子和技术指标构成的模型。
1.2
相比债券,估值模型的因子有何差别?
对于宽基指数择时,我们对于原始因子集的构建按照以下逻辑进行:首先构建所有指数通用的共性因子集,主要包括资金、利率、商品期货及现货价格、高频日度指数(如BDI等)、高频基本面(日度的消费及生产数据)、海外因子(美国股债价格、波动率等)以及描述国内权益市场的共性因子(如两融余额、股票回购金额),衡量当前资本市场的整体方向。然后构建每个指数有所区分的指数因子集,主要包含对应宽基指数自身的成交量、成交金额、市盈率、市净率、换手率、资金净买入;指数因子集的第二部分则由每个指数的技术指标构成,如随机指标、标准差、相对强弱指标、能量潮等等,通过这些因子衡量每个指数自身的高频量价和交易情绪,从而在资本市场整体基础上,进行每个宽基指数的择时。
因子的具体调整,首先是进一步减少低频因子数量。前期我们在构建2年国债及美债等高波动资产择时模型时,减少了低频因子的数量,主要源于高波资产的波段较短,价格的转向更多受资金、情绪等高频交易层面因素影响,低频因子如月频、季频因子对择时的指导意义不强,并且这些因子往往是滞后指标,如果数量过多对于当前资产价格的走势择时甚至可能产生负面影响。对于含权资产来说这种影响更为明显,因此我们选择性保留10-20个月频因子(主要由通胀、出口、金融数据等构成),剔除了其余的月频及更低频率的因子。
第二是丰富高频因子。对于债券和商品,因子的扩充更多是简单增加高频技术指标数量,对于构建技术指标的参数没有进行细化。对于宽基指数等高波动资产,选择不同参数的技术指标可以使模型学习到更多信息:不同区间长度的交易量和交易价格的走势,对于均线类或者动量类的技术指标,不同的参数设置也可以使模型学习到不同的市场环境下的历史走势。虽然部分技术指标可能存在一定的共线性,但是神经网络对共线性相对不敏感,此外我们所有对于因子的调整都是基于原始因子集,后续我们仍有通过SHAP值筛选因子的技术手段。未来可能的一个丰富因子集的手段是通过个股更加丰富的数据,加权聚合得到行业数据。
1.3
模型结构有哪些调整?
首先是类别平衡机制。不同的指数走势差异较大,部分指数存在单边形态,如万得微盘指数单边上行形态较为明显;中证红利全收益虽然整体呈上行状态,但上行过程中的下行形态相对明显;恒生科技不存在明显单边;万得全A、科创50、国证2000则是在历史区间不存在明显单边,但自2025年4月以来走出了单边上行的形态,因此是否应用类别平衡需要根据不同指数的走势特性而确定。
然后是层数和隐藏单元维度的调整。对于高波资产需要复杂度更高的模型,但待估参数数量也会随之提升,以万得全A指数为例,假如将模型层数由2层提高至3层,会出现较为明显的过拟合现象,如果将隐藏单元维度提升,则可以在不出现过拟合的情况下,增加模型的复杂度,从而获得更精确的结果。
最后是几个重要超参数的调整:窗口长度、正则化系数、学习率。对于输出的窗口长度并非越短越好,过短的窗口输出信号波动较大,难以形成持续区间。高波资产模型层数和维度的调整需要正则化系数的相应配合,并且可能是数量级的提升,但正则化系数过强也会导致过多参数被压缩为0,模型的损失同样难以下降。最后是学习率,学习率过大可能导致不收敛和梯度爆炸,学习率过小则可能会陷入局部最优,可以通过lambda函数设置学习率递减来进行调优。
02
不同指数历史结果和最新表现如何?
2.1
万得全A指数
自2023年6月至今的样本外区间,万得全A择时模型共形成23个正确区间,9个错误区间,区间胜率71.88%。
![]()
截止2026年2月27日,万得全A模型单日输出概率为95.40%,MA5为81.93%,模型观点为看多,信号持续33个交易日。
![]()
2.2
中证红利全收益指数
中证红利指数波动率较高,走势相对高频震荡,难以形成明显趋势,通过增加隐藏单元数和丰富因子数量等技术手段也难以在回测中获得相对较好结果,因此我们选择中证红利全收益指数作为择时标的。
自2023年6月至今的样本外区间,中证红利全收益择时模型共形成22个正确区间,4个错误区间,区间胜率84.62%。
![]()
截止2026年2月27日,中证红利全收益择时模型单日输出概率为86.84%,MA5为89.84%,模型观点为看多,信号持续5个交易日。
![]()
2.3
恒生科技指数
作为港股“互联网龙头”,恒生科技市场关注度较高,也是权益投资的主线之一,因子方面更多考虑港股量价及全球流动性;但港股与内地存在交易日不对齐的问题,在一些节假日可能对模型产生一定影响。
自2023年6月至今的样本外区间,恒生科技择时模型共形成23个正确区间,6个错误区间,区间胜率79.31%。
![]()
截止2026年2月27日,恒生科技择时模型单日输出概率为5.66%,MA5为7.58%,模型观点为调整,信号持续14个交易日。
![]()
2.4
科创50指数
相较于恒生科技,科创50主要覆盖内地股票的“创新资产”,也是2025年以来投资主线之一,因子方面偏重于内地股票的量价数据。
自2023年6月至今的样本外区间,科创50择时模型共形成19个正确区间,4个错误区间,区间胜率82.61%。
![]()
截止2026年2月27日,科创50择时模型单日输出概率为3.92%,MA5为4.94%,模型观点为调整,信号持续4个交易日。
![]()
2.5
万得微盘指数
万得微盘指数主要衡量小微盘市场情况,但其走势偏单边,指数增幅相对较快,因此其出现翻转拐点时可能更具有指导意义。
自2023年6月至今的样本外区间,万得微盘指数择时模型共形成21个正确区间,5个错误区间,区间胜率80.77%。
![]()
截止2026年2月27日,万得微盘指数择时模型单日输出概率为92.50%,MA5为91.69%,模型观点为看多,信号持续59个交易日。
![]()
2.6
国证2000指数
中证2000指数上市时间较短,数据量相对较少,部分数据可以训练的窗口较少,国证2000与中证2000相关系数较高,但深市股票占比较高,因此与万得微盘指数结合,更好覆盖小微盘市场情况。
自2023年6月至今的样本外区间,国证2000指数择时模型共形成20个正确区间,8个错误区间,区间胜率71.43%。
![]()
截止2026年2月27日,国证2000指数择时模型单日输出概率为89.72%,MA5为92.14%,模型观点为看多,信号持续40个交易日。
![]()
2.7
小结
万得全A、国证2000的区间胜率相对较低,分别为71.88%和71.43%。错误区间主要源自去年9月底至12月中,这两个指数的走势,由于使用输出概率的MA5作为择时信号,所以一旦MA5进入震荡区间就意味着前序区间的结束,因此在震荡或者波段较小的行情中,会形成许多相对较短的区间,同时区间整体处于震荡,因此错误概率也会随之升高。
万得微盘、恒生科技的区间胜率相对较高,分别为80.77%、79.31%。万得微盘的趋势比较明显,但因其单边形态,类别平衡会迫使其关注少数类别,因此同样有一些较短区间信号左侧出现了翻转,但在信号下一次翻转之前当前行情迅速结束,从而形成了错误区间。恒生科技的错误区间主要出现于2023年上半年,当时的恒生科技走势偏向高频震荡,因此错误区间出现的频率升高。
中证红利全收益、科创50的表现最好,区间胜率分别为84.62%、82.61%。中证红利全收益趋势较为明确,波段持续时间相对较长,因此区间胜率较高,科创50的波幅相对较大,因此对波段可以进行更好地识别。
总体来看,30年国债的区间胜率(87.50%)比宽基指数更高一些,主要原因是债券有明显的动量效应,波动小于权益,区间稳定性和持续性更强。而权益指数虽然区间胜率相对不占优,但敏感性更高,单日信号的反转对于拐点的出现更具有指导意义。
风险提示
1、模型失效风险。模型输出的信号是基于特定的模型和历史数据计算得出的,然而市场环境是复杂多变的,包括宏观经济形势、政策调整、市场参与者行为等因素都可能发生变化。随着市场环境的改变,模型所依据的历史数据和统计规律可能不再适用,导致模型失效,从而使得模型输出的信号无法准确反映市场多空动能的真实情况,进而影响投资者基于此信号做出的投资决策。
2、因子失效风险。因子在历史数据中可能表现出与市场走势相关的特性,但未来这些因子的作用方向和作用强度可能发生变化。
3、数据质量风险。模型的计算依赖于准确、完整的数据。如果数据来源存在误差、 缺失或异常值等问题,可能会影响模型的计算结果。例如,市场的交易数据、宏观经济数据等可能存在统计口径不一致、数据更新不及时等问题,这些都可能导致模型的计算出现偏差,从而误导投资者的决策。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.