(来源:信达证券研究)
内容摘要
本文是信达金工风险因子与风险控制系列报告第二篇。在上篇报告《风险因子与风险控制系列之一:股票风险模型与基于持仓的业绩归因》中,我们探讨了风险模型的“前半程”——风险因子的选取、数据处理管道的设计、模型的构建与理解及业绩归因实践,得到了风险模型五个关键输出其三——因子暴露矩阵、因子收益率与特质收益率。本文作为系列第二篇,重点讲解风险模型的“后半段”工程,解析余下两大输出因子协方差矩阵和特异性波动率,并借由事前/事后案例展示这两个输出结果的实践应用价值。
计算因子协方差矩阵与特异性波动率。(1)刻画共同风险:因子协方差矩阵作为刻画资产共同风险的核心工具,在现代风险管理与投资决策体系中占据举足轻重的关键地位;其通过精准捕捉因子间的动态协变关系,帮助投资者构建理解市场风险传导机制的系统性框架,其成果价值更甚于特异性波动率。涉及到的步骤包括:EM算法、半衰加权、Newey-West调整、特征因子调整、波动率机制调整等,详见本文正文部分。(2)刻画特质风险:特异性波动率的精准预测也是高质量风险模型的必要一环(尽管重要性或不及因子协方差矩阵),重在处理缺失值补充、数据分布改善等问题,避免在单股票维度放大噪声。涉及到的步骤包括:半衰加权、Newey-West调整、结构化模型、贝叶斯收缩、波动率机制调整等,详见本文正文部分。
经偏差统计量、Q统计量评价发现,经典风险计算框架对随机组合、宽基指数及行业组合的风险预测偏差有限,对风格特征组合的优化更显著;模型对真实市场风险的捕捉精度较为合理,为事后风险拆分、事前组合优化提供了可靠输入。
案例1:再看券商金股组合的投资价值。本文再度讨论了券商金股组合,以此为例实现了对跟踪误差的归因(参考风险平价相关设定)。同时,我们以金股为例展示了如何使用哑变量另类数据构造有严格风格与行业偏离度约束的“泛指增”策略,应用最小跟踪误差方法收紧了策略与基准间差异,得到了近乎持续向上(尽管后期正斜率幅度有所下降)的超额曲线。
案例2:构建基于沪深300指数的最小方差组合。在协方差阵加持下,更多学术上的经典最优组合得以被实现。本文构建了基于沪深300指数的最小方差组合,发现其长期呈现低beta、低流动性、中小市值等风格特征,行业配置上超配医药、银行、电力及公用事业,低配非银金融、食品饮料等权重行业。在此基础上控制beta下限后,组合除beta外的其他风格暴露基本保持了原有状态,但对电力及公用事业、银行等行业的超配幅度显著降低,全区间风险调整前后收益均表现更优,为构造低波动属性权益投资工具提供了新思路。
案例3:应用协方差阵构建指增策略:相对暴露硬约束or风险预算控制?本文构造了复合量化-基本面因子,并以800指增为例给出了指增策略设计的新方案。在风格与行业偏离度约束收紧的大趋势下,严格的事前控制固然有助于打造更平滑的超额曲线,但如果不进行有效择时,也可能削弱alpha因子自带的风格轮动能力。指增语境下,本文比较了直接控制风格/行业与间接控制跟踪误差两类策略结果,发现:借助股票协方差阵构造的目标跟踪误差股票组合在特定换手率水平下,既保留了原策略的固有风格属性,又能起到平滑超额收益曲线的作用,在对复合因子风格属性较为自信的情形下,目标跟踪误差法不失为一种折中方案。
风险因素:结论基于历史数据,在市场环境转变时模型存在失效的风险。
01
计算因子协方差矩阵与特异性波动率
在上篇报告《风险因子与风险控制系列之一:股票风险模型与基于持仓的业绩归因》中,我们探讨了风险模型的“前半程”——风险因子的选取、数据处理管道的设计、模型的构建与理解及业绩归因实践,得到了风险模型五个关键输出其三——因子暴露矩阵、因子收益率与特质收益率。本文作为系列第二篇,重点讲解风险模型的“后半段”工程,解析余下两大输出因子协方差矩阵和特异性波动率,并借由事前/事后案例展示这两个输出结果的实践应用价值。
作为开始,我们将优先明确两个重要问题:(1)为什么要算协方差?(2)为什么要算因子协方差而非个股协方差?首先,为什么要算协方差?作为刻画资产间风险传导机制的核心工具,协方差矩阵的价值贯穿投资决策全流程:既用于事前设定组合风险预算(比如构建均值-方差、最小方差等经典模型,以及约束组合跟踪误差等),也可借此事后计算组合波动贡献来源,进而追溯行业轮动、风格漂移等因素对组合波动的贡献比例。
那么,为什么要算因子协方差而非个股协方差?(1)降低高维矩阵的复杂度。一个显而易见的好处是,因子协方差需要估计的参数少,较大程度上降低了协方差矩阵估计的复杂度。比如,对于N个股票的情形,个股协方差矩阵需要估计对角线上的N个方差/波动率和非对角线上的C_N^2个相关系数,对应5000个股票就要估计超过1250万个数值。但如果假设因子收益率与特异性收益率不相关,且特异性收益率之间互不相关,使用因子协方差矩阵作为过渡,有
1.1 刻画共同风险:因子协方差矩阵
因子协方差矩阵作为刻画资产共同风险的核心工具,在现代风险管理与投资决策体系中占据举足轻重的关键地位;其通过精准捕捉因子间的动态协变关系,帮助投资者构建理解市场风险传导机制的系统性框架。作为风险模型的核心输出成果,因子协方差矩阵能够刻画资产间协变关系,其成果价值更甚于特异性波动率。
1.1.1 EM算法
在上篇报告《风险因子与风险控制系列之一:股票风险模型与基于持仓的业绩归因》中,我们介绍了因子收益率的计算方法。然而,因子收益率常存在缺失值问题,需要在计算协方差矩阵前使用专门方法处理。比如:(1)“索引不对齐”。在全球模型中,不同国家的节假日安排存在差异,无法完全对齐交易日,导致因子收益率序列出现不连续的缺失情况。(2)“长度不同步”。在单一市场模型中,因时间序列长度不同步也会产生缺失值。该现象在行业因子体系中尤为突出,例如:互联网、新能源、AI等新兴行业的历史行情难以追溯太久;我们在前文构建风险模型时所采用的一级行业“综合金融”也存在类似的问题(最早成份只能追溯到2019年底)。同时,考虑到产业迭代是一个持续的过程,也不排除后续A股行业结构会出现更多颠覆式创新带来的早期数据真空。因此,找到一个系统化的方法解决缺失值问题是十分必要的。
EM算法(Dempster,1977)通过交替迭代E步和M步填充缺失值,其核心思路是:(1)E步(Expectation Step):假设(行业纯)因子收益率f服从多元正态分布,用现有参数估计条件期望并填补缺失值,其中缺失值部分的条件期望可以通过如下公式计算(角标mis、obs分别表示缺失值、非缺失值,μ、Σ分别表示均值、协方差,省略时间下标)。
1.1.2 半衰加权和Newey-West调整
1.1.3 特征因子调整
经特征因子调整后,我们重新统计并绘制了“4个组合”经典案例中的偏差统计量组图(a=1.4)。与特征因子调整前相比,调整后的低风险特征因子组合、最优组合风险的系统性低估问题得到了明显优化;调整后各组合的偏差统计量基本都在1附近,偏差统计量与特征组合的真实风险排序也已经不存在明显的线性关系。此外,组图[1]中似乎存在一个轻微的正斜率,背后的含义是低风险个股风险被更大幅地调低;这种现象是因为低风险个股在低风险特征因子上的暴露更大。
考虑到相较于模拟波动率偏差v(n)的调整,a的取值对最终结果的优化增益较弱,本文最终在计算因子协方差矩阵时选择了更稳健、更温和的处理方式,即放弃定标调整,直接令常数a=1。
1.1.4 波动率机制调整
前序步骤(半衰加权、Newey-West调整、特征因子调整)中,单一因子的波动率估计只考虑了该因子收益率自身的时间序列,并未引入任何截面信息。如果截面上模型在某段时间持续高估或低估风险,可以应用波动率机制调整(Volatility Regime Adjustment,VRA)方法集中调整所有因子的波动率从而消除这种偏差。
1.2 刻画特质风险:特异性波动率
特异性波动率的精准预测也是高质量风险模型的必要一环(尽管重要性或不及因子协方差矩阵),重在处理缺失值补充、数据分布改善等问题,避免在单股票维度放大噪声。
1.2.1 半衰加权和Newey-West调整
1.2.2 结构化模型
结构化模型的核心目的与EM算法一致,均用于修正缺失值和异常值的影响,但执行的位置、对象、方法均有不同。EM算法从因子收益率的联合分布出发填充缺失值,在流程初始阶段就消除了后续可能出现的空值问题;而在处理特异性波动率时,情况有所不同——由于股票收益率缺失或数据分布异常的情况时有发生,相较于因子收益率的空值,特异性收益率的空值是更可接受的。因此,MSCI Barra采用结构化模型来填充波动率(而非收益率)的空值,同时处理异常值。与EM算法在因子协方差矩阵估计中的应用位置不同,结构化模型的处理时机更靠后,需依赖半衰加权和Newey-West调整的前期计算结果。
1.2.3 贝叶斯收缩
经贝叶斯调整后,“低波个股风险被低估,高波个股风险被高估”的现象有所扭转,各分组特异性偏差统计量的均值更接近目标值1,模型成功借由截面规律迎合了特异性波动率在时序上的均值回复特性。
1.2.4 波动率机制调整
1.3 协方差矩阵预测效果评价
本节的余下部分展示了上述各步骤的优化效果。展示因子协方差矩阵各步骤效果时,我们使用经上述所有调整处理后的特质风险std_vra与各协方差阵组合计算偏差统计量和Q统计量;相应地,展示特异性波动率的预测效果时,我们使用经上述所有调整处理后的因子协方差矩阵cov_vra与各特异性波动率组合计算偏差统计量和Q统计量。
具体地,各变量符号及其含义对照如下:
本节首先分析了流通市值加权的各随机/指数/行业组合的偏差统计量和Q统计量(样本区间2013/1/1-2024/12/31,按月度均值展示)。(1)随机组合(random)。构造20个随机股票组合(随机种子为1~20),每组包含100只股票,采用流通市值加权法构建。样本池股票最初从万得全A基础域中随机选取,每月末核查样本存续状态,对退市或调出标的也按随机原则补充,动态维护样本池的稳定性。(2)指数组合。涵盖上证50、沪深300、中证500等宽基指数,以及300成长、300价值等风格指数。(3)行业组合。展示30个中信一级行业的相对应结果,其中综合金融行业起始日不与其他行业对齐。以上组合的调仓时点均设置为每月最后一个交易日日终,按收盘价成交。
进一步地,我们对各风格特征组合(单位暴露于某个风险因子的最小方差组合)开展类似的测试。对每个风格因子,生成20个随机特征组合(并非仅做多组合);其中每个特征组合包含100只股票(成份选取过程与随机组合一致)。
统计表明:无论是因子协方差主导的共同风险,还是特异性波动率刻画的特质风险,各优化步骤均显著收敛偏差统计量,且改善幅度较为明显,这充分体现了各调整步骤在精细化处理上的有用性。
02
应用共同风险、特质风险解决投研交实际问题
2.1 再看券商金股组合的投资价值
在上篇报告《风险因子与风险控制系列之一:股票风险模型与基于持仓的业绩归因》中,我们就券商金股组合讨论了两个核心问题:新进金股的表现为何几乎总是优于全部金股?金股组合为何近几年有所式微?我们通过因子暴露分析和收益归因解释了这两个问题,提示了新进金股组合持续较强的alpha属性(以高换手率为代价)与金股等权指数在市值风格上的偏配影响。本文中,我们继续讨论了共同风险、特质风险在这一案例中的应用,首先借助因子协方差与特异性波动率线性拆分组合波动率——例如将跟踪误差分解为风格、行业及特质贡献(具体方法详见附录3)。
以全部金股组合为例,在统计区间2018/1/3-2024/12/31中,该组合年化跟踪误差11.54%,其中风格贡献9.36%、行业贡献1.53%、特质贡献0.65%(满足9.36%+1.53%+0.65%=11.54%)。进一步来看,风格贡献的9.36%中包含市值因子size贡献4.34%、非线性市值因子sizenl贡献1.58%,二者合计占比超过一半。这与此前判断一致——金股指数的加权方式对其风格贡献影响较大,金股组合不宜直接使用等权方式评价和投资。
从事前优化的角度,本文继续尝试:(1)通过选择性控制风格提升金股组合表现:最小化目标组合与等权组合的跟踪误差,但将部分风格暴露约束到较窄的范围内。这样做的目的是模拟一种主动剥离特定负贡献风格的场景,同时允许组合适当暴露于与市场适配的优势风格(但还需注意风格因子间的关联性)。(2)用更公平的加权方式评价金股数据的有用性:将目标组合与基准(沪深300)的跟踪误差压缩到极致,从而彻底剥离风格及行业层面的干扰,更清晰展现金股组合的纯粹alpha捕获能力。
观察可见:(1)组合1(仅控制sizenl)与组合2(控制sizenl及size)的差异体现在风格约束范围。结果显示,两者的中小市值属性在全区间均被削弱,导致优化组合在2018-2022年未能跑赢基准全部金股组合,但2023年以来表现更优。这一现象表明,等权指数的评价方式虽在区间前半段放大了金股组合的结构性优势,却使其在区间后半段因市值风格错配陷入被动。进一步对比可见,除小市值风格阶段性回撤期间外,组合1的净值表现几乎持续优于组合2,这表明:若策略应用场景可放宽容量限制(比如作为“卫星”组合),则可适当弱化对市值这类“赚钱”风格的约束强度,以换取更灵活的收益空间。
(2)从组合2到组合3的优化路径显示,通过在风格控制框架中进一步纳入收益能力偏弱的流动性(liquidity)与残差波动率(residual_volatility)风格因子约束,组合2023年的净值表现实现了进一步提升。这一结果印证了在组合优化的风格控制环节中,嵌入风格轮动的研判视角能够有效增强组合的适配性,为策略收益提供额外增厚空间。
(3)组合4(最小化跟踪误差组合)相对沪深300基准的收益比价显示,2023年以后券商金股仍具备稳定获取正alpha的能力——尽管斜率水平较区间前半段有所回落。这一结论与《风险因子与风险控制系列之一:股票风险模型与基于持仓的业绩归因》中“全部金股组合在区间后半段的特质收益率基本为正”的研究结论呼应,进一步验证了券商金股在市场环境变化中持续创造超额收益的潜力。
2.2 构建基于沪深300指数的最小方差组合
最小方差组合是现代资产组合理论中的经典策略,其核心目标是在给定的资产池中,通过优化权重分配使组合的整体波动率(方差)最小化,从而在控制风险的前提下追求相对稳健的收益。作为均值-方差模型的一种特殊应用形式,它不依赖对资产预期收益的精准预测,而是聚焦于风险结构的优化,尤其适用于风险厌恶型投资者或需要控制下行风险的投资场景。
本节对比以下2个最小方差组合,选股范围为沪深300,测算区间为2013/1/1-2024/12/31,按收盘价成交,每月底再平衡,不考虑交易成本。
实证结果表明:(1)沪深300最小方差组合长期呈现低beta、低流动性、中小市值等风格特征,行业配置上超配医药、银行、电力及公用事业,低配非银金融、食品饮料等权重行业。全区间内,该组合年化收益率为8.16%,较基准(6.59%)超额约1.57%;即便考虑双边3‰的交易费率(估算年化收益损失约0.45%),仍具备较高吸引力。尤其在2021年以来的市场下跌阶段,其净值表现显著优于基准。
(2)控制beta下限后,组合除beta外的其他风格暴露基本保持了原有状态,但对电力及公用事业、银行等行业的超配幅度显著降低。全区间年化收益率达10.24%,在换手率相近的情况下,控制beta后的优化组合风险调整前后收益均有所提升。
2.3 应用协方差阵构建指增策略:相对暴露硬约束or风险预算控制?
在报告《破局之产品篇:公募基金产品布局,路在何方?》中,我们以团队Alpha因子库中的低频量价、高频量价、基本面选股因子为输入特征,使用惩罚系数为0.001的Lasso模型(预测目标是市值行业中性化后的股票收益率)合成了一个周频维度的线性复合基本面-量价因子(下称复合基本面-量价因子),其中训练集/测试集划分示意图如下:
本文试图以该复合基本面-量价因子为例,讨论量化方法构建指增策略时,股票风险模型的事前应用场景。首先从线性维度对复合量价-基本面因子的表现展开评估。全区间内(2016/1/1-2024/12/31),该因子所对应的10分组多头组合年化收益率高达18.51%,年化多空超额收益率为61.15%,多头超额收益率为18.74%(且在不扣除费用的情况下,每年均为正值)。该因子全区间有效性较好,但阶段性难免失效;2024年,该因子对应的多空超额收益率与多头超额收益率均出现两次较显著的回撤,分别发生在2月初至3月初以及9月至11月。
当然,构建指数增强策略时,我们重点关注在更严苛的现实约束条件下,因子能否持续发挥有效性。这些约束涵盖可投池范围的限定、调仓频率的管控、换手率的阈值设定、流动性的最低要求以及跟踪误差的上限控制等多个维度。以800指增为例,我们使用上述复合基本面-量价因子比较了以下三个优化组合:(1)组合1:作为基准参照组,该组合只纳入最基础的操作性约束——杠杆、做空约束与个股偏离,纯粹考量因子在极简规则下的域内表现。(2)组合2(间接法,“相对暴露硬约束”):在组合1的基础上,组合2进一步强化了风格和行业控制。除保留组合1的个股偏离限制外,额外要求行业暴露相对基准的偏离不超过±2%,风格暴露相对基准的偏离不超过±0.5(其中市值及非线性市值因子的偏离进一步收窄至±0.02)。此举旨在通过精细化的风格与行业约束,降低组合因风格漂移或行业集中度过高引发的非系统性风险。(3)组合3(直接法,通过设定目标跟踪误差控制风险预算):风格约束过严可能导致alpha因子超额钝化,主动化的风格择时手段也有滞后风险;目标跟踪误差是一种相对被动的折中方法——在组合1的基础上引入事前跟踪误差上限(年化不超过5%),目的是在风险可控的前提下,适度保留alpha因子的风格与行业轮动能力,避免过度约束扼杀因子对市场结构性机会的捕捉能力。为更清晰地对比不同约束逻辑的效果,本文中组合3暂未叠加风格约束,而在实际操作中,可根据市场环境在此基础上增设宽松的风格偏离阈值,以进一步平衡因子有效性与策略稳定性,减少因风格误判导致的超额收益损耗。
结果表明:全区间组合1(仅控个股偏离)、组合2(个股、行业、风格偏离)、组合3(个股偏离+跟踪误差)年化收益率分别为18.28%、16.26%、17.81%,相对基准中证800的跟踪误差分别为9.14%、4.73%、4.99%。仅控个股偏离时,该复合基本面-量价因子并不能在特定的可投池和换手约束下持续跑赢基准中证800,尤其在2019年(风格+行业收益为负值,特质收益也为负值)、2024年(风格负收益幅度高达-5.16%,特质收益率-1.75%)表现较差。
进一步拆解可见,组合 1 的收益波动与因子风格适配性高度相关:组合1在2016年、2021-2023年风格+行业收益为正,说明在这些时段复合基本面-量价因子能够有效命中优势风格;而在市场风格不利于该因子的阶段,仅靠个股偏离约束难以抵御系统性风险,并最终导致超额收益并不如意的现状。
对比组合2与组合1,风格/行业硬约束虽将跟踪误差稳定在5%以内,但过度限制使同等换手水平下年均收益率收窄2pct以上,反映刚性约束对因子天然风格轮动能力的抑制。
组合3的定位位于组合1和组合2之间,在特定换手率水平下,既保留了组合1的中小市值属性,又使得事后跟踪误差锚定在与组合2相近的5%,平滑了超额收益曲线。
03
总结与展望
本文是风险因子与风险控制系列文章第二篇,重点讲解风险模型的“后半段”工程,解析余下两大输出因子协方差矩阵(共同风险)和特异性波动率(特质风险)的计算逻辑,并借由事前/事后案例展示这两个输出结果的实践应用价值。
理论部分,我们详细梳理了因子协方差阵、特异性波动率在处理缺失值/异常值、时间序列非平稳性与其他系统性高/低估现象时的各项细节。经偏差统计量、Q统计量评价发现,经典风险计算框架对随机组合、宽基指数及行业组合的风险预测偏差有限,对风格特征组合的优化更显著;模型对真实市场风险的捕捉精度较为合理,为事后风险拆分、事前组合优化提供了可靠输入。
案例部分,本文再度讨论了券商金股组合,以此为例实现了对跟踪误差的归因(参考风险平价相关设定)。同时,我们以金股为例展示了如何使用哑变量另类数据构造有严格风格与行业偏离度约束的“泛指增”策略,应用最小跟踪误差方法收紧了策略与基准间差异,得到了近乎持续向上(尽管后期正斜率幅度有所下降)的超额曲线。这一结论与《风险因子与风险控制系列之一:股票风险模型与基于持仓的业绩归因》中“全部金股组合在区间后半段的特质收益率基本为正”的研究结论呼应,进一步验证了券商金股在市场环境变化中持续创造超额收益的潜力。
在协方差阵加持下,更多学术上的经典最优组合得以被实现。作为示例,我们构建了基于沪深300指数的最小方差组合,发现其长期呈现低beta、低流动性、中小市值等风格特征,行业配置上超配医药、银行、电力及公用事业,低配非银金融、食品饮料等权重行业。在此基础上控制beta下限后,组合除beta外的其他风格暴露基本保持了原有状态,但对电力及公用事业、银行等行业的超配幅度显著降低,全区间风险调整前后收益均表现更优,为构造低波动属性权益投资工具提供了新思路。
我们构造了复合量化-基本面因子,并以800指增为例给出了指增策略设计的新方案。在风格与行业偏离度约束收紧的大趋势下,严格的事前控制固然有助于打造更平滑的超额曲线,但如果不进行有效择时,也可能削弱alpha因子自带的风格轮动能力。指增语境下,本文比较了直接控制风格/行业与间接控制跟踪误差的策略结果,发现:借助股票协方差阵构造的目标跟踪误差股票组合在特定换手率水平下,既保留了原策略的固有风格属性,又能起到平滑超额收益曲线的作用,在对复合因子风格属性较为自信的情形下,目标跟踪误差法不失为一种折中方案。
至此,本系列报告已完成对经典风险模型五项核心成果——因子暴露、因子收益率、特异性收益率、因子协方差阵、特异性波动率的计算与构造,为现有投资框架匹配新规要求提供了切实有效的接口。后续我们也将持续迭代现有架构,推动风险模型从“被动防御”向“主动轮动”升级。
附录1:偏差统计量的定义及理论区间
附录2:“4个组合”经典案例
附录3:如何线性拆分组合风险贡献?
本文源自报告《风险因子与风险控制系列之二:共同风险、特质风险的计算及应用》
报告时间:2025年8月14日
发布报告机构:信达证券研究开发中心
报告作者:于明明 S1500521070001、吴彦锦 S1500523090002
★
分析师声明
★
负责本报告全部或部分内容的每一位分析师在此申明,本人具有证券投资咨询执业资格,并在中国证券业协会注册登记为证券分析师,以勤勉的职业态度,独立、客观地出具本报告;本报告所表述的所有观点准确反映了分析师本人的研究观点;本人薪酬的任何组成部分不曾与,不与,也将不会与本报告中的具体分析意见或观点直接或间接相关。
★
风险提示
★
证券市场是一个风险无时不在的市场。投资者在进行证券交易时存在赢利的可能,也存在亏损的风险。建议投资者应当充分深入地了解证券市场蕴含的各项风险并谨慎行事。
本报告中所述证券不一定能在所有的国家和地区向所有类型的投资者销售,投资者应当对本报告中的信息和意见进行独立评估,并应同时考量各自的投资目的、财务状况和特定需求,必要时就法律、商业、财务、税收等方面咨询专业顾问的意见。在任何情况下,信达证券不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任,投资者需自行承担风险。