来源:源达
投资要点
股东户数因子的定义
股东户数是指持有一家上市公司股票的全体股东账户总数。该数据随季报、中报及年报定期披露。按照不同指数样本进行统计,市值规模与股东户数之间的呈现出正向关联,即市值较大的上市公司通常拥有更多的股东户数。为消除市值影响,本文中我们选用“股东户数变动比例”做为因子搭建策略,计算公式如下:股东户数变动比例=(最新报告期的股东户数-上一个报告期的股东户数)/ 上一个报告期的股东户数 *100%。
股东户数因子的特点
①股东户数因子在中小盘风格占优的市场中负向选股最为有效。如2019年至2023年连续五年Rank IC均显著为负,其中2021年负向效果最强(Rank IC = -0.1247)
②股东户数因子在中小市值区间表现最优。在市值中位数约62亿至113亿元区间,Rank IC负值绝对值达0.062以上,且正比例低至16%,负向预测强度与稳定性俱佳。
③股东户数因子在医药生物、传媒、化工、计算机等行业表现最强。Rank IC负值均值在-0.06至-0.08之间,且IC正比例普遍低于30%,其中医药生物正比例仅8%、传媒仅16%;在银行、交通运输、休闲服务等行业基本失效,行业分化明显。
单因子组合策略构建
我们以股东户数因子作为单一因子构建选股策略。在全A股样本池内, 剔除ST、退市的公司,剔除行业为休闲服务、银行、综合、汽车、国防军工的公司,剔除因子次优值,在每年的4月30日及10月30日调仓,非交易日则顺延,根据股东户数因子从小到大排序,选取前10只等权重持有构建策略,2014.04.30-2026.05.22该策略组合实现了406.34%的总回报,年化收益率为14.33%。相较于沪深300指数,该组合实现了281.87%的超额收益。
叠加机构持股数因子策略构建
叠加机构持股数大于5家条件的股票组合回测表现最佳,2014.04.30-2026.05.22该策略组合实现了444.84%的总回报,年化收益率为15.02%。相较于沪深300指数,该组合实现了320.37%的超额收益。
风险提示
历史收益表现不代表未来;回测模型未考虑实际交易费用率;其他数据统计误
一、股东户数变动比例因子的IC检测
1.股东户数的定义
股东户数是指持有一家上市公司股票的全体股东账户总数。该数据随季报、中报及年报定期披露。由于A股存在一人多户规则,股东户数更精确地反映的是持有该股票的账户分布而非自然人数量。在某种程度上,股东户数的增减能够直观刻画筹码的分散与集中,在一定程度上反映了股票在不同投资者群体之间的动态转移。
近十年间(2014—2025年),上市公司的股东户数整体呈现出波动但无明显趋势的特征,2020年起稳定在2.5万户左右,近三年虽小幅回升至2.7万户,但仍未超过前期高点;而按照不同指数样本进行统计,则呈现出市值规模与股东户数之间的正向关联,即市值较大的上市公司通常拥有更多的股东户数,市值较小的公司股东户数则相对较少。
|
图1:不同时期股东户数统计 |
图2:不同指数股东户数统计 |
|
|
|
|
资料来源:Wind,源达信息证券研究所 |
资料来源:Wind,源达信息证券研究所 |
2.股东户数变动比例因子的 IC检测
为了消除具有市值差异的公司股东户数变动绝对值的影响,本文中选用“股东户数变动比例”做为因子搭建策略,计算公式如下:
股东户数变动比例=(最新报告期的股东户数-上一个报告期的股东户数)/ 上一个报告期的股东户数 *100%
考虑到定期报告的披露时间,我们对中证全指成分股,采用半年度频率数据,对 2014-2026年期间4月30日及10月31日的数据进行 IC 检测,可以发现股东户数因子的主要特征如下:
(1)股东户数因子在中小盘风格占优的市场中最为有效。 如2019年至2023年连续五年Rank IC均显著为负,其中2021年负向效果最强(Rank IC = -0.1247),2023年亦达-0.0869;但在2018年系统性单边下跌市中方向反转(Rank IC显著为正)。
(2)股东户数因子在中小市值区间表现最优。 在平均市值约62亿至113亿元区间(市值组3和组4),Rank IC负值绝对值达0.062以上,且正比例低至16%,负向预测强度与稳定性俱佳;在平均市值约23亿元的微盘股中,Rank IC仅-0.0234,正比例高达40%,负向能力很弱;在平均市值超过700亿元的大盘股中,Rank IC回落至-0.047,正比例回升至36%,有效性显著减弱。
(3)股东户数因子在医药生物、传媒、化工、计算机等行业表现最强。 Rank IC负值均值在-0.06至-0.08之间,且IC正比例普遍低于30%,其中医药生物正比例仅8%、传媒仅16%,负向选股最为稳定可靠;在银行、交通运输、休闲服务等行业基本失效,Rank IC负值接近零且正比例高达56%,方向频繁反转,行业分化极为明显。
分指数对股东户数因子进行IC检测,从结果来看,股东户数因子整体平均Rank IC为-0.06,Rank ICIR为-1.00,显示较为稳定的负向选股能力(即股东户数增加时,股票未来收益倾向下降)。该因子在中证1000中表现最为显著,平均Rank IC达-0.06,Rank ICIR达-0.85,预测强度较高且相对稳定;在沪深300中平均Rank IC为-0.05,但Rank ICIR仅为-0.40,稳定性减弱。
表1:不同指数股东户数因子 IC 检测情况
|
指数 |
有效月份 |
平均IC |
IC标准差 |
ICIR |
IC>0比例 |
平均RankIC |
RankICIR |
||
|
整体 |
25 |
-0.04 |
0.05 |
-0.83 |
0.16 |
-0.06 |
-1.00 |
||
|
沪深300 |
25 |
-0.03 |
0.13 |
-0.22 |
0.36 |
-0.05 |
-0.40 |
||
|
中证500 |
25 |
-0.03 |
0.10 |
-0.28 |
0.32 |
-0.03 |
-0.30 |
||
|
中证800 |
25 |
-0.03 |
0.09 |
-0.30 |
0.32 |
-0.04 |
-0.43 |
||
|
中证1000 |
24 |
-0.05 |
0.07 |
-0.70 |
0.17 |
-0.06 |
-0.85 |
||
数据来源:Wind,源达信息证券研究所
我们对股东户数因子分行业进行 IC 检测。从行业表现数据来看,该因子在医药生物、传媒、化工、计算机等行业呈现较强负向预测能力,Rank IC 负值均值在 -0.06 至 -0.08 之间,且Rank IC 正比例普遍低于 30%,负向强度与稳定性俱佳;与之相对,因子在休闲服务、银行、综合、汽车、国防军工等行业,IC或者Rank IC呈现正值,因子负向选股能力趋于失效。
表2:不同行业股东户数因子 IC检测情况
|
|
IC均值 |
IC标准差 |
IC正比例 |
Rank_IC均值 |
Rank_IC正比例 |
有效时间点 |
股票数量 |
|
化工 |
-0.06336 |
0.071233 |
0.24 |
-0.08691 |
0.16 |
25 |
7724 |
|
房地产 |
-0.07715 |
0.11935 |
0.24 |
-0.07828 |
0.28 |
25 |
2570 |
|
传媒 |
-0.08697 |
0.095826 |
0.16 |
-0.0751 |
0.28 |
25 |
3248 |
|
非银金融 |
-0.10388 |
0.173018 |
0.24 |
-0.07126 |
0.24 |
25 |
1591 |
|
机械设备 |
-0.06548 |
0.076966 |
0.2 |
-0.06982 |
0.24 |
25 |
7909 |
|
采掘 |
-0.06114 |
0.156249 |
0.28 |
-0.06896 |
0.28 |
25 |
1371 |
|
公用事业 |
-0.06479 |
0.124492 |
0.44 |
-0.06769 |
0.4 |
25 |
3837 |
|
计算机 |
-0.0546 |
0.082798 |
0.24 |
-0.06389 |
0.28 |
25 |
4896 |
|
医药生物 |
-0.07552 |
0.058775 |
0.08 |
-0.06238 |
0.2 |
25 |
7169 |
|
纺织服装 |
-0.09855 |
0.14575 |
0.28 |
-0.0616 |
0.36 |
25 |
1723 |
|
有色金属 |
-0.05969 |
0.09951 |
0.32 |
-0.06116 |
0.36 |
25 |
2713 |
|
电气设备 |
-0.04896 |
0.110076 |
0.32 |
-0.05431 |
0.32 |
25 |
4502 |
|
建筑装饰 |
-0.07511 |
0.119785 |
0.32 |
-0.05408 |
0.44 |
25 |
2723 |
|
建筑材料 |
-0.03074 |
0.169487 |
0.44 |
-0.05146 |
0.44 |
25 |
1524 |
|
休闲服务 |
0.011539 |
0.252532 |
0.4 |
-0.04957 |
0.52 |
25 |
724 |
|
农林牧渔 |
-0.04963 |
0.111964 |
0.32 |
-0.04582 |
0.28 |
25 |
1857 |
|
家用电器 |
-0.02088 |
0.138316 |
0.32 |
-0.0451 |
0.4 |
25 |
1416 |
|
汽车 |
-0.0178 |
0.087022 |
0.36 |
-0.04135 |
0.44 |
25 |
3866 |
|
电子 |
-0.04515 |
0.065337 |
0.28 |
-0.03635 |
0.28 |
25 |
5780 |
|
商业贸易 |
-0.02679 |
0.175982 |
0.36 |
-0.03359 |
0.4 |
25 |
1926 |
|
通信 |
-0.02011 |
0.165967 |
0.4 |
-0.03321 |
0.32 |
25 |
1924 |
|
食品饮料 |
-0.05188 |
0.092246 |
0.28 |
-0.02543 |
0.52 |
25 |
2251 |
|
轻工制造 |
-0.04332 |
0.107433 |
0.32 |
-0.02466 |
0.32 |
25 |
2766 |
|
交通运输 |
-0.06949 |
0.122992 |
0.32 |
-0.02164 |
0.56 |
25 |
2637 |
|
钢铁 |
-0.07502 |
0.18208 |
0.36 |
-0.01655 |
0.44 |
25 |
791 |
|
综合 |
0.009422 |
0.25597 |
0.48 |
0.008822 |
0.48 |
25 |
621 |
|
国防军工 |
-0.01926 |
0.178434 |
0.4 |
0.019412 |
0.48 |
25 |
1587 |
|
银行 |
0.009956 |
0.285117 |
0.56 |
0.020275 |
0.56 |
25 |
748 |
数据来源:Wind,源达信息证券研究所
接着,我们对不同市值的股票分组进行 IC 检测。根据市值分组测试,该因子的有效性呈现明显的非线性市值特征:在平均市值约 23 亿元的微盘股(市值组1)中,Rank IC 均值仅为 -0.023,正比例高达 40%,负向预测能力很弱且方向稳定性差;因子在市值中位数约 61 亿至 109 亿元区间(市值组3和组4)表现最优,Rank IC 负值绝对值达 0.062 以上,且 Rank IC 正比例低至 16%,负向预测强度与稳定性俱佳;当市值超过 700 亿元(市值组5)后,因子预测能力回落,Rank IC 负值绝对值降至 0.047,正比例回升至 36%,负向选股效果显著减弱。
表3:不同市值股东户数因子 IC检测情况
|
|
IC均值 |
IC标准差 |
IC正比例 |
Rank_IC均值 |
Rank_IC正比例 |
平均市值(亿) |
市值中位数(亿) |
|
市值组1 |
-0.0181 |
0.091655 |
0.36 |
-0.0234 |
0.4 |
22.98224 |
23.42489 |
|
市值组2 |
-0.03359 |
0.050673 |
0.24 |
-0.04002 |
0.24 |
39.31138 |
39.072 |
|
市值组3 |
-0.04939 |
0.03909 |
0.12 |
-0.06262 |
0.16 |
61.97104 |
60.98812 |
|
市值组4 |
-0.05943 |
0.073131 |
0.24 |
-0.06324 |
0.16 |
113.0162 |
108.7021 |
|
市值组5 |
-0.0367 |
0.099595 |
0.36 |
-0.04734 |
0.36 |
741.7429 |
304.3024 |
数据来源:Wind,源达信息证券研究所
从时间维度来看,股东户数因子在大多数年份展现出稳定的负向预测能力,尤其是2021年负向效果最强(RankIC = -0.1247),纵向对比来看,在市场结构性行情或中小盘风格占优时,该因子的选股有效性尤为突出;但2018年出现RankIC显著为正的反常现象,可能与当年市场系统性单边下跌导致股东户数信号失效有关。
表4:不同年份股东户数因子 IC检测情况
|
年份 |
样本数 |
IC |
IC_p值 |
RankIC |
RankIC_p值 |
RankIC_显著性 |
|
2014 |
4449 |
-0.02649 |
0.077301 |
-0.06467 |
1.58E-05 |
显著 |
|
2015 |
4769 |
-0.0106 |
0.464366 |
-0.06166 |
2.03E-05 |
显著 |
|
2016 |
5225 |
-0.03229 |
0.019585 |
-0.02513 |
0.069295 |
不显著 |
|
2017 |
5665 |
-0.0518 |
9.6E-05 |
-0.07197 |
5.87E-08 |
显著 |
|
2018 |
6317 |
0.006098 |
0.627973 |
0.03965 |
0.001622 |
显著 |
|
2019 |
6754 |
-0.08469 |
3.13E-12 |
-0.09499 |
5.16E-15 |
显著 |
|
2020 |
6822 |
-0.00187 |
0.877465 |
-0.04607 |
0.000141 |
显著 |
|
2021 |
7185 |
-0.00535 |
0.650532 |
-0.12473 |
2.62E-26 |
显著 |
|
2022 |
8046 |
-0.04544 |
4.56E-05 |
-0.04281 |
0.000122 |
显著 |
|
2023 |
8912 |
-0.05613 |
1.14E-07 |
-0.08689 |
2.09E-16 |
显著 |
|
2024 |
9577 |
-0.00662 |
0.516978 |
0.000621 |
0.951565 |
不显著 |
|
2025 |
10020 |
-0.00535 |
0.592312 |
-0.00164 |
0.869602 |
不显著 |
数据来源:Wind,源达信息证券研究所
股东户数变动比例较高组长期跑输股东户数变动比例较低组。将股东户数单因子从小到大分为10组,计算累计平均收益率曲线,可以发现股东户数变动比例因子较高组,即第9、8、10组表现明显弱于其他组,收益表现较差。
图3: 股东户数因子的分组平均累计收益
资料来源:Wind,源达信息证券研究所
二、组合策略构建
1.单因子组合策略构建
根据上述IC检测结果,我们以股东户数因子作为单一因子构建选股策略。在全A股样本池内,具体筛选流程如下:
筛选后的股票组合回测结果如下图,2014.04.30-2026.05.22该策略组合实现了406.34%的总回报,年化收益率为14.33%。相较于沪深300指数,该组合实现了281.87%的超额收益。
图4:全A股东户数因子筛选出的10只股票组合(2014.04.30-2026.05.22)
资料来源:Wind,源达信息证券研究所
表5:全A用股东户数因子筛选出的10只股票组合表现
|
指标名称 |
成立至今 (2014.04.30-2026.05.22) |
|
总回报 |
406.34% |
|
相对回报 |
281.87% |
|
年化平均回报 |
14.33% |
|
年化波动率 |
28.49% |
|
Alpha |
8.34% |
|
Beta |
0.8671 |
|
Sharpe |
0.45 |
|
跟踪误差 |
1.38% |
|
最大回撤 |
-64.71% |
数据来源:Wind,源达信息证券研究所
从因子含义来看,股东户数减少意味着市场上的股票正在从多数投资者手中向少数人集中,而能够大举买入的少数人,通常是资金实力较强的机构或大户。基于这一逻辑,我们结合机构持股数,对单因子策略组合进行进一步优化。
具体优化流程如下:
其中叠加机构持股数大于5家的股票组合回测表现最佳,2014.04.30-2026.05.22该策略组合实现了444.84%的总回报,年化收益率为15.02%。相较于沪深300指数,该组合实现了320.37%的超额收益。
图5:股东户数因子叠加机构持股数筛选出的10只股票组合(2014.04.30-2026.05.22)
资料来源:Wind,源达信息证券研究所
表6:股东户数因子叠加机构持股数筛选出的10只股票组合表现
|
指标名称 |
机构持股数大于5
|
机构持股数大于10 |
|
总回报 |
444.84% |
237.37% |
|
相对回报 |
320.37% |
112.90% |
|
年化平均回报 |
15.02% |
10.56% |
|
年化波动率 |
28.39% |
26.09% |
|
Alpha |
8.93% |
4.50% |
|
Beta |
0.8824 |
0.8777 |
|
Sharpe |
0.48 |
0.35 |
|
跟踪误差 |
1.35% |
1.16% |
|
最大回撤 |
-64.78% |
-61.77% |
数据来源:Wind,源达信息证券研究所
从回测结果来看,叠加机构持股数大于5后,组合表现相对单因子组合获得一定提升,但进一步增加机构持股数之后,组合表现出现下滑。主要原因可能是机构持股家数的增加在一定程度上缩小了选股范围,剔除相关中小市值成长性更强的标的。
三、风险提示
历史收益表现不代表未来;
回测模型未考虑实际交易费用率;
其他数据统计误差