Farewell,ad-hoc 多因子模型
摘要: 強加人為稀疏性假設的多因子模型註定會成為一段歷史,但以它們為基礎也會孕育出新的正規化。
1 引言
前文《稀疏性幻覺》曾丟擲這樣的觀點,在以往被提出的、如今早已成為實證資產定價中占主導地位的諸多多因子模型都帶有非常強的稀疏性假設。這背後的動機是繞過和收益率有關的協變數的高維數問題,從而用低維模型研究定價問題。
然而,希望通過包含有限個因子的 ad-hoc 多因子模型來解釋股票預期收益率或者 span 出更大的夏普比率平方,僅僅是一種稀疏性幻覺。雖然追求簡約模型本身並無不妥,但這些歷史上曾經輝煌一時的模型並非實證資產定價的未來,也終將退出歷史的舞臺。
本文借 Cooper et al. (2021) 一文,從 APT 的角度針對上述觀點再來做一番探討。BTW, Review of Asset Pricing Studies 也是我經常推薦的期刊。
2 APT 與 PCA
關於 APT(Ross 1976)的經濟學動機,Cochrane (2005) 有如下描述:
Factor structure can imply factor pricing (APT). The APT suggests that one start with a statistical analysis of the covariance matrix of returns and find portfolios that characterize common movement.
這段話的意思就是, 能夠解釋資產收益率共同運動的因子也應該是能夠解釋資產預期收益率截面差異的因子 。在市場中不存在近似無風險套利機會這個假設下,Kozak, Nagel, and Santosh (2018) 同樣論述了這一點(見《Which beta (III)?》)。這個經濟學動機也正是最近幾年利用 PCA 構造隱性因子模型備受關注的原因。這也是本節的題目為 APT 與 PCA 的原因。
我們再從數學上簡單看一下。假設資產的超額收益滿足如下回歸模型:
其中 是資產的超額收益,
是 demean 之後的因子(因子可以是 traded portfolios,即我們熟悉的 long/short portfolio returns,也可以是 nontraded portfolios)。由於在上式中對因子取值做了去均值處理,因此有
。
接下來,令 表示隨機貼現因子(SDF)。由於
表示超額收益,因此有
。對上面的迴歸模型兩邊同時乘以
並求期望可得:
利用 ,將
替換上式中的
並做簡單運算:
定義 以及
,上式最後變成我們熟悉的形式:
可以證明,當因子是 traded portfolio returns 時, 。
在 APT 的推導中,隱含的假設是不同資產的 是相互獨立的,即
,且特質收益率的方差
是有界的。在這兩個條件下,如果利用本節的迴歸模型計算不同資產超額收益率之間的協方差矩陣,則一個自然的結果就是這些解釋資產預期收益率的因子同時也能解釋資產的協方差矩陣。
在這個結論下,APT 為我們比較不同 ad-hoc 多因子模型提供了一個天然的基準 —— 我們可以通過 PCA 分解資產的協方差矩陣,利用特徵向量作為權重構造“統計”因子投資組合,以這些組合的收益率為因子構造一個基準的多因子模型。
如果 ad-hoc 模型能夠比較好的描述投資者在市場中面對的投資機會以及不同資產截面預期收益率的差異,則它們在資產定價方面的表現和上述基於 PCA 的基準模型之間不應該存在統計上顯著的差異。以此為出發點,就能夠評價不同的 ad-hoc 多因子模型。這也正是 Cooper et al. (2021) 的研究動機。
3 實證結果
雖然理論很清晰,但是實證依然充滿挑戰,那就是基於哪個協方差矩陣構造基準模型。在這方面,使用個股是不現實的,所以只能取而代之使用常見的 sorted portfolios 作為資產。Cooper et al. (2021) 基於資料可得性等原因選擇了 42 個常見的異象,並通過每個異象變數將股票分成 10 組(每月再平衡),一共得到了 420 個投資組合。以它們為資產計算協方差矩陣,Cooper et al. (2021) 構造了一個包含 6 個主成分的基準模型,記為 APT6。
再來看看被評價的 ad-hoc 多因子模型。該文一共考慮了 7 個模型,都是人們非常熟悉的,見下表。

為了比較來自 APT 的基準模型和上述 7 個 ad-hoc 模型,Cooper et al. (2021) 使用了很多常見的實證資產定價檢驗手段。本節介紹其中一個,即 time-series spanning test。以上述 420 個 sorted portfolios 作為 test assets,分別對這 8 個模型進行時序迴歸,計算每個 test asset 的 pricing error,並基於 pricing errors 進行檢驗。
其中一個檢驗統計量是截面 R-squared,定義如下:
其中 是 test assets 的 pricing errors 在截面上的方差,
是這些資產的平均收益率在截面上的方差。由定義可知,
越大則說明模型解釋資產預期收益率的能力越強。下表給出了檢驗結果(只需要看 Panel A 即可)。

從 Panel A 可知,來自 APT 的基準模型的 高於任意一個 ad-hoc 模型的 。此外,
(請注意它不代表夏普比率平方)這一行展示了基準模型和單個 ad-hoc 模型的
之差,其下方括號內為對應的 p -value。從 Panel A 的結果可知,除了 HMXZ5 之外,其他 ad-hoc 模型和基準模型相比的差異均在 5% 的顯著性水平以下。而 HMXZ5 和基準模型的差異的顯著性水平是 10% 以下。另外讓人驚訝的是 BS6 模型的
是負的。(Panel B 的穩健性檢驗給出了類似的結果。)
面對以上實證結果,我們似乎還不能馬上否定 ad-hoc 模型。其背後的原因有兩個。首先,APT 模型是根據 420 個作為 test assets 的協方差矩陣構造的,它是一個純粹的 in-sample test,它能解釋更多的截面差異理所應當。第二,HMXZ5 這個最近兩年出盡風頭的模型(見 Hou et al 2019)和 APT 模型的差距在統計上並不是那麼顯著。不過值得一提的是,HMXZ5 雖然源自加強版的 q-theory model(見 《從 Factor Zoo 到 Factor War,實證資產定價走向何方?》 ),但它也僅僅是事後的 in-sample 實證分析。
為了排除顧慮,使用未被用於構造 APT 模型的 test assets 就顯得格外重要。為此,Cooper et al. (2021) 使用了另外 8 個異象構造了 80 個 sorted portfolios 作為 test assets。結果如下。

對於這 80 個 test assets 來說,基準模型 APT6 依然有不錯的定價能力,其 為0.34( p -value = 0.000)。反觀各種 ad-hoc 模型,C4、HXZ4 以及 BS6 的
均為負。其中表現最好的是 SY4。另外,雖然以定價能力差異來看,我們依然不能說 HMXZ5(此外這回還有 FF6)和基準模型的差異在統計上是顯著的,但如果對照著
來看,HMXZ5 首先就沒有表現出統計上顯著的定價能力。另外,考慮到 HMXZ5 是 HXZ4 的拓展(僅僅加上了額外的預期投資增長因子),我們也無法忽視 HXZ4 和 HMXZ5 的巨大反差(
一正一負)。
除本節介紹的實證結果之外,Cooper et al. (2021) 還考慮了其他很多穩健性檢驗,感興趣的小夥伴請閱讀原文。總體而言,來自 APT 的基準模型無論在 in-sample test 還是在 out-of-sample test 都表現出了更好的定價能力,因而優於各類 ad-hoc 模型。在諸多 ad-hoc 模型中,唯一能與其相比的是 HMXZ5,但其所代表的投資機會遠遠遜於 APT 模型。
4 結束語
最近幾年,實證資產定價的研究正規化已從 ad-hoc 多因子模型轉到隱性多因子模型,其中的代表作當屬基於 PCA 方法的 Kelly, Pruitt, and Su (2019) 以及 Kozak, Nagel, and Santosh (2020)。(順便一提,這兩篇文章分別獲得 2019 和 2020 JFE Fama-DFA best paper prize。)無論從對資產的定價能力,還是從構造的最大夏普比率平方來說,隱性因子模型都要優於 ad-hoc 多因子模型,一如 Cooper et al. (2021)。
對於業界的投資實務來說,多因子模型的作用找到最能解釋資產預期收益率差異(即最能代表投資機會)的因子,並最大化樣本外的條件風險收益特徵。而從實證資產定價來說,多因子模型的新正規化應能夠正面應對協變數(公司特徵)的高維數問題,在摒棄稀疏性假設的前提下研究眾多高度相關的協變數和資產收益率的關係。
在可以預見的未來,無論是對業界還是學界的目標,曾經輝煌一時的 ad-hoc 多因子模型似乎都無法繼續發揮太大的作用。雖然這些模型讓多因子模型的概念深入人心,但隨著理論和實證資產定價研究持續發展,終有那麼一個時刻,我們要對它們說聲拜拜。
也許這個時刻已經到來。
參考文獻
- Barillas, F. and J. Shanken (2018). Comparing asset pricing models. Journal of Finance 73 (2), 715 – 754.
- Carhart, M. M. (1997). On persistence in mutual fund performance. Journal of Finance 52 (1), 57 – 82.
- Cochrane, J. H. (2005). Asset Pricing (Revised Edition) . Princeton University Press.
- Cooper, I., L. Ma, P. Miao, and D. Philip (2021). Multifactor models and their consistency with the APT. Review of Asset Pricing Studies 11 (2), 402 – 444.
- Fama, E. F. and K. R. French (2015). A five-factor asset pricing model. Journal of Financial Economics 116 (1), 1 – 22.
- Fama, E. F. and K. R. French (2018). Choosing factors. Journal of Financial Economics 128 (2), 234 – 252.
- Hou, K., H. Mo, C. Xue, and L. Zhang (2019). Which factors? Review of Finance 21 (1), 1 – 35.
- Hou, K., H. Mo, C. Xue, and L. Zhang (2021). An augmented q-factor model with expected growth. Review of Finance 25 (1), 1 – 41.
- Hou, K., C. Xue, and L. Zhang (2015). Digesting anomalies: An investment approach. Review of Financial Studies 28 (3), 650 – 705.
- Kelly, B. T., S. Pruitt, and Y. Su (2019). Characteristics are covariances: A unified model of risk and return. Journal of Financial Economics 134 (3), 501 – 524.
- Kozak, S., S. Nagel, and S. Santosh (2018). Interpreting factor models. Journal of Finance 73 (3), 1183 – 1223.
- Kozak, S., S. Nagel, and S. Santosh (2020). Shrinking the cross-section. Journal of Financial Economics 135 (2), 271 – 292.
- Ross, S. A. (1976). The arbitrage theory of capital asset pricing. Journal of Economic Theory 13 (3), 341 – 360.
- Stambaugh, R. F. and Y. Yuan (2017). Mispricing factors. Review of Financial Studies 30 (4), 1270 – 1315.
免責宣告: 入市有風險,投資需謹慎。在任何情況下,本文的內容、資訊及資料或所表述的意見並不構成對任何人的投資建議。在任何情況下,本文作者及所屬機構不對任何人因使用本文的任何內容所引致的任何損失負任何責任。除特別說明外,文中圖表均直接或間接來自於相應論文,僅為介紹之用,版權歸原作者和期刊所有。
原創不易,請保護版權。如需轉載,請聯絡獲得授權,並註明出處。已委託“維權騎士”( 維權騎士-版權保護 版權知識 原創檢測 識別字體 著作權登記 ) 為進行維權行動。
- Missing Financial Data
- 尋找 Mean-Variance Frontier (II)
- 出色不如走運 (VII)?
- 基金研究:文獻綜述 (I)
- Farewell,ad-hoc 多因子模型
- Momentum
- 稀疏性幻覺
- Bayesian Two-Pass Regression
- Value
- 隨筆
- 反應過度、反應不足與股票收益
- 利用收益率時序資訊改進 SDF 估計
- 世界變化不停 人潮川流不息 我只想每個落日 身邊都有你
- PEAD, R.I.P.? PEAD.txt 來代替
- Being Honest with Backtest Reporting
- Q&A with Eugene Fama
- 出色不如走運 (VI)?
- False In-Sample Predictability?
- Which Beta (III) ?
- Cross-Section Research, A History