Anomalies, Factors, and Multi-Factor Models
發(fā)布時間:2019-02-13 | 來源: 川總寫量化
作者:石川
摘要:本文解釋了異象、因子以及多因子模型的區(qū)別和聯系;梳理了從異象到因子再到模型背后的邏輯;介紹了學術界研究多因子模型的主流統(tǒng)計手段。
1 引言
在 empirical asset pricing 和 factor investing 中,anomalies(異象)、factors(因子)以及 multi-factor models(多因子模型)是三個常見的概念。從這些概念出發(fā)又能很自然的引發(fā)出一系列問題:
1. 什么是 anomalies;什么是 factors?
2. Anomalies 和 factors 有什么區(qū)別?
3. 一個 multi-factor model 中應該包含多少個 factors?
4. 學術界有哪些主流的 multi-factor models?
5. 如何比較并在不同的 multi-factor models 之間取舍?
在過去幾十年里,海外學術界對上述問題進行了大量的探索,留下了很多寶貴的實證結果和分析手段。而對于像你、我一樣進行因子投資的投資者來說,搞清楚這些問題對于構建系統(tǒng)和全面的因子投資分析體系至關重要。本文試圖回答上述五個問題。
2 Anomalies
多因子模型是 empirical asset pricing 的一種常見方法;其研究的核心問題是找到一組能夠解釋股票預期收益率截面差異的因子(見《股票多因子模型的回歸檢驗》)。假使我們根據基本面特征或量價指標(或 whatever,下面統(tǒng)稱為特征)挑選出一攬子股票并構建多空投資組合;如果該組合的收益率無法被用于 asset pricing 的多因子模型解釋,則稱該特征為一個異象(anomaly)。在數學上,這意味著該組合有模型無法解釋的 α 收益率:以使用該特征構建的多空組合收益率為被解釋變量放在回歸方程的左側,以多因子模型中因子收益率為解釋變量放在回歸方程的右邊,進行時序回歸,回歸的截距項就是 α 收益率;如果 α 顯著不為零,則說明該特征是一個異象。
舉個例子。《獲取 α 的新思路:科技關聯度》一文介紹了 Lee et al. (2018) 這篇文章;使用科技關聯度選股的多空對沖投資組合獲得了主流多因子模型無法解釋的 α 收益率(下圖),因此它是一個異象。
從有效市場假說的觀點出發(fā),市場中不應該存在很多異象。當然,有效市場假說并不完美,再加上學術界幾十年來的“不懈努力”,針對美股挖掘出了 400+ 個異象,這些異象在樣本內的統(tǒng)計檢驗中都獲得了很高的 t-statistics。產生如此多的異象主要有兩個原因:
第一個也是最主要的一個原因是數據挖掘。在 p-hacking 的激勵和多重假設檢驗的盛行下,大量所謂的異象在樣本內被挖出。Harvey, Liu and Zhu (2016) 研究了學術界發(fā)表的 316 個所謂顯著異象,并指出再考慮了 multiple testing 的影響后,異象收益率的 t-statistic 至少要超過 3.0(而非人們傳統(tǒng)認為的 5% 的顯著性水平對應的 2.0)才有可能是真正有效、而非來自運氣。
第二個原因和回歸方程右側的定價模型有關。比如,如果僅以 CAPM 為定價模型,那么很多異象都能獲得 CAPM 無法解釋的 α 收益率;隨著定價模型中因子個數的增加,更多的異象變得不再顯著。然而,真正的定價模型是未知的。
談及對異象的研究,不能不提的一篇文章是 Hou, Xue and Zhang (2017)。這篇長達 146 頁的文章驚人的復現了學術界提出的 447 個異象,涵蓋動量(57個)、價值/成長(68個)、投資(38個)、盈利(79個)、無形資產(103個)、以及交易摩擦(102個)六大類。下圖節(jié)選了少量動量類異象說明,感受一下。
對于這 447 個異象,當排除了微小市值股票的影響后,其中 286 個(64%)不再顯著(在 5% 的顯著性水平下,下同);如果按照 Harvey, Liu and Zhu (2016) 的建議把 t-statistic 閾值提升到 3.0,則其中 380 個(85%)異象不再顯著;最后,如果使用 Hou, Xue and Zhang (2015) 提出的 4 因子模型作為定價模型,那么其中 436 個(98%)異象不再顯著,剩余存活的僅有 11 個。好一個數據挖掘!
除此之外,Linnainmaa and Roberts (2018) 花費了很大的經歷構建了全新的樣本外數據,研究了美股中源于會計數據的 36 個異象在樣本內、外的表現的差異。分析表明,絕大部分異象在樣本外明顯失效,它們的失效說明這些異象并非來自未知風險以及錯誤定價這兩種解釋,而更有可能僅僅是數據挖掘的產物。
3 Factors
上一節(jié)介紹了異象,本節(jié)就來看看什么是因子(factors)。一個異象是可能成為一個優(yōu)秀因子的;然而由于異象之間的相關性,并不是所有異象都是因子。一個因子應該能夠對解釋資產(可以是個股也可以是個股組成的投資組合)預期收益率的截面差異有顯著的增量貢獻。如果異象滿足上述條件,它就可以被稱之為一個因子。在這個定義中,有兩個關鍵詞值得解讀,它們是“解釋”和“增量貢獻”:
1. “解釋”說明這個異象(或者潛在因子)已經從回歸方程的左側移到了回歸方程的右側,它被用來當作解釋變量來對資產的收益率做回歸,考察它是否能夠解釋預期收益率的截面差異。
2. “增量貢獻”暗示著同時考慮多個異象(因子)時,由于它們之間不完全獨立,需要排除相關性的影響。
舉個例子。我們知道價值因子是一個靠譜的選股因子。然而,很多指標 —— 比如 E/P 或 B/P 都可以用來構建價值因子的 High-Minus-Low 組合。如果同時基于 E/P 和 B/P 構建了 HML_EP 和 HML_BP 兩個因子,它們之間的相關性注定是非常高的。一旦選擇了其中之一作為價值因子,另一個對于資產預期收益率截面差異解釋能力的增量貢獻就不再顯著、無法成為因子。從資產定價的理論角度來說,多因子模型中的因子之間應盡可能獨立;但是從投資實踐來說,上面例子中的 E/P 和 B/P 可以被同時使用構建一個 HML 價值因子,這有助于降低波動且增加因子的魯棒性。
在從一攬子異象中篩選因子時,常見的做法是將它們同時作為回歸分析中的解釋變量,采用 Fama-MacBeth Regression(Fama and MacBeth 1973)來分析這些異象的收益率是否顯著。在這方面,Green, Hand and Zhang (2017) 是一個很好的例子。Green, Hand and Zhang (2017) 使用 Fama-MacBeth Regression 同時檢驗 94 個異象,并考慮了 multiple testing 對 t-statistic 以及 p-value 造成的影響,最終發(fā)現僅有 12 個異象可能成為潛在的因子:1. 賬面市值比;2. 現金;3. 分析師數量的變化;4. 盈余公告宣告收益;5. 一個月的動量;6. 六個月動量的變化;7. 盈利同比增長的季度數量;8. 年度研發(fā)支出占市值的比重;9. 收益波動性;10. 股票換手率;11. 股票換手率的波動性;12. 零交易的天數。上述結果告訴我們:在修正 multiple testing 的數據挖掘、以及考察了不同異象的相關性之后,真正能夠解釋資產預期收益率截面差異的獨立因子少之又少。
4 Multi-Factor Models
現在我們已經了解了異象,并通過回歸分析從異象中找出了因子,接下來就是挑選因子構建多因子模型了。在構建多因子模型時,兩個必須要回答的問題是:(1)選擇多少個因子合適?(2)選擇哪些因子更好?學術界對于第一個問題的共識為主流因子模型奠定了基調;而第二個問題則涉及不同多因子模型之間的比較。對于第一個問題,我們總可以僅使用一個因子,比如 CAPM 模型僅使用了市場因子;又或者我們可以使用許多因子。一個極端的情況是把每個上市公司作為一個因子,每個公司的股票只在自己公司的因子上有暴露,在代表其他公司的因子上零暴露。這樣的模型顯然能完美解釋股票預期收益率的截面差異,但在現實中沒人會那么用。以樣本內過擬合為代價,更多的因子總能更好的解釋收益率的截面差異。
在學術界,“幾個因子合適”這個問題所遵循的準則是 The Law of Parsimony(簡約法則),它還有一個更為人熟知的名字 —— Occam’s razor(奧卡姆剃刀)。如果從 ICAPM(Intertemporal CAPM)的角度來理解多因子模型,每個因子代表某種 state variable;而 state variable 是投資者想要對沖的某種風險。從這個意義上說,因子的個數應該是有限的。依據簡約法則,學術界主流的多因子模型包括以下幾個(按時間順序、排名不分先后,不完整 list),它們的因子個數均在 3 到 5 個之間:
Fama-French 三因子模型(Fama and French 1993):多因子模型的開山鼻祖,包括 MKT,HML 以及 SMB 三因子。
Carhart 四因子模型(Carhart 1997):在 Fama-French 三因子模型上加上了動量 MOM 因子。
Novy-Marx 四因子模型(Novy-Marx 2013):包含 MKT,HML,MOM 以及 PMU 四個因子;其中 PMU 所用的財務指標是 Gross Profit-to-Asset,代表 profitability 維度。
Fama-French 五因子模型(Fama and French 2015):Fama 和 French 在其三因子模型的基礎上加入了 CMA 和 RMW 兩個因子,分別代表 investment 和 profitability 兩個維度。
Hou-Xue-Zhang 四因子模型(Hou, Xue and Zhang 2015):包含 MKT,SMB,IVA 以及 ROE;其中 IVA 是 total assets 的年增長率,代表 investment 維度。
Stambaugh-Yuan 四因子模型(Stambaugh and Yuan 2016):包含 MKT,SMB,MGMT 和 PERF 四個因子。MGMT 和 PERF 分別使用了 6 個和 5 個指標,代表和 management 以及 performance 相關的兩個 mispricing 因子。雖然該模型只有四個因子,但它用到的基本面和量價指標多達 12 個。
Daniel-Hirshleifer-Sun 三因子模型(Daniel, Hirshleifer and Sun 2018):在 MKT 的基礎上,使用 PEAD 和 FIN 兩個指標作為短期和長期行為因子(behavioral factors)的代理指標,構建了三因子模型。該模型由于包括了傳統(tǒng)的 MKT 風險因子,又包括行為因子,故稱為復合模型。
如何比較不同的多因子模型呢?學術界主要有以下三種方法:
1. GRS tests;
2. Mean-Variance Spanning tests;
3. Bayesian approach。
GRS tests(Gibbons, Ross and Shanken 1989)檢驗 n 個資產在給定因子模型下的定價錯誤(pricing error)—— 即 α —— 是否在統(tǒng)計上聯合為零(jointly equal to zero)。在比較兩個多因子模型時,使用兩個模型的因子互為資產和定價模型進行檢驗。舉個例子。《中國版的 Fama-French 三因子模型,了解一下?》一文中比較了兩個不同版本的價值和市值因子的效果。結果(下表)顯示,當使用 SMB 和 VMG 為因子模型時,FFSMB 和 FFHML 的定價錯誤可以認為是零(p-value = 0.41);反過來,當使用 FFSMB 和 FFHML 為定價模型時,SMB 和 VMG 依然存在顯著不為零的定價錯誤(p-value 是 10 的 -13 次方這個量級)。這意味著 SMB 和 VMG 優(yōu)于 FFSMB 和 FFHML。
Mean-Variance Spanning tests 考察 n 個已知資產構建的 mean-variance 有效前沿能否包含某個新資產(Huberman and Kandel 1987)。在比較兩個多因子模型時,使用每個模型的因子構建有效前沿,并逐一檢驗其能否包含另一個模型中的因子。舉個例子。《美股上一個跨越時間尺度的趨勢因子》介紹了一個新的趨勢因子??紤]新的趨勢因子和三個已有因子(SREV、MOM 以及 LREV)的回歸模型如下:
該檢驗的 null hypothesis 是:
檢驗結果顯著的拒絕原假設,說明已有三因子無法解釋新的趨勢因子。最后來看看 Bayesian approach。假設比較兩個多因子模型 M_1 和 M_2;相關數據集用 D 表示。令 prob(M_1) 和 prob(M_2) 為這兩個模型的先驗概率,且有 prob(M_1) + prob(M_2) = 1(這里假設把多個模型兩兩比較)。根據貝葉斯定理有:
其中:
上式中,prob(θ_i) 是模型 i 參數的先驗分布,prob(D|θ_i) 是模型 i 的似然函數。上述貝葉斯方法的核心在于確定 prob(θ_i)。根據 Pastor and Stambaugh (2000) 以及 Barillas and Shanken (2018) 的理論,它和以兩個模型中的全部因子作為資產所構成的投資組合的預期最大夏普率的平方與市場夏普率的比值有關。使用貝葉斯方法,Stambaugh and Yuan (2016) 比較了他們的四因子模型(記為 M-4)和 Fama-French 五因子模型(記為 FF-5)以及 Hou-Xue-Zhang 四因子模型(記為 q-4)。下圖中,左圖是 M-4 和 FF-5 模型的比較;右圖是 M-4 和 q-4 模型的比較。圖中,橫坐標均為先驗,即兩模型中全部因子能達到的最大預期夏普率平方和市場夏普率的比值;縱坐標為不同模型的后驗概率。
結果說明,當先驗這個比值分別大于 1.05 和 1.2 的時候,M-4 因子模型就分別強于 FF-5 和 q-4 模型。顯然,使用多個因子得到的最大夏普率很容易是市場夏普率的 1.05 或 1.2 倍,意味著數據更加傾向于支持 M-4 模型。需要特別強調的是,無論采用哪種方法,比較多因子模型的目的是為了得到新的啟發(fā),而非一定要排個一二三四。這些因子模型之間孰優(yōu)孰劣并無定論,它們的提出豐富了我們對于 empirical asset pricing 的理解并指導著因子投資。
5 模型復雜度討論
在結束本文之前,再來簡單討論下構建因子模型時遵循的 The Law of Parsimony。在美國金融協會 2018 年的年會上,Daniel, Hirshleifer and Sun (2018) 報告了他們的復合因子模型,并對模型復雜度和模型的解釋效果做了探討,頗有新意。具體的,他們提出了兩個 Parsimony Index,通過懲罰因子和用于構建因子的指標個數來計算模型復雜度。
第一個 Parsimony Index = 零減去模型中所有因子使用的全部指標數之和;由此可知該 index 取值為負,越大(即越接近零)說明模型越簡單。如果一個指標被用于多個因子中,則在計算該 index 時需要多次計算它。
第二個 Parsimony Index = 零減去模型中的因子和指標個數之和;同上,該 index 取值為負,越大(即越接近零)說明模型越簡單。它和前者的區(qū)別為:(1)除指標外,也考慮了對因子個數的懲罰;(2)如果某指標被用于多個因子中,其只被計算一次。
按照上述定義,本文第四節(jié)介紹的主流因子模型的兩個 Parsimony Index 取值分別為:
使用上述 7 個因子模型來檢驗 34 個異象,根據 5% 顯著性水平下顯著的異象的個數以及所有異象的平均 α 收益率的絕對值分別作為模型解釋力度,最后將模型解釋力度和這兩個 Parsimony Index 分別做回歸以觀察解釋度和模型復雜度之間的關系。結果如下。以 5% 顯著性水平的異象個數作為解釋力度:
以全部異象平均 |α| 為解釋力度:
隨著模型復雜度的提升(表現為 Parsimony Index 的取值更?。?,模型的解釋力度上升(體現為 5% 顯著性下的異象變少和異象平均 |α| 降低)。這個結論符合預期,它也再次強調了不同因子模型之間的好壞并無定論 —— 我們總能通過增加模型復雜度來提升模型(樣本內)的解釋效果,因此需要在模型復雜度和樣本內的解釋力度之間取舍。在 The Law of Parsimony 的指導思想下,一個優(yōu)秀的因子模型通常有較少的因子或者基本面或量價特征;而作為使用者,我們應該盡量搞清楚每一個因子背后代表的風險。
6 結語
這篇文章沒有告訴你哪個異象能賺取 α。這篇文章沒有告訴你哪個因子能賺取高性價比的 β。這篇文章也沒有告訴你哪家的多因子模型更勝一籌。
OK, enough for “自我否定”。既然如此,為什么要寫這篇文章呢?如今,學術論文和賣方報告中開發(fā)出新“因子”的速度已遠超我能理解、消化的速度。以學術界的 447 個異象為例,如果每周寫一篇介紹一個,要寫 9 年。異象被當作“因子”來使用,但它背后往往沒有合理的金融學解釋(即無法代表合理的系統(tǒng)性風險),或者沒有用已有因子對其分析從而評判它對解釋股票預期收益率截面差異的增量貢獻,僅僅是數據挖掘的產物。它們中大多數根本不是因子,甚至連異象都談不上。出于這個原因,我希望能介紹一些方法,幫助因子投資的踐行者去偽存真。這就是寫作本文的初衷。
這篇文章回答了開篇提出的五個問題;解釋了異象、因子以及多因子模型的區(qū)別和聯系;梳理了從異象到因子再到模型,一步步使用多因子模型背后的邏輯;介紹了學術界在研究多因子時使用的主流統(tǒng)計手段。希望它能夠作為一個完善的工具箱,為你的多因子研究和投資添一分助力。
參考文獻
Barillas, F. and J. Shanken (2018). Comparing asset pricing models. Journal of Finance 73(2), 715 – 754.
Carhart, M. M. (1997). On persistence in mutual fund performance. Journal of Finance 52(1), 57 – 82.
Daniel, K. D., D. A. Hirshleifer and L. Sun (2018). Short- and long-horizon behavioral factors. Columbia Business School Research Paper No. 18-5.
Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics 33(1), 3 – 56.
Fama, E. F. and K. R. French (2015). A five-factor asset pricing model. Journal of Financial Economics 116(1), 1 – 22.
Fama, E. F. and J. D. MacBeth (1973). Risk, return, and equilibrium: Empirical tests. Journal of Political Economy 81(3), 607 – 636.
Green, J., J. R. M. Hand and X. F. Zhang (2017). The characteristics that provide independent information about average U.S. monthly stock returns.?Review of Financial Studies 30(12), 4389 – 4436.
Gibbons, M. R., S. A. Ross and J. Shanken (1989). A test of the efficiency of a given portfolio.?Econometrica 57(5), 1121 – 1152.
Harvey, C. R., Y. Liu and H. Zhu (2016). … and the cross-section of expected returns.?Review of Financial Studies 29(1), 5 – 68.
Hou, K., C. Xue and L. Zhang (2015). Digesting anomalies: An investment approach. Review of Financial Studies 28(3), 650 – 705.
Hou, K., C. Xue and L. Zhang (2017). Replicating Anomalies. Fisher College of Business Working Paper No. 2017-03-010; Charles A. Dice Center Working Paper No. 2017-10.
Huberman G. and S. Kandel (1987). Mean-variance spanning.?Journal of Finance 42(4), 873 – 888.
Lee, C. M. C., S. T. Sun, R. Wang and R. Zhang (2018). Technological Links and Return Predictability.?Journal of Financial Economics forthcoming.
Linnainmaa, J. T. and M. R. Roberts (2018). The history of the cross-section of stock returns.?Review of Financial Studies 31(7), 2606 – 2649.
Liu, J., R. F. Stambaugh and Y. Yuan (2018). Size and Value in China.?Journal of Financial Economics forthcoming.
Novy-Marx, R. (2013). The other side of value: The gross profitability premium. Journal of Financial Economics 108(1), 1 – 28.
Pastor, L. and R. F. Stambaugh (2000). Comparing asset pricing models: an investment perspective. Journal of Financial Economics 56(3), 335 – 381.
Stambaugh, R. F. and Y. Yuan (2016). Mispricing Factors. Review of Financial Studies 30(4), 1270 – 1315.
免責聲明:入市有風險,投資需謹慎。在任何情況下,本文的內容、信息及數據或所表述的意見并不構成對任何人的投資建議。在任何情況下,本文作者及所屬機構不對任何人因使用本文的任何內容所引致的任何損失負任何責任。除特別說明外,文中圖表均直接或間接來自于相應論文,僅為介紹之用,版權歸原作者和期刊所有。