解釋股票截面預(yù)期收益差異的獨(dú)立因子
發(fā)布時(shí)間:2018-12-12 | 來(lái)源: 川總寫量化
作者:石川
摘要:Green, Hand and Zhang (2017) 通過(guò) Fama-MacBeth 回歸同時(shí)檢驗(yàn)了 94 個(gè)因子,發(fā)現(xiàn)其中 12 個(gè)是顯著的。
1 引言
在發(fā)表偏差(publication bias)的驅(qū)使下,多重檢驗(yàn)(multiple testing)已經(jīng)成為學(xué)術(shù)界在進(jìn)行 asset pricing 時(shí)的普遍做法。然而,很多發(fā)表于頂級(jí)期刊的所謂能夠解釋股票截面預(yù)期收益差異的因子都是虛假發(fā)現(xiàn)(見(jiàn)《出色不如走運(yùn)(II)?》)。針對(duì)這個(gè)問(wèn)題,2011 年,前美國(guó)金融協(xié)會(huì)主席 John Cochrane 教授在主席演講中向?qū)W術(shù)界提出挑戰(zhàn) —— 到底哪些因子能獨(dú)立解釋股票預(yù)期收益截面差異?
2017 年,一篇發(fā)表于頂刊 Review of Financial Studies 上的文章通過(guò)使用 Fama-MacBeth Regression (Fama and MacBeth 1973)同時(shí)檢驗(yàn) 94 個(gè)學(xué)術(shù)界發(fā)表的異象回答了這個(gè)問(wèn)題(Green, Hand and Zhang 2017,下文記為 GHZ)。
事實(shí)上,這并不是學(xué)術(shù)界就此問(wèn)題的唯一嘗試。比如,Harvey and Liu (2018) 提出了一個(gè)基于回歸的框架來(lái)排除運(yùn)氣的成分以便檢驗(yàn)真正有效的因子。不過(guò) Harvey and Liu (2018) 這篇文章的核心內(nèi)容是介紹他們提出的方法而非實(shí)證結(jié)果。而 GHZ 的研究指出了美股上真正有效的因子,具有更高的實(shí)證價(jià)值。無(wú)論是這些因子還是 GHZ 使用的方法對(duì) A 股都有不小的借鑒意義。本文就來(lái)介紹 GHZ 這篇論文。
2 數(shù)據(jù)和因子
在研究中,GHZ 利用了 CRSP,Compustat 以及 I/B/E/S 數(shù)據(jù)庫(kù)的數(shù)據(jù)首先挑選出了 102 個(gè)因子,回測(cè)時(shí)間是 1980 年 1 月到 2014 年 12 月,頻率為月頻?;販y(cè)期之所以從 1980 年開始是由上市公司基本面數(shù)據(jù)的可得性決定的;同時(shí)包含 NYSE、AMEX 以及 NASDAQ 的上市公司。除此之外,GHZ 的特別之處是考慮了微小市值公司對(duì)評(píng)價(jià)因子有效性時(shí)的影響。為此,他們將所有股票根據(jù)市值分成三擋:
1. 市值超過(guò)中位數(shù)的股票為大市值組;
2. 市值在中位數(shù)和 20% 分位數(shù)之間的為小市值組;
3. 市值在 20% 分位數(shù)之下的為微小市值(microcap)組。
微小市值的這些股票的市值之和僅占所有股票總市值的 3%。為了避免回歸分析時(shí)對(duì)它們過(guò)度加權(quán),GHZ 采取了兩種回歸方法:
1. 對(duì)所有股票采用市值加權(quán)最小二乘法(VWLS);
2. 對(duì)前兩組的股票(即所有股票中排除微小市值組)采取普通最小二乘法(OLS)。
作者認(rèn)為上述兩種方法能夠更合理的找到有效因子,并通過(guò)合并這兩種回歸的結(jié)果確定最終的顯著因子。作為比較 —— 同時(shí)也是為了說(shuō)明過(guò)度加權(quán)微小市值股票的危害 —— GHZ 也同樣對(duì)所有的股票進(jìn)行了 OLS 回歸。不出意外,由于微小市值股票存在造成的偏誤,這種方法能夠發(fā)現(xiàn)更多的“有效”因子,但很多因子在非微小市值股票上并不顯著。
在進(jìn)行多因子同時(shí)回歸時(shí),因子間的共線性是必須考慮的問(wèn)題。共線性會(huì)造成因子收益率標(biāo)準(zhǔn)誤(standard error)的巨大誤差,從而無(wú)法有效的評(píng)價(jià)因子是否顯著(見(jiàn)《為什么要進(jìn)行因子正交化處理?》)。GHZ 使用 variance inflation factors(VIF)對(duì)因子進(jìn)行了初步篩選,并剔除了 8 個(gè) VIF 高于 7 的因子(下圖),最終從 102 個(gè)因子中選出了 94 個(gè)待評(píng)價(jià)的因子。這 94 個(gè)因子的平均相關(guān)系數(shù)為 0.07。
同時(shí)檢驗(yàn) 94 個(gè)因子屬于 multiple testing 的問(wèn)題。為避免過(guò)擬合,GHZ 對(duì)回歸分析得到的單個(gè)因子 p-value 進(jìn)行了以控制 false discovery rate為目標(biāo)的調(diào)整,具體使用的方法為 BHY 修正(Benjamini and Yekutieli 2001,見(jiàn)《出色不如走運(yùn)(II)?》)。GHZ 以調(diào)整后的 p-value 小于 0.05 作為因子顯著的準(zhǔn)則。
除了調(diào)整后的 p-value 之外,GHZ 也同時(shí)計(jì)算了每個(gè)因子的 t-statistic。Harvey et al. (2016) 指出由于 multiple testing 的問(wèn)題,單個(gè)因子的 t-statistic(的絕對(duì)值)至少要大于 3 才可能顯著。GHZ 也以此為顯著性準(zhǔn)則匯報(bào)了顯著性因子的個(gè)數(shù)。該準(zhǔn)則比調(diào)整后 p-value 小于 0.05 要弱一些,因此找到了更多的因子。
下面就來(lái)看看實(shí)證結(jié)果。
3 單個(gè)因子檢驗(yàn)
在同時(shí)對(duì) 94 個(gè)因子進(jìn)行檢驗(yàn)之前,GHZ 首先對(duì)每個(gè)因子進(jìn)行了單獨(dú)檢驗(yàn)。作者這么做的目的是希望通過(guò)單獨(dú)檢驗(yàn)和共同檢驗(yàn)分別找出顯著性的因子,以此比較這兩種方法找到的因子是否一致,這可能會(huì)對(duì)未來(lái)的 asset pricing 研究帶來(lái)一些啟發(fā)和靈感。在單個(gè)因子檢驗(yàn)中,截面回歸方程的左側(cè)是個(gè)股的收益率,右側(cè)是目標(biāo)因子和其他控制變量。根據(jù)有無(wú)控制變量,單個(gè)因子的檢驗(yàn)一共有以下四個(gè)版本:
1. 僅有單個(gè)目標(biāo)因子,無(wú)其他控制變量;
2. 除了單個(gè)目標(biāo)因子外,還包括四因子模型(Fama and French 1993 的三因子 + Carhart 1997 的動(dòng)量因子);
3. 除了單個(gè)目標(biāo)因子外,還包括 Fama-French 五因子模型(Fama and French 2015);
4. 除了單個(gè)目標(biāo)因子外,還包括 Hou et al. (2015) 的因子模型。
對(duì)每一個(gè)版本,通過(guò)在每期用因子暴露和下一期的個(gè)股收益率截面回歸得到因子收益率,然后使用因子收益率的時(shí)序?qū)σ蜃语@著性進(jìn)行分析,計(jì)算得到調(diào)整后的 p-value 以及 t-statistic,使用 p-value 是否小于 0.05 或 t-statistic 絕對(duì)值是否大于 3.0 為基準(zhǔn)決定真正顯著的獨(dú)立因子。在回歸時(shí),考慮了本文前一節(jié)提到的三種方法 —— 對(duì)所有股票進(jìn)行 VWLS,對(duì)非微小市值股票進(jìn)行 OLS,以及(作為“反面教材”的)對(duì)所有股票進(jìn)行 OLS。為了方便在下文中介紹結(jié)果,將前兩種回歸稱為 GHZ 回歸。
單個(gè)因子檢驗(yàn)的結(jié)果如下(由于 94 個(gè)因子太多,故節(jié)選部分):
上圖中最重要的部分是紅色標(biāo)記的地方 —— 即使用調(diào)整后 p-value 小于 0.05 為基準(zhǔn)確定的顯著因子個(gè)數(shù)。在沒(méi)有控制變量的模型中(column A),GHZ 回歸一共找到了 12 個(gè)顯著因子;作為對(duì)比,由于微小市值股票的影響,對(duì)所有股票的 OLS 回歸發(fā)現(xiàn)了 30 個(gè)顯著因子。這說(shuō)明 18 個(gè)因子在非微小市值股票上是無(wú)效的。其他帶控制變量的回歸(columns B to D)也有類似的結(jié)果。
在沒(méi)有控制變量的模型中,通過(guò)單個(gè)因子回歸分析發(fā)現(xiàn)的顯著因子包括:
1. 總資產(chǎn)增長(zhǎng)率(asset growth);
2. 經(jīng)行業(yè)調(diào)整的銷售收入增長(zhǎng)率(growth in industry-adjusted sales);
3. 流通股本變動(dòng)百分比(growth in shares outstanding);
4. 存貨變動(dòng)(growth in inventory);
5. 盈余公告宣告收益(earnings announcement return);
6. 賬面價(jià)值增長(zhǎng)率(growth in book value of equity);
7. 資本支出增長(zhǎng)率(growth in CAPEX);
8. 長(zhǎng)期凈營(yíng)運(yùn)資產(chǎn)增長(zhǎng)率(growth in long-term net operating assets);
9. 機(jī)器設(shè)備廠房存貨增長(zhǎng)率(growth in PP&E plus inventory);
10. 盈利同比增長(zhǎng)的季度數(shù)(number of consecutive quarters with earnings higher than the same quarter a year ago);
11. 銷售收入與存貨差的增長(zhǎng)率(growth in sales less growth in inventory);
12. 標(biāo)準(zhǔn)化的未預(yù)期盈余(standardized unexpected quarterly earnings)。
以上通過(guò)單個(gè)檢驗(yàn)從 94 個(gè)發(fā)表于學(xué)術(shù)期刊的顯著因子中選出了 12 個(gè),這些因子是經(jīng)過(guò) multiple testing 調(diào)整后仍然有效的。下面就來(lái)看看對(duì)這 94 個(gè)因子同時(shí)回歸會(huì)得到怎樣的結(jié)果。
4 多個(gè)因子共同檢驗(yàn)
在共同檢驗(yàn)時(shí),GHZ 將所有 94 個(gè)因子同時(shí)放入回歸方程的右側(cè),進(jìn)行 Fama-MacBeth regression。和上一節(jié)一樣,仍然使用三種回歸方法。結(jié)果(節(jié)選)如下:
根據(jù) p-value 基準(zhǔn),在對(duì)所有股票進(jìn)行 VWLS 時(shí),一共發(fā)現(xiàn)了 6 個(gè)顯著因子;在對(duì)非微小市值股票進(jìn)行 OLS 回歸時(shí),一共發(fā)現(xiàn)了 9 個(gè)顯著因子。將這兩個(gè)回歸的結(jié)果合并一共得到 12 個(gè)顯著因子。與之相對(duì)應(yīng)的是,在對(duì)所有股票進(jìn)行 OLS 回歸時(shí),由于微小市值的影響,一共發(fā)現(xiàn)了 23 個(gè)顯著因子。把 94 個(gè)因子共同檢驗(yàn)也發(fā)現(xiàn)了 12 個(gè)顯著因子,它們是:
1. 賬面市值比(book-to-market);
2. 現(xiàn)金(cash);
3. 分析師數(shù)量的變化(change in the number of analysts);
4. 盈余公告宣告收益(earnings announcement return);
5. 一個(gè)月的動(dòng)量(1-month momentum);
6. 六個(gè)月動(dòng)量的變化(change in 6-month momentum);
7. 盈利同比增長(zhǎng)的季度數(shù)量(number of consecutive quarters with earnings higher than the same quarter in a year ago);
8. 年度研發(fā)支出占市值的比重(annual R&D to market cap);
9. 收益波動(dòng)性(return volatility);
10. 股票換手率(share turnover);
11. 股票換手率的波動(dòng)性(volatility of share turnover);
12. 零交易的天數(shù)(zero trading days)。
雖然上一節(jié)的單一因子檢驗(yàn)和本節(jié)的共同檢驗(yàn)碰巧都發(fā)現(xiàn)了 12 個(gè)因子,但是仔細(xì)比較不難看出兩種方法找到的顯著因子中大部分并不相同。根據(jù) McLean and Pontiff (2016) 對(duì)因子分類的定義,在單一因子檢驗(yàn)中,10 個(gè)顯著的因子都是基本面因子;而在共同檢驗(yàn)時(shí),僅有盈利同比增長(zhǎng)的季度數(shù)量屬于基本面因子,剩余更多的是交易行為因子。
?
上述兩種檢驗(yàn)結(jié)果為今后的 asset pricing 傳遞出兩個(gè)重要信息:
1. 在排除了微小市值對(duì)回歸造成的偏誤以及修正了多重檢驗(yàn)的數(shù)據(jù)挖掘之后,真正顯著的因子個(gè)數(shù)很少;
2. 在 asset pricing 的研究中,在分析一個(gè)潛在異象時(shí),應(yīng)該選擇共同檢驗(yàn)發(fā)現(xiàn)的這些顯著因子作為控制變量來(lái)進(jìn)行研究。
5 樣本外投資組合收益率分析
在前兩節(jié)的研究中,這些顯著的因子是在整個(gè)回測(cè)期(1980 到 2014)期間發(fā)現(xiàn)的。它們也許對(duì) asset pricing 有幫助,但是上述結(jié)果無(wú)法說(shuō)明它們?cè)趯?shí)戰(zhàn)中是否有交易的價(jià)值 —— 我們不能回到過(guò)去交易這些在事后被證明有效的因子。
為了研究它們?cè)诮灰字惺欠衲軌驇?lái)超額收益,GHZ 采用了滾動(dòng)窗口使用因子選股并在樣本外構(gòu)建投資組合的方法。樣本外滾動(dòng)測(cè)試使用過(guò)去 10 年(120 個(gè)月)的數(shù)據(jù)來(lái)回歸,因此從 1990 年開始。在選股時(shí),由于同時(shí)考慮了多個(gè)因子,因此使用因子收益率來(lái)預(yù)測(cè)個(gè)股在下一期的收益率,并使用預(yù)期收益率的高低構(gòu)建多空對(duì)沖的投資組合(做多預(yù)期收益率最高的 10%、做空預(yù)期收益率最低的 10%)。實(shí)證中一共考察了三種不同的投資組合(三個(gè)組合的區(qū)別是對(duì)小市值股票的權(quán)重依次提升)。當(dāng)使用全部 94 個(gè)因子進(jìn)行滾動(dòng)回歸時(shí),不同投資組合的收益率如下圖所示。隨著小市值比重的增加,投資組合的收益率逐漸增大。
如果不使用全部 94 個(gè)因子,而僅僅使用 GHZ 通過(guò)共同檢驗(yàn)找出的 12 個(gè)獨(dú)立因子會(huì)怎樣呢?下圖給出了答案。
可以很明顯的看到,僅僅使用 12 個(gè)獨(dú)立因子顯著降低了投資組合的收益率。這意味著我們好不容易辛辛苦苦找出了 12 個(gè)對(duì)解釋 asset pricing 有效的獨(dú)立因子,但是從實(shí)戰(zhàn)選股的角度來(lái)說(shuō),這卻不如使用全部 94 個(gè)因子 —— 不管它們是不是過(guò)擬合。如何解釋這種現(xiàn)象呢?GHZ 這篇文章并沒(méi)有對(duì)此進(jìn)行過(guò)多的討論。就我的理解,上述結(jié)果說(shuō)明了兩點(diǎn):
1. 這 12 個(gè)因子在整個(gè)回測(cè)期內(nèi)顯著;當(dāng)使用滾動(dòng)窗口時(shí),不同的因子可能在不同歷史時(shí)期顯著,因此使用 94 個(gè)因子能夠更好的捕捉因子風(fēng)格的輪動(dòng)。
2. 實(shí)盤交易的目標(biāo)是為了獲得超額收益,而不是理解 asset pricing 的機(jī)制。對(duì)于選股模型來(lái)說(shuō),最核心的是對(duì)未來(lái)收益率的預(yù)測(cè)是否準(zhǔn)確,而非因子的收益率估計(jì)是否無(wú)偏。上面的結(jié)果說(shuō)明使用更多的因子提高了樣本外收益率預(yù)測(cè)的準(zhǔn)確性。
有必要指出的是,上面的實(shí)證結(jié)果并沒(méi)有考慮實(shí)際交易中的手續(xù)費(fèi)等問(wèn)題,且同時(shí)使用 94 個(gè)因子一定存在過(guò)擬合的問(wèn)題。因此,雖然數(shù)據(jù)顯示 94 個(gè)因子比 12 個(gè)因子的效果更好,這也不意味著我們?cè)趯?shí)際交易中一定能取得顯著的優(yōu)勢(shì)。
6 2003 前后的差異
GHZ 這篇文章研究的最后一個(gè)部分發(fā)現(xiàn)因子在 2003 年前后截然不同的表現(xiàn) —— 因子對(duì)截面收益率差異的解釋力度驟然下降。上一節(jié)提到的三個(gè)樣本外投資組合的收益率在 2003 年前后的表現(xiàn)如下圖所示,前后出現(xiàn)了明顯的差異。這些投資組合的凈值曲線在 2003 年之后變得更加平坦。
在 2003 年之后,僅僅有 2 個(gè)因子仍然顯著,它們分別為盈利同比增長(zhǎng)的季度數(shù)量以及經(jīng)行業(yè)調(diào)整后的員工數(shù)。究其原因,GHZ 認(rèn)為在 2003 年之后,美股上的套利成本大幅降低造成了這種現(xiàn)象。2002 年 7 月,美國(guó)股市通過(guò)了 Sarbanes-Oxley 法案;同年 10 月,SEC 加速了對(duì)上市公司披露 10-Q 和 10-K 文件的要求。與此同時(shí),在 2003 年初(1 月到 5 月),紐交所引入自動(dòng)報(bào)價(jià)系統(tǒng),減少了交易的摩擦成本。這一系列變化極大降低了交易股票市場(chǎng)異象的量化對(duì)沖策略的成本和技術(shù)難度。無(wú)疑,2003 年前后的差異對(duì)于今后研究提出了挑戰(zhàn)。GHZ 也呼吁今后 asset pricing 的研究應(yīng)該給予 2003 年之后的數(shù)據(jù)更多的權(quán)重。
7 結(jié)語(yǔ)
研究因子時(shí)最艱難的部分往往是數(shù)據(jù)的準(zhǔn)備。一旦有了高質(zhì)量的數(shù)據(jù),各種用于檢驗(yàn)的回歸及其他統(tǒng)計(jì)手段是非常豐富的。作為一篇同時(shí)研究 94 個(gè)因子的文章,GHZ 的一個(gè)巨大貢獻(xiàn)在于因子數(shù)據(jù)的計(jì)算,以及為了計(jì)算因子而對(duì)公司基本面和交易數(shù)據(jù)的收集、整理。此外,GHZ 在截面回歸中用個(gè)股的收益率和這 94 個(gè)因子進(jìn)行回歸,可以想見(jiàn)計(jì)算量之巨大。這和 Harvey and Liu (2018) 中給出的簡(jiǎn)單例子完全不同。簡(jiǎn)單總結(jié)一下這篇文章給多因子投資實(shí)務(wù)的啟發(fā):
1. 分析時(shí)應(yīng)排除過(guò)度加權(quán)微小市值股票造成的偏差;
2. 真正顯著的因子很少,絕大部分其他因子都是數(shù)據(jù)挖掘的產(chǎn)物、或者能夠被這一小部分獨(dú)立因子解釋;
3. 共同檢驗(yàn)和單一檢驗(yàn)發(fā)現(xiàn)的顯著因子往往不同,前者的發(fā)現(xiàn)更有效;
4. 因子投資和資產(chǎn)定價(jià)的目標(biāo)不同;前者是為了提高樣本外預(yù)測(cè)的準(zhǔn)確性,后者是為了確保因子收益率的無(wú)偏估計(jì);在投資實(shí)務(wù)中,更應(yīng)該注重前者,但也要考慮實(shí)際的交易限制和成本。
GHZ 通過(guò)同時(shí)回歸找到的 12 個(gè)因子雖然是針對(duì)美股,但很多在 A 股上也是有效的。此外,GHZ 使用多個(gè)因子同時(shí)進(jìn)行 Fama-MacBeth regression 的做法和 Barra 如出一轍。今后的研究會(huì)使用 Barra 中國(guó)股票模型中的風(fēng)格因子進(jìn)行類似的實(shí)證,檢驗(yàn)不同因子在 A 股上的顯著性,希望以此更好的指導(dǎo)我們?cè)?A 股上實(shí)踐因子投資。
參考文獻(xiàn)
Benjamini, Y. and D. Yekutieli (2001). The control of the false discovery rate in multiple testing under dependency.?Annals of Statistics 29, 1165 – 1188.
Carhart, M. M. (1997). On persistence in mutual fund performance. Journal of Finance 52(1), 57 – 82.
Cochrane, J. H. (2011). Presidential address: Discount rates.?Journal of Finance 66(4), 1047 – 1108.
Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics 33(1), 3 – 56.
Fama, E. F. and K. R. French (2015). A five-factor asset pricing model. Journal of Financial Economics 116(1), 1 – 22.
Fama, E. F. and J. D. MacBeth (1973). Risk, return, and equilibrium: Empirical tests. Journal of Political Economy 81(3), 607 – 636.
Harvey, C. R., Y. Liu, and H. Zhu (2016). … and the cross-section of expected returns. Review of Financial Studies 29(1), 5 – 68.
Harvey, C. R. and Y. Liu (2018). Lucky Factors. Working paper.
Hou, K., C. Xue, and L. Zhang (2015). Digesting anomalies: An investment approach. Review of Financial Studies 28(3), 650 – 705.
Green, J., J. R. M. Hand, and X. F. Zhang (2017). The characteristics that provide independent information about average U.S. monthly stock returns. Review of Financial Studies 30(12), 4389 – 4436.
McLean, R.D., J. Pontiff. (2016). Does academic research destroy stock return predictability? Journal of Finance 71(1), 5–32.
免責(zé)聲明:入市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見(jiàn)并不構(gòu)成對(duì)任何人的投資建議。在任何情況下,本文作者及所屬機(jī)構(gòu)不對(duì)任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說(shuō)明外,文中圖表均直接或間接來(lái)自于相應(yīng)論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。