在线看片免费人成视久网,无码日本被黑人强伦姧视频 ,中日产幕无线码一区,无码精品av久久久免费

Barra 因子模型截面回歸求解

發(fā)布時間:2018-07-17  |   來源: 川總寫量化

作者:石川

摘要:Barra 因子模型求解采用了帶權(quán)重和約束條件的最小二乘回歸。本文解釋這個回歸求解的數(shù)學(xué)過程,并通過簡單實(shí)證說明求解的正確性。


1 引言


我似乎對 Barra 的因子模型過分鐘愛了?


That was a joke.


鐘愛談不上,Barra 的模型在中國市場有多大作用、在什么使用情景下有用(因?yàn)闆]有可投資性,它無法直接用來選股)也仍在摸索中。但是,這么多年一代代模型的推出和改進(jìn)代表著 Barra 自身的思考;一步步的構(gòu)建一個逐步完善的多因子投資體系。這個框架足以引發(fā)我們的思考并學(xué)習(xí)。


之前我們分三篇文章介紹了 Barra 的因子模型,它們分別是《正確理解 Barra 的純因子模型》、《協(xié)方差矩陣的 Newey-West 調(diào)整》、《Barra 因子模型中的風(fēng)險調(diào)整》。這些文章雖然對模型介紹的比較細(xì),但一直忽視了一個問題 —— 模型的求解。Barra 因子模型求解采用了帶權(quán)重約束條件的最小二乘回歸,求解起來并不是那么直觀,有一定的復(fù)雜性。所以本文就來介紹截面回歸的求解過程。


在那之前,我們再次來重申截面回歸所用到的暴露和收益率數(shù)據(jù)在時間上的關(guān)系。截面回歸的輸入顯然對求解至關(guān)重要。根據(jù) Barra Risk Model Handbook 的說明,因子暴露和因子收益率數(shù)據(jù)的正確解讀為:


... the previous steps have defined the exposures of each asset to the factors?at the beginning?of every period?in the estimation window. The factor excess returns?over the period?are then obtained via a cross-sectional regression of asset excess returns on their associated factor exposures ...


這意味著,對于給定某一期截面數(shù)據(jù)(記為 T 期),在截面回歸時使用 T 期股票(超額)收益率對期初(即 T - 1 期)因子暴露回歸。在 USE4 模型中,因子收益率是日頻的,因此截面回歸也應(yīng)該是日頻的,所以按照上述說明,在 T - 1 日結(jié)束后更新因子的暴露,并利用 T 日的股票收益率和因子暴露做截面回歸。下面就來介紹截面回歸的求解。


2 數(shù)學(xué)推導(dǎo)


在下文中,粗體小寫字母表示向量、粗體大寫字母表示矩陣。使用矩陣和向量,多因子模型可以表示為:


image.png


其中 X 是期初因子暴露矩陣。假設(shè)一共有 1 + P + Q = K 個因子(包括 1 個國家因子、P 個行業(yè)因子以及 Q 個風(fēng)格因子),則 X 是一個 N × K 階矩陣(其中 N 為股票個數(shù))。在行文中,我會不厭其煩的寫明矩陣的階數(shù),這有助于編程復(fù)現(xiàn)這個求解過程。具體的,


f2.png

下文中用 C 代表國家因子,在 X 中,所有股票在該因子上的暴露均為 1,因此 X 的第一列的所有元素都是 1。P 個行業(yè)因子用 I_1 到 I_P 表示;Q 個風(fēng)格因子用 S_1 到 S_Q 表示。r(N × 1 階)是當(dāng)期個股超額收益率向量;f(K × 1 階)是待求的當(dāng)期因子收益率向量,即 f = [f_C, f_{I_1}, …, f_{I_P}, f_{S_1}, …, f_{S_Q}]^T;u為 N × 1 階個股特異性收益率向量。Ω 為待求解的純因子投資組合權(quán)重矩陣。它是一個 K × N 階矩陣,它的每一行對應(yīng)某個因子的純因子投資組合中所有 N 支股票的權(quán)重。Ω 具體可以表達(dá)為:


f3.png


為了求解 Ω,我們還需要用到另外兩個矩陣,即回歸權(quán)重矩陣 V 和約束矩陣 R。約束矩陣對應(yīng)的是下面這個因?yàn)閲液托袠I(yè)共線性造成的約束條件(不考慮這個約束的話,截面回歸的求解不唯一):


f4.png

先來看看這個回歸權(quán)重矩陣 V 是什么。回歸權(quán)重矩陣 V 是一個 N × N 階對角陣,第 n 個對角元素代表著股票 n 的回歸權(quán)重 v_n。v_n 和股票 n 的市值 s_n(在本文第三節(jié)的實(shí)證中考慮流通市值)的平方根成正比,并滿足權(quán)重值和為 1。因此可得:


f5.png


V 的表達(dá)式為:


f6.png


Barra 采用回歸權(quán)重矩陣的初衷是為了降低個股特異性收益率的風(fēng)險對風(fēng)險因子收益估計的誤差。因此通過合理的回歸權(quán)重降低個股特異性風(fēng)險。關(guān)于這點(diǎn),Menchero et al. (2011) 中有相關(guān)的說明:


Factor returns in USE4 are estimated using?weighted least-squares regression, assuming that the variance of specific returns is?inversely proportional to the square root of total market capitalization. This regression-weighting scheme reflects the empirical observation that the idiosyncratic risk of a stock decreases as the market capitalization of the firm increases.


這段話的意思是,股票的特異性收益率的風(fēng)險是不同的。然而,股票的特異性風(fēng)險是不可測的。經(jīng)驗(yàn)表明,股票的特異性風(fēng)險與它的總市值平方根成反比。在構(gòu)建純因子投資組合時,應(yīng)該加以考慮這一點(diǎn)。這在數(shù)學(xué)上可以通過在回歸時,給股票加上基于特異性風(fēng)險的回歸權(quán)重,即帶權(quán)重的最小二乘回歸。基于上述考慮,Menchero (2010) 指出回歸權(quán)重應(yīng)該和市值的平方根成正比


In order to reduce estimation error in the factor returns, regression weights are used so that "noisy" stocks (i.e., those with high specific risk) are down-weighted. In practice,?regression weights are often taken as proportional to the square root of market capitalization, although other weighting schemes are possible.


這就是使用回歸權(quán)重矩陣 V 的意義。再來看看約束矩陣 R。約束矩陣 R 是代表上文提到的約束條件(即所有行業(yè)的因子組合收益率線性相關(guān))在求解時對行業(yè)因子收益率的限制條件。根據(jù) Ruud (2000) 提出的理論,K 個因子收益率之間的約束條件(在此我們僅有一個約束條件)可以由以下等式表達(dá):


f7.png

上式中,等號右邊的矩陣就是約束矩陣 R,它是一個 K × K - 1 階矩陣,這是因?yàn)樗?K 個因子收益率變量之間有一個約束條件,因此它們的自由度為 K - 1。不失一般性,在構(gòu)造 R 時,我們將行業(yè) P 的因子組合收益率 f_{I_P} 用其他行業(yè)的收益率的線性組合來表達(dá)。在有了 X,R 以及 V 之后,利用帶權(quán)重、帶約束條件的最小二乘回歸求解即可得到純因子投資組合的股票權(quán)重矩陣 Ω。以下求解公式來自 Menchero and Lee (2015) 中附錄 A 的 (A.7) 式,感興趣的朋友可進(jìn)一步參考。


f8.png

其中 -1 表示矩陣的逆矩陣。由前文可知,Ω 的每一行是一個 1 × N 向量;它就代表著第 k 個因子的純因子投資組合中所有股票的權(quán)重。得到 Ω 之后,可通過下式計算出所有因子在當(dāng)期的因子收益率:


f9.png


以上就是 Barra 因子模型截面回歸的求解。


3 簡單實(shí)證


本節(jié)對上述求解過程做一個簡單的實(shí)證,最主要的目的是檢驗(yàn) Ω 求解公式是否正確。此外,通過構(gòu)建的純因子組合,我們也可以驗(yàn)證在《正確理解 Barra 的純因子模型》談到的三類因子(國家因子、行業(yè)因子、風(fēng)格因子)的特性是否成立。我們選用中證 500 指數(shù)的成分股在 2016 年 5 月 31 日的截面數(shù)據(jù)和這些股票在 2016 年 6 月 1 日的收益率作為回歸的輸入。除國家因子外,行業(yè)因子考慮了 27 個申萬行業(yè),并考慮以下 11 種風(fēng)格因子(再次重申,本實(shí)證的目的是為了驗(yàn)證 Ω 的求解,因此對于如何構(gòu)建這些風(fēng)格因子不做描述):GROWTH,EP,BP,LIQ,SCALE,SCALENL,BETA,RESIDSTD,MOM,REV 以及 LIB2ASSET。根據(jù)上一節(jié)的求解方法,得到這 39 個因子(1 個國家 + 27 個行業(yè) + 11 個風(fēng)格)的投資組合在 2016 年 6 月 1 日的因子收益率如下。


f10.png


觀察不同因子的收益率可知,它們的數(shù)量級大致相當(dāng)。結(jié)果顯示,國家因子的收益率為 0.429%,當(dāng)日中證 500 的收益率是 0.44%。這兩個數(shù)字滿足《正確理解 Barra 的純因子模型》提到的國家因子組合近似的等于市場組合。比較國家因子組合中個股的權(quán)重和中證 500 指數(shù)中個股權(quán)重,權(quán)重差別的均值為 3.2%,權(quán)重差別的分布如下圖所示(提醒,這僅僅是當(dāng)期的結(jié)果):


f11.png


再來看看行業(yè)因子收益率。行業(yè)因子投資 100% 做多該行業(yè),100% 做空市場,因此它表示行業(yè)相對市場的超額收益。然而,行業(yè)因子的投資組合收益率并不等于申萬這些行業(yè)指數(shù)和中證 500 指數(shù)收益率的差值。這是因?yàn)樾袠I(yè)純因子投資組合對所有風(fēng)格因子的暴露為零,而申萬行業(yè)指數(shù)無法滿足這個限制,所以二者中個股的權(quán)重是不同的,因此它們的收益率也會有出入。


使用因子投資組合的權(quán)重矩陣 Ω(K × N 階)乘以當(dāng)期的因子暴露矩陣 X(N × K 階),就得到一個 K × K 階的矩陣,該矩陣的每一行都是其對應(yīng)的因子投資組合在其他因子上的暴露。檢查這個矩陣的結(jié)果可以幫助我們檢驗(yàn) Barra 純因子組合的性質(zhì)。下圖就是 Ω 乘以 X 得到的矩陣。


f12.png


圖中(看的不是太清楚,我盡量解釋),排除列名所在的最上面一行不考慮,第一行是國家因子;藍(lán)色長方形框出來的部分是行業(yè)因子;紅色長方形框出來的部分是風(fēng)格因子。白色的單元格表示的數(shù)字是 0 —— 因此我們很容易看出,國家因子和任一個行業(yè)因子組合在所有風(fēng)格因子上的暴露都是 0;而任何一個風(fēng)格因子純因子組合在國家、所有行業(yè)以及其他風(fēng)格因子上的暴露也都是 0。


下面再來具體看看不是零的單元格(我們從圖中分別針對國家和行業(yè)因子、以及風(fēng)格因子截取一部分解釋)。下圖顯示了該矩陣左上角的部分,包括國家因子和幾個行業(yè)因子。第一行(除了列名外)為國家因子,每一列對應(yīng)的單元格中的數(shù)字是國家因子在相應(yīng)因子上的暴露??梢?,國家因子對自身的暴露為 1,因?yàn)樗频牡扔谑袌?,而市場包含了所有行業(yè),因此它在每個行業(yè)上都有一定程度的暴露(比如,國家因子在 801010 行業(yè)上的暴露為 0.033,在 801020 行業(yè)上的暴露為 0.020)。


f13.png


再來看看行業(yè)因子。以 801010 這個行業(yè)為例(即排除列名外的第二行)。前文反復(fù)強(qiáng)調(diào)過,行業(yè)的純因子組合等價于 100% 做多該行業(yè),100% 做空國家因子。因此,對于 801010 這個行業(yè)來說,它在所有行業(yè)(包括它自己)上的暴露應(yīng)該是行向量 [1, 0, 0, … ,0](第一個 1 代表對它自己的 100% 多頭)和國家因子在這些行業(yè)上的暴露 —— 即向量 [0.033, 0.020, 0.059, … ] —— 的(做差就相當(dāng)于做空國家因子):[1, 0, 0, … ,0] - [0.033, 0.020, 0.059, … ] = [0.967, -0.020, -0.059, …]。而如果我們考察 801010 所在的第二行的數(shù)值,則上面計算得到的這個向量 [0.967, -0.020, -0.059, …](忽略計算誤差)中的數(shù)值正是對應(yīng) 801010 在不同行業(yè)(包括它自己)上的暴露!


擴(kuò)展一下上述結(jié)論,對于給定的行業(yè),它在其他行業(yè)的暴露等于向量 [0, 0, …, 0, 1, 0, …, 0] —— 假設(shè)該行業(yè)在所有行業(yè)中的位置為 p,則這個向量中的位置 p1,其他位置為?0 —— 與國家因子在這些行業(yè)上的暴露向量之差。這也解釋了為什么在上圖中我們觀察到,任何其他行業(yè)在行業(yè) p 上的暴露都相等(在誤差范圍內(nèi)),且等于國家因子在行業(yè) p 上暴露加個負(fù)號。最后來看看風(fēng)格因子的純因子組合。下圖證實(shí),對于每個風(fēng)格因子,其純因子組合只對它本身有 1 個單位的暴露,而對其他風(fēng)格因子沒有任何暴露。


f14.png


以上我們從多個角度檢驗(yàn)了截面回歸的求解結(jié)果。得到的數(shù)據(jù)和 Barra 對于純因子組合的構(gòu)建相符合,這說明了 Ω 求解過程的正確性。


4 結(jié)語


本文介紹了截面回歸的求解。結(jié)合之前的幾篇文章,對 Barra 模型的介紹基本比較完整了。然而,我們對它的思考和實(shí)踐應(yīng)遠(yuǎn)不止于此。在國內(nèi)的一些優(yōu)秀券商金工報告中,已經(jīng)開始使用最優(yōu)化的思想,加上各種可投資性的限制,利用 Barra 的這套純因子模型來構(gòu)建投資組合了。這無疑是一種很好的嘗試。另外,有朋友反饋說,使用了 Newey-West 調(diào)整后,協(xié)方差矩陣的 bias statistic 反而變差。還有其他各種各樣的問題。在我自己的實(shí)踐中,尚未遇到所有小伙伴們遇到的問題,因此暫時無法對所有問題都給出靠譜的評論。


無論我們是否使用 Barra 模型,最重要的是理解它內(nèi)在的含義和它使用的各種統(tǒng)計手段。切莫把 Barra 當(dāng)作多因子投資的“標(biāo)準(zhǔn)姿勢”,誤以為把它套用到 A 股數(shù)據(jù)上就會產(chǎn)生什么神奇的化學(xué)反應(yīng)。那無疑是本末倒置。正確的做法是理解其含義,并針對 A 股數(shù)據(jù)的特點(diǎn)有的放矢、靈活應(yīng)用。我們愿在踐行多因子選股的道路上與各位相伴,為找到收益風(fēng)險比更佳的投資組合而努力。



參考文獻(xiàn)

Menchero, J. (2010). Characteristics of Factor Portfolios. MSCI Barra Research Notes.

Menchero, J., D. J. Orr, and J. Wang (2011). The Barra US Equity Model (USE4). MSCI Barra Research Notes.

Menchero, J. and J.-H. Lee (2015). Efficiently combining multiple sources of alpha. The?Journal of Investment Management 13(4), 71 - 86.

Ruud, P. A. (2000).?An Introduction to Classical Econometric Theory. New York, NY: Oxford University Press.

Barra Risk Model Handbook (2007). MSCI.



免責(zé)聲明:入市有風(fēng)險,投資需謹(jǐn)慎。在任何情況下,本文的內(nèi)容、信息及數(shù)據(jù)或所表述的意見并不構(gòu)成對任何人的投資建議。在任何情況下,本文作者及所屬機(jī)構(gòu)不對任何人因使用本文的任何內(nèi)容所引致的任何損失負(fù)任何責(zé)任。除特別說明外,文中圖表均直接或間接來自于相應(yīng)論文,僅為介紹之用,版權(quán)歸原作者和期刊所有。