官术网_书友最值得收藏!

2.2 多因子模型的回歸檢驗

使用2.1節介紹的排序法,人們可以很容易地針對股票風格因子構建因子投資組合并計算其收益率。然而,多因子模型中最核心的問題是檢驗一系列因子解釋異象的能力。本節就來說明如何使用回歸的方法檢驗多因子模型,其中涉及的不同方法包括時序回歸檢驗、截面回歸檢驗以及Fama and MacBeth(1973)回歸檢驗[1]。

在下文的介紹中,令NK分別代表資產和因子的個數。回顧一下本書第1章中的式(1.3),它指出資產預期(超額)收益和因子預期收益率之間滿足如下關系:

其中代表資產[2] i的超額收益,βi為資產iK維因子暴露向量;λK維因子預期收益率向量。多因子模型研究的核心問題是資產預期收益率在截面上——即不同的資產之間——為什么會有差異。根據模型(2.12),如果一個資產在因子上的暴露βi高,則它的預期收益也應該更高。

再來仔細品一品這句話,即多因子模型(2.12)研究的是資產預期收益率在截面上的差異。站在本書提出的統一視角下,這是從截面角度來研究多因子模型的。在檢驗模型(2.12)時,不關心資產的收益率在時間序列上是如何隨著每期因子收益率來波動的,只關心在截面上和對應的βi之間的關系,因為模型(2.12)是關于均值的模型。多因子模型中所包含的因子代表了收益率的一種結構。一旦結構給定后,個股或者任何一個投資組合的預期收益率就完全由它在這些因子上的暴露決定了——暴露高,預期收益率就高;預期收益率是因子暴露的線性函數。怎樣找到最好的因子結構,即哪些因子使得個股在截面上的預期收益率區分度高,并讓不能被該模型解釋的定價誤差αi部分盡可能低,就是多因子模型研究的問題。

仍然晦澀?用圖2.3解釋一下(因為要做圖,所以假設單因子模型)。圖中橫坐標為βi,縱坐標為,每個點代表一個資產。圖中這條直線就代表E[Ri]=βiλ,它的斜率λ就是因子的預期收益率。當模型不能被完美地滿足時,資產的預期收益率E[Ri]和模型算出的βiλ之間就會存在誤差,它就是圖中的αi

圖2.3 截面上股票預期收益率和風險暴露的關系

正如前文反復強調的,多因子模型反映的是預期收益率和因子暴露在截面上的關系。在多因子模型被提出之前,人們最熟悉的因子模型無疑是CAPM。它因為只有一個市場因子,所以是多因子模型的一個特例。人們最早的猜測是市場因子的收益率和個股在該因子上的β就可以解釋截面上不同股票收益率之間的區別。但大量的實證結果顯示如果把個股的和它們針對市場因子的βi畫出來,二者之間的關系并不能很好地滿足該模型,說明僅僅用單一市場因子無法很好地解釋在截面上的差別。為了反映這一現象,Black et al.(1972)在CAPM的基礎上又加入了一個zero-beta因子,該兩因子模型能夠更好地解釋在截面上的差別[3]。再后來,Fama and French(1993)提出了大名鼎鼎的三因子模型,它在市場因子的基礎上加入價值(HML)和規模(SMB)兩個因子。這些努力都是為了能夠更好地解釋人們在股票收益率數據中觀察到的在截面上的差別。

之所以回顧上面這一小段歷史,是為了說明學術界在多因子模型上的各種努力都是為了更好地解釋為什么會因資產而異。那么,拿來一個多因子模型,如何定量地評估它是否是一個好的模型呢?為了回答這個問題,首先來看檢驗中的三個部分:估計值(estimate)、標準誤(standard errors)以及檢驗(test),見表2.3。

表2.3 多因子模型檢驗的三個部分

對于截面關系式,下文將采用回歸分析(regression analysis)來確定。一旦有了估計值和標準誤,就可以用它們檢驗多因子模型。由式(2.12)可知,αi代表了資產i的定價誤差。如果能夠在統計上證明所有αi都很接近零,則可以說該多因子模型就是很好的模型,即它能夠解釋資產預期收益率的截面差異。由此可見,多因子模型的回歸檢驗中最重要的就是檢驗所有αi聯合起來是否在統計上足夠接近零。除此之外,使用λ的估計值和標準誤,同樣可以檢驗每個因子的預期收益率[4]。根據上述說明,多因子模型的回歸檢驗可以簡單總結為以下三步:

(1)計算每個資產在所有因子上的暴露βi

(2)通過回歸分析對多因子模型進行估計;

(3)聯合檢驗資產定價誤差αi以及每個因子的預期收益率λk

無論選擇哪些因子(諸如風格因子或宏觀經濟因子),也無論在確定截面關系時采用時序回歸還是截面回歸,對多因子模型的檢驗最終都可以按照上述三步完成。下面先來看看時間序列回歸檢驗。

2.2.1 時間序列回歸

時間序列回歸(time-series regression)簡單直接,Black et al.(1972)最早使用它來檢驗CAPM。這種方法在回歸時使用因子收益率作為自變量(independent variable)或解釋變量(explanatory variable),以資產的超額收益率作為因變量(dependent variable)或被解釋變量(explained variable)。

此方法更適合分析由風格因子構成的多因子模型,這是因為人們可以使用2.1節介紹的排序法構建風格因子的因子模擬投資組合,并計算其收益率作為解釋變量。對于其他類別的因子,比如GDP等宏觀經濟因子,由于難以應用排序法構建它的因子模擬投資組合以及計算收益率,所以這種方法就無法使用,舉例來說,Fama and French(1993)中的價值(HML)和規模(SMB)因子均是風格因子。該文使用獨立雙重排序構建了這兩個因子的投資組合,并計算了它們的收益率時間序列,使用它們就可以方便地進行時間序列回歸檢驗。

λt表示t期因子收益率向量,為資產it期的超額收益率,這二者在時序上滿足如下線性關系:

對每個資產i=1, 2, ···, N,使用簡單最小二乘(Ordinary Least Squares,OLS)對模型(2.13)進行參數估計。在時間序列回歸中,回歸方程右側自變量是因子收益率λt,左側的因變量是,回歸得到資產i在因子上的暴露向量,截距,以及殘差。一旦有了λt在時序上取均值就可得:

式中表示對樣本數據在時序上取均值;是資產預期收益率和因子暴露在截面上的關系式。時間序列回歸中的截距正是資產i的定價誤差的估計。由(2.14)可知,時間序列回歸的好處是可以方便地估計每個因子的預期收益率。對于任意因子k,其收益率序列λkt在時序上的均值就是因子k預期收益率的估計:

下面仍然以單因子這種最簡單的情況來畫圖,說明上述時間序列回歸得到的βi的截面關系長什么樣子。圖2.4中的直線為=βiλ:當βi=0時,=0;此外,如果用該模型解釋因子投資組合本身(即將因子投資組合視作一個資產放在截面關系式的左側),且根據定義因子投資組合在自身上的暴露為1(即βi=1),因而有λ=0+1×λ。以上論述說明,時間序列回歸得到的=βiλ這條直線一定會經過(0, 0)和(1, λ)兩點。

圖2.4 時序回歸示意圖

圖2.4中所有黑色的實心圓點代表著資產,空心的點代表著因子投資組合。時間序列回歸得到的多因子模型=βiλ就是經過原點和空心點的那條直線。所有資產到這條直線的距離就是資產的。需要特別強調的是,在使用時間序列回歸時,需對每個資產i分別獨立用多因子模型進行時序回歸。因此圖2.4中的這條直線并不是以最小化的平方和為目的求出的,這是時序回歸和本書2.2.2節介紹的截面回歸的最大差別(截面回歸是以最小化所有的平方和為目標的)。

有了時序回歸模型,下一步就是計算各種參數的標準誤,并進行檢驗。當隨機擾動εit不存在自相關(autocorrelation)或異方差(heteroskedasticity)時,時序回歸參數的標準誤可以由OLS的標準公式給出。進一步的,假設εit滿足IID正態分布[5],Michael Gibbons、Stephen Ross以及Jay Shanken在Gibbons et al.(1989)一文中給出了檢驗αi是否聯合為零的方法。即便到了今天,該方法仍然是學術界檢驗和比較因子模型時的首選方法,由于影響深遠,所以該方法也由三位教授姓氏的首字母命名為GRS檢驗。

在GRS檢驗中,原假設所有αi均為零。定義向量以及=。GRS檢驗構建了如下滿足自由度為T-N-KNF分布的檢驗統計量(稱為GRS test statistic):

有了檢驗統計量,只需要利用F分布計算出它的p-值就可以判斷是接受還是拒絕原假設。需要說明的是,一旦εit之間存在相關性或者異方差,傳統OLS的標準誤公式就是錯誤的,且上述檢驗統計量也是有問題的。在這種情況下,可以采用更強大的計量經濟學工具——比如廣義矩估計(2.7節會介紹)——來進行檢驗。盡管如此,GRS檢驗仍然是非常普及的一種方法。

除了檢驗αi是否聯合為零外,另一個目標是考察每個因子的預期收益率。由于時序回歸假設因子收益率的時間序列已知,因此只需要參照2.1.2節的介紹對每個因子的收益率進行t-檢驗即可,此處不再贅述。最后對時間序列回歸檢驗簡要總結如下。

(1)因子收益率時序需已知。使用因子收益率作為解釋變量,分別對每個資產進行時序回歸,得到該資產在這些因子上的暴露的估計;時序回歸中的(截距項)就是截面關系上資產的定價誤差。

(2)將時序回歸結果在時間上取均值,就得到資產預期收益率和因子暴露在截面上的關系。由于時序回歸是對每個資產單獨進行的,因此該關系的確定不以最小化所有的平方和為目標。

(3)若(2.13)中的εit滿足IID正態分布,則可以通過GRS方法構建F-統計量來檢驗αi聯合是否在統計上為零,否則可以通過廣義矩估計等更高級的方法;對于因子預期收益率,可使用t-檢驗來分析。

2.2.2 截面回歸

時間序列回歸雖然很方便,但它以因子收益率時序已知為前提。這意味著它更適合處理股票的風格因子,而對諸如GDP、CPI以及利率這樣的宏觀經濟因子無能為力。這時可以選擇截面回歸(cross-sectional regression)來檢驗多因子模型,它能夠方便地處理因子收益率時序未知的情況。截面回歸檢驗的最終目的自然還是考察βi在截面上的關系,但此方法的第一步仍然是利用時序回歸確定資產的因子暴露。

假設t期一組因子的取值為ft=[f1t, f2t, ···, fKt]′(K維階向量)。首先通過如下時序線性回歸模型確定因子暴露:

需要說明的是,在模型(2.17)中,截距項用了符號ai,而非像式(2.13)中的αi。這是因為如果模型(2.17)中的解釋變量不是因子收益率,則它的截距項就不是定價誤差。采用OLS對模型(2.17)進行估計,在得到資產的因子暴露。之后,進入本方法的第二步:截面回歸。在這一步中,使用第一步得到的因子暴露的估計作為解釋變量,以資產收益在截面上滿足的線性回歸模型為:

使用OLS求解模型(2.18)就可以得到因子預期收益率的估計,以及每個資產的定價誤差的估計。細心的讀者可能發現,在模型(2.18)中并沒有出現截距項,而是使用回歸的殘差直接作為定價誤差。這背后的原因是多因子模型假定當不存在模型設定偏誤時,資產的預期收益率應該僅由因子暴露和因子預期收益率決定。當然,公式是“死的”,應用是“活的”,Cochrane(2005)指出在進行模型(2.18)截面回歸時,也可以考慮包含截距項。加入截距項后,模型(2.18)變為:

仍以單因子為例,圖2.5展示了通過截面回歸得到的資產預期收益率和因子暴露的截面關系。如果使用OLS對模型(2.18)進行估計,則圖2.5中截面回歸得到的關系將通過原點并最小化所有殘差的平方和。

圖2.5 截面回歸示意圖

為了更方便地給出數學公式,定義全部N個資產在這K個因子上的因子暴露矩陣,它是N×K矩陣;定義N維向量,和N維向量。利用上述數學符號,截面回歸模型(2.18)的OLS估計量為:

為了聯合檢驗所有定價誤以及每個因子的預期收益率,僅知道是不夠的,還需要求出它們各自的標準誤。令εt=[ε1t, ε2t, ···, εNt]′(εit是時序線性模型(2.17)中的隨機擾動,且定義Σf≡cov(ft)以及Σ≡cov(εt),利用它們并假設ftεt之間相互獨立,且它們各自在時序上滿足獨立同分布,Cochrane(2005)給出了的協方差矩陣:

在實際中,由于真實的ΣΣf未知,故可采用殘差向量代替εt,計算樣本代替Σ,并使用樣本協方差矩陣代入式(2.22)和式(2.23)就得到協方差矩陣的估計。進一步利用它們計算標準誤即可進行檢驗。

盡管上述表達式看上去已經足夠復雜了,但仍有兩點需要簡單說明。第一,在截面回歸模型(2.18)中,作為解釋變量的因子暴露是從第一步時序回歸中得來的,它們是估計值而非真實值。對于模型(2.18)來說,被稱為生成的回歸變量(generated regressors)。因此在計算標準誤時,應該對生成回歸變量造成的誤差進行修正。對于此,Shanken(1992)給出了解決該問題的修正方法(被稱為Shanken修正),即在的表達式中添加系數

在實際應用中,使用。第二,除Shanken修正外,截面OLS回歸中存在的另外一個問題是,在截面上αi存在相關性。這種相關性雖然不會影響OLS估計的性質,但是會使OLS計算的標準誤存在巨大的誤差,造成對標準誤的低估。為解決這個問題,可以使用廣義最小二乘(Generalized Least Squares,即GLS)代替OLS。

當使用GLS求解截面回歸時,估計量的表達式為(以下數學符號中加入了下標GLS以便和OLS表達式進行區分):

當使用GLS并考慮Shanken修正后,為:

在實際中,使用分別代替Σ、Σf以及λGLS就得到的估計。利用OLS或GLS得到的標準誤,構建如下自由度為N-Kχ2-檢驗統計量,檢驗全部N個定價誤差是否聯合為零:

為了檢驗因子預期收益率,只需從取出對角線上的元素并開方即可,它們就是K個因子收益率的標準誤。對于每個因子,利用其預期收益率和其標準誤,計算出相應的t-統計量(自由度T-1)即可進行檢驗。以上就完成了截面回歸檢驗。接下來簡要總結一下。

(1)截面回歸不要求因子的收益率時間序列已知,因此應用更加廣泛。截面回歸的第一步是通過時間序列回歸得到每個資產i在因子上的暴露;第二步才是進行截面回歸。因此這種方法又被稱作兩步回歸估計(two-pass regression estimate)。

(2)在得到后,使用資產的時序平均收益率進行截面OLS或GLS回歸,估計出因子的期望收益率和資產的定價誤差。

(3)由于的標準誤時可以進行Shanken修正。有了估計值和標準誤,構建相應的χ2-統計量和t-統計量來進行檢驗。

最后值得一提的是,截面回歸既可以檢驗由風格因子構成的模型,也可以檢驗同時包括風格和宏觀經濟等不同類型的因子的模型。接下來的2.2.3節將比較時序回歸和截面回歸在分析風格因子上的異同。除此之外,本節使用的OLS和GLS估計中都假設了因子ft和隨機擾動εt之間相互獨立,且各自在時序上滿足獨立同分布這個假設。當該假設不成立時,仍然可以使用廣義矩估計來進行分析。此外,廣義矩估計也可以方便地修正因因子暴露為估計值造成的誤差??紤]到本書的側重,以下不再對此進行展開介紹,感興趣的讀者請參考Cochrane(2005)。在學術界對因子模型的研究中,本節介紹的截面回歸方法并不常見,但理解它可以更好地體會不同方法之間的差異,做到融會貫通。

2.2.3 時序回歸vs截面回歸

2.2.1和2.2.2兩節分別介紹了時序回歸和截面回歸。有意思的是,對于風格因子這種可以通過排序法構建因子模擬投資組合并計算因子收益率時序的情況,既可以使用時序回歸又可以使用截面回歸來檢驗多因子模型。那么它們二者的區別是什么呢?

圖2.6以單因子為例,直觀地比較了二者的區別。時序回歸僅在時序上對每個資產進行回歸,然后通過在時序上取均值來得到隱含的截面關系。這意味著圖2.6中時序回歸得到的必然經過(0, 0)和(1, λ)兩點(其中λ是因子收益率的時序均值)。反觀截面回歸,它的第一步和時序回歸完全一樣,也是使用已有的因子收益率作為解釋變量,得到資產的因子暴露的估計。然而在第二步,它沒有采用“時序上取平均”,而是以為解釋變量,以為被解釋變量進行截面回歸。以OLS為例,它以最小化所有資產定價誤差的平方和為目的。

在時序回歸中,每個資產的定價誤差的估計來自獨立的回歸,即每個資產進行一次回歸,一共進行N次,得到全部N;而在截面回歸中,它第二步的截面回歸以最小化所有N的平方和為目標,因此它同時利用了所有資產的數據。從某種意義上來說,這使得截面回歸更加合理。對于時序回歸,因子的平均收益率就是該因子模擬投資組合收益率在全部T期的均值;而對于截面回歸來說,因子收益率通過OLS或GLS確定,它的取值將會和時序回歸得到的因子收益率不同。這是二者最大的區別。

看到這里,有的讀者朋友也許會問一個問題。對于風格因子,它們的因子模擬投資組合明明已經有了,因子收益率時間序列也有了,只需要通過在時序上取平均就可以得到因子預期收益率,而截面回歸卻進行了第二步,通過OLS或GLS得到因子預期收益率。這兩種方法得到的因子收益率是不同的,那么它們之間有什么差異?到底哪個是更準確的呢?接下來從數學上回答這個問題。

圖2.6 時序回歸vs截面回歸

以OLS為例,由2.2.2節的敘述可知,因子預期收益率的估計量為:

考察式(2.32)等號右側N×K因子暴露矩陣,因此前面這個表達式得到一個K×N矩陣,它的每一行對應一個因子,每一列對應一個資產。它的第k行可以被視作因子k的一個投資組合,第k行、第i列的數值即為資產i在該投資組合中的權重。因此,這個K×N矩陣恰好構成了多因子模型中全部因子的K個投資組合。接下來,將矩陣相乘,并經過簡單的代數運算可得:

為了便于解釋,令。式(2.33)展示出了矩陣?代表的因子投資組合的非常好的性質。對于任意一個因子k,它的投資組合中資產的權重是?的第k行。由于式(2.33)的結果等于單位矩陣I,它說明?的第k行和因子暴露矩陣的每一列相乘時,和任何jk列的內積都是0,而和第k列的內積為1。令ωki表示?矩陣第k行、第i列的元素,i行、第j列的元素,則上述結果在數學上可以表達為:

?的定義可知,前者中的ωki表示因子k的投資組合中資產i的權重,后者中的表示資產i在因子j上的暴露。由此可知,則表示N個資產按權重ωki在因子j上的暴露的加權平均,因為資產權重來自因子k的投資組合,因此這個加權平均也是因子k的投資組合對因子j的暴露。式(2.34)說明因子k的投資組合對任何其他因子jjk)的暴露均為零;而式(2.35)則表明因子k的投資組合對它自己的暴露是1。以上就是式(2.33)的含義。

從上面的論述可知,使用截面回歸不僅求出了每個因子的預期收益率,而且還同時得到了每個因子的投資組合。該投資組合滿足只對該因子有暴露,而對其他因子沒有暴露這個優秀的性質。對于任意一個因子k,很顯然截面回歸得到的因子投資組合和排序法得到的因子投資組合是不同的,因此截面回歸得到的因子預期收益率和時序回歸的因子預期收益率[6]也自然不同。由于截面回歸得到的?投資組合控制了在其他因子上的暴露,因此比起時序回歸結果,通常認為截面回歸得到的因子收益率能夠更加客觀地評價因子的風險溢價。這就是兩種方法的差異。

圖2.7 同時用時序回歸和截面回歸檢驗模型

最后,時序回歸和截面回歸有時也被同時使用,以檢驗模型選擇的因子是否有意義。考慮圖2.7中假想的例子。假設對于某個因子,βi在截面上的關系如圖2.7中黑色圓點表示,由時序回歸定義可知,它的結果經過圖中原點和代表因子投資組合的白色空心圓點。由于該直線的斜率為正,因此時序回歸求出的因子預期收益率大于零。反觀通過截面回歸估計,由于這條直線會最小化所有的平方和,因此會得到完全不同的結果:它的斜率為負,表明因子預期收益率小于零。兩個模型的背離就反映出挑選的因子可能有問題,需要進一步分析。

2.2.4 Fama–MacBeth回歸

1973年,Eugene Fama和James MacBeth在Fama and MacBeth(1973)一文中提出了一個兩步回歸方法(被稱為Fama–MacBeth回歸),該文的目的是檢驗CAPM。該方法非常巧妙地排除了隨機擾動在截面上的相關性對標準誤的影響,在業界被廣泛使用。這篇文章也是計量經濟學領域被引用最頻繁的文章之一。

與2.2.2節類似,Fama–MacBeth回歸的第一步也是通過N個時間序列回歸得到每個資產i在全部因子上的暴露,這和截面回歸的第一步相同。Fama–MacBeth回歸和截面回歸檢驗最大的差異體現在第二步截面回歸上。截面回歸檢驗使用在截面上進行一次截面回歸。Fama–MacBeth回歸在每個時間點t,以t期的收益率為因變量(注意:是t期的收益率,而非全部T期收益率的均值),以為自變量進行截面回歸,因而一共進行了T次截面回歸。這是Fama–MacBeth回歸檢驗和截面回歸檢驗最大的不同。在t期,資產超額收益和因子收益率在截面上的線性回歸模型為:

如果考慮截距項,則有:

比較模型(2.36)和模型(2.18)可知,在截面回歸檢驗中,首先在時序上對t=1, 2, ···, T)取均值,得到資產i的平均收益率在截面上做回歸,因此只做了一次截面回歸。反觀Fama–MacBeth回歸,它在每個t對模型(2.36)進行一次OLS估計(如果有T=100期數據,就意味著進行100次截面回歸),得到因子收益率和殘差的估計。接下來,Fama–MacBeth把T次截面回歸得到的T個估計再取平均,最終得到因子預期收益率和每個資產i定價誤差的估計:

Fama–MacBeth回歸的巧妙之處在于它把T期的回歸結果當作T個獨立的樣本。傳統的截面回歸檢驗只進行一次回歸,得到因子收益率和定價誤差的一個樣本估計。而在Fama–MacBeth截面回歸得到了每個因子收益率的時間序列以及每個資產定價誤差的時間序列,因此可以方便地求出每個因子預期收益率的標準誤和每個資產定價誤差的標準誤:

有了每個因子的預期收益率,如法炮制便可計算t-統計量,并以此來檢驗因子預期收益率。此外,在有了矩陣之后,使用χ2-統計量檢驗全部N個定價誤差是否聯合為零:

從上面的描述不難看出,Fama–MacBeth回歸中的截面回歸和傳統截面回歸的區別是:

? Fama–MacBeth截面回歸檢驗先在不同的t上使用OLS(或GLS,下同)對的截面回歸模型進行估計,再把估計

? 傳統截面回歸檢驗是先把,然后用OLS對均值之間的截面回歸關系進行一次估計,直接得到。

簡單來說,Fama–MacBeth截面回歸是“先估計、再均值”,而傳統截面回歸是“先均值,再估計”,因此,Fama–MacBeth回歸可以被理解為一種特殊的截面回歸。較2.2.2節的方法而言,Fama–MacBeth回歸的優勢是可以排除αit的相關性對標準誤的影響。有必要指出的是,當截面回歸中的解釋變量在全部T期上不變時,以上兩種方法得到的估計是相同的,但Fama–MacBeth在應對αit的截面相關性上仍然有優勢。

在實際應用中,由于Fama–MacBeth方法具有靈活性,不必限制全部T期截面回歸中因子暴露βi保持不變。事實上,在Fama and MacBeth(1973)中,兩位作者在時序回歸估計βi時便采用了滾動窗口,因此因子暴露向量在不同的時刻t會發生變化[7]。具體來說,對于t期,使用截至t-1期的一段給定窗口的歷史數據進行時序回歸估計因子暴露βit?1。由于它是使用截至t-1期的數據估計的,因此因子暴露向量的時間下標是t-1。使用估計值作為t期截面回歸的解釋變量,得到如下的截面回歸模型:

或考慮截距項的情況:

在每個時刻t對模型(2.45)或模型(2.46)進行OLS估計就是時變因子暴露的Fama–MacBeth回歸。比起全局都用同樣的因子暴露,這種方法在實際的研究和投資實踐中的應用更加廣泛。

下面來說一說Fama–MacBeth回歸的不足。首先,它對于αit在時序上的相關性無能為力[8]。其次,由于截面回歸中用到的并不是真實的,而是通過時間序列得到的估計值,因此存在誤差。Fama–MacBeth回歸對此也無能為力,仍然需要Shanken修正。話雖如此,Fama–MacBeth回歸通過在截面回歸時“先回歸,再均值”的思路巧妙地排除了αit截面相關性的影響,得到了學術界的廣泛認可,影響深遠。時至今日,在計量經濟學做面板分析的文章中,仍有約1/3的文章采用Fama–MacBeth回歸(Petersen 2009),且幾乎在每篇研究資產定價的論文中都可以見到它的身影。Fama–MacBeth回歸的要點總結如下。

(1)Fama–MacBeth回歸是一種截面回歸。和普通截面回歸一樣,它的第一步也是通過時間序列回歸得到資產在因子上的暴露。

(2)在得到后,在每個t(共T期)使用OLS對資產超額收益率的截面線性回歸模型進行估計,得到t期因子的收益率的估計。在通過T次截面回歸,得到T個估計后,將它們在時序上取均值得到因子預期收益率和殘差均值。此外,利用,以檢驗資產定價誤差和因子預期收益率。

(3)Fama–MacBeth回歸排除了αit的截面相關性對標準誤的影響,但是對時序相關性無能為力。

和其他回歸模型一樣,Fama–MacBeth截面回歸的主要目的是檢驗多因子模型解釋資產超額收益的能力,即αi聯合起來在統計上是否為零。但在學術界的實證資產定價研究中,學者們更多的時候是用它來檢驗因子預期收益率λk。由于可以方便地得到因子收益率序列從而求出其均值和標準誤,因此它可以輕松地勝任這個任務。在使用Fama–MacBeth回歸檢驗因子預期收益率時,學術界通常采用帶截距項的模型(2.46),其目的是排除模型設定偏誤的影響。2.3節會對因子預期收益率檢驗做更深入的探討。

2.2.5 不同回歸方法比較

前文2.2.1節、2.2.2節以及2.2.4節分別介紹了時序回歸、截面回歸和Fama–MacBeth回歸三種檢驗多因子模型的回歸方法。對于這些方法,在筆者平日閱讀學術論文和自身研究因子時有兩點體會,在此分享給讀者。

首先,所有模型都是“不完美”的。這句話的意思是,當把足夠多的資產放在回歸模型的左側時,任何一個多因子模型都會被拒絕(即若資產定價誤差聯合起來為零,則被拒絕)。人們研究多因子模型的動機不應追求它們在統計上多么“完美”,而應該關注每個因子背后到底有多少邏輯。在實證資產定價的研究中,往往不會使用個股作為資產去檢驗模型(否則模型一定會被拒絕),而是依據一些規則把股票“打包”構成投資組合,然后使用這些投資組合作為資產去檢驗多因子模型。這是學術界最常見的做法。

其次,在檢驗多因子模型時,不同的方法在很大程度上可以說都是“殊途同歸”,它們之間的差異也許都沒有它們名字的差異大;在特定的假設下,不同的方法往往是等價的。比如,當因子暴露在時序上不變時,那么傳統截面回歸和Fama–MacBeth截面回歸的結果是一致的。在應用中,可以通過比較不同檢驗方法的結果來加深對多因子模型的認知,這才是學習不同方法最大的價值。

[1]本節的介紹專注于對核心概念的解釋,數學部分僅在最低限度包括必要的內容。對不同回歸檢驗方法的數學背景感興趣的讀者可參考Cochrane(2005)。

[2]一個資產可以是一支股票也可以是由一攬子股票構成的一個投資組合。

[3]為了紀念Fischer Black,后人將該模型稱為Black CAPM模型。

[4]根據2.1.2節的說明,在因子研究中原假設通常為因子預期收益為零。因此,檢驗時關注的是能否在給定的顯著性水平下拒絕原假設。

[5]IID是獨立同分布之意,其英文全稱為independent and identically distributed。

[6]它是排序法得到的因子模擬投資組合的收益率的時序平均。

[7]對時變因子暴露的研究也是當下實證資產定價研究的前沿課題之一。

[8]一般認為,股票收益率的時序相關性很微弱、截面相關性很高,因此使用Fama–MacBeth回歸并不會遇到太大的問題。Petersen(2009)分析了不同的回歸方法在分析面板數據(panel data)時由于忽略隨機擾動的時序或截面相關性而導致不準確的標準誤(低估了其真實值)。

主站蜘蛛池模板: 镇雄县| 万年县| 普陀区| 恭城| 清流县| 房产| 伊春市| 全南县| 江阴市| 潞城市| 麦盖提县| 克拉玛依市| 玛曲县| 乐陵市| 库尔勒市| 宜川县| 民勤县| 富宁县| 绥芬河市| 黄陵县| 山东省| 中西区| 桦南县| 红桥区| 清涧县| 南澳县| 天水市| 普兰县| 云霄县| 湖南省| 呈贡县| 黔江区| 武义县| 庐江县| 凯里市| 黄山市| 邻水| 普洱| 玉环县| 乌海市| 正宁县|