官术网_书友最值得收藏!

2.4 異象檢驗

學術界對于異象的研究是十分狂熱的。在過去30年的時間里,學者們在美股市場中“挖”出了數百個異象。Hou et al.(2020)一文花了非常大的精力復制了452個異象,是一篇很好的總結。不幸的是,他們發現絕大多數被發表的異象并不能獲得多因子模型無法解釋的顯著α收益率,這意味著很多學術研究并沒有帶來真正科學、正確的結果。本書第6章會對學術界的這種風氣進行介紹,本節先來看看如何檢驗異象。

2.4.1 時序回歸檢驗異象

通過第1章的介紹可知,如果某個資產能夠獲得多因子模型無法解釋的顯著超額收益,那么就稱該資產為一個異象。在股票多因子研究的范疇內,上述異象資產通常是按照如下幾個步驟構造投資組合的:

(1)選擇一個潛在的財務指標或者量價指標,以它作為異象變量(anomaly variable)。

(2)根據異象變量取值的高低,將股票在截面上排序,使用排序法構建異象投資組合,并獲得異象收益率的時間序列。

(3)檢驗該異象收益率能否被多因子模型解釋。

在給出具體的檢驗之前,有一點關于異象研究的重要趨勢值得一提。在過去,最常見的做法是使用單一異象變量來構建異象。然而,在近些年的研究中,一個主流的趨勢是使用多個(即復合)變量來構造異象。當然,這種做法有利也有弊。好的一方面是這些使用多指標構建的異象往往有更強的金融學含義,因此更能夠幫助人們理解上市公司基本面和技術面信息與未來預期收益率之間的關系。比如Asness et al.(2019)一文以Quality minus junk為題提出的質量異象。該文三個維度使用了眾多指標,最終得出了一個總分對股票排序,構造了異象投資組合。又如Piotroski and So(2012)的研究,它使用兩個變量的獨立雙重排序構建了一個預期差異象,而其中一個排序變量本身就是一個應用了多個財務指標的復合變量。不好的一方面則是使用復合變量更容易出現過擬合。從某種意義上說,研究異象(和因子)其實是對著歷史數據進行數據挖掘。一旦使用的變量過多,就容易出現過度挖掘,使得發現的所謂異象僅僅是樣本內過擬合的結果。盡管如此,從本書的目標來看,復合變量構成的異象仍然比單一變量構成的異象更加值得探討。為此,在本書第5章研究異象時,會針對學術界一些非常經典的復合變量異象在A股進行實證。

回到本節的重點,異象檢驗的第一種方法非常直接,即時間序列回歸。令t=1, 2, ···, T)代表t時刻異象收益率,λtt=1, 2, ···, T)代表t時刻因子收益率向量(假設共有K個因子)。在檢驗異象時,原假設是異象收益率中不存在因子無法解釋的部分,即α=0。為檢驗它,用λt作為解釋變量、作為被解釋變量進行時序回歸OLS估計:

式中,是截距項,它是α的估計值,代表異象收益率中無法被多因子模型解釋的部分;為該異象在K個因子上的暴露向量的估計,它的取值告訴人們哪些因子對解釋異象收益率起了作用;是殘差。OLS除了給出上述參數的估計外,還會計算出它們的標準誤。由于目標是檢驗異象能否獲得顯著超額收益,因此使用計算t-值:

在時序回歸中,總的期數為T。另外,解釋變量包括一個截距項以及K個因子,故而一共有K+1個解釋變量。因此,式(2.51)中t-值滿足的t分布的自由度為T-K-1。最后,根據t-值和t-分布就可以計算出p-值,從而決定是否在給定的顯著性水平下拒絕原假設。如果原假設α=0被拒絕,那么就稱背后的資產為異象。

其實,對于異象的檢驗到這里就告一段落了。然而,在時間序列回歸中有一個必須面對的計量經濟學問題。當時間序列的隨機擾動有自相關性或者異方差時,OLS的標準誤就是不準確的,這就造成計算出的t-值也是失真的。下面2.4.2節首先說明這個計量經濟學問題,然后2.4.3節給出解決辦法。

2.4.2 計量經濟學問題

接下來暫時跳出多因子模型,討論回歸分析中普遍存在的計量經濟學問題。考慮總體(population)的廣義線性回歸模型(generalized linear regression model)公式如下:

其中yT維向量;XT×(K+1)解釋變量矩陣(其中K是解釋變量的個數,外加一個截距項);b是(K+1)維回歸系數向量;εT維隨機擾動向量;ΣT階)是ε的協方差矩陣。上述模型和經典線性回歸模型最大的區別是正定矩陣Υ的引入。在經典模型中假設給定解釋變量X下,ε滿足獨立且同方差,因此Υ是單位陣I。

在廣義線性回歸中,ε獨立、同方差這兩個假設均可被打破,從而得到兩個常見的特性:異方差(heteroscedasticity)和自相關(autocorrelation)。在廣義線性回歸模型中引入Υ正是為了反映ε的上述特性。當僅出現異方差但沒有自相關時,σ2Υ滿足:

反之,當僅出現自相關但沒有異方差時,σ2Υ滿足:

式(2.53)和式(2.54)只是給了Υ的兩個典型例子。在一般的情況下,自相關和異方差同時存在,Υ矩陣中第i行、第j列的元素則由υij表示。如果矩陣Υ已知,則通常使用廣義最小二乘(GLS)對回歸系數b進行參數估計。但當Υ未知時,OLS往往是首選。對模型(2.52)使用OLS得到b的估計為:

對式(2.55)兩邊取期望,如果E[ε|X]=0成立,則有可以推導出的協方差矩陣,記為VOLS(下標OLS表示使用OLS估計):

ε不存在異方差以及自相關性時,Υ=I。將其代入式(2.56)并進行簡單的代數運算就可以得到經典OLS中VOLS的表達式:

VOLS=σ2(X′X)?1?。?.57)

在實際中用樣本殘差的方差s2代替總體的σ2代入式(2.57),從而得到VOLS的估計,其對角線元素的平方根就是這K+1個回歸系數(包括截距項)的標準誤,通過它們就可以進行t-檢驗。然而,當ε存在異方差或者自相關時,上述就不是一個好的估計量。

式(2.56)右側表達式中除第一項1/T之外,剩余部分可以看成是三個矩陣相乘的形式,其中第一個和第三個僅和解釋變量X有關,因此修正自相關和異方差的核心就是正確地估計式(2.56)中的中間矩陣。為了方便討論,令Q代表中間的矩陣:

式中xi=[xi1, xi2, ···, xiK+1]′,即X的第i行的轉置(注意它不等于X的第i列)。一旦能找到在考慮了自相關和/或異方差之后的矩陣Q的估計量,便可通過它進而求出的協方差矩陣的估計量。在這方面,最著名的兩個估計量當屬White(1980)估計量(僅考慮異方差)以及Newey and West(1987)估計量(同時考慮異方差及自相關)。

2.4.3 White估計量和Newey–West估計量

為了估計Q,需要用到的“武器”恰恰就是解釋變量矩陣X,以及回歸的樣本殘差向量。當ε僅有異方差但沒有自相關時,Q則簡化為僅考慮對角線上的元素:

White(1980)指出使用X以及便可求出Q的漸進估計(記為S0):

S0代入式(2.56)便得到的協方差矩陣的估計量:

式(2.61)被稱為White異方差相合估計量。該結果的優勢在于,哪怕人們對異方差的取值或結構一無所知,仍然可以根據OLS的結果進行適當的推斷??紤]到實際問題,在資產收益率中無法被多因子模型解釋的隨機擾動部分的異方差性質未知,上述性質就顯得格外重要。在檢驗異象時,除了異方差外,通常仍需考慮ε的自相關性。為此,一個自然的想法是將上述Q的估計延伸到對角線之外的元素,即:

式(2.62)看似合理,但因其存在兩個問題,所以并不正確:(1)該表達式中一共有T2項求和,而求和項之前的比例系數僅僅是1/T,因此S可能不收斂;(2)即便S收斂,它也很可能不是正定的,從而使得的協方差矩陣非正定,這顯然有違常理。

為了解決上述問題,Newey and West(1987)給出了在同時考慮ε的自相關和異方差時,中間矩陣Q的相合估計量:

比較式(2.60)和式(2.63)不難發現,后者中的第一項正好對應僅有異方差的情況,而第二項則是針對自相關性的修正。其中J是計算自相關性影響的最大滯后階數(Newey and West 1994給出了自動計算J取值的自適應算法),wj是滯后期j的權重系數,由其表達式不難看出自相關性的影響隨著滯后期j的增大而減小。將式(2.63)中的S代入式(2.56),得到協方差矩陣的Newey–West異方差自相關相合估計量:

將式(2.64)的協方差矩陣對角線上的元素求平方根,就得到回歸系數的標準誤[1]。該估計量在實證資產定價研究中應用非常廣泛,幾乎任何一篇分析因子或者異象的論文,在檢驗收益率顯著性時,都會提到諸如“經Newey–West調整后的t-值(Newey–West adjusted t-statistic)”或者“經Newey–West調整后的標準誤(Newey–West adjusted standard error)”。這些描述的含義是使用式(2.64)計算回歸系數的標準誤以及t-值[2]。

再回到本節異象檢驗的問題中,按照如下步驟即可在OLS回歸時對回歸系數的標準誤進行Newey–West調整:

(1)使用異象收益率作為被解釋變量、多因子中K個因子的收益率以及一個截距項(一共K+1項)作為解釋變量,進行時序回歸OLS估計,得到殘差。

(2)使用K+1個解釋變量X和殘差,根據式(2.63)和式(2.64)計算出經Newey–West調整后的,計算時依照Newey and West(1994)給出的公式確定最大滯后期數J

上式中表示向下取整。

(3)將的對角線元素開平方,其平方根就是回歸系數的標準誤(一共K+1個)。

(4)找到截距項的標準誤,它對應的就是式(2.50)中的的經Newey–West調整后的標準誤按照式(2.51)計算t-值,進行t-檢驗。

本書在第5章針對A股市場進行異象實證研究時,將采用上述步驟檢驗異象的顯著性。

2.4.4 截面回歸檢驗異象

除了通過時序回歸方法檢驗異象外,Fama–MacBeth截面回歸也常被用于檢驗異象。其背后的邏輯是,異象能獲得超額收益則意味著異象變量能夠預測資產未來的收益率;而Fama–MacBeth截面回歸可以在控制其他因子的同時,檢驗異象對收益率的預測性。在回歸時,使用異象變量以及多因子模型中構造因子的變量同時作為解釋變量,以資產(個股或投資組合,通常為個股)超額收益作為被解釋變量,在每個時刻t進行截面回歸,得到異象變量t期的超額收益,記為(上標α代表異象)。利用該序列,計算異象收益率的均值和均值的標準誤(分別記為),然后進行t-檢驗。如果在控制了因子變量后,該異象的預期收益依然顯著,那么就認為它可以獲得多因子模型無法解釋的超額收益。

由于異象收益率在時序上可能存在異方差和自相關性,因此也可以通過Newey–West調整得到準確的的估計。如何對單個收益率序列進行Newey–West調整呢?正確做法是使用作為被解釋變量,Xt=1(t=1, 2, ···, T)作為解釋變量,通過OLS求出殘差序列。上述OLS的回歸系數實際上就等于在時序上的均值,而殘差則是收益率和其時序均值之差,它反映了異象收益率的自相關和異方差性。把殘差Xt=1代入式(2.63)即可得到經Newey–West調整的中間矩陣。在針對單一時間序列進行的計算中,中間矩陣為標量(記為Q),因此它的估計S(也是標量)為:

Xt=1易知XX=T。將式(2.66)中的SXX=T代入Newey–West估計量式(2.64),通過簡單運算可得的方差的估計:

將式(2.67)開方就得到經Newey–West調整后的。最終,使用均值計算t-統計量并檢驗異象預期收益率的顯著性。

有必要說明的是,上述檢驗單一收益率在時序中的Newey–West調整對回歸右側的所有解釋變量都成立。如果解釋變量是異象變量,那么它檢驗的就是異象預期收益率是否顯著;如果解釋變量是因子變量,那么它檢驗的就是因子預期收益率是否顯著。根據2.3節的說明,雖然使用排序法構建因子投資組合并檢驗其收益率一直以來是學術界的慣例,但是近年來越來越多的研究使用公司特征作為因子暴露,并使用Fama–MacBeth回歸檢驗因子收益率。一旦得到因子收益率的時間序列,就可以使用本節介紹的方法計算因子預期收益率的標準誤,并對其檢驗。除此之外,上述Newey–West調整也可以被應用于排序法中。這意味著首先通過投資組合排序法獲得因子的收益率序列,然后計算其均值的標準誤時應用式(2.66)和式(2.67),這樣便可得到正確的。在本書第3章關于主流因子的實證研究中,將使用排序法構建因子收益率序列,并按照本節的方法計算標準誤,檢驗因子預期收益率。

[1]嚴格地說,是標準誤的估計。

[2]White(1980)估計量也常被用來計算回歸系數的標準誤。但由于Newey and West(1987)估計量既考慮異方差又考慮自相關,比White(1980)估計量適用性更高,因而得到了更廣泛的使用。

主站蜘蛛池模板: 莱州市| 武城县| 邵武市| 黑龙江省| 汉阴县| 宜都市| 崇仁县| 区。| 银川市| 栾城县| 维西| 河西区| 镇康县| 孝昌县| 阜新市| 嘉兴市| 湟中县| 聂荣县| 长宁区| 滨州市| 凭祥市| 屯留县| 尉氏县| 华蓥市| 泰顺县| 武胜县| 邢台县| 同德县| 内江市| 收藏| 富蕴县| 阜城县| 桐柏县| 涞水县| 东兴市| 六盘水市| 金坛市| 龙胜| 静安区| 普兰县| 安龙县|