官术网_书友最值得收藏!

2.3 因子暴露和因子收益率

自從Fama and French(1993)提出第一個多因子模型以來,使用排序法構建因子投資組合、計算因子收益率,并通過時序回歸確定資產在因子上的暴露便成為學術界的研究范式,本書第4章介紹的七個主流多因子模型均采用此方法。然而,由2.2.3節的介紹可知,通過截面回歸可獲得因子的純因子組合,從而得到和排序法不同的因子的收益率。相較于使用排序法構建的因子投資組合,由于純因子組合在其他因子上沒有暴露,因此從理論上能夠更準確地體現因子收益率。

在此基礎上,近年來出現的新研究趨勢是使用時變因子暴露的Fama–MacBeth截面回歸計算因子收益率,并以此代替排序法的收益率。在諸多研究成果中,最具代表性的兩篇文章要數Jegadeesh et al.(2019)和Fama and French(2020)。這兩篇文章都是研究因子收益率的,但側重點卻有所不同。前者關注的是如何更準確地估計因子暴露,進而計算因子收益率;而后者則考察了排序法和回歸法之中,哪種方法計算的因子收益率能夠更好地解釋股票預期收益率的截面差異。這些發現將人們對于因子暴露和因子收益率的理解帶上了更高的臺階,也為未來實證資產定價和因子投資指明了方向。本節接下來的內容將綜合梳理這些新方法和新發現。

下面回顧一下Fama–MacBeth截面回歸,它是一個兩步回歸方法:

? 第一步時序回歸:估計時刻t資產i在所有因子上的暴露。(為了簡化符號表達,中沒有引入代表時間的下標。在本節的討論中均假設代表時變的因子暴露。)

? 第二步截面回歸:使用作為解釋變量,資產的超額收益率作為被解釋變量,用OLS對截面回歸模型(2.46)進行估計,得到t期每個因子的收益率;在得到整個因子收益率時序后,對因子預期收益率進行檢驗。

顯然,如果沒有就無法進行截面回歸,因此上述過程的第一步是為了第二步服務。一旦有了,第二步的截面回歸就是“例行操作”。由此可知,Fama–MacBeth回歸中值得深入討論的是如何確定因子暴露。由2.2.4的介紹可知,時序回歸僅僅得到βi的估計,它屬于生成的回歸變量,而非真實(但未知)的βi。因此,這種做法存在誤差。將作為第二步截面回歸中的解釋變量就引入了計量經濟學中的變量誤差(errors-in-variables,EIV)問題。

Fama and MacBeth(1973)自然意識到了這個問題。為此,他們給出的解決辦法是使用個股組成的投資組合代替個股作為資產。以檢驗CAPM為例,該文將個股按照其歷史βi的大小構成了不同的投資組合,然后將這些投資組合作為資產。該文指出,當使用投資組合時,個股βi的估計誤差會相互抵消,因此投資組合β值(個股βi的加權平均)的估計會更準確,從而在一定程度上降低EIV的影響。

自此以后,在進行Fama–MacBeth回歸檢驗因子時,使用投資組合而非個股作為資產就成了主流做法。但有大佬對此頗有微詞,這其中就包括Eugene Fama的學生Richard Roll。Roll和他的合作者在Jegadeesh et al.(2019)一文中指出,將個股按照某種屬性分組、構建投資組合作為資產實際上是一種降維處理,投資組合會丟掉很多個股截面上的特征。如果待檢驗的因子和這些投資組合恰好正交,那么用它們作為資產進行Fama–MacBeth回歸是無法發現這些因子的風險溢價的。因此,Jegadeesh et al.(2019)建議仍然使用個股作為資產檢驗因子,并提出通過引入工具變量(instrumental variables,IV)的方法應對EIV問題。

除此之外,應對EIV問題的另一種方法則顯得更加“顛覆”,它干脆舍去了第一步的時序回歸,而是直接采用公司特征(firm characteristic)的取值(經必要標準化處理后)作為因子暴露的估計。舉個例子,假設考慮圍繞賬面市值比(BM)構建的價值因子,按照Fama–MacBeth回歸的傳統做法,應該把個股和該因子收益率做時序回歸求出因子暴露;而另一種處理方式是直接使用BM取值,將其進行必要的標準化處理之后作為股票在該因子上的暴露。

這兩種選擇因子暴露的方法大相徑庭。它們之間孰優孰劣呢?它們又如何影響因子收益率的計算呢?這些問題的答案就是本節的內容。接下來先看一看引入工具變量的做法。

2.3.1 引入工具變量

t時刻,資產超額收益率和因子暴露滿足如下截面線性回歸模型:

為便于討論,引入如下數學符號。令以及αt=[α1t, α2t, ···, αNt]′;定義N×(K+1)矩陣;定義(K+1)維向量ζt≡[γt, λ1t, ···, λkt]′。由定義可知,ζt中的第一項是模型(2.47)中的截距項,而后面K項則是這K個因子t期的收益率。使用上述定義,并將全部N個資產放在一起表達,(2.47)變為:

為減少EIV問題的影響,Jegadeesh et al.(2019)在估計模型(2.48)的參數中引入了工具變量,得到ζt的IV估計量:

式中的工具變量。Jegadeesh et al.(2019)使用互不重疊的歷史數據分別進行時序回歸計算,并指出它們是不相關的,因而能夠減少EIV問題。在具體操作中,在每個月末使用過去三年個股的日頻收益率和多因子模型的日頻收益率進行時序多元回歸:

(1)如果當前月是偶數月(比如二月、四月、六月等),則使用過去三年窗口內所有的偶數月之中個股和多因子的收益率進行回歸,得到的回歸系數就是;使用這三年窗口內所有奇數月之中個股和多因子的收益率進行回歸,得到的回歸系數作為

(2)如果當前月是奇數月(比如一月、三月、五月等),則使用過去三年窗口內所有的奇數月之中個股和多因子的收益率進行回歸,得到的回歸系數就是;使用這三年窗口內所有偶數月之中個股和多因子的收益率進行回歸,得到的回歸系數作為

由于模型(2.48)存在EIV問題,所以OLS估計量往往是有偏的(biased)。此外,由于多個解釋變量同時存在,因此人們無法確定每個因子的收益率是被高估還是被低估,而式(2.49)所示的IV估計量則是因子收益率的無偏估計。

2.3.2 使用公司特征

雖然使用IV估計量消除了EIV問題,但Jegadeesh et al.(2019)的研究同時指出,通過IV估計量得到的顯著的因子收益率也可能源自被忽視的變量偏差,即在截面回歸時沒有使用構建因子投資組合時使用的公司特征作為控制變量。以規模和價值因子為例,排除變量偏差意味著在使用經回歸得到的因子暴露的基礎上,同時加入了構建這兩個因子的公司變量(即對數市值[1]和BM)共同作為解釋變量,進行Fama–MacBeth截面回歸。實證結果顯示,當排除變量偏差后,僅有公司特征作為因子暴露的因子被定價了,而以時序回歸β作為因子暴露的因子并沒有被定價。無論采用傳統OLS估計量還是新提出的IV估計量,上述結論均成立。

表2.4給出了Jegadeesh et al.(2019)的實證結果[2]。對于IV估計量和OLS估計量,表中分別匯報了三組實驗結果。以IV估計量為例,在實驗(1)和(2)中,分別僅使用時序回歸得到的和公司特征作為因子暴露,計算相應因子的平均收益。結果顯示,在這兩組實驗中,規模和價值因子的月均收益率均顯著不為零(實驗(2)中規模因子月均收益率為負的原因是當使用ln(市值)作為因子暴露時,小市值的暴露更低)。然而,在實驗(3)中,當時序和公司特征被同時選為解釋變量后,結果顯示以時序回歸為暴露的因子的月均收益不再顯著。在實驗(3)中,以為因子暴露的規模因子的月均收益率t-值僅為-0.42,以為因子暴露的價值因子的月均收益率t-值則是1.88(小于0.05顯著性水平下t-值的閾值)。而另一方面,在實驗(3)中,以ln(市值)和BM分別作為暴露的規模和價值因子的月均收益率,其t-值分別為-3.93和4.40,在統計上均十分顯著。對于OLS估計量,也可以觀察到同樣的結果,在此不再贅述[3]

上述結果似乎在向人們傳遞這樣的信息:比起時序回歸的,公司特征似乎才是更好的因子暴露。下面將對此進行探討。

表2.4 Jegadeesh et al.(2019)針對美股的研究結果

注意:本表格匯報了使用不同因子暴露時,相應因子的月均收益率(%),括號內為該預期收益率的t-值。

2.3.3 兩類模型

最初,Fama and French(1996)這篇著名的解讀Fama and French(1993)三因子模型的文章指出,解釋一支股票的收益應關注它和因子之間的時序回歸系數,而非公司特征。舉例來說,某個BM很低的公司的收益率如果和價值因子的相關系數很高,那么該公司應該被當作價值股,而非成長股。毫無疑問,使用時序回歸作為因子暴露則是符合人們認知的,然而實證數據顯示的卻又是另一個故事。當使用個股作為測試資產時,以公司特征作為因子暴露則“完勝”時序回歸得到的:前者能獲得顯著風險溢價,但后者卻不行。

以下從兩個不同的角度思考時序回歸和公司特征之間的差異:(1)日頻收益率噪聲較高,使用它進行時序回歸得到的因子暴露存在較高誤差,使得個股的因子暴露取值在時序上并不穩定。一旦因子暴露在時序上不穩定,就會導致在不同期進行截面回歸時,該因子的表現就像隨機因子一樣,因而難以獲得顯著的溢價。(2)真實的因子暴露是未知的,而相比時序回歸系數,公司特征是未知因子暴露更好的代理變量?;贏股的實證結果[4]顯示,當期的公司特征比最新時序回歸更能預測下一期股票的收益率。這個結果可以從一定程度上解釋為什么僅有公司特征為暴露的因子被定價,而使用時序回歸為暴露的因子沒有被定價。在某種意義上,它似乎說明公司特征是更好的因子暴露變量,但其背后的原因仍然值得繼續深入探索。

既然公司特征相比時序回歸是更好的因子暴露,且只有以公司特征作為因子暴露代理變量的因子被定價,那么一個很自然的想法是使用截面回歸計算因子收益率并以公司特征作為個股在因子上的暴露,從而也得到一種多因子模型。學術界管這種方法得到的模型叫作“截面多因子模型”。與之相對應的是自Fama and French(1993)沿襲而來的使用排序法計算因子收益率,并通過時序回歸計算股票的因子暴露。這種模型被稱為“時序多因子模型”。那么,在這兩類模型中,誰能更好地解釋股票預期收益率的截面差異呢?

Fama and French(2020)回答了這個問題[5],其核心結論為,比起傳統的“時序回歸多因子模型”,“截面回歸多因子模型”更能解釋資產收益率的預期差異,即資產的定價誤差更接近零。此外,當使用“截面回歸多因子模型”時,因子暴露應使用時變的公司特征,而非恒定的公司特征(比如對于某公司,把它的某個特征在時序上取均值,但這種方法效果并不好)。除此之外,Fama and French(2020)還研究了另一種“四不像”的模型,即使用截面回歸計算因子收益率,得到因子收益率序列后再使用股票和因子收益率時序回歸計算因子暴露,以取代公司特征。這個“四不像”模型對資產預期收益率的解釋能力和“時序回歸多因子模型”相似,但卻不如“截面回歸多因子模型”。這個結果說明,“截面回歸多因子模型”優于“時序回歸多因子模型”,原因可能源于兩點:(1)截面回歸的因子收益率優于排序法的因子收益率;(2)時變公司特征相比時序回歸是更好的因子暴露代理變量。二者缺一不可。

自Fama and French(1993)三因子模型問世以來,學術界便采用了“時序回歸多因子模型”這一傳統。而在27年后,如今,Eugene Fama和Kenneth French又通過Fama and French(2020)一文打破了這一傳統,引領了今后實證資產定價模型的研究方向。雖然其結果更多地建立在純粹的實證分析之上,但該文還是清晰地回答了學術界和業界都非常關心的兩個問題:到底如何計算因子收益率以及用什么作為因子暴露。從上述結果來看,基于截面回歸得到的純因子組合作為因子投資組合、使用公司特征作為因子暴露在未來或大有可為。此外,“截面多因子模型”也更符合業界的做法(例如Barra多因子模型)。本書第3章將遵循學術界慣例,采用投資組合排序法檢驗因子,而第4章將使用公司特征作為因子暴露,通過Fama–MacBeth回歸檢驗因子,以幫助讀者理解不同方法的差異。

[1]在使用個股的數據進行截面回歸時,市值通常會被對數市值代替,以此降低極值的影響。

[2]在原文中,Jegadeesh et al.(2019)在進行Fama–MacBeth回歸時還加入了市場因子暴露以及截距項作為解釋變量。但由于它們不是此處關注的重點,因而沒有被納入表2.4中。

[3]公眾號“川總寫量化”的文章《Which Beta?》以中證500的成分股為基準驗證了Jegadeesh et al.(2019)的方法,并在A股上觀察到了類似的現象。

[4]參考公眾號“川總寫量化”的文章《Which beta?》。

[5]公眾號“川總寫量化”的文章《Which Beta(II)?》對Fama and French(2020)進行了詳細解讀。

主站蜘蛛池模板: 侯马市| 汾阳市| 宁河县| 武胜县| 墨竹工卡县| 长汀县| 威海市| 庆元县| 北辰区| 镇沅| 乌兰察布市| 松溪县| 鸡泽县| 四子王旗| 康乐县| 城口县| 临汾市| 平乐县| 巴彦县| 仲巴县| 寻乌县| 岚皋县| 兴国县| 阿合奇县| 余江县| 黑水县| 白沙| 天台县| 视频| 抚州市| 九寨沟县| 无极县| 响水县| 邹平县| 上林县| 平远县| 宣汉县| 鲁甸县| 奉节县| 会昌县| 葫芦岛市|