- 因子投資:方法與實踐
- 石川等
- 8844字
- 2020-09-29 17:15:49
2.5 多因子模型比較
2.2.5節提到,所有的多因子模型都是“不完美”的。而這句話的后半句是有些多因子模型是“有用”的。如果一個模型中的因子都有可靠的經濟學或金融學依據,代表了某種風險[1],且該多因子模型能夠解釋大量資產的預期收益,那么該模型就是有用的。然而從不同的邏輯出發,人們總能提出不同的因子,并用它們組合出不同的多因子模型。對于不同的多因子模型,應該如何進行比較呢?有哪些統計學方法能幫人們做出科學的判斷呢?介紹比較多因子模型的方法就是本節的內容。
要比較多因子模型,可以本著“兩個目標、兩個切入點、多種方法”這條邏輯主線進行。先看兩個目標。Barillas and Shanken(2017)指出,評價一個多因子模型要看它能否解釋用來檢驗該模型的資產(英文為test assets,本書將其譯為測試資產)以及該模型能否解釋其他模型的因子。因此,比較不同多因子模型對同一組測試資產的解釋程度就是第一個目標;而不同多因子模型兩兩相互檢驗能否解釋他人的因子就是第二個目標。再來看兩個切入點。無論是解釋測試資產還是其他因子,被解釋的資產往往都是多個。當評價一個多因子模型時,聯合檢驗多個資產定價誤差是否為零就是第一種切入點;而單獨考察這些資產的定價誤差是否為零則是另一種切入點。無論采取哪種切入點,都有具體的方法進行檢驗。如果目標是聯合檢驗定價誤差,則可以使用GRS檢驗以及均值—方差張成(mean-variancespanning)檢驗;如果目標是把定價誤差獨立看待,則可以使用α檢驗。
比較多因子模型的核心是從某個切入點出發,選擇適當的統計方法。一旦有了方法,它就既可以被用來檢驗測試資產,也可以被用來進行不同模型包含的因子的相互檢驗。換句話說,不管是用測試資產還是用其他模型的因子當被解釋變量,對于統計方法本身是沒有太大差異的。因此,下文將以不同切入點介紹不同的檢驗方法。在實證資產定價的研究中,來自這兩個切入點的不同方法經常被同時使用,其目的是讓模型之間孰優孰劣的結論更加可靠。接下來的2.5.1節和2.5.2節兩節首先分別介紹GRS和均值—方差張成檢驗,它們都是聯合檢驗定價誤差的方法。這兩種方法的檢驗統計量(test statistic)的表達式差異并不大,而且背后也有著千絲萬縷的聯系,2.5.3節將從幾何的角度解釋它們的差異。2.5.4節將會介紹α檢驗,它也是非常流行的一種檢驗方法,但與前面兩種方法不同,它并不是把所有定價誤差聯合看待,而是獨立看待。最后,2.5.5節簡要介紹貝葉斯方法。
2.5.1 GRS檢驗
GRS檢驗由Michael Gibbons、Stephen Ross以及Jay Shanken提出,并由此得名。在2.2.1節介紹多因子模型的時序回歸檢驗時已經對該方法進行了介紹,并給出了檢驗統計量。假設有N個用于檢驗的資產,并假設待檢驗的多因子模型中有K個因子。令=
表示全部N個資產的定價誤差向量,
表示t期N個資產無法被該多因子模型解釋的殘差向量,
表示t期K個因子的收益率向量,則根據(2.16)可知GRS統計量為:

GRS檢驗有兩個吸引人的優點。首先,它的F-統計量是有限樣本(finite sample)下的統計量,即GRS檢驗給出了給定樣本大小T下這些定價誤差應滿足的聯合分布,該檢驗是高度精確的。當樣本量趨于無窮的時候,的聯合分布漸進趨于χ2分布,但在有限樣本下使用χ2分布并不可靠,這就凸顯了GRS檢驗的價值。其次,GRS檢驗有非常高的檢驗效力。當然,任何事物都有兩面。GRS統計量的精確性高度依賴正態分布假設。在現實中,該假設可能過于嚴格而無法滿足,這會降低GRS檢驗在實踐中的吸引力。另外,GRS檢驗要求樣本數T大于資產個數N。這意味著當用來檢驗的資產個數很大時,需要使用更長窗口的歷史數據來計算GRS統計量。
盡管以上種種,時至今日,GRS檢驗仍被學術界廣泛使用。比如Liu et al.(2019)使用GRS檢驗比較了他們提出的中國版三因子模型和Fama and French(1993)三因子模型在A股市場上的效果。在GRS檢驗中,將這兩個模型之間的因子互為解釋和被解釋變量。結果顯示,中國版三因子模型能夠解釋Fama and French(1993)中的因子,而Fama and French(1993)三因子模型無法解釋中國版三因子,因此中國版三因子模型更適用于A股市場[2]。
借助計算機的運算能力,人們可以根據式(2.16)式很容易地求出GRS統計量。但是這個看上去復雜的數學公式對理解該檢驗背后的本質似乎沒有太大幫助。好消息是,GRS統計量還有另外一種形式:

式中,表示由全部N個資產和K個因子構成的某個事后(ex post)最大夏普比率投資組合的夏普比率;
表示由全部K個因子構成的某個事后最大夏普比率投資組合的夏普比率。因此,GRS統計量可以直觀地理解為:在K個因子之外加入N個資產之后,能夠獲得的最大夏普比率是否顯著高于僅由K個因子實現的最大夏普比率,如果夏普比率顯著提高,那么該因子模型就不能解釋這N個資產。注意,即便原假設被拒絕,也僅能說這N個資產作為一個整體無法被該多因子模型解釋,但卻無法知道具體哪個或哪幾個資產發揮了作用,這是因為GRS檢驗是聯合檢驗。2.5.3節將從式(2.68)引出GRS統計量的幾何解釋。
2.5.2 均值—方差張成檢驗
Huberman and Kandel(1987)提出的均值—方差張成(mean–variance spanning)檢驗是另一種常見的聯合檢驗手段。從名字就不難看出來,這種方法和Markowitz(1952)提出的現代投資組合理論(Modern Portfolio Theory)以及均值—方差分析有著緊密的聯系。Kan and Zhou(2012)對均值—方差張成檢驗進行了系統而全面的介紹。
這種方法的核心無疑是“張成(spanning)”兩個字。假如市場中有K個因子投資組合;通過按各種不同的權重配置它們又能得到許多新的組合。對于每個給定的預期收益率,都能找到這K個資產的唯一一種配置權重,使得該組合是所有預期收益率等于
的組合中方差最低的,這個特殊的投資組合就是預期收益率為
的最小方差組合。把不同
的最小方差組合都繪制在橫坐標為標準差、縱坐標為預期收益的二維平面內,就得到了最小方差前沿(minimum–variance frontier),它的形狀是一個拋物線,如圖2.8所示。

圖2.8 最小方差前沿
圖2.8中的最小方差前沿就是由這K個因子張成的(spanned),這就是這種方法得名的原因。而這種檢驗所關注的問題是,加入N個新的(來檢驗該模型的)資產后,這全部N+K個資產張成的新的最小方差前沿能否“優于”僅由K個因子張成的最小方差前沿。這里,“優于”意味著對于每一個給定的,N+K個資產張成的前沿上的點都比K個因子張成的前沿上的點有更低的方差,這就是均值—方差張成檢驗的直觀解釋。
下面來看看數學上的這種檢驗的原假設是什么。令代表t期N+K個資產的收益率向量,其中R1t和R2t分別為K個因子和N個資產的收益率向量。接下來,定義這N+K個資產的預期收益率和收益率的協方差矩陣:

由多因子模型可知:
R2t=α+βR1t+εt (2.70)
利用μ和V可以求出α=μ2-βμ1以及。接下來,定義δ=1N-β1K(其中1N和1K分別為N和K階元素全是1的向量)。由此,Huberman and Kandel(1987)給出了均值—方差張成檢驗的原假設的充要條件:
H0:α=0N, δ=0N (2.71)
式中,0N表示N維零向量。當原假設式(2.71)成立時,對于任何一個用來檢驗的資產(或這些資產的組合),總能使用原始的K個因子來構建一個投資組合,并使得該投資組合的預期收益率和測試資產的預期收益率相同,但方差更低。其中前者由α=0N和δ=0N(即β1K=1N)保證;而后者由式(2.70)中R1t和εt不相關,且var(εt)>0保證。這兩條關于預期收益率和方差的性質說明,這N個資產無法在K的基礎上張成更優的最小方差前沿,因此可以接受原假設。
除了上述數學含義外,從由全部N+K個資產張成的最小方差前沿上也能夠找到上述原假設的直觀解釋。Kan and Zhou(2012)指出,在這個最小方差前沿上存在兩個特殊的投資組合。其一是全局最小方差組合(global minimum–variance portfolio),其二是從均值—方差二維平面的原點向最小方差前沿做切線的切點。如果原假設成立,則條件δ=0N意味著全局最小方差投資組合中,N個資產的權重都是零,即該組合完全由K個因子構成。類似的,條件α=0N意味著切點投資組合中N個資產的權重都是零,因此該組合同樣完全由K個因子構成。換句話說,這兩個特殊的投資組合均僅僅由K個因子構成,而N個資產對它們沒有任何貢獻。另外,在投資組合理論中,有一個重要的定理叫作“兩基金分離定理”(two-fund separation theorem)。它的含義是,使用最小方差前沿上的任意兩個組合就能構造出整個前沿,即前沿上的其他組合都可以由這兩個投資組合的某種線性組合得到(Merton 1972)。根據“兩基金分離定理”,如果這兩個投資組合中均不包含N個測試資產,那么整個由N+K個資產構成的最小方差前沿上的所有投資組合都不包含這N個資產,這便解釋了為什么α=0N和δ=0N是原假設成立的充要條件。
雖然以上直觀地解釋了均值—方差張成檢驗要干什么以及它的原假設是什么,但為了進行檢驗,還是要用到具體的統計檢驗量的。在這方面,Huberman and Kandel(1987)一文最早提出了似然比(likelihood ratio)檢驗統計量。而Kan and Zhou(2012)又通過Wald檢驗和拉格朗日乘數(Lagrange multiplier)檢驗構建了兩個檢驗統計量。這三個檢驗統計量在大樣本下都漸進滿足自由度為2N的χ2分布。
這三個統計量的表達式十分接近,且均和兩個重要參數s1和s2有關。關于這兩個參數,Kan and Zhou(2012)給出了一個非常直觀的經濟學解釋。為了介紹它,首先需要一些鋪墊。考慮圖2.9所示的均值—方差平面中由K個因子張成的最小方差前沿。在縱軸上取(0, r)點并從它向最小方差前沿做切線,找到切點組合。定義:

它表示這條切線的斜率。由于不同的(0, r)點會產生不同的切線,因此是r的函數。當r等于無風險利率Rf時,
恰恰就是從(0, Rf)出發得到的切點組合的夏普比率(Sharpe 1966a)。

當把N個資產加入后,使用全部N+K個資產張成最小方差前沿并按類似式(2.72)的方式定義便可得到s1和s2的表達式:

最后,通過s1和s2求出似然比檢驗、Wald檢驗以及拉格朗日乘數檢驗的統計量(分別記為LR、W和LM):

這三種檢驗的統計量雖然略有差異,但它們都是以某種形式將s1和s2“加”起來作為一個綜合的分數來檢驗原假設的。由s1和s2的定義可知,人們實際上是在均值—方差平面的縱軸上搜尋兩個特殊的r。對于第一個r,由K和N+K個資產張成的最小方差前沿上的相應的兩個切點的值差異最大;對于第二個r,由K和N+K個資產張成的最小方差前沿上的相應的兩個切點的
值差異最小。這三種統計量以這兩個特殊r下兩個前沿的綜合差異來檢驗它們是否在統計上有所不同,一旦結果顯示統計上并無顯著不同,就接受原假設。以上是大樣本下三種均值—方差張成檢驗的統計量。當樣本量T較資產數N+K不足夠大時,使用上述統計量并不準確,更好的方法是像GRS檢驗一樣計算有限樣本下的統計量。從數學上推導有限樣本下統計量的表達式十分煩瑣,且超出了本書的范疇。好消息是,Kan and Zhou(2012)給出了這些統計量的幾何解釋,2.5.3節將對其進行介紹。
關于均值—方差張成檢驗的應用,一個很有代表性的例子是Han et al.(2016)。三位作者針對美股提出了一個趨勢因子,它不同于傳統的動量或反轉,而是將不同時間尺度下收益率的動量和反轉現象綜合到一起,構建了一個綜合的趨勢因子。該文使用新的趨勢因子作為測試資產,用傳統的短期反轉、中期動量以及長期反轉因子作為解釋變量,通過均值—方差張成檢驗進行了分析。結果顯示,這三個因子無法解釋新的趨勢因子,即加入新的趨勢因子后,最小方差前沿將會得到顯著提升。
2.5.3 從幾何角度比較GRS和均值—方差張成
對比式(2.75)~式(2.77)中的統計量(并代入s1和s2的定義)和式(2.68)中GRS檢驗的統計量,能夠發現這些表達式中都有。只不過GRS檢驗中的
默認的是用無風險收益率Rf計算的夏普比率,而均值—方差張成檢驗中的
使用一般的r計算,這意味著它們之間注定有一些關聯。
不嚴格地說,無論是GRS檢驗還是均值—方差張成檢驗都是為了檢驗新增加的N個資產能否在原始的K個因子上提高投資組合的風險收益的特征的。如果答案是肯定的,那么就拒絕原假設,即這N個資產聯合起來無法被K個因子解釋。既然是為了同一個目標,那么它們之間又有什么差異呢?最直觀的說明無異于使用幾何方法解釋它們的含義,這就是本節的重點。從現代投資組合理論中的有效前沿(efficient frontier)說起。
首先假設市場中存在無風險收益率Rf,且人們能夠沒有任何限制地按照Rf來借貸。在這種情況下,現代投資組合理論指出有效前沿是圖中經過(0, Rf)和切點組合的直線(圖2.10(a))。無論一個人能容忍的最大風險(即
)是什么,都應該通過無風險資產和切點組合(tangency portfolio)的某種線性組合實現最優選擇,因為這條線的斜率最高,意味著有效前沿上任何點的夏普比率都最高。
GRS檢驗假設市場中存在無風險收益率Rf,且可以無約束借貸。回顧一下式(2.68)不難發現,GRS檢驗關注的核心是在加入N個資產之后,使用全部N+K個資產得到的切點組合能否比僅僅使用K個因子得到的切點組合有更高的夏普比率。除切點組合外,GRS檢驗不關心最小方差前沿上的其他點。圖2.11進一步說明了這一點。

圖2.10 有效前沿

圖2.11 GRS檢驗的幾何解釋
為了方便解釋,圖2.11中的縱坐標采取了相對Rf的超額收益。如果被檢驗的多因子模型無法解釋N個資產,那么在加入N個資產后能夠顯著提升切點組合的夏普比率。在圖2.11中,從橫坐標上的點出發做一條豎直線,它和兩條切線分別相交于A、B兩點。由夏普比率定義可知,A、B兩點的縱坐標恰恰就分別等于
。由此可知,
分別為線段OA和OB的長度。回顧一下GRS統計量式(2.68),它正是由
之比計算的。因此GRS檢驗的幾何意義就是考察線段OB的長度是否顯著大于線段OA的長度。
接下來看看均值—方差張成檢驗的幾何含義。作為回顧,前面2.5.2節介紹了三種統計量,并指出這些統計量是大樣本下的漸進性質。本節的幾何解釋則給出了這些統計量在有限樣本中的含義。前面的介紹已經指出,GRS檢驗假設市場中存在無風險收益率Rf,以及可以按Rf無約束借貸,因此它僅關注切點組合。與GRS檢驗不同,均值—方差張成檢驗并不假設Rf的存在,因此適應更廣泛的情況。
當不存在無風險收益率Rf時,有效前沿由最小方差前沿的上半部分組成(圖2.10(b))。因此,為了比較K個因子張成的前沿和全部N+K個資產張成的最小方差前沿,僅僅比較切點組合是不夠的——事實上,因為不存在Rf,因此也沒有傳統意義上的切點組合。這種情況的解決之道是,從兩個最小方差前沿上找到兩個特殊的點進行比較,這正是均值—方差張成檢驗的幾何含義。而三種不同檢驗統計量之間的差異僅僅因為它們各自選擇的特殊點不盡相同。
圖2.12展示了不同檢驗統計量用到的關鍵點。圖中gK和gN+K分別為由K個因子和全部N+K個資產張成的事后最小方差投資組合,這兩個點代表的投資組合的標準差的大小由線段OD和OC的長度表示。接下來,以這兩個點向縱軸做垂線,找到點A和點B。從點A出發向K個因子的最小方差前沿做切線,切線和直線=1相交于點G,同樣從點A出發做N+K個資產的最小方差前沿的漸進線,漸進線和直線
=1相交于點H。類似的,以點B為起點,做N+K個資產的最小方差前沿的切線,做K個因子的最小方差前沿的漸進線,它們分別與直線
=1相交于點E和F。除此之外,圖中利用(2.72)的定義給出了線段AG、AH、BE以及BF的長度。使用上述六個線段就可以解釋三種檢驗統計量的幾何意義。
先說似然比檢驗。在有限樣本下,其檢驗統計量[3]滿足F2N,2(T-K-N)分布。按照圖2.12的幾何解釋,似然比檢驗的統計量為:

上式說明LR的大小和兩個比值有關。第一個比值是OD/OC,比較兩個全局最小方差組合的標準差。由于OD≥OC(K個資產構成的最小方差組合的標準差一定不小于N+K個資產構成的最小方差組合的標準差),因此OD/OC≥1。第二個比值是AH/BF,由于N+K個資產張成的事后最小方差前沿一定“優于”僅由K個因子張成的事后最小方差前沿,因此AH/BF≥1。如果原假設成立,即事前(ex ante)兩個前沿一樣,那么可以期待OD/OC和AH/BF都不會顯著地偏離1。如果它們其中之一或者二者全部顯著大于1,那么原假設就會被拒絕。

圖2.12 均值—方差張成檢驗的幾何解釋
對于Wald檢驗和拉格朗日乘數檢驗,在有限樣本下,它們的統計量并不滿足F分布,而是十分復雜的分布。不過,參考式(2.76)和式(2.77),仍然可以寫出它們的幾何含義:

觀察式(2.79)和式(2.80)不難發現,W和LM這兩個統計量的表達式可以說是“完美對稱”的。W中的第一項是(OD/OC)2-1,它反映的仍然是兩個全局最小方差組合的標準差偏離程度,由于OD≥OC,因此該項中用(OD/OC)2減去1;再看LM,它的第一項是1-(OC/OD)2,它和(OD/OC)2-1如出一轍,只不過因為分子、分母互換了位置導致(OC/OD)2≤1,因此該項中是用1減去(OC/OD)2。再看兩個統計量中的第二項。W的第二項涉及BE和BF,它們都從點B出發,BE是點B到全部N+K個資產的最小方差前沿的切線,BF是點B到K個因子的最小方差前沿的漸進線。(BE/BF)2-1則衡量了在K個因子的基礎上加入N個資產導致切線斜率平方的提升。反觀LM的第二項,它包括AG和AH,它們都從點A出發,AG是點A到K個因子的最小方差前沿的切線、AH是點A到全部N+K個資產的最小方差前沿的漸進線。1-(AG/AH)2則衡量了從N+K個資產中去除N個資產(從而僅剩下K個因子)導致切線斜率平方的降低。這種“對稱”彰顯了幾何解釋之美、數學之美。
2.5.4 α檢驗
前文介紹的GRS檢驗和均值—方差張成檢驗均是聯合檢驗N個資產的定價誤差是否顯著偏離零。與它們不同,本節的α檢驗把每個資產i的αi獨立看待,檢驗其是否為零。在得到所有αi的檢驗結果后,將它們取平均并以此評價多因子模型。
α檢驗實操起來非常簡單。對每個用來檢驗多因子模型的資產(可以是測試資產或其他模型的因子),將其超額收益作為被解釋變量,使用待檢驗的多因子模型作為解釋變量,進行時序回歸,估計其定價誤差的標準誤(計算標準誤時通常會采用Newey–West調整)。有了
和它的標準誤,計算t-值=
。在原假設下,多因子模型可以解釋這些資產,因此αi=0。在得到全部N個資產的
和t-值之后,將它們的絕對值取平均作為評價多因子模型的依據。取絕對值的原因是,此處只關心定價誤差相對于0的偏離程度,而非其方向。因此,α檢驗關注的兩個評價指標就是
的均值以及|t-值|的均值。
α檢驗在多因子模型的比較中應用非常廣泛。最常見的做法是使用同一組測試資產來檢驗不同的多因子模型,并以上述指標偏離零的程度來評價多因子模型的“好”與“差”。這兩個指標越低,說明一個多因子模型越能夠解釋這些資產,因而是“更好”的模型。在實證資產定價研究中,應用α檢驗來比較模型的例子數不勝數,Hou et al.(2015)和Fama and French(2020)就是其中的代表。最后值得一提的是,α檢驗經常和GRS檢驗同時使用。在本書第4章介紹多因子模型時,也將同時使用這兩種檢驗方法進行實證分析。
2.5.5 貝葉斯方法
由Barillas and Shanken(2018)提出的貝葉斯方法[4]也常被用于多因子模型的比較。該文作者是計量經濟學大佬,且又發表于金融學頂刊Journal of Finance,因而備受關注。考察多因子模型:

令Σ=cov(εt),如果原假設α=0成立,那么預期收益率就滿足E[Re]=βλ。Barillas and Shanken(2018)提出的貝葉斯方法假設多因子模型的參數β和Σ滿足特定的非正常先驗分布(improper prior)[5]。而對于參數α,它在原假設下為零,在備擇假設下滿足多元正態條件分布f(α|β, Σ)=N(0, τΣ)(τ>0是一個參數)。在該方法中,因子收益率和資產收益率為觀測到的數據。有了參數和數據,Barillas and Shanken(2018)通過計算邊際似然度(marginal likelihood)來比較不同的多因子模型。令D代表數據、Mi代表第i個模型,則邊際似然函數為:

由定義可知,邊際似然度是在給定模型Mi下,觀察到數據D的條件概率。在貝葉斯模型比較中,不同模型的后驗概率比與它密切相關。假設兩個多因子模型Mi和Mj,則它們的后驗概率之比滿足:

式中,等號右側第一項是兩個模型先驗概率之比;而第二項就是它們的邊際似然度之比,它又被稱為貝葉斯因子(Bayes factor)。在多因子模型比較中,通常假設兩個模型的先驗概率一樣,因此邊際似然度的高低就會最終主宰模型的選擇。
上述描述雖然簡要,但它就是Barillas and Shanken(2018)一文的核心。利用該方法,Stambaugh and Yuan(2017)比較了他們提出的四因子模型和Fama and French(2015)五因子模型以及Hou et al.(2015)四因子模型。該文是將貝葉斯方法用于多因子模型比較的代表性研究之一。相較于GRS檢驗或均值—方差張成檢驗來說,貝葉斯方法在學術界的使用要少一些。這一方面和它被發表的時間較短有關[6],另一方面該方法也存在一些被質疑的地方。
2020年,貝葉斯統計學的大佬Siddhartha Chib同樣在Journal of Finance發文對Barillas and Shanken(2018)的方法提出了挑戰(Chib et al.2020)[7]。該文直截了當地認為Barillas and Shanken(2018)的方法有誤,并給出了改進方法。
Chib et al.(2020)指出上述貝葉斯方法中參數的先驗設定存在問題。簡單地說,在具體使用時,在參數β和Σ所滿足的非正常先驗分布中需要確定一個常數的取值。而只有當所有待比較的多因子模型滿足以下三個性質時,采用邊際似然度來挑選模型才是合理的。這三個條件是:(1)不同模型的參數βi和Σi(下標i代表模型i)滿足同樣的非正常先驗分布;(2)該分布中的常數對所有模型相同;(3)不同模型的參數空間一樣。Chib et al.(2020)進一步指出Barillas and Shanken(2018)的模型并不滿足上述三個條件,因此使用(2.82)來比較模型是不正確的。針對上述問題,他們對不同模型的參數βi和Σi需滿足的先驗分布進行了修正,并提出了改進的貝葉斯方法。由于貝葉斯方法尚存疑問,因此本書不再對其做進一步的討論,感興趣的讀者可參考相關文獻。
[1]隨著行為金融學的發展,越來越多的學者開始從這個角度提出新的因子,這些因子背后的邏輯往往不是風險補償,而是錯誤定價(mispricing)。本書的第6章在介紹因子研究現狀的時候會涉及大量行為金融學方面的內容。
[2]第4章會就Liu et al.(2019)提出的中國版三因子模型進行具體的實證分析和探討。
[3]假設用來檢驗多因子模型的資產數滿足N≥2。當N=1時,統計量的表達式與N≥2時不同。
[4]該方法最早的版本是一篇2015年的研究手稿(working paper),在學術界得到了廣泛的傳播。不過,該論文的正式版最終于2018年發表于金融學頂刊Journal of Finance。一些使用該方法的論文引用了其早期的版本,并發表于2018年之前。本書在引用參考文獻時首選正式發表的版本,故而引用了Barillas and Shanken(2018)這個版本。如果行文中引用了一篇先于該文發表的、卻使用了貝葉斯方法的論文,請勿感到詫異。
[5]非正常分布指的是在其參數空間上的積分是無窮大的分布。在貝葉斯統計中,如果后驗概率是正常的,那么仍然可以使用非正常先驗分布。
[6]將貝葉斯方法應用于資產定價的研究早在20世紀80年代就出現了,見Shanken(1987),Harvey and Zhou(1990)以及McCulloch and Rossi(1991)。
[7]這兩篇文章都發表于金融學頂刊Journal of Finance。Barillas and Shanken(2018)一文的題目是Comparing asset pricing models,而Chib et al.(2020)則直接在前文題目之前加了一個On表示評價,即On comparing asset pricing models,可謂“火藥味十足”。