官术网_书友最值得收藏!

2.1 投資組合排序法

由1.1.2節因子的定義可知,一個因子代表了不同資產收益率的某種驅動力,而該因子的收益率就是這些資產的共性收益。然而在上述定義中,因子是十分抽象的。因子收益率是什么呢?它又如何計算呢?舉例來說,股票市場的整體估值水平和股票的收益率密切相關,估值的高低能夠影響股票收益率的共同漲跌。又比如,股票市場作為經濟的晴雨表,股票收益率的高低又都受到宏觀經濟好壞(如GDP的高低)的影響。這些例子說明,像估值、GDP這些都可以作為因子來解釋股票的收益率,但是如何定量計算它們的收益率呢?為了回答問題,就要用到實證資產定價和因子投資中的一個非常重要的概念——因子模擬投資組合(factor mimicking portfolio)。如果說因子是抽象的,那么因子模擬投資組合就是這個抽象概念的實際載體,它是定量研究和使用因子的出發點。

2.1.1 因子模擬投資組合

因子模擬投資組合是使用股票資產、圍繞某目標因子構建的投資組合;該投資組合需滿足以下兩個條件:

? 條件一:該投資組合僅在目標因子上有大于零的暴露、在其他因子上的暴露為零;

? 條件二:在所有滿足條件一的投資組合中,該投資組合的特質性風險(idiosyncratic risk)最小。

以下通過一個假想的例子逐條解讀這兩個條件。假設有兩個因子A和B以及四支股票。表2.1給出了這些股票在這兩個因子上的暴露以及它們的特質性風險。接下來按上述兩個條件來構建因子A的因子模擬組合。

首先來看一個錯誤的做法,即按同等資金權重配置股票一和股票二。它們在因子A上的因子暴露都很高,似乎能夠反映出因子A的收益率。然而,這種做法之所以錯誤,是因為這兩支股票在因子B上的因子暴露也非常高。因此,由它們二者構成的投資組合的收益率將受到因子A和B的共同影響。這個問題就體現出滿足上述定義中第一個條件的重要性:因子模擬投資組合的收益率應該僅由目標因子驅動,而不受其他因子的影響(意味著投資組合對于其他因子的因子暴露為零),這才能純粹反映出該目標因子的收益。按照這個條件,可以選擇按同等資金權重配置股票一和股票三。由于它們在因子B上的暴露取值相反,因此這二者構成的投資組合僅在因子A上有暴露,滿足第一個條件。

表2.1 股票和因子暴露及特異風險示意

上面第一條雖然很關鍵,但是在它的限制下,得到的投資組合并不一定是唯一的。比如同等權重配置股票一和股票三滿足第一個條件;類似的,同等權重配置股票一和股票四也滿足第一個條件。那么,它們是否都可以作為因子A的因子模擬組合?還是需要進一步取舍呢?這時就要給出第二個條件——因子模擬投資組合的特質性風險最小。該組合的特質性風險由構成它的個股的特質性風險決定。對于多因子模型來說,個股的特質性風險源自個股收益率在時序上的隨機擾動,即式(1.5)中的εt。對于一個滿足條件一的投資組合,它的收益率由兩部分驅動,分別為目標因子和構成該組合的個股的特質性風險。

如果該組合中特質性風險很高,那么特質性風險的影響就會壓過目標因子而占主導地位,這會給因子收益率的計算帶來較大的誤差。換句話說,只有盡可能地排除特質性風險的影響、使得該投資組合的收益中的絕大部分都由目標因子驅動,才能夠準確地計算因子的收益率。這正是第二個條件背后的動機。因子模擬投資組合是所有滿足條件一的投資組合中,特質性風險最低的?;氐缴厦娴睦?,在股票一和股票三、股票一和股票四這兩個組合中,由表中數據可知,后者的特質性風險要低于前者,因而滿足條件二。因此,根據因子模擬組合需滿足的兩個條件,最終可通過等權重配置股票一和股票四構建了因子A的因子模擬投資組合。

有了因子模擬投資組合,就可以計算因子收益率了。從定義出發,因子模擬投資組合就是針對某目標因子構建的投資組合;在條件一和條件二的約束下,該投資組合的收益率應盡可能地僅由目標因子驅動,因此該投資組合的收益率就是因子收益率。從上面的例子也不難看出,為了構建因子模擬組合,首先需要知道資產在不同因子上的暴露。在因子暴露已知的前提下,人們可以通過不同的方法來構建因子模擬投資組合。在眾多方法中,有一個簡化的方法在學術界的實證資產定價研究和業界的因子投資中均得到了廣泛的應用,它就是投資組合排序法(portfolio sort),簡稱排序法。

2.1.2 排序法及其檢驗

大量研究發現,股票的收益率受很多因子的影響。因性質不同,因子又可以被分為不同的種類。以2.1節開篇舉的兩個例子來說,圍繞諸如估值這類股票的財務信息或者量價數據構建的因子代表了最主流的一類因子,它們被稱為股票的風格因子(style factor),典型的風格因子還包括市值、盈利、低波動等;而像圍繞GDP這類經濟數據構建的因子則被稱為宏觀經濟因子。因子的種類遠不止風格因子和宏觀經濟因子兩類,上面的例子只是為了說明數據的屬性決定了因子的類別。有必要指出的是,本節介紹的排序法是針對風格因子構建因子模擬投資組合的一種簡化方法。對于其他類型因子,比如宏觀經濟因子,該方法并不適用(2.2節會說明如何處理其他類型的因子)。話雖如此,由于風格因子在股票多因子模型中的地位無人能及,這種方法得到了廣泛的使用。

前文2.1.1節的例子說明,構建因子模擬組合的前提是知道所有股票在該因子上的暴露。由式(1.3)可知,股票在某因子i上的暴露βi反映的是在控制了其他因子后,該目標因子的收益率變化對股票超額收益變化的影響程度。這意味著首先需要知道因子收益率才能計算因子暴露。而從前文可知,首先需要有因子模擬組合才能計算因子收益率,而因子暴露又是構建因子模擬組合的前提條件。這種矛盾似乎讓人們陷入“先有雞還是先有蛋”的怪圈。排序法最大的優勢則在于它舍棄了“因子暴露已知”這個條件,從而繞過了上述“怪圈”。

下面以賬面市值比(book-to-market ratio,BM,即市凈率的倒數)這個經典的估值指標為例介紹排序法。雖然BM是一個估值指標,但依照學術界的慣例,將通過它構建的因子稱為價值因子而非估值因子。本書遵循上述慣例。在排序法中,將股票排序的變量(比如BM)被稱為排序變量(sort variable,簡稱變量)。排序法中最核心的思想是使用個股在該變量上取值的大小來代替個股在該因子上暴露的高低。需要強調的是,該方法并沒有假設變量的取值等于因子暴露,也沒有假設這二者之間滿足某種特定的數學關系。該方法僅假設變量和因子暴露是相關聯的。以BM為例,該方法認為高BM的股票在圍繞BM構建的價值因子上的暴露更高,低BM的股票在圍繞BM構建的價值因子上的暴露更低,僅此而已。在這個核心思想下,人們雖然不知道個股在該因子上的暴露,但是卻可以通過變量的高低來代替它,并以此為依據構建因子模擬投資組合。這正是排序法的方便之處。同時,這也解釋了排序法為什么僅適用于風格因子。對于其他類型的因子(比如宏觀經濟因子),由于難以從個股本身的數據出發找到和因子暴露相關的變量,自然也就無法使用這種方法。

前面說完了排序法的核心思想,下面馬上來介紹它的具體方法。排序法的英文名字是portfolio sort,它的背后包含了“按變量將股票排序”“把股票依排序分組構建投資組合”以及“定期更新投資組合”三個步驟。

(1)排序:首先確定股票池,并將股票池中的全部股票在截面上按照排序變量(本例中的BM)的取值高低從大到?。ɑ驈男〉酱?a href="../Text/Chapter9.xhtml#note_1">[1])排序。

(2)分組:按排名高低將全部股票分為L組(依照慣例,一般根據變量取值分布的十分位數將全部股票分成10組,即L=10)。做多排名最高的第一組內的股票,并同時做空排名最低的最后一組內的股票而構建一個多、空對沖的投資組合,該投資組合又被稱為價差組合(spread portfolio)。由構建方式可知,價差組合中多、空兩頭的收益率分別為變量取值最高的1/L股票的收益和變量取值最低的1/L股票的收益,它們的差異就反映了圍繞該變量構建的因子的收益率。因此,價差組合正是使用排序法構建的因子模擬投資組合,而價差組合的收益率正是該因子的收益率。需要指出的是,在構建價差組合時,通常要求多、空兩個組合的金額相同,即整個因子模擬投資組合是資金中性的[2]。此外,由于多、空兩個投資組合都包含多支股票,因此需要為它們選擇個股加權方式,其中最常見的是市值加權和等權重。

(3)定期更新:由于個股在變量上的取值并非一成不變的(即代表它們在該因子上的暴露也是隨時間變化的),因此需要定期進行上述兩步,完成對因子模擬投資組合的更新。學術界通常稱上述更新為再平衡(rebalance),且再平衡的頻率多為每月或每年。在每期構建了新的因子模擬投資組合之后,計算該組合在當前時刻和下一個再平衡時刻之間的收益率。在時序上如此往復,就得到因子收益率的時間序列。

通過排序法,人們可以方便地構建因子模擬投資組合,計算因子收益率以及由排序法得到的L個投資組合的收益率。一旦有了這些數據,檢驗因子預期收益率,以及考察L個投資組合收益率的單調性就構成了檢驗的內容。學術界將上述檢驗稱為投資組合排序檢驗(portfolio sort test)。下面依次說明這兩個檢驗內容。

投資組合排序檢驗最重要的目的是檢驗因子預期收益率。在關于因子的研究中,原假設通常為因子預期收益為零。由第1章的定義可知,因子的預期收益率應該大于零。因此,檢驗關注的是依據樣本數據計算出的因子收益率,能否在給定的顯著性水平下拒絕原假設。令{λt}(t=1, 2, ···, T)代表因子收益率時間序列,則因子預期收益率的估計以及其標準誤(standard error)s.e.分別為:

其中std(λt)表示λt的標準差。上式說明將{λt}在時序上取平均值就得到預期收益率的估計。有了,便可在原假設下(即λ=0)計算t-值(t-statistic),進行t-檢驗:

它滿足自由度為T-1的t分布。根據t-值和t分布可計算出(雙尾)p-值,通過t-值或p-值就能夠判定在給定的顯著性水平下接受或拒絕原假設。依照學術界的慣例,通常使用0.05和0.01的顯著性水平,在大樣本下它們對應的t-值閾值分別約為2.0和2.6。因此,一旦樣本數據計算出的收益率的t-值高于2.0,就認為該結果在原假設下是顯著的[3]。如果原假設(因子預期收益率為零)無法被拒絕,那么被研究的因子就不滿足預期收益率大于零的要求,因此t-值是否高于2.0就是一個重要的判定依據[4]。本書第3章到第5章的實證分析中將匯報檢驗結果的t-值。

除此之外,由于一個好的因子應能夠解釋個股超額收益的截面差異,因此排序法關注的第二個問題就是依照排序變量高低得到的L個投資組合的收益率是否有很好的單調性,這可以通過計算收益率和排序變量分組的秩相關系數(rank correlation coefficient)來檢驗。秩相關系數和相關系數類似,不同的是計算時將觀測值轉換為觀測值的排位(rank),因此它考察的是兩個隨機變量之間的單調相關性。統計學中有多種計算秩相關系數的方法,其中最流行的要數Spearman秩相關系數(以Charles Spearman命名)。將L個投資組合的收益率的高低排位記為Xr、將它們依排序變量的分組的高低排位記為Xg,這二者的相關系數即為收益率和排序變量分組的秩相關系數ρs

從式(2.4)中不難發現,當L個投資組合的收益率隨變量分組完美單調遞增時,二者的秩相關系數為1;而當這些收益率隨變量分組完美遞減時,這二者的秩相關系數為-1。

下面仍以BM為例對上述檢驗進行說明。通過排序法將A股市場中的股票按照BM高低分為L=10組(記為Low,2,···,9,High,其中Low代表BM最低的一組、High代表BM最高的一組),每組內股票按總市值加權配置,每月再平衡[5]。此外,通過做多BM最高的一組(即High組)、做空BM最低的一組(即Low組)構建價值因子投資組合。表2.2給出了對價值因子預期收益率的檢驗結果,以及這10個投資組合預期收益率的檢驗結果(這是學術界的常見做法)。從檢驗結果可知,因子月均收益率為0.88%,標準誤為0.47%,t-值為1.85,p-值為0.07,因此可以在0.1的顯著性水平下拒絕原假設。

表2.2 BM排序檢驗結果

接下來,為了從視覺上更好地呈現單調性,圖2.1展示了利用BM排序得到的10個投資組合的月均收益率,它們基本隨BM的增加而變大。利用式(2.4)計算可知,這10個投資組合的收益率和BM分組的秩相關系數高達0.94(p-值為5.48×10?5),表現出顯著的單調性,且收益率和BM取值之間呈正相關。

由于簡單易用,排序法在學術界和業界關于風格因子的研究中得到了廣泛的應用。值得一提的是,在前文介紹排序法的時候默認的都是使用單一變量對股票排序,因此它也被稱為單變量排序(univariate sorting)。但不要忘記,排序法僅僅是構建因子模擬投資組合的一個相對“粗暴”的方法。根據定義,因子模擬投資組合應該在非目標因子上沒有暴露,然而排序法卻難以控制其他因子的影響,這是它最大的缺點。舉個假想的例子,如果高BM的股票全都是大市值股票、低BM的股票全都是小市值股票,那么當使用BM這個單一變量排序的時候,構建的價差組合在無形之中也同時做多了大市值股票、做空了小市值股票。因此,這個價差組合雖然是圍繞BM構建的,但其收益率卻受到BM和市值的共同影響,因而難以客觀評估BM的貢獻。為了盡可能排除其他因子的干擾,常見的做法是使用多個變量進行雙重排序或三重排序,這些方法統稱為多重排序法。

圖2.1 按BM排序得到的10個投資組合的月均收益率

2.1.3 多重排序法

1. 雙重排序

在多重排序法中,最重要的是雙重排序(double sorting或bivariate sorting)。所謂雙重排序,即按照兩個變量排序并構建因子模擬投資組合??紤]兩個排序變量X1X2,將股票按照這兩個變量分別劃分為L1L2組,一共得到L1×L2個組合。在雙重排序時,一處非常關鍵的細節是使用這兩個變量分別獨立對股票排序,還是這兩個變量在排序時存在先后的依存關系。前者被稱為獨立雙重排序(independent double sorting或unconditional double sorting),或者被稱為條件雙重排序(dependent double sorting或conditional double sorting)。

首先來看獨立雙重排序的情況。假設使用兩個排序變量分別獨立地把股票劃分成5組,即L1=L2=5,它們兩兩取交集一共得到25個投資組合,如圖2.2中的P11P55所示。在劃分時,最常見的做法是取這兩個變量各自的五分位數。這25個投資組合中股票的權重可以采用等權重或市值加權。接下來,通過這25個組合就可以圍繞給定的變量構建因子模擬投資組合了。以X1為例,構建的思路和單變量排序一樣,仍然是做多在該變量上排名高的股票、做空在該變量上排名低的股票,并滿足資金中性。由于采用了雙重排序,因此對于變量X2的每一檔,都存在一個在變量X1上排名高的投資組合。換句話說,一共有L2(=5)個這樣的組合,它們是P51P52、P53、P54以及P55。類似的,一共有L2(=5)個在變量X1上排名低的組合,它們是P11、P12P13P14以及P15。最后,等權重做多L2(=5)個高排名組合、做空L2(=5)個低排名組合,就得到了圍繞X1構建的因子投資組合。令Rij,t代表投資組合Pijt期的收益率,則該因子第t期的收益率為:

圖2.2 獨立雙重排序法示例

在獨立雙重排序中,兩個變量的地位是完全對稱的,因此很容易就可以得到圍繞X2變量構建的因子投資組合,它通過做多L1(=5)個在變量X2上高排名組合(P15、P25、P35、P45以及P55)、做空L1(=5)個在變量X2上低排名組合(P11、P21、P31P41以及P51)而構成,并滿足資金中性。該因子第t期的收益率為:

有了因子收益率的時間序列,就可以像2.1.2節一樣如法炮制,計算t-值并檢驗因子預期收益率。值得一提的是,如果把式(2.5)和式(2.6)中的投資組合收益率重新排列一下,就可以得到另一種等價的形式:

下面以式(2.7)為例進行解讀。它表示從每一個X2變量分組i內挑出X1變量排名最高和最低的兩組,即R1i,并計算它們的差。然后把一共L2(本例中是5)個取平均,就得到。式(2.7)和式(2.5)的區別是,式(2.5)是對這5個高排位和5個低排位投資組合“先分別取平均、再做差”,而式(2.7)則是將它們兩兩“先做差、再取平均”。在數學上,這兩種方式完全是等價的,而式(2.5)的方式也確實是常見的計算因子收益率的方法[6]。但是,之所以介紹式(2.7)和式(2.8)這種表達式,是因為它們經常被用于對異象的研究中。

在學術界針對美股市場異象的研究中,雙重排序法經常被使用。為了檢驗一個新的異象變量可以獲得超額收益,學者們往往用它和已有的因子變量進行雙重排序,從而排除已有因子的影響。在進行分析時,學者們除了關心異象收益率之外,還關心在已有因子變量的每組內,該異象變量是否能區分股票收益率的截面差異?;氐缴厦?span id="cjspdbq" class="content-word-italic">X1X2的例子,為檢驗能否通過X1構建異象,應考察在每個X2分組內,根據X1劃分的L1個分組中最高和最低的組的收益率差異是否顯著[7]。在這種情況下就會關心每個-R1i的取值。以上就是式(2.7)和式(2.8)這兩種表達式也存在的原因。但再次強調的是,當使用獨立雙重排序法時,無論使用哪種表達式都不影響的計算結果。

獨立雙重排序雖然簡單,但它也有一個缺點,即獨立排序可能導致某些組合包含的股票數目過少。舉個例子,假設共有1000支股票,按照X1X2兩變量各分為5組,得到25個組合,平均下來每個組合包含40支股票。當X1X2的截面相關性很高時,那么當一支股票在X1變量取值較高時,它在X2上的取值也會較高。這就會造成這兩個變量相同的分組中——圖2.2中對角線上的組——的股票個數較多,而其他組內(特別是高X1、低X2組以及低X1、高X2組)的股票個數較少。這種分組內股票數量的不平衡將使得最終的因子收益受異常值影響的可能性更高,造成因子收益率的不穩定并且也會影響在實踐中的實施[8]。在實際研究因子時,上述缺點雖然存在,但通常不會帶來太大的問題。這是因為人們通常不會使用截面相關性高的變量做雙重排序。當對參與排序的兩個變量的相關性不確定時,可以計算每組內股票的數量。如果全部L1×L2個投資組合均包含足夠多的股票,那么就沒有太大的問題。

接下來介紹條件雙重排序。它與獨立雙重排序最大的區別是按照給定的順序先后使用兩個變量對股票進行排序。仍然以X1X2兩個變量為例。假設先用X1排序將全部股票劃分成L1組。接下來,在以上每個組內,再用X2排序把屬于該組內的股票進一步劃分為L2個組,最終得到L1×L2個分組。從這個例子中不難看出,條件雙重排序是考察當X1控制之后,變量X2對股票收益率的影響。反之,如果按照先用X2排序、再用X1排序,那就是在考察控制了X2之后,變量X1對股票收益率的影響。

條件雙重分組關心的是當第一個變量被控制之后,第二個變量是否對解釋收益率有增量信息。在這種方法中,兩個排序變量的地位是不對稱的:第一個排序變量僅僅作為控制變量,人們關心的是第二個排序變量和收益率之間的關系,因此只需(也只應)圍繞第二個排序變量構建因子并計算因子收益率[9]。

在條件雙重排序方法中,學術界通常使用以下兩種方法為第二排序變量計算因子收益率。第一種方法和獨立雙重排序法中的收益率公式并無不同。假設X1X2分別為第一、第二排序變量,則圍繞X2構建的因子收益率就如式(2.6)或式(2.8)所示(如果需要計算X1的因子收益率,只需將兩個排序變量的先后順序調換)。除此之外,還有另外一種方法。仍以X1X2分別為第一、第二排序變量為例。在這種方法中,將全部L1X2排名最高的組,即PiL2i=1, 2, ···, L1),以及L1X2排名最低的組,即Pi1i=1, 2, ···, L1),分別取并集:

中的全部股票按照市值加權或等權重配置,構成變量X2的多頭;將中的全部股票按同樣的加權方式配置,構成變量X2的空頭。在每一期t,多頭組合收益率(記為)減去空頭組合收益率(記為),就是在這種方法下圍繞變量X2構建的因子的收益率:

這兩種計算X2(即第二排序變量)因子收益率的方法雖略有不同,但仔細比較它們不難發現,當每個投資組合中的股票都按照等權重配置時,式(2.6)和式(2.11)則是完全等價的。只有當每個投資組合采用非等權重(比如市值加權)時,這兩種方法才略有差異。假設每個投資組合內股票按市值加權配置,當使用式(2.6)時,它多、空兩頭各自的L1個投資組合仍然按照等權重配置;而當使用式(2.11)時,它首先把所有屬于多頭和空頭的股票都挑出來,然后再按照市值加權配置。

最后值得一提的是,條件雙重排序的規則保證了每組內都有足夠多的股票。在本節的例子中L1=L2=5,如果假設這5組是按照排序變量的五分位數劃分的,那么條件雙重排序得到的25個投資組合中有相同數量的股票。在更一般的情況中,兩個變量劃分的組數可以不同,且每個變量用來劃分的分位數也可能有差異,在這時不同組內的個股數量會有差異,但仍然能夠保證有足夠多的股票。

2. 兩點說明

關于雙重排序,還有兩點補充說明。第一點說明,使用雙重排序的目的是排除兩個變量之間的相互影響,從而更準確地計算圍繞每個變量構建的因子模擬投資組合的收益率。在這方面,條件雙重排序比獨立雙重排序是更好的選擇,因為它是在控制了第一個分類變量后、考察第二個分類變量和股票收益率的條件關系。然而,學術界在研究因子時,往往更習慣使用獨立雙重排序。這可能與最初經典的Fama and French(1993)三因子模型使用了獨立排序有關。另外,當研究異象時,為了排除小市值的影響,使用市值和異象變量進行條件雙重排序、構建異象投資組合并計算其超額收益也并不罕見。而在這些研究中,兩種計算收益率的方法均有使用。舉例來說,Bali et al.(2014)在研究尾部風險異象時采用式(2.6)計算異象收益率;而Liu et al.(2019)則使用式(2.11)研究并計算了一系列異象投資組合的收益率。

第二點說明是關于雙重排序時兩個變量劃分的分組數。當學術界研究異象時,當股票池中的股票數量很大時,5×5或10×10都是常見的分組方式。但是當學術界研究因子時,往往采用2×3的劃分,且變量之一是股票的市值。這種處理方法也和Fama and French(1993)三因子模型不無關系。由于該文是多因子模型的開山鼻祖,它的很多處理方法對學術界都有著非常深遠的影響。Fama and French(1993)在構建規模(SMB)和價值(HML)兩個因子[10]時,采用市值和BM進行獨立雙重排序。在排序時,該文按市值把股票分成了大、小市值兩組,按BM把股票分成高、中、低三組,最后兩兩交集構建了2×3=6個投資組合。這種使用市值和另外一個變量進行2×3劃分的獨立雙重排序在Fama and French(1993)之后得到了廣泛的應用,本書第4章會詳細介紹。

3. 三重排序

除前面介紹的雙重排序之外,近年也有部分研究采用了三重排序(triple sorting)。一個典型例子是Hou et al.(2015)提出的四因子模型。該文從實體投資經濟學理論出發推導出預期收益率和投資以及盈利之間的條件關系。此外,考慮到盈利能力和投資效應在小盤股中都更強,為了排除市值的影響,Hou et al.(2015)在構建因子時,使用規模、投資和盈利三個維度的變量進行了三重排序。

排序法及其檢驗是因子研究中最常見的方法之一。它最大的好處是繞過因子暴露,構建因子模擬投資組合、計算因子收益率。它是通過時間序列回歸檢驗股票多因子模型的基礎。在結束2.1節之前,最后再來討論一個問題:因子命名。

2.1.4 因子命名約定

因子命名本身并無嚴格的要求。但之所以需要約定一個命名方式,是因為無論是在學術界的研究還是業界的實踐中,對同一個因子往往有很多不同的稱呼。仍以BM為例。在Fama and French(1993)三因子模型中,兩位作者使用BM和市值雙重排序構建了一個HML因子。HML是High-Minus-Low的首字母縮寫,而其中High代表BM高的股票,Low代表BM低的股票,Minus代表做多前者、做空后者。顯然,人們也可以把它稱作BM因子——這個名字以構建因子的變量為出發點;又或者把它稱為價值[11]因子——這個名字以該變量代表的股票風格(style)為出發點。無論是叫HML因子、BM因子還是價值因子,它們指代的都是同一個因子模擬投資組合、同一個因子。為了本書前后一致性,本小節對書中使用的因子命名方法進行說明。在因子命名時,考慮的因素是命名的方便程度以及名字是否能清晰地傳達因子的含義。

首先,本書不采用Fama and French(1993)的命名方法,原因如下。任何一個變量排序都可以把股票分成高、中、低不同的分組,并構建一個High-Minus-Low組合。如果大家都叫HML因子,則無法加以區分。舉例來說,在Fama and French(2015)五因子模型中包括使用BM構建的HML因子和使用ROE構建的盈利因子。Fama and French(2015)將ROE和市值一起進行雙重排序,并通過做多高ROE的組同時做空低ROE的組構建了該盈利因子。由于High和Low兩個詞已經被HML因子占用了,Fama and French(2015)則想出了使用穩?。≧obust)和疲軟(Weak)來代表高、低兩個ROE組合,并以Robust-Minus-Weak即RMW為該因子命名。這種做法的優點是,它能體現變量和收益率之間是正相關還是負相關。比如無論是HML還是RMW,都代表變量高取值組和變量低取值組的差異,這意味著BM或ROE和股票收益率呈現正相關。而在Fama and French(1993)中,代表規模的SMB因子是Small-Minus-Big的縮寫,它則表示市值和收益率呈現負相關,即小市值股票的預期收益率高于大市值股票。盡管有這一優點,然而一旦人們真正理解了因子背后的原因,就不再需要依靠其命名來暗示變量和收益率的關系。且考慮到這種做法在因子數量越來越多的時候將會對因子命名造成不便,因此本書放棄這種方法。

使用變量本身和使用其代表的風格命名在方便程度上并無太大差異,但由于以下兩個原因,本書作者認為后者更合理。首先,如前所述,風格因子在股票市場中占主宰地位。學術界和業界的絕大多數研究都是關于風格因子。因此,風格比變量本身能更清晰地傳達出因子所代表的含義。其次,在業界的因子投資實踐中,出于穩健性的考慮,往往使用多個指標構建某種風格的因子。比如,業界會同時使用BM和盈利市值比(earnings-to-priceratio,即EP)等多個估值指標構建價值因子。在這種情況下,選擇某個指標對因子命名就會以偏概全。

出于上述考量,本書選擇以變量代表的風格為出發點對因子進行命名。舉例來說,按照本書的約定,將會稱使用BM構建的因子為價值因子,使用ROE構建的因子為盈利因子。

[1]排序法的第二步將會通過做多排名靠前的股票、做空排名靠后的股票構建因子模擬投資組合。一般認為因子的風險溢價為正。這意味著在排序時通常從金融學和經濟學原理考慮變量和收益率之間的相關性。如果變量和收益率呈現負相關,則往往按變量取值從小到大將股票排序。低波動因子就是這樣一個例子。

[2]在針對以美元計價的美股研究中,將其稱為dollar neutral。

[3]t分布的對稱性可知,如果t-值小于?2.0也可以認為結果在原假設下是顯著的。

[4]本書6.1節將介紹學術界的最新研究成果,它們將單個因子檢驗的t-值閾值提升到3.0以上。

[5]本書的第3章將會詳細說明實證分析中的數據處理方式。

[6]比如經典的Fama and French(1993)三因子模型就使用了這種表達式。本書第4章會詳細說明。

[7]除此之外,研究人員也會關心每個給定的X2分組下,以X1排序劃分的L1個投資組合的收益率是否呈現出很好的單調性。

[8]在某些極端情況下,X1X2的某種分組組合的交集甚至可能為空,即沒有任何股票。

[9]Bali et al.(2016)指出在條件雙重排序法中為第一排序變量構建因子并計算因子收益率有很大的不確定性。

[10]本書第4章會詳細介紹包括Fama and French(1993)三因子模型在內的主流多因子模型。

[11]BM本身是一個估值指標。但因為它常被用在價值投資(value investing)中衡量公司估值是否過高,因此無論是學術界還是業界,通常把它稱為價值因子。

主站蜘蛛池模板: 东方市| 米脂县| 黔东| 古蔺县| 华坪县| 丰台区| 林口县| 盱眙县| 金华市| 阿拉善右旗| 吴旗县| 睢宁县| 女性| 西城区| 富顺县| 措勤县| 临洮县| 双牌县| 东乡族自治县| 东兴市| 丹巴县| 元谋县| 墨竹工卡县| 桃江县| 昭平县| 通道| 曲阜市| 沁阳市| 大余县| 文安县| 喀什市| 中方县| 黄大仙区| 景宁| 仲巴县| 西乌珠穆沁旗| 横山县| 泰州市| 桂阳县| 阿拉尔市| 阿瓦提县|