- 心理與教育研究中的多元統計方法
- 曹亦薇 張一平
- 1785字
- 2019-11-29 16:46:31
2.4 協方差分析的功能與注意事項
自Fisher(1932)提出協方差分析方法以來,越來越多的使用者認為只要運用得當,ANCOVA是一個非常有用的工具。ANCOVA可以在實驗研究(experimental research,其特點是抽樣的隨機性和分配的隨機性)的設計中控制干擾變量(協變量),從而提高檢驗力的敏感性,也可以在非實驗研究(non-experimental research,一般以調查等方式為主,往往無法保證上述隨機性)中消除系統偏差、減少誤差方差。所謂系統偏差是指各組在與因變量變化有關的重要變量上存在系統差異。如果有系統偏差的話,各組接受不同的處理后,因變量出現顯著性差異,追究其原因可能是由不同處理造成的,也可能是實驗開始時各組在這個重要變量上不相等造成的。協方差分析就是通過調整因變量來校正實驗開始時各組本身存在的差異。關于誤差方差,很多書里常常會提醒讀者在單因素方差分析變異源中的誤差方差(組內方差)是個大雜燴,凡是無法解釋的變異通通歸為誤差源中。而協方差分析將協變量的變異從誤差變異中單獨列出來以減少誤差變異,從而增加了檢驗力。查看上面圖2.10與圖2.11中的誤差變異即可明白。
盡管協方差分析只是在方差分析模型中增加了一個或數個協變量,但是如果忽視了協變量的質量與選擇,會給統計結果的解釋帶來很大的麻煩。對于初學者來說應該注意以下幾個方面。
(1)協變量與自變量獨立。
從一般線性模型(general linear model)的角度來看,協方差分析中的協變量與分組變量都是自變量,其中協變量是連續變量,自變量是離散變量或分組變量。協變量與自變量相互獨立,是指協變量的變化不受分組影響(即假設各組協變量的樣本平均值間的差異是由抽樣誤差造成的)。在圖2.13(a)中,因變量的總方差由Ⅰ,Ⅱ,Ⅲ三部分組成,其中Ⅰ是因變量自身引起的方差,Ⅱ是協變量解釋的方差,Ⅲ是由自變量解釋的方差;因變量的誤差方差由Ⅰ與Ⅱ組成。刪除了協變量方差后,即調整后的因變量的誤差方差就剩下Ⅰ,調整后的總方差為Ⅰ與Ⅲ之和。
然而如果協變量與自變量無法保證相互獨立,各變量的方差結構就變得復雜起來。觀察圖2.13(b)中增加的Ⅳ與Ⅴ兩部分。因變量的總方差隨即變成由Ⅰ,Ⅱ,Ⅲ,Ⅳ四部分組成;Ⅳ既是協變量解釋的方差又是自變量解釋的方差,Ⅴ是自變量方差中由協變量解釋的部分。盡管調整后的誤差方差(Ⅰ)與調整后的總方差(Ⅰ+Ⅲ)結構不變,但是處理與解釋Ⅳ與Ⅴ這兩部分的方差是比較困難的。因為在這種情況下,調整后的誤差變量(參見公式(2.2)),消除了協變量影響的同時也會消除一部分自變量的效應。一般來說,若事先了解到協變量與自變量相互獨立的話,例如保證分組的隨機性或者事先掌握了自變量的分組對于協變量沒有差異等信息,有助于協方差分析結果的解釋。

圖2.13 協方差分析中因變量方差結構示意圖
(2)協變量的選擇。
所謂協變量,是指與因變量有關的但又不是研究對象的一類連續變量。Miller和Chap-man曾經舉出一些協變量選擇不當的例子。例如年齡為協變量,年級為分組變量,由于這兩個變量相關性很高,協方差分析就變得沒有意義;又如在心理病理學中,抑郁與焦慮情緒同時出現的可能性很大,若將焦慮測量的得分作為協變量處理,抑郁測量的得分的殘差便缺少良好的結構效度。因此協變量的確定是協方差分析中極為重要的一環,尤其是在準實驗研究和非實驗研究中更需慎重,因為在這兩類研究中可以不必滿足分組的隨機性這一前提條件。
(3)協變量的信度與數量。
觀察協方差分析的數學模型(2.1)式,其中的誤差分數εij表示第i個個體所有能夠影響因變量的無法控制的變異源。它是只與因變量有關的隨機變量,不包括協變量的隨機誤差。這就要求協變量需有相當高的信度。理論上協變量中不允許誤差存在,但在實際上又是不可能的。因此一般我們要求協變量的信度至少要在0.8以上。
在前面的說明中,我們重點介紹了單因素協方差分析,即只有一個協變量和一個自變量。其實協變量可以有多個,依研究的實際需要而定。一般來說,我們希望這些協變量與因變量有中等程度以上的相關,但協變量之間的相關性要盡可能低,否則會出現共線性問題(詳細解釋見第3章)。在實際應用時,協變量個數盡量少些是一種明智的選擇。那么是否有較為具體的標準呢?1980年Huitema提出了計算協變量合理個數的公式:[C+(J-1])/N≤0.1。其中,C為協變量的數量,J為處理組數,N為被試總數。例如有三個處理組,被試總數為30,則C≤1,即最多只能有1個協變量。Huitema指出,若[C+(J-1])/N>0.1,即使協方差分析的F檢驗正確,調整后平均值的估計值也會十分不穩定。