- 心理與教育研究中的多元統計方法
- 曹亦薇 張一平
- 2185字
- 2019-11-29 16:46:32
2.6 對四類離差平方和[1]的補充說明
進行ANCOVA, MANOVA等分析時,需要計算各種離差平方和。SPSS, SAS等統計軟件根據研究的各種假定以及由多個效應組成的列聯表單元格內次數均衡的程度,設計了四種計算離差平方和的方法,分別稱為類型Ⅰ,Ⅱ,Ⅲ及類型Ⅳ平方和(TypeⅠ,Ⅱ,Ⅲ,ⅣSum of Squares)。前三種方法適用于單元格內不存在缺失數據的情況,類型Ⅳ適用于單元格內存在缺失數據的情況,其中類型Ⅲ是默認值。
類型Ⅰ此方法也稱為平方和分級解構法。類型Ⅰ的一個明顯特點是各因素效應的離差平方和依照因素投入次序的不同而不同。具體來說,該方法計算每一項因素的效應時只針對它前面的效應項進行調整。類型Ⅰ離差平方和常用于:①均衡的ANOVA模型,其中任何一個主效應均先于所有一階交互效應之前指定和計算,任何一階交互效應均在二階交互作用之前指定并計算;②多項式回歸模型,其中低階項均在高階項之前指定和計算;③純嵌套模型,其中第一個指定的效應嵌套在第二個指定的效應中,第二個指定的效應嵌套在第三個指定的作用中,依此類推(此嵌套形式只能通過語法執行)。
類型Ⅱ此方法用在為所有其他“相應的”效應進行調節的模型中計算某個效應的離差平方和。不同的統計分析方法中,“相應的”效應的定義范圍略有不同。例如在ANOVA中,所謂某個因素主效應的“相應的”效應是指不包含正在檢驗的效應以及該效應與其他效應的交互作用。但在ANCOVA中,因素的“相應的”效應卻包含正在被檢查的效應與協變量的交互作用。
類型Ⅱ常用于:①均衡的ANOVA模型;②任何只有主效應的模型,任一回歸模型;③純嵌套設計(此嵌套形式能通過使用語法執行)。
類型Ⅲ此方法與類型Ⅱ一樣,計算離差平方和時不受因素投入次序的影響。此種方法計算得到的某效應的離差平方和是剔除了該效應之后剩余的全部效應的離差平方和,以及全體效應與該效應的交互作用(如果存在)離差平方和的調整結果。眾多使用者認為類型Ⅲ離差平方和對單元格無缺失值的非均衡模型也有用。在單元格無缺失值的因素設計中,此方法等同于Yates的加權均值平方技術。類型Ⅲ常用于:①任何在類型Ⅰ和類型Ⅱ中列出的模型;②任何無單元格缺失值的均衡或非均衡模型。
類型Ⅳ此方法是針對單元格存在缺失值的情況而設計的。類型Ⅳ常用于:①任何在類型Ⅰ和類型Ⅱ中列出的模型;②任何帶有空白單元格的均衡或非均衡模型。
針對上述介紹,我們用表2.2的模擬數據來查看類型Ⅰ,Ⅱ,Ⅲ離差平方和的計算結果以及協變量的檢驗結果。因為該組數據的分組是均衡的,所以不考查類型Ⅳ的離差平方和。
表2.8是四張檢驗組間與組內效應的結果表,共同特點是各表內均含自變量“組”與協變量X的交互效應。表2.8(a)和表2.8(b)是考查不同投入順序的Ⅰ型離差平方和結果;表2.8(c)和表2.8(d)是分別用Ⅱ型、Ⅲ型方法計算離差平方和及檢驗結果。
首先查看表2.8(a)、表2.8(b)。由于投入的順序不同((a)表是先協變量后自變量,(b)表則相反),它們的Ⅰ型離差平方和是不同的。例如(a)表內協變量效應是336.876,而(b)表內是313.228;自變量也是如此。除此之外,其他數值是一致的。
表2.8(c)是用Ⅱ型方法計算的離差平方和,由于無投入順序的差異故只列一表。比較表2.8(c)與2.8(a)中各效應的差別,主要是截距和組效應數值上的差異。表2.8(d)是用Ⅲ型方法計算的離差平方和。與2.8(a)至2.8(c)各表相比,截距、X、組效應的離差平方和都不相等。但是,表2.8(a)至表2.8(d)內的“組*X”的交互效應、誤差效應、總計、校正總計以及校正模型的離差平方和都相同,說明當列聯表各格內個體次數比較均衡一致時,這幾項效應的離差平方和不受類型方法的影響。根據交互效應的假設檢驗結果,接受回歸系數同質性的假設,可以進行下一步的協方差分析。
表2.8(a)協方差分析中組間與組內的效應檢驗(Ⅰ型平方和,先投入協變量X)

表2.8(b)協方差分析中組間與組內的效應檢驗(Ⅰ型平方和,先投入組效應)

表2.8(c)協方差分析中組間與組內的效應檢驗(Ⅱ型平方和,效應投入無先后影響)

表2.8(d)協方差分析中組間與組內的效應檢驗

表2.9是重新設計的無“組*X”交互效應離差平方和的計算結果。表2.9(a)、表2.9(b)是用Ⅰ型方法計算離差平方和,(a)表是先投入協變量,(b)表是先投入自變量。顯然Ⅰ型方法的特點是變量投入次序不同,離差平方和值不同。同時比較表2.9(a)至表2.9(d),其中誤差、總計、校正總計以及校正模型的離差平方和全都相同,說明無論用何種類型方法計算,這幾項效應的離差平方和均無變化。
聯系2.2小節在介紹協方差分析的前提假設與檢驗統計量時,表2.6中誤差的離差平方和為294.05,與表2.9(a)至表2.9(d)的誤差離差平方和(294.022)基本一致;因素A,即自變量(組)的離差平方和為228.91,與表2.9(a)至表2.9(d)的值(228.936)也基本一致。結合表2.5,我們知道,總離差平方和(SSY=859.83)分別減去誤差和自變量的平方和,即

此值正好與表2.9(a)中協變量X的離差平方和相等。由此可知,2.2小節中我們先剔除協變量的影響后再求調整后的方差分析統計量,其本質是用類型Ⅰ的方法求離差平方和,這當然可行。但是若研究問題再復雜些,例如有兩個協變量時,用類型Ⅰ的方法就會出現不同答案。
表2.9(a)協方差分析中組間與組內的效應檢驗(Ⅰ型,先投入協變量)

表2.9(b)協方差分析中組間與組內的效應檢驗(Ⅰ型,先投入自變量)

表2.9(c)協方差分析中組間與組內的效應檢驗(Ⅱ型)

表2.9(d)協方差分析中組間與組內的效應檢驗
