- 心理與教育研究中的多元統(tǒng)計(jì)方法
- 曹亦薇 張一平
- 9字
- 2019-11-29 16:46:33
第3章 多重線性回歸
3.1 什么是多重線性回歸
先從一個(gè)簡單的研究說起。作者曾在大學(xué)新生適應(yīng)性研究中發(fā)現(xiàn),新生的愉悅感會(huì)受到多種因素的影響,特別是新生們?cè)诖髮W(xué)的學(xué)習(xí)適應(yīng)狀態(tài)以及人際關(guān)系。新生的學(xué)習(xí)適應(yīng)狀態(tài)以及人際關(guān)系是否直接影響其愉悅感?為此,我們假設(shè)第i個(gè)新生的愉悅感的自評(píng)分?jǐn)?shù)用下面的線性公式來表示:

顯然該公式是線性回歸模型的推廣,自變量由一個(gè)變成兩個(gè),因變量是愉悅感的自評(píng)分?jǐn)?shù)。這樣的回歸模型我們稱為多重線性回歸模型,“多重”是指自變量(或稱為預(yù)測變量)的個(gè)數(shù)超過一個(gè),“線性”是指回歸模型是由自變量的線性組合表示,一般省略為多重回歸模型(multiple regression model)。
表3.1是在2012年某高校大學(xué)新生適應(yīng)性調(diào)查中隨機(jī)抽出的30名學(xué)生的測試分?jǐn)?shù)。
表3.1 大學(xué)新生適應(yīng)性測量結(jié)果(部分)

一般來說,如果有p(p≥2)個(gè)自變量X1,X2,……,Xp,對(duì)某個(gè)因變量Y進(jìn)行預(yù)測或者探索自變量是否為引起因變量變動(dòng)的原因時(shí),可以利用上述回歸模型。表達(dá)式為:

式中,Yi與X1i,X2i,……,Xpi都是連續(xù)變量,下標(biāo)i是指第i個(gè)被試的觀測值(i=1,2,……,n)。β0為截距,β1,β2,……,βp稱為偏回歸系數(shù)(partial regression coefficient),εi為被試i的誤差分?jǐn)?shù),這些參數(shù)都有待估計(jì)。
在公式(3.1)中將不含誤差項(xiàng)的部分稱為因變量Yi的預(yù)測方,

誤差就是因變量i與之間的差

在多重回歸模型中,誤差εi是指隨機(jī)誤差,并有如下假定:
(1)誤差εi可能大于0,也可能小于0,但它的期望值,即平均值為0;
(2)誤差εi的方差與因變量Yi的方差相等,且恒為定值σ2,記為

(3)誤差εi服從期望為0,方差為σ2的正態(tài)分布;
(4)全體誤差之間相互獨(dú)立,在回歸中殘差與各個(gè)X和Y^的相關(guān)均為0。
為方便起見,我們省略被試i的標(biāo)記,如Yi為Y,為
,εi為ε等。根據(jù)多重回歸模型對(duì)誤差的假設(shè),我們還可導(dǎo)
的四個(gè)性質(zhì):
(1)的平均值等于因變量Y的平均值;
(2)與殘差e的相關(guān)系數(shù)為0;
(3)Y的方差等于的方差與殘差方差的和;
(4)與Y的相關(guān)系數(shù)稱為復(fù)相關(guān)系數(shù),記為R(參見圖3.7的
)。
觀察公式(3.2)(3.3)可知:如果求得β0,β1,β2,……,βp的估計(jì)值,就可以用來預(yù)測因變量Y;如果誤差很小,或者在可以接受的范圍內(nèi),則可認(rèn)為自變量(不一定是全部)的預(yù)測效果比較好。
由此可見,應(yīng)用多重回歸分析可以達(dá)到兩個(gè)目標(biāo):一是調(diào)查多個(gè)自變量是否為引起因變量變化的原因;二是探索這些自變量能否有效地預(yù)測因變量。還有人認(rèn)為可用來探索新的理論架構(gòu)。
為了實(shí)現(xiàn)上述目標(biāo),3.2小節(jié)將著重介紹參數(shù)估計(jì)的原理;3.3小節(jié)介紹如何利用SPSS實(shí)現(xiàn)多重回歸分析以及評(píng)價(jià)結(jié)果的正確性與可靠性;3.4小節(jié)討論如何建立有效的多重回歸模型;3.5小節(jié)利用實(shí)際數(shù)據(jù)進(jìn)行多重回歸分析。