官术网_书友最值得收藏!

第1章 描述統(tǒng)計(jì)

1.1 考點(diǎn)歸納

一、統(tǒng)計(jì)圖表

1.統(tǒng)計(jì)圖

(1)概念:統(tǒng)計(jì)圖是用圖形的形式呈現(xiàn)研究的數(shù)量化結(jié)果的一種形式。

(2)組成及特點(diǎn)如下:

統(tǒng)計(jì)圖一般由圖題、變量說明、坐標(biāo)軸及單位、圖形4個(gè)部分組成。常見的統(tǒng)計(jì)圖有線性圖、條形圖、圓形(扇形)圖和組織圖等。

統(tǒng)計(jì)圖比統(tǒng)計(jì)表更直觀,更易于理解。但是,統(tǒng)計(jì)圖和統(tǒng)計(jì)表一樣,不能代替研究報(bào)告中的有關(guān)文字?jǐn)⑹觯荒苡脕韽?qiáng)調(diào)某些重要的數(shù)據(jù)關(guān)系。

不同的統(tǒng)計(jì)圖表達(dá)的效果是有區(qū)別的,即使選用同一種統(tǒng)計(jì)圖,繪制方法的不同(如采用不同的軸單位尺度)也可能造成表達(dá)效果的差異。

2.統(tǒng)計(jì)表

(1)概念:統(tǒng)計(jì)表是用表格的形式呈現(xiàn)研究的數(shù)量化結(jié)果的方式之一。

(2)組成及特點(diǎn)如下:

一個(gè)統(tǒng)計(jì)表通常包括表題、表體和表注三部分。表題是統(tǒng)計(jì)表的標(biāo)題。表體是統(tǒng)計(jì)表的主體內(nèi)容,包括研究的對象或特征,研究對象或特征的指標(biāo)、類別、數(shù)據(jù)結(jié)果等內(nèi)容。表注是對統(tǒng)計(jì)表中有關(guān)內(nèi)容的說明,包括對表的來源、用途等作的注的說明。有時(shí)可以說明統(tǒng)計(jì)推論的結(jié)果和結(jié)論。

研究的對象或特征名稱一般列在表的左邊一列;研究對象或特征的指標(biāo)、類別名稱一般列在表的上邊一欄;同一縱列上的數(shù)據(jù)所保留的小數(shù)位要一致,位數(shù)要對齊。

統(tǒng)計(jì)表的類型主要包括原始數(shù)據(jù)表、次數(shù)分布表和分析結(jié)果表等。

二、集中量數(shù)

1.算術(shù)平均數(shù)

(1)概念:算術(shù)平均數(shù)是所有觀察值的總和除以總頻數(shù)所得之商,簡稱為平均數(shù)或均數(shù)。它是一種集中量數(shù),是某一特質(zhì)“真值”的漸進(jìn)、最佳的估計(jì)值。

表達(dá)公式:

式中N為數(shù)據(jù)個(gè)數(shù),Xi為每一個(gè)數(shù)據(jù),∑為相加求和。

(2)算術(shù)平均數(shù)的優(yōu)點(diǎn)是:反應(yīng)靈敏;計(jì)算方便;適合代數(shù)運(yùn)算;受抽樣變動(dòng)的影響較小。具體表現(xiàn)在以下幾個(gè)方面:

當(dāng)只知一組觀察值的總和及總頻數(shù)就可以求出算術(shù)平均數(shù);

用加權(quán)法可以求出幾個(gè)平均數(shù)的總平均數(shù);

用樣本數(shù)據(jù)推斷總體集中量時(shí),算術(shù)平均數(shù)最接近于總體集中量的真值,它是總體平均數(shù)的最好估計(jì)值;

在計(jì)算方差、標(biāo)準(zhǔn)差、相關(guān)系數(shù)以及進(jìn)行統(tǒng)計(jì)推斷時(shí),都要用到它。

(3)算術(shù)平均數(shù)的缺點(diǎn):易受兩極端數(shù)值(極大或極小)的影響并且當(dāng)一組數(shù)據(jù)中某個(gè)數(shù)值的大小不夠確切時(shí)就無法計(jì)算其算術(shù)平均數(shù)。

(4)算術(shù)平均數(shù)的條件要求如下:

數(shù)據(jù)必須是同質(zhì)的,即同一種測量工具所測量的某一特質(zhì);

數(shù)據(jù)取值必須明確;

數(shù)據(jù)離散不能太大。

(5)算術(shù)平均數(shù)的特點(diǎn):

在一組數(shù)據(jù)中每個(gè)變量與平均數(shù)之差(稱離均差)的總和等于零;

在一組數(shù)據(jù)中,每個(gè)數(shù)都加上一常數(shù)C,所得的平均數(shù)為原來的平均數(shù)加常數(shù)C;

在一組數(shù)據(jù)中,每個(gè)數(shù)據(jù)都乘以一個(gè)常數(shù)C,所得的平均數(shù)為原來的平均數(shù)乘以常數(shù)C。

(6)應(yīng)用平均數(shù)的原則

同質(zhì)性原則,即使用同一種觀測手段,采用相同的觀測標(biāo)準(zhǔn),能反映某一問題的同一方面特質(zhì)的數(shù)據(jù);

平均數(shù)和個(gè)體數(shù)值相結(jié)合的原則;

平均數(shù)與標(biāo)準(zhǔn)差、方差相結(jié)合原則。

2.中數(shù)(Median,符號為Md

(1)概念:中數(shù),又稱中位數(shù),中點(diǎn)數(shù),中值,是位于依一定順序排列的一組數(shù)據(jù)中央位置的數(shù)值,在這一數(shù)值上、下各有一半頻數(shù)分布著。即在這組數(shù)據(jù)中,有一半的數(shù)據(jù)比它大,有一半的數(shù)據(jù)比它小。這個(gè)數(shù)可能是數(shù)據(jù)中的某一個(gè),也可能根本不是原有的數(shù)。

(2)中數(shù)的計(jì)算方法

原始數(shù)值計(jì)算方法

將一組原始數(shù)據(jù)依大小順序排列后,若總頻數(shù)為奇數(shù),就以位于中央的數(shù)據(jù)作為中位數(shù);若總頻數(shù)為偶數(shù),則以最中間的兩個(gè)數(shù)據(jù)的算術(shù)平均數(shù)作為中位數(shù)。

頻數(shù)分布表計(jì)算法

若一組原始數(shù)據(jù)已經(jīng)編成了頻數(shù)分布表,可用內(nèi)插法,通過頻數(shù)分布表計(jì)算中位數(shù)。

(3)中位數(shù)雖然也具備一個(gè)良好的集中量所應(yīng)具備的某些條件,例如比較嚴(yán)格確定,簡明易懂,計(jì)算簡便,受抽樣變動(dòng)影響較小,但是它不適合進(jìn)一步的代數(shù)運(yùn)算。它適用于以下幾種情況:

一組數(shù)據(jù)中有特大或特小兩極端數(shù)值時(shí);

一組數(shù)據(jù)中有個(gè)別數(shù)據(jù)不確切時(shí);

資料屬于等級性質(zhì)時(shí);

當(dāng)需要快速估計(jì)一組數(shù)據(jù)的代表值時(shí)。

3.眾數(shù)(Mode,簡稱Mo

(1)概念:眾數(shù)又稱為范數(shù),密集數(shù),是指在次數(shù)分布中出現(xiàn)次數(shù)最多的那個(gè)數(shù)的數(shù)值。它也是一種集中量數(shù),也可用來代表一組數(shù)據(jù)的集中趨勢。

(2)計(jì)算眾數(shù)的方法

直接觀察求眾數(shù)。直接觀察求眾數(shù)的方法很簡單,就是只憑觀察找出出現(xiàn)次數(shù)最多的那個(gè)數(shù)據(jù)就是眾數(shù)。數(shù)據(jù)整理成次數(shù)分布表后,觀察次數(shù)最多的那個(gè)分組區(qū)間的組中值為眾數(shù)。依據(jù)次數(shù)分組表計(jì)算眾數(shù)受分組的影響。

用公式計(jì)算的眾數(shù)稱為數(shù)理眾數(shù)。當(dāng)次數(shù)分布曲線的形式已知時(shí),可用積分的方法求眾數(shù)。這種方法較復(fù)雜,在心理與教育統(tǒng)計(jì)中很少應(yīng)用,而應(yīng)用較多的是皮爾遜經(jīng)驗(yàn)法和金氏插補(bǔ)法。

(3)眾數(shù)的意義與應(yīng)用

眾數(shù)的概念簡單明了,容易理解,但它不穩(wěn)定,受分組影響,亦受樣本變動(dòng)影響。較少受極端數(shù)目的影響,反應(yīng)不夠靈敏。眾數(shù)只是一個(gè)估計(jì)值。同時(shí),眾數(shù)不能作進(jìn)一步代數(shù)運(yùn)算。所以眾數(shù)不是一個(gè)優(yōu)良的集中量數(shù),應(yīng)用也不廣泛。

三、差異量數(shù)

1.離差與平均差

(1)離差表示每一個(gè)觀測值與平均數(shù)的距離大小,正負(fù)號說明了重量施于什么方向,離均差的總和為零,標(biāo)志著完全平衡。有時(shí)又稱離均差或偏差。

(2)平均差是次數(shù)分布中所有原始數(shù)據(jù)與平均數(shù)絕對離差的平均值。一般用符號A.D.或M.D.來表示。如果使用原始數(shù)據(jù)求平均差,使用下面的公式:

平均差是根據(jù)分布中每一個(gè)觀測值計(jì)算求得的,它較好地代表了數(shù)據(jù)分布的離散程度。然而,由于它在計(jì)算中要對離均差取絕對值,不利于進(jìn)一步做統(tǒng)計(jì)分析,應(yīng)用受到了限制,屬于一種低效差異量數(shù),在統(tǒng)計(jì)實(shí)踐中不太常用。

2.方差與標(biāo)準(zhǔn)差

方差和標(biāo)準(zhǔn)差是最常用的差異量數(shù)。度量數(shù)據(jù)變異性即離散趨勢的統(tǒng)計(jì)量稱差異量數(shù)。標(biāo)準(zhǔn)差是方差的算術(shù)平方根。

(1)概念:方差,又稱變異數(shù)、均方。常用符號為:S2、SD2(樣本統(tǒng)計(jì)量),σ2(總體參數(shù))。它是每個(gè)數(shù)據(jù)與該組數(shù)據(jù)平均數(shù)之差乘方后的均值,即離均差平方后的平均數(shù)。

標(biāo)準(zhǔn)差即方差的平方根,常用符號為:SD、S(樣本統(tǒng)計(jì)量),(總體參數(shù))

用下列公式表示:

方差:

標(biāo)準(zhǔn)差:

(2)意義:方差和標(biāo)準(zhǔn)差適合于代數(shù)運(yùn)算方法,數(shù)值較穩(wěn)定且反應(yīng)靈敏,在計(jì)算中全部數(shù)據(jù)都參與運(yùn)算,是數(shù)據(jù)離散程度的最好的指標(biāo)。這也是標(biāo)準(zhǔn)差和方差優(yōu)于其他差異量數(shù)的特點(diǎn)。

標(biāo)準(zhǔn)差表示數(shù)據(jù)的分散程度,標(biāo)準(zhǔn)差大表示分散,標(biāo)準(zhǔn)差小表示相對集中。

若一個(gè)班的分?jǐn)?shù)之標(biāo)準(zhǔn)差大,說明該班學(xué)習(xí)成績不齊,好的好,差的差。此時(shí)標(biāo)準(zhǔn)差小好,說明成績整齊。

若一個(gè)老師所出的試卷,學(xué)生考完后標(biāo)準(zhǔn)大,說明這張?jiān)嚲沓龅煤茫巡煌瑢W(xué)生的水平區(qū)分開了。此時(shí)標(biāo)準(zhǔn)差小不好。

同一測量的標(biāo)準(zhǔn)差大,說明誤差較大。

(3)標(biāo)準(zhǔn)差的特點(diǎn):

每一個(gè)觀測值都加一個(gè)相同常數(shù)C之后,計(jì)算得到的標(biāo)準(zhǔn)差等于原標(biāo)準(zhǔn)差;

每個(gè)觀測值都乘以一個(gè)相同的常數(shù)C,則所得的標(biāo)準(zhǔn)差等于原標(biāo)準(zhǔn)差乘以這個(gè)常數(shù);

以上兩點(diǎn)相結(jié)合,每一個(gè)觀測值都乘以同一個(gè)常數(shù)C(C0),再加一個(gè)常數(shù)d,所得的標(biāo)準(zhǔn)差等于原標(biāo)準(zhǔn)差乘以這個(gè)常數(shù)C。

3.變異系數(shù)

(1)概念:變異系數(shù),又稱差異系數(shù)、相對標(biāo)準(zhǔn)差等,它是一種相對差異量,用CV來表示,為標(biāo)準(zhǔn)差對平均數(shù)的百分比。

(2)表達(dá)公式:

(3)應(yīng)用

同一團(tuán)體不同測量間變異的比較,例如相同班級不同科目考試成績之變異比較。

不同團(tuán)體同一測量間變異的比較,例如不同年級同一種試卷成績變異大小的比較。

四、相對量數(shù)

1.百分位數(shù)

百分位數(shù)是相對于某一百分等級的分?jǐn)?shù)點(diǎn)。它是指量尺上的一個(gè)點(diǎn),在此點(diǎn)以下,包括數(shù)據(jù)分布中全部數(shù)據(jù)個(gè)數(shù)的一定百分比,第P百分位數(shù)就是指在其值為P的數(shù)據(jù)以下,包括分布中全部數(shù)據(jù)的百分之p,其符號是Pp,公式如下:

式中,Pp為所求的第P個(gè)百分位數(shù);Lb為百分位數(shù)所在組的精確下限;f為百分位數(shù)所在組的次數(shù);Fb為小于Lb的各組次數(shù)的和;N為總次數(shù);i為組距。

2.百分等級

一個(gè)分?jǐn)?shù)的百分等級可定義為在常模團(tuán)體中低于該分?jǐn)?shù)的人數(shù)的百分比。百分等級指示個(gè)體在常模團(tuán)體中的相對位置,百分等級越低,個(gè)體所處的地位越低。百分等級是百分位數(shù)的逆運(yùn)算,當(dāng)已知原始分?jǐn)?shù),求某一分?jǐn)?shù)在總體中所處的百分位置時(shí),用百分等級,當(dāng)已知百分等級時(shí),可以求得處于某一百分等級的原始分?jǐn)?shù)值。

百分等級的計(jì)算公式是:

式中,PR為百分等級;X為給定的原始分?jǐn)?shù);f為該分?jǐn)?shù)所在組的頻數(shù);Lb為該分?jǐn)?shù)所在組的精確下限;Fb為小于Lb的各組次數(shù)的和;N為總次數(shù);i為組距。

3.標(biāo)準(zhǔn)分?jǐn)?shù)

(1)概念:標(biāo)準(zhǔn)分?jǐn)?shù)又稱為基分?jǐn)?shù)或Z分?jǐn)?shù),是以標(biāo)準(zhǔn)差為單位表示一個(gè)原始分?jǐn)?shù)在團(tuán)體中所處位置的相對位置量數(shù)。

(2)標(biāo)準(zhǔn)分?jǐn)?shù)可以通過線性轉(zhuǎn)換或者通過非線性轉(zhuǎn)換得到,由此可將標(biāo)準(zhǔn)分?jǐn)?shù)分為兩類:

線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)

根據(jù)標(biāo)準(zhǔn)分?jǐn)?shù)的定義,可通過下式將原始分?jǐn)?shù)直接轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù):

a.總體

b.樣本

因?yàn)闃?biāo)準(zhǔn)分?jǐn)?shù)是從原始分?jǐn)?shù)(X)中減去一個(gè)恒定值(平均數(shù))再除以一個(gè)恒定值(標(biāo)準(zhǔn)差S)得到的,所以這是一種線性轉(zhuǎn)換。有時(shí)也把線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)簡稱作標(biāo)準(zhǔn)分?jǐn)?shù)或Z分?jǐn)?shù)。

常態(tài)化的標(biāo)準(zhǔn)分?jǐn)?shù)

當(dāng)原始分?jǐn)?shù)不是常態(tài)時(shí),可先把原始分?jǐn)?shù)轉(zhuǎn)化為百分等級,然后從正態(tài)曲線面積表中便可得到對應(yīng)的標(biāo)準(zhǔn)分?jǐn)?shù)。由這種方式所得到的分?jǐn)?shù)就叫常態(tài)化的標(biāo)準(zhǔn)分?jǐn)?shù)。在將分?jǐn)?shù)常態(tài)化時(shí)有一個(gè)前提:只有所測特質(zhì)的分?jǐn)?shù)實(shí)際上應(yīng)該是常態(tài)分布,只是由于測驗(yàn)本身的缺陷或取樣誤差而使分布稍有偏斜時(shí),才能計(jì)算常態(tài)化標(biāo)準(zhǔn)分?jǐn)?shù)。

(3)標(biāo)準(zhǔn)分?jǐn)?shù)的性質(zhì)

Z分?jǐn)?shù)無實(shí)際單位,是以平均數(shù)為參照點(diǎn),以標(biāo)準(zhǔn)差為單位的一個(gè)相對量。

一組原始分?jǐn)?shù)轉(zhuǎn)換得到的Z分?jǐn)?shù)可以是正值,也可以是負(fù)值。凡小于平均數(shù)的原始分?jǐn)?shù)的Z值為負(fù)數(shù),大于平均數(shù)的原始分?jǐn)?shù)的Z值為正數(shù),等于平均數(shù)的原始分?jǐn)?shù)的Z值為零。所有原始分?jǐn)?shù)的Z分?jǐn)?shù)之和為零,Z分?jǐn)?shù)的平均數(shù)也為零。即,根據(jù)求平均數(shù)及Z分?jǐn)?shù)的公式可以證明。

一組原始數(shù)據(jù)中,各個(gè)Z分?jǐn)?shù)的標(biāo)準(zhǔn)差為1,即sZ=1。根據(jù)Z分?jǐn)?shù)的第二條性質(zhì)和標(biāo)準(zhǔn)差公式可以推證。

若原始分?jǐn)?shù)呈正態(tài)分布,則轉(zhuǎn)換得到的所有Z分?jǐn)?shù)值的均值為0,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布。

(4)標(biāo)準(zhǔn)分?jǐn)?shù)的優(yōu)點(diǎn)

可比性。標(biāo)準(zhǔn)分?jǐn)?shù)以團(tuán)體平均分作為比較的基準(zhǔn),以標(biāo)準(zhǔn)差為單位。因此不同性質(zhì)的成績,一經(jīng)轉(zhuǎn)換為標(biāo)準(zhǔn)分?jǐn)?shù)(均值為零,標(biāo)準(zhǔn)差為1),相當(dāng)于處在不同背景下的分?jǐn)?shù),放在同一背景下去考慮,具有可比性。

可加性。標(biāo)準(zhǔn)分?jǐn)?shù)是一個(gè)不受原始分?jǐn)?shù)單位影響的抽象化數(shù)值,能使不同性質(zhì)的原始分?jǐn)?shù)具有相同的參照點(diǎn),因而可以相加。

明確性。知道了某一被試的標(biāo)準(zhǔn)分?jǐn)?shù),利用標(biāo)準(zhǔn)正態(tài)分布函數(shù)值表,可以知道該分?jǐn)?shù)在全體分?jǐn)?shù)中的位置,即百分等級,也就知道了該被試分?jǐn)?shù)在全體被試分?jǐn)?shù)中的地位。所以,標(biāo)準(zhǔn)分?jǐn)?shù)較原始分?jǐn)?shù)意義更為明確。

穩(wěn)定性。原始分?jǐn)?shù)轉(zhuǎn)換為標(biāo)準(zhǔn)分?jǐn)?shù)后,規(guī)定標(biāo)準(zhǔn)差為1,保證了不同性質(zhì)的分?jǐn)?shù)在總分?jǐn)?shù)中的權(quán)重一樣。

(5)標(biāo)準(zhǔn)分?jǐn)?shù)的應(yīng)用

用于比較幾個(gè)分屬性質(zhì)不同的觀測值在各自數(shù)據(jù)分布中相對位置的高低;

計(jì)算不同質(zhì)的觀測值的總和或平均值,以表示在團(tuán)體中的相對位置;

表示標(biāo)準(zhǔn)測驗(yàn)分?jǐn)?shù)。

五、相關(guān)量數(shù)

相關(guān)量數(shù)用于描述雙變量數(shù)據(jù)相互之間的關(guān)系,這兩個(gè)變量之間的關(guān)系不同于因果關(guān)系和共變關(guān)系,在相關(guān)關(guān)系中,兩個(gè)變量之間不能確定因果,并且不同時(shí)受第三因素的影響。統(tǒng)計(jì)學(xué)中所講的相關(guān)是指具有相關(guān)關(guān)系的不同現(xiàn)象之間的關(guān)系程度,前提是事物之間的這種聯(lián)系又不能直接做出因果關(guān)系的解釋。有時(shí),相關(guān)被解釋為兩種特征相伴隨的變化。相關(guān)有三種:正相關(guān)、負(fù)相關(guān)和零相關(guān),其變化范圍在-1至+1之間。

1.積差相關(guān)

(1)概念:積差相關(guān)是英國統(tǒng)計(jì)學(xué)家皮爾遜于20世紀(jì)初提出的一種計(jì)算相關(guān)的方法,因而被稱為皮爾遜積差相關(guān),適用于正態(tài)分布中的雙列變量,即用等距等比量表測得的數(shù)據(jù)。常用的是皮爾遜相關(guān)。

(2)計(jì)算公式如下:

直接用原始數(shù)據(jù)計(jì)算的公式:

運(yùn)用標(biāo)準(zhǔn)差與離均差的計(jì)算公式:

其中,X、Y為兩個(gè)變量的離均差,;N為成對數(shù)據(jù)的數(shù)目;為X變量的標(biāo)準(zhǔn)差;為Y變量的標(biāo)準(zhǔn)差。

應(yīng)用標(biāo)準(zhǔn)分?jǐn)?shù)計(jì)算積差相關(guān)系數(shù)的公式:

其中,ZX為X變量的標(biāo)準(zhǔn)分?jǐn)?shù);ZY為Y變量的標(biāo)準(zhǔn)分?jǐn)?shù)。

(3)積差相關(guān)系數(shù)適合的情況:

兩列數(shù)據(jù)都是測量的數(shù)據(jù),而且兩列變量各自總體的分布是正態(tài)的,即正態(tài)雙變量。這里只要求保證雙變量總體為正態(tài)分布,而對要計(jì)算相關(guān)系數(shù)的兩樣本的觀測數(shù)據(jù)并不一定要求正態(tài)分布。

兩列變量之間的關(guān)系應(yīng)是直線性的。如果是非直線性的雙列變量,不能計(jì)算線性相關(guān)。判斷兩列變量之間的相關(guān)是否直線式,可以作相關(guān)散點(diǎn)圖進(jìn)行線性分析。

實(shí)際測驗(yàn)中,計(jì)算信度涉及的積差相關(guān)時(shí),分半的兩部分測驗(yàn)須滿足在平均數(shù)、標(biāo)準(zhǔn)差、分布形態(tài)、測題間相關(guān)、內(nèi)容、形式和題數(shù)都相似的假設(shè)條件。

(4)相關(guān)系數(shù)的合并

在心理與教育工作研究中,常遇到需將取自同一總體的幾個(gè)樣本的相關(guān)系數(shù)合成、求平均的相關(guān)系數(shù)這一問題,由于相關(guān)系數(shù)不是等距的尺度,因此,對其不能采用簡單合成的辦法,必須將其轉(zhuǎn)換成等距的尺度后再求平均,這樣方有意義。求平均的相關(guān)系數(shù),一般采用Z-r轉(zhuǎn)換法。具體步驟如下:

查費(fèi)舍Z-r轉(zhuǎn)換表,先將各樣本的r轉(zhuǎn)換成費(fèi)舍Z分?jǐn)?shù)

求每一樣本的Z分?jǐn)?shù)之和

求平均Z分?jǐn)?shù),即

其中,Zi由各樣本ri查Z-r轉(zhuǎn)換表得到;ni為各樣本的成對數(shù)目。

再查費(fèi)舍Z-r轉(zhuǎn)換表,將轉(zhuǎn)換成相應(yīng)的r值,即平均的r。

2.等級相關(guān)

(1)等級相關(guān)方法

等級相關(guān)方法對變量的總體分布不作要求,故又稱這種相關(guān)法為非參數(shù)的相關(guān)方法。適用于等級變量和非正態(tài)分布的變量之間的相關(guān)分析。常用的等級相關(guān)是斯皮爾曼相關(guān),也是線性相關(guān)。其公式為:

其中,N為等級個(gè)數(shù),,指二列成對變量的等級差數(shù)。

(2)等級序數(shù)法

如果不用等級差數(shù),可以直接用等級序數(shù)計(jì)算,可用下式:

其中,RX與RY為兩列變量各自排列的等級序數(shù)。

具體的計(jì)算步驟:賦予等級:計(jì)算兩個(gè)變量每對數(shù)據(jù)所賦予的等級數(shù)之差D,及差數(shù)的平方之和將有關(guān)數(shù)據(jù)代入等級相關(guān)的計(jì)算公式。

3.肯德爾等級相關(guān)

(1)肯德爾等級相關(guān)方法有很多種,有適合兩列等級變量資料的交錯(cuò)系數(shù)和相容系數(shù),它們的功用與斯皮爾曼等級相關(guān)相同。另外還有適合多列等級變量資料的方法,比如肯德爾和諧系數(shù)和肯德爾U分?jǐn)?shù)。

(2)肯德爾W系數(shù)

適用范圍:適用于多列等級變量的相關(guān)。

計(jì)算公式如下:

其中,

式中,Ri代表評價(jià)對象獲得的K個(gè)等級之和,N代表被等級評定的對象的數(shù)目,K代表等級評定者的數(shù)目。

W值介于0與1之間,計(jì)算值都為正值,若表示相關(guān)方向,可從實(shí)際資料中進(jìn)行分析。如果K個(gè)評價(jià)者意見完全一致,則W=1;若K個(gè)評價(jià)者的意見存在一定的關(guān)系,但又不完全一致,則0<W<1;如果K個(gè)評價(jià)者的意見完全不一致,則W=0。也就是說,如果各變量完全一致,那么各個(gè)評價(jià)者對每個(gè)被評價(jià)的事物(或人)評定的等級應(yīng)該相同,其等級和的最大變異即最大可能的s應(yīng)為。如果每個(gè)評價(jià)者給予的等級不同,則s變小,一致性程度降低,等級差異越大,一致性越低。如果完全沒有相關(guān),則每個(gè)被評價(jià)事物實(shí)際獲得的等級之和應(yīng)該相等,其最大可能的變異(s)應(yīng)為0。這樣實(shí)際獲得的等級(原始數(shù)據(jù)資料)總和的變異與最大可能的等級總和的變異的比值,便是和諧系數(shù),其值必然介于0到1之間。

(3)肯德爾U系數(shù)又稱一致性系數(shù),適用于對K個(gè)評價(jià)者的一致性進(jìn)行統(tǒng)計(jì)分析。它與肯德爾W系數(shù)所處理的問題相同,但更適合評價(jià)者采用對偶比較的方法所得數(shù)據(jù),所處理的資料的獲得方法不同,計(jì)算的結(jié)果也不一樣。肯德爾U系數(shù)的計(jì)算公式如下:

其中,N為被評價(jià)事物的數(shù)目,即等級數(shù),K為評價(jià)者的數(shù)目;∑rij為對偶比較記錄表中i>j(或i<j)格中的擇優(yōu)分?jǐn)?shù)。

計(jì)算步驟:將被評價(jià)的事物用符號代表,分別橫列與縱列,這樣可畫成N×N個(gè)格子。將每一對事物擇優(yōu)比較的結(jié)果按優(yōu)者記1,非優(yōu)者記0,難以判定記0.5的方法記分,將分?jǐn)?shù)填到相應(yīng)的格子中,這便是。兩相同事物不用比較,因此在整個(gè)方格中,位于對角線位置的小格空著。在對角線以下每格的次數(shù)記為i>j,對角線以上的每格中的次數(shù)記為i<j。將整理后的資料,代入公式計(jì)算。

4.點(diǎn)二列相關(guān)與二列相關(guān)

(1)點(diǎn)二列相關(guān)適用于一列為等距正態(tài)變量的測量數(shù)據(jù),另一列為二分名義變量的資料。常應(yīng)用于試卷的信度分析。公式如下:

(2)二列相關(guān)適用于兩列變量都為正態(tài)等距變量,但其中一列變量被人為地分成兩類資料。公式如下:

(3)點(diǎn)二列相關(guān)和二列相關(guān)的選擇

二列相關(guān)不太常用,但有些數(shù)據(jù)只適用于這種方法。在測驗(yàn)中,二列相關(guān)常用于對項(xiàng)目區(qū)分度指標(biāo)的確定。二者之間的主要區(qū)別是二分變量是否為正態(tài)分布。總的原則是,如果不是十分明確,觀測數(shù)據(jù)的分布形態(tài)是否為正態(tài)分布,這時(shí),不管觀測數(shù)據(jù)代表的是一個(gè)真正的二分變量,還是一個(gè)基于正態(tài)分布的人為二分變量,這時(shí)就用點(diǎn)二列相關(guān)。當(dāng)確認(rèn)數(shù)據(jù)分布形態(tài)為正態(tài)分布時(shí),都應(yīng)選用二列相關(guān)。只要有任何疑問,選用點(diǎn)二列相關(guān)總是較好的選擇。在實(shí)際的研究當(dāng)中,二列相關(guān)很少使用。

5.Φ相關(guān)

(1)Φ相關(guān)是指當(dāng)兩個(gè)分布都只有兩個(gè)點(diǎn)值或只是表示某些質(zhì)的屬性,如工作狀態(tài)(有工作與無工作)、吸煙狀況(吸煙者與非吸煙者)等,可以運(yùn)用列聯(lián)表計(jì)算,因此它又稱列聯(lián)系。適用資料是除四分相關(guān)(當(dāng)兩個(gè)變量都是連續(xù)變量,且每個(gè)變量的變化都被人為地分為兩種類型時(shí),采用四分相關(guān))之外的四格表(計(jì)數(shù))資料,是表示兩因素兩項(xiàng)分類資料相關(guān)程度最常用的一種相關(guān)系數(shù)。

(2)若直接用四格表內(nèi)數(shù)據(jù)計(jì)算可用下式:

圖1-1變量四格表

Φ接近1為高相關(guān),接近0為低相關(guān)。

主站蜘蛛池模板: 安丘市| 浙江省| 泗洪县| 收藏| 孝昌县| 巴南区| 阜康市| 微山县| 桃园县| 柞水县| 汝南县| 滦南县| 邵阳县| 滨海县| 宜兰县| 瑞安市| 灌南县| 沂源县| 洪湖市| 中超| 依兰县| 平潭县| 土默特右旗| 霍山县| 孟州市| 黎川县| 江西省| 德安县| 太和县| 磐安县| 绥化市| 唐山市| 得荣县| 于都县| 张家界市| 桃江县| 莒南县| 永和县| 岑巩县| 珲春市| 琼中|