§3.3 統(tǒng)計數(shù)據(jù)的離中趨勢
§3.3.1 變異指標——集中趨勢值代表性的測定
集中趨勢是各變量值向其中心值聚集的程度,在反映統(tǒng)計總體數(shù)據(jù)一般水平的同時,掩蓋了總體各單位標志值的數(shù)量差異。因此,在測定了一個數(shù)列的集中趨勢后,還需要考察數(shù)據(jù)遠離其中心值的程度即離中趨勢,計算變異指標。變異指標是反映統(tǒng)計數(shù)據(jù)差異程度的綜合指標,又稱標志變動度。
變異指標是衡量集中趨勢代表性的尺度。數(shù)據(jù)分布越分散,變異指標越大,集中趨勢的代表性越小;數(shù)據(jù)分布越集中,變異指標越小,集中趨勢的代表性越大。
描述統(tǒng)計數(shù)據(jù)離散程度的測度值主要有極差、四分位差、平均差、方差和標準差,以及測度相對離散程度的離散系數(shù)等。
§3.3.2 極差與四分位差
(1)極差
極差又稱為全距,它是指所研究的數(shù)據(jù)中的最大值與最小值之差。極差表示數(shù)據(jù)的變動范圍,通常以R表示:

對于組距數(shù)列,極差也可以近似表示為:
R=最大組上限-最小組下限
用極差反映總體分布的離散程度雖然簡便,但它只從兩端數(shù)值考察,忽略了中間數(shù)據(jù)的變動情況,不能說明整體的差異程度,尤其是存在極端值情況下,使用極差往往會造成不正確的結論。
(2)四分位差
上四分位數(shù)與下四分位數(shù)之差,稱為四分位差,也稱為內距或四分間距,用QD表示,其計算公式為:

四分位差反映了中間50%數(shù)據(jù)的離散程度,其數(shù)值越小,說明中間的數(shù)據(jù)越集中;數(shù)值越大,說明中間的數(shù)據(jù)越分散。四分位差不受極值的影響。此外,由于中位數(shù)處于數(shù)據(jù)的中間位置,因此四分位差的大小在一定程度上也說明了中位數(shù)對一組數(shù)據(jù)的代表程度。
四分位差也可以測度定序數(shù)據(jù)的離散程度,但不適合于分類數(shù)據(jù)。
根據(jù)例3-2的計算結果,計算英語成績的四分位差為:
QD=QU-QL=86-72.5=3.5(分)
§3.3.3 平均差
平均差是總體中各個標志值對其算術平均數(shù)的離差絕對值的算術平均數(shù),用AD表示。由于考慮了數(shù)列中各項標志值變動的影響,因而它克服了極差的不足,能夠全面反映所研究總體的平均差異程度。
由于各標志值與其算術平均數(shù)的離差之和等于零,所以各項離差的平均數(shù)也等于零。在計算平均離差時,為了避免正負離差相互抵消,先取離差的絕對值,再求離差絕對值的平均數(shù),即平均差是平均絕對離差的簡稱。
根據(jù)所掌握的資料不同,平均差有簡單算術平均式和加權算術平均式兩種。

根據(jù)表3-2資料計算某班學生英語考試成績平均差的過程如表3-6所示。
表3-6 某班學生英語考試成績平均差計算表


計算結果表明,平均來說,該班每個學生的成績與平均成績相差7.86分。平均差反映了各個數(shù)據(jù)對其平均數(shù)差異的一般水平,較充分地反映了數(shù)據(jù)之間的離散程度。但它需要取絕對值,給應用帶來一定的局限。所以統(tǒng)計實踐中,應用方差和標準差比較多。
§3.3.4 標準差和方差
(1)標準差和方差的意義
標準差又稱均方根差,它是總體中各單位標志值與其算術平均數(shù)離差平方的平均數(shù)的平方根,通常用σ表示。標準差是各項離差的平均數(shù),但在數(shù)學處理上,沒有采用取絕對值而是采用平方的方法是為了避免正負離差相互抵消,在進一步的計算中這具有數(shù)學上的優(yōu)越性。標準差的平方稱為方差,通常用σ2表示。
如果所掌握的資料未經(jīng)過分組,就可直接采用簡單平均公式計算標準差和方差。如果所掌握的是分組資料,則須采用加權平均公式計算標準差和方差。

根據(jù)表3-2資料計算某班學生英語考試成績標準差的過程如表3-7所示。
表3-7 某班學生英語考試成績表標準差計算表


計算結果表明,平均來說,該班每個學生的成績與平均成績相差9.88分。
(2)方差和標準差的數(shù)學性質
①若每一個變量值加上一個常數(shù),方差和標準差不變。設a為任意常數(shù),yi=xi+a,則有:

②若每一個變量值均擴大一個常數(shù)倍,方差和標準差也同比例變化。設a為任意常數(shù),yi=axi,則有:

③分組條件下,總方差可以分解成組內方差的平均數(shù)和組間方差 δ2兩部分,即:

組內方差的平均數(shù)是各組方差的加權平均數(shù):

組間方差是各組平均數(shù)的方差:

④同一數(shù)列的標準差一般不小于平均差,即:
σ≥ AD
一般說來,標準差比平均差具有更高的靈敏度。
§3.3.5 離散系數(shù)與異眾比率
(1)離散系數(shù)
上述全距、分位差、平均差和標準差都是反映標志變異絕對指標,與平均數(shù)有相同的計量單位,它們在反映變異程度大小時,不僅取決于統(tǒng)計數(shù)據(jù)的離散程度,還取決于這些統(tǒng)計數(shù)據(jù)一般水平的高低。當我們比較具有不同水平的數(shù)列的變異程度時,一般不能直接用絕對指標,而應該用標志變異的相對指標——離散系數(shù),即標志變異的絕對指標與數(shù)列集中趨勢值(常常用算術平均數(shù))的比值。其意義是單位平均數(shù)上的差異,離散系數(shù)小,標志變異小,平均數(shù)的代表性就高,反之則反。離散系數(shù)的基本形式為:

在統(tǒng)計分析中常用的離散系數(shù)是標準差系數(shù),計算公式為:

如某班級學生平均身高172厘米,標準差6厘米;平均體重60千克,標準差4千克。由于身高和體重的算術平均數(shù)不等,且計量單位也不同,因此無法對平均身高和平均體重的代表性進行比較,還必須結合其各自的算術平均數(shù)進一步計算標準差系數(shù):

計算結果表明平均身高的代表性好于平均體重。
(2)異眾比率
對于定性數(shù)據(jù),可以計算“異眾比率”,衡量眾數(shù)的代表性。異眾比率是指非眾數(shù)值的次數(shù)之和在總次數(shù)中所占比重,如果用Vm0表示異眾比率,fm和∑ fi分別表示眾數(shù)所在組的次數(shù)和總次數(shù),則異眾比率的計算公式為:

異眾比率越大,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越大,眾數(shù)的代表性就越差;異眾比率越小,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越小,眾數(shù)的代表性越好。
統(tǒng)計數(shù)據(jù)集中趨勢和離中趨勢的各種指標適用于所有的定量數(shù)據(jù),但是并非都適合定性數(shù)據(jù)。不同計量層次數(shù)據(jù)的特征要求用不同的測度值,歸納如表3-8所示。
表3-8 不同計量層次數(shù)據(jù)的適合測度值
