官术网_书友最值得收藏!

2.4 正態性檢驗

2.4.1 概述

正態性檢驗是對一組測量值是否具有正態分布特性所進行的檢驗。

進行測量值的統計處理和統計檢驗時,一般都是在假定數據服從正態分布的基礎上。但測量值是否服從正態分布,尚需對數據進行正態性檢驗。

常用的正態性檢驗有夏皮羅-威爾克檢驗、偏態-峰態檢驗、愛潑斯-普利檢驗、達戈斯提諾檢驗等,在GB/T 4882中給出了這幾種檢驗的方法和使用條件。除此以外,χ2擬合優度檢驗、柯爾哥莫洛夫檢驗、秩和檢驗等也可應用于測量值的正態性檢驗,但這些檢驗方法沒有針對正態分布的特點,功效較低,并未在現行標準中使用。早期采用的繪制直方圖或用正態概率紙檢驗法較為簡單、直觀,但不嚴密。

2.4.2 夏皮羅-威爾克(Shapiro-Wilk)檢驗法

將樣本測量值xi按由小到大的順序排列,計算統計量W

  (2-41)

式中,i是測量值由小到大順序排列的序次;對測量值數目n是偶數時,k=n/2,n是奇數時,k=(n-1)/2;系數ain是與測量值數目n及測量值序次i有關的系數。表2-13列出了不同測量值數目(n≤50)的系數akn值;為樣本均值。

表2-13 夏皮羅-威爾克檢驗系數aini=1~k)數值

W是與樣本測量值分布有關的統計量,其值在0~1之間。如果樣本測量值來自一個正態總體,測量值近似呈對稱分布,W值應接近于1;當樣本測量值不來自正態總體,則測量值的分布是不對稱的,W值小于1。當測量值偏離正態分布愈遠,不對稱性愈大,W值愈小。

Wnα是與測量次數n和顯著性水平有關的臨界值,見表2-14。通常,當WWn,0.05),認為測量值服從正態分布,當Wn,0.05)>WWn,0.01),認為測量值近似服從正態分布,而W<Wn,0.01)時,認為測量值不服從正態分布。

表2-14 夏皮羅-威爾克檢驗臨界值Wnα

【例2-16】 有9個實驗室對某碳素鋼標準物質中硅含量進行定值分析,共給出36個測量結果:0.336,0.361,0.349,0.349,0.340,0.359,0.348,0.349,0.344,0.356,0.348,0.349,0.343,0.357,0.346,0.352,0.344,0.355,0.348,0.349,0.345,0.354,0.347,0.350,0.345,0.353,0.347,0.350,0.345,0.352,0.346,0.351,0.346,0.352,0.346,0.350,試評價其測量結果是否符合正態分布。

 n=36,k=18,將所有測量結果由小到大排列,將前18個結果按由小到大列于表2-15的xk項,而將后18個數據按由大到小列于xn+1-k項,列表計算xn+1-k-xk,計算各項αknxn+1-k-xk)值,akn值由表2-13查得。

表2-15 硅量的夏皮羅-威爾克檢驗參數計算表

計算得

由36個測量結果得,標準差s=0.005067,則:

查表2-14,W(36,0.05)=0.935,W>W(36,0.05),定值分析測量結果符合正態分布。

2.4.3 偏態-峰態系數檢驗

正態分布函數以平均值為中心是對稱的,對稱點峰高受測量結果離散性制約。若樣本為非正態總體,要不分布曲線不對稱,峰位置產生左偏或右偏,要不峰過高或過低。峰的偏移可用偏度來表征,峰過高或過低可用峰度來表征。通過以下的計算可得表征樣本測量結果的偏度系數和峰度系數。

對樣本的測量值計算:

計算偏度系數A,用于檢驗不對稱性,

  (2-42)

計算偏度系數B,用于檢驗峰態,

  (2-43)

對于服從正態分布的測量值,偏態系數A值應小于臨界值A1,峰態系數B應落在臨界區間B1B'1A1B1B'1的值與要求的概率水平和測量次數n有關,見表2-16。理論上講,對完全的正態分布,其偏態系數A應為0,峰態系數B應為3。若樣本測量值為非正態總體,發生峰的顯著偏移,或峰過高、過低,則AB偏離臨界值。由此根據樣本測量值的偏度系數A和峰度系數B來判斷其分布的正態性。

表2-16 偏態-峰態檢驗臨界值

【例2-17】 有33個實驗室參加白云石中氧化鎂含量的能力驗證試驗,測量結果數值分別為19.54,19.18,19.16,19.24,19.10,19.19,18.95,19.14,19.10,19.49,19.26,19.43,18.72,19.19,19.37,19.09,19.14,19.17,19.10,19.14,19.16,19.51,19.48,19.05,19.36,19.01,19.21,19.02,19.30,19.34,19.01,19.08,18.98,該測量結果是否符合正態分布。

 采用偏態-峰態系數法檢驗其正態性。

根據測量結果計算得

查表2-16,n=33,α=0.05,A1=0.64,B1區間2.00~4.10,由于A<0.64,2.00<B<4.10,表明33個實驗室的能力驗證結果符合正態分布。

2.4.4 愛潑斯-普利(Epps-Pulley)檢驗

愛潑斯-普利檢驗適用于n≥8,小樣本(n<8)對偏離正態分布的檢驗不太有效。

n個待檢驗的測量值xj,計算m2和統計量TEP

  (2-44)

式中,k=2,3,…,n。測量值的排序是隨意的(不一定是升序或降序),但應注意在整個計算過程中選定的次序須保持不變。

統計量TEP與一定顯著性水平的臨界值Tnα比較,當統計量TEP不大于其臨界值,則認為在該顯著性水平下測量值遵循正態分布。臨界值Tnα見表2-17。圖2-8給出了計算統計量TEP的程序流程。

表2-17 愛潑斯-普利檢驗的臨界值Tnα

圖2-8 愛潑斯-普利檢驗中統計量計算流程圖

【例2-18】 有10個測量值4.9、6.5、11.0、5.0、10.9、13.1、14.0、11.4、14.5、12.7,試用愛潑斯-普利法進行正態性檢驗。

 將測量值xj列于表2-18的第2列(注意,表中xj的排序可以是隨意的),計算得=10.4,m2=11.8580。

于表2-18的第3列,固定下標k=2,j=1,計算bkj,此列bkj僅1項

第4列,固定下標k=3,j=1、2,計算bkj,此列bkj有2項,以下類推:

第11列,固定下標k=10,j=1,2,…,9,計算bkj,此列bkj有9項

計算表2-18中k=2,3,…,10各列的和(∑),各列總和B(∑∑),表列中的bkj值共有nn-1)/2=45項。計算得:

表2-18 檢驗統計量TEP的計算

計算各jaj值(j=1,2,…,10),共10項,計算值列于第12列,計算其和A

計算統計量

由表2-17知,n=10,α=0.05時,TEP檢驗的臨界值為0.357,統計量不大于臨界值,可認為在0.05顯著性水平測量值遵循正態分布。

2.4.5 達戈斯提諾(D’Agostino)檢驗

將測量值按由小到大排列,計算統計量

  (2-45)

式中的K值,當n是偶數時為1~n/2,n是奇數時為1~(n-1)/2;

計算的統計量Y用達戈斯提諾檢驗臨界區間(表2-19)判斷測量值分布的正態性。當顯著性水平為0.05時,Y值落在臨界區間aa范圍內,顯著性水平為0.01時,Y值落在臨界區間bb范圍內,則認為測量值服從正態分布。

表2-19 達戈斯提諾檢驗臨界區間

【例2-19】 表2-20給出了61個樣本硅含量的測量結果,檢驗測量結果是否呈正態分布。

表2-20 硅量的達戈斯提諾檢驗計算參數表

 樣本數為奇數,K值為1至(61-1)/2=30,第31個數據(x31=0.378)在計算中用不上。為計算方便,于表2-20中將xK按由小到大自上而下排序,xn+1-K按由大到小自上而下排序,計算xn+1-K-xK項和項,由Excel工作表計算得:

計算的Y值介于相應臨界值的aabb區間,可認為在0.05和0.01顯著性水平,測量結果符合分正態分布。

2.4.6 正態性檢驗方法的應用

許多統計檢驗方法都是建立在測量值遵從正態分布的基礎上,但在有些情況下,如被測量值分布范圍特別寬或含量特別低(痕量和超痕量),測量值并不總是遵從正態分布。因此,在進行數據處理時,若事先不知道測量值的分布類型,需先對測量值進行正態性檢驗。夏皮羅-威爾克檢驗、愛潑斯-普利檢驗和達戈斯提諾檢驗是在分布與正態偏離形式沒有任何事先知道的情況下進行,稱為公用型檢驗方法。夏皮羅-威爾克檢驗適用于小樣本(3≤n≤50),愛潑斯-普利檢驗在n≥8時使用,而達戈斯提諾檢驗用于大樣本(50≤n≤1000)檢驗。偏度-峰度檢驗法和柯爾莫哥洛夫檢驗法既適合于大樣本又適合小樣本的檢驗。

從各檢驗方法依據的原理看,夏皮羅-威爾克檢驗、愛潑斯-普利檢驗和達戈斯提諾檢驗基于正態分布的對稱性;偏度-峰度檢驗較為嚴格,適用于8≤n≤5000樣本的檢驗,它既考察了正態分布的對稱性,又利用了正態分布的離散性。

各種檢驗方法的原理和步驟不盡相同,但其出發點是一致的,都是事先假設樣本測量值來自正態總體,再將假設的總體分布特性與樣本實際分布特性進行比較。若兩者一致,則接受事先的原假設;若樣本的實際分布特性在統計上存在顯著性差異,則不接受原假設。

正態分布統計量計算過程中,應保持足夠的有效數字。樣本測量值,特別是大樣本測量值的正態性檢驗有一定的計算量,但利用Excel工作表計算并不困難,有一些統計軟件可直接處理測量數據,進行正態性檢驗。

主站蜘蛛池模板: 垦利县| 桦南县| 和硕县| 五寨县| 民和| 丘北县| 元谋县| 武城县| 双鸭山市| 山东| 仪陇县| 浙江省| 靖州| 视频| 滕州市| 亚东县| 哈尔滨市| 济宁市| 祥云县| 孙吴县| 板桥市| 招远市| 田阳县| 辽阳市| 聊城市| 越西县| 盘山县| 武城县| 古丈县| 水富县| 皋兰县| 彩票| 甘南县| 霍州市| 永丰县| 江安县| 龙口市| 定兴县| 永寿县| 敦煌市| 唐海县|