官术网_书友最值得收藏!

2.1 離群值檢驗(yàn)

2.1.1 概述

離群值的處理對我們來說并不陌生。在體育比賽或音樂大賽中,多個(gè)裁判員給選手打分,往往去掉一個(gè)最高分,去掉一個(gè)最低分,再計(jì)算平均分作為選手的得分。這種記分方法是最簡單的數(shù)據(jù)處理方法,把最高分和最低分作為離群值而剔除(以防止人情分或誤打分的影響)。這種確定和剔除離群值的方法在直觀上有一定的公正性,但剔除的分值不一定離群,缺乏統(tǒng)計(jì)上的理由。

分析測試中,在對同一量進(jìn)行重復(fù)測定時(shí),常常可發(fā)現(xiàn)有一個(gè)或兩個(gè)測量值比其他測量值明顯偏高或偏低,出現(xiàn)“離群”的傾向。這些有“離群”傾向的值是否真正是與其他值不一致而離群,可用統(tǒng)計(jì)方法進(jìn)行檢驗(yàn)。按GB/T 4883—2008《數(shù)據(jù)的統(tǒng)計(jì)檢驗(yàn)和解釋 正態(tài)樣本離群值的判斷和處理》,將統(tǒng)計(jì)檢驗(yàn)常用術(shù)語與定義表述于下:

離群值(outlier):樣本中一個(gè)或幾個(gè)觀測值,它們離開其他觀測值較遠(yuǎn),暗示它們可能來自不同的總體。離群值按顯著性的程度分為歧離值和統(tǒng)計(jì)離群值。

檢出水平(delection level):為檢出離群值而指定的統(tǒng)計(jì)檢驗(yàn)的顯著性水平。通常檢出水平α值取0.05。

剔除水平(deletion level):為檢出離群值是否高度離群而指定的統(tǒng)計(jì)檢驗(yàn)的顯著性水平。通常剔除水平的α值取0.01。

統(tǒng)計(jì)離群值(statistical outlier):在剔除水平下統(tǒng)計(jì)檢驗(yàn)為顯著的離群值。

歧離值(straggler):在檢出水平下顯著,但剔除水平下不顯著的離群值。

在統(tǒng)計(jì)檢驗(yàn)中將檢出水平(α=0.05)下顯著,而剔除水平(α=0.01)下不顯著的離群值稱為歧離值,通常稱異常值。在剔除水平(α=0.01)下顯著的離群值稱為統(tǒng)計(jì)離群值,通常稱高度異常值。考慮習(xí)慣上的稱謂,以下將岐離值表述為異常值,統(tǒng)計(jì)離群值表述為高度異常值,而離群值是兩類異常值的統(tǒng)稱。

離群值產(chǎn)生的原因可分為兩類,第一類離群值是總體本身變動(dòng)性的極端表現(xiàn),雖然明顯偏離其他測量值,但仍然處于統(tǒng)計(jì)上所允許的合理誤差范圍之內(nèi),與其他測量值屬于同一總體;第二類離群值是由于試驗(yàn)條件和試驗(yàn)方法的偶然偏離所產(chǎn)生的結(jié)果,或產(chǎn)生于測量、記錄、計(jì)算中的過失誤差,在統(tǒng)計(jì)上與其他測量值不屬于同一總體。

實(shí)際測試中,測量值同時(shí)受多種因素的影響,分析人員往往不易或無法直觀判斷明顯偏高或偏低的測量值與其他測量值是否屬于同一分布,從而也無法決定其取舍。采用某一方法對一樣品進(jìn)行測試,在正確和正常情況下,其測量值的分布遵循一定的客觀規(guī)律。統(tǒng)計(jì)檢驗(yàn)就是借助于數(shù)理統(tǒng)計(jì)方法,根據(jù)測量值分布的規(guī)律來客觀評價(jià)和判斷被檢測量值是否“異常”或“高度異常”,并決定是否保留或舍去,以保證測量的可靠性。

離群值的出現(xiàn)有三種情況:

(1)上側(cè)情形 根據(jù)實(shí)際情況或以往經(jīng)驗(yàn),離群值都為高端值;

(2)下側(cè)情形 根據(jù)實(shí)際情況或以往經(jīng)驗(yàn),離群值都為低端值;

(3)雙側(cè)情形 根據(jù)實(shí)際情況或以往經(jīng)驗(yàn),離群值可能為高端值,也可能為低端值。

測量值由小到大排列,通常要檢驗(yàn)是否存在顯著偏低和顯著偏高的測量值,即偏低和偏高的測量值都要檢驗(yàn),這種檢驗(yàn)方式在統(tǒng)計(jì)上稱為雙側(cè)檢驗(yàn),計(jì)算的統(tǒng)計(jì)量與相應(yīng)顯著性水平的雙側(cè)檢驗(yàn)臨界值比較。在某些情況下,只檢驗(yàn)顯著偏高或顯著偏低的測量值,即只對一個(gè)方向的測量值檢驗(yàn),這種檢驗(yàn)方式在統(tǒng)計(jì)上稱為單側(cè)檢驗(yàn),計(jì)算的統(tǒng)計(jì)量與相應(yīng)顯著性水平的單側(cè)檢驗(yàn)臨界值比較。如果無法認(rèn)定是否單側(cè)情況,按雙側(cè)情況處理。

圖2-1、圖2-2表示了測量數(shù)據(jù)分布密度曲線對雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)的拒絕域和接受域。雙側(cè)檢驗(yàn)的拒絕域在密度曲線的兩端,單側(cè)檢驗(yàn)的拒絕域在密度曲線的左端或右端。對雙側(cè)檢驗(yàn),應(yīng)采用α/2的臨界值界限。

圖2-1 雙側(cè)檢驗(yàn)

圖2-2 單側(cè)檢驗(yàn)

集合所有的分析測試,其測量值服從正態(tài)分布或近似正態(tài)分布。統(tǒng)計(jì)檢驗(yàn)方法就是建立在隨機(jī)樣本測量值遵循正態(tài)分布和小概率原理基礎(chǔ)上的。根據(jù)測量值正態(tài)分布特性和隨機(jī)抽樣理論,一組測量值中,出現(xiàn)大偏差測量值的概率是很小的。例如,偏差大于兩倍標(biāo)準(zhǔn)差的測量值出現(xiàn)的概率只有5%,即平均每100次測量中才可能出現(xiàn)5次,而偏差大于三倍標(biāo)準(zhǔn)差的測量值出現(xiàn)的概率只有0.3%,平均每1000次測量中才可能出現(xiàn)3次。通常分析測試只進(jìn)行少數(shù)幾次,出現(xiàn)大偏差的可能性是十分小的,而現(xiàn)在居然出現(xiàn)了,根據(jù)小概率事件在一次測量中實(shí)際上不可能發(fā)生的原理,自然不能將其看成是由隨機(jī)因素引起的,人們有理由認(rèn)為偏差很大的測量值與其他測量值來源于不同總體,而作為離群值處理。

上述2倍標(biāo)準(zhǔn)差(2σ)和3倍標(biāo)準(zhǔn)差(3σ)在統(tǒng)計(jì)上通常稱為允許的合理誤差范圍。統(tǒng)計(jì)中所取特定小的概率在統(tǒng)計(jì)檢驗(yàn)中稱為顯著性水平,記為α,它表示犯“將本來不是離群值而作為離群值處理”這類錯(cuò)誤的概率。在分析測試中,一般取顯著性水平α=0.05。取顯著性水平0.05判斷,可以認(rèn)為,判斷的異常值在95%的情況下的正確的,但仍有5%的可能性是判斷錯(cuò)誤的。有時(shí)取α=0.01顯著性水平,判斷的高度異常值判錯(cuò)的可能性更小。

2.1.2 離群值檢驗(yàn)

離群值的檢驗(yàn)可分為兩類,一類是測量結(jié)果的標(biāo)準(zhǔn)差已知;另一類是標(biāo)準(zhǔn)差未知,需用待檢驗(yàn)數(shù)據(jù)本身來估計(jì)。

2.1.2.1 奈爾(Nair)檢驗(yàn)

奈爾檢驗(yàn)法使用的前提是標(biāo)準(zhǔn)差(σ)已知。將測量結(jié)果由小到大排列,x1x2、…、xn,其平均值為,當(dāng)懷疑xnx1是可疑值時(shí),分別計(jì)算統(tǒng)計(jì)量:

  (2-1)

將統(tǒng)計(jì)量R(或R'n)與相應(yīng)臨界值Rαn比較,Rαn是與測量次數(shù)n及顯著性水平α有關(guān)的數(shù)值。奈爾檢驗(yàn)臨界值見表2-1。

當(dāng)只是高端存在可疑值或只是低端存在可疑值時(shí),采用單側(cè)檢驗(yàn),確定顯著性水平α=0.05,當(dāng)RnR'n大于臨界值R0.05,n,但小于R0.01,n時(shí),判定xnx1為異常值;當(dāng)RnR'n大于R0.01,n時(shí),判定xnx1為高度異常值。

當(dāng)雙側(cè)檢驗(yàn)時(shí),確定顯著性水平α=0.05,但在查臨界值表時(shí),應(yīng)取α=0.025的R0.025,n臨界值作為判斷標(biāo)準(zhǔn)。

當(dāng)剔除一個(gè)離群值后,計(jì)算剔除后測量數(shù)據(jù)的平均值,再繼續(xù)用奈爾檢驗(yàn)法檢驗(yàn)可疑值。

奈爾檢驗(yàn)法的樣本量3≤n≤100。

【例2-1】 測定冶金用石灰石中的氧化鈣,根據(jù)實(shí)驗(yàn)室長期積累的數(shù)據(jù),氧化鈣含量在50%左右,其重復(fù)測量的標(biāo)準(zhǔn)差為0.16%。現(xiàn)對一石灰石樣品進(jìn)行分析,測得氧化鈣含量為51.23%、51.46%、51.28%、51.70%、51.90%、51.25%、51.35%和51.38%,試問其最大的兩個(gè)值51.90%和51.70%是否應(yīng)判為離群值?

 計(jì)算得8次測量的平均值為51.444%,計(jì)算51.90%奈爾檢驗(yàn)統(tǒng)計(jì)量:

查表2-1,R0.05,8=2.334,R0.01,8=2.828,R8>R0.01,8,在0.01顯著性水平,51.90%是高度異常值,剔除該數(shù)據(jù)。余下7 個(gè)數(shù)據(jù)的平均值為51.379,計(jì)算51.70%奈爾檢驗(yàn)統(tǒng)計(jì)量:

表2-1 奈爾檢驗(yàn)臨界值Rαn(單側(cè))

R0.05,7=2.267,R7<R0.05,7,在0.05顯著性水平,51.70%不是異常值。

2.1.2.2 拉依達(dá)(Райта)檢驗(yàn)

設(shè)一組數(shù)據(jù)的平均值為,待檢驗(yàn)的測量值為xp,殘差νp=xp-,如果殘差νp的絕對值大于三倍標(biāo)準(zhǔn)差,即

  (2-2)

則認(rèn)為xp含有粗大誤差,為離群值,應(yīng)從該組數(shù)據(jù)中舍去。

顯然,采用拉依達(dá)檢驗(yàn)準(zhǔn)則使用起來方便,不需查表,在測量次數(shù)較多或要求不高時(shí)可采用。有時(shí)采用兩倍標(biāo)準(zhǔn)差2s作為殘差νp的判斷標(biāo)準(zhǔn),檢驗(yàn)更為嚴(yán)格。

但是,拉依達(dá)檢驗(yàn)只適用于測量次數(shù)n>10時(shí)使用,對以2s作判斷標(biāo)準(zhǔn),只適用于測量次數(shù)n>5時(shí)使用。可證明,當(dāng)n≤10(或n≤5)時(shí),不能檢驗(yàn)出任何可疑數(shù)據(jù),出現(xiàn)“判有為無”的錯(cuò)誤。

2.1.2.3 格拉布斯(Grubbs)檢驗(yàn)

不論方差已知還是未知,均可使用此法。

將測量值由小到大排列,x1x2、…、xn,計(jì)算其平均值和標(biāo)準(zhǔn)差s

①當(dāng)xn為可疑值時(shí),計(jì)算統(tǒng)計(jì)量:

  (2-3)

②當(dāng)x1為可疑值時(shí),計(jì)算統(tǒng)計(jì)量:

  (2-4)

如果統(tǒng)計(jì)量GnG1大于相應(yīng)顯著性水平的格拉布斯檢驗(yàn)臨界值Gαn(見表2-2),則認(rèn)為被檢量xnx1為離群值。Gαn是與測量次數(shù)n及顯著性水平α有關(guān)的數(shù)值。

表2-2 格拉布斯檢驗(yàn)臨界值Gαn

③對雙側(cè)檢驗(yàn),xnx1可能為可疑值,計(jì)算GnG1,當(dāng)Gn>G1,且Gn>Gα/2,n時(shí),判定xn為離群值。或G1>Gn,且G1>Gα/2,n,判定x1為離群值。

【例2-2】 為標(biāo)定某低合金鋼標(biāo)準(zhǔn)物質(zhì)中鋁的認(rèn)定值,由10個(gè)實(shí)驗(yàn)室參與協(xié)同試驗(yàn),各實(shí)驗(yàn)室測量值的排序?yàn)?.646%、0.651%、0.653%、0.653%、0.656%、0.658%、0.659%、0.662%、0.663%和0.679%,檢查該測量數(shù)據(jù)是否存在離群值。

 由樣本測量數(shù)據(jù)得n=10,s=0.009006%,離群值可能是最高值或最低值,計(jì)算統(tǒng)計(jì)量得:

G10>G1,取顯著性水平α=0.05和0.01,按雙側(cè)檢驗(yàn)查表得G0.025,10=2.290,G0.005,10=2.482,G10大于G0.025,n,但小于G0.005,10,0.679%是異常值,但不是高度異常值。

仔細(xì)分析數(shù)據(jù)0.679%偏高的原因,該實(shí)驗(yàn)室采用鉻天青S光度法測定鋁量,但樣品含0.10%的鈦,對鋁的測定有影響,該實(shí)驗(yàn)室操作人員顯色時(shí)未采用掩蔽措施而致使結(jié)果偏高。0.679%雖不是高度異常值,但由于技術(shù)原因,在數(shù)據(jù)匯總時(shí)應(yīng)予剔除,要求該實(shí)驗(yàn)室采取掩蔽鈦的措施重新測試。

ISO 5725.2(GB/T 6379.2)在實(shí)驗(yàn)室間進(jìn)行測量方法精密度協(xié)同試驗(yàn)時(shí),給出了檢驗(yàn)最大的兩個(gè)測量值或最小的兩個(gè)測量值是否為離群值的格拉布斯檢驗(yàn)方法,其統(tǒng)計(jì)量的計(jì)算和臨界值見第5章5.3.6.2。

2.1.2.4 狄克遜(Dixon)檢驗(yàn)

單側(cè)檢驗(yàn):將一組測量數(shù)據(jù)按由小到大的順序排列,x1x2、…、xn,對x1xn按表2-3的計(jì)算式計(jì)算高端值統(tǒng)計(jì)量Dn或低端值統(tǒng)計(jì)量D'n,如果統(tǒng)計(jì)量DnD'n大于相應(yīng)顯著性水平臨界值Dαn)(表2-3),則認(rèn)為被檢量xnx1為離群值。

表2-3 狄克遜檢驗(yàn)的統(tǒng)計(jì)量和臨界值Dαn)(單側(cè)檢驗(yàn))

雙側(cè)檢驗(yàn):將一組測量數(shù)據(jù)按由小到大的順序排列,x1x2、…、xn,對x1xn按表2-4的計(jì)算式計(jì)算高端值統(tǒng)計(jì)量Dn和低端值統(tǒng)計(jì)量D'n,當(dāng)Dn>D'nDn>Dαn)時(shí),則認(rèn)為xn為離群值;當(dāng)D'n>DnD'n>Dαn)時(shí),則認(rèn)為x1為離群值。

表2-4 狄克遜檢驗(yàn)的統(tǒng)計(jì)量和臨界值Dαn)(雙側(cè)檢驗(yàn))

【例2-3】 今用ICP-AES法測定某低合金鋼中鉬量,在重復(fù)性條件下進(jìn)行14次獨(dú)立分析,測量值按從小到大的順序排列,分別為0.354%、0.357%、0.358%、0.359%、0.359%、0.361%、0.363%、0.363%、0.364%、0.367%、0.368%、0.369%、0.372%、0.390%,試判斷最大值0.390%是否為離群值。

 測量數(shù)據(jù)的樣本量n=14,計(jì)算狄克遜檢驗(yàn)統(tǒng)計(jì)量:

查狄可遜單側(cè)檢驗(yàn)臨界值表,D(0.05,14)=0.546,D(0.01,14)=0.640,D14>D(0.01,14),0.390%為高度異常值。

如采用格拉布斯法檢驗(yàn),計(jì)算得=0.3646%,s=0.0089%,計(jì)算格拉布斯統(tǒng)計(jì)量:

查格拉布斯法檢驗(yàn)統(tǒng)計(jì)量G0.05,14=2.371,G0.01,14=2.659,G14>G0.01,14,0.390%為高度異常值,其結(jié)論與狄克遜檢驗(yàn)結(jié)論是一致的。

有些文獻(xiàn)上介紹的Q檢驗(yàn),實(shí)際上是簡化了的狄克遜檢驗(yàn)法,沒有狄克遜法嚴(yán)格。

2.1.2.5 羅馬諾夫斯基檢驗(yàn)

羅馬諾夫斯基檢驗(yàn)準(zhǔn)則的出發(fā)點(diǎn)是檢查被檢測量值是否符合不包括本身數(shù)據(jù)的一組測量值的分布,并與相應(yīng)的顯著性水平聯(lián)系。

羅馬諾夫斯基檢驗(yàn)法亦稱t檢驗(yàn)法,將除可疑值以外的測量值當(dāng)作一個(gè)總體,并假定該總體遵循正態(tài)分布。計(jì)算不包括待檢驗(yàn)測量值xp的其余數(shù)據(jù)的平均值及標(biāo)準(zhǔn)差,將被檢可疑值xp當(dāng)作樣本為1的特殊總體,如果xp與其余測量值同屬一個(gè)總體,則它們間不應(yīng)有顯著性差異。計(jì)算統(tǒng)計(jì)量:

  (2-5)

若統(tǒng)計(jì)量k大于顯著性水平α的臨界值kαn),則認(rèn)為xp的出現(xiàn)是一個(gè)小概率事件,有理由判定xp是離群值。臨界值kαn)是與測量次數(shù)n及顯著性水平有關(guān)的數(shù)值(表2-5)。

表2-5 羅馬諾夫斯基檢驗(yàn)臨界值kαn

2.1.2.6 偏度-峰度檢驗(yàn)

考慮樣本各測量值,確認(rèn)它們的樣本來自正態(tài)總體,而極端值應(yīng)較明顯地偏離樣本主體,可采用偏度-峰度檢驗(yàn)法,判斷測量值是否偏離正態(tài)總體。

(1)偏度檢驗(yàn)(單側(cè)檢驗(yàn)) 一組測量數(shù)據(jù)按x1x2、…、xn大小順序排列,計(jì)算偏度檢驗(yàn)統(tǒng)計(jì)量:

  (2-6)

確定顯著性水平α,若統(tǒng)計(jì)量bs大于偏度檢驗(yàn)臨界值bαn(見表2-6),則判最大值xn為離群值;若統(tǒng)計(jì)量-bs>bαn,則判最小值x1為離群值。

表2-6 偏度檢驗(yàn)臨界值

注:當(dāng)n為中間數(shù)時(shí),可用內(nèi)插法估計(jì)臨界值。

(2)峰度檢驗(yàn)(雙側(cè)檢驗(yàn)) 峰度檢驗(yàn)用于兩端測量值是否存在離群值。

峰度檢驗(yàn)統(tǒng)計(jì)量為:

  (2-7)

確定顯著性水平α,若統(tǒng)計(jì)量bk大于峰度檢驗(yàn)臨界值bαn(見表2-7),則判離平均值最遠(yuǎn)的測量值為離群值,否則為未發(fā)現(xiàn)離群值。

表2-7 峰度檢驗(yàn)臨界值

注:當(dāng)n為中間數(shù)時(shí),可用內(nèi)插法估計(jì)臨界值。

【例2-4】 以例2-3數(shù)據(jù)為例,用偏度檢驗(yàn)法檢查其最大值0.390%是否是離群值。

 采用偏度檢驗(yàn)法,借助Excel表格,計(jì)算得按式(2-6)計(jì)算偏度統(tǒng)計(jì)量:

查偏度檢驗(yàn)臨界值b0.05,14=0.87,b0.01,14=1.29,bs>b0.01,14,由此,判定最大值0.390%是高度異常值,其結(jié)論與格拉布斯和狄克遜檢驗(yàn)是一致的。

當(dāng)一組測量值中有一個(gè)以上離群值時(shí),可重復(fù)使用偏度-峰度檢驗(yàn)法。在用此法進(jìn)行連續(xù)剔除時(shí),也有可能存在“判多為少”或“判有為無”的可能,但比狄克遜與格拉布斯檢驗(yàn)法要好一些。

2.1.3 統(tǒng)計(jì)檢驗(yàn)的功效

由于數(shù)理統(tǒng)計(jì)的特點(diǎn)是它的結(jié)論不是絕對肯定或絕對否定,而是給出某種假設(shè)成立與否的一定概率。又,雖然各種可疑值的檢驗(yàn)方法的共同之處都是基于概率統(tǒng)計(jì)原理推導(dǎo)出來的,但這些檢驗(yàn)方法的嚴(yán)密程度和計(jì)算的繁簡程度不同,所取的置信水平不同。不同的檢驗(yàn)方法有不同的檢驗(yàn)功效,適用場合也不同。應(yīng)當(dāng)說,多數(shù)情況下各統(tǒng)計(jì)方法的檢驗(yàn)是一致的,但也往往出現(xiàn)用不同的檢驗(yàn)方法可能得到不同的結(jié)論,用一種方法檢驗(yàn)認(rèn)為是離群值,而另一種方法檢驗(yàn)認(rèn)為不是離群值的現(xiàn)象,特別是位于其臨界值附近的測量值,出現(xiàn)這種情況的概率較大。

諸多檢驗(yàn)方法中,格拉布斯、狄克遜、羅馬諾夫斯基檢驗(yàn)法考慮了測量數(shù)據(jù)數(shù),將數(shù)據(jù)的分布與顯著性水平聯(lián)系起來,判據(jù)客觀。狄克遜檢驗(yàn)法使用極差計(jì)算,無需計(jì)算平均值和標(biāo)準(zhǔn)差,使用簡便。格拉布斯檢驗(yàn)法和羅馬諾夫斯基檢驗(yàn)法考慮了測量數(shù)據(jù)的分布,是較為嚴(yán)格的統(tǒng)計(jì)方法。羅馬諾夫斯基檢驗(yàn)法則比格拉布斯更嚴(yán)格,有些羅馬諾夫斯基法檢驗(yàn)出的異常值,格拉布斯檢驗(yàn)法未必能檢驗(yàn)出,因此有可能將一些正常的測量值當(dāng)作異常值處理,存在“判少為多”或“判無為有”的可能。對一組測量值中存在一個(gè)以上離群值時(shí),方差中包括另一個(gè)離群值,使其變大,但比值/不一定大,使一些離群值可能檢查不出來,使“判多為少”或“判有為無”的可能性變大。因此,格拉布斯法檢驗(yàn)一個(gè)以上離群值的功效較差。

偏度-峰度檢驗(yàn)法又是正態(tài)性檢驗(yàn)的優(yōu)良檢驗(yàn)法,不來自正態(tài)分布的樣本都可能被它拒絕。它對非正態(tài)性的分布比較敏感,因此,有可能將非離群值判斷為離群值,而實(shí)際上是由數(shù)據(jù)的非正態(tài)性引起的,在使用時(shí)要注意。

對各統(tǒng)計(jì)檢驗(yàn)方法,GB/T 4883《數(shù)據(jù)的統(tǒng)計(jì)處理和解釋 正態(tài)樣本離群值的判斷和處理》建議以下的選擇原則:

當(dāng)只有一個(gè)檢出的離群值,在方差未知條件下,格拉布斯檢驗(yàn)的統(tǒng)計(jì)量使用了全部測試數(shù)據(jù),而狄克遜檢驗(yàn)只用了“部分”的數(shù)據(jù),格拉布斯檢驗(yàn)的功效最優(yōu),而狄克遜檢驗(yàn)稍遜一些,但相差不大。當(dāng)n較小時(shí),建議使用格拉布斯檢驗(yàn)法;當(dāng)n較大時(shí),同時(shí)在正態(tài)概率紙上,若樣本主體是基本在一條直線的近旁,建議使用偏度-峰度檢驗(yàn)法。若樣本主體不是基本在一條直線的近旁,建議使用格拉布斯檢驗(yàn)法。

當(dāng)限定檢出離群值多于一個(gè)時(shí),重復(fù)使用同一檢驗(yàn)法可能犯“判多為少”(只檢出一部分離群值)的錯(cuò)誤,而不易犯“判少為多”(錯(cuò)將一部分非離群值判為離群值)的錯(cuò)誤。各檢驗(yàn)方法中,以使用偏度-峰度法最好,犯這兩類錯(cuò)誤的概率最小。使用狄克遜檢驗(yàn)法效果次之,而重復(fù)使用格拉布斯檢驗(yàn)的功效較差。當(dāng)n較小時(shí),可重復(fù)使用狄克遜檢驗(yàn)法。

在較為精密的場合,可選擇2~3種進(jìn)行判斷,當(dāng)判斷結(jié)論一致時(shí),可放心地加以取舍;當(dāng)幾種方法判斷有矛盾時(shí),一般以不剔除為妥,此時(shí)可增加測量次數(shù),提高檢驗(yàn)可靠性。

2.1.4 檢驗(yàn)結(jié)果的處理

在測試數(shù)據(jù)可疑值處理時(shí),首先要確認(rèn)所采集數(shù)據(jù)的可靠性,從技術(shù)上或操作上設(shè)法尋找明顯偏高或偏低的原因。若發(fā)現(xiàn)其可疑值是由記錄或傳遞有誤造成的,則及時(shí)更正;若發(fā)現(xiàn)其測量與其分析方法要求的條件不一致,造成顯著的系統(tǒng)誤差,或存在粗大誤差或操作失誤引起的偏差,則可直接剔除其數(shù)據(jù),不必進(jìn)行統(tǒng)計(jì)檢驗(yàn)。但是,有時(shí)未必能找出技術(shù)上或操作上的原因,需借助于統(tǒng)計(jì)檢驗(yàn)方法檢查可疑值,以判斷測量值是否“離群”。

通常各檢驗(yàn)方法的檢驗(yàn)結(jié)果是一致的,有時(shí)也有檢驗(yàn)結(jié)果不一致的情況。這時(shí)就應(yīng)結(jié)合對數(shù)據(jù)處理的要求、顯著性水平的選擇及分析測試技術(shù)等因素綜合考慮。對可疑值的檢驗(yàn)和處理,并不能認(rèn)為采用最嚴(yán)格的檢驗(yàn)方法為最好,要根據(jù)數(shù)據(jù)分布和檢驗(yàn)要求而具體分析。

標(biāo)準(zhǔn)物質(zhì)的定值通常由多個(gè)實(shí)驗(yàn)室進(jìn)行共同分析,采用成熟的、可靠的分析方法,以數(shù)理統(tǒng)計(jì)方法確定其認(rèn)定值,追求認(rèn)定值的正確度和測量精度。在對數(shù)據(jù)技術(shù)分析的基礎(chǔ)上,通常采用較嚴(yán)的0.05顯著性水平判斷離群值,同時(shí)結(jié)合測試方法精密度從重復(fù)性限r和再現(xiàn)性限R等參數(shù)進(jìn)行綜合評價(jià)。

測量數(shù)據(jù)的統(tǒng)計(jì)檢驗(yàn)應(yīng)依據(jù)對使用測量數(shù)據(jù)的預(yù)期要求來選擇合適的顯著性水平。在制定測試方法精密度時(shí),由不同的實(shí)驗(yàn)室進(jìn)行協(xié)同試驗(yàn),考慮到各實(shí)驗(yàn)室測試水平的差異,而且制定的精密度是在各不同的實(shí)驗(yàn)室間使用,應(yīng)盡可能保留反映各實(shí)驗(yàn)室水平的測試信息。出于此原因,ISO 5725.2(GB/T 6379.2)規(guī)定保留超過0.05顯著性水平的異常值,而僅剔除超過0.01顯著性水平的高度異常值,對離群值的檢驗(yàn)要求相對寬松些。

在試驗(yàn)研究中,對待離群值的處理更要慎重。試驗(yàn)研究本身就是尋找研究對象在試驗(yàn)條件下的變化規(guī)律,而這種變化規(guī)律可能還沒有被人們認(rèn)識(shí)(例如,事物的變化不一定服從正態(tài)分布),離群值的出現(xiàn)有時(shí)很可能反映尚沒有被認(rèn)識(shí)事物變化規(guī)律的一種新信息。如果隨意丟去測量值,相當(dāng)于失去認(rèn)識(shí)事物的信息,是很可惜的。在試驗(yàn)研究中,出現(xiàn)統(tǒng)計(jì)上離群值,如果不是粗大誤差引起的,往往會(huì)反映某個(gè)試驗(yàn)條件變化的結(jié)果,這時(shí)更要從技術(shù)上尋找,或進(jìn)行重復(fù)試驗(yàn),確認(rèn)離群值是技術(shù)條件原因還是試驗(yàn)誤差引起的。方差分析能很好地處理試驗(yàn)條件變化與試驗(yàn)誤差對測試結(jié)果變化的關(guān)系。一些環(huán)境監(jiān)測或生化指標(biāo)的檢查中,在正常情況下,離群值的出現(xiàn)往往預(yù)示環(huán)境受污染或生化指標(biāo)異常,而這正是人們要尋找的污染源或生化指標(biāo)異常人群的信息。例如,大氣中和廢水中的有害組分的監(jiān)測,樣品隨時(shí)間與空間的變動(dòng)性很大,異常值的出現(xiàn)常常暗示污染情況的某種變化,循此深入進(jìn)行研究,很可能發(fā)現(xiàn)新的污染源及污染的變化趨勢。又如,區(qū)域環(huán)境背景值研究,在某些樣點(diǎn)出現(xiàn)“離群值”,暗示該地區(qū)是一個(gè)高背景值區(qū),這種“離群值”很可能為發(fā)現(xiàn)與防治地方病提供重要的線索。這樣的“異常值”當(dāng)然不能隨意剔除,而應(yīng)當(dāng)予以專門研究。當(dāng)然,如果對這些測量值有所懷疑,可進(jìn)行補(bǔ)充試驗(yàn)或重復(fù)試驗(yàn),以確認(rèn)是由偶然因素造成的還是必然的結(jié)果。

2.1.5 可疑數(shù)據(jù)檢驗(yàn)中的一些問題

以上介紹的檢驗(yàn)異常值的方法多是相對檢驗(yàn)方法,其統(tǒng)計(jì)量不僅與被檢驗(yàn)的可疑值有關(guān),還同時(shí)與其他量的分布有關(guān)。如果一組測量值較分散,表明測量的隨機(jī)誤差較大,可疑值(最大或最小值)即使偏離其他測量值較大,在統(tǒng)計(jì)上也不一定認(rèn)為是離群值;而當(dāng)測量的精密度較高時(shí),即使可疑值與其他測量值相差不大,亦有可能在統(tǒng)計(jì)上認(rèn)為是離群值。遇到這種情況,應(yīng)慎重對待:

①由于測量值分布較分散(特別是實(shí)驗(yàn)室間的協(xié)同試驗(yàn)),因而可疑值的檢驗(yàn)顯得不靈敏,這時(shí)應(yīng)考慮測試是否嚴(yán)謹(jǐn),檢查測試是否存在較大的隨機(jī)誤差(和一定的系統(tǒng)誤差)。如果該測試方法已進(jìn)行過實(shí)驗(yàn)室間協(xié)同試驗(yàn),或有先前在正常條件下經(jīng)多次測試積累的精密度數(shù)據(jù),那亦可以按協(xié)同試驗(yàn)的重復(fù)性限r(和再現(xiàn)性限R)或先前積累的精密度數(shù)據(jù)進(jìn)行判別,以避免“漏判”。

②由于測量值精密度高而使離散度本來不大的測量值在統(tǒng)計(jì)上被判為離群值,這時(shí)亦應(yīng)以協(xié)同試驗(yàn)的重復(fù)性限r(和再現(xiàn)性限R)或先前積累的精密度數(shù)據(jù)進(jìn)行判別,以免“誤判”。在對標(biāo)準(zhǔn)物質(zhì)分析時(shí),如果測量值在統(tǒng)計(jì)上認(rèn)為是離群值,但其仍然在認(rèn)定值的置信范圍內(nèi),將這樣的異常值舍去也是不合適的,應(yīng)將其保留,并說明保留的理由。

③應(yīng)用奈爾法檢驗(yàn),已知標(biāo)準(zhǔn)差是很重要的,而且要求標(biāo)準(zhǔn)差值可靠。當(dāng)測量數(shù)據(jù)不多,或認(rèn)為計(jì)算的標(biāo)準(zhǔn)差可靠性差,可引用方法的重復(fù)性標(biāo)準(zhǔn)差sr,或先前積累的精密度數(shù)據(jù)。

④過多的離群值往往預(yù)示測試過程存在問題。在精密度的協(xié)同試驗(yàn)或標(biāo)準(zhǔn)物質(zhì)定值分析中,可能有這樣的實(shí)驗(yàn)室,它在多個(gè)水平上出現(xiàn)離群值,這表明該實(shí)驗(yàn)室在測試中存在較大的系統(tǒng)誤差(和隨機(jī)誤差),可考慮剔除該實(shí)驗(yàn)室的部分或全部數(shù)據(jù),因?yàn)樵搶?shí)驗(yàn)室的測量結(jié)果與其他實(shí)驗(yàn)室的可能不屬于同一正態(tài)總體。

由此,采用多種檢驗(yàn)方法,包括采用測試方法的重復(fù)性標(biāo)準(zhǔn)差,或采用先前積累的精密度數(shù)據(jù),在對測量值進(jìn)行離群值的統(tǒng)計(jì)檢驗(yàn)中可以彌補(bǔ)其相對檢驗(yàn)的不足。在標(biāo)準(zhǔn)物質(zhì)均勻性檢驗(yàn)和定值分析的數(shù)據(jù)處理時(shí)這種互為補(bǔ)充的檢驗(yàn)方法尤為重要。

主站蜘蛛池模板: 腾冲县| 虹口区| 政和县| 昌平区| 栾城县| 汾阳市| 麻江县| 济南市| 阿尔山市| 德兴市| 涿鹿县| 淳化县| 永康市| 甘孜县| 西乌珠穆沁旗| 新宾| 侯马市| 二手房| 灵川县| 灵川县| 东城区| 阳新县| 剑河县| 仁怀市| 临城县| 宿州市| 平武县| 吴忠市| 正蓝旗| 潼关县| 湖南省| 绥宁县| 穆棱市| 本溪市| 鹿泉市| 平度市| 兴海县| 大邑县| 兴城市| 沙河市| 扶风县|