官术网_书友最值得收藏!

2.4 分析結果的數據處理

凡是測量就有誤差存在。用數字表示測量結果都具有不確定性,即使是一位經驗豐富的分析工作者采用最好的分析方法和可靠的分析儀器對同一個樣品進行多次測定,其得到的結果也不可能完全一致。于是,相關的一系列問題便提出來了:如何更好地表達結果,使之既能體現測量的精密度,又能夠充分顯示結果的準確度;如何對測量的可疑值或離群值進行有根據的取舍;如何比較不同人、不同實驗室間的結果以及用不同實驗方法得到的結果;等等。這些問題需要采用數理統計的方法?加以解決。

本節只簡要介紹與處理分析實驗數據有關的數理統計的最基本問題。

2.4.1 置信度與置信區間

在實際分析工作中,最核心的問題就是如何通過測量來求得真值。一方面,由于隨機誤差的不可避免,測量值與真值往往不一致(xμ);另一方面,測量值與真值之間的差距又不會很大,即x不但不可能偏離μ 太遠(有界性),而且通常就在μ 附近(小誤差出現的概率較大)。基于上述兩方面因素,在有限次測量中,合理地得到真值的方法應該是估計出測量值與真值的接近程度,即在測量值附近估計出包含有真值的范圍。這就提出了置信度與置信區間的問題。

置信度P) 又稱置信水平,就是人們對所做判斷的有把握程度。置信度的實質仍然歸結為某事件出現的概率,可以理解為某一定范圍的測定值(或誤差值)出現的概率。

置信區間 是指將在一定概率下以測量值為中心包含總體平均值在內的區間。置信區間的意義在于真值在指定概率下,分布在某一個區間。

在分析測試中,測定次數是有限的,一般平行測定3~5次,無法計算總體標準偏差 σ 和總體平均值 μ,而有限次測定的隨機誤差并不完全服從正態分布,而是服從類似于正態分布的t分布?t值的定義為:

image081  (2.14)

若以某樣本的測定值的平均值image083表示 μ 的置信區間,根據t分布則可得出以下關系式:

image085  (2.15)

式(2.15)表示在一定置信度下,以平均值image087為中心,包括總體平均值 μ 的范圍。這就是平均值的置信區間。該式的意義:在一定置信度下(如95%),真值(總體平均值)將在測定平均值image089附近的一個區間即在image091image093之間存在,有把握程度為95%。因此,式(2.15)常作為分析結果的表達式。

例2.6 測定SiO2的含量,6次平行測定的數據(%)為28.62、28.59、28.51、28.48、28.52和28.63,計算置信度為90%和95%時的平均值的置信區間。

解:image087= 28.56%,s = 0.06%,n = 6。查t值表(表2.4)得

P = 90%,t = 2.015,根據式(2.15),μ = (28.56±0.05)%

P = 95%,t = 2.571,根據式(2.15),μ = (28.56±0.07)%

計算結果表明:若平均值的置信區間取 (28.56±0.05)%,則真值在其中出現的概率為90%;若將真值出現的概率提高到95%,則其平均值的置信區間將擴大為 (28.56±0.07)%。

置信度選擇越高,置信區間越寬,其區間包括真值的可能性就越大。在分析化學中,一般將置信度定為95%或90%。

表2.4 t值表

28

29

例2.7 同例2.6,若將測定次數改為4次,4次平行測定的數據(%)分別為28.62、28.59、28.48和28.52,計算置信度為95%時的置信區間。

解:image087= 28.55,s = 0.064%,n = 4,查表2.4:P = 95%,t = 3.182

則: μ = (28.55±0.12)% 

由此可見,在一定測定次數范圍內,適當增加測定次數,可使置信區間顯著縮小,從而使測定的平均值image087與總體平均值 μ 更接近。

當測定值的精密度越高(s值越小)、測定次數越多(n值越大)時,置信區間越窄,即平均值越接近真值,平均值越可靠。

注意:對于置信區間的概念必須正確理解,如 μ =(47.50±0.10)%(置信度為95%),應當理解為在 (47.50±0.10)% 的區間內包括總體平均值 μ 的概率為95%。因為 μ 是客觀存在的,沒有隨機性,不能說它落在某一區間的概率為多少。

2.4.2 可疑值的取舍

在一組平行測定的數據中,有時個別數據與其他數據相比差距較大,這樣的數據就稱為可疑值,也叫極端值或離群值。數據中出現個別值離群太遠時,首先要仔細檢查測定過程是否有操作錯誤,是否有過失誤差存在,不能隨意舍棄可疑值以提高精密度,而是需要進行數理統計處理。即判斷可疑值是否仍在偶然誤差范圍內。可疑值取舍的統計方法很多,也各有特點,但基本思路是一致的,即它們都是建立在隨機誤差服從一定的分布規律的基礎上。常用的統計檢驗方法有image102檢驗法、Q檢驗法(Q-test)?和格魯布斯法。

本書主要介紹image102檢驗法和Q檢驗法兩種方法。

(1)image102檢驗法

步驟】首先求出除可疑值以外的其余數據的平均值image105和平均偏差image107,然后將可疑值與平均值image105之差的絕對值與image102比較,若差的絕對值大于等于image102,則將可疑值舍棄,否則保留。

該檢驗法比較簡單,但判斷有時不夠準確。

例2.8 某標準溶液的4次標定值分別為0.1014mol?L?1、0.1012mol?L?1、0.1025mol?L?1和0.1016mol?L?1,問其中0.1025mol?L?1是否應舍棄?

解:除掉0.1025外的其余三個數據的image105=0.1014,image107=0.00013,image102= 0.00052,則:

|0.1014?0.1025| = 0.0011>image102

故可疑值0.1025應該舍棄。

(2)Q檢驗法

如果測定次數在10次以內,采用Q檢驗法比較簡便。

步驟】將測定值由小到大排列:x1, x2, x3, …, xn。如果其中x1xn為可疑值,算出統計量Q值。

xn可疑時,用:image117  (2.16)

x1可疑時,用:image119  (2.17)

式(2.16)和式(2.17)中xn?x1稱為極差。image121值越大,說明x1xn離群越遠,遠至一定程度時則應將其舍去,故image122值又稱為“舍棄商”。

根據測定次數n和所要求的置信度P,查Q值表(表2.5),可得相應n和置信度P下的image124,若image125image127,則應將可疑值舍棄,否則保留。

表2.5 Q值表

30

例2.9 同例2.8,用Q檢驗法判斷0.1025是否應舍棄(置信度0.90)。

解:image129  

查表2.5,n=4時,Q0.90=0.76,因0.69<0.76(image130Q0.90),故0.1025不應舍棄,而應保留。

同一個例子,Q檢驗法與image132檢驗法的結論不同,這表明了不同判斷方法的相對性。

Q檢驗法由于不必計算image134s,故使用起來比較方便。Q檢驗法在統計上有可能保留離群較遠的值。置信度常選90%,如選95%,會使判斷誤差更大。

如果測定數據較少,測定的精密度也不高,因image135值與QP,n值相接近而對可疑值的取舍

難以判斷時,最好補測1~2次再進行檢驗就更有把握。

缺乏經驗的人往往喜歡從三次測定數據中挑選兩個“好”的數據,這種做法是沒有根據的,有時甚至是荒謬的,表面上似乎提高了測定的精密度,但對平均值的置信區間來說,有時得到相反的結果。

例如,有下列三個測定值:40.12、40.16和40.18。表面看起來,取后面兩次測定數據的平均值40.17更理想,其實,其置信區間更寬了,真值存在的范圍更大了。

① 不舍棄40.12,平均值的置信區間(置信度為95%)為:

image137

即真值范圍在40.07~40.23。

② 舍棄40.12后,平均值的置信區間(置信度為95%)為:

image139

即真值存在范圍在40.04~40.30。

總之,出現可疑數據時,應著重從技術上查明原因,然后再進行統計檢驗,切忌任意舍棄。

主站蜘蛛池模板: 叙永县| 荔波县| 武清区| 治县。| 北宁市| 都江堰市| 德庆县| 无极县| 周至县| 漳州市| 峨眉山市| 巫溪县| 包头市| 湘潭县| 纳雍县| 芮城县| 涟源市| 孟村| 乌拉特前旗| 雷波县| 定结县| 金平| 刚察县| 高阳县| 宝应县| 嘉定区| 二连浩特市| 绥芬河市| 常德市| 琼海市| 连平县| 微山县| 乌拉特前旗| 岳西县| 林西县| 赞皇县| 夏河县| 岑巩县| 福泉市| 和顺县| 汕尾市|