- 分析化學綜合教程(第二版)
- 馬惠莉 劉杰主編
- 2525字
- 2020-07-31 17:45:21
2.4 分析結果的數據處理
凡是測量就有誤差存在。用數字表示測量結果都具有不確定性,即使是一位經驗豐富的分析工作者采用最好的分析方法和可靠的分析儀器對同一個樣品進行多次測定,其得到的結果也不可能完全一致。于是,相關的一系列問題便提出來了:如何更好地表達結果,使之既能體現測量的精密度,又能夠充分顯示結果的準確度;如何對測量的可疑值或離群值進行有根據的取舍;如何比較不同人、不同實驗室間的結果以及用不同實驗方法得到的結果;等等。這些問題需要采用數理統計的方法?加以解決。
本節只簡要介紹與處理分析實驗數據有關的數理統計的最基本問題。
2.4.1 置信度與置信區間
在實際分析工作中,最核心的問題就是如何通過測量來求得真值。一方面,由于隨機誤差的不可避免,測量值與真值往往不一致(x ≠ μ);另一方面,測量值與真值之間的差距又不會很大,即x不但不可能偏離μ 太遠(有界性),而且通常就在μ 附近(小誤差出現的概率較大)。基于上述兩方面因素,在有限次測量中,合理地得到真值的方法應該是估計出測量值與真值的接近程度,即在測量值附近估計出包含有真值的范圍。這就提出了置信度與置信區間的問題。
① 置信度(P) 又稱置信水平,就是人們對所做判斷的有把握程度。置信度的實質仍然歸結為某事件出現的概率,可以理解為某一定范圍的測定值(或誤差值)出現的概率。
② 置信區間 是指將在一定概率下以測量值為中心包含總體平均值在內的區間。置信區間的意義在于真值在指定概率下,分布在某一個區間。
在分析測試中,測定次數是有限的,一般平行測定3~5次,無法計算總體標準偏差 σ 和總體平均值 μ,而有限次測定的隨機誤差并不完全服從正態分布,而是服從類似于正態分布的t分布?,t值的定義為:
(2.14)
若以某樣本的測定值的平均值表示 μ 的置信區間,根據t分布則可得出以下關系式:
(2.15)
式(2.15)表示在一定置信度下,以平均值為中心,包括總體平均值 μ 的范圍。這就是平均值的置信區間。該式的意義:在一定置信度下(如95%),真值(總體平均值)將在測定平均值
附近的一個區間即在
和
之間存在,有把握程度為95%。因此,式(2.15)常作為分析結果的表達式。
例2.6 測定SiO2的含量,6次平行測定的數據(%)為28.62、28.59、28.51、28.48、28.52和28.63,計算置信度為90%和95%時的平均值的置信區間。
解:= 28.56%,s = 0.06%,n = 6。查t值表(表2.4)得
P = 90%,t = 2.015,根據式(2.15),μ = (28.56±0.05)%
P = 95%,t = 2.571,根據式(2.15),μ = (28.56±0.07)%
計算結果表明:若平均值的置信區間取 (28.56±0.05)%,則真值在其中出現的概率為90%;若將真值出現的概率提高到95%,則其平均值的置信區間將擴大為 (28.56±0.07)%。
置信度選擇越高,置信區間越寬,其區間包括真值的可能性就越大。在分析化學中,一般將置信度定為95%或90%。
表2.4 t值表
例2.7 同例2.6,若將測定次數改為4次,4次平行測定的數據(%)分別為28.62、28.59、28.48和28.52,計算置信度為95%時的置信區間。
解:= 28.55,s = 0.064%,n = 4,查表2.4:P = 95%,t = 3.182
則: μ = (28.55±0.12)%
由此可見,在一定測定次數范圍內,適當增加測定次數,可使置信區間顯著縮小,從而使測定的平均值與總體平均值 μ 更接近。
當測定值的精密度越高(s值越小)、測定次數越多(n值越大)時,置信區間越窄,即平均值越接近真值,平均值越可靠。
注意:對于置信區間的概念必須正確理解,如 μ =(47.50±0.10)%(置信度為95%),應當理解為在 (47.50±0.10)% 的區間內包括總體平均值 μ 的概率為95%。因為 μ 是客觀存在的,沒有隨機性,不能說它落在某一區間的概率為多少。
2.4.2 可疑值的取舍
在一組平行測定的數據中,有時個別數據與其他數據相比差距較大,這樣的數據就稱為可疑值,也叫極端值或離群值。數據中出現個別值離群太遠時,首先要仔細檢查測定過程是否有操作錯誤,是否有過失誤差存在,不能隨意舍棄可疑值以提高精密度,而是需要進行數理統計處理。即判斷可疑值是否仍在偶然誤差范圍內。可疑值取舍的統計方法很多,也各有特點,但基本思路是一致的,即它們都是建立在隨機誤差服從一定的分布規律的基礎上。常用的統計檢驗方法有檢驗法、Q檢驗法(Q-test)?和格魯布斯法。
本書主要介紹檢驗法和Q檢驗法兩種方法。
(1)
檢驗法
【步驟】首先求出除可疑值以外的其余數據的平均值和平均偏差
,然后將可疑值與平均值
之差的絕對值與
比較,若差的絕對值大于等于
,則將可疑值舍棄,否則保留。
該檢驗法比較簡單,但判斷有時不夠準確。
例2.8 某標準溶液的4次標定值分別為0.1014mol?L?1、0.1012mol?L?1、0.1025mol?L?1和0.1016mol?L?1,問其中0.1025mol?L?1是否應舍棄?
解:除掉0.1025外的其余三個數據的=0.1014,
=0.00013,
= 0.00052,則:
|0.1014?0.1025| = 0.0011>
故可疑值0.1025應該舍棄。
(2)Q檢驗法
如果測定次數在10次以內,采用Q檢驗法比較簡便。
【步驟】將測定值由小到大排列:x1, x2, x3, …, xn。如果其中x1或xn為可疑值,算出統計量Q值。
當xn可疑時,用: (2.16)
當x1可疑時,用: (2.17)
式(2.16)和式(2.17)中xn?x1稱為極差。值越大,說明x1或xn離群越遠,遠至一定程度時則應將其舍去,故
值又稱為“舍棄商”。
根據測定次數n和所要求的置信度P,查Q值表(表2.5),可得相應n和置信度P下的,若
>
,則應將可疑值舍棄,否則保留。
表2.5 Q值表
例2.9 同例2.8,用Q檢驗法判斷0.1025是否應舍棄(置信度0.90)。
解:
查表2.5,n=4時,Q0.90=0.76,因0.69<0.76(<Q0.90),故0.1025不應舍棄,而應保留。
同一個例子,Q檢驗法與檢驗法的結論不同,這表明了不同判斷方法的相對性。
Q檢驗法由于不必計算和s,故使用起來比較方便。Q檢驗法在統計上有可能保留離群較遠的值。置信度常選90%,如選95%,會使判斷誤差更大。
如果測定數據較少,測定的精密度也不高,因值與QP,n值相接近而對可疑值的取舍
難以判斷時,最好補測1~2次再進行檢驗就更有把握。
缺乏經驗的人往往喜歡從三次測定數據中挑選兩個“好”的數據,這種做法是沒有根據的,有時甚至是荒謬的,表面上似乎提高了測定的精密度,但對平均值的置信區間來說,有時得到相反的結果。
例如,有下列三個測定值:40.12、40.16和40.18。表面看起來,取后面兩次測定數據的平均值40.17更理想,其實,其置信區間更寬了,真值存在的范圍更大了。
① 不舍棄40.12,平均值的置信區間(置信度為95%)為:
即真值范圍在40.07~40.23。
② 舍棄40.12后,平均值的置信區間(置信度為95%)為:
即真值存在范圍在40.04~40.30。
總之,出現可疑數據時,應著重從技術上查明原因,然后再進行統計檢驗,切忌任意舍棄。
- 西點工藝
- 表面處理技術概論(第二版)
- 李觀儀《新編英語教程(6)》(修訂版)學習指南【詞匯短語+課文精解+全文翻譯+練習答案】
- 化學基礎實驗操作規范
- 2020年西南財經大學802經濟學二(政治經濟學部分)考試大綱解析
- 李珍《社會保障理論》(第3版)配套題庫【名校考研真題+課后習題+章節題庫+模擬試題】
- 市場、設計與訴求:視覺傳達設計者需要了解的市場調查
- HyperMesh實用工程技術
- 會計學實驗教程
- 紡織機械基礎概論(第3版)
- 2015浙江理工大學服裝學院畢業設計作品集
- 畫法幾何及土木工程制圖(第4版)
- 人身保險綜合實驗教程
- 2020年山西公務員錄用考試專用教材:數量關系【考點精講+典型題(含歷年真題)詳解】
- 服裝精確制板與工藝:半身裙·連衣裙