网上电商

書名：分析化學綜合教程（第二版）
作者名：馬惠莉劉杰主編
本章字數： 2525字
更新時間： 2020-07-31 17:45:21

2.4　分析結果的數據處理

凡是測量就有誤差存在。用數字表示測量結果都具有不確定性，即使是一位經驗豐富的分析工作者采用最好的分析方法和可靠的分析儀器對同一個樣品進行多次測定，其得到的結果也不可能完全一致。于是，相關的一系列問題便提出來了：如何更好地表達結果，使之既能體現測量的精密度，又能夠充分顯示結果的準確度；如何對測量的可疑值或離群值進行有根據的取舍；如何比較不同人、不同實驗室間的結果以及用不同實驗方法得到的結果；等等。這些問題需要采用數理統計的方法?加以解決。

本節只簡要介紹與處理分析實驗數據有關的數理統計的最基本問題。

2.4.1　置信度與置信區間

在實際分析工作中，最核心的問題就是如何通過測量來求得真值。一方面，由于隨機誤差的不可避免，測量值與真值往往不一致（x ≠ μ）；另一方面，測量值與真值之間的差距又不會很大，即x不但不可能偏離μ 太遠（有界性），而且通常就在μ 附近（小誤差出現的概率較大）。基于上述兩方面因素，在有限次測量中，合理地得到真值的方法應該是估計出測量值與真值的接近程度，即在測量值附近估計出包含有真值的范圍。這就提出了置信度與置信區間的問題。

① 置信度（P）　又稱置信水平，就是人們對所做判斷的有把握程度。置信度的實質仍然歸結為某事件出現的概率，可以理解為某一定范圍的測定值（或誤差值）出現的概率。

② 置信區間　是指將在一定概率下以測量值為中心包含總體平均值在內的區間。置信區間的意義在于真值在指定概率下，分布在某一個區間。

在分析測試中，測定次數是有限的，一般平行測定3～5次，無法計算總體標準偏差 σ 和總體平均值 μ，而有限次測定的隨機誤差并不完全服從正態分布，而是服從類似于正態分布的t分布?，t值的定義為：

　　（2.14）

若以某樣本的測定值的平均值表示 μ 的置信區間，根據t分布則可得出以下關系式：

　　（2.15）

式（2.15）表示在一定置信度下，以平均值為中心，包括總體平均值 μ 的范圍。這就是平均值的置信區間。該式的意義：在一定置信度下（如95%），真值（總體平均值）將在測定平均值附近的一個區間即在和之間存在，有把握程度為95%。因此，式（2.15）常作為分析結果的表達式。

例2.6　測定SiO₂的含量，6次平行測定的數據（%）為28.62、28.59、28.51、28.48、28.52和28.63，計算置信度為90%和95%時的平均值的置信區間。

解：= 28.56%，s = 0.06%，n = 6。查t值表（表2.4）得

P = 90%，t = 2.015，根據式（2.15），μ = (28.56±0.05)%

P = 95%，t = 2.571，根據式（2.15），μ = (28.56±0.07)%

計算結果表明：若平均值的置信區間取 (28.56±0.05)%，則真值在其中出現的概率為90%；若將真值出現的概率提高到95%，則其平均值的置信區間將擴大為 (28.56±0.07)%。

置信度選擇越高，置信區間越寬，其區間包括真值的可能性就越大。在分析化學中，一般將置信度定為95%或90%。

表2.4　t值表

例2.7　同例2.6，若將測定次數改為4次，4次平行測定的數據（%）分別為28.62、28.59、28.48和28.52，計算置信度為95%時的置信區間。

解：= 28.55，s = 0.064%，n = 4，查表2.4：P = 95%，t = 3.182

則：　μ = (28.55±0.12)%　

由此可見，在一定測定次數范圍內，適當增加測定次數，可使置信區間顯著縮小，從而使測定的平均值與總體平均值 μ 更接近。

當測定值的精密度越高（s值越小）、測定次數越多（n值越大）時，置信區間越窄，即平均值越接近真值，平均值越可靠。

注意：對于置信區間的概念必須正確理解，如 μ =(47.50±0.10)%（置信度為95%），應當理解為在 (47.50±0.10)% 的區間內包括總體平均值 μ 的概率為95%。因為 μ 是客觀存在的，沒有隨機性，不能說它落在某一區間的概率為多少。

2.4.2　可疑值的取舍

在一組平行測定的數據中，有時個別數據與其他數據相比差距較大，這樣的數據就稱為可疑值，也叫極端值或離群值。數據中出現個別值離群太遠時，首先要仔細檢查測定過程是否有操作錯誤，是否有過失誤差存在，不能隨意舍棄可疑值以提高精密度，而是需要進行數理統計處理。即判斷可疑值是否仍在偶然誤差范圍內。可疑值取舍的統計方法很多，也各有特點，但基本思路是一致的，即它們都是建立在隨機誤差服從一定的分布規律的基礎上。常用的統計檢驗方法有檢驗法、Q檢驗法（Q-test）?和格魯布斯法。