第2章 實驗誤差分析及數據處理
2.1 實驗誤差分析
在實驗測量過程中,由于實驗方法和實驗設備的不完善,測量儀表和人觀察的偏差以及環境的影響,實驗的測量值與客觀存在的真實值之間不可避免地存在一定的差異,這種差異即為實驗數據的誤差。通過實驗誤差分析,可以認清誤差的來源及其影響,并設法排除數據中所包含的無效成分,還可進一步改進實驗方案。在實驗中注意哪些是影響實驗的主要方面,這對正確組織實驗方法、正確評判實驗結果和設計方案,從而提高實驗的精確性具有重要的指導意義。
2.1.1 真值及平均值
測量誤差=測量值-真值 (2-1)
真值也稱理論值,是指某物理量客觀存在的確定值。由于測量儀器、測量方法、環境、人員及測量程序等都不可能完美無缺,實驗誤差難以避免,故真值是無法得到的。
由于真值是無法測定的,故只能在實驗中無限地增加測量次數,根據誤差的分布規律,即當正負誤差出現概率均等時,再經過仔細推敲消除系統誤差,將其多次測量值求平均值,讓測量值無限接近真值。在分析實驗數據及誤差時,一般用以下幾種值代替真值:
(1)理論真值
理論真值是由理論證實而得知的值。如平面三角形內角之和為180°;計量學中經國際計量大會決議的值,像熱力學溫度單位——絕對零度等于-273.15K;以及一些理論公式表達值等。
(2)相對真值
在化工過程中,經常會在測量時候使用高精度級的標準儀器來代替普通的儀器,像這樣所測得的數據稱為相對真值。如:高精度的渦輪流量計相對于普通的孔板流量計而言就是真值;高精度的鉑電阻溫度傳感器相對于普通的溫度計而言就是真值。
(3)平均值
在沒有系統誤差的前提下,將多次測量值相加再取平均,得到的數值用來代替真值。然而,實際上實驗的測量是有一定次數限制的,根據這些有限次數的測量求出的平均值也只是近似地接近真值,也稱為最佳平均值。
目前常用的平均值有以下幾種方式:
①算術平均值 算術平均值是最常見的一種平均值。凡測量值的分布服從正態分布,利用最小二乘法原理可以證明,在一組等精確度的測量中,算術平均值是最佳或者說是最值得信賴的值。
(2-2)
式中 x1,x2,…,xn——各次測量值;
n——測量的次數。
②幾何平均值 幾何平均值是將一組n個測量值連乘并開n次方求得的平均值。即
(2-3)
③均方根平均值
(2-4)
④加權平均值 若某組實驗值是用不同方法或是由不同的實驗人員測得的,則這組實驗數據中的不同值的精度或可靠性不一致,在這種情況下,為了突出可靠性高的數值,則宜采用加權平均值。
(2-5)
式中 w1,w2,…,wn——各次測量值對應的權重。
⑤對數平均值 在化學反應、熱量和質量傳遞中,其分布曲線具有對數的特性,在這種情況下表征平均值常用對數平均值。比如氣體膜傳熱實驗,填料吸收塔的傳質系數的測定實驗等。設兩個變量分別為x1、x2,其對數平均值
(2-6)
變量的對數平均值總小于算術平均值。當1<x1/x2<2時,算術平均值和對數平均值相差不大,引起的誤差不超過4%,這時對數平均值可以用算術平均值代替。
上述介紹的各種平均值,目的是要從一組測定值中找出最接近真值的那個值。平均值的選擇主要決定于一組觀測值的分布類型,在化工原理實驗研究中,數據分布較多屬于正態分布,故通常采用算術平均值。
2.1.2 誤差及誤差分類
誤差產生的原因很多,總結起來有三個方面:①由于觀測者感覺器官鑒別能力、技術水平、工作態度及狀態都對測量結果的影響而產生的誤差;②由于儀器本身在設計、制造、安裝、校正等方面精密程度不同,因而觀測值的精確度也必然受到一定的限制;③由于溫度、濕度、壓強、大氣折光等外界因素發生變化,對觀測結果產生的影響也會隨之變化。通常我們所說的觀測條件就是把這三方面因素綜合起來,它的好壞直接影響觀測結果的準確程度。
根據誤差產生的原因及其性質可分為系統誤差、偶然誤差和粗大誤差。
(1)系統誤差
系統誤差是指在實驗測量中由未發覺或未確認的因素所引起的,在同一組實驗測定中,影響結果或偏大或偏小。換句話說,實驗條件固定,系統誤差自然而然也就確定了;相反實驗條件一旦改變,系統誤差也就隨之改變。產生系統誤差的原因主要有:
①由于測量儀器不良,本身存在偏差。如儀器刻度不精確,儀表零點未校正或者標準本身存在偏差等。
②周圍環境的改變,偏離校準值。如外界溫度、壓力、濕度等變化引起的偏差。
③測量不當與偏向,如近似的測量方法或近似的計算公式等引起的誤差。
④實驗人員的習慣操作與偏向,如讀數偏高或偏低等引起的誤差,記錄某一信號的時間總是滯后、判定滴定終點的顏色每個人不同等因素所引起的誤差。
我們經常用精確度一詞來表征系統誤差的大小,系統誤差越小,準確度越高,反之亦然。由于系統誤差是測量誤差的重要組成部分,消除和估計系統誤差對于提高測量準確度就十分重要。一般系統誤差是有規律的,其產生的原因也往往是可知的或找出原因后可以將其清除掉。至于不能消除的系統誤差,我們應設法確定或估計出來,見表2-1。
表2-1 單次測量和多次測量的確定及評估

(2)偶然誤差
偶然誤差又叫隨機誤差,在已經消除了系統誤差的前提下去測量,由某些不易控制的因素造成的,測量過程中所測定的數據在倒數一位或者倒數兩位數字上仍有差別,然而這些差別沒有規律性可循,時而大時而小,時而正時而負,我們把這樣的誤差稱為偶然誤差。偶然誤差產生的原因很復雜,沒有控制和補償的措施,因而也就沒有辦法消除。但是,偶然誤差完全遵守統計規律,誤差的大小及其正負的出現完全可以由概率推算。因此,在實驗過程中要測得更接近真值的數據,就需多次測量并利用其測定的結果求算平均值,從而減小偶然誤差對實驗的影響。
(3)粗大誤差
粗大誤差也叫過失誤差,是由于實驗人員在實驗過程中粗心大意、操作不正確等原因引起的與事實完全不符的誤差。該誤差跟偶然誤差類似,也無規律可循,但是如果加強對實驗的管理,實驗人員提高自身的責任感、多方警惕、細心操作,粗大誤差是完全可以避免的。常見的粗大誤差準則如表2-2所示。
表2-2 常見的粗大誤差準則

綜上所述,我們可以認為系統誤差和過失誤差總是可以設法避免的,而隨機誤差是不可以避免的,因此最好的實驗結果應該只含有偶然誤差。
2.1.3 誤差表示方法
(1)絕對誤差
測量值X和真值A0的差值稱為絕對誤差,通常稱為誤差。記為:
D=X-A0 (2-7)
真值A0一般是無法求得的,因而上述公式(2-7)只有理論意義。在數據處理中我們常用高一級標準儀器的顯示值來代替真值A0,用A來表示定義實際值。因為高級別標準儀器存在的誤差相對較小,也就是說A雖然不等于A0,但跟X比起來更接近于A0。我們通常把X與A之間存在的誤差稱為儀器顯示值的絕對誤差。用下面的公式表示:
d=X-A (2-8)
稱儀器顯示值的絕對誤差d的相反數為修正值,用C表示,記為:
C=-d=A-X (2-9)
通過檢定,可以由高一級標準儀器給出被檢儀器的修正值C。利用修正值便可以求出該儀器的實際值A。即:
A=X+C (2-10)
絕對誤差雖很重要,但僅用它還不足以說明測量的準確程度,換句話說,它還不能給出測量準確與否的完整概念。
(2)相對誤差
相對誤差能衡量某一測量數據的準確程度,一般用δA來表示。可表示為顯示值絕對誤差d與被測量的實際值A的百分比值,稱為實際相對誤差。記為:
(2-11)
如果在相對誤差中的實際值A用儀器的顯示值X代替,稱為顯示值相對誤差。記為:
(2-12)
如果沒有特殊說明,我們在計算時多采用顯示值的相對誤差。
(3)引用誤差
引用誤差是指儀表示值的絕對誤差與量程范圍之比,通過引用誤差的計算,可以劃分儀表精確度等級。
(2-13)
式中 d——示值絕對誤差;
Xn——標尺上限值-標尺下限值。
(4)范圍誤差
范圍誤差是指在一組測量中的最高值與最低值之差,在此作為誤差的變化范圍。使用中常應用誤差系數的概念。
(2-14)
式中 K——最大誤差系數;
L——范圍誤差;
α——算數平均值。
(5)算術平均誤差
算術平均誤差是經過多次測量,把每次測量值的誤差求出來,而后求的平均值。公式為:
(2-15)
式中 n——測量次數;
di——第i次測量的誤差。
(6)標準誤差
標準誤差也稱為均方誤差。其定義為:
(2-16)
式(2-16)使用于無限測量的場合。實際測量工作中,大多數的測量次數是有限的,其計算公式為:
(2-17)
標準誤差不是一個具體的誤差,σ的大小只說明在一定條件下等精度測量集合所屬的每一個觀測值對其算術平均值的分散程度,如果σ的值愈小則說明每一次測量值對其算術平均值分散度就小,測量的精度就高,反之精度就低。
算數平均誤差和標準誤差的計算式中第i次誤差可分別代入絕對誤差和相對誤差,相對得到的值表示測量集合的絕對誤差和相對誤差。
上述的各種誤差表示方法中,不論是比較各種測量值的精度還是評價測量結果的好壞,均以相對誤差和標準誤差為優選,在文獻中標準誤差的使用率會更高。
2.1.4 精密度、正確度和準確度
測量的質量和水平,可用誤差概念來描述,也可用準確度等概念來描述。為了指明誤差的來源和性質,通常用以下三個概念。
①精密度 可以衡量某物理量幾次測量值之間的一致性,即重復性。它可以反映隨機誤差的影響程度,精密度高表示隨機誤差小。如果實驗的相對誤差為0.01%,且誤差純由隨機誤差引起,則可認為精密度為10-4。
②正確度 是指在規定條件下,測量中所有系統誤差的綜合。正確度高表示系統誤差小。如果實驗的相對誤差為0.01%,且誤差純由系統誤差引起,則可認為正確度為10-4。在我國的分析資料中一般不采用正確度而采用準確度表征測量中系統的誤差。
③準確度(或稱精確度) 它表示測量中所有系統誤差和隨機誤差的綜合。因此,準確度表示測量結果與真值的逼近程度。如果實驗的相對誤差為0.01%,且誤差由系統誤差和隨機誤差共同引起,則可認為準確度為10-4。
為說明它們間的區別,往往用打靶來作比喻,如圖2-1所示:圖(a)為系統誤差大,而隨機誤差小,即正確度低而精密度高;圖(b)為系統誤差小而隨機誤差大,正確度高而精密度低。在實際測量中沒有像靶心那樣明確的真值,而是設法去測定這個未知的真值;圖(c)為系統與隨機誤差都小,即準確度高。

圖2-1 精密度、正確度和準確度關系圖
學生在實驗過程中,往往滿足于實驗數據的重現性,而忽略了數據測量值的準確程度。絕對真值是不可知的,人們只能定出一些國際標準作為測量儀表準確性的參考標準。隨著人類認識運動的推移和發展,可以逐步逼近絕對真值。在一組測量中,精密度高的正確度不一定高,但準確度高,則精密度和正確度一定都高。
2.1.5 儀器的精確度與測量值的誤差
(1)給出精確度等級類的儀器
這些儀器的精確度常采用儀器的最大引用誤差和精確度的等級來表示。儀器的最大引用誤差的定義為:
(2-18)
式中儀表顯示值的絕對誤差指在規定的正常情況下,被測參數的測量值與被測參數標準值之差的絕對值的最大值。對于多檔次儀表,不同檔次顯示值的絕對誤差和量程范圍均不相同。當儀表顯示值的絕對誤差相同,則量程范圍越大,最大引用誤差越小。目前,我國生產儀表的常用精確度等級有0.005、0.02、0.05、0.1、0.2、0.4、0.5、1.0、1.5、2.5、4.0等。如果某臺測溫儀表的基本誤差為±1.0%,則認為該儀表的精確度等級符合1.0級。
(2)不給出精確度等級類的儀器
此類儀器的精確度計算公式為:
(2-19)
式中名義分度值指測量時讀數能夠讀準的最小分度所代表的數值。
(3)測量值的實際誤差
用上述方法所確定的測量誤差,一般總是比測量值的實際誤差小得多。這是因為儀器沒有調整到理想狀態,如不垂直、不水平、零位沒有調整好等會引起誤差;儀表的實際工作條件不符合規定的正常工作條件,會引起附加誤差;儀器經過長期使用后,零件發生磨損,裝配狀況發生變化等,也會引起誤差;可能存在操作者的習慣和偏向所引起的誤差等。總而言之,測量值實際誤差大小的影響因素是很多的。為了獲得較準確的測量結果,需要有較好的儀器,也需要有科學的態度和方法,以及扎實的理論知識和實踐經驗。
2.1.6 誤差的性質及傳遞
在化工原理實驗中通常直接測量或間接測量得到有關的參數數據,這些參數數據的可靠程度如何?如何提高其可靠性?因此,必須研究在給定條件下誤差的基本性質和變化規律。
(1)誤差的正態分布
如果測量數列中不包括系統誤差和過失誤差,從大量的實驗中發現偶然誤差的大小有如下幾個特征:
①絕對值小的誤差比絕對值大的誤差出現的機會多,即誤差的概率與誤差的大小有關。這是誤差的單峰性。
②絕對值相等的正誤差或負誤差出現的次數相當,即誤差的概率相同。這是誤差的對稱性。
③極大的正誤差或負誤差出現的概率都非常小,即大的誤差一般不會出現。這是誤差的有界性。
④隨著測量次數的增加,偶然誤差的算術平均值趨近于零。這叫誤差的抵償性。
根據上述的誤差特征,可疑誤差出現的概率分布如圖2-2所示。圖中橫坐標表示偶然誤差,縱坐標表示各誤差出現的概率,圖中曲線稱為誤差分布曲線,以y=f(x)表示。其數學表達式為:
(2-20)
式(2-20)稱為高斯誤差分布定律亦稱為誤差方程。式中σ為標準誤差,h為精確度指數,σ和h的關系:
(2-21)

圖2-2 誤差分布曲線
若誤差按函數關系分布,則稱為正態分布。σ越小,測量精度越高,分布曲線的峰越高越窄;σ越大,分布曲線越平坦且越寬,如圖2-3所示。由圖可知,σ越小,小誤差占的比重越大,測量精度越高。反之,則大誤差占的比重越大,測量精度越低。

圖2-3 不同σ的誤差分布曲線
(2)測量集合的最佳值
在測量精度相同的情況下,測量一系列觀測值M1、M2、M3、…、Mn所組成的測量集合,假設其平均值為Mm,則各次測量誤差為:
(2-22)
當采用不同方法計算平均值時,所得到誤差值不同,誤差出現的概率亦不同。若選取適當的計算方法,使誤差最小,而概率最大,由此計算的平均值為最佳值。根據高斯分布定律,只有各點誤差平方和最小,才能實現概率最大。這就是最小乘法值。由此可見,對于一組精度相同的觀測值,采用算術平均得到的值是該組觀測值的最佳值。
(3)有限測量次數中標準誤差σ的計算
由誤差基本概念知,誤差是觀測值和真值之差。在沒有系統誤差存在的情況下,以無限多次測量所得到的算術平均值為真值。當測量次數為有限時,所得到的算術平均值近似于真值,稱最佳值。因此,觀測值與真值之差不同于觀測值與最佳值之差。
令真值為A,計算平均值為a,觀測值為M,并令d=M-a,D=M-A,則
∑di=∑Mi-na ∑Di=∑Mi-nA (2-23)
因為
∑Mi-na=0 ∑Mi=na (2-24)
將式(2-23)和式(2-24)代入∑Di=∑Mi-nA中,即得
(2-25)
將式(2-25)代入di=Mi-a中得
(2-26)
將式(2-26)兩邊各平方得
對i求和
(2-27)
(2-28)
根據標準誤差的定義
(2-29)
式中,代表觀測次數為無限多時誤差的平方和,故當觀測次數有限時,
(2-30)
(4)可疑觀測值的舍棄
由概率積分知,隨機誤差正態分布曲線下的全部積分相當于全部誤差同時出現的概率,
即:
(2-31)
若誤差x以標準誤差σ的倍數表示,即x=tσ,則在±tσ范圍內出現的概率為2Φ(t),超出這個范圍的概率為1-2Φ(t)。Φ(t)稱為概率函數,表示為
(2-32)
2Φ(t)與t的對應值在數學手冊或專著中均附有此類積分表,讀者需要時可自行查取。在使用積分表時,需已知t值。由圖2-4和表2-3給出幾個典型及其相應的超出或不超出|x|的概率。

圖2-4 誤差分布曲線的積分
表2-3 誤差概率和出現次數

(5)函數誤差
上述討論主要是直接測量的誤差計算問題,但在許多場合下,往往涉及間接測量的變量,所謂間接測量是指與直接測量的量之間有一定的函數關系,間接測量值就是直接測量得到的各個測量值的函數。其測量誤差是各個測量值誤差的函數。
①函數誤差的一般形式 是指在間接測量中,一般為多元函數,而多元函數可用式(2-33)表示:
y=f(x1,x2,x3,…,xn) (2-33)
式中 y——間接測量值;
xi——直接測量值。
由臺勞級數展開得
(2-34)
或
(2-35)
它的最大絕對誤差為:
(2-36)
式中 ——誤差傳遞系數;
Δxi——直接測量值的誤差;
Δy——間接測量值的最大絕對誤差。
函數的相對誤差δ為
(2-37)
②某些函數誤差的計算
a.函數y=x±z的絕對誤差和相對誤差
由于誤差傳遞系數,
,因此函數y=x±z的最大絕對誤差
Δy=±(|Δx|+|Δz|) (2-38)
相對誤差
(2-39)
b.函數形式為,x、z、w為變量。
誤差傳遞系數為:
(2-40)
則該函數的最大絕對誤差為:
(2-41)
最大相對誤差為:
(2-42)
現將某些常用函數的最大絕對誤差和相對誤差列于表2-4中。
表2-4 某些常用函數的誤差傳遞公式

2.1.7 有效數字及運算規則
有效數字就是實際測得的數據。在科學與工程中,到底該用幾位有效數字來表示測量或計算結果,并不是一個數值中小數點后面位數越多越準確。實驗中,從測量儀表上所讀數值的最后一位數字往往是儀表精度所決定的估計數字。即一般應讀到測量儀表最小刻度的1/10位。數值準確度大小由有效數字位數來決定。
(1)有效數字的確定
一個數據,其中除了起定位作用的“0”外,其他數都是有效數字。如0.0037只有兩位有效數字,而370.0則有四位有效數字。一般要求測試數據有效數字為4位。要注意有效數字不一定都是可靠數字。如測流體阻力所用的U形管壓差計,最小刻度是1mm,但我們可以讀到0.1mm,如342.4mmHg;又如二等標準溫度計最小刻度為0.1℃,我們可以讀到0.01℃,如15.16℃,此時有效數字為4位,而可靠數字只有三位,最后一位是不可靠的,稱為可疑數字。記錄測量數值時只保留一位可疑數字。
為了清楚地表示數值的精度,明確讀出有效數字位數,常用指數的形式表示,即寫成一個小數與相應10的整數冪的乘積。這種以10的整數冪來記數的方法稱為科學記數法。如:75200,有效數字為4位時,記為7.520×105;有效數字為3位時,記為7.52×105;有效數字為2位時,記為7.5×105。又如:0.00478,有效數字為4位時,記為4.780×10-3;有效數字為3位時,記為4.78×10-3;有效數字為2位時,記為4.7×10-3。
此外,在計算過程中涉及的一些特殊常數,如π,等,我們一般視其有效數字為無限多位。
(2)有效數字運算規則
①記錄測量數值時,只保留一位可疑數字。
②當有效數字位數確定后,其余數字一律舍棄。舍棄辦法是四舍五入,即末位有效數字后邊第一位小于5,則舍棄不計;大于5則在前一位數上增1;等于5時,前一位為奇數,則進1為偶數,前一位為偶數,則舍棄不計。這種舍入原則可簡述為:“小則舍,大則入,正好等于奇變偶”。如:保留4位有效數字,5.14285→5.143。
③在加減計算中,各數所保留的位數,應與各數中小數點后位數最少的相同。例如將24.65,0.0082,1.632三個數字相加時,應寫為:24.65 +0.01 +1.63=26.29。
④在乘除運算中,各數所保留的位數,以各數中有效數字位數最少的那個數為準;其結果的有效數字位數也應與原來各數中有效數字位數最少的那個數相同。例如:0.0121×25.64×1.05782應寫成0.0121×25.6×1.06=0.328。上例說明,雖然這三個數的乘積為0.3283456,但只應取其積為0.328。
⑤在對數計算中,所取對數位數應與真數有效數字位數相同。