第一章 測量誤差及數據處理
第一節 物理量的測量、誤差與不確定度的基本知識
一、物理量的測量
進行物理實驗時,不僅要定性觀察物理變化的過程,而且還要定量測定物理量的大小。為了進行測量,必須規定一些標準單位,如選定質量的單位為千克(kg),長度的單位為米(m),時間的單位為秒(s),電流強度的單位為安培(A)等。所謂測量,就是將待測量與這些選作標準單位的物理量進行比較,其倍數即為物理量的測量值。一般用米尺測長度,用天平秤測質量,用停表測時間,用電表測電壓、電流,用溫度計測溫度等,像這樣可以用測量器具直接測出物理量量值的測量稱為直接測量,相應的物理量稱為直接測量量。但對于大多數物理量來說,沒有直接讀數的儀器,只能用間接的辦法進行測量。例如:測量圓柱形銅棒的密度時,可以用米尺量出它的高(h)和直徑(d),算出體積,然后用天平稱出它的質量(M),則圓柱形銅棒的密度
。像這樣由直接測得的物理量經過函數運算間接算出該物理量的量值,該物理量的測量過程稱為間接測量,相應的物理量稱為間接測量量。如果設x,y…為直接測量值,W為由它們所確定的間接測量值,它們之間的函數關系表達式為:
W=f(x,y…) (1-1)
可見,直接測量是獲得一切物理量的基礎,間接測量依賴于直接測量。但是,并非采取基本單位的物理量在一切情況下都必然是直接測量值,而用導出單位的物理量就必然是間接測量值。在實踐中,它取決于所使用的測量工具,還與測量方法有關。例如:用米尺無法直接測得圖1-1中所示的尺寸W,它只能由W=A-B獲得。這時,(厚度)尺寸W就成了間接測量值。另外,如果用速率表測汽車行駛的速率,這時所測得的速率就是直接測量值。

圖1-1 直接測量與間接測量
二、測量值的確定
1.直接測量
先給一個最簡單的測量:用米尺(最小分度值為1mm)測量鋼棒的長度(圖1-2)。將尺的始端對準鋼棒的一端,鋼棒的另一端所對米尺上的刻度數值即為棒長。從圖1-2中看到棒的長度在3.2~3.3cm之間。但究竟是多少呢?不同的人可以讀出不同的數,如3.26cm、3.27cm、3.28cm等。這三個數中最后一位數是估計出來的,稱為存疑數字。實際上,我們很難判斷哪個讀數更準確,因而也就不能確定鋼棒長度的真值。所謂真值,就是指反映物質自身各種各樣特性的物理量所具有的客觀的真實數值。而測量的目的就是力圖得到真值。

圖1-2 直接測量值的獲得
為了提高測量的可靠程度,常常對同一物理量進行多次測量。如對于物理量x,各次測量值為xi(i=1,2,…,n)。通常,各次測量值并不完全一致,而且也不可能判斷出哪一次的測量值恰好是真值。那么,如何確定測量值呢?一般在測量沒有錯誤及符合統計規律的情況下,可以“期望”諸測量值的算術平均值:
(1-2)
算術平均值是較為接近真值x的,因而把它叫做真值x的最佳近似值,即用代表x比采用任何一次測量值都更準確。
如果量具有未消除的零點偏差δ0,則應予以扣除,即令:
(1-3)
2.間接測量
對間接測量值W=f(x,y,…),它由諸直接測量值x,y,…所確定。當多次測量時,有兩種可能情況:①各直接測量值是分別獨立進行測量的,且測量條件變化幅度很小;②每次都是在差不多同時或同一條件下對各量測量一遍,而各次測量之間又都是相互獨立的。嚴格說來,在這兩種不同的情況下,計算間接測量算術平均值的方法是不同的。
對于情況①,各直接測量值x,y,…是相互獨立測量的。首先分別求出它們各自的算術平均值,
,…,然后將其代入函數關系式(1-1)中求得W的測量值:
(1-4)
對于情況②,每次測量得一組xi,yi,…(i=1,2,…,k),相應地Wi=f(xi,yi,…),而以其多次測量的算術平均值作為測量值。
(1-5)
通常,當測量條件沒有大幅度變化時,兩種計算方法所得結果是相近的。所以,除非測量條件變化幅度過大時必須采用式(1-5)外,不論何種情況,都可以用較為簡便的式(1-4)計算。
三、誤差的定義
測量誤差ΔN為測量值N與其真值N0之差,即:
ΔN=N-N0 (1-6)
真值N0一般未知,因而誤差不能確定,它只具有理論上的意義。
隨著科學水平的提高和人們經驗、技巧、知識的不斷豐富,誤差被控制得愈來愈小,但由于理論或方法、測量器具、環境影響以及人的分辨能力的限制,絕不會使誤差降為零,這已為大量實踐所證實,也為一切從事科學實驗的人們所公認。實驗結果都存在誤差,誤差自始至終地存在于一切科學實驗的整個過程中,這條結論稱為誤差公理。
四、誤差的分類
按照誤差的性質,誤差可分為三類,不過在具體實驗中,它們往往是混在一起出現的。
1.系統誤差(非統計性誤差)
在相同條件下,多次重復測量同一物理量所對應的各次測量誤差,如果其符號和大小保持不變或隨著條件的改變而有規律地發生變化,這樣的誤差稱為系統誤差。這樣的誤差都不符合統計學中隨機函數的規律,亦稱非統計性誤差。
系統誤差的特征是具有確定性。產生系統誤差的原因常常是:①設備誤差。如儀器的固有缺陷,如制造偏差、刻度不準、安裝不正、零點未調準、元件不標準、受過損傷等。②理論方法誤差。例如,測量方法的不當或偏差,包括間接測量中函數關系式(計算公式)的簡化(如忽略電表內阻或電壓表分流等)。③環境誤差。如測量環境條件溫度、濕度、氣壓、電源電壓、地磁等的改變。④個人誤差。如觀測者操作方法欠妥;升溫、降溫過快,不待指針停穩就讀數;千分尺螺旋桿擰得過緊等。⑤讀數偏差。如斜視讀數、一律抹去尾數等。
系統誤差按其掌握程度分為以下兩種。
①可定系差:能夠確定其數值的系統誤差。一經發現,要從結果中修正掉(即:測量值=示值+修正值)。
②未定系差:無法確定其數值的系統誤差。例如:儀表的基本允許誤差主要屬于未定系統誤差。
系統誤差按其是否會發生變化分為以下兩種。
①定值系差:指符號與大小不變的系統誤差。例如:千分尺密合時就已有了一個微小示數,則每次重復測得的值都會出現同樣的偏離,稱為零點誤差。
②變值系差:指測量條件改變時,按某種規律變化的系統誤差。這種變化,有的可能隨著時間變化,有的可能隨著位置變化。例如:分光計刻度盤中心O與望遠鏡轉軸O'如有偏心差e,如圖1-3所示,則當轉盤角位置為φ時,測量誤差為:
Δ=BB'=esinφ (1-7)

圖1-3 偏心差
這便是周期變化的系統誤差,稱為偏心差。
系統誤差常常是影響測量結果的主要因素,實驗水平的高低往往決定于對系統誤差處理水平的高低。
2.隨機誤差(統計性誤差)
在相同條件下,多次測量同一物理量所對應的各次測量的誤差,其符號和絕對值以不可預定的方式變化,這種誤差稱為隨機誤差。它通常是符合統計學規律的,所以也稱為統計性誤差。
隨機誤差具有隨機變化的性質。產生的原因通常是某些偶然的、不確定因素的影響,比如由于操作者視覺和儀器精度的限制使平衡點確定不準或估讀數有起伏(讀數誤差);由于環境因素的隨機起伏而導致讀數的微小變化等。這些影響一般是微小的,很難確定影響的具體大小,故不能予以排除或修正其影響。
盡管隨機誤差不能完全消除,但可通過改進測量方式或進行多次重復測量減少其影響。
隨機誤差雖然在大小和符號上不確定,但當測量次數較多時,會發現存在某種統計規律。分析表明,大部分隨機誤差服從正態分布(或稱為高斯分布)。令f(ΔN)代表單位誤差間隔內出現某誤差值的概率,即:
(1-8)
f(ΔN)稱為概率密度函數,當測量次數k趨于無限多次時,f(ΔN)可表達為:
(1-9)
式中 (1-10)
稱為標準誤差,意義是任一次測量誤差ΔNi落在[-σ,σ]間的概率為0.68,它代表了一列測量數據的離散程度。
f(ΔN)~ΔN曲線形狀如圖1-4所示,稱為正態分布曲線。由曲線形狀看出,遵守正態分布的隨機誤差的算術平均值隨著測量次數的增加而趨于零,即:
(1-11)

圖1-4 隨機誤差的正態分布
由該式得:
(1-12)
即在系統誤差可以忽略的情況下,當k→∞時測量值的平均值等于真值。
實際測量總是有限次的,不難理解,此時測量值的平均值最接近真值,即平均值是測量的最佳值。
在有限次測量的情況下,稱測量值Ni與平均值之差為偏差或殘差,即
(1-13)
此時,用標準偏差S作為標準誤差σ的最佳描述。可以證明,測量列中任一次測量值的標準偏差為:
(1-14)
該式稱為貝賽爾公式。平均值的標準偏差為:
(1-15)
SN或的意義是,當測量次數較多時(一般要求k≥5),任一個ΔNi落在[-SN,SN]之間或
的誤差落在
之間的概率約為0.68。
上面所得到的概率稱為置信概率(用P表示),置信概率P=0.997所對應的誤差稱為極限誤差(或稱為誤差限),對于正態分布的隨機誤差,可以證明極限誤差近似為:
Δlim=3S (1-16)
3.粗大誤差
定義:誤差列ΔNi(i=1,2,…,k)中,有個別的誤差明顯超出規定條件下的預期值,這樣的誤差稱為粗大誤差。粗大誤差具有反常性質。
產生原因:常由于各種過失所造成,比如讀錯、記錯、測量條件或操作不符合要求等。
粗大誤差對應的測量值稱為壞值。應按一定規則判斷測量值是否是壞值;一旦發現,應將其從測量列中剔除。
一般常用的幾種判斷壞值的方法有以下兩種。
(1)多次等精度直接測量的情形
①3S準則:如果測量次數足夠大,那么其中任一測量值Ni落在內的概率幾乎是百分之百,所以如某測量值的偏差大于3S,可認為該測量值為壞值。
該準則適合于測量次數k較大(k≥10)的情形,否則該準則失效。
②肖維勒準則:如果測量值Ni(i=1,2,…,k)中Nj滿足
(1-17)
則Nj為壞值。式中,wk稱為肖維勒系數,其值與測量次數k有關,見表1-1。
表1-1 wk數值表

由表1-1可知,測量次數越少wk越小,說明測量值容許的范圍越小。另外,3S準則相當于測量次數k≈200次的情形。
注意,某壞值剔除后,還應該再用上述準則繼續判斷還有沒有壞值。
(2)yi=f(xi)的情形
①粗略判斷:在坐標紙上標出各數據點(xi,yi),如有個別點偏離大多數數據點所繪曲線太遠,可認為該組數據是壞值。
②嚴格判斷:對于線性函數
y=ax+b (1-18)
可計算其剩余標準差Sy(見本章第四節),如果
(1-19)
可認為(xi,yi)是壞值。式中,是將xi代入由最小二乘法求得的最佳直線方程y*=ax+b所得的y*值。
如果是一般函數關系,應先將它改為直線方程(見本章第四節),再按上述方法處理。
五、不確定度的概念及結果表示
由于真值N0未知,測量值N大于或小于N0都有可能,實際工作中只能要求N與N0之差的絕對值以一定的置信概率P不大于某微小值u:
|N-N0|≤u(置信概率為P) (1-20)
其中u值可以通過一定的手段進行估算。該式等價于N-u≤N0≤N+u(置信概率為P),即N0以置信概率P存在于(N-u)~(N+u)之間。
上面引入的u稱為不確定度,它表征真值以某一置信概率存在的范圍,是衡量測量結果不確定性的尺度。為此,測量結果亦可表示為:
N±u=… (置信概率P=…) (1-21)
該式稱為結果表示式。
不確定度u與測量值N比值的百分數稱為相對不確定度,用ur表示:
(1-22)
相對不確定度的一個重要作用是用于衡量實驗質量的高低。
注意:
①結果表示式(1-21)并不意味著有兩個測量結果,而是代表真值以某置信概率存在的兩端界限。
②結果表示式(1-21)中要有單位。一般測量值、不確定度值和單位稱為結果表示的三要素。
③不確定度u只取一位數字,相對不確定度最多取兩位數字。
④結果表示式(1-21)中,測量結果所保留的最末位必須與u值所在的位對齊(因為該位已是可疑位)。