官术网_书友最值得收藏!

2.3 有限次測量誤差分析與處理

大多數測定值及其誤差都服從正態分布。如果能求得正態分布特征參數μσ,那么被測量的真值和測量精密度地就唯一地被確定。然而,μσ是當測量次數趨于無窮大時的理論值,在實際測量中人們不可能進行無窮多次測量,甚至測量次數不會很多。所以本節的討論重點為:如何根據有限次直接測量所得的一列測定值來估計被測量的真值;如何衡量這種估計的精密度和這一列測定值的精密度。

為敘述方便,引入如下數理統計中常用概念。

①子樣平均值。代表由n個元素x1x2,…,xn組成的子樣的散布中心,表示為

  (2.9)

②子樣方差。描述子樣在其平均值附近散布程度,表示為

  (2.10)

 s2是子樣的數字特征,為隨機變量。當n趨于無窮大時,趨于μs2趨于σ2

2.3.1 算術平均值原理、真值的估計

如果一列子樣容量為n的等精度測定值x1x2,…,xn,服從正態分布,則根據該列測定值提供的信息,利用最大似然估計方法可估計被測量的真值μ

顯然,用測定值子樣平均值估計被測量的真值應該具有協調性和有效性。由于測定值子樣平均值的數學期望恰好就是被測量真值。

  (2.11)

按無偏性定義,用估計μ具有無偏性。因此,測定值子樣的算術平均值是被測量真值的最佳估計值。

測定值子樣平均值是一個隨機變量,也服從正態分布。因而,可用的均方根誤差σx表征對被測量真值μ估計的精密度。的方差為

也可寫為均方根誤差的形式

  (2.12)

由式(2.12)可知,測定值子樣平均值的均方根誤差是測定值母體均方根誤差的1/ 倍。表明在等精度測量條件下對某一被測量進行多次測量,用測定值子樣平均值估計被測量真值比用單次測量的測定值估計具有更高的精密度。

2.3.2 均方根誤差的估計與貝塞爾公式

均方根誤差表征一列測定值在其真值周圍的散布程度,是衡量測量列精密度的參數。根據有限次測量獲得的信息估計均方根誤差σ,仍采用最大似然估計。

母體方差σ2的最大似然估計值可由似然方程=0,即

求得

  (2.13)

因此,測定值子樣方差是母體方差的最大似然估計值。但這種估計是有偏的。

為此,必須用n/n-1)乘以s2來彌補這個系統誤差,從有偏估計轉化為無偏估計,以表示σ2的無偏估計值

  (2.14)

由式(2.14)得到計算均方根誤差表達式

  (2.15)

式(2.15)稱為計算母體均方根誤差σ的貝塞爾公式。

2.3.3 測量結果的誤差評價

對某被測量進行的重復測量稱為等精度測量。一般總是將測量結果表達為在一定置信水平下,以子樣平均值為中心,以置信區間半長為區間的一個范圍,這個置信區間就是測量的誤差。由于置信度不同,測量結果的誤差可有不同的表示方法。

(1)標準誤差

測量列的標準誤差σ是母體參數,它明確地、單值地表征了測量列的精密度。測量列所服從的正態分布Pxx0σ),當(x-x0)/σ=1時,查得P=0.683。若測量結果用單次測量值表示,置信區間采用標準誤差,則

若測量結果用測定值子樣平均值表示,置信區間采用標準誤差,則

用標準誤差作為誤差的評價,表示隨機誤差不大于標準誤差的置信度,其對應的置信區間為[-σσ]。這就是說,在此置信度下,高精密度的測量得到較小的置信區間、低精密度的測量具有較大的置信區間。由于正態分布密度曲線當|x-x0|=σ處正好是曲線的拐點,在|x-x0|>σ以后,概率密度變化率變小,這也是經常選用標準誤差作為置信區間的理由之一。

(2)平均誤差

測量列的平均誤差δ是該測定值全部隨機誤差絕對值的算術平均值。

  (2.16)

對于連續型隨機變量,δ值就是各測定值隨機誤差絕對值的數學期望,將這一定義代入正態分布函數,即得

  (2.17)

可見,平均誤差δ也可以定義為對應于置信度為0.7979×0.683=0.545時的置信區間。

對于單次測量結果,則有

同樣為多次測量,則有

此處,是子樣平均值的平均誤差,且有

  (2.18)

(3)或然誤差

或然誤差是指在一組測量中對應于置信度為50%時的置信區間,記為r,寫為數學式Pxx0σ)=0.50求得的區間為[-rr]。查表得z=0.6745,則r=0.6745σ

多次測量,則有

同樣,用表示子樣平均值的或然誤差,它與測量列或然誤差r的關系為

  (2.19)

(4)極限誤差(最大誤差)

定義極限誤差的范圍(置信區間)為標準誤差的三倍,記為3σ。從正態分布曲線可知,對應于置信區間的3σ置信度為99.7%,也就是說被測量真值落在x±3σ范圍內的概率已接近100%,而落在該范圍之外的概率極小,所以此誤差定義為極限誤差。

同樣,可以定義子樣平均值的極限誤差Δ,它與測量列極限誤差的關系為

  (2.20)

多次測量,則有

2.3.4 小子樣誤差分布——t分布

前面介紹了隨機誤差的正態分布,當子樣足夠大時,平均值服從正態分布Px0)。當子樣容量n→∞時,子樣方差是母體方差σ2 的無偏估計,所以的分布是已知的。當子樣容量很小時(如n<10),不能用子樣方差代表母體方差,因為這時的子樣方差是個隨機變量,不同的子樣,取不同的值,子樣容量越小,這種情況就越嚴重。

為了在母體參數σ未知情況下,根據子樣平均值估計被測量真值x0,就必須考慮一個統計量,它只取決于子樣容量n,而與母體均方根誤差σ無關,故引入一個統計量t,設

隨機變量t并不遵循正態分布,它的分布規律稱為t分布。t分布的概率密度函數為

圖2.3 t分布曲線

  (2.21)

式中 Γ——特殊函數;

ν——自由度。

當進行n次獨立測量時,因為它受到平均值的約束,所以n個測量值中有一個是不獨立的。

t分布的概率密度函數以t=0為對稱,如圖2.3所示。當自由度νν≥30)趨于無窮大時,t分布趨于正態分布。因此t分布主要用于小子樣推斷。由圖可見,當子樣容量n很小時,t分布中心值比較小,分散度大。這從另一方面說明,當用正態分布來對小子樣進行估計時,往往得到“太樂觀”的結果,即分散度太小,夸大了測量結果的精密度。

表2.1中列出各種自由度ν和常用置信概率P下,滿足式(2.22)的tP值。

  (2.22)

式(2.22)表明,自由度為νt分布在區間[-tPtP]內的概率為P

表2.1 t分布的tP數值

設一列等精度獨立測定值x1x2,…,xn,服從正態分布Nxμσ),真值μ及母體均方根誤差σ均未知。根據這一列測定值可求行子樣平均值及其均方根誤差估計值

由于服從自由度ν=n-1的t分布,所以可用式(2.22)作如下的概率描述。

或改寫為

測量結果可表示為

  (2.23)

根據相應的置信概率P,可從表2.1查得對應的tP值。

例2.1 用光學高溫計測量某金屬鑄液的溫度,得到如下5個測量數據(℃):

975,1005,988,993,987

設金屬鑄液溫度穩定,測溫隨機誤差屬于正態分布。試求鑄液的實際溫度(取P=95%)。

解 因測量次數較少,采用t分布推斷給定置信概率下的誤差限。

①求5次測量的平均值

②求的均方根誤差的估計值

③根據給定的置信概率P=95%和自由度ν=5-1=4,查表2.1得tP=2.78。按式(2.23),測量結果為

即被測金屬鑄液溫度有95%的可能在溫度區間[976.6℃,1003.0℃]之內。

在例2.1中,若用正態分布求取給定置信概率P=95%的置信溫度區間,查表計算得到該區間是[980.6℃,999℃],這要比t分布來的區間小。這表明,在測量次數少的情況下,用正態分布計算誤差限,往往會夸大了測量結果的精密度。因此,對小子樣的誤差推斷,宜采用t分布處理。

2.3.5 非等精度測量與加權平均值

在非等精度測量中,既然各個測定值(或各組測量結果)的精密度不同,可靠程度不同,那么在求被測量真值的估計值時,顯然不應取它們的算術平均值,而應權衡輕重。精密度高的測定值更可靠一些,應給予更大的重視。用數pi表示某一測定值xi應受重視程度。pi越大, 表明該測定值xi越值得重視。pi稱為權,而某數乘以pi稱為加權。在非等精度測量中,被測量真值的最佳估計值是測定值的加權平均值。

設對某被測量進行n次測量,得到一列測定值x1x2,…,xn。假定各測定值互相獨立,服從正態分布Nxiμσi)。仍可用最大似然估計方法求取被測量真值的估計值。

非等精度測量測定值x1x2,…,xn的似然函數是

xi服從正態分布,故

  (2.24)

對式(2.24)兩邊取對數,解似然方程=0,可得到μ的最大似然估計值

  (2.25)

將式(2.25)分子分母同乘以正常數λ,并記pi=λ/,則式(2.25)可改寫為

  (2.26)

式中pi=λ/就是測定值xi的權。權pi與方差成反比,σi越小,pi越大,在計算估計值時,相應測定值xi所占的比重也越大。因此,在非等精度測量中,被測量真值μ的最佳似然估計值是測定值的加權算術平均值,仍記為

由于加權算術平均值的數學期望為

  (2.27)

故加權算術平均值對真值μ的估計具有無偏性。因此可以說,加權算術平均值是被測量真值的最佳估計值。

關于加權算術平均值的均方根方差,由于的方差為

所以

因此,的均方根誤差

  (2.28)

通過以上討論,人們就可以解決非等精度測量的真值估計及其誤差評價問題。

例2.2 兩實驗者對同一恒溫水箱的溫度進行測量,各自獨立地獲得一列等精度測定值數據(單位: ℃)。

實驗者A:91.4,90.7,92.1,91.6,91.3,91.8,90.2,91.5,91.2,90.9

實驗者B:90.92,91.47,91.58,91.36,91.85,91.23,

91.25,91.70,91.41,90.67,91.28,91.53

試求恒溫水箱溫度(測量結果的誤差采用標準誤差)。

解 ①求兩列測定值各自的算術平均值。

②求的均方根誤差的估計值。

因此,兩實驗者對恒溫箱溫度測量結果分別為

實驗者A測溫結果=91.3±0.2(℃)

實驗者B測溫結果=91.35±0.09(℃)

為求恒溫箱溫度,需綜合考慮A,B兩測量結果。

③求兩測量結果的加權算術平均值。

代替 代替,則可求得

=91.34

④求加權算術平均值的均方根誤差。

⑤據題意,測量結果的誤差采用標準誤差,所以

恒溫箱溫度=91.34±0.08(℃)

主站蜘蛛池模板: 临邑县| 张掖市| 丰镇市| 德钦县| 白玉县| 达州市| 龙江县| 广平县| 万山特区| 怀化市| 杭州市| 稷山县| 梁河县| 桐乡市| 甘德县| 彭泽县| 星座| 陆河县| 信丰县| 黄冈市| 清徐县| 廉江市| 塔城市| 扎兰屯市| 广宁县| 通海县| 玉树县| 葫芦岛市| 星子县| 方城县| 石阡县| 康平县| 铅山县| 奉新县| 天津市| 长兴县| 奈曼旗| 玉山县| 龙游县| 来安县| 荃湾区|