項目4 數據處理
【學習目標】
1.會對測試結果進行分析計算。
2.會對測試數據進行修約。
3.能對測試結果進行誤差分析、異常值處理等。
所謂數據處理是指從獲得的數據得出結果的加工過程,包括記錄、整理、計算、分析等處理方法。數據處理過程中要進行測量誤差處理、數據修約等。恰當地處理測量所得的數據,可以最大限度地減少測量誤差的影響,得到一個盡可能精確的結果。
一、測量誤差
在測量過程中,由于測量器具本身的誤差以及測量方法、測量環境等因素制約,導致測得值與被測真值之間存在一定的差異,這種差異稱為測量誤差。
依據JJF 1001—1998《通用計量術語及定義》,測量誤差的定義是“測量結果減去被測量真值”,實際工作中,測量誤差又簡稱誤差。
1.誤差的分類 測量誤差按其產生的原因可分為系統誤差、隨機誤差、過失誤差。
(1)系統誤差。由于測量工具(或測量儀器)本身固有誤差、測量原理或測量方法本身理論的缺陷、實驗操作及實驗人員本身心理生理條件的制約而帶來的測量誤差稱為系統誤差。
系統誤差的特點是在相同測量條件下,重復測量所得測量結果總是偏大或偏小,且誤差數值一定或按一定規律變化。減小系統誤差的方法通常可以改變測量工具或測量方法,還可以對測量結果考慮修正值。
引起系統誤差的原因很多,主要有以下幾種。
①檢測原理或檢測方法不完善而產生的誤差。
②由儀器設備而引起的誤差。
③由環境條件所引起的誤差,如環境溫濕度不穩定、氣壓變化、振動、噪聲等諸多因素的影響。
④由操作人員而引起的誤差。
系統誤差決定了檢測的準確度,系統誤差越小,檢測結果的準確度越高。
(2)隨機誤差。隨機誤差是測量結果與在重復性條件下,對同一被測量進行無限多次測量所得結果的平均值之差。隨機誤差又稱偶然誤差,是隨機產生的。它是在對同一產品的檢測過程中,由于操作人員技術不熟練、外界條件的變動、檢測儀器的不完善、檢測對象本身的狀態發生變化等偶然因素的影響而引起的誤差。
從隨機誤差分布規律可知,增加測量次數,并按統計理論對測量結果進行處理可以減小隨機誤差。
隨機誤差決定了檢測的精密度,隨機誤差越小,檢測結果的精密度越高。
(3)過失誤差。過失誤差也稱疏失誤差、粗大誤差。是由于測量過程中的錯誤、疏忽等原因引起的誤差,如讀錯、記錯或操作儀器錯誤,或偶然一個外界干擾因素造成的等。過失誤差是指一種顯然偏離實際值的誤差,沒有任何規律可循,純屬偶然引起。如發現檢測結果中存在過失誤差,必須從檢測結果中剔除。
2.誤差的表示 測量誤差可用絕對誤差和相對誤差兩種指標表示。
(1)絕對誤差。絕對誤差是測定值X與真值(被測參數的理論值叫作真值)μ0之間的差值。用ΔX表示絕對誤差,則:
事實上,真值是不知道的。但可以通過量具或高一級準確度的儀器進行校核等方法來預先掌握儀器的測量誤差ΔX,再由測量值X估計真值μ0的所在區間。即:
可見,只有在儀器的誤差或校正值的范圍已知的情況下,檢測結果才有意義。
在實際檢測中,當沒有顯著的系統誤差時,只要檢測的次數足夠,根據數理統計理論,就可用所測數據(測定值)的算術平均值代表其真值。
(2)相對誤差。相對誤差是絕對誤差ΔX與真值μ0的比值,用δ表示相對誤差,則:
實際計算時,可以近似地用測定值X代替分母中的真值μ0,δ越大,測定值X偏離真值越遠。檢測的準確度就越差。
相對于絕對誤差而言,相對誤差更能反映檢測結果的準確性。
3.誤差的來源
(1)儀器誤差。儀器誤差是儀器設計所依據的理論不完善,或假設條件與實際檢測情況不一致(方法誤差)以及由于儀器結構不完善、儀器校正與安裝不良(工具誤差)所造成的誤差。
在儀器上可能出現的誤差主要有以下幾種。
①零值誤差。儀器零點未調整好,檢測結果的絕對誤差為一常數。
②校準誤差。儀器刻度未校準,指示結果系統偏大或偏小,相對誤差為一常數。
③非線性誤差。儀器輸入量與輸出量之間不符合線性轉換關系。
④遲滯誤差。儀器輸入量由小到大或由大到小,在同一檢測點出現輸出量的差異,或是儀器進程示值與回程示值之間的差異(進回程差)。
⑤示值變動性。對同一被測對象進行多次重復檢測,檢測結果的不一致性。
⑥溫差和時差。溫差指儀器在不同溫度條件下,儀器性能的變化。時差是指儀器在相同檢測條件下,儀器性能隨時間的變化。
(2)環境條件誤差。由于各種環境因素與要求的環境狀態不一致而引起的測量裝置與被測量物本身的變化所形成的誤差。
(3)人員操作誤差。由于測量者主觀原因引起的誤差。如讀數視差或因工作疲勞引起的視覺生理變化導致的誤差等。
(4)方法誤差。由于測量方法或計算方法不完善而形成的誤差,如操作或試驗方法不合格引起的誤差。
(5)試樣誤差。紡織材料被測對象總體很大,要檢測出全部總體性質的真值是不可能的。由于總體中個體性質的離散性、取樣方法不當、取樣代表性不夠和檢測個體數不足等,都會產生試樣誤差。
試樣誤差是除儀器誤差外,另外一個影響檢測結果準確性的重要因素,它取決于試樣量大小和抽樣方法。
4.誤差的估計
按照絕對誤差ΔX的定義:
式中:——多次檢測的平均值;
s——平均值與真值之間的偏差,即系統誤差;
r——檢測值圍繞平均值的波動(離散),即隨機誤差。也就是說,絕對誤差是由系統誤差和隨機誤差兩部分組成的。這是誤差的直接表示方法,當然也可以間接表示和估計誤差。
二、異常值處理
在試驗結果數據中,有時會發現個別數據比其他數據明顯過大或過小,這種數據稱為異常值。
1.形成異常值的原因 產生異常值的原因是多方面的,大致歸納為以下兩方面。
(1)測量人員的主觀原因。由于測量者工作責任感不強,工作過于疲勞或者缺乏經驗操作不當,或在測量時不小心、不耐心、不仔細等,從而造成錯誤的讀數或錯誤的記錄,這是產生異常值的主要原因。
(2)外界條件的客觀原因。由于測量條件意外地改變,如機械沖擊、外界振動等,引起儀器示值或被測對象位置的改變而產生異常。
2.異常值處理方法 異常值的處理應按國家標準GB 4883—2008《數據的統計處理和解釋、正態樣本異常值的判斷和處理》、GB/T 6379.2—2004《測量方法與結果的準確度 第2部分:確定標準測量方法重復性與再現性的基本方法》等來進行,一般有以下幾種處理方式。
(1)異常值保留在樣本中,參加其后的數據分析。
(2)剔除異常值,即把異常值從樣本中排除。
(3)剔除異常值,并追加適宜的測試值計入。
(4)找到實際原因后修正異常值。
判斷異常值首先應從技術上尋找原因,如技術條件、觀測、運算是否有誤,試樣有否異常,如確信是不正常原因造成的應舍棄或修正,否則可以用統計方法判斷,對于檢出的高度異常值應舍棄,一般檢出異常值可根據問題的性質決定取舍。
三、數字修約
在進行實際檢驗時,往往要對一些數據進行修約。數字修約及有效位數的保留,應按國家標準GB/T 8170—2008《數值修約規則與極限數值的表示和判定》進行。
1.數據分類 質量數據就其本身的特性來說,可以分為計量值數據和計數值數據。
(1)計量值數據。計量值數據是可以連續取值的數據,表現形式是連續型的。如長度、厚度、直徑、強度等質量特征,一般都是可以用檢測工具或儀器等測量(或試驗)的,類似這些質量特征的測量數據,一般都帶有小數,如長度為1.15m、1.18m等。在工程質量檢驗中得出的原始檢驗數據大部分是計量值數據。
(2)計數值數據。有些反映質量狀況的數據是不能用測量器具來度量的。為了反映或描述屬于這種類型內容的質量狀況,又必須用數據來表示時,便采用計數的辦法,即用1、2、3……連續地數出個數或次數,凡屬于這樣性質的數據即為計數值數據。
2.數據的修約條件 數據獲得后,還涉及數據的定位問題,也就是對規定精確程度范圍之外的數字如何取舍的問題。
(1)修約間隔。修約間隔是確定修約保留位數的一種方式。修約間隔的數值一經確定,修約值即為該數值的整數倍。主要有0.1單位修約、0.2單位修約、0.5單位修約、1單位修約等。
例如,指定修約間隔為0.1,修約值即應在0.1的整數倍中選取,相當于將數值修約到一位小數。
(2)有效位數。對沒有小數位且以若干個零結尾的數值,從非零數字最左一位向右數得到的位數減去無效零(即僅為定位用的零)的個數;對其他十進位數,從非零數字最左一位向右數而得到的位數,就是有效位數。例如,12.490為五位有效位數;10.00為四位有效位數。
3.數字修約規則 GB/T 8170—2008《數值修約規則與極限數值的表示和判定》中,“數值修約”表述為“數值修約是通過省略原數值的最后若干位數字,調整所保留的末位數字。使最后所得到的值最接近原數值的過程”。所謂“最接近原數值”的概念就是修約后的修約誤差應該最小,正確的做法是保證修約誤差的絕對值最小。
數字的修約(0.1單位修約)按如下規則進行。
(1)擬舍棄數字的最左一位數字小于5時,則會舍去,保留其余各位數字不變。如將12.1498修約到一位小數,得12.1。
(2)擬舍棄數字的最左一位大于5時,則進一,即保留的末位位數加1。如將1268修約到“百”位數,得1.3×102(特定場合可寫為1300)。
(3)擬舍棄數字的最左一位等于5,且其右邊的數字并非全部為0時,則進一,即保留數字的末位加1。如10.5002修約到個位數,得11。
(4)擬舍棄的數字的最左一位數字等于5,其后無數字或其右邊的數字全部為零時,若所保留的末位數字為奇數(1,3,5,7,9)則進1,為偶數(2,4,6,8,0)則舍棄。如將0.0305修約成兩位有效數,則得0.030(0.0僅為定位用,非有效數字);將31500修約成兩位有效數,則得3.2×104。
(5)不允許連續修約。應根據擬舍棄數字中最左一位數字的大小,按上述規則一次修約完成。如將15.4748修約成15,而不能修約成16。
(6)數字修約規則為“四舍六入五考慮,五后非零視前位,五前為偶應舍去,五前為奇則進一,整數修約原則同,不要連續做修約”。
【復習思考題】
1.什么是隨機抽樣?隨機抽樣的方法可以分為幾種?
2.檢測過程中為何會出現異常值?如何處理異常值?
3.計算題。
(1)現有短纖維1000包,由歷史資料得知包與包之間的重量變異系數為1%,保證誤差率定為0.5%,要求置信水平(1-a)為95%,求取樣包數。
(2)已知a=10%,E=4%,欲確定紗線拉伸試驗的檢測次數。假設先測量了30次,得到CV=17%,求還需補測多少次。
4.數字修約的基本規則是什么?
5.對如下數字進行修約。
修約到一位小數:2.236 ;3.576 ;5.549 ;6.238 ;
保留兩位有效數字:2465 ;30.714 ;15.325 ;0.0325 ; 47500 ;1.25 。