第2章 實驗數據的采集和處理
2.1 實驗數據的列表法和圖示法
實驗數據的顯示形式有兩種:數據表和數據圖。前者可以用一張簡潔明了的表格呈現復雜繁多的數據,方便后續的計算和分析,使得實驗數據變得清晰易懂;后者可以將實驗數據的內在規律直觀地呈現出來,容易觀察數據中的極值點、轉折點、周期性、變化率以及其他特性,同時還可方便后續的回歸分析。因此,正確的使用表和圖,是實驗者處理數據的基本技能之一。
2.1.1 列表法
列表法是將實驗數據列成表格,將各變量的數值按照規定的形式和順序排列起來。
實驗數據表一般由表號+表名、表頭和數據等三部分組成,如表2-1和表2-2所示。如有必要,可以在表格下方加上第四部分表注。第一部分:表號+表名,標號在前,表名在后,都放在表的上方,前者方便引用,后者用于說明表的主要內容;第二部分:表頭,通常放在第一行,也可以放在第一列,既可稱為行標題,也可叫做列標題,主要表示實驗研究的問題類別和指標名稱;第三部分:數據,是表格的主體部分,應根據表頭按規律排列;第四部分:表注,通常放在表格下方,主要內容有指標解釋、資料來源、特殊說明等。
表2-1 離心泵特性曲線測定實驗的數據記錄

表2-2 離心泵特性曲線測定實驗的結果

實驗數據表一般有兩種形式:數據記錄表和結果表示表,如表2-1和表2-2所示。
(1)數據記錄表
數據記錄表是實驗記錄和實驗數據初步整理的表格。它是根據實驗內容設計的一種專門表格,表中數據包括3種:原始數據、中間數據和最終結果。實驗數據記錄表必須在實驗正式開始之前列出,目的是使實驗數據的記錄更有計劃性,不遺漏實驗數據。例如表2-1就是離心泵特性曲線測定實驗的數據記錄表。
(2)結果表示表
結果表示表反映實驗的最終結果。它應當簡潔明了,方便理解各變量之間的關系,目的是反映出實驗結果的內在規律。例如表2-2是離心泵特性曲線測定實驗的結果。
有時數據記錄表和結果表示表之間的差別并不是顯而易見的,如果實驗數據不多,原始數據與實驗結果之間的關系很明顯,可以將兩類表合二為一。
實驗數據表根據使用者的目的和實驗數據的特點不同,其形式和結構上會有較大的不同,但基本原則應該一致,主要如下。
①表格設計應內容簡潔、層次清楚,便于閱讀、計算和分析;表名應當高度概括數據表的內容和特征。
②表頭應當給出各變量的名稱、符號、單位,若表中所有數據的單位都相同,可以在表右上角統一標注單位。
③數據記錄要規范,實驗時要記錄各種實驗條件和現象,數據的有效數字位數應與實驗檢測儀器的精密度匹配;需用科學計數法表示數據時,將10±n記入表頭,注意:表中數據=測量值×10±n。
④原始數據要書寫得清晰整齊,妥善保存,不得隨意丟棄;實驗完成后立即將原始數據輸入計算機表格中,方便后續計算和分析。
2.1.2 圖示法
圖示法是將實驗數據用科學、規范的圖形表示出來,目的是為了使復雜的數據更加直觀和形象,它的優點是實驗者可以直觀地看出實驗數據變化的特征和規律,發現變量間的聯系,為數學模型的建立提供依據。根據數據作圖的步驟為:首先選擇合適的坐標系和圖形,然后確定最佳的比例尺。
(1)坐標系和圖形的選擇
大部分數據圖都是描述在一定的坐標系中。在不同的坐標系中,對同一組數據作圖,可以得到不同的圖形。作圖前,應該對實驗數據的變化規律有一個初始的判斷,然后選擇合適的坐標系,使所作圖形的規律性更突出。
實驗數據圖可以選用的坐標系有笛卡爾坐標系(又稱普通直角坐標系)、對數坐標系、半對數坐標系、概率坐標系、極坐標系、三角形坐標系等。化工實驗中常用的有:普通直角坐標系和對數坐標系,后者包括半對數坐標系和雙對數坐標系。普通直角坐標系兩個軸的分度都是均勻的;而半對數坐標系,一個軸是分度均勻的普通坐標軸,另一個軸是分度不均勻的對數坐標軸;雙對數坐標系,兩個軸都是對數坐標軸,即每個軸的刻度都是分度不均勻的對數坐標軸。
根據實驗數據(自變量x和因變量y),選用坐標系的原則如下。
①兩個變量的變化幅度都不大時,可選用普通直角坐標系;線性函數y=a+bx適合選用普通直角坐標系,化工實驗中結果的其他函數形式往往化成線性函數形式。
②兩個變量中,有一個變量的最小值與最大值之間相差幾個數量級時,可以選用半對數坐標系;指數函數y=abx適合選用半對數坐標,實驗數據進行對數轉化后:lgy=lga+xlgb,即lgy與x成線性相關,即可在普通直角坐標系做圖。
③如果兩個變量在數值上發生了幾個數量級的變化,可選用雙對數坐標系;冪函數y=axb適合選用雙對數坐標,因為實驗數據進行對數轉化后:lgy=lga+blgx,即lgy與lgx成線性相關,即可在普通直角坐標系做圖。
④如果自變量x由零開始逐漸增加,因變量y相應地發生極大變化,此時采用對數坐標系(半對數坐標系或雙對數坐標系),可使y和x的函數關系更加清晰,但是需要對半對數坐標系或雙對數坐標系進行選擇。
用于實驗數據處理的圖形種類很多,根據形狀可分為散點圖、線圖、柱形圖、條形圖、餅圖、環形圖、直方圖、面積圖等。圖形的選擇取決于實驗數據的性質,化工原理實驗的常用的圖形有散點圖和線圖。散點圖適用于表示兩個變量間的相互關系,通過它可以看出變量關系的統計規律,方便后續數學模型的擬合;線圖表示因變量隨自變量的變化情況,通過它可以看出兩個變量間的變化趨勢。更多實驗數據處理圖形的詳細介紹已經超出本書的范圍,請參考有關實驗數據處理的教材。
例2-1 已知變量x和y的數據如下表所示,試分析采用哪一種坐標系,利用何種圖形作圖,才能更好地建立x和y間的函數關系?(本例題使用Microsoft Office Excel軟件作圖)
解 ①根據上表數據在普通直角坐標系中作折線圖,如圖2-1(a)所示,y和x的函數關系很難描述,原因是橫坐標的刻度和比例尺不合適。

圖2-1 直角坐標系和對數坐標系中x和y的關系
②根據上表數據在普通直角坐標系中作散點圖,如圖2-1(b)所示,y和x成對數函數關系,但是在x初始階段,即x=10、20、40、60、80時,數據點非常密集,很難準確描述x和y的函數關系。
③根據x和lgy數據在半對數坐標系中作散點圖,如圖2-1(c)所示。注意:縱坐標為lgy,即某數據點縱坐標與原點的實際距離為該點對應數值的常用對數,但是該點刻度標注的卻是對數函數的真數。y和x的函數關系與圖2-1(b)相似,但在x初始階段,即x=10、20、40、60、80時,數據點非常密集,很難準確描述x和y的函數關系。
④根據lgx和y數據在半對數坐標系中作散點圖,如圖2-1(d)所示,y和x的函數關系很難描述。注意:橫坐標刻度為lgx,即某數據點橫坐標與原點的實際距離為該點對應數值的常用對數,但是該點刻度標注的卻是對數函數的真數。
⑤根據lgx和lgy數據在雙對數坐標系中作散點圖,如圖2-1(e)所示,縱坐標為lgy,橫坐標為lgx,y和x的函數關系非常清晰。
⑥如果不用對數坐標系,也可以在普通直角坐標系中表示lgx和lgy的關系,如圖2-1(f)所示,圖形和圖2-1(e)的一致,y和x的函數也關系非常清晰。注意:縱坐標和橫坐標的刻度表示該數據點對應數值的常用對數,不是對數函數的真數。
對數坐標軸的原點是1,如圖2-1(c)、(e)中的縱軸;而普通坐標軸的原點往往是0,如圖2-1(a)中的縱軸、圖2-1(b)中的橫軸和縱軸。根據需要,對數坐標軸的起始刻度可以不從1開始,如圖2-1(d)、(e)的橫軸,均從10開始;而普通坐標軸的起始刻度也可不從0開始,如圖2-1(a)中的橫軸從10開始,圖2-1(d)中的橫軸從1.0開始。
(2)坐標比例尺的確定
坐標比例尺即坐標軸的分度,是指每條坐標軸所能代表的物理量的大小。Excel作圖中,往往選擇默認的比例尺,但是如果默認的比例尺不合適,就會導致圖形失真,最終導致不正確的結論。因此,需要實驗者自己選擇合適的坐標比例尺。
需要注意的是,選擇坐標比例尺時不要因比例常數過小,而造成圖中數據點分布異常的假象。同時也不要因比例常數過大,而損失實驗數據的準確度。
根據實驗數據,確定坐標比例尺的方法如下。
①若誤差已知,則比例尺建議為2Δx=2Δy=2mm。
Δx和Δy是已知變量x和y的誤差,假設2Δy=2mm,則y軸的比例尺My應為:
例如,已知質量的測量誤差Δy=0.1g,若取2Δm=2mm,則
即坐標軸上的10mm代表1g。
②若誤差未知,則坐標比例常數建議為M=2×10±n。
假設變量x和y的誤差Δx、Δy未知,坐標軸的比例常數M建議是(1、2、5)×10±n(n為正整數),但3、6、7、8等常數是一定不可用。
③橫坐標和縱坐標之間的比例可以不一致,應根據實際情況選擇,最好是讓曲線的坡度處于30°~60°之間。
例2-2 已知自變量x的測量誤差Δx=0.1,因變量y的測量誤差Δy=0.01。根據下表數據,試在普通直角坐標系中畫出兩者的關系曲線,并分析x對y的影響。
解 圖2-2(a)、(b)反映了不同比例尺下x和y的關系。

圖2-2 基于不同坐標比例尺的x對y的影響
從圖2-2(a)可以看出:x對y幾乎沒有什么影響,因為圖中的曲線幾乎都是水平的。而由圖2-2(b)可以看出,x對y影響顯著,當x=7.0時,y有明顯增大。這兩個截然不同的結論是否由于圖2-2(a)、(b)兩圖的比例尺不一樣導致的?
分析如下:
根據兩個變量的誤差,確定坐標系的比例尺。
設2Δx=2Δy=2mm,
因Δx=0.1,Δy=0.01,所以
橫軸的比例尺為:/單位x值
縱軸的比例尺為:/單位y值
可見圖2-2(b)的比例尺是合適的,所以正確結論應為:x對y的影響顯著,當x=7.0時,y最大。