- 分析測試統計方法和質量控制
- 曹宏燕等編著
- 1119字
- 2020-05-06 20:08:58
第4章 回歸分析
4.1 概述
回歸分析是研究變量之間相互依賴關系的一種統計方法,是數理統計學中應用廣泛的一個分支。
兩個變量之間的關系一般可分為兩類:一類是變量之間存在著完全確定的函數關系,一個變量或一些變量可以確定另一變量的值。例如,圓的周長l和面積S與其半徑r存在確定的函數關系l=2πr、S=πr2。電學中電壓V、電流I和負載電阻R間有明確的函數關系V=IR。另一類是變量間存在密切的關系,但沒有達到嚴格的確定關系,而具有某種程度的不確定性,這種變量之間不完全確定的關系稱為相關關系。相關關系是一種統計關系,因變量y的取值與自變量x的取值雖有一定關系,但y的取值帶有一定的隨機性,它只是隨自變量x大體上按一定的規律而變化。例如,兒童是身高和體重與年齡有一定的關系,雖然這種關系也可以用一個函數式表示,但具體到一個兒童,其計算值可能與實際測量值存在一定差距。又如,糧食產量與施肥量有關,肥料有助于提高糧食產量,但施肥量相同的田地其糧食產量仍有差別。
函數關系與相關關系的差別在于:函數關系是由自變量x決定因變量y的值,而相關關系是由x值決定y值的概率分布。
確定性關系和相關關系是兩種不同類型的變量關系,但它們之間沒有絕然的區別。由于測量誤差和其他因素的影響,確定性關系往往以相關關系表現出來,而當人們對事物變化規律有深刻認識時,原來是相關關系的變量又能找出其確定性關系的表達式。
在分析測試中,測量結果與其他影響因素之間雖有密切的關系,但又不像數學函數關系,因變量y隨自變量x嚴格地按確定的規律變化,而通常表現為相關關系。當自變量x變化時,因變量y大體上按某種規律變化(即在一定范圍內變化,有時會有例外),不能由xi精確求出yi值。如ICP-AES、AAS等分析方法,測量的光譜強度I(或吸光度A)與其濃度c間通常有I=a+bc關系式,但由于測量誤差、干擾的存在,儀器性能、測量條件的影響,關系式中的系數a、b會在一定范圍內變動。一定濃度c在重復測量時,測得的I會在一定范圍內變化,或者說由強度I計算出的濃度c不是十分確定的。用回歸直線表示I和c之間的關系時,試驗點不一定都在按其相關關系式畫出的直線上,試驗點與回歸直線有一定的離散度。
回歸分析是研究相關關系的一種數學工具,它是利用數理統計方法,在大量的試驗數據和觀察中,尋找隱藏在隨機性后面的統計規律。
回歸分析的內容有:
①從一組數據出發,計算變量間相關關系的數學表達式;
②對這些相關關系表達式進行可信度的檢驗和判斷;
③從影響某一變量的許多自變量中判斷影響量的主要因素和次要因素;
④利用求得的相關關系,對試驗和生產過程進行預測和控制。
在分析測試中,遇到最多的是一元線性回歸問題。一元線性回歸雖簡單,但應用廣泛,且包含了回歸分析的基本思想和方法,具有普遍意義。