- 數據分析從入門到進階
- 陳紅波 劉順祥等
- 1573字
- 2019-11-12 14:04:05
2.3.4 線性回歸模型預測
回歸分析是確定兩種或兩種以上變量間相互依賴的定量關系的一種統計分析方法,回歸分析有很多種類:根據變量的個數分為一元回歸和多元回歸分析;根據因變量的個數分為簡單回歸分析和多重回歸分析;根據自變量和因變量之間的關系類型分為線性回歸分析和非線性回歸分析。
涉及變量之間的線性關系描述,趨勢預測等分析,很多人會想到用專業的分析軟件(R、Python、SAS等)來做分析。這些統計分析工具雖然很專業,但Excel也可以幫助用戶快速解決這個分析任務。下面簡單介紹Excel中一元線性回歸模型的處理方法。
(1)案例分析
回歸分析中只包含一個自變量和一個因變量,而且二者關系可以用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。
以女性的身高(height)和體重(weight)數據為例,建立一元回歸模型方程,探索身高與體重的關系,數據如表2-24所示。
表2-24 女性身高體重

在做一元線性回歸分析之前,可以先繪制二維散點圖來觀測兩個變量之間的關系,然后添加趨勢線,選擇線性模型獲得方程以及R平方值。
(2)操作步驟
1)選中區域B1:C16范圍內的身高體重數據(包含標題),然后單擊“插入|圖表|散點圖”命令,如圖2-147所示。

圖2-147 單擊“散點圖”按鈕
2)修改散點圖的Y軸最小值為80,X軸最小值為154,修改散點圖標題為“女性身高與體重回歸分析”。左擊選中散點圖,單擊“設計|添加圖表元素|坐標軸標題|更多軸標題選項”命令,然后修改橫軸坐標軸標題為“身高”,縱軸坐標軸標題為“體重”,結果如圖2-148所示。

圖2-148 修改散點圖坐標軸
3)單擊散點圖中任意數據點,即選中所有數據點,然后右擊選擇“添加趨勢線”,在“設置趨勢線格式”對話框中,將趨勢線選項設為“線性”。另外,勾選“顯示公式”和“顯示R平方值”這兩個選項。
如圖2-149所示,身高和體重的一元線性方程為:y=1.5329x-152.03,即體重為1.5329*身高-152.03。這里判定系數R2=0.99,說明方程的擬合程度比較好,擬合直線能解釋99%的Y變量的波動。

圖2-149 添加趨勢線并設置參數
為了進一步使用更多的指標來描述這個模型,使用“數據分析”功能內的“回歸”方法進行詳細的統計分析,操作步驟如下:
1)單擊“數據|分析|數據分析”命令,在“數據分析”對話框中選擇“回歸”選項,然后單擊“確定”按鈕。
2)在“回歸”對話框進行參數設置,“Y值輸入區域”選擇$C$1:$C$16(包含標題),“X值輸入區域”選擇$B$1:$B$16,勾選“標志”和“置信度”選項,勾選“殘差”和“正態分布”選項區的所有選項,然后單擊“確定”按鈕,如圖2-150所示。

圖2-150 “回歸”對話框
回歸分析的統計分析結果如圖2-151所示。表一的回歸統計結果中得出R=0.995,R2=0.990,說明方程擬合效果很好,且身高與體重呈現正相關。

圖2-151 回歸分析結果
表二的方差分析結果中得出身高和體重的一元線性回歸方程為:y=1.532857143x-152.029048。回歸模型的F值檢驗和回歸系數的t檢驗的P值都遠小于0.01,說明方程模型擬合很好且具有顯著性關系。
表三的殘差輸出結果表包含預測體重數據、殘差以及標準殘差,右側殘差分布圖是以身高變量為X軸橫坐標,體重變量為Y軸縱坐標繪制的散點圖,散點在X軸橫坐標上下波動,隨意分布,說明模型擬合結果合理。
(3)回歸統計表中的指標解釋
● Multiple R:相關系數,用來衡量自變量x與因變量y之間的相關程度的大小。
● R Square:判定系數,是相關系數R的平方,數值越接近1,代表擬合效果越好。
● Adjusted R Square:矯正測定系數,用于多元回歸分析。
● 標準誤差:衡量擬合程度的大小,此值越小,說明擬合程度越好。
● 觀測值:回歸方程模型中觀察值的個數。
(4)回歸系數表中的指標解釋
● Coefficients:回歸模型中各自變量的系數以及常量。
● 標準誤差:各自變量的系數以及常量的剩余標準差,此值越小,說明擬合程度越好。
● t Stat:回歸系數的t檢驗數值。
● P-value:各自變量的系數以及常量對應的P值,P>0.05表示不具有顯著的統計學意義;P≤0.01表示具有非常顯著的統計學意義;0.01<P≤0.05表示具有顯著的統計學意義。
● Upper 95%與Lower 95%:各自變量以及常量的上下限區間范圍。
- Oracle 11g從入門到精通(第2版) (軟件開發視頻大講堂)
- 編程卓越之道(卷3):軟件工程化
- 零基礎學Scratch少兒編程:小學課本中的Scratch創意編程
- SQL Server 2012數據庫管理與開發項目教程
- Linux命令行與shell腳本編程大全(第4版)
- C語言程序設計
- Java程序設計案例教程
- Internet of Things with ESP8266
- Vue.js 3應用開發與核心源碼解析
- PhoneGap 4 Mobile Application Development Cookbook
- Android Studio開發實戰:從零基礎到App上線 (移動開發叢書)
- Puppet:Mastering Infrastructure Automation
- Scrapy網絡爬蟲實戰
- SQL Server 2012 數據庫應用教程(第3版)
- 零基礎學編程系列(全5冊)