- R語言統計分析與應用
- 汪海波等
- 1015字
- 2020-05-26 17:10:49
本書內容
本書第1章介紹了R的特點以及結構組成,R的獲取、安裝和啟動,如何用網上的擴展包增強R基本安裝的功能,R菜單操作,用戶界面,如何以交互方式和批處理方式運行程序,R系統的文件管理。第2章介紹了R編程入門,包括數據集的建立以及各種操作方法等,同時講解了向R中導入數據的諸多方法。這一章的前半部分介紹了如何用R來存儲數據的數據結構,以及如何用鍵盤輸入數據;后半部分介紹了怎樣從文本文件、網頁、電子表格、統計軟件和數據庫向R導入數據,涵蓋了數據管理中函數(數學函數、統計函數、字符函數)以及常用運算符。第3章探討了基本的數據管理,包括數據集的排序、合并、取子集,以及變量的轉換、重編碼和刪除。第4章介紹了樣本量和檢驗效能估計。第5章在第3章的基礎上介紹了高級數據管理方法,涵蓋了控制結構(循環、條件執行)的用法,然后介紹如何編寫自己的R函數,以及如何用不同的方法整合數據。第6章概括地總結了定量資料基本統計分析方法的主要內容。從第7章開始逐個介紹了工作實踐中常用的一些多元統計分析方法,內容包括各種多元統計分析方法的基本原理、計算方法、分析步驟、實例應用、R函數和使用方法,以及結果解釋和結論分析等;介紹了針對一個數值型結果變量與一系列數值型預測變量間的關系進行建模的回歸方法,并詳細給出了擬合模型的方法、適用性評價和含義解釋,包括t檢驗、方差分析、直線回歸和相關、多元線性回歸與相關、Logistic回歸分析。第12章介紹了相對數的概念、率假設檢驗方法和R程序。第13章介紹了行×列表分析和交叉表。第14章探討了非參數分析方法,包括配對及單樣本秩和檢驗、兩組樣本比較的秩和檢驗、多組樣本比較的秩和檢驗及兩兩比較、等級分組資料和隨機區組設計資料比較的秩和檢驗及兩兩比較。第15章介紹了生存分析,主要涉及生存率的兩種估計方法,乘積極限法和壽命表法,以及Cox模型。多元數據分析的一個難點是簡化數據。后續章節介紹了如何將大量的相關變量轉換成較少的不相關變量(主成分分析),以及如何發現一系列變量中的潛在結構(因子分析)。這些方法涉及許多步驟,每一步都有詳細的介紹。第16~20章分別闡述了主成分分析、因子分析、聚類分析、判別分析和典型相關分析。從第21章開始探討了R軟件的拓展應用,包括ROC分析和統計圖,所涉及的統計圖包括條形圖、餅圖、散點圖、折線圖、箱線圖、直方圖、核密度圖和點圖。另外,本書每一章都給出了使用R軟件進行數據分析的實例,以幫助讀者理解和掌握各章的內容。