- R語言統(tǒng)計(jì)分析與應(yīng)用
- 汪海波等
- 1268字
- 2020-05-26 17:10:49
1.1 R簡介
R語言是從S統(tǒng)計(jì)繪圖語言演變而來的,S語言在20世紀(jì)70年代誕生于貝爾實(shí)驗(yàn)室,由Rick Becker、John Chambers和Allan Wilks開發(fā)。基于S語言開發(fā)的商業(yè)軟件Splus,可以方便地編寫函數(shù)、建立模型,具有良好的擴(kuò)展性,在國外學(xué)術(shù)界應(yīng)用很廣。1995年,新西蘭奧克蘭大學(xué)統(tǒng)計(jì)系的Robert Gentleman和Ross Ihaka基于S語言的源代碼,編寫了一個能執(zhí)行S語言的軟件,并將該軟件的源代碼全部公開,這就是R軟件,其命令統(tǒng)稱為R語言。
1.1.1 R特點(diǎn)
與起源于貝爾實(shí)驗(yàn)室的S語言類似,R也是一種為統(tǒng)計(jì)計(jì)算和繪圖而生的語言和環(huán)境,它是一套開源的數(shù)據(jù)分析解決方案,由一個龐大且活躍的全球性研究型社區(qū)維護(hù)。R的特點(diǎn)如圖1-1所示。

▲圖1-1 R的特點(diǎn)
具體來說,R有以下7個方面的特點(diǎn)。
(1)完全免費(fèi),軟件本身及程序包的源代碼公開。多數(shù)商業(yè)統(tǒng)計(jì)軟件價格不菲,投入成千上萬美元都是有可能的。
(2)豐富的資源,涵蓋了多種行業(yè)數(shù)據(jù)分析中幾乎所有的方法。R是一個全面的統(tǒng)計(jì)研究平臺,提供了各式各樣的數(shù)據(jù)分析技術(shù),幾乎任何類型的數(shù)據(jù)分析工作皆可在R中完成。
(3)交互式平臺。R是一個可進(jìn)行交互式數(shù)據(jù)分析和探索的強(qiáng)大平臺,任意一個分析步驟的結(jié)果均可被輕松保存、操作,并作為進(jìn)一步分析的輸入。有各式各樣的圖形用戶界面工具通過菜單和對話框提供了與R語言同等的功能。
(4)擴(kuò)展性強(qiáng)。編寫函數(shù)和程序包十分方便,跨平臺,可以勝任復(fù)雜的數(shù)據(jù)分析、繪制精美的圖形。R擁有頂尖水準(zhǔn)的制圖功能。如果希望復(fù)雜數(shù)據(jù)可視化,那么R擁有最全面且最強(qiáng)大的一系列可用功能。
(5)適用性強(qiáng)。R可運(yùn)行于多種平臺之上,包括Windows、UNIX和Mac OS X。這基本上意味著它可以運(yùn)行于你所能擁有的任何計(jì)算機(jī)上。R可以輕松地從各種類型的數(shù)據(jù)源導(dǎo)入數(shù)據(jù),包括文本文件、數(shù)據(jù)庫管理系統(tǒng)、統(tǒng)計(jì)軟件,乃至專門的數(shù)據(jù)倉庫。它同樣可以將數(shù)據(jù)輸出并寫入這些系統(tǒng)中。
(6)應(yīng)用面廣。R適用于幾乎任何應(yīng)用的需要。目前在R網(wǎng)站上約有2400個程序包,涵蓋了基礎(chǔ)統(tǒng)計(jì)學(xué)、社會學(xué)、經(jīng)濟(jì)學(xué)、生態(tài)學(xué)、空間分析、系統(tǒng)發(fā)育分析、生物信息學(xué)等諸多方面。R可用來解決自然科學(xué)和社會科學(xué)領(lǐng)域中的各種問題,如統(tǒng)計(jì)學(xué)、社會學(xué)、經(jīng)濟(jì)學(xué)、生物、醫(yī)療衛(wèi)生等,其功能包括圖形顯示、數(shù)據(jù)分析、數(shù)據(jù)輸入、數(shù)據(jù)檢查、數(shù)據(jù)管理、報(bào)表生成、統(tǒng)計(jì)計(jì)算、市場研究、銷售管理、供應(yīng)管理、調(diào)查分析和建立預(yù)測模型等。
(7)完備的幫助系統(tǒng)。每個函數(shù)都有統(tǒng)一格式的幫助,運(yùn)行實(shí)例。
1.1.2 R支持資料
R的官方網(wǎng)頁擁有大量英文學(xué)習(xí)資源,還可以參考http://cran.r-project.org/other-docs.html中文翻譯文檔。統(tǒng)計(jì)之都BBS是一個不錯的學(xué)習(xí)R的中文網(wǎng)站,你可以在這個論壇中找到大量學(xué)習(xí)資料或直接提出問題同大家探討。
R的幫助系統(tǒng)非常強(qiáng)大,可以直接使用\?topic或help(topic)來獲取topic的幫助信息,也可使用help.search("topic")來搜索幫助系統(tǒng)。如果你只知道函數(shù)的部分名稱,那么可以使用apropos("tab")來搜索得到載入內(nèi)存所有包含tab字段的函數(shù)。如果還沒有得到需要的資料,還有R Site Search:http://finzi.psych.upenn.edu/search.html,等價于在R平臺上使用RSiteSearch()函數(shù)。
正如大家應(yīng)用R的過程中看到的,大部分經(jīng)典的R書籍都為英文版的,例如:
Modern Applied Statistics with S(Venables and Ripley)
The New S Language: A Programming Environment for Data Analysis and Graphics(Richard A. Becker,John M. Chambers,Allan R.Wilks)
A Handbook of Statistical Analysis Using R(Brian S. Everitt,Torsten Hothorn)
Data Analysis and Graphics using R(Maindonald and Braun)
Introductory Statistics with R(Dalgaard)
- 金融科技(FinTech)發(fā)展的國際經(jīng)驗(yàn)和中國政策取向(中國金融四十人論壇書系)
- 自愿審計(jì)動機(jī)與質(zhì)量研究:基于我國中期財(cái)務(wù)報(bào)告審計(jì)的經(jīng)驗(yàn)證據(jù)
- 審計(jì)學(xué)基礎(chǔ)
- 讓財(cái)報(bào)說話:世界500強(qiáng)CFO帶你輕松讀財(cái)報(bào)(鮮讀版)
- 博弈論及其在經(jīng)濟(jì)管理中的應(yīng)用
- 企業(yè)能源審計(jì)與節(jié)能規(guī)劃
- 大數(shù)據(jù)搜索與挖掘及可視化管理方案 :Elastic Stack 5:Elasticsearch、Logstash、Kibana、X-Pack、Beats (第3版)
- 陜西國家統(tǒng)計(jì)調(diào)查市、縣優(yōu)秀報(bào)告集萃(2006—2015)(上下)
- 風(fēng)險(xiǎn)導(dǎo)向?qū)徲?jì)準(zhǔn)則實(shí)施效果研究
- 下一場全球金融危機(jī)的到來:明斯基與金融不穩(wěn)定
- 多項(xiàng)目管理方法及其應(yīng)用研究(國家社科基金后期資助項(xiàng)目)
- 2014年注冊會計(jì)師(CPA)全國統(tǒng)考專用輔導(dǎo)教材系列:審計(jì)(名師解讀版)
- 人口預(yù)測模型研究及應(yīng)用
- 政府采購評審專家工作指南
- 房產(chǎn)稅征收對區(qū)域經(jīng)濟(jì)的影響:以新都區(qū)為例