官术网_书友最值得收藏!

1.1 R簡介

R語言是從S統(tǒng)計(jì)繪圖語言演變而來的,S語言在20世紀(jì)70年代誕生于貝爾實(shí)驗(yàn)室,由Rick Becker、John Chambers和Allan Wilks開發(fā)。基于S語言開發(fā)的商業(yè)軟件Splus,可以方便地編寫函數(shù)、建立模型,具有良好的擴(kuò)展性,在國外學(xué)術(shù)界應(yīng)用很廣。1995年,新西蘭奧克蘭大學(xué)統(tǒng)計(jì)系的Robert Gentleman和Ross Ihaka基于S語言的源代碼,編寫了一個能執(zhí)行S語言的軟件,并將該軟件的源代碼全部公開,這就是R軟件,其命令統(tǒng)稱為R語言。

1.1.1 R特點(diǎn)

與起源于貝爾實(shí)驗(yàn)室的S語言類似,R也是一種為統(tǒng)計(jì)計(jì)算和繪圖而生的語言和環(huán)境,它是一套開源的數(shù)據(jù)分析解決方案,由一個龐大且活躍的全球性研究型社區(qū)維護(hù)。R的特點(diǎn)如圖1-1所示。

▲圖1-1 R的特點(diǎn)

具體來說,R有以下7個方面的特點(diǎn)。

(1)完全免費(fèi),軟件本身及程序包的源代碼公開。多數(shù)商業(yè)統(tǒng)計(jì)軟件價格不菲,投入成千上萬美元都是有可能的。

(2)豐富的資源,涵蓋了多種行業(yè)數(shù)據(jù)分析中幾乎所有的方法。R是一個全面的統(tǒng)計(jì)研究平臺,提供了各式各樣的數(shù)據(jù)分析技術(shù),幾乎任何類型的數(shù)據(jù)分析工作皆可在R中完成。

(3)交互式平臺。R是一個可進(jìn)行交互式數(shù)據(jù)分析和探索的強(qiáng)大平臺,任意一個分析步驟的結(jié)果均可被輕松保存、操作,并作為進(jìn)一步分析的輸入。有各式各樣的圖形用戶界面工具通過菜單和對話框提供了與R語言同等的功能。

(4)擴(kuò)展性強(qiáng)。編寫函數(shù)和程序包十分方便,跨平臺,可以勝任復(fù)雜的數(shù)據(jù)分析、繪制精美的圖形。R擁有頂尖水準(zhǔn)的制圖功能。如果希望復(fù)雜數(shù)據(jù)可視化,那么R擁有最全面且最強(qiáng)大的一系列可用功能。

(5)適用性強(qiáng)。R可運(yùn)行于多種平臺之上,包括Windows、UNIX和Mac OS X。這基本上意味著它可以運(yùn)行于你所能擁有的任何計(jì)算機(jī)上。R可以輕松地從各種類型的數(shù)據(jù)源導(dǎo)入數(shù)據(jù),包括文本文件、數(shù)據(jù)庫管理系統(tǒng)、統(tǒng)計(jì)軟件,乃至專門的數(shù)據(jù)倉庫。它同樣可以將數(shù)據(jù)輸出并寫入這些系統(tǒng)中。

(6)應(yīng)用面廣。R適用于幾乎任何應(yīng)用的需要。目前在R網(wǎng)站上約有2400個程序包,涵蓋了基礎(chǔ)統(tǒng)計(jì)學(xué)、社會學(xué)、經(jīng)濟(jì)學(xué)、生態(tài)學(xué)、空間分析、系統(tǒng)發(fā)育分析、生物信息學(xué)等諸多方面。R可用來解決自然科學(xué)和社會科學(xué)領(lǐng)域中的各種問題,如統(tǒng)計(jì)學(xué)、社會學(xué)、經(jīng)濟(jì)學(xué)、生物、醫(yī)療衛(wèi)生等,其功能包括圖形顯示、數(shù)據(jù)分析、數(shù)據(jù)輸入、數(shù)據(jù)檢查、數(shù)據(jù)管理、報(bào)表生成、統(tǒng)計(jì)計(jì)算、市場研究、銷售管理、供應(yīng)管理、調(diào)查分析和建立預(yù)測模型等。

(7)完備的幫助系統(tǒng)。每個函數(shù)都有統(tǒng)一格式的幫助,運(yùn)行實(shí)例。

1.1.2 R支持資料

R的官方網(wǎng)頁擁有大量英文學(xué)習(xí)資源,還可以參考http://cran.r-project.org/other-docs.html中文翻譯文檔。統(tǒng)計(jì)之都BBS是一個不錯的學(xué)習(xí)R的中文網(wǎng)站,你可以在這個論壇中找到大量學(xué)習(xí)資料或直接提出問題同大家探討。

R的幫助系統(tǒng)非常強(qiáng)大,可以直接使用\?topic或help(topic)來獲取topic的幫助信息,也可使用help.search("topic")來搜索幫助系統(tǒng)。如果你只知道函數(shù)的部分名稱,那么可以使用apropos("tab")來搜索得到載入內(nèi)存所有包含tab字段的函數(shù)。如果還沒有得到需要的資料,還有R Site Search:http://finzi.psych.upenn.edu/search.html,等價于在R平臺上使用RSiteSearch()函數(shù)。

正如大家應(yīng)用R的過程中看到的,大部分經(jīng)典的R書籍都為英文版的,例如:

Modern Applied Statistics with S(Venables and Ripley)

The New S Language: A Programming Environment for Data Analysis and Graphics(Richard A. Becker,John M. Chambers,Allan R.Wilks)

A Handbook of Statistical Analysis Using R(Brian S. Everitt,Torsten Hothorn)

Data Analysis and Graphics using R(Maindonald and Braun)

Introductory Statistics with R(Dalgaard)

主站蜘蛛池模板: 靖远县| 色达县| 青海省| 龙陵县| 黄龙县| 台南市| 观塘区| 吉首市| 于都县| 巴彦淖尔市| 公主岭市| 武乡县| 苏尼特右旗| 怀柔区| 崇州市| 新昌县| 侯马市| 长寿区| 双鸭山市| 汽车| 蕲春县| 平遥县| 博兴县| 黄龙县| 甘南县| 扶沟县| 乌鲁木齐市| 临澧县| 井陉县| 桓台县| 望谟县| 汉源县| 抚宁县| 攀枝花市| 惠安县| 皋兰县| 藁城市| 慈利县| 吴堡县| 滕州市| 崇文区|