官术网_书友最值得收藏!

  • 統計學
  • 龐皓主編
  • 4619字
  • 2021-02-08 18:13:20

§1.1 什么是統計學

§1.1.1 “統計”的含義

在日常工作與生活中我們接觸的數據很多,例如為了監督商品的質量,質量監督部門經常從市場上抽取部分商品加以檢驗,并在媒體上公布某類商品的合格率;足球比賽時,解說員經常會引用競賽雙方比賽中攻門的次數和成功率,以說明球隊的實力和所發揮的水平;汽車生產企業的管理人員為了經營決策,要隨時關注自己產品的生產數量和市場占有率的變化;每年高考后,學校和學生都非常關心考試的成績、升學率和各高校的平均錄取分數;各類藥品的說明書中,都注明了該藥品對某些疾病的有效性和產生副作用的可能性;等等。這些數據都是通過統計而獲得的,常被稱為統計數據。事實上,可以運用統計數據從數量上去說明和分析研究的問題十分廣泛,所研究的事物可以是某種社會經濟現象,例如全國各民族人口的分布狀況、各地區居民收入的差距等;也可以是某種自然現象,例如一個地區地震或災害性氣候發生的頻率和強度等。

“統計”作為在日常生活中經常使用的名詞具有多重含義,一般泛指統計實踐活動和統計學,有時也指統計數據或統計資料。統計活動是人們為了認識客觀事物,對所研究事物加以觀測、分析,以獲取數據信息的實踐活動。統計資料包括統計數據和依據統計數據所做的分析報告,統計資料是統計活動的成果,它可以為人們制定決策提供依據。人類的統計活動歷史久遠,可以說自從有了國家便開始了統計實踐。據史料記載,中國夏禹時代(公元前兩千多年)就有人口的記載,為了賦稅、徭役和兵役的需要,歷代都有田畝和戶口的記錄。在古代巴比倫、埃及和羅馬帝國都有對人口和資源數量的詳細記錄。到中世紀,西歐各國都有了人口、軍隊、領地、職業、財產等數量的記錄。

統計學是對統計實踐活動規律性的科學總結,是通過研究如何合理測定、收集、整理、顯示和分析反映客觀現象的數據,以探索事物數量規律性的方法論學科。統計學研究的是怎樣用數據去表現事物內在數量規律性的方法,數據是統計學科最基礎的核心,因而統計學也可稱為是“數據的科學”。世間萬事萬物依據特定的性質予以歸類,可形成作為研究對象的各種群體——現象的總體。無論是屬于自然的,還是社會經濟的,凡是可以用數據表現的總體,都可以作為統計的研究對象。現在,統計思想和統計方法已經滲透到經濟、管理、自然環境、科學實驗、工程技術、氣象、地震、醫藥衛生等幾乎社會的每一個角落,統計學不僅在以上這些領域得到了發展,即使是在一些過去與數量無多少聯系的學科,如政治學、法學、歷史學、藝術學、考古學等領域,也都對統計方法技術的應用加以研究和實踐。我們已進入信息時代,信息的主體是數據,而凡是有數據的地方就離不開統計學。

§1.1.2 統計學的產生與發展

與人們的統計實踐活動相比,統計學產生的歷史并不算長,至今只有三百多年。統計學(Statistics)這一名詞最早來自歐洲。17世紀中葉德國的海爾門·康令創立了“國勢學”,用文字記述國家的地理、歷史、政治組織、社會制度、商業和軍事力量。1749年,國勢學派的主要代表阿亨瓦爾在《近代歐洲各國國勢學論》一書中,首次提出了“統計學”這個名詞。統計學的另一個來源是英國的政治算術學派,英國人威廉·配第(William Patty)在所著的《政治算術》一書中用大量的數字、重量、尺度等定量的方法,對英國、法國、荷蘭三國的經濟實力進行了分析和比較。馬克思在《資本論》中曾給予威廉·配第很高的評價,認為他“是政治經濟學之父,在某種程度上也可以說是統計學的創始人”。此外,英國人約翰·格朗特(John Graunt)在1662年出版了《關于死亡表的自然觀察與政治觀察》一書,他通過大量觀察的方法,研究并發現了人口與社會現象中重要的數量規律性。在研究中,格朗特不但探索了人口變化和發展的一些數量規律,而且還對倫敦市總人口數量做出了較為科學的估計。如果說威廉·配第是政府統計的創始人,那么約翰·格朗特可被認為是人口統計的創始人。可以看出,統計學最早是由于國家和社會管理的需要對社會經濟狀況的數量描述而產生的。

現代統計學的進一步發展與數學的分支——概率論是分不開的。由于航海、保險、賭博等的興起,在對具有偶然性現象的研究中,發現某些偶然現象從個別事件看似乎沒有什么規律,但通過大量觀察又可以發現其中具有一定的規律性。數學家們在研究賭博中的數量規律時,從大量偶然現象中尋找其規律性,于是逐步形成了概率論。在對機會游戲研究的基礎上,數學家帕斯卡爾(B. Pascal)和費馬特(Pierre de Fermat)將賭博中出現的各種具體問題,歸納為一般的概率原理,為后來概率論和統計學的發展奠定了重要的基礎。比利時統計學家凱特勒(Adolphe Quetelet)把概率論的原理引進了統計學,運用大數定律證明社會現象和自然現象的發展變化并非偶然,而是具有內在規律性。概率論引入統計學后,使統計方法發生了很重要的飛躍,在各個領域都創立了許多有效的統計方法,如生物遺傳學中的相關回歸方法;人口學中抽樣方法的應用。這樣,逐步形成了建立在概率論基礎上的以推斷統計方法為中心的數理統計學。數理統計學的產生使統計方法,特別是統計推斷方法發生了重大變化,不僅極大地豐富了統計方法體系,同時也使統計方法具有了更加嚴謹的數學基礎。

20世紀初,大工業的發展引起對產品質量檢驗問題的高度重視,對于大批量產品的生產,要做全面的質量檢驗特別是破壞性檢驗已經不可能,從而提出了只抽取少量產品作為樣本對全部產品的質量做出推斷的要求。1907年,英國人戈賽特(W. S. Gosset)提出了小樣本t統計量的概念,指出從大量的產品中只抽取較小的樣本就可以完成對全部產品質量的檢驗和推斷,從而使統計學進入了現代統計學(主要是推斷統計學)的新階段。以后費喧(R. A. Fisher)給出了F統計量、極大似然估計、方差分析等方法和思想,內曼(J. Neyman)和皮爾遜(E. S. Pearson)提出了置信區間估計和假設檢驗,沃爾德(A. Wald)提出了序貫抽樣和統計決策函數,等等,到20世紀中葉構筑起了現代統計學的基本框架。

從20世紀50年代以來,統計理論、方法和應用進入了一個全面發展的新階段。統計學受計算機科學、信息論等現代科學技術的影響,理論統計學新的研究領域層出不窮,例如多元統計分析、時間序列分析、貝葉斯統計、非參數統計、生存分析、線性統計模型、探索性數據分析、數據挖掘,等等。統計學的應用也日益擴展,已涉及社會科學和自然科學的各個領域,形成了社會與人口統計學、經濟統計學、管理統計學、生物統計學、醫藥衛生統計學、氣象統計學等應用統計學科。現在,統計學已經發展成為研究領域十分廣泛的學科體系。

§1.1.3 統計學研究的特點

統計學是收集、整理、顯示和分析統計數據的方法論學科,統計研究或統計活動的目的是為了探索客觀事物內在的數量規律性,對客觀事物的統計學研究具有以下一些共同特點:

(1)數量性

統計是用來處理數據的,數據由數字組成,但它不僅是單純的數字,數據是有特定內容的數字,統計是要從有特定內容的數據中尋求有價值的數量信息。所以,統計總是與所研究對象的數量特征相聯系的。一切事物都有質和量兩個方面,從質和量的辯證統一中研究現象的數量特征,從數量上認識事物的性質和規律性,這是統計研究的基本特點。用統計數據去具體描述和分析事物的數量特征,可以更確切地表現事物發展的狀態和程度,通過數據去揭示的數量規律性,能更具體、更準確地說明事物之間的內在聯系。所以,從數量上表現和分析事物的特征和規律,是認識客觀世界的重要方式。表現事物數量特征的統計數據通常不是指個別的數字,而是指同類的眾多數據。因為事物發展變化的數量規律性通常隱藏在大量統計數據之中,需要通過大量觀察,利用統計方法對數據進行加工整理,并運用專門的統計方法進行分析才能將其揭示出來。例如,在農業生產中,要從大量的農業試驗數據中用統計方法才能探索施肥量與糧食產量之間具體的數量關系;又如,商品廣告費用支出與商品銷售量的數量關系,要通過大量的廣告費用支出和銷售量數據才能進行分析并得出結論。統計學正是運用科學的方法去收集、整理、顯示和分析事物的數量特征,從而尋求數據中所體現的現象內在聯系及數量規律。統計的目的在于對用統計數據所表現的現象數量特征進行研究,離開了統計數據,統計方法乃至統計學就失去了它存在的意義。需要強調的是,統計學研究的是有特定內容的具體數量,例如要研究“工業產品產量”,就必須明確什么是工業,什么是工業產品,如何去計量產品產量;要研究“失業人口”,就必須事先明確怎樣去界定就業與失業。統計研究在對事物的數量特征和規律做出結論時,不能脫離所研究事物的具體性質,這是與數學原則所區別的。

(2)總體性

統計研究的總是由同類事物構成的群體的數量特征,單個事物的數量一般可以直接測定,例如了解某一個職工的月工資,只要查閱其工資表即可知道,不需要運用更多的統計方法。所以,單一個體的數量特征一般不是用統計方法研究的對象,而對于一個大的公司或一個地區全體職工的月平均工資,就不能直接觀測,而需要用統計方法才能確定。這種由同類事物構成的群體也稱為總體。統計總是針對一定的總體,目的是反映總體的數量特征,因為由總體內在必然因素決定的事物內在的數量規律性,要在特定總體中才能體現出來。而個體現象的具體數量特征是內在因素與其他眾多偶然因素共同作用形成的,作用于個體的偶然性因素只有在總體中才能在一定程度上被中和或抵消。能夠反映現象本質特征的由內在因素決定的總體規律性,只有著眼于總體層面才能被認識。例如,個別商品的價格由于多種因素的影響,在一定時期可能有升有降,而社會商品的價格總水平的變動,則是該時期經濟規律和經濟政策作用的綜合結果。雖然總體的數量特征一般不能直接度量,我們只能對某些個體的特征進行具體觀測,但是必須明確,統計研究的主要對象是總體,并不是具體的個體。從對參差不齊的個體數量特征的觀測入手,運用科學的方法獲得表現總體一般特征的綜合數量,這正是統計研究的基本思想和突出特點。統計學提供了一系列的方法,專門用來收集數據、整理數據、顯示數據的特征,進而分析和探索(或推斷)事物總體的數量規律性。當然,如果事物本身的數量規律比較簡單,所用的統計方法也就相對容易;如果事物本身的數量規律錯綜復雜,所運用的統計方法也就相對復雜。

(3)差異性或不確定性

任何客觀事物都是必然性與偶然性的對立統一。同樣,任何一個數據,也都是必然性因素與偶然性因素共同作用的結果。必然性因素是相對穩定的,它決定著客觀事物內在的本質和聯系,是有規律可循的。而偶然性因素導致了該事物每個具體表現形式的差異性和不確定性。如果客觀事物只有必然性一個方面的特征,事物的表現形式就會比較簡單,就可以比較容易把握它的規律性。正是由于偶然性和不確定性的存在,造成事物的表現形式與必然規律性發生偏移,從而形成了表面特征的千姿百態,也就形成數據表現形式的千差萬別。這樣,必然的數量規律性就被掩蓋在表面的差異性或不確定性之中了。統計所研究的事物總體是由眾多個體組成的,這些個體的數量特征由于受多種偶然因素的作用具有差異性和不確定性,我們正是要根據不確定的經驗數據去做出推斷,從個體的這種差異中去描述或推斷總體的特征或必然規律,這才產生了統計學。假如已知一個公司全體職工的總體中每個職工的月工資沒有差異,那么對于這些無差異的個體,只需隨意了解其中任何一個職工的月工資,也就知道了其他職工的工資水平和全公司職工的平均工資,在這種情況下也就不需要運用什么統計方法了。從大量包含偶然性的有差異性的現象中揭示出事物的必然特征和統計規律性,這是一種基本的統計思想。

主站蜘蛛池模板: 和顺县| 平和县| 南雄市| 锦屏县| 获嘉县| 张家口市| 景宁| 昭通市| 乌拉特中旗| 汉川市| 马公市| 荥阳市| 纳雍县| 万荣县| 鹤岗市| 防城港市| 长治市| 即墨市| 兰州市| 任丘市| 资溪县| 许昌县| 昆明市| 卢氏县| 红原县| 孟连| 邯郸市| 扬州市| 平阴县| 开封县| 闽清县| 嵊泗县| 进贤县| 连江县| 灵寿县| 康乐县| 余庆县| 建始县| 安平县| 石泉县| 河源市|