- 統(tǒng)計(jì)學(xué)基礎(chǔ)(第2版)
- 劉澤主編
- 7507字
- 2021-01-06 18:36:22
知識(shí)鏈接
1.1 統(tǒng)計(jì)的內(nèi)涵
“統(tǒng)計(jì)”一詞有三種含義:統(tǒng)計(jì)學(xué)、統(tǒng)計(jì)工作和統(tǒng)計(jì)資料。統(tǒng)計(jì)學(xué)是一系列統(tǒng)計(jì)方法的理論闡述;統(tǒng)計(jì)工作是統(tǒng)計(jì)的具體實(shí)踐活動(dòng);統(tǒng)計(jì)資料是統(tǒng)計(jì)工作各階段的成果,也可稱為統(tǒng)計(jì)數(shù)據(jù)。
1.1.1 統(tǒng)計(jì)學(xué)
統(tǒng)計(jì)學(xué)是關(guān)于收集、整理、分析和解釋統(tǒng)計(jì)數(shù)據(jù)的科學(xué),是一門方法論性質(zhì)的學(xué)科,其目的是探索研究對象的數(shù)量特征和數(shù)據(jù)的內(nèi)在規(guī)律性。
統(tǒng)計(jì)學(xué)的這一定義包含了如下3個(gè)要點(diǎn)。
(1)統(tǒng)計(jì)學(xué)是研究“數(shù)據(jù)”的科學(xué),離開了數(shù)據(jù),統(tǒng)計(jì)學(xué)也就失去了它存在的意義,因此有人稱統(tǒng)計(jì)學(xué)是“數(shù)據(jù)的科學(xué)”。
(2)統(tǒng)計(jì)學(xué)是方法論科學(xué),是研究數(shù)據(jù)的“工具”,因此它適用于所有有數(shù)據(jù)存在的學(xué)科領(lǐng)域。
(3)統(tǒng)計(jì)學(xué)研究的不是抽象的數(shù)據(jù),而是“有載體的統(tǒng)計(jì)數(shù)據(jù)”,因此利用統(tǒng)計(jì)方法得到的任何數(shù)據(jù)特征和數(shù)據(jù)規(guī)律都與某一研究對象緊密相連。
統(tǒng)計(jì)學(xué)的研究對象是現(xiàn)象總體的數(shù)量方面。統(tǒng)計(jì)通過對總體中大量個(gè)體的差異化數(shù)據(jù)進(jìn)行收集、整理和分析,獲得研究對象總體的特征和規(guī)律性。
英文“Statistics”一詞包含了兩層含義,一是作為一門學(xué)科的統(tǒng)計(jì)學(xué);二是表示統(tǒng)計(jì)數(shù)據(jù)或統(tǒng)計(jì)資料,說明了統(tǒng)計(jì)學(xué)與統(tǒng)計(jì)數(shù)據(jù)之間密不可分的關(guān)系。
1.1.2 統(tǒng)計(jì)工作過程
一般將統(tǒng)計(jì)工作概括地分為4個(gè)階段,即統(tǒng)計(jì)設(shè)計(jì)、數(shù)據(jù)收集、數(shù)據(jù)整理和數(shù)據(jù)分析,如圖1-1所示。

圖1-1 統(tǒng)計(jì)工作過程
1. 統(tǒng)計(jì)設(shè)計(jì)
統(tǒng)計(jì)設(shè)計(jì)是根據(jù)統(tǒng)計(jì)研究的目的和研究對象的特點(diǎn),對統(tǒng)計(jì)工作各個(gè)方面及各個(gè)環(huán)節(jié)所做的通盤考慮與安排。其基本任務(wù)是制定出各種統(tǒng)計(jì)工作方案,主要內(nèi)容應(yīng)包括統(tǒng)計(jì)指標(biāo)體系、統(tǒng)計(jì)調(diào)查方案、統(tǒng)計(jì)匯總或整理方案以及統(tǒng)計(jì)分析方案等諸多方面。統(tǒng)計(jì)設(shè)計(jì)是統(tǒng)計(jì)工作實(shí)施的基本依據(jù),是使統(tǒng)計(jì)工作協(xié)調(diào)、有序、順利進(jìn)行的必要條件。
2. 數(shù)據(jù)收集
數(shù)據(jù)收集是根據(jù)統(tǒng)計(jì)設(shè)計(jì)的要求,采用科學(xué)的數(shù)據(jù)收集方法,收集總體中全部或部分個(gè)體數(shù)據(jù)資料的工作過程。數(shù)據(jù)收集是統(tǒng)計(jì)工作的基礎(chǔ)環(huán)節(jié),是認(rèn)識(shí)事物的起點(diǎn)。原始數(shù)據(jù)質(zhì)量的高低,直接影響到分析結(jié)論的可靠性。因此,數(shù)據(jù)收集階段應(yīng)盡可能地降低統(tǒng)計(jì)調(diào)查誤差。
3. 數(shù)據(jù)整理
數(shù)據(jù)整理是對收集來的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行科學(xué)的加工整理,使之系統(tǒng)化、條理化,把大量的反映個(gè)體特征的零散資料轉(zhuǎn)化為反映總體綜合數(shù)量特征的統(tǒng)計(jì)資料的過程。數(shù)據(jù)整理是數(shù)據(jù)收集和數(shù)據(jù)分析之間承上啟下的中間環(huán)節(jié),其主要任務(wù)是對收集到的數(shù)據(jù)進(jìn)行分組、歸類,并用合適的統(tǒng)計(jì)表或統(tǒng)計(jì)圖展示整理的結(jié)果。
4. 數(shù)據(jù)分析
數(shù)據(jù)分析是運(yùn)用統(tǒng)計(jì)方法及與分析對象有關(guān)的知識(shí),從定量與定性的結(jié)合上對研究對象總體進(jìn)行分析,以揭示研究對象數(shù)量特征和數(shù)量規(guī)律的統(tǒng)計(jì)工作階段。數(shù)據(jù)分析是統(tǒng)計(jì)工作的最后一環(huán),也是關(guān)鍵的一步。統(tǒng)計(jì)分析報(bào)告是統(tǒng)計(jì)分析的產(chǎn)品,統(tǒng)計(jì)分析報(bào)告的質(zhì)量既取決于數(shù)據(jù)本身的質(zhì)量,又有賴于對統(tǒng)計(jì)數(shù)據(jù)分析利用的程度。
一般來說,統(tǒng)計(jì)工作的4個(gè)階段是依次進(jìn)行的,任何一個(gè)階段的工作失誤都會(huì)影響到下一階段的工作質(zhì)量。但在某些情況下,為保證統(tǒng)計(jì)工作整體上取得好的效果,各階段也會(huì)交叉進(jìn)行。例如,在數(shù)據(jù)收集和整理階段可以進(jìn)行一些必要的分析,或者對原設(shè)計(jì)方案進(jìn)行適當(dāng)?shù)母倪M(jìn);在數(shù)據(jù)分析階段,如果現(xiàn)有資料不能滿足分析的需要,可以做一些必要的補(bǔ)充調(diào)查、數(shù)據(jù)整理等工作。
1.1.3 統(tǒng)計(jì)數(shù)據(jù)
統(tǒng)計(jì)數(shù)據(jù)是對現(xiàn)象進(jìn)行計(jì)量和分析的結(jié)果,是研究對象的特征表現(xiàn)。對個(gè)體而言,其特征既可以用數(shù)字表示也可以用文字表示;對總體而言,其特征都是用數(shù)字表示的。
一個(gè)完整的統(tǒng)計(jì)數(shù)據(jù),應(yīng)包括3個(gè)最基本的構(gòu)成要素:數(shù)據(jù)名稱、數(shù)值和數(shù)據(jù)的計(jì)量單位。但在具體表述一個(gè)統(tǒng)計(jì)數(shù)據(jù)時(shí),很多時(shí)候只有這3個(gè)要素是不夠的,還應(yīng)包含對數(shù)據(jù)其他方面的內(nèi)涵規(guī)定,如數(shù)據(jù)所屬的時(shí)間和空間范圍等。
例如,“工業(yè)機(jī)器人7 485(臺(tái)/套)”傳遞的信息是不完整的,如果改為“2016年11月,我國規(guī)模以上工業(yè)企業(yè)生產(chǎn)的工業(yè)機(jī)器人有7 485(臺(tái)/套)”,數(shù)據(jù)的內(nèi)外邊界就很清楚了。
統(tǒng)計(jì)數(shù)據(jù)從不同的角度有不同的分類,通常可以從以下3個(gè)角度分類,如圖1-2所示。

圖1-2 統(tǒng)計(jì)數(shù)據(jù)的分類
1. 按計(jì)量尺度分類
按計(jì)量尺度不同,可以將統(tǒng)計(jì)數(shù)據(jù)分為分類數(shù)據(jù)、順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)。
(1)分類數(shù)據(jù),用文字來表述,表明事物的不同屬性或類別。在統(tǒng)計(jì)處理時(shí),我們用數(shù)字代碼來表示分類數(shù)據(jù)的各個(gè)類別。例如,用“1”代表“男性”,用“2”代表“女性”,這里的“1”和“2”只表達(dá)了現(xiàn)象分屬于兩個(gè)類別這樣一層含義。再如,企業(yè)所屬的不同行業(yè)、企業(yè)的不同所有制類型、不同職業(yè)等都屬于分類數(shù)據(jù)。
(2)順序數(shù)據(jù),用文字來表述,表明有順序的不同類別。在統(tǒng)計(jì)處理時(shí),我們同樣可以用數(shù)字代碼來表示。例如,用“1”“2”“3”“4”“5”分別代表考試成績的“不及格”“及格”“中”“良”“優(yōu)”,這里的1、2、3、4、5不僅表明現(xiàn)象分屬于不同的類別,而且表明這些類別的順序。再如,不同的教育程度、產(chǎn)品的不同等級等均屬于順序數(shù)據(jù)。
(3)數(shù)值型數(shù)據(jù),用數(shù)字來表現(xiàn)各種現(xiàn)象的數(shù)量特征,是使用自然或度量衡單位對事物進(jìn)行計(jì)量的結(jié)果。一個(gè)企業(yè)的職工人數(shù)、產(chǎn)值、銷售收入、市場占有率等指標(biāo)都是用具體的數(shù)字來表示的。數(shù)值型數(shù)據(jù)不僅能表明現(xiàn)象數(shù)量上的不同和大小順序,還能在數(shù)據(jù)之間進(jìn)行數(shù)量運(yùn)算,大部分統(tǒng)計(jì)分析方法適用于數(shù)值型數(shù)據(jù)的分析,統(tǒng)計(jì)處理的大多是數(shù)值型數(shù)據(jù)。
分類數(shù)據(jù)和順序數(shù)據(jù)也統(tǒng)稱為品質(zhì)數(shù)據(jù)或定性數(shù)據(jù),數(shù)值型數(shù)據(jù)也稱為數(shù)量數(shù)據(jù)或定量數(shù)據(jù)。
2. 按數(shù)據(jù)來源分類
按來源不同,可將統(tǒng)計(jì)數(shù)據(jù)分為觀測數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)。
(1)觀測數(shù)據(jù)是指通過直接調(diào)查或觀察收集到的數(shù)據(jù)。社會(huì)經(jīng)濟(jì)領(lǐng)域的統(tǒng)計(jì)數(shù)據(jù)基本上是觀測數(shù)據(jù)。
(2)實(shí)驗(yàn)數(shù)據(jù)是通過對實(shí)驗(yàn)對象、實(shí)驗(yàn)環(huán)境以及實(shí)驗(yàn)過程的有效控制而獲得的統(tǒng)計(jì)數(shù)據(jù)。這些數(shù)據(jù)主要用于考察變量之間的因果關(guān)系。
3. 按與時(shí)間的關(guān)系分類
按與時(shí)間的關(guān)系不同,可將統(tǒng)計(jì)數(shù)據(jù)分為截面數(shù)據(jù)、時(shí)間序列數(shù)據(jù)和面板數(shù)據(jù)。
(1)截面數(shù)據(jù)是指某一總體中不同個(gè)體在相同或近似相同的時(shí)間上的數(shù)據(jù)表現(xiàn)。
(2)時(shí)間序列數(shù)據(jù)是指將不同時(shí)間上某一指標(biāo)值列出所形成的按時(shí)間順序排列的數(shù)據(jù)序列。
(3)面板數(shù)據(jù)是指總體中不同個(gè)體在不同時(shí)間上的數(shù)據(jù)表現(xiàn),是時(shí)間序列數(shù)據(jù)與截面數(shù)據(jù)的結(jié)合。
1.2 統(tǒng)計(jì)的職能
統(tǒng)計(jì)的職能可以概括為信息職能、咨詢職能和監(jiān)督職能,如圖1-3所示。
1. 信息職能
信息職能指的是統(tǒng)計(jì)提供信息服務(wù)的功能,通過采集、處理、傳遞、存儲(chǔ)和分析數(shù)據(jù),提供以數(shù)量描述為基本特征的社會(huì)經(jīng)濟(jì)信息。
2. 咨詢職能
咨詢職能指的是統(tǒng)計(jì)提供咨詢建議和對策方案的服務(wù)功能,利用已經(jīng)掌握的豐富的統(tǒng)計(jì)信息資料,運(yùn)用科學(xué)的統(tǒng)計(jì)分析方法和先進(jìn)的技術(shù)手段,開展綜合分析和專題分析,為科學(xué)決策和科學(xué)管理提供可選擇的咨詢建議和決策方案。

圖1-3 統(tǒng)計(jì)的職能
3. 監(jiān)督職能
監(jiān)督職能指的是統(tǒng)計(jì)揭示事物運(yùn)行中的偏差,促使事物運(yùn)行不偏離正常軌道的功能。統(tǒng)計(jì)以定量檢查、監(jiān)測、預(yù)警指標(biāo)體系等為手段,揭示決策及其執(zhí)行過程中的偏差,使決策及其執(zhí)行過程按客觀規(guī)律的要求進(jìn)行。
信息職能是統(tǒng)計(jì)最基本的職能,是保證咨詢和監(jiān)督職能得以有效發(fā)揮的前提,反過來統(tǒng)計(jì)咨詢職能和統(tǒng)計(jì)監(jiān)督職能的強(qiáng)化又會(huì)促進(jìn)統(tǒng)計(jì)信息職能的強(qiáng)化。統(tǒng)計(jì)的3種功能相輔相成,相互作用,構(gòu)成了一個(gè)有機(jī)整體,故又稱為統(tǒng)計(jì)的整體功能。
統(tǒng)計(jì)方法已應(yīng)用到人類生活的各個(gè)領(lǐng)域。尤其是生活在21世紀(jì)的人們,將與數(shù)據(jù)朝夕相處,收集相關(guān)數(shù)據(jù),從數(shù)據(jù)中提取信息,進(jìn)行預(yù)測與決策,將是個(gè)人、企業(yè)、政府經(jīng)常面對的事情。在科研領(lǐng)域,統(tǒng)計(jì)方法已應(yīng)用到幾乎所有的研究領(lǐng)域,有些學(xué)科廣泛地應(yīng)用統(tǒng)計(jì)方法使得其擁有各自的統(tǒng)計(jì)術(shù)語,如生物統(tǒng)計(jì)、醫(yī)學(xué)統(tǒng)計(jì)、衛(wèi)生統(tǒng)計(jì)、商務(wù)統(tǒng)計(jì)、經(jīng)濟(jì)統(tǒng)計(jì)學(xué)、統(tǒng)計(jì)物理學(xué)、人口統(tǒng)計(jì)、心理統(tǒng)計(jì)學(xué)、教育統(tǒng)計(jì)學(xué)、社會(huì)統(tǒng)計(jì)、體育統(tǒng)計(jì)學(xué)等。
統(tǒng)計(jì)在工商業(yè)領(lǐng)域扮演著一個(gè)重要的角色。一個(gè)工商管理人員會(huì)經(jīng)常面臨大量企業(yè)經(jīng)濟(jì)管理方面的數(shù)據(jù),而這些數(shù)據(jù)只有被分析、提煉才能成為管理人員進(jìn)行管理和決策的依據(jù)。
圖1-4簡要表述了當(dāng)我們遇到一個(gè)具體問題時(shí),借助于統(tǒng)計(jì)工具解決問題的思維過程。

圖1-4 應(yīng)用統(tǒng)計(jì)的思維過程
我們在討論統(tǒng)計(jì)所具有的職能、統(tǒng)計(jì)應(yīng)用的廣泛性及統(tǒng)計(jì)對決策的重要性時(shí),還應(yīng)看到統(tǒng)計(jì)有所為也有所不為。統(tǒng)計(jì)可以幫助人們分析數(shù)據(jù),并通過分析得出某種結(jié)論,但對統(tǒng)計(jì)結(jié)論的進(jìn)一步解釋,則需要相關(guān)領(lǐng)域的專業(yè)知識(shí)。

視頻1-1 統(tǒng)計(jì)的源流

視頻1-2 統(tǒng)計(jì)與生活
1.3 統(tǒng)計(jì)學(xué)的研究方法
統(tǒng)計(jì)學(xué)從17世紀(jì)產(chǎn)生發(fā)展到今天,其應(yīng)用領(lǐng)域越來越廣泛,其方法越來越豐富。統(tǒng)計(jì)學(xué)的研究方法可以簡單地劃分為兩大類:描述性統(tǒng)計(jì)方法和推斷性統(tǒng)計(jì)方法。
傳統(tǒng)統(tǒng)計(jì)學(xué)以描述統(tǒng)計(jì)為主,主要包括數(shù)據(jù)的收集、整理、圖表顯示和數(shù)據(jù)的綜合測度等內(nèi)容,描述統(tǒng)計(jì)是統(tǒng)計(jì)學(xué)的基礎(chǔ)和統(tǒng)計(jì)工作的初步。
現(xiàn)代統(tǒng)計(jì)學(xué)產(chǎn)生于20世紀(jì)初,以推斷統(tǒng)計(jì)為主,其方法包括抽樣理論、參數(shù)估計(jì)、假設(shè)檢驗(yàn)、方差分析、統(tǒng)計(jì)決策理論、非參數(shù)統(tǒng)計(jì)、現(xiàn)代時(shí)間序列分析、多變量分析等,推斷統(tǒng)計(jì)是現(xiàn)代統(tǒng)計(jì)學(xué)的核心。現(xiàn)代統(tǒng)計(jì)學(xué)體現(xiàn)了對數(shù)學(xué)方法的廣泛吸收和應(yīng)用,現(xiàn)代統(tǒng)計(jì)方法的應(yīng)用也提高了數(shù)據(jù)分析的效率和數(shù)據(jù)挖掘的深度。
在統(tǒng)計(jì)工作的不同階段應(yīng)用著不同的統(tǒng)計(jì)方法。在數(shù)據(jù)收集階段,要體現(xiàn)統(tǒng)計(jì)的“大量觀察法”,具體應(yīng)用時(shí)還有不同的調(diào)查方式與方法可供選擇;在數(shù)據(jù)整理階段,主要應(yīng)用“統(tǒng)計(jì)分組法”,通過分組、歸類了解數(shù)據(jù)的內(nèi)部結(jié)構(gòu),并通過合適的圖、表展示數(shù)據(jù);在數(shù)據(jù)分析階段,根據(jù)分析問題的角度和深度不同,又有大量的統(tǒng)計(jì)分析方法可供選擇。隨著對更多數(shù)學(xué)方法的吸收和先進(jìn)信息技術(shù)的不斷滲透,更有效的統(tǒng)計(jì)分析方法還在不斷產(chǎn)生。
本書將按照統(tǒng)計(jì)工作的不同階段,分別介紹數(shù)據(jù)收集的方式與方法(任務(wù)二 數(shù)據(jù)收集)、數(shù)據(jù)整理與數(shù)據(jù)顯示方法(任務(wù)三 數(shù)據(jù)整理與顯示)和數(shù)據(jù)分析(任務(wù)四至任務(wù)八)的一系列方法。
任何統(tǒng)計(jì)方法的有效性都取決于研究對象是否滿足方法的適用條件或基本假設(shè),誤用統(tǒng)計(jì)學(xué)的方法可能會(huì)導(dǎo)致描述上的偏離或者推論的錯(cuò)誤,而這個(gè)錯(cuò)誤又可能導(dǎo)致決策的失誤。因此,作為統(tǒng)計(jì)方法的使用者應(yīng)正確使用統(tǒng)計(jì)方法,避免誤用。
1.4 統(tǒng)計(jì)學(xué)中的基本概念
1.4.1 總體、樣本與個(gè)體
總體是客觀存在的、性質(zhì)相同的大量個(gè)體組成的整體,是由統(tǒng)計(jì)研究目的決定的統(tǒng)計(jì)研究對象的全體。個(gè)體是組成總體的個(gè)別單位。例如,要研究某地區(qū)國有企業(yè)的生產(chǎn)經(jīng)營狀況,則該地區(qū)全部國有企業(yè)構(gòu)成總體,某個(gè)國有企業(yè)就是個(gè)體;某企業(yè)要檢查某批產(chǎn)品的質(zhì)量,該批所有產(chǎn)品構(gòu)成總體,某件產(chǎn)品就是個(gè)體。
樣本是從總體中抽取出來的一部分個(gè)體組成的整體。抽樣的目的是用樣本的數(shù)據(jù)特征推斷總體的數(shù)據(jù)特征。例如,研究顧客的滿意度,從該產(chǎn)品的用戶中隨機(jī)抽取5%構(gòu)成樣本,用這部分顧客的滿意度對該產(chǎn)品用戶的滿意度進(jìn)行估計(jì)。總體、樣本與個(gè)體的關(guān)系如圖1-5所示。

圖1-5 總體、樣本和個(gè)體
1.4.2 參數(shù)與統(tǒng)計(jì)量
參數(shù)是描述總體綜合數(shù)量特征的概括性數(shù)字度量,是對總體中所有個(gè)體某一數(shù)量特征的綜合。
統(tǒng)計(jì)量是描述樣本綜合數(shù)量特征的概括性數(shù)字度量,是對樣本中所有個(gè)體某一數(shù)量特征的綜合,計(jì)算樣本統(tǒng)計(jì)量是為了估計(jì)總體參數(shù)。
不管是總體參數(shù)還是樣本統(tǒng)計(jì)量,體現(xiàn)的都是對個(gè)體數(shù)量特征的綜合,都用數(shù)字表示。例如,隨機(jī)抽取5%的用戶進(jìn)行滿意度調(diào)查,5%用戶的滿意度得分是82分,這就是統(tǒng)計(jì)量;據(jù)此推算出全部用戶的滿意度得分為79~85分,這就是參數(shù)。
習(xí)慣上,也將總體的綜合數(shù)量特征稱為統(tǒng)計(jì)指標(biāo)。
1.4.3 變量
變量是描述個(gè)體特征的概念,變量的具體取值稱為變量值。習(xí)慣上,也將反映個(gè)體特征的變量稱為標(biāo)志。
1. 按變量的表現(xiàn)形式分類
變量按其表現(xiàn)形式的不同可分為品質(zhì)變量和數(shù)值型變量。
(1)品質(zhì)變量用文字表示,包括分類變量和順序變量。分類變量是說明事物類別的一個(gè)名稱,其取值是分類數(shù)據(jù)。例如,企業(yè)的“行業(yè)”屬性是分類變量,其變量值表現(xiàn)為“IT業(yè)”“物流業(yè)”“旅游業(yè)”等不同類別的行業(yè);順序變量也是說明事物有序類別的一個(gè)名稱,其取值是順序數(shù)據(jù)。如“服務(wù)等級”是順序變量,其變量值表現(xiàn)為“優(yōu)”“良”“中”“差”4個(gè)順序等級。
(2)數(shù)值型變量是說明事物數(shù)字特征的一個(gè)名稱,其取值是數(shù)值型數(shù)據(jù)。例如,企業(yè)的“營業(yè)額”是數(shù)值型變量,其變量值為具體的數(shù)值,如“20萬元”“30萬元”“40萬元”等。
以商場的會(huì)員卡為例,每個(gè)會(huì)員的個(gè)體信息就是變量,如某會(huì)員的性別是一個(gè)分類變量,教育程度是一個(gè)順序變量,購買金額是一個(gè)數(shù)值型變量。
2. 按變量的取值不同分類
數(shù)值型變量根據(jù)變量的取值不同,分為離散型變量和連續(xù)型變量。
(1)離散型變量是只能取整數(shù)值的變量,一般用來反映以自然整數(shù)計(jì)量的數(shù)量表現(xiàn),變量值之間以整數(shù)位斷開。例如,企業(yè)從業(yè)人數(shù)1 000人,只用整數(shù)來計(jì)量,在999和1 000兩個(gè)整數(shù)之間不可能有小數(shù)值。
(2)連續(xù)型變量是可以在一個(gè)或多個(gè)區(qū)間中取任何值的變量,其取值是連續(xù)不斷的,不能一一列舉。例如,銷售收入20萬元,以貨幣單位計(jì)量,在順序的兩個(gè)“萬元”之間可以有小數(shù)值,表示比萬元更小的計(jì)量單位上的取值。
1.5 統(tǒng)計(jì)應(yīng)用軟件簡介
從古人在樹木上刻痕以計(jì)算家畜和財(cái)產(chǎn)的數(shù)量,到今天通過計(jì)算機(jī)和軟件來收集、儲(chǔ)存、分析數(shù)據(jù),人類處理和分析數(shù)據(jù)的速度和規(guī)模已發(fā)生了革命性的變化。人類正行駛在以數(shù)據(jù)為載體的信息高速公路上,在人們的日常生活、政府行政事務(wù)管理、企業(yè)生產(chǎn)經(jīng)營管理、科學(xué)研究等各個(gè)領(lǐng)域,手工計(jì)算已被計(jì)算器、計(jì)算機(jī)所取代,數(shù)據(jù)分析軟件幫助人們快速、高效地完成數(shù)據(jù)分析任務(wù)。
在統(tǒng)計(jì)教學(xué)中,統(tǒng)計(jì)學(xué)中的眾多公式、符號(hào)及數(shù)字,令很多人望而生畏、感到枯燥乏味;同時(shí),數(shù)據(jù)量較大、較為復(fù)雜的運(yùn)算,手工也難以勝任。近年來,借助于計(jì)算機(jī)和數(shù)據(jù)處理軟件,統(tǒng)計(jì)教學(xué)和統(tǒng)計(jì)學(xué)習(xí)變得更高效。
目前,可以用于統(tǒng)計(jì)數(shù)據(jù)處理和分析的軟件很多。辦公自動(dòng)化軟件Excel就包含強(qiáng)大的數(shù)據(jù)處理功能,其應(yīng)用非常普遍。專業(yè)的統(tǒng)計(jì)軟件有SPSS、SAS、Minitab、Statistica、Eviews等。本書的適用對象是非統(tǒng)計(jì)專業(yè)的學(xué)生,也不涉及很復(fù)雜高深的模型與運(yùn)算,因此選擇具有較高普及率的Excel軟件作為統(tǒng)計(jì)入門學(xué)習(xí)和掌握常用數(shù)據(jù)處理方法的工具,本書將使用Excel的最新版本Excel 2016來進(jìn)行講解。
Excel具有強(qiáng)大的表格格式化功能、計(jì)算和函數(shù)功能、圖表制作功能等,可以利用Excel的相應(yīng)命令來制作電子表格、圖表(見圖1-6),進(jìn)行數(shù)據(jù)的分類匯總(見圖1-7),利用統(tǒng)計(jì)函數(shù)或相應(yīng)的數(shù)據(jù)分析工具完成數(shù)據(jù)的運(yùn)算或分析等(見圖1-8~圖1-10)。Excel具有功能強(qiáng)大和使用方便的特點(diǎn),廣泛應(yīng)用于會(huì)計(jì)、財(cái)務(wù)、金融、營銷、貿(mào)易、統(tǒng)計(jì)、行政等領(lǐng)域,是比較適合非統(tǒng)計(jì)專業(yè)的經(jīng)濟(jì)管理人員使用的應(yīng)用統(tǒng)計(jì)軟件。
本書有關(guān)運(yùn)算的任務(wù)實(shí)施都借助于Excel來完成,很少涉及手工計(jì)算,相應(yīng)的公式推導(dǎo)、手工計(jì)算簡捷公式全部省略,讀者可將注意力放在統(tǒng)計(jì)方法的基本原理、Excel的操作步驟和統(tǒng)計(jì)結(jié)果的解讀上。

圖1-6 插入圖表

圖1-7 數(shù)據(jù)的分類匯總

圖1-8 插入函數(shù)

圖1-9 工具菜單中的數(shù)據(jù)分析

圖1-10 Excel中的數(shù)據(jù)分析工具
1.6 案例——女排奪冠背后的“數(shù)據(jù)分析之道”
在2016年8月的里約奧運(yùn)會(huì)上,中國女排繼2004年拿到雅典奧運(yùn)會(huì)冠軍后,時(shí)隔12年再次獲得奧運(yùn)會(huì)冠軍!這一刻,女排姑娘們又創(chuàng)造奇跡!“女排精神”再次感動(dòng)中國!郎平“執(zhí)教有方、訓(xùn)練有道、指揮有謀”,被稱為“女神”!
當(dāng)我們見證體壇明星們創(chuàng)造奇跡的時(shí)候,是否想過在他們的背后還有一個(gè)科研團(tuán)隊(duì)在用科技的力量幫助這些天才走向成功?現(xiàn)代賽場上,主教練在指揮時(shí)單憑個(gè)人記憶和歷史經(jīng)驗(yàn)做決策已經(jīng)不夠了,經(jīng)常要用到實(shí)時(shí)比賽數(shù)據(jù)分析作為參考,重大體育比賽項(xiàng)目配備專業(yè)的數(shù)據(jù)分析團(tuán)隊(duì)已經(jīng)是標(biāo)準(zhǔn)配置了。2010年,國家排球隊(duì)重金引進(jìn)了一套技戰(zhàn)術(shù)統(tǒng)計(jì)軟件,里約奧運(yùn)會(huì)上,女排的數(shù)據(jù)分析師袁靈犀就是運(yùn)用這套軟件,通過臨場的數(shù)據(jù)分析告訴教練組最佳的應(yīng)對策略。
比賽后的數(shù)據(jù)分析是事后諸葛亮,僅供參考,比賽進(jìn)程中的趨勢分析是及時(shí)數(shù)據(jù),用來作為是否進(jìn)行調(diào)整的依據(jù)。開賽前半小時(shí),袁靈犀在指定的“技術(shù)區(qū)域”,架上攝像機(jī),接好筆記本電腦,再連上打印機(jī),為比賽的數(shù)據(jù)采集做好準(zhǔn)備。比賽過程中,袁靈犀需要在一瞬間判斷球員打了什么戰(zhàn)術(shù),還要判斷她打到了哪個(gè)區(qū)域,然后馬上輸入,軟件就會(huì)自動(dòng)畫出扣球線路。每場排球比賽,現(xiàn)場輸入技術(shù)數(shù)據(jù)至少有1 000條,包括每個(gè)隊(duì)員的發(fā)球集、二傳傳球位置分析、重點(diǎn)球員在不同戰(zhàn)術(shù)中扣球和吊球的習(xí)慣線路。必須詳細(xì)記錄每一分的來歷,用于備賽和協(xié)助現(xiàn)場指揮。還要記錄我方和對手每一名隊(duì)員的扣球路線、扣球區(qū)域概率、助攻區(qū)位、調(diào)整攻區(qū)位等,軟件依靠收集的數(shù)據(jù)生成分析圖。借助于數(shù)據(jù)分析軟件,可以對各種扣球線路數(shù)據(jù)了如指掌,教練可以根據(jù)這個(gè)數(shù)據(jù)來安排換人,改變下一局的輪次打法。
目前,借助于該軟件可以進(jìn)行排球軌跡獲取和智能分析、排球扣球動(dòng)作生物力學(xué)分析、運(yùn)動(dòng)員彈跳力和下肢運(yùn)動(dòng)關(guān)聯(lián)分析、跳發(fā)球技術(shù)和移動(dòng)步法數(shù)據(jù)分析、運(yùn)動(dòng)員體能衰減數(shù)據(jù)分析、得失分影響因子分析、運(yùn)動(dòng)員之間的關(guān)聯(lián)關(guān)系分析、運(yùn)動(dòng)員和后備隊(duì)員功能特征等分析。袁靈犀作為中國女排數(shù)據(jù)分析師,不僅懂排球業(yè)務(wù),懂各種排球打法,還要懂?dāng)?shù)據(jù)分析,懂外語,懂電腦。畢竟,不懂業(yè)務(wù)就沒法讓數(shù)據(jù)分析軟件發(fā)揮最大功效。

視頻1-3 帶你認(rèn)識(shí)統(tǒng)計(jì)員家族
1.7 習(xí)題與實(shí)訓(xùn)
一、選擇題
1. 利用統(tǒng)計(jì)方法認(rèn)識(shí)研究對象包括的統(tǒng)計(jì)活動(dòng)有()。
A. 解釋數(shù)據(jù)
B. 收集數(shù)據(jù)
C. 分析數(shù)據(jù)
D. 整理數(shù)據(jù)
2. 屬于某一有序類別的非數(shù)值型數(shù)據(jù)是()。
A. 支付方式(現(xiàn)金、支票、刷卡)
B. 購物金額
C. 企業(yè)規(guī)模(大、中、小)
D. 年齡
3. 一個(gè)統(tǒng)計(jì)數(shù)據(jù)的構(gòu)成要素有()。
A. 名稱
B. 數(shù)值
C. 時(shí)間范圍
D. 計(jì)量單位
4. 在不同時(shí)間上收集到的數(shù)據(jù)是()。
A. 觀測數(shù)據(jù)
B. 實(shí)驗(yàn)數(shù)據(jù)
C. 截面數(shù)據(jù)
D. 時(shí)間序列數(shù)據(jù)
5. 描述總體的特征值稱為()。
A. 統(tǒng)計(jì)量
B. 變量
C. 參數(shù)
D. 變量值
6. 下列屬于離散型變量的是()。
A. 某企業(yè)職工總?cè)藬?shù)
B. 城鄉(xiāng)居民儲(chǔ)蓄存款余額
C. 職工的月收入
D. 全國城鎮(zhèn)居民家庭總戶數(shù)
二、思考題
1. 什么是統(tǒng)計(jì)學(xué)?舉出幾個(gè)統(tǒng)計(jì)應(yīng)用的例子。
2. 簡述統(tǒng)計(jì)工作的流程。
3. 統(tǒng)計(jì)數(shù)據(jù)可分為哪幾種類型?舉例說明各類數(shù)據(jù)的特點(diǎn)。
三、綜合應(yīng)用題
1. 判斷下列數(shù)據(jù)屬于分類數(shù)據(jù)、順序數(shù)據(jù)還是數(shù)值型數(shù)據(jù):品牌、職業(yè)、產(chǎn)品的滿意度(滿意、較滿意、一般、不太滿意、不滿意)、考試成績、市場占有率、流動(dòng)資金占用額、學(xué)歷、購物方式、月收入。
2. 某市的城市抽樣調(diào)查隊(duì)隨機(jī)抽取了1000戶居民作為固定樣本,記錄其每月的消費(fèi)支出情況,連續(xù)記錄了12個(gè)月,并對這100戶居民12個(gè)月的每月消費(fèi)總額及消費(fèi)構(gòu)成進(jìn)行了匯總和分析,以此估計(jì)該市居民的消費(fèi)支出情況。
(1)指出該調(diào)查的總體、樣本、個(gè)體;參數(shù)、統(tǒng)計(jì)量、變量。
(2)某戶居民每月支出額是分類變量、順序變量還是數(shù)值型變量?
(3)某戶居民每月食品支出額是離散型變量還是連續(xù)型變量?
(4)某月1 000戶居民的支出額和12個(gè)月1 000戶居民的平均支出額,哪個(gè)是時(shí)間序列數(shù)據(jù)?哪個(gè)是截面數(shù)據(jù)?
(5)上述數(shù)據(jù)是觀測數(shù)據(jù)還是實(shí)驗(yàn)數(shù)據(jù)?
3. 某校組織了一次學(xué)生消費(fèi)水平的調(diào)查。該校共有在校生5 000人,隨機(jī)調(diào)查了800人。
(1)指出該項(xiàng)調(diào)查的總體、總體單位、樣本、樣本單位。
(2)針對該項(xiàng)調(diào)查,設(shè)計(jì)調(diào)查內(nèi)容,并舉例說明什么是變量、統(tǒng)計(jì)量、參數(shù),什么是離散型變量和連續(xù)型變量。
- 汽車底盤機(jī)械系統(tǒng)構(gòu)造與檢修一體化教程
- 計(jì)算機(jī)應(yīng)用與數(shù)據(jù)分析+人工智能項(xiàng)目實(shí)踐教程
- 房地產(chǎn)政策與法規(guī)(第二版)
- 專業(yè)認(rèn)知與職業(yè)規(guī)劃(會(huì)計(jì)類)
- 高職英語應(yīng)用文寫作
- 邏輯學(xué)教程(第四版)
- 企業(yè)品牌管理案例
- 廣西中高職銜接的理論研究與實(shí)踐探索
- 城鎮(zhèn)燃?xì)饧夹g(shù)問答
- 旅游接待禮儀(第二版)
- Dreamweaver CS6網(wǎng)頁設(shè)計(jì)案例教程(微課版)
- 溝通技巧與團(tuán)隊(duì)協(xié)作(微課版)
- 公共關(guān)系理論與應(yīng)用
- 機(jī)械設(shè)計(jì)(上冊)
- 飯店服務(wù)心理學(xué)