§2.3 統計表和統計圖
§2.3.1 統計表
(1)統計表的概念
把經過調查整理匯總計算而得到的統計數據按一定的結構和順序,系統地排列在一定的表格內,就形成了統計表。統計表是表現統計數據的基本工具。經過整理的統計數據用統計表的形式表現,較之于冗長的文字敘述更為醒目、清楚,便于數據的檢查核對和比較分析。
(2)統計表的構成
統計表從形式上看一般由總標題、橫行標題、縱列標題、數字資料等要素構成,必要時可以在表的下方加上表外附加。總標題是統計表的名稱,概括表的內容,置于表的正上方。橫行標題放在表內的左端,表示研究的對象。縱列標題放在表的右上端,也稱為指標名稱。統計表的結構如表2-7所示。
表2-7 2015年三次產業對國內生產總值增長的貢獻率和拉動 ←總標題

(3)統計表的種類
統計表的形式多種多樣,根據使用者的要求和數據本身的特點,可以設計出形式多樣的統計表。統計表按照分組情況不同,可分為簡單表、簡單分組表、復合分組表。對總體未經過任何分組,按總體單位排列的統計表稱為簡單表;對總體按一個標志分組的統計表稱為簡單分組表(如表2-7);對總體按兩個及以上標志進行層疊分組的統計表稱為復合分組表(如表2-8)。
表2-8 2015年國內、國外三種專利申請受理情況單位:件

資料來源:《中國統計年鑒2016》。
將不同時間的數據按照時間順序排列形成的統計表,就是時間序列表。利用時間序列表可以反映現象變動的趨勢和規律。
對于定類數據的描述和分析,通常需要用列聯表進行交叉分析。列聯表又稱為交叉表,它是由兩個以上的變量進行交叉分類的頻數分布表,可以同時用于匯總兩個變量的數據和檢驗兩個變量之間的關系的方法。例如表2-9是對某個地區200家飯店餐價和質量等級進行交叉分析編制的列聯表。表中的行是飯店的質量等級,是個定性變量,分為較好、好、很好;表中的列變量——餐價,是一定量變量。
表2-9是一個2×4列聯表,表中的每個數據都反映著來自飯店質量等級和餐價兩個方面的信息。列聯表提供了變量之間關系的內涵。從表2-9反映出餐價的高低與飯店的質量等級有聯系,質量等級越高的飯店,餐價越高。
表2-9 200家飯店的質量等級與餐價的列聯表

列聯表廣泛用于研究兩個變量間的關系。在兩個變量都是定性變量或兩個變量都是定量變量時,也可以編制列聯表對變量的關系進行分析。
(4)統計表的設計規則
由于使用者的目的及統計數據的特點不同,統計表在形式和結構上會有較大差異,但其設計的基本要求是一樣的,要便于使用者進行比較、分析及閱讀,“科學、實用、簡練、美觀”仍然是設計統計表的基本要求。設計統計表時一般應該注意以下規則:
①統計表的各種標題,確切地反映和概括出表的基本內容。特別是總標題的表達,力求簡明,總標題一般需要表明統計數據的時間(When)、地點(Where)以及何種數據(What),即標題內容應滿足3W要求。
②表中不要羅列太多和過于龐雜的內容,盡可能做到簡明扼要。
③要合理安排統計表的結構,表中的行和列各欄,一般應按先局部后整體的原則排列,即先列各個項目,后列總計。當沒有必要列出所有項目時,可以先列總計,而后列出其中一部分的項目。
④如果統計表的欄數較多,通常要加以編號,在橫行標題和計量單位等欄,用甲、乙、丙等文字標明;縱列標題各欄,用(1)、(2)、(3)等數字編號。
⑤表中數字應該填寫整齊,對準位數,同欄數字的單位、小數位要一致。若有相同數字應全部填列,不得寫“同上”字樣。當不應有數字時用“—”表示。
⑥統計表中必須注明數字資料的計量單位。當全表只有一種計量單位時,可以把它寫在表頭的右上方。如果表中需要分別注明不同單位時,橫行的計量單位可以專設一攔;縱攔的計量單位,要與縱標目寫在一起。
⑦必要時統計表應該加注說明或注解。例如,某些指標有特殊的計算口徑,某些資料只包括一部分地區,某些數字是由估算來插補等,都要加以說明,此外還要注明統計資料的來源,以便查考。說明或注解一般寫在表的下端,作為表外附加。
§2.3.2 統計圖
統計圖是直觀的表達統計數據的形式,它可以將復雜、枯燥的數據用形象生動的圖形表現出來,正確的繪制和使用好統計圖是統計分析的基礎。繪制這些圖形,除直方圖外,基本上都可以利用Excel的圖表功能來完成。在Excel工作表中,輸入數據后點擊“圖表向導”(或在“插入菜單”下點擊“圖表”),選擇所需的圖表類型,按所選圖表對話框中的提示操作,即可得到所需的統計圖。
(1)柱形圖
柱形圖是用寬度相同、高度或長短不同的條形來表示數據多少的圖形。柱形圖既可以用來表示定性數據的分布,也可以用來進行同類形象在不同空間、不同時間的對比。
柱形圖與直方圖不同。首先,直方圖是用面積表示各組頻數的多少,矩形的高度表示每一組的頻數或頻率,矩形的寬度則表示各組的組距,因此其高度和寬度都有意義;而柱形圖是用柱形的高度表示各類別頻數的多少,其寬度是固定的。其次,由于分組數據有連續性,直方圖的各矩形通常是連續排列的,而柱形圖則是分開排列的。最后,柱形圖主要用于分類數據的顯示,而直方圖用于展示分組數據。
柱形圖的類別較多,繪制時,各類別可以放在縱軸,稱為柱形圖,也可以放在橫軸上,稱為條形圖。如按表2-1中的資料繪制成的圖2-12,就是柱形圖。

圖2-12 2015年我國就業人數的產業分布
(2)餅圖
餅圖又稱圓形圖,整個餅圖面積代表所研究數據的整體,每一個扇形面積代表總體每個部分所占的百分比,主要用于表示各部分對于總體的比例,對結構性問題研究十分有用。
圖2-13是利用表2-2數據繪制的餅圖。

圖2-13 某地區居民對住房滿意度
(3)環形圖
環形圖與餅圖類似,主要用于反映現象的結構,但兩者又有區別。環形圖中間有一個“空洞”,總體中的每一部分數據用環中的一段表示。餅圖顯示一個總體各組成部分所占的比重,而環形圖可以在一個圖上顯示多個總體的結構,其中每一環是一個總體數據系列,這樣有利于我們比較不同總體的結構差異。圖2-14是根據表2-10中2015年我國東、西部地區居民平均每人消費支出結構繪制的環形圖,外環反映的是西部地區居民的消費結構,內環是反映東部地區居民的消費結構,利用這個環形圖便于直接比較兩個地區居民消費結構的差異。
表2-10 2015年東、西部地區居民人均消費支出

資料來源:《中國統計年鑒2016》

圖2-14 2015年我國東、西部居民人均消費支出構成
(4)線圖
線圖是在直角坐標上用折線表現數據變化的圖形,主要用于顯示時間序列數據,反映現象隨時間變化的特征。
圖2-15是根據全國城鄉居民家庭人均收入的數據繪制的線圖。從圖中可以觀察到,城鄉居民家庭人均收入呈逐年提高的趨勢,城鎮居民的家庭人均收入明顯高于農村,且差距越來越大。

圖2-15 全國城鄉居民家庭人均收入
(5)雷達圖
雷達圖也稱為蜘蛛圖,是顯示多個變量特征的多維圖。在顯示或對比各變量的數值總和時很有用。假定各變量的取值具有相同的正負號,總的絕對值與圖形所圍成的區域值成正比。利用雷達圖也可以研究多個總體之間的相似程度。圖2-16是根據表2-10的數據繪制的雷達圖。

圖2-16 2015年我國東西部地區居民人均消費支出構成
一張精心設計的統計圖形是展示數據的有效工具,可以準確地表達數據所要傳遞的信息。設計圖形時,應繪制得盡可能簡潔,以能夠清晰地顯示數據、合理地表達內容和目的。應避免一切不必要的修飾。圖形體現的視覺效果應與數據所體現的事物特征相一致,否則有可能歪曲數據,給人以錯誤的印象。
6.莖葉圖
直方圖展示了總體數據的主要分布特征,但它掩蓋了各組內數據的具體差異。為了彌補這一缺陷,對于未分組的原始數據則可以用莖葉圖來觀察其分布。莖葉圖由“莖”和“葉”兩部分構成,其圖形是由數字組成的。
①單組數據。
繪制莖葉圖的關鍵是設計好樹莖。制作莖葉圖時,首先把一個數字分成兩部分,通常是以該數據的高位數值作為“樹莖”,以次高位的數值作為“樹葉”。如136分成“13”和“6”,86分成“8”和“6”,前面部分是樹莖,后面部分是樹葉。
在畫莖葉圖時,先將莖依從小到大的次序寫在一條豎線的左邊,然后將每個數據的葉寫在豎線的右邊,并將它們按從小到大的次序排列,再給出葉的單位,這便構成了一張莖葉圖。圖2-17是根據例2-1的數據制作的莖葉圖。

圖2-17 某班學生統計學成績的莖葉圖
圖2-17的豎線左邊的數值稱為“莖”,豎線右邊的數值稱為“葉”。以第3行為例,豎線左邊的6表示該行所有數值的十位數都為6,個位數最小為0(成績為60分),最大為9(成績為69分),數據個數為15,即成績為六十幾分有15人。其余以此類推。
②兩組數據。
在要比較兩組樣本時,可畫出它們的背靠背的莖葉圖,這是一個簡單直觀而有效的對比方法。
【例2-2】某賽季甲、乙兩名籃球運動員每場比賽得分的原始記錄如下:
1)甲運動員得分:13,51,23,8,26,25,16,33,14,28,39,23
2)乙運動員得分:49,24,40,31,50,39,44,36,15,37,40,41
為對其進行對比,我們將這些數據放到一個背靠背的莖葉圖上(圖2-18)。

圖2-18 兩運動員得分的背靠背莖葉圖
在圖2-18中,樹莖放置中間,這里使用的是共同的莖,甲運動員的樹葉向左生長,乙運動員的樹葉向右生長。從莖葉圖可以看出,甲運動員的得分較為分散,而乙運動員的得分較為集中,乙運動員發揮較為穩定且其整體水平較高。
(3)莖葉圖的特征:
A.用莖葉圖表示數據有兩個優點:一是從統計圖上沒有原始數據信息的損失,所有數據信息都可以從莖葉圖中得到;二是莖葉圖中的數據可以隨時記錄,隨時添加,方便記錄與表示;
B.莖葉圖只便于表示兩位(或一位)有效數字的數據,對位數多的數據不太容易操作;而且莖葉圖只方便記錄兩組的數據,對兩組以上的數據雖然能夠記錄,但是沒有表示兩組記錄那么直觀,清晰;
C.莖葉圖對重復出現的數據要重復記錄,不能遺漏。