官术网_书友最值得收藏!

第3章 如何用簡單圖表展現(xiàn)數(shù)據(jù)

引導(dǎo)案例

在日常生活中大家多多少少都會使用數(shù)據(jù):在商務(wù)領(lǐng)域,每天的客戶數(shù)量和銷售額是最重要的數(shù)據(jù);對學(xué)生來說,考試成績的數(shù)據(jù)在升學(xué)問題上發(fā)揮重要作用;成年人會對每年的定期健康檢查中血壓和血液成分的數(shù)據(jù)很關(guān)心,生活中與數(shù)據(jù)沒有關(guān)系的人是不存在的。

但是,光是瀏覽原始數(shù)據(jù)(單純列舉的數(shù)字)恐怕什么也弄不明白。確實,數(shù)據(jù)在一定意義上是體現(xiàn)“現(xiàn)實本身”的。但是,在“打眼一瞧什么也不明白”這一點上,“數(shù)據(jù)”也好,“現(xiàn)實”也罷,都有相同之處。比如,請瀏覽一下圖3-1。

圖3-1 80位女大學(xué)生身高(cm)數(shù)據(jù)

這是80位女大學(xué)生的身高數(shù)據(jù)(從石村貞夫的《話統(tǒng)計解析》中刊登的200個數(shù)據(jù)中抽取的最初80個)。

從這80個數(shù)據(jù)中能得到什么?

首先能確認“女大學(xué)生的身高各不相同,數(shù)據(jù)參差不齊”。

作為“日本成年女性”的一部分,這些女大學(xué)生的身高數(shù)值是多種多樣的。這種“多種多樣的數(shù)值”,用術(shù)語來說叫作“分布”。分布的產(chǎn)生,是決定數(shù)值背后的某種“不確定性”作用的結(jié)果,除此別無其他。不確定性的結(jié)構(gòu)會產(chǎn)生參差不齊的身高數(shù)值。但是即使概括地說這些數(shù)據(jù)是“不確定的”,它們也有自己固有的“特征”和“特點”。這種固有的特征和特點叫作“分布特性”。

那么,這些身高數(shù)據(jù)固有的特征和特點是什么?對于熟悉數(shù)據(jù)解析的人來說,即使從列舉的數(shù)值中也能抽取出很多的特征和特點。普通人則只能看到簡單的數(shù)字羅列。

所以,從這些原始數(shù)據(jù),也就是“原始的現(xiàn)實”中,抽取出分布的特征和特點的手法就很有必要。這就是統(tǒng)計的手法。

統(tǒng)計學(xué)使用的方法叫作“壓縮”。所謂壓縮,是指“將作為數(shù)據(jù)列舉的大量數(shù)字,以一定的基準(zhǔn)進行整理,只抽取有意義的信息”。大致來說有如下兩種手法:

1)以圖畫捕捉其特征;

2)以一個數(shù)字來代表特征。其代表數(shù)字叫作“統(tǒng)計量”。

本章主要給大家介紹整理數(shù)據(jù)的手法。

主站蜘蛛池模板: 咸丰县| 麦盖提县| 湛江市| 大同市| 黄骅市| 塘沽区| 麦盖提县| 大石桥市| 革吉县| 安岳县| 扎赉特旗| 互助| 聂拉木县| 白城市| 合作市| 新乡县| 万山特区| 东港市| 章丘市| 泽库县| 富蕴县| 宝山区| 博罗县| 班玛县| 开远市| 旬邑县| 澎湖县| 钦州市| 渭南市| 金平| 伊金霍洛旗| 大庆市| 商水县| 铜山县| 普陀区| 乃东县| 河南省| 原阳县| 赤城县| 大同县| 枣阳市|