官术网_书友最值得收藏!

第3章 如何用簡單圖表展現(xiàn)數(shù)據(jù)

引導(dǎo)案例

在日常生活中大家多多少少都會使用數(shù)據(jù):在商務(wù)領(lǐng)域,每天的客戶數(shù)量和銷售額是最重要的數(shù)據(jù);對學(xué)生來說,考試成績的數(shù)據(jù)在升學(xué)問題上發(fā)揮重要作用;成年人會對每年的定期健康檢查中血壓和血液成分的數(shù)據(jù)很關(guān)心,生活中與數(shù)據(jù)沒有關(guān)系的人是不存在的。

但是,光是瀏覽原始數(shù)據(jù)(單純列舉的數(shù)字)恐怕什么也弄不明白。確實(shí),數(shù)據(jù)在一定意義上是體現(xiàn)“現(xiàn)實(shí)本身”的。但是,在“打眼一瞧什么也不明白”這一點(diǎn)上,“數(shù)據(jù)”也好,“現(xiàn)實(shí)”也罷,都有相同之處。比如,請瀏覽一下圖3-1。

圖3-1 80位女大學(xué)生身高(cm)數(shù)據(jù)

這是80位女大學(xué)生的身高數(shù)據(jù)(從石村貞夫的《話統(tǒng)計(jì)解析》中刊登的200個(gè)數(shù)據(jù)中抽取的最初80個(gè))。

從這80個(gè)數(shù)據(jù)中能得到什么?

首先能確認(rèn)“女大學(xué)生的身高各不相同,數(shù)據(jù)參差不齊”。

作為“日本成年女性”的一部分,這些女大學(xué)生的身高數(shù)值是多種多樣的。這種“多種多樣的數(shù)值”,用術(shù)語來說叫作“分布”。分布的產(chǎn)生,是決定數(shù)值背后的某種“不確定性”作用的結(jié)果,除此別無其他。不確定性的結(jié)構(gòu)會產(chǎn)生參差不齊的身高數(shù)值。但是即使概括地說這些數(shù)據(jù)是“不確定的”,它們也有自己固有的“特征”和“特點(diǎn)”。這種固有的特征和特點(diǎn)叫作“分布特性”。

那么,這些身高數(shù)據(jù)固有的特征和特點(diǎn)是什么?對于熟悉數(shù)據(jù)解析的人來說,即使從列舉的數(shù)值中也能抽取出很多的特征和特點(diǎn)。普通人則只能看到簡單的數(shù)字羅列。

所以,從這些原始數(shù)據(jù),也就是“原始的現(xiàn)實(shí)”中,抽取出分布的特征和特點(diǎn)的手法就很有必要。這就是統(tǒng)計(jì)的手法。

統(tǒng)計(jì)學(xué)使用的方法叫作“壓縮”。所謂壓縮,是指“將作為數(shù)據(jù)列舉的大量數(shù)字,以一定的基準(zhǔn)進(jìn)行整理,只抽取有意義的信息”。大致來說有如下兩種手法:

1)以圖畫捕捉其特征;

2)以一個(gè)數(shù)字來代表特征。其代表數(shù)字叫作“統(tǒng)計(jì)量”。

本章主要給大家介紹整理數(shù)據(jù)的手法。

主站蜘蛛池模板: 开化县| 醴陵市| 仙居县| 定边县| 平昌县| 丹江口市| 济源市| 界首市| 明光市| 苗栗市| 烟台市| 松溪县| 息烽县| 固阳县| 阆中市| 根河市| 福建省| 新和县| 鄂托克前旗| 定州市| 河池市| 大名县| 新蔡县| 惠州市| 甘孜县| 岫岩| 报价| 海阳市| 嘉禾县| 郸城县| 偃师市| 永川市| 偃师市| 岱山县| 文化| 七台河市| 望都县| 和平区| 海南省| 项城市| 兴义市|