- 統計學實務(第5版)
- 梁俊平
- 1172字
- 2020-06-19 14:10:24
2.1 統計數據分類
2.1.1 定性數據和定量數據
在統計學中,根據數據反映的測量水平,可把數據區分為名稱數據(定類數據)、順序數據(定序數據)、等距數據(定距數據)和比率數據(定比數據)四種類型。
(1)定類數據(Nominal):表示個體在屬性上的特征或類別上的不同變量,僅僅是一種標志,沒有序次關系。例如,“性別”,“男”編碼為1,“女”編碼為2。
(2)定序數據(Ordinal):用數字表示個體在某個有序狀態中所處的位置,不能做四則運算。例如,“受教育程度”,文盲半文盲=1,小學=2,初中=3,高中=4,大學=5,碩士研究生=6,博士及其以上=7。
(3)定距數據(Interval):具有間距特征的變量,有單位,沒有絕對零點,可以做加減運算,不能做乘除運算。例如,溫度。
(4)定比數據(Ratio):數據的最高級,既有測量單位,也有絕對零點,如職工人數、身高。
名稱變量不說明事物與事物之間的差異的大小和先后。順序變量可以就事物的大小多少按照次序對事物進行排列。等距變量具有相等的單位,能表明量的相對大小。它觀測數據的單位是相等的,但是零點是相對的。比率變量除了具有量的大小、相等單位,還有絕對零點。它的數據可以進行加減乘除運算。
通常在統計實踐中,統計數據簡單分為兩種基本類型:定性數據和定量數據。
定性數據是指非數值類別的數據(定性數據有時也稱為分類數據)。
定量數據代表一定的數量和尺度,它是有數值的。

例如,眼睛顏色屬于定性數據,因為眼睛顏色分為藍色、棕色、淡褐色等。又如,冰激凌的口味、雇員的姓名、動物的性別及電影和餐館的等級,如不好、一般、好、非常好。
定量數據,如運動員在比賽中跑步的時間、大學畢業生的收入,以及不同班級的學生人數等。
2.1.2 連續數據和離散數據
定量數據又可以進一步分為連續數據和離散數據。
連續數據是指數據能夠在一個給定的區間內取任何一個值,相鄰兩個數值可作無限分割,只能用測量或計量方法取得。
離散數據是指數據只能夠取自然數或整數單位,一般用計數方法取得。

連續數據,如一個人的體重可以是零到幾百克中的任何一個值,所以表示體重的數據是連續的。
離散數據,如班里同學的學號是離散的,因為學號必須是整數。鞋子的尺碼也是離散的數據,因為它只包含整數和半整數值。
2.1.3 橫截面數據和面板數據

橫截面數據是在同一時間,不同統計單位相同統計指標組成的數據列。橫截面數據是按照統計單位排列的。因此,橫截面數據不要求統計對象及其范圍相同,但要求統計的時間相同。也就是說,必須是同一時間截面上的數據。
面板數據是橫截面數據與時間序列數據綜合起來的一種數據類型。其有時間序列和橫截面兩個維度,當這類數據按兩個維度排列時,是排在一個平面上的,與只有一個維度的數據排在一條線上有著明顯的不同,整個表格像一個面板,所以把“Panel Data”譯作“面板數據”。
時間序列數據是指在不同時間點上收集到的數據,這類數據反映了某一事物、現象等隨時間的變化狀態或程度。