官术网_书友最值得收藏!

2.1 統計數據分類

2.1.1 定性數據和定量數據

在統計學中,根據數據反映的測量水平,可把數據區分為名稱數據(定類數據)、順序數據(定序數據)、等距數據(定距數據)和比率數據(定比數據)四種類型。

(1)定類數據(Nominal):表示個體在屬性上的特征或類別上的不同變量,僅僅是一種標志,沒有序次關系。例如,“性別”,“男”編碼為1,“女”編碼為2。

(2)定序數據(Ordinal):用數字表示個體在某個有序狀態中所處的位置,不能做四則運算。例如,“受教育程度”,文盲半文盲=1,小學=2,初中=3,高中=4,大學=5,碩士研究生=6,博士及其以上=7。

(3)定距數據(Interval):具有間距特征的變量,有單位,沒有絕對零點,可以做加減運算,不能做乘除運算。例如,溫度。

(4)定比數據(Ratio):數據的最高級,既有測量單位,也有絕對零點,如職工人數、身高。

名稱變量不說明事物與事物之間的差異的大小和先后。順序變量可以就事物的大小多少按照次序對事物進行排列。等距變量具有相等的單位,能表明量的相對大小。它觀測數據的單位是相等的,但是零點是相對的。比率變量除了具有量的大小、相等單位,還有絕對零點。它的數據可以進行加減乘除運算。

通常在統計實踐中,統計數據簡單分為兩種基本類型:定性數據和定量數據。

定性數據是指非數值類別的數據(定性數據有時也稱為分類數據)。

定量數據代表一定的數量和尺度,它是有數值的。

例如,眼睛顏色屬于定性數據,因為眼睛顏色分為藍色、棕色、淡褐色等。又如,冰激凌的口味、雇員的姓名、動物的性別及電影和餐館的等級,如不好、一般、好、非常好。

定量數據,如運動員在比賽中跑步的時間、大學畢業生的收入,以及不同班級的學生人數等。

2.1.2 連續數據和離散數據

定量數據又可以進一步分為連續數據和離散數據。

連續數據是指數據能夠在一個給定的區間內取任何一個值,相鄰兩個數值可作無限分割,只能用測量或計量方法取得。

離散數據是指數據只能夠取自然數或整數單位,一般用計數方法取得。

連續數據,如一個人的體重可以是零到幾百克中的任何一個值,所以表示體重的數據是連續的。

離散數據,如班里同學的學號是離散的,因為學號必須是整數。鞋子的尺碼也是離散的數據,因為它只包含整數和半整數值。

2.1.3 橫截面數據和面板數據

橫截面數據是在同一時間,不同統計單位相同統計指標組成的數據列。橫截面數據是按照統計單位排列的。因此,橫截面數據不要求統計對象及其范圍相同,但要求統計的時間相同。也就是說,必須是同一時間截面上的數據。

面板數據是橫截面數據與時間序列數據綜合起來的一種數據類型。其有時間序列和橫截面兩個維度,當這類數據按兩個維度排列時,是排在一個平面上的,與只有一個維度的數據排在一條線上有著明顯的不同,整個表格像一個面板,所以把“Panel Data”譯作“面板數據”。

時間序列數據是指在不同時間點上收集到的數據,這類數據反映了某一事物、現象等隨時間的變化狀態或程度。

主站蜘蛛池模板: 林口县| 越西县| 得荣县| 且末县| 通渭县| 阳西县| 丰县| 疏附县| 察雅县| 凤城市| 钦州市| 瑞安市| 织金县| 垣曲县| 聊城市| 平南县| 阆中市| 石门县| 黎平县| 凌云县| 高密市| 威海市| 利辛县| 恩施市| 沁阳市| 土默特右旗| 宁乡县| 奉新县| 新巴尔虎右旗| 蕲春县| 武平县| 永康市| 南安市| 安图县| 正安县| 金坛市| 梁平县| 东阳市| 泸州市| 沽源县| 宁津县|