官术网_书友最值得收藏!

1.3 統計學中的基本術語

1.3.1 總體、個體與樣本

總體是在一定的研究目的下,所要研究事物的全體。它是由客觀存在的、具有某種共同性質的眾多個別事物構成的整體[10],總體規模用N表示。

構成總體的個別事物是個體或總體單位。個體是所要研究具體問題的承擔者。在統計調查中,常常稱總體為調查對象,稱個體為調查單位。

樣本[11]是從總體中抽取的一部分個體的集合,構成樣本的個體的數目稱為樣本容量,用n表示。一個樣本單位必定是一個總體單位;樣本是總體的代表,帶來了總體的信息,與總體有同質的數量特征;樣本具有隨機性,而研究目的一經確定,總體就是唯一的。從總體中隨機抽取一部分個體作為樣本,目的是要根據樣本提供的有關信息去推斷總體的特征。總體的規模N可以很大,甚至可以無窮大,樣本是總體的一個子集,其規模n小于或者大大小于總體規模N

比如,若要了解某校學生的學習情況,學習情況具體體現在學生身上,所以全校所有的學生是總體,每一個學生是個體,從全校所有的學生中隨機抽取400名學生就構成了一個樣本,通過400名學生的學習情況如平均成績、及格率等,可以推斷全校學生的學習情況。若要研究某市的工業生產情況,工業生產情況具體體現在工業企業中,該市每一個工業企業是個體,所有的工業企業是總體,從中抽取的若干個工業企業構成一個樣本,通過樣本工業企業的產值、利潤、上繳稅金、勞動生產率等,可以推算全市工業產值、利潤、上繳稅金、勞動生產率等。若要研究某市的工業生產設備情況,工業生產設備情況具體體現在設備上,所以每一臺工業生產設備是個體,該市所有的工業生產設備是總體,從中抽取的部分工業生產設備是樣本,通過這些設備的凈值、生產能力等,可以推算全市所有工業生產設備的凈值、生產能力等。

在這些例子中,了解“學習情況”“工業生產情況”“工業生產設備情況”是研究目的;學籍、進行工業生產、用于工業生產的設備分別是這些學生、工業企業、工業生產設備的“共同性質”;若干名學生、若干個工業企業、很多的工業生產設備分別是“眾多個別事物”。

總體具有以下特點:

(1)總體具有同質性。它是指構成總體的總體單位在某一方面性質是相同的。只有性質相同的人、單位、物等才能集合在一起,研究其數量表現和數量聯系才有意義。因此,同質性是構成總體的基礎。

(2)總體具有大量性。它是指構成總體的總體單位必須足夠多。總體單位是總體數量特征最原始的承擔者,總體的數量特征很多時候是無法直接觀測到的,只能通過對總體單位的數量特征進行觀測才能得到。而總體單位的數量特征可能各不相同,沒有規律可循,只有對大量總體單位的數量特征進行綜合,才能體現總體的數量特征。因此,大量性是構成總體的條件。

(3)總體具有差異性。它是指構成總體的總體單位在某一方面性質是相同的,而在其他方面都是不盡相同的。例如上邊的例子,如果每一個學生的學習情況都一樣,每一個工業企業的生產情況都一樣,每一臺工業生產設備的狀況都一樣,我們就無須總體了,只要了解一個學生、一個工業企業、一臺工業生產設備,就知道了所有學生的學習情況、所有工業企業的生產情況、所有工業生產設備的狀況。因此,差異性是構成總體的前提。

按構成總體的總體單位是否可以計量,總體可以分為有限總體和無限總體。構成一個總體的總體單位無論有多少,只要其數量是有限的,就是有限總體。例如全國人口普查,總體單位多達十幾億人,但它是有限的,是有限總體。構成一個總體的總體單位若是不可數的,即為無限總體。如果沒有時間界限,可以把連續生產線的產品產量視為無限總體。絕大多數社會經濟現象是有限總體,而在推斷統計中,總體是隨機變量,也是無限總體。

1.3.2 標志、指標與變量

1.標志

標志是說明總體單位特征的概念,所以也稱為單位標志或單位標識。在統計調查中稱為調查項目或登記項目。總體單位具有很多特征,在人口調查中,說明每一個人特征的標志有性別、籍貫、文化程度、婚姻狀況等;在工業生產調查中,說明每一個工業企業特征的標志有所有制類別、職工人數、固定資產數量、產量、利潤額等。

標志的具體表現稱為標志值。例如人口調查中,性別這個標志具體可以表現為男或者女,年齡這個標志具體可以表現為1歲、36歲、88歲等。這里“男”“女”“1歲”“36歲”“88歲”等是標志值。

根據標志的具體表現不同,標志可以分為品質標志和數量標志。若一個標志的具體表現只能用文字表示,不能用數字表示,則這個標志為品質標志,品質標志表明總體單位的屬性。例如,性別表現為男或女,籍貫表現為北京、上海、成都等,婚姻狀況表現為未婚或已婚,所有制類別表現為國有經濟、集體經濟、股份制經濟等。所以,性別、籍貫、婚姻狀況、所有制類別等是品質標志。就所研究的問題,有的品質標志只有“是”或者“非”兩種表現,則稱其為是非標志。例如產品合格與否,每一件產品要么合格,要么不合格;家庭是否有電腦,每一個家庭要么有電腦,要么沒有電腦等。產品合格與否、家庭是否有電腦就是是非標志。

若一個標志的具體表現可以取不同的數字,則這個標志為數量標志,數量標志表明總體單位的數量特征。例如年齡可以是1歲、36歲、88歲等,職工人數可以是5253人、10234人、103人等,固定資產可以是9877萬元、15789萬元、78萬元等,利潤總額可以是461萬元、19.809億元、122萬元等。所以,年齡、職工人數、固定資產、利潤總額等是數量標志。

2.統計指標與指標體系

統計指標簡稱為指標,是反映總體數量特征的概念或概念與具體數值。例如,人口總數、國內生產總值、增長速度、增加值、社會消費品零售總額等是統計指標;名稱加數值也是統計指標,例如2022年“年末全國人口141175萬人,比上年末減少85萬人”;“初步核算,全年國內生產總值1210207億元,比上年增長3.0%。其中,第一產業增加值88345億元,比上年增長4.1%;第二產業增加值483164億元,增長3.8%;第三產業增加值638698億元,增長2.3%”;“全年糧食產量68653萬噸,比上年增加368萬噸,增產0.5%”;“全年社會消費品零售總額439733億元,比上年下降0.2%”;全年實物商品網上零售額119642億元,按可比口徑計算,比上年增長6.2%,占社會消費品零售總額的比重為27.2%。這些名稱加數值也是反映我國國情國力的一些統計指標。

統計指標包括指標名稱、指標數值、計量單位三個要素。指標名稱是現象數量特征的內涵和外延,反映指標的經濟含義、時間范圍和空間范圍。指標數值是現象數量的規模大小、水平高低、相對程度等。計量單位是現象數量的衡量尺度。

按表現形式,統計指標可以分為總量指標、相對指標和平均指標;按反映現象的數量特點,統計指標可以分為數量指標和質量指標,數量指標是反映現象總規模、總水平或總數的指標,質量指標是反映現象相對水平或工作質量的指標。統計指標的兩種分類的關系如下:

社會經濟現象是復雜的、多種多樣的,其數量表現和數量關系不是一兩個指標就能夠反映的,因為單個指標的作用是有限的,一個統計指標只能反映總體某一方面的數量特征,要能全面反映總體的數量特征,就需要若干個既相對獨立又相互聯系的統計指標。若干個有聯系的統計指標構成的有機整體就是統計指標體系。

統計指標體系分為基本統計指標體系和專題統計指標體系兩大類。基本統計指標體系反映經濟和社會發展基本情況,比如,一個國家的人口總數、國土面積、國內生產總值等;專題統計指標體系反映某一經濟或社會現象的情況,比如,為了反映全國或地區的經濟效益而設置的國民經濟效益指標體系,為了反映全國或地區的固定資產投資分布、利用和效益而設置的固定資產投資指標體系等。

指標與標志有密切的聯系,指標數值總是匯總標志值或總體單位得到的,比如,把各個工業企業的增加值和企業個數匯總就得到反映工業企業生產情況的重要指標——工業增加值和工業企業總數。但是,與標志有可以用數量表示的數量標志與不可以用數量表示的品質標志之分不同,任何統計指標都可以用數量表示,也就是說統計指標都是可量的,而標志未必都是可量的。品質標志的表現不是數值,只有對品質標志的具體表現所對應的單位進行匯總,才是指標。例如,性別的具體表現為男或女,按性別進行匯總得到男性人數、女性人數,性別比例、男性人數占全部人數的比重等才是指標。

3.變量

統計中,稱說明現象某種數量特征的概念為變量。按照這個定義,指標名稱和標志都是變量,如國內生產總值、工資總額、學生人數、性別可以取不同的值或不同的表現,它們就是變量。

變量的具體表現是變量值,即統計數據,如國內生產總值744127億元、工資總額3000萬元、學生人數21000人、性別男等。

變量可以分成定性變量和定量變量兩類。

定性變量是具體表現為文字的變量,只能以類別分開,所以也稱為分類變量、屬性變量。例如,“性別”的具體表現是“男”“女”;“滿意度”的具體表現是“非常滿意”“滿意”“基本滿意”“不滿意”“非常不滿意”等。對于定性變量,通常關注的是每一個類別的數量和所占比例。

定量變量是可以取具體數值的變量,所以也稱為數值變量。例如,“成績”可以是60分、75分、92分等;“國內生產總值”分別為1143669.7億元、1210207億元等。數值變量有離散變量和連續變量之分。

離散變量是可以一一列舉的量,其取值都是整數,如“機構數”“學生人數”“設備臺數”等。離散變量一般通過計數得到。

連續變量是不能一一列舉的量,任意兩個變量值之間都有無窮多個變量值,如“重量”“長度”“零件尺寸誤差”等。連續變量一般通過測量得到。

1.3.3 統計數據的分類和計量尺度

統計數據是對客觀現象進行計量的結果。任何現象都有其屬性或數量表現,現象之間都有內在的關系,這些屬性或數量表現及內在關系的表現,就是統計數據。

1.統計數據的分類

按是否可以直接用數字表示,統計數據可以分為定性數據和定量數據。品質標志的具體表現是定性數據,反映現象的類別和等級。數量標志的具體表現和統計指標數字是定量數據,反映現象的規模、水平、相對程度等。

按是否經過加工處理,統計數據有原始數據和綜合數據之分。原始數據產生于統計調查階段,主要是說明總體單位特征的數據,比如,性別男、女,月工資為3860元、6410元等;綜合數據則是經過統計整理后形成的,用以說明總體特征的數據,即統計指標數字,如2022年我國國內生產總值1210207億元。按時間狀況,統計數據可以分為截面數據和時序數據。截面數據也稱為靜態數據,是同一時間點或時間段的數據,如全國2022年國內生產總值、年末的人口等;時序數據也稱為動態數據、時間序列,是不同時間點或時間段的數據序列,如我國歷年的國內生產總值、歷年年末的人口等。

2.統計數據的計量尺度

(1)定類尺度(類別尺度)。

定類尺度是按某種屬性對現象進行平行分組。分組后所形成的數據,稱為定類數據、類別數據或列名數據。比如按性別把總體分成男和女兩類;按企業登記注冊類型,把企業分為內資企業、港澳臺商投資企業和外商投資企業三大類。“男”“女”“內資企業”“港澳臺商投資企業”和“外商投資企業”就是定類數據。為了便于計算機處理,人們可以用0、1、2或A、B、C代表這些數據,但是它們只是數據的代碼,彼此之間沒有數量上的關系和差異。

定類數據沒有優劣、大小、順序之分,誰排前、誰排后,對統計研究沒有實質性影響。定類數據只能區分事物的同類或不同類,所以其數學特性是“等于(=)”和“不等于(≠)”,其計算功能是能夠計算每一個類別的次數和比重、眾數和異眾比,進行列聯表分析和χ2檢驗等。

(2)定序尺度(順序尺度)。

定序尺度是按現象的某種屬性對現象進行有等級差異或順序差異分組。分組后形成的數據稱為定序數據、順序數據。比如按“滿意度”把總體分成“非常滿意”“滿意”“基本滿意”“不滿意”“非常不滿意”五類。“非常滿意”“滿意”“基本滿意”“不滿意”“非常不滿意”就是定序數據。定序數據也可以用1、2、3或A、B、C等表示,但也僅僅是它們的代碼而已。

顯然,“非常滿意”好于“滿意”“滿意”好于“基本滿意”等,它們不是平行的,是有序的。定序數據不僅可以區分事物的同類或不同類,還可以區分事物的好壞,所以其數學特性除了“等于”和“不等于”外,還有“大于”和“小于”。但是它不能具體測定類別之間的差異,不能具體說一個類別大于或小于另一個類別多少,除了包含定類數據的功能外,其還可以計算中位數、分位數、等級相關等,但是不能進行加、減、乘、除運算。

定類尺度和定序尺度在對現象總體分類時,必須符合窮盡和互斥的原則,即在分類時必須包括總體的所有個體,使每一個個體或單位都能歸入其中一類,而且只能歸入一類,不能遺漏、不能重復。

(3)定距尺度(間隔尺度、區間尺度)。

定距尺度是對現象類別或順序之間的間距進行的測度。這樣得到的數據稱為定距數據、區間數據、間隔數據。定距數據之間的差是固定不變的,并且沒有一個通常的零點,定距數據之間的比值是沒有意義的。比如,如表1-1所示的美國女裝的標準尺碼就是定距數據。女裝尺寸每增加2英寸[12],尺碼就大一號,但是,絕對不能說16號女裝是8號女裝的兩倍大。又如溫度也是間隔數據,10℃比8℃高2℃、20℃比18℃高2℃,高出的溫度一樣,但是,20℃的天氣絕不是比10℃的天氣熱一倍,0℃是溫度的一種狀況,絕不代表溫度不存在。

表1-1 美國女裝的標準尺碼(單位:英寸)

資料來源:林德,馬歇爾,沃森.商務與經濟統計方法:全球數據集:英文版·原書第13版[M].馮燕奇,葉光,聶巧平,譯.北京:機械工業出版社,2009.

(4)定比尺度。

定比尺度是對現象進行觀測計數或計算,這樣得到的數據是定比數據。定比數據是對事物精確的度量,有真正的零值。比如,兩人某門課考試成績均為90分,意味著兩人考試成績沒有差別;成績95分比80分高15分;體重為60千克的人比體重為30千克的人重1倍。定比數據除了具有定類數據、定序數據和定距數據的全部計算功能外,還具有加、減、乘、除運算功能,比如可以匯總,可以計算各種特征值、相對數以及進行更多的定量分析。比如,某校學生人數21000人,等于各個專業學生人數之和;2022年末,廣義貨幣供應量(M2)余額266.4萬億元,同比增長11.8%;人民幣各項存款余額258.5萬億元,比上年末增加26.3萬億元;人民幣各項貸款余額214.0萬億元,比上年末增加21.3萬億元。

按計量尺度所分的上述四類數據是有層次的,后一層次的數據包含了前一層次的全部信息內容,能夠轉換為前一層次的數據,但反之則不然,即定比數據包含了定類數據、定序數據和定距數據的全部信息內容,也可以轉換成定類數據、定序數據和定距數據;定序數據包含了定類數據的全部信息內容,可以轉換成定類數據,但是不能轉換成定距數據、定比數據,定距數據不能轉換成定比數據。定距尺度和定比尺度得到的數據都是定量數據。定距數據只能計算差距,不能計算比率;定比尺度是最高級的計量層次,具有加、減、乘、除的運算功能[13]。圖1-2是四個計量尺度的特征。

圖1-2 四個計量尺度的特征

主站蜘蛛池模板: 林芝县| 昌图县| 马尔康县| 平乐县| 长沙县| 和田市| 区。| 福清市| 射洪县| 喀什市| 襄汾县| 长春市| 潜江市| 上思县| 罗甸县| 泰来县| 曲沃县| 黑龙江省| 民县| 靖安县| 济宁市| 湾仔区| 宜宾市| 会昌县| 宣武区| 岳普湖县| 吴堡县| 津市市| 赤峰市| 泽普县| 平度市| 大庆市| 永登县| 射阳县| 石楼县| 白河县| 青铜峡市| 千阳县| 绍兴县| 赤水市| 玛多县|