- 統計學:實驗與習題指導(第四版)
- 張宏亮 王鵬主編
- 9412字
- 2025-06-30 09:58:50
實驗一 數據的搜集與整理
一、實驗目的及要求
(一)實驗目的
培養學生處理數據的基本能力。通過本實驗,學生應開始了解Microsoft Excel的操作界面,在有效搜集數據資源的基礎上,利用軟件完成數據的輸入、導入、保存、編碼、分類(組)、篩選、排序等數據整理工作。
(二)實驗要求
(1)熟悉Microsoft Excel的基本操作界面。
(2)熟悉間接數據的搜集方法、搜集途徑,能熟練通過網絡搜集間接數據。
(3)了解直接數據的搜集。
(4)掌握不同類型的數據的處理方法,尤其是注意Microsoft Excel在數據輸入、導入等方面的區別,掌握數據文件的建立和保存方法。
(5)掌握數據的編碼、分類(組)、篩選、排序等整理操作的方法。
二、數據的搜集
在生產生活中,很多時候我們都需要搜集數據,例如,市場營銷團隊需要評估營銷方案;藥物制造商需要確定一種新藥是否比現在用的藥物療效更好;老師想要了解學生學習某門課程的情況;國家想要了解當前的人口數量及結構狀況等。一般而言,搜集總體中每個事物的數據是比較困難的,耗時耗力。所以,一般我們都是從樣本中搜集數據的。
依據研究目的搜集數據是統計工作的第一步,而確定數據最合適的來源又是搜集數據工作的第一步。這是非常重要的一步,因為如果搜集的數據有偏差、模糊不清或有其他的錯誤時,即使使用最復雜的統計方法,也無法得出有用的信息。統計數據主要源于兩種渠道:一種是源于別人的調查或實驗數據,稱為間接數據或二手數據;另一種是源于科學實驗、觀察研究或者直接調查的數據,稱為直接數據或一手數據。
(一)間接數據的搜集
間接統計數據主要是公開出版或報道的數據,可以通過年鑒、期刊、報紙、廣播、電視等途徑搜集獲取。在網絡廣泛普及的今天,通過網絡搜集間接數據已經成為一種主流手段。一般來說,在網絡上搜集數據可以采用兩種方式。
第一種方式是直接進入專業數據庫網站查詢數據。比如,要搜集中國2020年國家社會經濟數據,你可以進入網址http://www.stats.gov.cn,點擊首頁的“數據”,如圖1-1-2所示。

圖1-1-2 中國國家統計局官網主頁
進入統計數據頁面,選擇數據查詢下的“年度數據”,如圖1-1-3所示。

圖1-1-3 中國國家統計局-年度數據查詢
進入年度數據查詢頁面,就可通過頂部的搜索欄或者左側的導航欄,搜索、查詢并下載2020年中國國家統計年鑒中相應的社會經濟統計數據了,如圖1-1-4所示。

圖1-1-4 中國國家統計局-年度數據獲取
表1-1-1列出了常見的獲取統計數據的專業數據庫網站。
表1-1-1 常見的統計數據網站

第二種通過網絡獲取二手數據的方式是使用搜索引擎。比如,我們可以使用百度網站,搜索中國2020年國家社會經濟數據。在瀏覽器地址欄中輸入www.baidu.com,敲擊回車鍵進入百度搜索引擎,在搜索框中輸入“中國2020年經濟數據”,如圖1-1-5所示。

圖1-1-5 百度搜索引擎
單擊“百度一下”按鈕,獲得搜索結果如圖1-1-6所示,可以在搜索顯示出的結果中,選擇鏈接進入查看是否符合自己的搜索目標。

圖1-1-6 百度搜索結果
大家看到搜索引擎的結果會指向第一種方法中的專業數據庫網站。但是除此以外,它還會返回很多相關的結果。對于間接數據的搜集,如果目標明確并且能夠找到對應專業數據庫網站的,就沒有必要使用搜索引擎,因為它可能給你提供一些無法判別其真實可靠性的結果。當然,如果目標并不明確,或者專業的數據庫網站沒有直接提供的,你不妨利用搜索引擎去搜索別人類似的研究的二手數據成果,再通過其他手段去確認其真實可靠性。
(二)直接數據的搜集
直接統計數據可以通過兩種途徑獲得:一是科學試驗;二是專門組織的統計調查。科學試驗是在所設定的特殊試驗場所、特殊狀態下,對調查對象進行試驗以取得所需資料。進行合適的試驗設計是一門課程,本教材就不過多地涉及這方面的分析。專門組織的統計調查是根據統計研究的目的和任務,采取科學的調查方法,有組織、有計劃地向客觀實際搜集各種統計資料的活動過程,主要包括普查、重點調查、典型調查、抽樣調查、統計報表等調查方式。本實驗主要介紹抽樣調查取得直接數據的方法。
抽樣調查的步驟如圖1-1-7所示:

圖1-1-7 抽樣調查的步驟
比如,可以按照如下步驟設計調查大學生生活費收支情況:
步驟一:調查方案設計


步驟二:問卷設計
在明確調查目的后,應該思考數據搜集的方法,確定問題的回答方式和問題的用詞方式,使得問卷易于回答且不會產生歧義。完成初步問卷的設計和編排后,可以征詢相關方面的意見,通過小范圍測試或反復修訂,得到最終的問卷,用于實施發放。

步驟三:問卷的發放與收回
本次調查采取分層抽樣,對在校本科生各個年級男、女生各發放問卷30份左右;共發放問卷××份,回收問卷××份,其中有效問卷××份。各年級男、女生回收有效問卷具體情況如下:

三、數據的整理
在獲得了直接或間接的數據以后,我們應該對數據進行初步處理,方便對它們進行進一步分析。一般數據初步處理包括了編碼、錄入、篩選、排序以及保存數據文件等工作。
當然,這一切都需要與Microsoft Excel軟件結合來實現。那么我們有必要來簡單了解一下Microsoft Excel的操作界面,如圖1-1-8所示。

圖1-1-8 Microsoft Excel的操作界面
當運用Microsoft Excel的時候,你實際是將所搜集到的數據放置在工作表中。工作表就像書頁一樣,可以用鼠標左鍵點擊工作表標簽來切換。工作表中包含的網格線將以字母為標題的列和以數字為標題的行分割成單個的單元格,而每一個單元格就是以自己所在的列字母和行數字共同來表示的。比如第二列第一行的單元格稱為單元格B1,第五列第三行的單元格稱為單元格E3等。當單元格被選中激活時,其名稱會顯示在地址名框中。
直接使用列字母和行數字標示單元格叫相對地址標示,在公式中使用相對地址引用,公式復制過程中引用地址(值)隨位置而變。比如在C1單元格中輸入“=A1”,直接復制C1到C2粘貼,C2單元格中的公式將自動地變成“=A2”,如果復制到D1,公式變為“B1”,相對引用在公式復制中“橫向復制變列號,縱向復制變行號”。列字母和行數字前都加上“$”符號標示單元格叫絕對地址標示,在公式中使用絕對地址引用,公式復制過程中引用地址(值)保持不變。比如C1單元格中輸入“=$A$1”,其后復制C1到任何單元格,該單元格的公式都是“=$A$1”。
在單元格中,既可以輸入單個值,又可以輸入與其他單元格相關的表達式,但前提是你必須激活這個單元格。激活單元格的方法很簡單,用鼠標左鍵在要激活的單元格上單擊一次就可以了。此時被激活的單元格會顯示深色的邊框,與其他單元格區分開來。除了單個單元格的使用,你也可以選中一個以上的單元格。如果你想表示一組單元格,而這組單元格形成一個連續的矩形區域,可以用以冒號連接的最左上角單元格與最右下角單元格作為單元格區域。比如,單元格區域A1:B5表示工作表前五行前兩列的區域。Microsoft Excel中也會顯示諸如A:A或3:3這樣的區域,表示第一列或第三行的所有單元格。
(一)數據編碼
數據編碼是指把需要加工處理的數據庫信息,用特定的數字來表示的一種技術,是根據一定數據結構和目標的定性特征,將數據轉換為代碼或編碼字符,在數據傳輸中表示數據組成,并作為傳送、接收和處理的一組規則和約定。由于計算機要處理的數據信息十分龐雜,有些數據庫所代表的含義又使人難以記憶。為了便于使用,容易記憶,常常要對加工處理的對象進行編碼,用一個編碼符號代表一條信息或一串數據。對數據進行編碼在計算機的管理中非常重要,可以方便地進行信息分類、校核、合計、檢索等操作。因此,數據編碼就成為計算機處理的關鍵。不同的信息記錄應當采用不同的編碼,一個碼點可以代表一條信息記錄。人們可以利用編碼來識別每一個記錄,區別處理方法,進行分類和校核,從而克服項目參差不齊的缺點,節省存儲空間,提高處理效率。
其實我們在前面的工作中已經接觸過編碼。在我們設計的那個抽樣調查獲取直接數據的方案中,那些封閉式的問題給出了諸如A、B等選項答案,就相當于對答案進行了編碼,將來我們可以直接在Microsoft Excel工作表的單元格中錄入A、B等字樣來代替具體的選項內容,這樣只要在旁邊附注編碼的對應指代內容,就能讓使用數據的人明確數據所代表的含義了。
對于開放式的問題,在設計問題的時候沒有預先編碼,就必須在數據搜集完成以后,依據數據的特征進行歸類,而后再進行編碼分類。比如,我們設計一個調查消費者消費某種飲料的原因的問題,讓受調查者接受開放式的問答,有可能得到以下的結果:
(1)因為它口味比較好;
(2)它具有最好的味道;
(3)我喜歡它的口味;
(4)我不喜歡其他同類飲料太重的口味;
(5)它便宜;
(6)它總做打折活動;
(7)它不像其他飲料那樣令我的胃不舒服;
(8)我總是選擇這個牌子的飲料;
(9)我已經喝了好多年了;
(10)我周圍的朋友都喝它;
(11)我妻子幫我買的;
(12)我家人喜歡喝它;
(13)我沒想過;
(14)不知道;
(15)沒什么特別原因。
如果你老老實實地把這些結果錄入到Microsoft Excel工作表中,軟件會認為它們是十五種不同的原因,因為它們無論從文字上還是從字數上都不盡相同。顯然,這并不是我們想看到的結果,因為我們知道其中有些回答雖然表述不同,但是它代表了一個含義,為此我們要進行編碼,使軟件也能了解哪幾個回答應在同一編碼下代表同一個含義。在這個例子中我們可以構建編碼(如表1-1-2所示),將來在軟件錄入中用新的編碼符號來代替含義一致的回答結果,比如有人回答“我覺得它比某某味道好”就可以用編碼符號1來錄入反映。
表1-1-2 開放式問題的編碼表(例)

數據的編碼應具有系統性、標準性、實用性、擴充性和效率性的特點。比較起來,封閉式問題事先設計、預先編碼的方式,讓上述這幾個特點表現得更為突出明確。但在實際操作的時候,我們切不可一味地去強求封閉式問題的設計,而要從回答問題的一方去考慮。比如,我們想要了解一家工廠班組長希望加強的培訓內容,如果設計封閉式的問題,我們可能要窮舉班組長工作要涉及的兩百多個答案。顯然,對于那些回答的班組長而言,光這兩百多個答案可能都會看花了眼。所以我們可以給重要的問題設置明確的選項,讓班組長對其余的問題給出開放式回答就可以了。
(二)數據的錄入
數據的錄入是將搜集到的數據直接輸入到Microsoft Excel工作表中。數據錄入既要講求效率,又要保證質量。Microsoft Excel的數據錄入操作比較簡單,一般只要在工作表中單擊激活一個單元格就可以錄入數據了。單元格的切換可以使用鼠標,也可以在激活一個單元格以后用回車Enter(或者制表符Tab)鍵,向下(或者向右)切換單元格。在單元格內部的換行可以使用“Alt+Enter”組合鍵。
當然,數據錄入中最重要的還是要保證數據形式完整和性質正確。這就需要通過“設置單元格格式”來實現。比如想錄入十八位身份證號碼522601197902130800,如果直接激活單元格將這十八位數輸入其中,回車或激活其他單元格時,原來的十八位數字就會顯示成“5.22601E+17”,原因是Microsoft Excel將這十八位數默認是數值型變量并且使用了科學計數法顯示。這顯然不利于使用者去查閱身份證號碼。此時,可以激活數字所在單元格,在“格式”菜單下找到“單元格卡片集”,然后點擊其中的“格式下拉框”箭頭,選中“設置單元格格式”打開對話框,選中“數字”卡片,在分類中選中“文本”,單擊“確定”后再用鼠標雙擊數字所在單元格就能以文本的方式展示出十八位身份證號碼了,如圖1-1-9所示。(熟悉快捷鍵的同學也可以在激活單元格后,使用Ctrl+1組合鍵打開設置單元格格式對話框。)
對于錄入重復數據或使用二手數據時,大家一般都習慣使用復制功能(Ctrl+C),但是Microsoft Excel在簡單復制數據時不一定能保證格式的完整性。比如,在某個Microsoft Excel工作簿文件中,我們使用公式“=sum(A1:A6)”計算出第一列前六行數據之和,然后我們將這個求和結果簡單地復制→粘貼到另一個Microsoft Excel工作簿文件中,結果將不再是原來計算出來的和值。原因是因為公式只認單元格,在第一個工作簿文件中A1到A6的數值并不一定就是第二個文件中A1到A6的數值,再加上公式里使用了相對單元格地址,那粘貼的位置也會對結果造成影響。這個時候,就需要單擊鼠標右鍵,使用“選擇性粘貼”菜單,通過設置來實現復制的格式要求。比如對于我們的例子中的數據就該使用選擇性粘貼對話框中的粘貼“數值”單選框來實現,如圖1-1-10所示。

圖1-1-9 設置單元格格式

圖1-1-10 選擇性粘貼
數據的格式既可以事先選中單元格設置,又可以輸入以后調整。對于未輸入(或未確定格式)的數據,想要實現和已經輸入的數據相同的格式要求,可以使用工具欄中的“格式刷”工具按鈕。比如A2單元格有已經設置好格式的數據,B3單元格的數據想和A2單元格統一,可以激活A2單元格,點擊格式刷,再點擊B3單元格就可以了。
(三)數據的導入
有的時候,我們搜集到的二手數據是別人已經做好的數據庫文件,唯一令人不滿意的是,他們并沒有把數據庫文件保存成為Excel工作簿文件的形式。Microsoft Excel提供了導入數據文件的功能。數據文件的導入是將別的軟件形成的數據或數據庫文件轉換到Excel工作表中。這樣,大家就不必要掌握那么多紛繁復雜的軟件,以此提高工作效率,也方便協同處理數據。
Microsoft Excel支持文本文件、Office數據庫文件、網頁文件、Dbase文件、Paradox文件、Xml文件等多種外部數據源的導入。導入的方法有兩種,一是使用“文件-打開”菜單,二是使用“數據-獲取外部數據”菜單,兩者都是打開導入向導,按向導一步步完成對數據文件的導入。
使用“文件-打開”菜單,進入“打開”對話框,在文件類型下拉框中選中所有文件(如圖1-1-11所示),然后找到你想要打開的數據庫文件所在位置,雙擊鼠標左鍵或單擊“打開”按鈕,就可以進入導入向導。

圖1-1-11 “打開”對話框
使用“數據-獲取外部數據”菜單,可以直接在下拉框中選擇需要導入的外部文件類型(如圖1-1-12所示),然后在對話框中瀏覽找到你想要打開的數據庫文件所在位置,雙擊鼠標左鍵或單擊“打開”按鈕,就可以進入導入向導。

圖1-1-12 “獲取外部數據”對話框
接下來,我們用一個導入數據庫文件的例子來介紹導入向導。比如,一個已經存在的文本文件“導入練習.txt”中錄入了如圖1-1-13所示的數據內容,我們想將其導入Microsoft Excel工作表中。

圖1-1-13 導入練習
兩種導入方法任選其一,進入導入向導第一個步驟,如圖1-1-14所示。

圖1-1-14 文本導入向導-步驟一
首先要設置原始數據類型,由于源文本文件中沒有使用任何形式的分隔符號,只是使用了空格手工對齊數據,所以選中“固定寬度”單選框。其次要導入起始行并確定源文件格式,源文件中我們是從最左上角的編輯區域輸入數據的,因此起始行輸入1——這里可以鼠標左鍵點擊手工輸入,也可以使用右側的上下箭頭來調增調減。文件原始格式設置為簡體中文。再次,數據包含了標題行,所以要選中“數據包含標題”復選框。最后完成上述工作,點擊“下一步”按鈕,進入導入向導的第二個步驟,如圖1-1-15所示。

圖1-1-15 文本導入向導-步驟二
文本文件導入的第二個步驟要設置字段的寬度,也就是確定分列的位置。你可以在要建立分列處單擊鼠標左鍵建立分列線,也可以雙擊分列線取消分列。對于已經形成的分列線,如果你覺得不合適的,可以手工按住分列線并拖至滿意的位置。圖中的數據預覽區域,向上的黑色箭頭就是分列線。完成分列位置的設置以后,點擊“下一步”按鈕,進入導入向導的第三個步驟,如圖1-1-16所示。

圖1-1-16 文本導入向導-步驟三
文本文件導入的第三個步驟要設置每列的數據類型。方法是用鼠標左鍵點擊數據預覽區域的某一列,然后在左上角“列數據格式”設置區域選擇數據格式。本例中,“按勞動生產率分組”列由于不參與后續計算,可以設置為“文本”,而“企業數比重”列后續可能要參與計算,可以設置為“常規”。點擊“完成”按鈕,結束文本導入,并可設置將文本數據內容導入形成一個新的工作表或工作簿文件,如圖1-1-17所示。

圖1-1-17 導入練習結果
需要注意的是,導入不同類型的文件,導入向導展示的步驟或內容會有所不同。導入步驟中前一步驟選擇不同,后面步驟要求完成的工作也會有所不同。此外,對于那些Microsoft Excel不支持導入的文件類型,Microsoft Excel會提示出錯信息。
(四)數據的篩選
數據的篩選是從大數據表單中選出分析所要用的數據。Microsoft Excel提供了兩種數據的篩選操作,即“自動篩選”和“高級篩選”。
首先介紹“自動篩選”。選中需要篩選的數據區域,然后在“數據”菜單下“排序與篩選”卡片集中點擊漏斗形的“篩選”卡片,這時被選中的數據區域的每一列第一個單元格右下角就會出現下拉箭頭,可以通過點擊下拉箭頭來實現對每一列的篩選或設置。如果在下拉箭頭中選擇“數字篩選-自定義篩選”,打開“自定義自動篩選方式”對話框,如圖1-1-18所示,可以根據條件(等于、大于等于等)篩選出數據在某一范圍內符合條件的記錄,自定義中可以用“與”“或”來約束區分條件。此外,通過逐次對不同列使用“自動篩選”的“自定義自動篩選方式”還可實現對多個字段進行嵌套組合篩選,此時各字段間限制的條件只能是“與”的關系,并且在結果上還取決于使用下拉箭頭的先后順序,一般先滿足先點擊的下拉箭頭約束,再滿足后點擊的下拉箭頭約束。

圖1-1-18 “自定義自動篩選方式”對話框
“自動篩選”一般用于簡單的條件篩選,篩選的結果將不滿足條件的數據暫時隱藏起來,只顯示符合條件的數據。篩選隱藏并非是僅隱藏數據所在的單元格,而是隱藏數據所在的行,此時如果被篩選的區域左側或右側單元格有數據,就會因為篩選隱藏了某行或某幾行而隨之隱藏起來。為此,自動篩選后再次點擊“數據”菜單下“排序與篩選”卡片集中的“篩選”卡片,就能恢復原來的數據狀態。
“高級篩選”通過點擊“數據”菜單下“排序與篩選”卡片集中的“篩選”卡片右側的“高級”卡片,調用“高級篩選”對話框來實現篩選,如圖1-1-19所示。

圖1-1-19 “高級篩選”對話框
“高級篩選”一般用于條件較復雜的篩選操作,其篩選的結果可顯示在原數據表格中,不符合條件的記錄被隱藏起來;也可以在新的位置顯示篩選結果,同時保留顯示原數據形式,這樣就更加便于進行數據的比對了。高級篩選需要在單元格或區域內輸入篩選條件,由于Microsoft Excel的篩選按列作為篩選字段,所以列標題成為篩選的標題依據。列標題下可以輸入篩選的條件,條件放在同一行表示“與”的關系,條件不在同一行表示“或”的關系。
“自動篩選”比較簡單,大家可以自己練習操作。下面我們以一個例子來介紹“高級篩選”的使用。在單元格A1:D12錄入甲、乙、丙、丁四個企業各11個工資數據,如圖1-1-20所示。

圖1-1-20 高級篩選數據
如果我們要篩選出四個企業工資收入都大于1200的數據,那么可以將“甲企業”“乙企業”“丙企業”“丁企業”四個列標題復制出放在新行,并且在它們下面輸入條件。這里由于是要四個企業工資均大于1200,是“與”的邏輯關系,所以條件應放在一行上。本例我們將上述工作錄入到A14:D15單元格,如圖1-1-21所示。

圖1-1-21 高級篩選-條件一
選中原始數據所在的A1:D12單元格后,點擊“數據”菜單下“排序與篩選”卡片集中的“篩選”卡片右側的“高級”卡片,打開“高級篩選”對話框。方式選擇“將篩選結果復制到其他位置”單選框;列表區域點擊右側的紅色箭頭,用鼠標拖動選擇原始數據所在的單元格A1:D12;條件區域點擊右側的紅色箭頭,用鼠標拖動選擇單元格A14:D15;復制到點擊右側的紅色箭頭,用鼠標拖動選擇單元格F1(如圖1-1-22所示)。點擊“確定”就能得到篩選結果,如圖1-1-23所示。

圖1-1-22 “高級篩選”對話框設置

圖1-1-23 高級篩選-結果一
如果我們要篩選的條件是甲、乙兩家企業的工資大于1200的數據,或者丙、丁兩家企業的工資小于1400的數據,那么可以將“甲企業”“乙企業”“丙企業”“丁企業”四個列標題復制出放在新行,并且在它們下面分行輸入條件,如圖1-1-24所示。使用類似上面的步驟,篩選的結果如圖1-1-25所示。

圖1-1-24 高級篩選-條件二

圖1-1-25 高級篩選-結果二
(五)數據的排序
數據的排序是將數據的次序排列整理并顯示出來的過程。排序在顯示數據的序數排列結果的同時,也方便查詢某些數據,比如一組數據的最大值、最小值等。
Microsoft Excel的排序功能主要靠“數據”菜單下“排序與篩選”卡片集中的“升序排列”(A→Z)、“降序排列”(Z→A)工具按鈕或“排序”工具卡片實現。在選中需排序區域數據后,點擊“升序排列”(或“降序排列”)工具按鈕,數據將按升序(或降序)快速自動排序。
選中需要排序的數據區域,點擊“數據”菜單下“排序與篩選”卡片集中的“排序”工具卡片,打開“排序”對話框,依次完成主關鍵字、排序依據和次序等排序條件設置。如果需要同時設置多個關鍵字(變量)的排序,可以點擊“添加條件”,增加次要關鍵字;如果被選中的排序數據區域包含變量名稱,還應選中“數據包含標題”前的復選框,如圖1-1-26所示。

圖1-1-26 “排序”對話框
同時,在“排序”對話框中還可以進行自定義排序,來實現那些直觀從數據、時間、文本或字母上排序無意義的數據排序的特殊要求。比如,想要將學校教師的職稱按照“教授、副教授、講師、助教”來排序,如果交給Microsoft Excel默認的排序處理,它會按照詞組第一個字的大寫拼音來安排升序或降序,形成“副教授、講師、教授、助教”的升序或降序結果。為此,要使用自定義序列。在排序對話框的“次序”條件設置時,點擊下拉箭頭選擇“自定義序列”,打開自定義序列對話框,在輸入序列區域手工輸入排序次序“教授,副教授,講師,助教”,每個詞之間通過回車分割開,然后點擊“添加”按鈕,在自定義序列框下就會多出一組序列“教授,副教授,講師,助教”,如圖1-1-27所示。

圖1-1-27 自定義序列
選中新增的序列,點擊“確定”,自定義的排序規則就會顯示在“次序”條件設置中,如圖1-1-28所示,接下來就可以繼續使用“排序”功能,實現自己定義的排序次序來排列數據次序了。

圖1-1-28 “排序”選項
此外,Microsoft Excel分析工具庫中的“排位與百分比排位”擴展函數,也能部分實現顯示排序結果的功能。其調用菜單路徑為“數據-數據分析-排位與百分比排位”,打開“排位與百分比排位”對話框。這里,我們仍然以前面圖1-1-20的四個企業的工資數據為例,來調用“排位與百分比排位”分析工具庫擴展函數,如圖1-1-29所示。

圖1-1-29 排位與百分比排位工具
在輸入區域點擊右側的紅色箭頭,用鼠標拖動選擇數據所在單元格A1:D12;由于四個企業的數據以列分開,所以分組方式選中“列”單選框;輸入區域包括了標志名稱,選中“標志位于第一行”復選框,讓分析工具知道不要把標志名計入分析過程;輸出區域右側的紅色箭頭,選中一個右側和下側沒有數據的單元格(否則有的數據會被覆蓋),這里我們選中F1單元格,點擊“確定”按鈕就能得到輸出結果,如圖1-1-30所示。輸出結果中,“點”代表了數據在原序列所在的排位位置,“甲企業”等標志下是按降序排列的數據,“排位”是降序排列構成的新序列號。

圖1-1-30 排位與百分比排位工具輸出結果
思考練習
1.請搜集間接數據“北京市2020年人口數”,理解專業數據庫網站搜集數據和搜索引擎搜集數據的聯系和區別,以及它們各自的優缺點。
2.思考在設計調查問卷搜集直接數據時,定類尺度、定序尺度、定距尺度和定比尺度四種統計數據計量尺度,各適合什么形式的編碼設計?
3.現有兩個企業的月工資資料如下(元):
甲企業:1220,1600,1500,1520,1100,1880,1640,1540,1320,1680,1560,1220,1200,1140,1880,660,1340,1700,1480,1440,1380,1980,1480,1440,1300,1460,1760,1840,1600,1360,1700,1900,1480,1360,1560,1540,1400,1960,1800,500,960,1680,1560,1520,1500,1280,1560,1300,1160,1340,1520,960,1580,1200
乙企業:1860,1800,1200,1800,1080,1060,1980,1420,1200,1900,1960,1580,1760,1240,1620,1620,1500,1840,1060,840,1220,1560,1500,820,1280,1440,1600,1560,1700,1640,1620,1620,1680,1860,1400,1600,1560,1560,1200,1020,1200,1200,1680,1640,1540,1680,1880,1700,1840,1680,1520,1880,1800,1480,1240,1480,1820
試根據以上資料完成下述操作:
(1)新建Microsoft Excel工作簿,將資料錄入Microsoft Excel工作表中(注意:一家企業的數據錄為一列),并保存工作簿文件名為“練習1.xls”。
(2)對數據完成“甲企業工資大于等于1400”“甲企業月工資大于1500且乙企業月工資小于1800”“甲企業月工資大于1500且乙企業月工資小于1800”三項篩選工作。
(3)對甲、乙企業的月工資數據進行排序。