2.1 單組設計一元定量資料t檢驗與符號秩和檢驗
2.1.1 問題與數據
【例2-1】已知玉米單交種群105的平均穗重為300g。噴藥后,隨機抽取9個果穗,其穗重分別為308g、305g、311g、298g、315g、300g、321g、294g、320g。問:噴藥后,與噴藥前的果穗平均重量之間的差別是否具有統計學意義?
【例2-2】已知某常規育種水稻平均單株產量為250g,經雜交培育后,隨機抽取10株,測得單株產量分別為272g、200g、268g、247g、267g、246g、373g、216g、206g、246g。問:雜交培育的水稻平均單株產量與常規育種水稻平均單株產量之間的差別是否具有統計學意義?
這兩個例子基本相同,以例2-1來進行詳細分析,遇到不同之處再專門說明。
2.1.2 對數據結構的分析
在例2-1中,整個資料只涉及一個組,即用某法重復測定果穗重量9次,得到9個數據,故應屬于“單組設計”。因指標(果穗重量)為測量得到且可帶小數,故該資料屬于定量資料,即這是單組設計一元定量資料。
2.1.3 分析目的與統計分析方法的選擇
該研究分析目的是考察該9個樣品所代表的總體均值與標準值之間的差別是否有統計學意義,因此統計分析應該屬于單組設計定量資料的統計分析。若定量資料滿足獨立性和正態分布要求,可進行單組設計一元定量資料t檢驗,此時,可求出該定量指標的總體平均值的95%置信區間;否則,應進行單組設計一元定量資料符號秩和檢驗,此時,可基于非參數法求出該定量指標的總體中位數的95%置信區間。
2.1.4 SAS程序中重要內容的說明
例2-1資料的程序名為SASTJFX2_1.SAS。

例2-2資料的程序名為SASTJFX2_2A.SAS,可以與例2-1程序完全相同,注意用新數據替換原來的數據,別忘了將Mu0=300改為Mu0=250;但這里還給出另一種形式,供讀者選用,設程序名為SASTJFX2_2B.SAS。
DATAPGM2_2B; INPUT X @@; Y=(X-250); CARDS; 272200 268247 267246 373216 206246 ; RUN; ODS HTML; PROCUNIVARIATENORMAL; VAR Y;RUN;PROCMEANS; VAR X;RUN; ODS HTML CLOSE;
注意:“Y=X?250;”是一個賦值語句,應根據具體情況修改標準值250。
2.1.5 主要分析結果及解釋


對例2-1而言,首先看關于正態性檢驗的結果。W=0.954097、P=0.7350>0.05,可以認為這組定量數據服從正態分布;再看t檢驗的結果,并結合統計學知識和專業知識給出統計學結論和專業結論。本例,t=2.495401、P=0.0372<0.05,故按α=0.05水準,拒絕H0(μ0=300),接受H1(μ0≠300),可以認為噴藥后果穗重量的均值與標準值(300g)之間的差別有統計學意義。
專業結論:因X=308g,標準值為300g,結合統計學結論,可以認為噴藥后果穗重量的均值高于標準值。求得總體平均值的95%置信區間為(300.6,315.4)g。
對例2-2而言,由SASTJFX2_2B.SAS程序輸出的主要結果如下:

首先查看關于變量Y的正態性檢驗的結果,有W=0.836851、P=0.0404<0.05,故可以認為這組定量資料不服從正態分布;接著就應查看符號秩和檢驗的結果,即位置檢驗:Mu0=0的最后一行,并結合統計學知識和專業知識給出統計學結論和專業結論。本例,S= ?2.5、P=0.8262>0.05,故按α=0.05水準,認為此樣本所代表的總體中位數與給定的標準值250g之間的差別無統計學意義。
專業結論:可認為該類水稻雜交培育后的單株產量的總體中位數與常規育種的平均單株產量(250g)接近相等。求得中位數為246.5g,其95%置信區間為(206.0,272.0)g。注意,關于中位數及其置信區間需查看本例第1個程序輸出的結果中“分位數”部分。在本例中,由于變量X并不服從正態分布,所以描述其平均水平時使用中位數,相應的需要計算中位數的95%可信區間,由于輸出結果中關于分位數置信區間部分的內容較多,此處從略。