- 統計質量控制及其應用
- 吳希主編
- 420字
- 2020-06-08 16:18:15
第一節 統計量和抽樣分布
統計推斷的目的是基于從總體中選取的樣本來對總體下結論。通常我們會對用于分析的隨機樣本進行假設。我們定義一組容量為n的樣本,這些
是獨立同分布的。這些樣本來自于無限總體或有限總體,采用的是等概率的抽樣方式。
盡管我們將研究的大多數方法是在假設隨機樣本已經被使用的前提下,但是在質量控制中還是會存在其他的抽樣方法。我們需要在使用統計方法進行分析時,確認這種方法要適合任何的樣本設計方案;否則,當我們使用其他抽樣技術搜集數據時,統計推斷的結論可能會導致嚴重的錯誤。
統計推斷主要利用從樣本數據中計算得到的量。統計量指由樣本數據計算出的任何的量。例如,令表示樣本,則樣本均數為

樣本方差為

樣本標準差為

這些都是統計量。樣本均數和樣本方差描述了樣本數據的集中趨勢和變異。
如果已知樣本來自的總體的概率分布,可以由樣本統計量來決定概率分布的形式。統計量的概率分布稱為抽樣分布。現在將討論抽樣分布與三個一般抽樣情況之間的聯系。
一、從正態分布總體中抽樣
假設x是服從均數為μ、方差為σ2的正態分布。如果從中抽取容量為n的樣本,記為,則樣本均值
服從正態分布
。
這個結論不僅對于正態總體是如此,對于其他的總體分布,也有同樣的結論。這是因為由下面的式子:

根據中心極限定理我們知道,無論總體的分布如何,的分布都近似服從均數為
,方差為
的正態分布。因此,無論總體的分布如何,樣本均數的抽樣分布都近似服從正態分布,即

除正態分布以外另一個重要的抽樣分布是分布,如果
是來自于標準正態,則隨機變量

服從自由度為n的分布。自由度為n的
分布為


圖3-1 不同自由度的分布
不同自由度的分布如圖3-1所示。
分布是偏態的,均數
,方差
。為了分析如何使用
分布,假設
來自于正態分布
。則隨機變量

服從自由度為的
分布。由樣本方差的計算公式,上式可以寫成:

因此當樣本來自于正態分布時,服從自由度為
的
分布。
另一個常用的分布是分布。如果
是服從標準正態分布的隨機變量,
是服從自由度為
的隨機變量,如果
和
是獨立的,則隨機變量

服從自由度為的
分布。
的概率分布為:

t分布的均值為μ=0,方差為。t分布的分布圖如圖3-2所示。需要注意的是,如果
,此時的t分布無限接近標準正態分布。

圖3-2 不同自由度的t分布
假設來自于正態分布
。如果
和s2可由樣本計算得到,并且由
,可得

由于和s2是獨立的,所有隨機變量

服從自由度為n-1的t分布。
基于正態分布基礎上隨后一個抽樣分布是F分布。如果是兩個獨立的、分別服從以
為自由度的
分布,則比值

服從分子自由度為u、分母自由度為v的F分布。F分布的概率密度函數為:

F分布的分布圖如圖3-3所示。

圖3-3 不同u,v的F分布圖
舉一個服從F分布的隨機變量的例子。假設有兩個變量服從獨立的正態分布過程,其中,
。令
是來自于第一個正態過程的樣本,樣本容量為
;
是來自于第二個正態過程的樣本,樣本容量為n2,如果
和
是兩個樣本的樣本方差,則

F分布主要用于推斷兩正態分布的總體方差是否存在差異。