- 統計質量控制及其應用
- 吳希主編
- 700字
- 2020-06-08 16:18:10
五、概率分布
直方圖、莖葉圖、箱形圖都可以用于描述樣本數據。樣本是從總體中按照某些方法抽取出來的。概率分布是與總體分布的概率有關的數據模型。換句話說,我們可以將樣本值x視為一個隨機變量,因為當每次抽樣時,都可以得到不同的樣本值,則可以通過概率分布去描述總體中出現任何樣本值的概率。概率分布主要分成兩種類型。
1.連續型分布
當變量可以連續取值時,對應的概率分布即稱為連續型概率分布,例如溫度、時間等。
設連續型隨機變量的概率密度函數為
,則

2.離散型分布
當變量只能在固定點處取值時,例如只能取整數值0,1,2,…,對應的概率分布稱為離散型概率分布。例如,不合格產品數量的分布,或者印制電路板瑕疵數量的分布等。
若離散型隨機變量所能取的值是
并以概率
表示當
取值為
時的概率,即
P(x=xk)=pk k=1,2,…
3.隨機變量的數字特征
實際問題中,往往需要能夠概括地表達隨機變量某種平均性質的量,即隨機變量的數字特征,其中最基本的就是數學期望和方差,前者刻畫了隨機變量取值的相對集中位置或平均水平,后者刻畫了隨機變量取值圍繞平均水平的離散程度。
數學期望,即均數,對于連續型隨機變量,均數的計算公式為
(2-4)
對于離散型隨機變量,均數的計算公式為
(2-5)
均數即是數據的中心,均數決定著分布的位置[圖2-11(a)]。而分布的散布程度或變異則由方差決定。
方差是反映隨機變量離散程度大小的一個數字特征。對于連續型隨機變量,方差的計算公式為
(2-6)
對于離散型隨機變量,方差的計算公式為

當方差越大時,代表數據的變異越大。在實際中,常使用方差的平方根來表示數據的變異,即標準差。
(2-7)
方差和標準差主要決定著分布的形狀[圖2-11(b)]。

圖2-11 不同均數與不同標準差的概率分布圖