官术网_书友最值得收藏!

五、概率分布

直方圖、莖葉圖、箱形圖都可以用于描述樣本數據。樣本是從總體中按照某些方法抽取出來的。概率分布是與總體分布的概率有關的數據模型。換句話說,我們可以將樣本值x視為一個隨機變量,因為當每次抽樣時,都可以得到不同的樣本值,則可以通過概率分布去描述總體中出現任何樣本值的概率。概率分布主要分成兩種類型。

1.連續型分布

當變量可以連續取值時,對應的概率分布即稱為連續型概率分布,例如溫度、時間等。

設連續型隨機變量的概率密度函數為,則

2.離散型分布

當變量只能在固定點處取值時,例如只能取整數值0,1,2,…,對應的概率分布稱為離散型概率分布。例如,不合格產品數量的分布,或者印制電路板瑕疵數量的分布等。

若離散型隨機變量所能取的值是并以概率表示當取值為時的概率,即

Px=xk)=pk k=1,2,…

3.隨機變量的數字特征

實際問題中,往往需要能夠概括地表達隨機變量某種平均性質的量,即隨機變量的數字特征,其中最基本的就是數學期望和方差,前者刻畫了隨機變量取值的相對集中位置或平均水平,后者刻畫了隨機變量取值圍繞平均水平的離散程度。

數學期望,即均數,對于連續型隨機變量,均數的計算公式為

  (2-4)

對于離散型隨機變量,均數的計算公式為

  (2-5)

均數即是數據的中心,均數決定著分布的位置[圖2-11(a)]。而分布的散布程度或變異則由方差決定。

方差是反映隨機變量離散程度大小的一個數字特征。對于連續型隨機變量,方差的計算公式為

  (2-6)

對于離散型隨機變量,方差的計算公式為

當方差越大時,代表數據的變異越大。在實際中,常使用方差的平方根來表示數據的變異,即標準差。

  (2-7)

方差和標準差主要決定著分布的形狀[圖2-11(b)]。

圖2-11 不同均數與不同標準差的概率分布圖

主站蜘蛛池模板: 错那县| 达州市| 延津县| 合肥市| 资阳市| 东兰县| 蓬安县| 德保县| 平湖市| 保德县| 沽源县| 赤水市| 新化县| 黄浦区| 陈巴尔虎旗| 拉孜县| 永春县| 西盟| 沈阳市| 葫芦岛市| 新津县| 靖宇县| 武鸣县| 景泰县| 正阳县| 乌什县| 铜陵市| 思南县| 昌都县| 万载县| 镇江市| 巴楚县| 册亨县| 南川市| 罗江县| 寻乌县| 金华市| 乌兰察布市| 方城县| 岐山县| 道孚县|