官术网_书友最值得收藏!

二、分位數-分位數圖

同理,任意兩個數據集都可以通過比較來判斷是否服從同一分布。計算每個分布的分位數。一個數據集對應于x軸,另一個對應于y軸。作一條45°的參照線。如果這兩個數據集來自同一分布,那么這些點就會靠近這條參照線。

注意事項:

繪制正態概率圖有很多方法。除了這里給定的方法以外,正態分布還可以用概率和百分數來表示。實際的數據可以先進行標準化或者直接標在x軸上。如果此時這些數據形成一條直線,那么該正態分布的均值就是直線在y軸截距,標準差就是直線斜率。

對于正態概率圖,圖2-21顯示了一些常見的變形圖形。

圖2-21 正態概率圖常見圖形

短尾分布:如果尾部比正常的短,則點所形成的圖形左邊朝直線上方彎曲,右邊朝直線下方彎曲——如果傾斜向右看,圖形呈S型。表明數據比標準正態分布時候更加集中靠近均值。

長尾分布:如果尾部比正常的長,則點所形成的圖形左邊朝直線下方彎曲,右邊朝直線上方彎曲——如果傾斜向右看,圖形呈倒S型。表明數據比標準正態分布時候有更多偏離的數據。一個雙峰分布也可能是這個形狀。

右偏態分布:右偏態分布左邊尾部短,右邊尾部長。因此,點所形成的圖形與直線相比向上彎曲,或者說呈U型。把正態分布左邊截去,也會是這種形狀。

左偏態分布:左偏態分布左邊尾部長,右邊尾部短。因此,點所形成的圖形與直線相比向下彎曲。把正態分布右邊截去,也會是這種形狀。

盡管作直方圖能馬上知道數據的分布,但它卻不是判斷這些數據是否來自同一特定分布的好辦法。人眼不能很好地判別曲線,其他的分布也可能形成相似的形狀。并且,用服從正態分布的少量數據集作成的直方圖可能看起來不是正態的。因此,正態概率圖是判斷數據分布的較好方法。

主站蜘蛛池模板: 秦安县| 南漳县| 富宁县| 横峰县| 苏尼特右旗| 浑源县| 元氏县| 临城县| 浦东新区| 曲麻莱县| 尚义县| 遵义县| 依兰县| 靖江市| 高要市| 祥云县| 大姚县| 柳河县| 萨嘎县| 公安县| 安徽省| 汉寿县| 仁布县| 遵义县| 平昌县| 雷波县| 元阳县| 绵竹市| 邵东县| 宜州市| 会东县| 河北省| 阜新市| 林甸县| 二连浩特市| 博野县| 高平市| 平凉市| 垫江县| 许昌县| 浦江县|