第二章 隨機變量的分布
第一節 隨機變量及其分布函數
在第一章中,我們討論了隨機事件及其概率,為了更全面、系統地研究隨機試驗的結果,找到隨機現象的統計規律性,有必要將隨機試驗的結果數量化.為此,人們引入了隨機變量及其分布的概念.隨機變量及其與之相關的一系列概念的引入,使概率論的研究能夠借助數學分析工具,為概率論的研究獲得了飛速發展.
一、隨機變量
人們對隨機事件的興趣常常在其結果表現的數量.我們可以在隨機試驗中引入變量用來描述隨機試驗的結果.
比如:擲一顆均勻的骰子,觀察出現的點數.
若記骰子出現的點數為X,則X的可能值為1,2,3,4,5,6,每擲一次X取1~6中的一個,X的取值是隨試驗結果變化的,當試驗結果確定后,X的值就相應確定,稱X這樣的變量為隨機變量.
若研究某超市一位顧客購買的商品件數和顧客付款時等待的時間,可記Y表示顧客購買的商品件數,Y可能取值為0,1,2,3或其他自然數.Y的取值為隨機的,是一個隨機變量,事件“Y<3”即“顧客購買的商品件數少于3件”.若記Z表示顧客付款的等待時間,則Z為隨機變量,事件“Z>5”即“顧客付款等待的時間超過5分鐘”.
可以看出,隨機變量是研究隨機現象的一個重要工具,也是概率論的一個基本概念,它的一般定義如下:
[定義1] 設S為某隨機試驗的樣本空間,若對于S中任意一個樣本點ω都有唯一的確定的實數X(ω)與之對應,即存在一個定義于S的單值實函數X=X(ω),則稱X為隨機變量.
本書中,一般用大寫英文字母X、Y、Z等表示隨機變量,其取值用小寫字母x、y、z等表示.
隨機變量X作為樣本點的一個函數,它的取值隨試驗結果而定.該變量究竟取何值在試驗之前是無法確定的,只有在試驗之后才知道它的確切值;而試驗的各種結果出現有一定的隨機性,因此隨機變量的取值具有隨機性,這是隨機變量和普通變量之間的差異.
如果一個隨機變量僅取數軸上的有限個或可列個點,則稱此隨機變量為離散型隨機變量.如果一個隨機變量的可能取值充滿數軸上的一個區間,則稱此隨機變量為連續型隨機變量.
【例2-1-1】 區分以下隨機變量是離散型隨機變量,還是連續型隨機變量.
(1)拋一枚質地均勻的硬幣,正面出現的次數X是可能取0與1兩個值的隨機變量.“X=0”表示“出現反面”,“X=1”表示“出現正面”.類似地,檢查一件產品,不合格品數Y也是一個僅能取0與1兩個值的隨機變量,“Y=0”表示“合格品”,“Y=1”表示“不合格品”.
(2)盒子中裝有6個紅球、4個白球,從中任取3個球,取到的白球數X是可能取0,1,2,3等四個值的隨機變量.
(3)記錄一個十字路口1小時通過的汽車數X,隨機變量X可能取到的值為0,1,2,…等一切非負整數.類似地,一本書上的錯別字個數、單位時間內某個站臺上候車的人數都可以看作取一切非負整數的隨機變量.
以上都是離散型隨機變量,離散型隨機變量常常與計數的過程聯系在一起,而連續型隨機變量則常常與測量過程聯系在一起,以下的隨機變量為連續型隨機變量.
(4)電視機的使用壽命X(單位:小時)是(0,+∞)上取值的隨機變量,“X>10000”表示“電視機的使用壽命超過1萬小時”.
(5)若某路公共汽車在某站每隔5分鐘通過一次,則某位乘客候車的時間X(單位:分鐘)是在[0,5]上取值的隨機變量.
二、分布函數
研究隨機變量首先要解決以下兩個問題:
①隨機變量可能取哪些值,或取值范圍是什么?
②隨機變量取值的規律性如何?
下面定義的分布函數是為了描述隨機變量取值規律性而引入的一個概念.
[定義2] 設X為一個隨機變量,對任意實數x,事件“X≤x”的概率為x的函數,記為
F(x)=P{X≤x}
稱F(x)為X的分布函數.
在有多個隨機變量的場合,為了區分,X的分布函數也可記為FX(x).
如果將隨機變量X看作數軸上“隨機點”的坐標,那么分布函數F(x)的函數值就表示隨機點X落在區間[-∞,x]內的概率.對于任意的x1,x2∈R(x1<x2)有
P{x1<X≤x2}=F(x2)-F(x1) (2-1-1)
即
P{x1<X≤x2}=P{X≤x2}-P{X≤x1}=F(x2)-F(x1)
在上述定義中并沒有限定隨機變量X是離散的或是連續的,不論離散型隨機變量還是連續型隨機變量都可以有分布函數.從分布函數的定義可得到它的以下基本性質:
①F(x)是不減函數且0≤F(x)≤1;
②;
③;
④F(x)是右連續函數.
【例2-1-2】 向半徑為r的圓內任意投擲一點,求此點到圓心的距離X的分布函數F(x).
解:因為x<0時,事件“X≤x”為不可能事件,所以F(x)=P{X≤x}=0;
當x≥r時,事件“X≤x”為必然事件,所以F(x)=P{X≤x}=1;
當0≤x<r時,由幾何概型可知
因此有
【例2-1-3】 設隨機變量X的分布函數為
(1)求系數A、B;
(2)計算P{X≤2},.
解:(1)根據分布函數的性質,有
得
因此
(2)P{X≤2}=F(2)=1-e-2≈0.8647