2.2 應用統計
2011年諾貝爾經濟學獎獲得者Thomas J.Sargent在世界科技論壇上表示人工智能都是利用統計學來解決問題。隨機性在自然現象和社會現象中普遍存在,應用統計學作為一門收集、整理、描述、顯示和分析數據的科學,在測量、通信、質量控制、氣象、水文、地震預測等多個領域都有重要的應用。
2.2.1 參數估計
掌握某個隨機現象的統計規律,就是要掌握描述該隨機現象的隨機變量的分布。在實際應用中,我們無法通過大量抽樣的方法得到觀測數據,所以需要對分布的某些數字特征進行估計。我們可以把幾個參數分為兩類:當總體分布的形式已知時,分布的未知因素體現在總體分布的某個參數上,這類參數有一個顯著的特點,總體分布可以隨著參數的確定而確定,而且總體參數雖然未知,但是它可能的取值范圍是已知的。當總體分布的形式未知時,即使對未知參數作出了估計,仍無法確定總體的分布。
參數估計的方法有點估計法和區間估計法兩種。
2.2.2 假設檢驗
假設檢驗是統計推斷中另一類重要的問題。在假設檢驗中,先假設總體分布的形式或總體的參數具有某種特性,然后利用樣本提供的信息來判斷原先的假設是否合理。若合理,則承認假設的正確性,否則便否認原先的假設,從而對所需研究的問題作出分析和判斷。
假設檢驗通常可以分為以下5個步驟。
(1)提出假設,寫明原假設H0和備擇假設H1(H0的對立面)的具體內容,H0與H1是互補的假設。
(2)選擇檢驗統計量,根據H0的內容,選取適當的統計量,要求此統計量的分布是可確定的。
(3)給定檢驗水平a,對于實際的問題應根據不同的需要和側重,選取不同的水平,為了查表方便,一般選取a=0.01,0.05,0.10,…,n。
(4)確定拒絕域(或接受域),由假設的內容選取的統計量和給定的ɑ,用分步的分位數表來確定拒絕H0的臨界值,并表示成一般的拒絕形式——拒絕域。
(5)作出判斷,由樣本值算出統計量的值,若所算出的統計值落入拒絕域中,則在檢驗水平a下拒絕H0,而認為H1是真的;否則,接受H0。
2.2.3 回歸分析與方差分析
回歸分析和方差分析是數理統計中常用的方法,用于研究變量與變量之間的相關關系。在實踐中,我們可以發現,變量之間的關系可以分為兩種,一種是各變量之間存在完全確定的關系;另一種變量之間的關系是非確定性的,這種關系無法用一個精確的數學式來表示,可以稱為相關關系或統計依賴關系。另外,在相關關系的變量中,仍分為幾種不同的情況。第一種情況是,這些變量全部為隨機變量,可以將變量中的任一個作為“因變量”,其余則作為“自變量”。第二種情況是,某些變量是可以觀測和控制的非隨機變量,另一個變量與之有關,但它是隨機變量,可以把隨機變量作為因變量,可控變量作為自變量,此時變量的地位不可交換。回歸分析方法是處理第二種情況的重要工具,回歸的內容包括:確定預報變量與響應變量之間的回歸模型,根據樣本觀測數據檢驗回歸模型;利用所得回歸模型根據一個或幾個變量的值預測或控制另一個變量的取值,并給出這種預測或控制的精度。
方差分析與回歸分析的要求與方法都不同。方差分析是根據實驗結果進行分析,鑒別各有關因子對實驗結果的影響程度。在方差分析中,因子可以不是數量化指標,而是不同的條件,它可以用來檢驗“多個正態總體均值是否有顯著性差異”。
- 輕輕松松自動化測試
- Go Machine Learning Projects
- Seven NoSQL Databases in a Week
- Excel 2007函數與公式自學寶典
- 輕松學Java
- 80x86/Pentium微型計算機原理及應用
- 工業機器人現場編程(FANUC)
- Supervised Machine Learning with Python
- Nginx高性能Web服務器詳解
- Visual Studio 2010 (C#) Windows數據庫項目開發
- Silverlight 2完美征程
- Web編程基礎
- Spark大數據商業實戰三部曲:內核解密|商業案例|性能調優
- 工業機器人入門實用教程
- 30天學通Java Web項目案例開發