機率統計教學錄影數學符號數學基礎排列組合機率統計簡介機率機率公理隨機變數連續測度單一分布條件機率聯合分布貝氏定理動差生成函數特徵函數機率法則匯總離散分布二項分布多項分布負二項分布幾何分布超幾何分布布瓦松分布連續分布均勻分布常態分布Gamma 分布指數分布卡方分布柯西分布Weibull 分布T 分布F 分布Beta 分布多維分布統計抽樣敘述統計推論統計中央極限定理估計方法單組樣本估計兩組樣本估計檢定方法單組樣本檢定兩組樣本檢定平均値的推論變異數的推論無母數推論迴歸分析變異數分析實驗設計因子實驗品質管制時間序列數據分類統計定理匯總統計情況分類計算統計蒙地卡羅法最大似然法則假說與學習EM 算法簡單貝氏分類貝氏網路隨機過程馬可夫鏈蒙地卡羅馬可夫資源範例投影片教學錄影練習題考題解答訊息相關網站參考文獻最新修改簡體版English |
中央極限定理(1)\begin{eqnarray} \frac{x_1+x_2+...+x_n}{n} = \bar{x} \rightarrow N(\mu, \sigma/\sqrt{n}) \end{eqnarray}
另一種講法:Z 為標準常態分布 (2)\begin{eqnarray} \frac{\bar{x}-\mu}{\sigma/\sqrt{n}} \rightarrow Z \end{eqnarray}
常態分布的重要數值(3)\begin{eqnarray} 1. && P[-\sigma < X - \mu < \sigma] &=& 0.68 \\ 2. && P[-2 \sigma < X - \mu < 2 \sigma] &=& 0.95 \\ 3. && P[-3 \sigma < X - \mu < 3 \sigma] &=& 0.997 \end{eqnarray}
R 程式範例一(4)\begin{eqnarray} x_1+x_2+...+x_n \rightarrow N(\mu, \delta/\sqrt{n}) \end{eqnarray}
說明: 圖一、hist(u[,1]) 畫出的圖形 圖二、hist(y) 畫出的圖形 R 程式範例二
圖三、指令 CLT(sample(0:1, 100000, replace=T)) 的執行結果 中央極限定理 (Central Limit Theorem, CLT) 的證明(5)\begin{eqnarray} \frac{x_1+x_2+...+x_n}{n} = \bar{x} \rightarrow N(\mu, \delta/\sqrt{n}) \end{eqnarray}
證明:Classical CLT (Lindeberg–Lévy CLT) 本證明的有效條件:假定 $(x_1, x_2,...,x_n$ 是相同且獨立的隨機分布所抽出的樣本。 本證明需使用到機率中的 動差生成函數 與微積分中的 泰勒展開式 假如 E(Y) = 0 且 Var(Y) = 1,那麼根據 $Var(Y) = E(Y^2) - E(Y)^2 = E(Y^2) - 0^2 = E(Y^2)$,則 Y 的動差生成函數將符合下列算式: (6)\begin{eqnarray} m_Y(t) &=& E[1] + t E[Y] + \frac{(t E[Y])^2}{2!} + .... \\ &=& 1 + t * 0 + \frac{t^2 Var(Y)}{2!} + .... \\ &=& 1 + 0 + \frac{t^2}{2!} + .... \\ \end{eqnarray}
令 $Y_i = \frac{X_i-\mu}{\sigma}$,也就是將 $X_i$ 標準化後的結果,那麼 Y 將符合上述的 $E(Y) = 0 , Var(Y) = 1$ 之條件。 接著我們將可以定義算式 $Z_n$ 如下所示 (7)\begin{align} Z_n = \frac{n\bar{X}_n-n\mu}{\sigma \sqrt{n}} = \sum_{i=1}^n {Y_i \over \sqrt{n}} \end{align}
此時根據動差生成函數的基本特性,可以發現 $Z_n$ 的動差特徵函數之特性如下 (8)\begin{align} m_{Z_n}(t) = \left[m_Y\left({t \over \sqrt{n}}\right)\right]^n = \left[ 1 - {t^2 \over 2n} + o\left({t^2 \over n}\right) \right]^n \, \rightarrow \, e^{-t^2/2}, \quad n \rightarrow \infty. \end{align}
也就是隨機變數 $Z_n$ 的動差生成函數 $m_{Z_n}(t)$ 將會趨近於標準常態分布的動差生成函數 $e^{-t^2/2}$。 由於動差生成函數是隨機變數的「指紋」,因此隨機變數 $Z_n$ 也將隨著 n 的增大而越來越趨近標準常態分布 $Z$ 。 參考文獻
|
中央極限定理
page revision: 89, last edited: 10 Dec 2011 03:57
Post preview:
Close preview