隨機變數 (Random Variable)

機率統計

教學錄影

數學符號

數學基礎

排列組合

機率統計簡介

機率

機率公理

隨機變數

連續測度

單一分布

條件機率

聯合分布

貝氏定理

動差生成函數

特徵函數

機率法則匯總

離散分布

二項分布

多項分布

負二項分布

幾何分布

超幾何分布

布瓦松分布

連續分布

均勻分布

常態分布

Gamma 分布

指數分布

卡方分布

柯西分布

Weibull 分布

T 分布

F 分布

Beta 分布

多維分布

統計

抽樣

敘述統計

推論統計

中央極限定理

估計方法

單組樣本估計

兩組樣本估計

檢定方法

單組樣本檢定

兩組樣本檢定

平均値的推論

變異數的推論

無母數推論

迴歸分析

變異數分析

實驗設計

因子實驗

品質管制

時間序列

數據分類

統計定理匯總

統計情況分類

計算統計

蒙地卡羅法

最大似然法則

假說與學習

EM 算法

簡單貝氏分類

貝氏網路

隨機過程

馬可夫鏈

蒙地卡羅馬可夫

資源

範例

投影片

教學錄影

練習題

考題解答

訊息

相關網站

參考文獻

最新修改

簡體版

English

隨機變數

定義:隨機變數系以樣本空間 S 為定義域的實數值函數。

換言之,隨機變數 X 是一個機率空間 (probability space) 中的函數,可以寫為 $X(S) \rightarrow R$,該函數將 S 的某一子集合映射到實數領域 R,以下是隨機變數的定義:

(1)
\begin{align} X(s) \quad; \quad 其中 s \in S, X(s) \in R \end{align}

而機率密度函數則是一個符合機率公理的的函數 P,當我們寫 P[X=x] 時,意味著 x 是一個特定實數,其機率定義如下:

(2)
\begin{align} P[X=x] = P(S_x) = P(\{s:X(s)=x\}) = \sum_{s \in S_x} P(s) \end{align}

其中的 $S_x$ 乃是一個 S 的子集合,定義為 $S_x = \{s:X(s)=x\}$

舉例而言,P[X=2] 代表 $P({s \in A: X(s)=2})$ 的機率。

範例1:

在投擲銅板的機率過程中,其樣本空間 S={正, 反} ,而其中一個常見的隨機變數 X ,是用來計算銅板的正面數量,也就是 X(正) =1, X(反) = 0。

範例2:

在投擲兩個銅板的機率過程中,其樣本空間 S={正正, 正反, 反正, 反反} ,而其中一個常見的隨機變數 X ,是用來計算銅板的正面數量,也就是 X(正正) =2, X(正反) = X(反正) = 1, X(反反) = 0。

P[X=2] = P({正正}) = 0.25
P[X=1] = P({正反,反正}) = 0.5
P[X=0] = P({反反}) = 0.25

範例3:

在投擲骰子的機率過程中,其樣本空間 S={1點,2點,3點,4點,5點,6點},而其中一個常見的隨機變數 X ,是用來計算點數的,也就是 X(1點) =1, X(2點) = 2, … X(6點) = 6。
此時,P[X=1] = P[X=2] = … = P[X=6] = 1/6。

範例4:

在投擲骰子的機率過程中,其樣本空間 S={1點,2點,3點,4點,5點,6點},而其中一個不常見的隨機變數 Y ,是用來辨認偶數點的,也就是 Y(1點) =0, Y(2點) = 1, Y(3點) = 0, Y(4點) = 1, Y(5點) = 0, Y(6點) = 1。

此時,P[Y=1] = P[Y=0]= 1/2。

補充:為了方便起見,我們經常會將 P[X=1] 簡寫成 P[1] 或 f(1),P[X=x] 簡寫成 P[x] 或 f(x)。

在單一個樣本空間 S 中,可以有很多不同的隨機變數 X, Y, … ,因為將 S 映射到 R 的函數有很多。

(3)
\begin{eqnarray} X(s) && \quad; \quad 其中 s \in S, X(s) \in R \\ Y(s) && \quad; \quad 其中 s \in S, Y(s) \in R \\ ... \end{eqnarray}

隨機變數的代數運算

在機率統計中,我們經常看到隨機變數可以像數值一樣進行 +, -, * 等運算。舉例而言,假如 X, Y 均為隨機變數,那麼 $3 X, X+Y, X-2Y, X Y, X^2$ 等都是隨機變數。

但是在前一節當中,我們看到了隨機變數其實被定義為一個「實數值函數」X(S)->R,那麼這些 +, -, * 等運算就是在函數上所近行的運算,這些運算的函意到底是甚麼呢?

3X 的意義

隨機變數 3X 代表的是一個函數 Z=3X,其中 Z 函數對每一個元素 s 的映射值均為 X 的 3 倍,也就是 :

(4)
\begin{equation} Z(s) = 3 * X(s) \end{equation}

範例5:

令 X 為擲骰子點數的隨機變數,也就是 X(k點)=k (k=1..6),那麼隨機變數 3X 代表的是 Z(k點)=3*X(k點)=3k 這個函數。

進階:
1. 請問 P[Z=3] = ?, (1/6)
2. 請問 P[Z=1] = ?, (0)
3. 請問 P[Z=18] = ?, (1/6)
4. 請問 P[Z=5] = ?, (0)

範例6:

令 X 為丟銅板所得正面次數的隨機變數,也就是 X(正)=1, X(反)=0,那麼隨機變數 Z=3X 代表的是 Z(正)=3,Z(反)=0 這個函數。

X+Y 的意義

隨機變數 X+Y 代表的是一個函數 Z=X+Y,其中 Z 函數對每一個元素 s 的映射值均為 X + Y 的映射值總和,也就是:

(5)
\begin{equation} Z(s) = X(s)+Y(s) \end{equation}

範例7:

令 X, Y 均為為擲骰子點數的隨機變數,也就是 X(k點)=Y(k點)=k (k=1..6),那麼 X+Y 代表的是隨機變數 Z(k點)=2k 這個隨機變數。

範例8:令 X 為擲骰子點數的隨機變數,Y 為丟銅板所得正面次數的隨機變數,那麼 X+Y 這個隨機變數代表甚麼意義呢?
解答:

在這個範例中,X 與 Y 兩者的定義域 $S_X, S_Y$ 並不相同,因此必須用聯合隨機分布的概念,也就是同時投擲一顆骰子與一個銅板,才能有效說明 X+Y 的意義。

對於定義域不同的兩個隨機變數而言,其樣本空間可用兩者的「笛卡兒」乘積代表,也就是 $S_X = \{1點,...., 6點\}$, 而 $S_Y = \{正, 反\}$,此時 X+Y 所在的樣本空間,必須解釋為 {1點,…., 6點} 與 {正, 反} 兩者的笛卡兒乘積,總共有 12 種可能,聯合分布的樣本空間 S 如下所示。

S = (S_X, S_Y) = { (1點, 正), (1點,反), (2點, 正), (2點,反), ….(6點, 正), (6點,反)}

因此,Z = X+Y 所代表的隨機變數,其實是一個 Z 函數,該函數將 $(S_X, S_Y)$ 映射到實數 R 中,其中的 X 作用在 $S_X$ 上,而 Y 作用在 $S_Y$ 上,也就是:

$Z(s) = Z(x, y) = X(x)+Y(y)$

所以,P(Z=2) 也可以寫成 P(X+Y = 2) ,也就是 $P(\{(1點, 正), (2點,反)\})$,因此 P(Z=2) 的機率為 2/12 = 1/6。

X Y 的意義

隨機變數 X Y 代表的是一個函數 Z=X Y,其中 Z 函數對每一個元素 s 的映射值均為 X Y 的映射值乘積,也就是:

(6)
\begin{equation} Z(s) = X(s) Y(s) \end{equation}

範例9:令 X 為擲骰子點數的隨機變數,Y 為丟銅板所得正面次數的隨機變數,那麼 X Y 這個隨機變數代表甚麼意義呢?
解答:

同範例 8,X 與 Y 兩者的定義域 $S_X, S_Y$ 並不相同,樣本空間仍然用其「笛卡兒」乘積代表。

S = (S_X, S_Y) = { (1點, 正), (1點,反), (2點, 正), (2點,反), ….(6點, 正), (6點,反)}

因此,Z = X Y 所代表的隨機變數,其實是一個 Z 函數,該函數將 $(S_X, S_Y)$ 映射到實數 R 中,其中的 X 作用在 $S_X$ 上,而 Y 作用在 $S_Y$上。

所以,P(Z=2) 也可以寫成 P(X Y = 2) ,也就是 P({(2點, 正)}) ,因此 P(Z=2) 的機率為 1/12。

$X^k$ 的意義

隨機變數 $X^k$ 代表的是一個函數 Z=X^k,其中 Z 函數對每一個元素 s 的映射值均為 X(s) 的 k 次方,也就是:

(7)
\begin{equation} Z(s) = X^k(s) \end{equation}

範例10:X 為投擲 1 顆骰子點數的隨機變數,且定義 $Z = X^2$ ,請問隨機變數 P(Z=4) 的機率為何?
解答:

$Z(s)=4=X^2(s)=X(s)*X(s) \quad \rightarrow \quad X(s) = 2$

所以 P(Z=4) 相當於 P(X=2) = P({2點}) = 1/6

但必須注意的是 Z 的定義域雖仍然為 ({1點,…., 6點}),但是值域卻為 1,4,9,16,25,36。

期望值與變異數

期望值 E(X):離散隨機變數 X 的期望值 E(X) 定義如下

(8)
\begin{align} E[X] = \sum_{x \in X(S)} x P(x) \quad ; \quad 經常會簡寫為 \mu \end{align}

變異數 Var(X):離散隨機變數 X 的變異數 Var(X) 定義如下

(9)
\begin{align} Var(X) = \sum_{x \in X(S)} (x-\mu_X)^2 P(x) \end{align}

期望值 E[g(X)] :期望值的通式 E[g(X)] 定義如下:

(10)
\begin{align} E[g(X)] = \sum_{x \in X(S)} g(x) P(x) \end{align}

注意:

  • 1. 以上三式中 $\sum$ 的下標均為 $x \in X(S)$,而非 $x \in S$,也就是 x 是實數值,而非樣本點。
  • 2. 這也是為何要將隨機變數定義為實函數的原因,這樣才能對這些「變數」進行 +, -, * 等代數運算,並且可以進行期望值與變異數的計算。

結語

隨機變數 X, Y, Z, … 乃是一種作用於樣本空間 S 的實函數,此種函數會將樣本點映射到實數中,例如: $X(S) \rightarrow R$ 代表函數 X 將樣本空間中的元素 s 映射到某個實數值 x。

而隨機變數之間的代數運算,像是 $3X, X+Y, X-2Y, X Y, X^k$ 等運算的結果,也仍然是一種作用在樣本空間 S 的實函數,只是當 X, Y 兩者的樣本空間有所不同時,我們必須以兩者樣本空間的迪卡兒乘積 $S = (S_X, S_Y)$ 作為樣本空間。

此時 X, Y 的機率密度函數將會採用以下的「邊際機率密度函數」之算法,以便將聯合樣本空間 $(S_X, S_Y)$ 中的機率與單一樣本空間 $S_X$$S_Y$ 中的機率關聯起來。

(11)
\begin{eqnarray} P(X=x) &=& P(x, \_) = \sum_{y \in S_Y} P(x,y) \\ P(Y=y) &=& P(\_, y) = \sum_{x \in S_X} P(x,y) \end{eqnarray}

最後我們必須強調的是,樣本空間的選擇並沒有一定的標準,您可以視問題的需要來定義樣本空間,不過樣本空間當然是越小越好,否則將會很難計算。

參考文獻

  1. 第二章 随机变量与分布函数
  2. 統計學導論 (五版), 方世榮著, 華泰文化出版。

Facebook

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License