兩組樣本的檢定

機率統計

教學錄影

數學符號

數學基礎

排列組合

機率統計簡介

機率

機率公理

隨機變數

連續測度

單一分布

條件機率

聯合分布

貝氏定理

動差生成函數

特徵函數

機率法則匯總

離散分布

二項分布

多項分布

負二項分布

幾何分布

超幾何分布

布瓦松分布

連續分布

均勻分布

常態分布

Gamma 分布

指數分布

卡方分布

柯西分布

Weibull 分布

T 分布

F 分布

Beta 分布

多維分布

統計

抽樣

敘述統計

推論統計

中央極限定理

估計方法

單組樣本估計

兩組樣本估計

檢定方法

單組樣本檢定

兩組樣本檢定

平均値的推論

變異數的推論

無母數推論

迴歸分析

變異數分析

實驗設計

因子實驗

品質管制

時間序列

數據分類

統計定理匯總

統計情況分類

計算統計

蒙地卡羅法

最大似然法則

假說與學習

EM 算法

簡單貝氏分類

貝氏網路

隨機過程

馬可夫鏈

蒙地卡羅馬可夫

資源

範例

投影片

教學錄影

練習題

考題解答

訊息

相關網站

參考文獻

最新修改

簡體版

English

檢定的參數種類

兩組樣本 X, Y 的檢定 (Hypothesis testing) 可以根據檢定對像而細分為以下幾種情況:

  1. 比較兩平均數 $\mu_1, \mu_2$ 的差值 $\mu_1-\mu_2$ 的檢定
  2. 比較兩變異數 $\sigma_1, \sigma_2$ 的差值 $\sigma_1-\sigma_2$ 的檢定
  3. 比較兩機率 $p1, p2$ 的差值 $p1-p2$ 的檢定
  4. 比較兩組中位數 M 的差值 $M_X - M_Y$ 的檢定 (無母數方法)

比較兩平均數 $\mu_1, \mu_2$ 的差值 $\mu_1-\mu_2$ 的檢定

(方法一):合併 T 檢定 (pooled T test)

  • 又被稱為:「獨立 T 檢定」或「不相關 T 檢定」
  • 前提條件:兩組樣本必須互相獨立才能使用合併 T 檢定,沒有理相信 (常態分布) 兩組樣本的母體變異數不相等的情況之下,想比較 $\mu_1 - \mu_2$ 時,可用「合併 T 檢定」。
  • 前提假定:
  • 合併平均數 $\mu_1, \mu_2$ 與 變異數 $\sigma_1, \sigma_2$ 的檢定
右尾檢定 左尾檢定 雙尾檢定
H0 $\mu_1 = \mu_2$ $\mu_1 = \mu_2$ $\mu_1 = \mu_2$
H1 $\mu_1 > \mu_2$ $\mu_1 < \mu_2$ $\mu_1 \neq \mu_2$
> x=rnorm(25, mean=3, sd=2)
> x
 [1]  1.7314493 -0.1737618  1.9285682  3.8467183  4.2276010  1.9211225
 [7]  3.5942417  5.5049456  1.6873243  5.9730197  2.9417960  4.0597357
[13]  3.4849595 -0.2703420  1.2834361  2.9972777  4.8145254  6.4859058
[19]  1.3985492  0.2572882  4.9104658  5.9279225  3.0992725 -1.0605704
[25]  5.8661331
> y=rnorm(20, mean=3.2, sd=2)
> y
 [1] 4.8500553 2.5884067 0.5215695 3.5791425 0.1132645 1.9238581 2.7999475
 [8] 3.0016801 2.4230465 2.1099650 3.0268919 1.5033308 1.6638613 7.3840919
[15] 1.6543867 6.2835260 1.2498559 2.6159083 4.0705806 4.4077052
> t.test(x, y, var.equal=T)

        Two Sample t-test

data:  x and y 
t = 0.2804, df = 43, p-value = 0.7805
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -1.046155  1.384054 
sample estimates:
mean of x mean of y 
 3.057503  2.888554 

>

(方法二):成對 T 檢定 (Paired T Test)

  • 前提條件
    1. 2個或以上的連續變項皆呈常態分配 (normally distributed)
    2. 變項與觀察值之間互相獨立 (mutually independently)
> x=rnorm(20, mean=5, sd=2)
> y=rnorm(20, mean=5.3, sd=2)
> t.test(x,y, pair=T)

        Paired t-test

data:  x and y 
t = 0.2053, df = 19, p-value = 0.8395
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -1.226749  1.493543 
sample estimates:
mean of the differences 
              0.1333967

比較兩變異數 $\sigma_1, \sigma_2$ 的差值 $\sigma_1-\sigma_2$ 的檢定

(方法一):等變異數 F 檢定

右尾檢定 左尾檢定 雙尾檢定
H0 $\sigma_1 = \sigma_2$ $\sigma_1 = \sigma_2$ $\sigma_1 = \sigma_2$
H1 $\sigma_1 \gt \sigma_2$ $\sigma_1 \lt \sigma_2$ $\sigma_1 \neq \sigma_2$
> var.test(x, y)

        F test to compare two variances

data:  x and y 
F = 1.3999, num df = 24, denom df = 19, p-value = 0.458
alternative hypothesis: true ratio of variances is not equal to 1 
95 percent confidence interval:
 0.5708604 3.2830579 
sample estimates:
ratio of variances 
          1.399933

(方法二):Smith-Satterthwaite 程序

  • 前提條件:兩 (常態母體) 的變異數不相等時,所使用之檢定方式。

比較兩機率 $p1, p2$ 的差值 $p1-p2$ 的檢定

右尾檢定 左尾檢定 雙尾檢定
H0 $p_1-p_2 = (p_1-p_2)_0$ $p_1-p_2 = (p_1-p_2)_0$ $p_1-p_2 = (p_1-p_2)_0$
H1 $p_1-p_2 \gt (p_1-p_2)_0$ $p_1-p_2 \lt (p_1-p_2)_0$ $p_1-p_2 \ne (p_1-p_2)_0$
> x=c(100, 200)
> y=c(300, 400)
> prop.test(x,y)

        2-sample test for equality of proportions with continuity
        correction

data:  x out of y 
X-squared = 18.7698, df = 1, p-value = 1.475e-05
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.24201562 -0.09131771 
sample estimates:
   prop 1    prop 2 
0.3333333 0.5000000

比較兩組中位數 M 的差值 $M_X - M_Y$ 的檢定 (無母數方法)

右尾檢定 左尾檢定 雙尾檢定
H0 $M_X = M_Y$ $M_X = M_Y$ $M_X = M_Y$
H1 $M_X > M_Y$ $M_X < M_Y$ $M_X \neq M_Y$

(方法一):Wilcoxon Rank-Sum 檢定:兩組獨立觀察值 X, Y 適用

  • 統計量:$\frac{W_m-E(W_m)}{\sqrt{Var(Wm)}}$
  • 其中的:$E(W_m) = [m(m+n+1)/2] ; Var(W_m) = mn(m+n+1)/12$
> x = rnorm(20, mean=5, sd=2)
> y = rnorm(20, mean=5.5, sd=2)
> x
 [1] 5.375763 6.160474 3.155309 6.342408 4.437914 2.769980 6.510839 2.005095
 [9] 3.616549 9.790559 3.322384 4.601135 1.905218 6.635422 4.316334 5.381583
[17] 4.572226 5.938405 2.058560 5.114112
> y
 [1]  3.574096  5.300593  4.814954  3.638376  9.582099  3.905482  3.366089
 [8]  4.421847  4.529616  5.910828  5.673176  5.068274 11.310093  6.790893
[15]  3.401899  2.139871  4.441523  5.868585  8.380567  9.632829
> 
> wilcox.test(x,y, exact=F, correct=F)

        Wilcoxon rank sum test

data:  x and y 
W = 167, p-value = 0.372
alternative hypothesis: true location shift is not equal to 0

(方法二):Wilcoxon Signed-Rank 檢定:兩組成對觀察值 (X, Y) 適用

  • 樣本:兩組成對觀察值 $(X_1, Y_1), (X_2, Y_2), ..., (X_n, Y_n)$
  • 方法:將差距絕對值 $|X_1-Y_1|, |X_2, Y_2|, ..., |X_n, Y_n|$ 由小到大排序,並給予 1..n 的名次。
  • 檢定統計量:看看 $M_X$ 是否夠接近 $M_Y$,如果差很多那麼 W 應該會很大。
  • 正排名權重:$W_+ = \sum_{R_i>0} R_i$
  • 負排名權重:$|W_-| = \sum_{R_i<0} |R_i| ;$
  • W = min(W_+, |W_-|)
> wilcox.test(x,y, exact=F, correct=F, paired=T)

        Wilcoxon signed rank test

data:  x and y 
V = 83, p-value = 0.4115
alternative hypothesis: true location shift is not equal to 0

參考文獻

  1. R 學習筆記/機率分佈/資料分布檢定:https://sites.google.com/site/rprojectnotes/introduction/probability_distributions#TOC-2
  2. R 學習筆記/機率分佈/單樣本與雙樣本檢定:https://sites.google.com/site/rprojectnotes/introduction/probability_distributions#TOC-3

Facebook

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License