敘述統計

隨機抽樣

母體 => (獨立性) X1, X2, …. , Xn 等 n 個隨機變數相互獨立 => 取出 x1, x2, …., xn 等 n 個觀察值。

敘述統計

敘述統計乃是隨機抽樣的樣本集合,進行某些計算與繪圖,以變成忠實的呈現出樣本的某些特性。這些計算出的數值,以及呈現出來的圖形,可以反映出樣本的某些統計特性,讓統計者能透過數值或圖形,大致了解樣本的統計特徵。

統計數值

  • 樣本平均數:(mean) $\bar{X} = \frac{\sum_{i=1}^n X_i}{n}$
  • 樣本中位數:(median) 樣本排序後最中間位置的數值
  • 樣本變異數:(Sample variance) $S^2 = \sum_{i=1}^n \frac{(X_i - \bar{X})^2}{n-1} = \frac{n \sum_{i=1}^n X_i^2 - (\sum_{i=1}^n Xi)^2}{n (n-1)}$
    • 注意:變異數的定義為 $\delta^2 = E[(X-\mu)^2]$,上述的樣本變異數必須除以 n-1 才是變異數的不偏估計量,而不是除以 n。
  • 樣本變異數:(Sample standard deviation) 樣本變異數中的 S 稱為樣本標準差。
  • 樣本全距:(range) 樣本中最大的觀察值減去最小的觀察值 $\omega = X_H-X_L$
  • 離群值:(outlier 或 wild) 離其他樣本很遠,特別大或特別小的樣本值。
  • 樣本四分數間距:(interquartile range, iqr) $iqr = q_3 - q_1$

統計圖

  • 莖葉圖:(stem-and-leaf diagram)
  • 雙莖葉圖:(double stem-and-leaf diagram)
  • 直方圖:(histogram)
  • 肩型圖 (累加分配圖):(relative cumulative frequency ogive)
  • 盒型圖:(boxplots) 由四分位數 q1, q3, 以及內籬笆 f1, f3 (inner fences), 連接值 a1, a3 與外籬笆 F1, F3 (outer fances) 所組成的圖形。
    • f1 = q1 - 1.5 iqr; f3 = q3 + 1.5 iqr;
    • F1 = q1 - 3.0 iqr; F3 = q3 + 3.0 iqr;
    • a1 是大於且最接近 f1 的數據點; a3 小於且最接近 f3 的數據點。
Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License