2013.12.20 心理及教育統計(十) t' test &統計檢定力

review

平均數的假設檢定:分為一個樣本與二個樣本的狀況。
  • 單一樣本:是否來自於已知平均數的母群?
    • 已知母群平均數:z-test,典型的假設檢定,0.05以±1.96為臨界值。
    • 不知母群平均數:t-test,因使用樣本平均數推測母群平均數之關係,當樣本數不足時難免有誤差,故其臨界值相較於z-test為大,以維持其嚴謹度。
      • t分配:受自由度影響,從定義而來的分配方式,相較於常態分配低闊但自由度夠大時同常態分配。
  • 雙數樣本:再分為相依樣本與獨立樣本。
    • 相依樣本:彼此重複且具相關性,如前測後測,使用t-test。
    • 獨立樣本:彼此獨立不互影響,如男女生,再依平均值知道與否區分。
      • 已知母群平均數:z-test。
      • 不知母群平均數:再比較其性質是否為同質。
        • 同質:t-test。
        • 異質:t'-test,其對照的分配為Behrens-Fisher Distribution,使用樣本估計母群變異數。
          note:簡單而言,如已知母群變異數就可使用z-test,如不知而使用樣本變異數估計,則使用t-test。唯一例外在於二獨立樣本、不知變異數又變異數不同質的時候,採用t'-test的方式(另描述)。
  • t-test的假設:
    • 獨立性:個體間須相互獨立,以相依樣本而言,其受測對象是同一批人,因此二樣本相關,但二樣本中個體是彼此獨立的,換言之任一向本中不可有單一個體含有二筆以上的資料。
    • 常態分配:樣本是常態分配中抽取,換言之無論多少樣本,其來自於各自的常態分配。
    • 強韌性:不受偏離假設而影響的特性,換言之當標準不慎嚴格的時候,對偏差的容忍度。
      • 獨立無解釋空間,不獨立無法操作。
      • 近似常態分配也是可以接受的。
      • 比較二樣本的同質性,如二樣本的變異數比例在4倍之內仍可使用t-test,但樣本數不可以太小(否則結果不穩定)。
  • t'-distribution:不知長相的分配,但t'-test需在此分配上比較臨界值,有二種逼近法,可直接推估臨界值來計算,或者校正其自由度後再比較。
    • Coochran & Cox estimation of t'(t'之臨界值):使用舊的臨界值推測新的臨界值。
      • 概念上,分別使用原始樣本之t分配(分別將自由度減1者),再除以變異數的結合。
    • Welch(1938)-Satterthwaite(1946) solution-solve of df:使用舊的自由度推測新的自由度。
      • 概念上,使用原始樣本之自由度經處理後,整合為新的自由度,再與t分配比較。
    • Welch(1947)之修正:校正後取最靠近的整數。
    • 簡易處理法:
      • 基於t分配的臨界值,當自由度越大的時候,其臨界值越小。
      • 而上述逼近法取得的自由度,應該介於二樣本自由度減1之最小值,及二樣本自由度相加減2之間。
變異數同質性檢定:
  • 經驗法則:直接觀察平均值不同,後以變異數比例介於3(或4)倍之內。
  • 檢定方式:F檢定
  • 其他做法:modeling。

統計檢定力

  • 第一類錯誤(alpha)及第二類錯誤(beta):
    • 第一類錯誤:指實際上為假,但被接受之狀況。
    • 第二類錯誤:指實際上為真,但被拒絕之狀況。
      • 較常使用1-beta,表正確接受真實狀況的事件。
  • 統計檢定力(statistic power):即1-beta的範圍,表正確拒絕虛無假設的機率。
    • 影響統計檢定力的要素有四:
      • alpha(significant level):當alpha↑,beta↓,因而使(1-beta)↑,檢定力上升。
      • 虛無假設與對立假設平均數之差距:可理解為二族群的重疊度。
      • 變異數(population variability):當變異數↓,則beta↓,則(1-beta)↑。
      • N(sample size):當N↑,則beta↓,使(1-beta)↑。
  • Effect Size (ES):常以d作為代號,計算方式為二族群平均數之差除以標準差。
    • Effect size的估計:
      • 來自過去的研究。
      • 根據所收集到的樣本中推估。
      • 使用對照表取得,如Cohen (1998)之標準。
        • small(0.2)重疊85%
        • medium (0.5)重疊67%
        • large (0.8) 重疊53%
    • Power analysis:可用於決定研究所需之樣本數(N)。
      • 單一樣本之z-test:(假定變異數已知)
        • 如已知N,經過計算後得知其power。
          • 集中delta=d*根號N。
          • 在已知道delta的情況下,決定alpha後查表得power。
        • 已知power,經過計算後得知所需的樣本數(N)。
          • 設定已需的Power,可決定所需的delta。
          • 樣本數N=(delta/d)之平方。
      • 單一樣本的t-test:(假定變異數未知)
      • 雙重相依樣本:
        • 已知N,經計算可得power。
        • 為達成特定power,換算所需樣本數。
      • 雙重獨立樣本:(只使用同質)
        • 已知N計算Power。
          • 如二族樣本數相同,可直接計算取得。
          • 如二族群樣本數不同,可先求調節平均數(harmonic mean),再計算power。
        • 設定power求取個別樣本數。
note:
  • 就雙重樣本的情況而言,可以分為知道母群變異數與不知母群變異數二種:
    • 知道母群變異數:使用z-test,計算方式為樣本平均數與母群平均數的差值,經標準化換算成檢定值後與臨界值比較。
    • 不知母群變異數:又可分為二變異數同質與不同質的狀況。
      • 變異數同質:經檢定後判定其為同質,則計算變異數之pool,後使用pool完成後續的t-test。
      • 變異數不同質:

留言

熱門文章