2013.12.20 心理及教育統計(十) t' test &統計檢定力
review
平均數的假設檢定:分為一個樣本與二個樣本的狀況。
統計檢定力
平均數的假設檢定:分為一個樣本與二個樣本的狀況。
- 單一樣本:是否來自於已知平均數的母群?
- 已知母群平均數:z-test,典型的假設檢定,0.05以±1.96為臨界值。
- 不知母群平均數:t-test,因使用樣本平均數推測母群平均數之關係,當樣本數不足時難免有誤差,故其臨界值相較於z-test為大,以維持其嚴謹度。
- 雙數樣本:再分為相依樣本與獨立樣本。
- 相依樣本:彼此重複且具相關性,如前測後測,使用t-test。
- 獨立樣本:彼此獨立不互影響,如男女生,再依平均值知道與否區分。
- 已知母群平均數:z-test。
- 不知母群平均數:再比較其性質是否為同質。
- 同質:t-test。
- 異質:t'-test,其對照的分配為Behrens-Fisher Distribution,使用樣本估計母群變異數。
note:簡單而言,如已知母群變異數就可使用z-test,如不知而使用樣本變異數估計,則使用t-test。唯一例外在於二獨立樣本、不知變異數又變異數不同質的時候,採用t'-test的方式(另描述)。 - t-test的假設:
- 獨立性:個體間須相互獨立,以相依樣本而言,其受測對象是同一批人,因此二樣本相關,但二樣本中個體是彼此獨立的,換言之任一向本中不可有單一個體含有二筆以上的資料。
- 常態分配:樣本是常態分配中抽取,換言之無論多少樣本,其來自於各自的常態分配。
- 強韌性:不受偏離假設而影響的特性,換言之當標準不慎嚴格的時候,對偏差的容忍度。
- 獨立無解釋空間,不獨立無法操作。
- 近似常態分配也是可以接受的。
- 比較二樣本的同質性,如二樣本的變異數比例在4倍之內仍可使用t-test,但樣本數不可以太小(否則結果不穩定)。
- t'-distribution:不知長相的分配,但t'-test需在此分配上比較臨界值,有二種逼近法,可直接推估臨界值來計算,或者校正其自由度後再比較。
- Coochran & Cox estimation of t'(t'之臨界值):使用舊的臨界值推測新的臨界值。
- 概念上,分別使用原始樣本之t分配(分別將自由度減1者),再除以變異數的結合。
- Welch(1938)-Satterthwaite(1946) solution-solve of df:使用舊的自由度推測新的自由度。
- 概念上,使用原始樣本之自由度經處理後,整合為新的自由度,再與t分配比較。
- Welch(1947)之修正:校正後取最靠近的整數。
- 簡易處理法:
- 基於t分配的臨界值,當自由度越大的時候,其臨界值越小。
- 而上述逼近法取得的自由度,應該介於二樣本自由度減1之最小值,及二樣本自由度相加減2之間。
變異數同質性檢定:
- 經驗法則:直接觀察平均值不同,後以變異數比例介於3(或4)倍之內。
- 檢定方式:F檢定
- 其他做法:modeling。
統計檢定力
- 第一類錯誤(alpha)及第二類錯誤(beta):
- 第一類錯誤:指實際上為假,但被接受之狀況。
- 第二類錯誤:指實際上為真,但被拒絕之狀況。
- 較常使用1-beta,表正確接受真實狀況的事件。
- 統計檢定力(statistic power):即1-beta的範圍,表正確拒絕虛無假設的機率。
- 影響統計檢定力的要素有四:
- alpha(significant level):當alpha↑,beta↓,因而使(1-beta)↑,檢定力上升。
- 虛無假設與對立假設平均數之差距:可理解為二族群的重疊度。
- 變異數(population variability):當變異數↓,則beta↓,則(1-beta)↑。
- N(sample size):當N↑,則beta↓,使(1-beta)↑。
- Effect Size (ES):常以d作為代號,計算方式為二族群平均數之差除以標準差。
- Effect size的估計:
- 來自過去的研究。
- 根據所收集到的樣本中推估。
- 使用對照表取得,如Cohen (1998)之標準。
- small(0.2)重疊85%
- medium (0.5)重疊67%
- large (0.8) 重疊53%
- Power analysis:可用於決定研究所需之樣本數(N)。
- 單一樣本之z-test:(假定變異數已知)
- 如已知N,經過計算後得知其power。
- 集中delta=d*根號N。
- 在已知道delta的情況下,決定alpha後查表得power。
- 已知power,經過計算後得知所需的樣本數(N)。
- 設定已需的Power,可決定所需的delta。
- 樣本數N=(delta/d)之平方。
- 單一樣本的t-test:(假定變異數未知)
- 雙重相依樣本:
- 已知N,經計算可得power。
- 為達成特定power,換算所需樣本數。
- 雙重獨立樣本:(只使用同質)
- 已知N計算Power。
- 如二族樣本數相同,可直接計算取得。
- 如二族群樣本數不同,可先求調節平均數(harmonic mean),再計算power。
- 設定power求取個別樣本數。
note:
- 就雙重樣本的情況而言,可以分為知道母群變異數與不知母群變異數二種:
- 知道母群變異數:使用z-test,計算方式為樣本平均數與母群平均數的差值,經標準化換算成檢定值後與臨界值比較。
- 不知母群變異數:又可分為二變異數同質與不同質的狀況。
- 變異數同質:經檢定後判定其為同質,則計算變異數之pool,後使用pool完成後續的t-test。
- 變異數不同質:
留言
張貼留言