2013.12.20 心理及教育統計(十) t' test &統計檢定力

2013.12.20 心理及教育統計(十) t' test &統計檢定力

review

平均數的假設檢定：分為一個樣本與二個樣本的狀況。

單一樣本：是否來自於已知平均數的母群？

已知母群平均數：z-test，典型的假設檢定，0.05以±1.96為臨界值。
不知母群平均數：t-test，因使用樣本平均數推測母群平均數之關係，當樣本數不足時難免有誤差，故其臨界值相較於z-test為大，以維持其嚴謹度。

t分配：受自由度影響，從定義而來的分配方式，相較於常態分配低闊但自由度夠大時同常態分配。

雙數樣本：再分為相依樣本與獨立樣本。

相依樣本：彼此重複且具相關性，如前測後測，使用t-test。
獨立樣本：彼此獨立不互影響，如男女生，再依平均值知道與否區分。

已知母群平均數：z-test。
不知母群平均數：再比較其性質是否為同質。

同質：t-test。
異質：t'-test，其對照的分配為Behrens-Fisher Distribution，使用樣本估計母群變異數。
note：簡單而言，如已知母群變異數就可使用z-test，如不知而使用樣本變異數估計，則使用t-test。唯一例外在於二獨立樣本、不知變異數又變異數不同質的時候，採用t'-test的方式(另描述)。

t-test的假設：

獨立性：個體間須相互獨立，以相依樣本而言，其受測對象是同一批人，因此二樣本相關，但二樣本中個體是彼此獨立的，換言之任一向本中不可有單一個體含有二筆以上的資料。
常態分配：樣本是常態分配中抽取，換言之無論多少樣本，其來自於各自的常態分配。
強韌性：不受偏離假設而影響的特性，換言之當標準不慎嚴格的時候，對偏差的容忍度。

獨立無解釋空間，不獨立無法操作。
近似常態分配也是可以接受的。
比較二樣本的同質性，如二樣本的變異數比例在4倍之內仍可使用t-test，但樣本數不可以太小(否則結果不穩定)。

t'-distribution：不知長相的分配，但t'-test需在此分配上比較臨界值，有二種逼近法，可直接推估臨界值來計算，或者校正其自由度後再比較。

Coochran & Cox estimation of t'(t'之臨界值)：使用舊的臨界值推測新的臨界值。

概念上，分別使用原始樣本之t分配(分別將自由度減1者)，再除以變異數的結合。

Welch(1938)-Satterthwaite(1946) solution-solve of df：使用舊的自由度推測新的自由度。

概念上，使用原始樣本之自由度經處理後，整合為新的自由度，再與t分配比較。

Welch(1947)之修正：校正後取最靠近的整數。
簡易處理法：

基於t分配的臨界值，當自由度越大的時候，其臨界值越小。
而上述逼近法取得的自由度，應該介於二樣本自由度減1之最小值，及二樣本自由度相加減2之間。

變異數同質性檢定：

經驗法則：直接觀察平均值不同，後以變異數比例介於3(或4)倍之內。
檢定方式：F檢定
其他做法：modeling。

統計檢定力

第一類錯誤(alpha)及第二類錯誤(beta)：

第一類錯誤：指實際上為假，但被接受之狀況。
第二類錯誤：指實際上為真，但被拒絕之狀況。

較常使用1-beta，表正確接受真實狀況的事件。

統計檢定力(statistic power)：即1-beta的範圍，表正確拒絕虛無假設的機率。

影響統計檢定力的要素有四：

alpha(significant level)：當alpha↑，beta↓，因而使(1-beta)↑，檢定力上升。
虛無假設與對立假設平均數之差距：可理解為二族群的重疊度。
變異數(population variability)：當變異數↓，則beta↓，則(1-beta)↑。
N(sample size)：當N↑，則beta↓，使(1-beta)↑。

Effect Size (ES)：常以d作為代號，計算方式為二族群平均數之差除以標準差。

Effect size的估計：

來自過去的研究。
根據所收集到的樣本中推估。
使用對照表取得，如Cohen (1998)之標準。

small(0.2)重疊85%
medium (0.5)重疊67%
large (0.8) 重疊53%

Power analysis：可用於決定研究所需之樣本數(N)。

單一樣本之z-test：(假定變異數已知)

如已知N，經過計算後得知其power。

集中delta=d*根號N。
在已知道delta的情況下，決定alpha後查表得power。

已知power，經過計算後得知所需的樣本數(N)。

設定已需的Power，可決定所需的delta。
樣本數N=(delta/d)之平方。

單一樣本的t-test：(假定變異數未知)
雙重相依樣本：

已知N，經計算可得power。
為達成特定power，換算所需樣本數。

雙重獨立樣本：(只使用同質)

已知N計算Power。

如二族樣本數相同，可直接計算取得。
如二族群樣本數不同，可先求調節平均數(harmonic mean)，再計算power。

設定power求取個別樣本數。

note：

就雙重樣本的情況而言，可以分為知道母群變異數與不知母群變異數二種：

知道母群變異數：使用z-test，計算方式為樣本平均數與母群平均數的差值，經標準化換算成檢定值後與臨界值比較。
不知母群變異數：又可分為二變異數同質與不同質的狀況。

變異數同質：經檢定後判定其為同質，則計算變異數之pool，後使用pool完成後續的t-test。
變異數不同質：

留言