2014.03.28 教育及心理統計 (四) 多重比較
ANOVA
- 其虛無假設為組間平均值沒有差異,而檢定達顯著差異時,只表示「至少一組與其它組別有差異」,但未指出那些組別有所差異。
- 基於上述原因,於F檢定後執行多重比較可得到更細緻的結果;然重複多次比較將造成誤差增加而失去可信度。
多重比較
- 多重比較分為事前比較與事後比較,並且有各自的計算方式與策略。
- 事前比較
- multiple t-test最為簡單
- 特色為使用MSE作為母群變異的不偏估計,其使用MSE之自由度。
- Linear contrasts特色為當常數總和為零之狀況稱為linear contrasts
- 利用細數一致不同的方式排除組別,從而比較差異。
- Orthogonal contrasts有垂直正交的概念,換言之任二組乘積總和為零,表是SSbetween可以被拆成j-1個SS片段。(通常這些片段可能彼此重疊)
- Bonferroni t tests (Dunn's tests)特色為控制整體alpha不超過alpha,並且分配各別alpha到各組別間
- 其方式類似multiple t-tests,但Bonferroni t tests有控制alpha。
- Bonferroni的特色在於其可直接查表,相較於其他方法較容易執行。
- Bunn-Sidak test 同樣控制總alpha,結果與Bonferroni tests相似。
- Holm tests 長相類似t-test,特色為不同比較使用不同臨界值。
- 依序排列後與檢驗值比較。
- 目標為控制整體alpha。
- Holm相較於Bonferroni之CI更小,換言之更具power
- 事後比較
- Fisher's Least Significant Difference (LSD)
- 計算類似multiple t tests,差別在於LSD為事後檢定(於F-tests前後)
- 具爭議,未必建議使用
- Newman-Keuls test 須注意r定義為u-j+1,以此找尋不同臨界值
- 以共線與否呈現其是否有差異
- Tukey's honestly significant difference 特色為皆使用在pairwise comparisons(一對一比較),而不使用complex comparisons(組合後比較)
- 使用於pairwise comparisons,則稱為Tukey's HSD tests
- 使用非pairwise comparisons則無法控制整體alpha,故建議改用其他方式
- 如果n不相等則為Tukdy-Kramer procedure
- 當變異數不同質,則可使用Behrens-Fisher approach,校正df
- 故Tukey可用在n不相等與變異數不同質,但計算繁瑣
- The Ryan Proceudre (REGWQ): Ryan/Einot/Gabriel/Welsch 考量修正alpha之效ˋ能
- Newman較保守,但power較差;Tukey較power但繁瑣
- Scheffe tests可用於各種contrasts,但可能過於保守造成難以顯著,故用上可能放寬標準為0.1
- 僅針對單組狀況下,Sceffe之CI較寬,較容易接受而保守 ?
- Dunnett's Test
- 組平均與控制組平均比較,如差異大於臨界值則接受虛無假設
- 若n不同,則使用平均方式取代之
- Bonferroni與之比較,Dunnett's較為power。
- studentized Range Statistic (q) 表最小達成顯著的差異距離
- 適用於Newman、REGWQ及Tukey三種比較方式。
- Newman、Tukey、Scheffe及Dunnett's 均使用最小距離判斷是否達顯著
- Newman、REGWQ及Tukey使用q
- Scheffe使用(r-1)F
- Dunnet則使用查表td方式處理
Summary of multiple comparisons(參考比較表)
Holm, Newman and REGWQ使用不同的臨界值。
Scheffe之臨界值較高,故較為保守
多因子變異數分析 (Factorial design) (ANOVA,≧2 independent variance)
- 多因子指有二個以上的獨立變項
- one-way ANOVA可用二度表格呈現,使用i,j描述其編碼與組別
- two-way ANOVA可直接延伸one-way的概念
- 將i定義為第二變項的編號
- 增加k定義為編碼數
- factor effects model增加各組間的關聯性比較
- three-way ANOVA
- i,j,k定義為變項編號
- l定義為所屬組別編碼
- cell mean model 共同影響+error
- factor effects model (共同影響+ab+bc+ac+abc)+error
由此可見其推廣的規律性 - 操作紀錄
- 效果:各組平均與總平均之差
- 單一變項內之效果總合為0,表無主要影響
- interaction effect
- 計算自cell mean / factor effect之計算合併調整而來
- 代表該格平均,扣除A、B變項平均,加上總平均
- 如推廣到abc,則為所在組平均,扣除A、B及C平均,加上AB、AC、BC平均,後再扣除ABC平均。
- 總交互作用之和為0
- 縱向總和為0
- 橫向總和為0
- 若沒有interaction effect,每一個皆為0
- 參考講義additive factor effects (加成性)
- two-way ANOVA之前提
- independence
- normality 每一個細格有各自常態分配
- homogeneity of variance 每個細格有同質變異數
- model (同樣可分為cell mean, factor effect model寫法) / 參考講義之表格
- fix 二變項為固定, Ho:a1=a2=a3=0
- random 二變項隨機, H0:oa^2=0
- mixed 一變項固定,一變項隨機 H0:a1=a2=a3=0
- effect
- main effect
- 無視另外一個變項之比較
- A效果: 無視B而比較A之變項組平均
- interaction effect 一因子是否受到另一因子的程度影響
- 繪plots圖,並且看線段有無交叉
- A main effect,無視B因素的平均是否改變
- B main effect,無視A因務的平均是否改變
- interaction effect,圖形是否交叉
------------------------------------------------------------------------------------------------------
Note: Orthogonal contrasts 補充
Orthogonal contrasts之條件有三:
一、各linear 係數總和為零。
二、任二linear係數相乘之總和為0。
三、若n組比較,可產生n-1組linear。
需同時符合上述三點方為嚴格定義之Orthogonal contrasts
Note2: q及距離整理
- 使用最小平均差判斷顯著與否者有:Newman, Tukey, Scheffe,REGWQ and Dunnet
- 其中Newman、REGWQ及Tukey使用q
- Scheffe使用(r-1)F
- Dunnet使用td
Note3: r的意義
多重比較衝經常使用r作為查表的參數之一,然不同比較方式中r的意涵有所差異。
Newman的r代表組的差異修正值,即i-j+1
Tukey的r代表組數
Scheffe的(r-1)代表組數
Dunnett的r代表組數
Bronfernni的c代表比較次數(如3組任二二比較,則得C3取2=6)
Note4: 不同的比較方式有其alpha的大小與適用對象
適用於與控制組比較=> Dunnett's (for comparing all treatments with a control)
留言
張貼留言