2014.03.14 教育及心理統計(三) 多重比較
F檢定之後?
多重比較
- type of error rate : PC≦FW≦alpha
- error rate per comparison (PC):個別比較的alpha,以a'描述之
- family error rate (FW):整體之alpha,可理解為至少犯一個type I error的機率,計算方式為1-(1-a')^C,其中進行C次檢驗。
- 事前比較vs事後比較
- 事前比較:檢驗前已鎖定特定對象後,可能基於以往研究或經驗,進行比較並理解特定關係。
- 事後比較:檢驗後發現不同,從而檢視何者不同,屬於探索性的模式。
事前比較
- multiple t tests:最簡單,此作法的缺點為未能控制整體alpha。
- 變異數同質 因E(MSE)為o^2的不偏估計,並以MSE之df取得自由度。
- n相等
- n不等
- 變異數不同質 使用s當作分母處理之。
- n相等
- n不等(Welch法)
- linear contrasts:
- linear combination 線性組合:將所有數值加總,呈現係數為1之線性組合。
- L=CX+CX+CX+CX...,則當C=1時,L為X之總和。
- 當C=1/J,則L為X之平均。
- linear contrasts 線性對比:於上述加總的狀態中,如係數總和為0的狀況,稱為linear contrasts,於線性對比的狀況下,依照各組係數之排列關係,可看出為何者之間的比較,如:
- 1 -1 0 0:為第一組與第二組的比較。
- -1 -1 1 1 :為第一組與第二組,和第三組與第四組之比較。
- 1/3 1/3 1/3 -1:為第一組、第二組與第三組及第四組之比較。
- 其變異數:同樣L的狀態,因變異數為平方概念,將常數C提出後呈現平方狀態,而樣本平均數之抽樣分配依據CLT呈現o/n,因此描述為s^2/n。
- 其抽樣分配來源為常態分配,因常態分配的加減處理結果仍為常態。
- 假定F為t^2,則可將該式平方,其中MSE為SSE/df,分子可定義為SS/1,而此為卡方分配/卡方分配,因此得到F分配之對照。
- 總結而言,定義各組係數,取得其sum of square,並且計算F值並比較F分配,搭配虛無與對立假設之描述。
- 虛無假設可寫為L=0,或者(u1+u2+u3)/3-(u4+u5)/2=0
- Orthogonal contrasts 垂直(獨立)正交,為各SS之間的關係
- 當linear contrasts成立(係數總和為0),且係數乘積總合為0者,稱為orthogonal contrasts,如:
狀況一:1*1+1*(-1)+0*(-2)=0,符合 - 1 -1 0
- 1 1 -2
- 如Orthogonal contrasts成立,可將SS for between拆解成J-1部分(當自由度為J-1時),概念上將大圓拆解成數個彼此不重疊的片段,並且將片段總和則同大圓。
- Bonferroni t (Dunn's test)
除概念較簡單,且有現成表單可以查詢/整體概念為控制alpha rate。 - 基於Bonferoni inequality(不等式):事件發生的機率,至多為所有事件機率之總和。
- FW≦a+a+a+a+a.......,表整體的alpha至多為個別比較之alpha加總。
- 當所有的alpha相等時,FW=ca(有c個alpha),因此總出錯率為a/c。
- 基本上同F檢驗,只是會控制alpha,使用Dunn's table 查臨界值(以df和C,比較次數查表)。
- Dunn-Sidak tests (based on multiplicative inequality) P(FW)≦1-(1-a)^c
- a'=1-(1-a)^1/c
- 基本上Bonferroni的作法與Dunn-Sidak的作法結果相似,唯前者較簡易而廣為應用。
- Holm test
- 作法類似Bonfferoni,唯一差別在於其假定的alpha rate不同,Bronfferoni為平均分配並彼此相等,而Holm的做法則為各自不同,總和一致。
- 概念上,將t自小排列到大,並依序給予其alpha為a/1,a/2,a/3,a/4:
- 計算所有contrasts,依t'數值大小排列(無論正負,從小到大),依序查表得出臨界值從而比較。
- 控制family error rate不超過alpha:
- 使用Bonferroni:查Dunn's table。
- 使用Holm:查Dunn's table。
- Holm法之CI比較窄,比較powerful。
- alpha大,表其臨界值小,信賴區間小,拒絕區域大,較容易拒絕虛無假設,比較powerful。
- Larzelere and Mulaik test: equivalent to Holm's test,但用在correlation coeffs可控制FW
- 重點為其適用於檢定相關,而非平均數假設檢定。
- 其針對不同比較對象,給予不同的alpha rate,其計算方式a'=a/(k-i+1),其中k表示進行比較之次數,i表自大排到小的排序。
- 因此,總比較數大的時候,其a'數值會比較小。
- 排序較小者(表其相關性較大者),其alpha較大;排序較大者(相關性較小者),其alpha較小。
- 但使用Bonferroni則所有的alpha皆為a/k。
事後比較
- Fisher's Least Significant Difference (LSD) Procedure, Fisher's Protected t test
- 其檢驗公式與multiple t tests類似,然而其概念有所差異在於LSD需要顯著F之後才執行,且如果虛無假設為真,可保證其FW=alpha;但如果虛無假設不為真,則整體 F檢定無法確保其FW。
- 故有人不建議使用此法。
- (student) Newman-Keuls test:計算組間差別,並調整其自由度r=i-j+1,又稱為range或step,表其隨組數變化而來。(注意此r指自由度)。
- 此作法的缺點同LSD,無法妥善管理alpha rate。
- 定義W=q根號(MSE/n),而q之r為(i-j+1),表其受到其所在欄位影響,故可得數個W值。
- 將平均數依大小排序後,橫軸為i,縱軸為i,因此第一欄位的應該為2-1+1=2,同理。
- 第四行第二列的數字,應為4-2+1=3。
- 除傳統的星號表示方式,也可使用線段表示其差異(達顯著者為不同線段,不顯著者在同一線段)。
- Tukey's honestly significant difference (HSD) tests
- 如果所有比較都是pairwise,則可控制FW。
- 如果都用在pairwise comparisons,可使用Tkey's HSD tests。
- 其也可用在非pairwse comparisons,但此狀況比較適合使用Scheffe 法。
- 通常使用在樣本數相等的情況,如樣本數不同則稱為Tukey-Kramer procedure。
- D=HSD=q根號(MSE/N),對n相等。
- Tukey-Kramer procedure因n不等,因此需要調整加權後再使用。
- Behrens-Fisher approach:當變異數不同質,修正其自由度後再查表。
- 此作法允許N與變異數不同之狀況。
- The Ryan Proceudre (REGWQ, Ryan/Einot/Gabriel /Welsch):
- Tukey較複雜,但較能控制FW
- Newman較powerful,但無法妥善控制fW
- 其各自有不同的處理方式,但因計算之困難,因此多使用統計軟體執行。
Studentized Range Statistic (q)
- q=(Xl-Xs)/根號MSE/n,其中Xl表最大平均數,Xs表最小平均數。
- 對照q之分配,考慮alpha, r df,其中r表組數。
- q與t的關係為,q=t根號2。
- 將公式移項調整後,可另D=最大最小平均數差=q根號(MSE/n),其意義代表二組差異達顯著之最小值。
作者已經移除這則留言。
回覆刪除作者已經移除這則留言。
回覆刪除作者已經移除這則留言。
回覆刪除請問正交比對為何比較數是J-1?是因為df為J-1(我不這麼覺得),或是有其他證明呢?非常想知道...謝謝
回覆刪除同學您好
刪除我想這邊的主要原因是當這些linear contrasts為orthogonal contrasts時,其恰可將SSBetween分為數個不重疊的SSL,而每個SSL的自由度均為1,於此狀況下,由於整體SSB的自由度是J-1,故SSL之自由度總合亦須為J-1。