2013.11.22 心理及教育統計(七)
Preview:
Today:
處理類別資料
- 類別資料:如頻率、次數、人數,完整且為整數的資料。
- 若虛無假設成立,表事件發生為隨機,因而存在期望值(expected)。
- 卡方檢定(Chi-square)可用以檢定所得結果(觀察值)與期望值間的差距,進而判斷是否達顯著差異。
- 卡方檢定:屬於假設檢定的一種,著手點在於觀察值與期望值是否相似,如兩者相似則接受虛無假設,如兩者差異大則拒絕虛無假設,詳下收。
- 具體而言:卡方分配假定虛無假設成立之分配方式,而抽樣分配之結果如與卡方分配一致,則視為接受虛無假設,如兩者明顯差異,則視為拒絕虛無假設。
卡方檢定(Chi-square test):處理類別資料之檢定方式
- 概念上,卡方檢定乃透過樣本數值與期望值之差距是否達顯著,從而判斷接受或者拒絕虛無假設。
- 比較 Z-test V.s Chi-square:
- Z-test建立於常態分配之模型之上,以標準Z分配與機率模型為本,以判斷樣本與對照族群是否相同,進而檢測假設是否成立。
- Chi-square建立於卡方分配之上,假定虛無假設之情況為隨機分配,從而比較樣本與期望值之差異,以判斷假設是否成立。
- note:名詞界定之必要性,如Z分配與Z檢定乃不同之物,前者為標準常態分配,後者則建立在常態分配模型上的檢定手法;同理,卡方檢定與卡方分配有所不同,前者為建立於卡方分配之上的檢定手法,而後者則為數據分配之型態。
卡方分配(Chi-square distribution)
- 卡方分配:自X~N(u,o^2)後抽取各變項,經標準化後平方所得。
- 符號以X^2描述,右下記錄其自由度,不同自由度有不同分配長相。
- 換言之,卡方分配為經平方與操作後之結果。
- 自由度(df):受不同數目之Z^2組合而定。
- df=1:將個別x化為z分數後平方之分配,稱為自由度為1之卡方分配。
- df=2:將個別x化為z分數後平方,並隨機抽取二個相加所得的分配方式,稱為自由度為2的卡方分配。(任二個z平方相加所得的新的Z平方)。
- df=3:同理,將個別z平方的,任選三個相加視為一個新的Z平方,稱為自由度為3的卡方分配。
- 因此,任取n個z方相加作為一個新的Z平方,即為自由度為n的卡方分配。
- 此外,卡方分配受自由度影響,當自由度越大的時候,卡方分配越靠近常態分配。
- 卡方分配特質:
- 曲線下面積為1,可用機率判斷之。
- 正偏分配。(自由度越大,越趨近常態)
- 分配受自由度影響。
- 所有數值>0(因平方而來)。
- alpha全部單尾(因為平方)。
- 臨界值:
- 當df=1,alpha=0.05,Z^2=1,96^2=3.84。
but,為什麼使用雙尾的平方,而非單尾的平方? - 平均數為其自由度(k),而變異數為自由度二倍(2k),眾數出現於(k-2)。
- 偏態:(根號2/k)>0,因此必為正偏;而當k變大的時候其偏態可趨近於0因而趨近常態。
- 具有加成性:假定Xk和Xl為兩個獨立的卡方分配,則可將二者相加產生新的X(k+l),並且將自由度直接相加。
- eg.自由度為5以及自由度為3的卡方分配,加成之後成為自由度為8的卡方。
- 樣本變異數為卡方分配。
- 自母群抽取樣本,分別審視其平均數與變異數:
- 當樣本數夠大的時候,樣本平均數之抽樣分配呈現常態分配,且樣本平均數之抽樣分配的變異數,與母群變異數的關係由樣本大小瓜分。
- 樣本變異數的抽樣分配,其本身性質即為自由度為n-1的卡方分配(正偏),其中n代表抽取樣本之大小。
- 回憶過去,曾接受「樣本變異數是母群變異數的不偏估計」,換做數學符號寫為E(s^2)=o^2,代表經過無數次抽出放回的程序,樣本變異數抽樣分配將呈現常態分配,因而逼近於母群的變異數。
利用卡方分配檢驗單向度的類別資料:
- 當虛無假設成立時,理應觀察值與期望值相同,比較二者間差異的方法,稱為卡方檢定。透過樣本可計算出卡方估計值,並且比較卡方分配查表所得的臨界值,來判斷是否拒絕虛無假設。
- 卡方估計值(X^2 test statistic):將觀測值與期望值差平方,除以期望值之總和。
- Pearson's Chi-square test:
- 1-dimensional test:Goodness-of-fit test
- 2-dimensional test:Contingency test .
- 卡方分配臨界值的判定,使用自由度減1(k-1)的標準,概念如之前所述。
殘差分析(residual analysis):用以估計誤差值的大小。
- 殘差:為觀察值與期望值的差,除以根號期望值(即為卡方分配單一項目的根號結果)。
- 如O>E,殘差>0;反之,如O<E,殘差<0。
- 殘差的正負,可知觀察值與期望值的大小關係。
- 殘差的大小,可觀察其貢獻度有多少。
- 備註:儘管虛無假設是建立在隨機之上,但實際上應指自然現象,如基因分配的機率就有所不同。
卡方檢定 V.S 卡方分配
- 卡方檢定分配為間斷,而卡方分配為連續(來自常態分配)。
- 當樣本數夠大的時候,可將間斷資料視為連續分配,方能用此方式檢驗。
- Np或者Nq很大的時候,卡方檢定值分配傾向連續,可以常態分配逼近,此時進行卡方檢定其統計值與來自卡方分配(連續的分配)的臨界值比較才有意義。
- 反之,Np或者Nq很小時,卡方檢定值之分配是不連續的,不能以卡方分配視之。
雙向度卡方檢定(2-dimensional Chi-square test):
- 概念上,將兩個z^2相加所得的卡方分配型態,因此利用其相加性,使兩個獨立的卡方分配相加後處理之。
- 自由度:自由度為兩者各減1後相乘,舉例而言,如果是df=5和df=4的兩個卡方分配相加,則呈現(5-1)(4-1)的自由度,也就是4*3=12=df。
- 期望值取得:將該數值所在的行、列總值相乘,後除以總數。
- 但為何以此方式取得期望值? 以黑白娃娃的研究為例
- 說法一:假設年代與黑白偏好無關,則二年份選娃娃的比例相同。
- 說法二:1939年分配到W和B的比例,應等同於兩者加總後的分配比例。因此,252*197/341。
Yate's Correction for Continuity:無論單向度與多向度,本質皆為間斷資料,因此與二項分配相同,也存在修正公式以調整其與連續比較之適切性。
- 單向度:基本上於分子減0.5即可。
- 雙性度:同上。
雙向度之殘差分析(Residual analysis for 2-dimensional test):
- 殘差之總和即為統計檢定值。
- 欲決定殘差之顯著性,尚需要殘差之標準差:
- 各別cell有自己的標準差:根號之總數減行總數/總數檢列總數。
- 將殘差進行Z檢定後,可比較各cell殘差值得顯著與否。
勝算比(Odds ration):
- 分子分母皆為比值的重況下進行比較,稱為勝算比。
- 以黑白娃娃為例:1939年喜歡白娃娃的比例除以1970年喜歡白娃娃的比例,相除結果為4.5倍。
- 此勝算比可用於更大的表格中,並且將之延伸產生比較效果。
二維表格的特例:可利用邊緣頻率計算卡方值。(參考講義)
二變項相關(binary, dichotomous):亦可利用邊緣計算。(參考講義)
卡方檢定之假設
- 卡方檢定的數值,應與卡方分配(特別是df-1者)比較,然前者理應間斷資料,而後者為連續資料,如何比較這二種不同類型之資料,乃本段討論之重點。
- 卡方檢定之假設:
- 假設資料間互相獨立(independence of observation),換言之,單一個體只能出現在一個細格中。
- 類別範圍不可重疊(categories must be mutually exclusive)。
- 假定卡方檢定分配為連續(normality==continuity),即為E(Np)需夠大,通常設定Np≧5為標準。
- 必須考慮所有情況,而不能只考慮部分情況。
- 舉例而言:鄉村與都市小孩喜歡日光節約時間與否
- 只考慮喜歡時,結果可能為接受虛無假設。
- 同時考慮喜歡與不喜歡(此為所有狀況),結果為拒絕虛無假設。
- 因此,考慮所有可能性之周全性,方能有意義的討論所有資料。
其它檢定法:
- 類別資料並非只有卡方檢定方式,如可用likelihood ratio test進行比較。
- Likelihood ration test:二個可能性比值之比較,分別為在虛無假設成立下成立的可能性,以及在對立假設成立下的可能性進行比較,此檢定方式稱為G square。此比值如果越大,則越接受對立假設。
- 處理三個以上的變項,使用log-liner model較為適切。
- 當期望值<5的時候,可使用Fisher's Exact Test。
note: 2013.11.28
- 假設檢定之重點,應為「研究假設與虛無假設」何者為真的二元判別上,儘管處理的資料性質不同、使用手法各有差異,但都在討論是否接受/拒絕虛無假設,並且存在著機率上的可能性誤差。
- 面對不同性質的資料,如nominal data, interval data等,基於其特質有不同的處理方式與限制,因而對應到不同性質的檢定方法上,如使用z-test對應到interval data,而使用Chi-square對應nominal data。
- 獲得之樣本分配資訊,用以比對假設虛無假設成立之分配狀態,而不同檢定方式建立於不同的分配模型上,如Z-test建立於常態分配,而Chi-square建立在卡方分配上。
- 各檢定方式之結果,以是否達統計顯著作結,然是否達統計顯著僅考慮第一型錯誤的發生率,並且第一型與第二型錯誤呈現相反關係,如提高檢測標準將減少第一型錯誤的產生,同時也增加第二型錯誤的機會,反之亦然。因此,選用何種標準,應視目標與成本、嚴重程度之考量而定。
- 檢測之結果僅能以是否達顯著差異描述之,因採用否證之方式,故無法以直接以支持/否定理論解釋,換言之,存在因樣本特質強度不足以拒絕虛無假設,但實質上研究假設為真的情況,故對於結果之詮釋需更為謹慎。
- 效果值(effect size)用以描述兩族群差異的程度,或可理解為介入後造成變化的強度有多少,基於比較之需求通常將其標準化,即為兩族群之差除以母群標準差而得。簡易標準中,0.2表small effect、0.5表medium effect及0.8表larger effect。
P.s)顯著呈現與否受二因素影響,一為效果值之大小,二為樣本數之多寡。
留言
張貼留言