2013.11.29 心理及教育統計(八) 類別資料與卡方檢定(Categorical Data & Chi-Square Test)
note:下周為期中考,範圍自推論統計之後,不與上次內容重疊(但若涉及CLT以及抽樣分配則不在此列)。
Review:
Review:
卡方檢定與卡方分配:
- 卡方檢定之統計值,將與自由度少一的卡方分配臨界值比較,而臨界值大小可因不同的alpha標準而定。
- 概念上,假設檢定方法有一對照分配,如同Z-test之比較對象為常態分配,而卡方檢定比較對象為卡方分配。
- 樣本之限制:間斷資料可比連續資料?
- 樣本檢定值建立於樣本結果,理論上性質為間斷資料,然比較分配之卡方分配來自於常態分配,性質屬於連續資料,此二者無法直接比較。
- 有鑑於此,卡方檢定存有一假設,假定樣本數量夠多時,此樣本結果可視為連續資料,因此得以與卡方分配比較臨界值。反之,如勉強以間斷資料比較連續資料,可能出現額外的誤差而影響節我。
- 就標準上而言,如任何細格的期望值低於5的情況下,應考慮使用其他方式完成檢定,如Fisher's exact test。
- 卡方分配的長相受自由度影響,自由度越大的時候卡方將接近常態分配(對稱性上升),此與卡方分配的特質相關:
- 所有數值皆>0。
- 正偏。
- 曲線下面積總和為1。
- alpha值為單尾。
- 卡方分配之平均數為其自由度k、變異數為2k、眾數為2-k、偏態為根號2/k,因此當k趨近於無限大的時候,卡方分配趨近於常態。
- 卡方分配具有加乘性,兩者可以相加而造成自由度相加。
P.s)自由度為總項數-1,代表固定組數,僅需n-1個變數即可填滿完整的數值,換言之其可便項目的數量相對較少。 - 單向度與雙向度:
- 單向度:Goodness of fit test,著重的面向是樣本結果的分配狀態與期望分配狀態是否一致,如一致則顯示其未受到其他因素干擾,機率隨機。
- 雙性度:Contingency test,應用於雙向度的情況,用以檢定此二項度是否彼此影響,或者彼此獨立。
- 比對臨界值為df-1標準的卡方分配標準,可參考講義內的證明。
- 多cell的計算方式,df為(a-1)(b-1)而得:
- 如果為單向度,則可直接判斷其自由度,對照分配為自由度減一的卡方分配。
- 如果為雙向度,則使用(a-1)(b-1)計算之結果,以取得比較分配之自由度。
殘差分析:估計誤差值大小之用,用於多向度的意義較大。
- 殘差的概念,為觀察值與期望值的差異大小,計算方式為觀察值與期望值差除以根號樣本數。
- 將個細格之殘差平方後加總即可得卡方統計值,因此可從其比例大小判斷貢獻度。
- 加上另外一狀況為,統計值之大小並無法反映雙向度內的關係強弱,即便將所有細格的數值直接二倍(數值間的關係並未改變),但結果而言統計值呈現二倍變化,此可知單純的統計值無法反映雙向度間的關係,尚需使用殘差分析以協助釐清這層強度的關係。
- 但僅觀察殘差的數值僅能呈現觀測值與期望值之正負關係,但無法作為解釋之用,尚須結合標準差換算成z score後方能以統計顯著與否解釋結果。
- 殘差分析檢定需使用殘差之標準差,計算方式為根號的總數與列差除以總數與列差,此轉換方式等同於z檢定。
- 如此殘差達顯著,則可解釋為此二項度間呈現某種相關性,以及相關程度有多大。
- 殘差分析的結果,只要出現顯著就需要解釋,因此同一要素可能有二次以上的解釋,如結果顯示男生比較喜歡A黨,但比較不喜歡B黨。(換言之,如果沒有呈現顯著,就不能宣稱相反的結果)
- 卡方檢定的假設:
- 資料點間不可相依,換言之彼此獨立且不重複,或者類別不重疊。
- 當N夠大的時候,樣本資料可假定為常態分配,方能檢定(通常期望值應大於5,另一說法為最少應大於總數之5倍)。
- 應考量所有可能性,包含正面與負面,結果將有所不同。
- 雙向度的處理方式:
- 自由度為行、列數減一後相乘。
- 期望值的取得方式,以及期望值之概念與原理。
- 修正公式:Yate提出修正公式,因卡卡方檢定與二項分配資料皆為間斷資料,但比較對象皆為連續資料,為減少誤差而提出修正公式。
- 勝算比:對於2x2的模式有效,可比較兩者間的倍數關係。
- 簡化公式用於2x2的模式。以及相關公式:
- 交叉相乘之差除以根號各行列總和之乘積。
- 其他檢定法:卡方為其中一種類別檢定法,然有其他可能。
- likelihood ration test(G檢定):對立假設除以虛無假設之機率,如此比值大於臨界值則拒絕虛無假設。
- log-linear model:處理3個以上的變項。
- Fisher's Exact Test:當期望值小於5的時候使用的方式。
期望值的分配:
Fisher's Exact Test- 若沒有特別情況,虛無假設的結果為平均分配、隨機分配,然特定狀況下期望值未必是對半,如基因分配的狀態。
- Exact:實際觀察此模式的發生機率,基於其實際檢測之特性,而稱為exact。
- permutation on observed table:透過排列組合之操作方式,對觀測值進行雙向的推演,觀測其P的變化。
- p-value的判別,依不同的研究假設而定,狀況有三:
- H0:P1=P2時,H1:P1≠P2,此為雙尾模型,故須雙向考慮,將小的極端兩背後,與標準值(常用如0.05, 0.01)比較,以判斷。
- H0:P1≧P2,H1:P1<P2,此為單尾模型,因欲檢測為P1是否小於P2因此檢測小尾。
- H0:P1≦P2,H1:P1>P2,此為單尾模型,檢測為較大之尾。
卡方檢定可做哪些類別的檢定?
- 適配度檢定(goodness-of-fit):檢定母體是否為某一分配。
- 概念:藉由比較樣本觀測值與假設母體之分配是否接近或者相似,用以判斷資料是否來自假設分配。
- 獨立性檢定(independence):檢定兩種隨機變數之間是否相互獨立。
- 概念:檢定兩種隨機變數之間是否相互獨立的方法。
- 舉例:檢定教育與性別是否無關、介入與治療成效是否獨立。
- 同質性檢定(homogeneity):檢定兩組或者多組是否具有相同分配。
- 概念:此方法是檢定分配是否相同,而非檢定分配的類型。
- 舉例:北市與高市的滿意度分配是否相同。
- 名詞解釋:同樣為相關性,但對於不同性質的資料用語不同。
- 連續資料之相關稱為correlation
- 間斷資料之相關稱為association
- 卡方值越大,並不代表x、y間的相關性越大,而僅能反應是否拒絕虛無假設。
- 因將資料兩倍後,資料間的差異理應不變,但實質上卻造成統計值的兩倍,因此可知此結果。
Contingency Coefficient (C):
- 以符號c代表其相關性(association) :
- 計算:根號x^2/(x^2+N),換言之,當N>0的情況下,C絕對不可能達成1,這也是他的缺點。
- C的最大值隨項度而改變,如2x2最大為0.707,而3x3的則為0.816,依序可自行計算取得。
- 簡言之,c的最大值為根號(k-1)/k,k=min(R,C)。
Phi :
- 只能用於2x2的模式,只能用於雙變項,為卡方值除以N的根號。
Cramer's Phi:
- 拓展為2x2以上的模式應用。
- 將Phi根號內的部分,再除以(k-1),也就是最小df。
- 其最大值可為1,相較於C而改善此優勢。
勝算比(Odds Ration):
- 可比較變項與變項間的關係。
- 不限定使用在那些尺寸的模型上。
Cohen's kappa(k):
- 是一種測量同意度(agreement)的方式:
- 如inter-rater的檢定,觀察兩這評分結果的一致性。
- 直觀的部分,計算方式同意(重疊)的部分,除以總個數所得的百分比(percentage of agreement),此做法有點類似看所有可能性後,取兩者相同的狀況。
- Cohen's kappa (k):上述之同意度描述方式,並未特別討論自然發生的或然率,也就是基於機率造成之相同結果,而非因兩評估者皆同意之共識,故提出修正方案,意圖為修正巧合造成的誤差,因而刪去機率之因素稱為chance-corrected。
- 作法:將觀測值與期望值相減後,再除以總數,操作上同agreement的計算,並將分子與分母都減去期望值後所得。
2013.12.02
note:研究假設之設定時,population 1 通常解釋為此研究樣本呈現之結果,或稱研究樣本族群,而population 2 則為假定虛無假設成立時,該族群分配的樣式,換言之,也就是不希望出現的分配。於此條件下,虛無假設被定義為兩族群分配相同,也就是樣本族群分配等同於虛無假設分配,對立假設則為樣本族群分配與虛無假設分配不同,作為檢定方式之基礎。
note 2:執行Chi-square test的時候,第一層算出統計值比較卡方分配,顯示觀察值與標準差的差異是否達顯著,然此數值並不能反應差異幅度,差異幅度須以殘差方式呈現。殘差計算類似於統計值,但因未平方而可觀察其正負號以判斷觀察值與期望值的大小關係。殘差分析尚且需要使用到殘差標準差,此可透過根號之總數與行、列之比值取得各細格的標準差,並將各別殘差除以標準查而得其Z分數,此結果用以討論各別細格是否達顯著差異,可協助解釋數據資料的傾向,作法為固定顯著的項目(行),並討論其在各列的意義。
note 3:Fisher's exact test使用的概念為真實的排列組合計算,雖計算較為繁瑣但檢定結果更為嚴謹,因此結果可信度較高(存在卡方檢定結果為拒絕虛無假設,但Fisher檢定結果為否的情況),缺點為計算繁瑣而不易操作。另註記,如分母的數值複雜且難以代換簡化,可直接取得其簡化後的個別元素並於每次操作的時候直接提取。
留言
張貼留言