2013.11.29 心理及教育統計(八) 類別資料與卡方檢定(Categorical Data & Chi-Square Test)

note:下周為期中考,範圍自推論統計之後,不與上次內容重疊(但若涉及CLT以及抽樣分配則不在此列)。
Review:
  • 類別資料:如處理頻率、人數等整數型資料。
  • 卡方檢定:概念為在虛無假設成立為前提,比較觀察值與期望值之差距而判斷此樣本資料是否出於對照分配之檢定方式。
卡方檢定與卡方分配:
  • 卡方檢定之統計值,將與自由度少一的卡方分配臨界值比較,而臨界值大小可因不同的alpha標準而定。
    • 概念上,假設檢定方法有一對照分配,如同Z-test之比較對象為常態分配,而卡方檢定比較對象為卡方分配。
  • 樣本之限制:間斷資料可比連續資料?
    • 樣本檢定值建立於樣本結果,理論上性質為間斷資料,然比較分配之卡方分配來自於常態分配,性質屬於連續資料,此二者無法直接比較。
    • 有鑑於此,卡方檢定存有一假設,假定樣本數量夠多時,此樣本結果可視為連續資料,因此得以與卡方分配比較臨界值。反之,如勉強以間斷資料比較連續資料,可能出現額外的誤差而影響節我。
    • 就標準上而言,如任何細格的期望值低於5的情況下,應考慮使用其他方式完成檢定,如Fisher's exact test。
  • 卡方分配的長相受自由度影響,自由度越大的時候卡方將接近常態分配(對稱性上升),此與卡方分配的特質相關:
    • 所有數值皆>0。
    • 正偏。
    • 曲線下面積總和為1。
    • alpha值為單尾。
    • 卡方分配之平均數為其自由度k、變異數為2k、眾數為2-k、偏態為根號2/k,因此當k趨近於無限大的時候,卡方分配趨近於常態。 
    • 卡方分配具有加乘性,兩者可以相加而造成自由度相加。
      P.s)自由度為總項數-1,代表固定組數,僅需n-1個變數即可填滿完整的數值,換言之其可便項目的數量相對較少。
  • 單向度與雙向度:
    • 單向度:Goodness of fit test,著重的面向是樣本結果的分配狀態與期望分配狀態是否一致,如一致則顯示其未受到其他因素干擾,機率隨機。
    • 雙性度:Contingency test,應用於雙向度的情況,用以檢定此二項度是否彼此影響,或者彼此獨立。
  • 比對臨界值為df-1標準的卡方分配標準,可參考講義內的證明。
  • 多cell的計算方式,df為(a-1)(b-1)而得:
    • 如果為單向度,則可直接判斷其自由度,對照分配為自由度減一的卡方分配。
    • 如果為雙向度,則使用(a-1)(b-1)計算之結果,以取得比較分配之自由度。
殘差分析:估計誤差值大小之用,用於多向度的意義較大。
  • 殘差的概念,為觀察值與期望值的差異大小,計算方式為觀察值與期望值差除以根號樣本數。
    • 將個細格之殘差平方後加總即可得卡方統計值,因此可從其比例大小判斷貢獻度。
  • 加上另外一狀況為,統計值之大小並無法反映雙向度內的關係強弱,即便將所有細格的數值直接二倍(數值間的關係並未改變),但結果而言統計值呈現二倍變化,此可知單純的統計值無法反映雙向度間的關係,尚需使用殘差分析以協助釐清這層強度的關係。
  • 但僅觀察殘差的數值僅能呈現觀測值與期望值之正負關係,但無法作為解釋之用,尚須結合標準差換算成z score後方能以統計顯著與否解釋結果。
  • 殘差分析檢定需使用殘差之標準差,計算方式為根號的總數與列差除以總數與列差,此轉換方式等同於z檢定。
    • 如此殘差達顯著,則可解釋為此二項度間呈現某種相關性,以及相關程度有多大。
  • 殘差分析的結果,只要出現顯著就需要解釋,因此同一要素可能有二次以上的解釋,如結果顯示男生比較喜歡A黨,但比較不喜歡B黨。(換言之,如果沒有呈現顯著,就不能宣稱相反的結果)
  • 卡方檢定的假設:
    • 資料點間不可相依,換言之彼此獨立且不重複,或者類別不重疊。
    • 當N夠大的時候,樣本資料可假定為常態分配,方能檢定(通常期望值應大於5,另一說法為最少應大於總數之5倍)。
    • 應考量所有可能性,包含正面與負面,結果將有所不同。
  • 雙向度的處理方式:
    • 自由度為行、列數減一後相乘。
    • 期望值的取得方式,以及期望值之概念與原理。
  • 修正公式:Yate提出修正公式,因卡卡方檢定與二項分配資料皆為間斷資料,但比較對象皆為連續資料,為減少誤差而提出修正公式。
  • 勝算比:對於2x2的模式有效,可比較兩者間的倍數關係。
  • 簡化公式用於2x2的模式。以及相關公式:
    • 交叉相乘之差除以根號各行列總和之乘積。
  • 其他檢定法:卡方為其中一種類別檢定法,然有其他可能。
    • likelihood ration test(G檢定):對立假設除以虛無假設之機率,如此比值大於臨界值則拒絕虛無假設。
    • log-linear model:處理3個以上的變項。
    • Fisher's Exact Test:當期望值小於5的時候使用的方式。
期望值的分配:
  • 若沒有特別情況,虛無假設的結果為平均分配、隨機分配,然特定狀況下期望值未必是對半,如基因分配的狀態。
Fisher's Exact Test
  • Exact:實際觀察此模式的發生機率,基於其實際檢測之特性,而稱為exact。
    • permutation on observed table:透過排列組合之操作方式,對觀測值進行雙向的推演,觀測其P的變化。
    • p-value的判別,依不同的研究假設而定,狀況有三:
      • H0:P1=P2時,H1:P1≠P2,此為雙尾模型,故須雙向考慮,將小的極端兩背後,與標準值(常用如0.05, 0.01)比較,以判斷。
      • H0:P1≧P2,H1:P1<P2,此為單尾模型,因欲檢測為P1是否小於P2因此檢測小尾。
      • H0:P1≦P2,H1:P1>P2,此為單尾模型,檢測為較大之尾。
卡方檢定可做哪些類別的檢定?
  • 適配度檢定(goodness-of-fit):檢定母體是否為某一分配。
    • 概念:藉由比較樣本觀測值與假設母體之分配是否接近或者相似,用以判斷資料是否來自假設分配。
  • 獨立性檢定(independence):檢定兩種隨機變數之間是否相互獨立。
    • 概念:檢定兩種隨機變數之間是否相互獨立的方法。
    • 舉例:檢定教育與性別是否無關、介入與治療成效是否獨立。
  • 同質性檢定(homogeneity):檢定兩組或者多組是否具有相同分配。
    • 概念:此方法是檢定分配是否相同,而非檢定分配的類型。
    • 舉例:北市與高市的滿意度分配是否相同。
    • 名詞解釋:同樣為相關性,但對於不同性質的資料用語不同。
      • 連續資料之相關稱為correlation
      • 間斷資料之相關稱為association
  • 卡方值越大,並不代表x、y間的相關性越大,而僅能反應是否拒絕虛無假設。
    • 因將資料兩倍後,資料間的差異理應不變,但實質上卻造成統計值的兩倍,因此可知此結果。
Contingency Coefficient (C):
  • 以符號c代表其相關性(association) :
    • 計算:根號x^2/(x^2+N),換言之,當N>0的情況下,C絕對不可能達成1,這也是他的缺點。
    • C的最大值隨項度而改變,如2x2最大為0.707,而3x3的則為0.816,依序可自行計算取得。
    • 簡言之,c的最大值為根號(k-1)/k,k=min(R,C)。
Phi :
  • 只能用於2x2的模式,只能用於雙變項,為卡方值除以N的根號。
Cramer's Phi:
  • 拓展為2x2以上的模式應用。
  • 將Phi根號內的部分,再除以(k-1),也就是最小df。
  • 其最大值可為1,相較於C而改善此優勢。
勝算比(Odds Ration):
  • 可比較變項與變項間的關係。
  • 不限定使用在那些尺寸的模型上。

Cohen's kappa(k):
  • 是一種測量同意度(agreement)的方式:
    • 如inter-rater的檢定,觀察兩這評分結果的一致性。
    • 直觀的部分,計算方式同意(重疊)的部分,除以總個數所得的百分比(percentage of agreement),此做法有點類似看所有可能性後,取兩者相同的狀況。
  • Cohen's kappa (k):上述之同意度描述方式,並未特別討論自然發生的或然率,也就是基於機率造成之相同結果,而非因兩評估者皆同意之共識,故提出修正方案,意圖為修正巧合造成的誤差,因而刪去機率之因素稱為chance-corrected。
    • 作法:將觀測值與期望值相減後,再除以總數,操作上同agreement的計算,並將分子與分母都減去期望值後所得。

2013.12.02
note:研究假設之設定時,population 1 通常解釋為此研究樣本呈現之結果,或稱研究樣本族群,而population 2 則為假定虛無假設成立時,該族群分配的樣式,換言之,也就是不希望出現的分配。於此條件下,虛無假設被定義為兩族群分配相同,也就是樣本族群分配等同於虛無假設分配,對立假設則為樣本族群分配與虛無假設分配不同,作為檢定方式之基礎。
note 2:執行Chi-square test的時候,第一層算出統計值比較卡方分配,顯示觀察值與標準差的差異是否達顯著,然此數值並不能反應差異幅度,差異幅度須以殘差方式呈現。殘差計算類似於統計值,但因未平方而可觀察其正負號以判斷觀察值與期望值的大小關係。殘差分析尚且需要使用到殘差標準差,此可透過根號之總數與行、列之比值取得各細格的標準差,並將各別殘差除以標準查而得其Z分數,此結果用以討論各別細格是否達顯著差異,可協助解釋數據資料的傾向,作法為固定顯著的項目(行),並討論其在各列的意義。
note 3:Fisher's exact test使用的概念為真實的排列組合計算,雖計算較為繁瑣但檢定結果更為嚴謹,因此結果可信度較高(存在卡方檢定結果為拒絕虛無假設,但Fisher檢定結果為否的情況),缺點為計算繁瑣而不易操作。另註記,如分母的數值複雜且難以代換簡化,可直接取得其簡化後的個別元素並於每次操作的時候直接提取。

留言

熱門文章