2013.11.22 心理及教育統計(七)

Preview:
  • 二項分配:執行多次Bernoulli Trails所得之結果,資料性質本為間斷資料,然如果資料數量龐大時,可假設為連續資料而以常態分配並轉換為Z分配應用之。
Today:

處理類別資料

  • 類別資料:如頻率、次數、人數,完整且為整數的資料。
  • 若虛無假設成立,表事件發生為隨機,因而存在期望值(expected)。
  • 卡方檢定(Chi-square)可用以檢定所得結果(觀察值)與期望值間的差距,進而判斷是否達顯著差異。
  • 卡方檢定:屬於假設檢定的一種,著手點在於觀察值與期望值是否相似,如兩者相似則接受虛無假設,如兩者差異大則拒絕虛無假設,詳下收。
    • 具體而言:卡方分配假定虛無假設成立之分配方式,而抽樣分配之結果如與卡方分配一致,則視為接受虛無假設,如兩者明顯差異,則視為拒絕虛無假設。

卡方檢定(Chi-square test):處理類別資料之檢定方式

  • 概念上,卡方檢定乃透過樣本數值與期望值之差距是否達顯著,從而判斷接受或者拒絕虛無假設。
  • 比較 Z-test V.s Chi-square:
    • Z-test建立於常態分配之模型之上,以標準Z分配與機率模型為本,以判斷樣本與對照族群是否相同,進而檢測假設是否成立。
    • Chi-square建立於卡方分配之上,假定虛無假設之情況為隨機分配,從而比較樣本與期望值之差異,以判斷假設是否成立。
    • note:名詞界定之必要性,如Z分配與Z檢定乃不同之物,前者為標準常態分配,後者則建立在常態分配模型上的檢定手法;同理,卡方檢定與卡方分配有所不同,前者為建立於卡方分配之上的檢定手法,而後者則為數據分配之型態。

卡方分配(Chi-square distribution)

  • 卡方分配:自X~N(u,o^2)後抽取各變項,經標準化後平方所得
    • 符號以X^2描述,右下記錄其自由度,不同自由度有不同分配長相。
      • 換言之,卡方分配為經平方與操作後之結果。
  • 自由度(df):受不同數目之Z^2組合而定。
    • df=1:將個別x化為z分數後平方之分配,稱為自由度為1之卡方分配。
    • df=2:將個別x化為z分數後平方,並隨機抽取二個相加所得的分配方式,稱為自由度為2的卡方分配。(任二個z平方相加所得的新的Z平方)。
    • df=3:同理,將個別z平方的,任選三個相加視為一個新的Z平方,稱為自由度為3的卡方分配。
    • 因此,任取n個z方相加作為一個新的Z平方,即為自由度為n的卡方分配。
    • 此外,卡方分配受自由度影響,當自由度越大的時候,卡方分配越靠近常態分配。
  • 卡方分配特質:
    • 曲線下面積為1,可用機率判斷之。
    • 正偏分配。(自由度越大,越趨近常態)
    • 分配受自由度影響。
    • 所有數值>0(因平方而來)。
    • alpha全部單尾(因為平方)。
    • 臨界值:
      • 當df=1,alpha=0.05,Z^2=1,96^2=3.84。
        but,為什麼使用雙尾的平方,而非單尾的平方?
    • 平均數為其自由度(k),而變異數為自由度二倍(2k),眾數出現於(k-2)。
    • 偏態:(根號2/k)>0,因此必為正偏;而當k變大的時候其偏態可趨近於0因而趨近常態。
    • 具有加成性:假定Xk和Xl為兩個獨立的卡方分配,則可將二者相加產生新的X(k+l),並且將自由度直接相加。
      • eg.自由度為5以及自由度為3的卡方分配,加成之後成為自由度為8的卡方。
    • 樣本變異數為卡方分配。
      • 自母群抽取樣本,分別審視其平均數與變異數:
        • 當樣本數夠大的時候,樣本平均數之抽樣分配呈現常態分配,且樣本平均數之抽樣分配的變異數,與母群變異數的關係由樣本大小瓜分。
        • 樣本變異數的抽樣分配,其本身性質即為自由度為n-1的卡方分配(正偏),其中n代表抽取樣本之大小。
        • 回憶過去,曾接受「樣本變異數是母群變異數的不偏估計」,換做數學符號寫為E(s^2)=o^2,代表經過無數次抽出放回的程序,樣本變異數抽樣分配將呈現常態分配,因而逼近於母群的變異數。

利用卡方分配檢驗單向度的類別資料:

  • 當虛無假設成立時,理應觀察值與期望值相同,比較二者間差異的方法,稱為卡方檢定。透過樣本可計算出卡方估計值,並且比較卡方分配查表所得的臨界值,來判斷是否拒絕虛無假設。
  • 卡方估計值(X^2 test statistic):將觀測值與期望值差平方,除以期望值之總和。
  • Pearson's Chi-square test:
    • 1-dimensional test:Goodness-of-fit test
    • 2-dimensional test:Contingency test .
  • 卡方分配臨界值的判定,使用自由度減1(k-1)的標準,概念如之前所述。

殘差分析(residual analysis):用以估計誤差值的大小。

  • 殘差:為觀察值與期望值的差,除以根號期望值(即為卡方分配單一項目的根號結果)。
    • 如O>E,殘差>0;反之,如O<E,殘差<0。
    • 殘差的正負,可知觀察值與期望值的大小關係。
    • 殘差的大小,可觀察其貢獻度有多少。
  • 備註:儘管虛無假設是建立在隨機之上,但實際上應指自然現象,如基因分配的機率就有所不同。

卡方檢定 V.S 卡方分配

  • 卡方檢定分配為間斷,而卡方分配為連續(來自常態分配)。
  • 當樣本數夠大的時候,可將間斷資料視為連續分配,方能用此方式檢驗。
    • Np或者Nq很大的時候,卡方檢定值分配傾向連續,可以常態分配逼近,此時進行卡方檢定其統計值與來自卡方分配(連續的分配)的臨界值比較才有意義。
    • 反之,Np或者Nq很小時,卡方檢定值之分配是不連續的,不能以卡方分配視之。

雙向度卡方檢定(2-dimensional Chi-square test):

  • 概念上,將兩個z^2相加所得的卡方分配型態,因此利用其相加性,使兩個獨立的卡方分配相加後處理之。
  • 自由度:自由度為兩者各減1後相乘,舉例而言,如果是df=5和df=4的兩個卡方分配相加,則呈現(5-1)(4-1)的自由度,也就是4*3=12=df。
  • 期望值取得:將該數值所在的行、列總值相乘,後除以總數。
    • 但為何以此方式取得期望值?  以黑白娃娃的研究為例
      • 說法一:假設年代與黑白偏好無關,則二年份選娃娃的比例相同。
      • 說法二:1939年分配到W和B的比例,應等同於兩者加總後的分配比例。因此,252*197/341。

Yate's Correction for Continuity:無論單向度與多向度,本質皆為間斷資料,因此與二項分配相同,也存在修正公式以調整其與連續比較之適切性。

  • 單向度:基本上於分子減0.5即可。
  • 雙性度:同上。

雙向度之殘差分析(Residual analysis for 2-dimensional test):

  • 殘差之總和即為統計檢定值。
  • 欲決定殘差之顯著性,尚需要殘差之標準差:
    • 各別cell有自己的標準差:根號之總數減行總數/總數檢列總數。
  • 將殘差進行Z檢定後,可比較各cell殘差值得顯著與否。

勝算比(Odds ration):

  • 分子分母皆為比值的重況下進行比較,稱為勝算比。
    • 以黑白娃娃為例:1939年喜歡白娃娃的比例除以1970年喜歡白娃娃的比例,相除結果為4.5倍。
  • 此勝算比可用於更大的表格中,並且將之延伸產生比較效果。

二維表格的特例:可利用邊緣頻率計算卡方值。(參考講義)

二變項相關(binary, dichotomous):亦可利用邊緣計算。(參考講義)

卡方檢定之假設

  • 卡方檢定的數值,應與卡方分配(特別是df-1者)比較,然前者理應間斷資料,而後者為連續資料,如何比較這二種不同類型之資料,乃本段討論之重點。
  • 卡方檢定之假設:
    • 假設資料間互相獨立(independence of observation),換言之,單一個體只能出現在一個細格中。
    • 類別範圍不可重疊(categories must be mutually exclusive)。
    • 假定卡方檢定分配為連續(normality==continuity),即為E(Np)需夠大,通常設定Np≧5為標準。
    • 必須考慮所有情況,而不能只考慮部分情況。
      • 舉例而言:鄉村與都市小孩喜歡日光節約時間與否
        • 只考慮喜歡時,結果可能為接受虛無假設。
        • 同時考慮喜歡與不喜歡(此為所有狀況),結果為拒絕虛無假設。
        • 因此,考慮所有可能性之周全性,方能有意義的討論所有資料。

其它檢定法:

  • 類別資料並非只有卡方檢定方式,如可用likelihood ratio test進行比較。
    • Likelihood ration test:二個可能性比值之比較,分別為在虛無假設成立下成立的可能性,以及在對立假設成立下的可能性進行比較,此檢定方式稱為G square。此比值如果越大,則越接受對立假設。
  • 處理三個以上的變項,使用log-liner model較為適切。
  • 當期望值<5的時候,可使用Fisher's Exact Test。


note: 2013.11.28

  • 假設檢定之重點,應為「研究假設與虛無假設」何者為真的二元判別上,儘管處理的資料性質不同、使用手法各有差異,但都在討論是否接受/拒絕虛無假設,並且存在著機率上的可能性誤差。
  • 面對不同性質的資料,如nominal data, interval data等,基於其特質有不同的處理方式與限制,因而對應到不同性質的檢定方法上,如使用z-test對應到interval data,而使用Chi-square對應nominal data。
  • 獲得之樣本分配資訊,用以比對假設虛無假設成立之分配狀態,而不同檢定方式建立於不同的分配模型上,如Z-test建立於常態分配,而Chi-square建立在卡方分配上。
  • 各檢定方式之結果,以是否達統計顯著作結,然是否達統計顯著僅考慮第一型錯誤的發生率,並且第一型與第二型錯誤呈現相反關係,如提高檢測標準將減少第一型錯誤的產生,同時也增加第二型錯誤的機會,反之亦然。因此,選用何種標準,應視目標與成本、嚴重程度之考量而定。
  • 檢測之結果僅能以是否達顯著差異描述之,因採用否證之方式,故無法以直接以支持/否定理論解釋,換言之,存在因樣本特質強度不足以拒絕虛無假設,但實質上研究假設為真的情況,故對於結果之詮釋需更為謹慎。
  • 效果值(effect size)用以描述兩族群差異的程度,或可理解為介入後造成變化的強度有多少,基於比較之需求通常將其標準化,即為兩族群之差除以母群標準差而得。簡易標準中,0.2表small effect、0.5表medium effect及0.8表larger effect。
    P.s)顯著呈現與否受二因素影響,一為效果值之大小,二為樣本數之多寡。


留言

熱門文章