2013.11.22 心理及教育統計(七)

11月 22, 2013

2013.11.22 心理及教育統計(七)

Preview：

二項分配：執行多次Bernoulli Trails所得之結果，資料性質本為間斷資料，然如果資料數量龐大時，可假設為連續資料而以常態分配並轉換為Z分配應用之。

Today：

處理類別資料

類別資料：如頻率、次數、人數，完整且為整數的資料。
若虛無假設成立，表事件發生為隨機，因而存在期望值(expected)。
卡方檢定(Chi-square)可用以檢定所得結果(觀察值)與期望值間的差距，進而判斷是否達顯著差異。
卡方檢定：屬於假設檢定的一種，著手點在於觀察值與期望值是否相似，如兩者相似則接受虛無假設，如兩者差異大則拒絕虛無假設，詳下收。

具體而言：卡方分配假定虛無假設成立之分配方式，而抽樣分配之結果如與卡方分配一致，則視為接受虛無假設，如兩者明顯差異，則視為拒絕虛無假設。

卡方檢定(Chi-square test)：處理類別資料之檢定方式

概念上，卡方檢定乃透過樣本數值與期望值之差距是否達顯著，從而判斷接受或者拒絕虛無假設。
比較 Z-test V.s Chi-square：

Z-test建立於常態分配之模型之上，以標準Z分配與機率模型為本，以判斷樣本與對照族群是否相同，進而檢測假設是否成立。
Chi-square建立於卡方分配之上，假定虛無假設之情況為隨機分配，從而比較樣本與期望值之差異，以判斷假設是否成立。
note：名詞界定之必要性，如Z分配與Z檢定乃不同之物，前者為標準常態分配，後者則建立在常態分配模型上的檢定手法；同理，卡方檢定與卡方分配有所不同，前者為建立於卡方分配之上的檢定手法，而後者則為數據分配之型態。

卡方分配(Chi-square distribution)

卡方分配：自X~N(u,o^2)後抽取各變項，經標準化後平方所得。

符號以X^2描述，右下記錄其自由度，不同自由度有不同分配長相。

換言之，卡方分配為經平方與操作後之結果。

自由度(df)：受不同數目之Z^2組合而定。

df=1：將個別x化為z分數後平方之分配，稱為自由度為1之卡方分配。
df=2：將個別x化為z分數後平方，並隨機抽取二個相加所得的分配方式，稱為自由度為2的卡方分配。(任二個z平方相加所得的新的Z平方)。
df=3：同理，將個別z平方的，任選三個相加視為一個新的Z平方，稱為自由度為3的卡方分配。
因此，任取n個z方相加作為一個新的Z平方，即為自由度為n的卡方分配。
此外，卡方分配受自由度影響，當自由度越大的時候，卡方分配越靠近常態分配。

卡方分配特質：

曲線下面積為1，可用機率判斷之。
正偏分配。(自由度越大，越趨近常態)
分配受自由度影響。
所有數值>0(因平方而來)。
alpha全部單尾(因為平方)。
臨界值：

當df=1，alpha=0.05，Z^2=1,96^2=3.84。
but,為什麼使用雙尾的平方，而非單尾的平方？

平均數為其自由度(k)，而變異數為自由度二倍(2k)，眾數出現於(k-2)。
偏態：(根號2/k)>0，因此必為正偏；而當k變大的時候其偏態可趨近於0因而趨近常態。
具有加成性：假定Xk和Xl為兩個獨立的卡方分配，則可將二者相加產生新的X(k+l)，並且將自由度直接相加。

eg.自由度為5以及自由度為3的卡方分配，加成之後成為自由度為8的卡方。

樣本變異數為卡方分配。

自母群抽取樣本，分別審視其平均數與變異數：

當樣本數夠大的時候，樣本平均數之抽樣分配呈現常態分配，且樣本平均數之抽樣分配的變異數，與母群變異數的關係由樣本大小瓜分。
樣本變異數的抽樣分配，其本身性質即為自由度為n-1的卡方分配(正偏)，其中n代表抽取樣本之大小。
回憶過去，曾接受「樣本變異數是母群變異數的不偏估計」，換做數學符號寫為E(s^2)=o^2，代表經過無數次抽出放回的程序，樣本變異數抽樣分配將呈現常態分配，因而逼近於母群的變異數。

利用卡方分配檢驗單向度的類別資料：

當虛無假設成立時，理應觀察值與期望值相同，比較二者間差異的方法，稱為卡方檢定。透過樣本可計算出卡方估計值，並且比較卡方分配查表所得的臨界值，來判斷是否拒絕虛無假設。
卡方估計值(X^2 test statistic)：將觀測值與期望值差平方，除以期望值之總和。
Pearson's Chi-square test：

1-dimensional test：Goodness-of-fit test
2-dimensional test：Contingency test .

卡方分配臨界值的判定，使用自由度減1(k-1)的標準，概念如之前所述。

殘差分析(residual analysis)：用以估計誤差值的大小。

殘差：為觀察值與期望值的差，除以根號期望值(即為卡方分配單一項目的根號結果)。

如O>E，殘差>0；反之，如O<E，殘差<0。
殘差的正負，可知觀察值與期望值的大小關係。
殘差的大小，可觀察其貢獻度有多少。

備註：儘管虛無假設是建立在隨機之上，但實際上應指自然現象，如基因分配的機率就有所不同。

卡方檢定 V.S 卡方分配

卡方檢定分配為間斷，而卡方分配為連續(來自常態分配)。
當樣本數夠大的時候，可將間斷資料視為連續分配，方能用此方式檢驗。

Np或者Nq很大的時候，卡方檢定值分配傾向連續，可以常態分配逼近，此時進行卡方檢定其統計值與來自卡方分配(連續的分配)的臨界值比較才有意義。
反之，Np或者Nq很小時，卡方檢定值之分配是不連續的，不能以卡方分配視之。

雙向度卡方檢定(2-dimensional Chi-square test)：

概念上，將兩個z^2相加所得的卡方分配型態，因此利用其相加性，使兩個獨立的卡方分配相加後處理之。
自由度：自由度為兩者各減1後相乘，舉例而言，如果是df=5和df=4的兩個卡方分配相加，則呈現(5-1)(4-1)的自由度，也就是4*3=12=df。
期望值取得：將該數值所在的行、列總值相乘，後除以總數。

但為何以此方式取得期望值？以黑白娃娃的研究為例

說法一：假設年代與黑白偏好無關，則二年份選娃娃的比例相同。
說法二：1939年分配到W和B的比例，應等同於兩者加總後的分配比例。因此，252*197/341。

Yate's Correction for Continuity：無論單向度與多向度，本質皆為間斷資料，因此與二項分配相同，也存在修正公式以調整其與連續比較之適切性。

單向度：基本上於分子減0.5即可。
雙性度：同上。

雙向度之殘差分析(Residual analysis for 2-dimensional test)：

殘差之總和即為統計檢定值。
欲決定殘差之顯著性，尚需要殘差之標準差：

各別cell有自己的標準差：根號之總數減行總數/總數檢列總數。

將殘差進行Z檢定後，可比較各cell殘差值得顯著與否。

勝算比(Odds ration)：

分子分母皆為比值的重況下進行比較，稱為勝算比。

以黑白娃娃為例：1939年喜歡白娃娃的比例除以1970年喜歡白娃娃的比例，相除結果為4.5倍。

此勝算比可用於更大的表格中，並且將之延伸產生比較效果。

二維表格的特例：可利用邊緣頻率計算卡方值。(參考講義)

二變項相關(binary, dichotomous)：亦可利用邊緣計算。(參考講義)

卡方檢定之假設

卡方檢定的數值，應與卡方分配(特別是df-1者)比較，然前者理應間斷資料，而後者為連續資料，如何比較這二種不同類型之資料，乃本段討論之重點。
卡方檢定之假設：

假設資料間互相獨立(independence of observation)，換言之，單一個體只能出現在一個細格中。
類別範圍不可重疊(categories must be mutually exclusive)。
假定卡方檢定分配為連續(normality==continuity)，即為E(Np)需夠大，通常設定Np≧5為標準。
必須考慮所有情況，而不能只考慮部分情況。

舉例而言：鄉村與都市小孩喜歡日光節約時間與否

只考慮喜歡時，結果可能為接受虛無假設。
同時考慮喜歡與不喜歡(此為所有狀況)，結果為拒絕虛無假設。
因此，考慮所有可能性之周全性，方能有意義的討論所有資料。

其它檢定法：

類別資料並非只有卡方檢定方式，如可用likelihood ratio test進行比較。

Likelihood ration test：二個可能性比值之比較，分別為在虛無假設成立下成立的可能性，以及在對立假設成立下的可能性進行比較，此檢定方式稱為G square。此比值如果越大，則越接受對立假設。

處理三個以上的變項，使用log-liner model較為適切。
當期望值<5的時候，可使用Fisher's Exact Test。

note： 2013.11.28

假設檢定之重點，應為「研究假設與虛無假設」何者為真的二元判別上，儘管處理的資料性質不同、使用手法各有差異，但都在討論是否接受/拒絕虛無假設，並且存在著機率上的可能性誤差。
面對不同性質的資料，如nominal data, interval data等，基於其特質有不同的處理方式與限制，因而對應到不同性質的檢定方法上，如使用z-test對應到interval data，而使用Chi-square對應nominal data。
獲得之樣本分配資訊，用以比對假設虛無假設成立之分配狀態，而不同檢定方式建立於不同的分配模型上，如Z-test建立於常態分配，而Chi-square建立在卡方分配上。
各檢定方式之結果，以是否達統計顯著作結，然是否達統計顯著僅考慮第一型錯誤的發生率，並且第一型與第二型錯誤呈現相反關係，如提高檢測標準將減少第一型錯誤的產生，同時也增加第二型錯誤的機會，反之亦然。因此，選用何種標準，應視目標與成本、嚴重程度之考量而定。
檢測之結果僅能以是否達顯著差異描述之，因採用否證之方式，故無法以直接以支持/否定理論解釋，換言之，存在因樣本特質強度不足以拒絕虛無假設，但實質上研究假設為真的情況，故對於結果之詮釋需更為謹慎。
效果值(effect size)用以描述兩族群差異的程度，或可理解為介入後造成變化的強度有多少，基於比較之需求通常將其標準化，即為兩族群之差除以母群標準差而得。簡易標準中，0.2表small effect、0.5表medium effect及0.8表larger effect。
P.s)顯著呈現與否受二因素影響，一為效果值之大小，二為樣本數之多寡。

搜尋此網誌

404 Not Found

2013.11.22 心理及教育統計(七)

處理類別資料

卡方檢定(Chi-square test)：處理類別資料之檢定方式

卡方分配(Chi-square distribution)

利用卡方分配檢驗單向度的類別資料：

殘差分析(residual analysis)：用以估計誤差值的大小。

卡方檢定 V.S 卡方分配

雙向度卡方檢定(2-dimensional Chi-square test)：

Yate's Correction for Continuity：無論單向度與多向度，本質皆為間斷資料，因此與二項分配相同，也存在修正公式以調整其與連續比較之適切性。

雙向度之殘差分析(Residual analysis for 2-dimensional test)：

勝算比(Odds ration)：

二維表格的特例：可利用邊緣頻率計算卡方值。(參考講義)

二變項相關(binary, dichotomous)：亦可利用邊緣計算。(參考講義)

卡方檢定之假設

其它檢定法：

留言

張貼留言

熱門文章

2013.09.24 &2013.10.01&2013.10.08 知覺心理學 (三) Neural Processing and Perception

2013.09.10 知覺心理學 (一) 導論