2013.10.18 心理及教育統計(五)

10月 18, 2013

2013.10.18 心理及教育統計(五)

2013.10.18 心理及教育統計(五)
review：常態分配

常態分配(normal distribution)：符合常態分布公式，並且因應平均數與變異數而有不同的長相。

常態分布之頻率函數可透過積分方式，取得曲線下面積而得，然不同樣式之常態分配都需重新積分，有操作上之效率問題。有鑑於此，將常態分配之原始分數轉變為Z分數，並對照Z分數常模，能較有效率的取得結果。
Z分配之特性仍不偏離線性轉換，不改原始分數之特質與長相，唯其平均數為0，標準差為1。
note：1.645(90%)、1.96(95%)、2.58(99.7%)。

抽樣分配(sampling distribution)：於母群體中抽樣n個樣本所得之平均數與標準差，可得抽樣分配中的一點，抽取無限多次時，用以描述此無限多點之分配方式，稱為抽樣分配。

種類：依使用的估計值而定，如樣本平均數抽樣分配、樣本中數抽樣分配、樣本標準差抽樣分配。
概念標準差：稱為標準誤，也就是抽樣分配之標準差(standard error)。

中央極限定理(central limit theory,CLT)：如於平均數為u，標準差為(SD)^2的母群體中，令抽樣樣本數為n，則隨著n增加，樣本平均數的抽樣分配將接近常態分配，且此分配之平均數將接近u，變異數為1/n*(SD)^2。基本統計方法由此衍伸而來。
note：當n提升後，平均值接近u，變異數接近(1/n)*(SD)^2。

中央極限定理並未限制母群須為常態分配，換言之，只要抽取的樣本數夠多，抽取之結果都可接近常態分配。

Z檢定(當母群體之變異數已知時)

利用Z分配之概念，佐以訊號偵測理論，進而判讀是否駁斥虛無假設之方法，將於後續內容提及。

Today：推論統計，利用樣本資訊以推論母群之狀態。

推論統計分為二：估計(estimation)以及假設考驗(hypothesis testing)。

估計(直接推論)：其直接討論母群體之狀態與特質，因而屬於直接推論。

點估計(point estimation)：描述方式為點、單一數據。
區間估計(interval estimation)：描述方式為範圍，如x=85~102。作法上，當求出點估計之後，給予一個範圍來代表母群體參數有多少機率會落在此範圍內(a±b)，並描述有多少信心參數落於此範圍，如信賴區間(confident interval, CI)，而常用信心水準為90%或者95%。

顯著水準(significant level)：常用為0.05以及0,01，其中又有0.05最為常見，其意義為信賴區間指標，如0.05即為95%信賴區間。達成條件有四：

點估計之參數(平均值)
點估計之標準差、標準誤
信賴區間之水平
分配之長相與特質

信心水準(confident level)：對應不同的信心水準，將使用不同數量級之標準差。

90%CI：u±1.645*Sx。
95%CI：u±1.96*Sx。
99%CI：u±2.58*Sx。

信賴區間：抽樣後可得樣本之平均數區間，如複無限多次抽樣之後，其有多少比例可以包含u。
summary：比較Z-test 以及信賴區間(CI)，二者都可協助判斷是否達統計顯著，然著眼點的不同。
＊對照分布(comparison distribution)：假定為虛無假設成立之分布狀態，換言之，如果樣本結過推論為此族群，則支持虛無假設；反之，如果樣本結果推論與對照分布為不同族群，則支持替代假設。

假設檢定：比較樣本與母群的離散程度，換言之，檢視樣本結果是否屬於對照分布族群，如樣本結果落於多個標準差之外(代表發生機率低)，則可拒絕虛無假設，並認為達顯著差異。
信賴區間：以樣本為中心，依據不同的信心水準展開包含範圍，並假設真實母群的平均數(實際上未知)落於此範圍中，如於特定的信心水準下，樣本結果之信賴區間並未包含對照分布的平均值，則有此水平的信心可拒絕虛無假設，相信其有顯著差異。
儘管這兩者的出發點不盡相同，然其結果大致相似，即便在細微處仍可透過兩者的結果交叉比對，從而獲得更多資訊，如未達顯著差異且信賴區間又不包含者，可更有信心宣稱此二者分屬不同族群。
限制為仍建立於機率模型上，並注意即便機率低仍有可能發生之狀況。另，樣本結果不足以支持或拒絕虛無假設，亦不能作為建立因果關係的必要條件，其僅能以支持或者不支持研究假設之方式描述假設檢定之結果。

假設考驗(間接推論)：

假設分為研究性假設與統計性假設。

研究性假設：又稱為科學假設，研究者依據觀察與理論，對該研究提出邏輯性猜測，以陳述方式表現。
統計假設：把研究假設用數量或者統計學的用詞加以表達，並對未知的母數性質做有關之陳述。
H0 & H1：虛無假設 (H0)以及對立假設(H1 or HA)。

統計通常將兩者一併寫出，然兩者相互獨立並包含所有可能。
經常把不重要的寫在H0，將想驗證的事物寫在H1，寫H0常常會使用到等號。
再分為單側(尾)考驗與雙側(尾)考驗，也就是是否講究方向性，如為雙側考驗，其重視的僅為有無差異，而非誰高誰低。
P.s) 此假設前提皆使用母群體之參數，不可以樣本之估計值描述之。
於統計上，使用之策略為「是否能否定虛無假設」，換言之利用反面證據作為否證(refutation)，也因為其利用此方式，故稱為間接推論。
note：由於難以證明一個假設是否為真，但較容易用反證的方式推翻之。
note2：統計討論的是機率，因而無法證明何者為真，其結論都是以機率為前提，並且包含一定程度的不確定性(uncertainty)。
note3：無論接受或者拒絕H0，結果都為機率，僅能理解為發生可能性大(小)；換言之可能出現誤差，因此統計之作用並非證明，而是協助判斷。

Z檢定：假設虛無假設成立，樣本之結果落在虛無假設範圍的機率有多少？

操作定義：將原始分數轉換為Z分數，並且比較其以上區域的機率：如機率大則Z分數靠近平均值；如機率小則Z分數遠離平均值。

如機率很小，表示拒絕H0、接受H1。
如機率很大，表接受H0、拒絕H1。
note：或可將H0視為訊號檢測理論中的偽陽性率，如機率大表示假性結果發生的機率高？

Type I and Type II Errors：套用訊號偵測理論。

真實情況

H0為真

H0為假

決策

拒絕H0

alpha

1-beta

接受H0

1-alpha

Beta

Type 1(alpha)：拒絕H0犯錯的機率，換言之，如若虛無假設為真，但誤判而駁斥虛無假設的情況。
Type 2(beta)：接受H0犯錯的機率，換言之，如若虛無假設為假，但誤判而接受虛無假設的狀況。
Power =1-beta，又稱為統計檢定力(statistical power)，正確拒絕H0的機率。
P.s)兩類錯誤之取向應以其主題而定，然往往第一型錯誤的機率較為嚴重，因而需要被管控。
因此，alpha又稱為顯著水準(level of significance)=0.05; 0.01。

單側/雙側考驗：討論alpha放在哪一邊。

單側考驗：將所有alpha放於其中一端，其接受難度較高。
雙側考驗：將alpha平均分配於兩側。
p-value：在H0為真的前提下，得到等於或者大於此一觀察結果之統計考驗值的機率，相當於圖形中極端邊的曲線下面積(換言之，其可能在左或者右側，依研究假設而定)。當p大的時候，代表其較靠近平均值，相對於p小的時候，表示其與平均值距離增大。
alpha=0.05：代表發生第一型的錯誤機率低於0.05，常被作為判斷標準，其代表H0為真但被視為否定的第一型錯誤率。如p-value>alpha(0.05)，表此類型錯誤的發生率超過標準，因而為不理想之狀況；如果p-value<alpha(0.05)，表此類型錯誤的發生率低於標準，換言之虛無假設發生的機率不高，因而否定虛無假設。
臨界區或者拒絕區(region of rejection; critical region, unlikely region)：只標準之外的區域，以0.05為例，則>0.05之曲線面積、範圍，稱為拒絕區。如分數落於此區域，則會拒絕虛無假設；相對之下其他區域則為接受區。
note：p-value視為第一型錯誤的發生率，而alpha=0.05是人為設定之標準，也可使用0.01端看研究之嚴謹度。如p大於此標準值，代表第一型錯誤發生機率高，換言之如果虛無假設為真，但被否定出錯的可能性高，因而接受虛無假設；如果p小於此標準值，代表第一型錯誤發生機率低，換言之虛無假設為真，但被否定而出錯的機率低，因而否決之。

拒絕區(region of rejection)：如機率落於拒絕區內，表示否定虛無假設。

如果alpha相等，單側或雙側考驗較容易拒絕？單側考驗較容易拒絕虛無假設(拒絕區域大)，從問題本質上可如此區分：

問題：

單側：比較之概念，樣本之分數是否高於(或低於)母群？
雙側：是否相等之概念，樣本分數是否等同於母群分數？

符號：

單側：u1≧u2？ or u1<u2？
雙側：u1=u2？ or u1≠u2？

假設檢定的六個步驟：

設定理論：定義虛無假設與對立假設
選擇統計方法與顯著標準
選擇樣本與收案
找出拒絕區
計算統計數值(Z0)
進行統計決策
p.s) 取得CI也是相同概念，如果平均值落在範圍內則接受虛無，如果在外則拒絕虛無。

搜尋此網誌

404 Not Found

2013.10.18 心理及教育統計(五)

留言

張貼留言

熱門文章

2013.09.24 &2013.10.01&2013.10.08 知覺心理學 (三) Neural Processing and Perception

2013.12.10 知覺心理學 (十) Perceiving Depth and Size

		真實情況
		H0為真	H0為假
決策	拒絕H0	alpha	1-beta
決策	接受H0	1-alpha	Beta