2013.10.18 心理及教育統計(五)
2013.10.18 心理及教育統計(五)
review: 常態分配
review: 常態分配
- 常態分配(normal distribution):符合常態分布公式,並且因應平均數與變異數而有不同的長相。
- 常態分布之頻率函數可透過積分方式,取得曲線下面積而得,然不同樣式之常態分配都需重新積分,有操作上之效率問題。有鑑於此,將常態分配之原始分數轉變為Z分數,並對照Z分數常模,能較有效率的取得結果。
- Z分配之特性仍不偏離線性轉換,不改原始分數之特質與長相,唯其平均數為0,標準差為1。
- note:1.645(90%)、1.96(95%)、2.58(99.7%)。
- 抽樣分配(sampling distribution):於母群體中抽樣n個樣本所得之平均數與標準差,可得抽樣分配中的一點,抽取無限多次時,用以描述此無限多點之分配方式,稱為抽樣分配。
- 種類:依使用的估計值而定,如樣本平均數抽樣分配、樣本中數抽樣分配、樣本標準差抽樣分配。
- 概念標準差:稱為標準誤,也就是抽樣分配之標準差(standard error)。
- 中央極限定理(central limit theory,CLT):如於平均數為u,標準差為(SD)^2的母群體中,令抽樣樣本數為n,則隨著n增加,樣本平均數的抽樣分配將接近常態分配,且此分配之平均數將接近u,變異數為1/n*(SD)^2。基本統計方法由此衍伸而來。
note:當n提升後,平均值接近u,變異數接近(1/n)*(SD)^2。 - 中央極限定理並未限制母群須為常態分配,換言之,只要抽取的樣本數夠多,抽取之結果都可接近常態分配。
- Z檢定(當母群體之變異數已知時)
- 利用Z分配之概念,佐以訊號偵測理論,進而判讀是否駁斥虛無假設之方法,將於後續內容提及。
Today:推論統計,利用樣本資訊以推論母群之狀態。
- 推論統計分為二:估計(estimation)以及假設考驗(hypothesis testing)。
- 估計(直接推論):其直接討論母群體之狀態與特質,因而屬於直接推論。
- 點估計(point estimation):描述方式為點、單一數據。
- 區間估計(interval estimation):描述方式為範圍,如x=85~102。作法上,當求出點估計之後,給予一個範圍來代表母群體參數有多少機率會落在此範圍內(a±b),並描述有多少信心參數落於此範圍,如信賴區間(confident interval, CI),而常用信心水準為90%或者95%。
- 顯著水準(significant level):常用為0.05以及0,01,其中又有0.05最為常見,其意義為信賴區間指標,如0.05即為95%信賴區間。達成條件有四:
- 點估計之參數(平均值)
- 點估計之標準差、標準誤
- 信賴區間之水平
- 分配之長相與特質
- 信心水準(confident level):對應不同的信心水準,將使用不同數量級之標準差。
- 90%CI:u±1.645*Sx。
- 95%CI:u±1.96*Sx。
- 99%CI:u±2.58*Sx。
- 信賴區間:抽樣後可得樣本之平均數區間,如複無限多次抽樣之後,其有多少比例可以包含u。
summary:比較Z-test 以及信賴區間(CI),二者都可協助判斷是否達統計顯著,然著眼點的不同。
*對照分布(comparison distribution):假定為虛無假設成立之分布狀態,換言之,如果樣本結過推論為此族群,則支持虛無假設;反之,如果樣本結果推論與對照分布為不同族群,則支持替代假設。 - 假設檢定:比較樣本與母群的離散程度,換言之,檢視樣本結果是否屬於對照分布族群,如樣本結果落於多個標準差之外(代表發生機率低),則可拒絕虛無假設,並認為達顯著差異。
- 信賴區間:以樣本為中心,依據不同的信心水準展開包含範圍,並假設真實母群的平均數(實際上未知)落於此範圍中,如於特定的信心水準下,樣本結果之信賴區間並未包含對照分布的平均值,則有此水平的信心可拒絕虛無假設,相信其有顯著差異。
- 儘管這兩者的出發點不盡相同,然其結果大致相似,即便在細微處仍可透過兩者的結果交叉比對,從而獲得更多資訊,如未達顯著差異且信賴區間又不包含者,可更有信心宣稱此二者分屬不同族群。
- 限制為仍建立於機率模型上,並注意即便機率低仍有可能發生之狀況。另,樣本結果不足以支持或拒絕虛無假設,亦不能作為建立因果關係的必要條件,其僅能以支持或者不支持研究假設之方式描述假設檢定之結果。
- 假設考驗(間接推論):
- 假設分為研究性假設與統計性假設。
- 研究性假設:又稱為科學假設,研究者依據觀察與理論,對該研究提出邏輯性猜測,以陳述方式表現。
- 統計假設:把研究假設用數量或者統計學的用詞加以表達,並對未知的母數性質做有關之陳述。
- H0 & H1:虛無假設 (H0)以及對立假設(H1 or HA)。
- 統計通常將兩者一併寫出,然兩者相互獨立並包含所有可能。
- 經常把不重要的寫在H0,將想驗證的事物寫在H1,寫H0常常會使用到等號。
- 再分為單側(尾)考驗與雙側(尾)考驗,也就是是否講究方向性,如為雙側考驗,其重視的僅為有無差異,而非誰高誰低。
P.s) 此假設前提皆使用母群體之參數,不可以樣本之估計值描述之。 - 於統計上,使用之策略為「是否能否定虛無假設」,換言之利用反面證據作為否證(refutation),也因為其利用此方式,故稱為間接推論。
note:由於難以證明一個假設是否為真,但較容易用反證的方式推翻之。
note2:統計討論的是機率,因而無法證明何者為真,其結論都是以機率為前提,並且包含一定程度的不確定性(uncertainty)。
note3:無論接受或者拒絕H0,結果都為機率,僅能理解為發生可能性大(小);換言之可能出現誤差,因此統計之作用並非證明,而是協助判斷。 - Z檢定:假設虛無假設成立,樣本之結果落在虛無假設範圍的機率有多少?
- 操作定義:將原始分數轉換為Z分數,並且比較其以上區域的機率:如機率大則Z分數靠近平均值;如機率小則Z分數遠離平均值。
- 如機率很小,表示拒絕H0、接受H1。
- 如機率很大,表接受H0、拒絕H1。
note:或可將H0視為訊號檢測理論中的偽陽性率,如機率大表示假性結果發生的機率高? - Type I and Type II Errors:套用訊號偵測理論。真實情況H0為真H0為假決策拒絕H0alpha1-beta接受H01-alphaBeta
- Type 1(alpha):拒絕H0犯錯的機率,換言之,如若虛無假設為真,但誤判而駁斥虛無假設的情況。
- Type 2(beta):接受H0犯錯的機率,換言之,如若虛無假設為假,但誤判而接受虛無假設的狀況。
- Power =1-beta,又稱為統計檢定力(statistical power),正確拒絕H0的機率。
P.s)兩類錯誤之取向應以其主題而定,然往往第一型錯誤的機率較為嚴重,因而需要被管控。 - 因此,alpha又稱為顯著水準(level of significance)=0.05; 0.01。
- 單側/雙側考驗:討論alpha放在哪一邊。
- 單側考驗:將所有alpha放於其中一端,其接受難度較高。
- 雙側考驗:將alpha平均分配於兩側。
- p-value:在H0為真的前提下,得到等於或者大於此一觀察結果之統計考驗值的機率,相當於圖形中極端邊的曲線下面積(換言之,其可能在左或者右側,依研究假設而定)。當p大的時候,代表其較靠近平均值,相對於p小的時候,表示其與平均值距離增大。
- alpha=0.05:代表發生第一型的錯誤機率低於0.05,常被作為判斷標準,其代表H0為真但被視為否定的第一型錯誤率。如p-value>alpha(0.05),表此類型錯誤的發生率超過標準,因而為不理想之狀況;如果p-value<alpha(0.05),表此類型錯誤的發生率低於標準,換言之虛無假設發生的機率不高,因而否定虛無假設。
- 臨界區或者拒絕區(region of rejection; critical region, unlikely region):只標準之外的區域,以0.05為例,則>0.05之曲線面積、範圍,稱為拒絕區。如分數落於此區域,則會拒絕虛無假設;相對之下其他區域則為接受區。
note:p-value視為第一型錯誤的發生率,而alpha=0.05是人為設定之標準,也可使用0.01端看研究之嚴謹度。如p大於此標準值,代表第一型錯誤發生機率高,換言之如果虛無假設為真,但被否定出錯的可能性高,因而接受虛無假設;如果p小於此標準值,代表第一型錯誤發生機率低,換言之虛無假設為真,但被否定而出錯的機率低,因而否決之。 - 拒絕區(region of rejection):如機率落於拒絕區內,表示否定虛無假設。
- 如果alpha相等,單側或雙側考驗較容易拒絕? 單側考驗較容易拒絕虛無假設(拒絕區域大),從問題本質上可如此區分:
- 問題:
- 單側:比較之概念,樣本之分數是否高於(或低於)母群?
- 雙側:是否相等之概念,樣本分數是否等同於母群分數?
- 符號:
- 單側:u1≧u2? or u1<u2?
- 雙側:u1=u2? or u1≠u2?
- 假設檢定的六個步驟:
- 設定理論:定義虛無假設與對立假設
- 選擇統計方法與顯著標準
- 選擇樣本與收案
- 找出拒絕區
- 計算統計數值(Z0)
- 進行統計決策
p.s) 取得CI也是相同概念,如果平均值落在範圍內則接受虛無,如果在外則拒絕虛無。
留言
張貼留言