2014.02.21 (五) 教育及心理統計二
Review
- 統計名詞
- 描述統計:以表、圖或量之方式,描述統計結果予人理解。
- 推論統計:
- 常態分配
- 特性
- 抽樣分配
- 中央極限定理(CLT):當樣本數(n)數量大時發生...
- 母群平均數=樣本平均數抽樣分配之平均數。
- 母群變異數/根號n=樣本平均數抽樣分配之變異數。
- 樣本平均數抽樣分配形式同母群分配形式。
- 樣本平均數抽樣分配之離散程度較母群分配離散程度小。
- 樣本平均數抽樣分配
- 平均數
- 變異數=標準誤(SEM)
- 假設檢定
- z test:資料距其來源之族群平均數相聚多少標準差。
- 臨界值
- 拒絕區
- p-value
- 信賴區間
- 錯誤風險
- type I error (alpha)
- type II error (beta)
- power:正確拒絕虛無假設之能力,同(1-beta)。
- 二項分配:由二種結果經多次執行後產生的分配型態。
- 類別資料:間斷或頻率之資料性質,用以區辨個體。
- 卡方檢定
- 卡方分配
- 平均數之假設檢定
- 母數檢定法:需對資料分配假設,其假設來自於參數。
- 無母數檢定法:不需對資料進行假設,故無使用參數問題。
- t test
- 常態分配
- 變異數同質
- 獨立性
- 單一樣本
- 已知母群變異數:Z test
- 不知母群變異數:t test
- 雙重樣本
- 相依樣本:paired t test
- 獨立樣本
- 母群變異數已知:Z test
- 母群變異數未知
- 已知變異數同質:t test
- Pool 標準差
- 已知變異數不同質:Behren-Fisher t' test
- 修正critical value(直接校正臨界標準)
- 修正degree of freedom(對應原本的分配)
- 當資料非常態分配時
- 當樣本超過二個以上時
- 有母數方法
- 樣本獨立:變異數分析 (Analysis of Variance,ANOVA) 比較各組平均數差異。
- 樣本相依:重複數計量 (repeated measure) 同一樣本多時間點前後測
- 無母數方法
Today
- 單因子變異數分析: 如地區(東南西北)
- F檢定:概括性的檢定,只告知有無差異,不提供那些變項間有差異。
- 多重比較:提供更細緻的資訊,顯示各變項之差異狀態。
- 二因子變異數分析: 如地區(東南西北)&性別(男女)
- 三因子變異數分析: 如地區(東南西北)&性別(男女)&年紀(<6歲,國小,國中,高中)
- 相關與回歸: 涉及二個因子以上的比較。
- 相關:變項與變項之間的關係。
- 回歸:產生預測性。
單一因子變異數分析 (one-way ANOVA)
- 又稱為simple ANOVA, one-way ANOVA, single factor design.
- 只有一個獨變項者,稱為"因子(factor)"
- t-test為ANOVA中的一個類型,恰為只有二個樣本的狀況之下。
- ANOVA的使用條件:(條件同t-test)
- interval/ration data 適用於連續變項
- normal distribution 常態分配
- equal variances 變異數同質
- independent 數量點之間各自獨立
Sources of Variability
- 雖名為變異數分析,實質上並非分析變異數,因前提假設已假定變異數同質。
- 資料的變異來源有四:
- 誤差變異(error variance)
- 隨機測量誤差 (measurement error)
- 控制誤差(uncontrolled extraneous var.);實指無法改變的變項,多為人口學變項如性別、年齡、社經地位、教育程度。
- 個體差異(individual difference)
- 獨立變項效應(independent variable effect):為主要驗證的變項,即研究中操弄的變項。
- 因此,ANOVA檢驗的重點在於「此獨立變項是否真確造成差異」,實質檢驗方式為比較「獨立變項影響效果與誤差變異影響效果的比值」,換言之,「獨立變項影響是否大於誤差變異之影響」表示「此獨立變項所造成的影響大於誤差之影響程度,因此我們無法排除此獨立變項的影響」。
- 舉例而言,住在東、西、南、北四個區域的孩子,此地域差異是否造成學業成就的差異?
t-test and ANOVA 基本上是between/within的比例概念,二者相近。
- t-test邏輯:
- H0=H1 表二族群之間沒有差異。
- t=(x1-x2)/sp:
- 分子反應二族群之間平均數的差異(between)。對應概念即為獨立變項(treatment, independent factor)之差異。
- 分母反應二族群內的差異(within),對應概念即為誤差變異(error variation)。
- 因此,此結果呈現的概念為組間變異/組內變異之比例關係,顯然如果組間變異超過組內變異,則此變項影響大於隨機誤差,因此拒絕虛無假設。
- ANOVA邏輯:
- H0:u1=u2=u3=u4 H1:至少一u不同。
- F=(error variance + independent variable variance)/error variance=(1+I/E)。
- 分子為between的概念。
- 分母為within的概念。
- 因此概念上同t-test。
- 若 H0發生,則F=1,表示Independent variable variance未造成影響。
- ANOVA並未考慮error variance如何產生,只管其與獨立變項的影響程度比例。
- note:此二邏輯比較為重要觀念。
- t test:between/ within
- ANOVA:(between+within)/within=1+between/within
- 不進行多個t-test的理由: t-test為ANOVA的一個特例,既如此,和不讓多個樣本間重複執行多個t-test? 理由有三
- 犯錯率與控制:執行一個F檢定,可知其犯錯率並管理之;然使用多個t-test,疊加每次檢定產生的0.05誤差,將造成檢定結果可信度存疑。
- powerful:二者比較之下F檢定的統計檢定力高於多次t-test的組合,表正確拒絕虛無假設的能力較好。
- F檢定的效能較佳,可考量各變項之影響,並且考量各變項間交互作用之影響。
- 如變項為性別(男女)及居住地(東西南北),則ANOVA可以處理:
- 無論居住地,男女族群平均數的差異
- 無論性別,居住地平均數的差異
- 同時考慮性別與居住地,共同作用之差異
1-way ANOVA
- model: Linear Structure
- 假定J表組別;i表個體編碼;並以Xij表第j組內第i個人的分數,其假設同t-test/ANOVA的基本假設。
- Xij=uj+eij (cell means model)
=(u,+aj)+eij (factor effects model) - u.表所有總平均(grand mean)
- aj表uj-u.(第j子的效果),總合為0。
- eij:xij-uj, eij~N(0,o^2)
note:但實際操作上,無法取得母群的u,因此操作上都將上述理論為u者轉換為樣本平均數X而處理之。 - treatment effect:
- fixed effect: model I (因子樣本取自於欲推論之母群,表示只檢視考慮樣本中的關係與狀態,而不延伸推廣其它樣本外的事情)
- 如探究三種教學方式的差別、探究東南西北四種居住地的差別,fixed effct指考慮這些已知資訊的關係與狀態。
- random effect: model II (隨機抽取因子樣本,目的為回推母群,表示只抽取部分作為代表,目的在觀察趨勢以回推母群其它可能)
- 如只取20,30,50mg的劑量,觀察劑量增加對於成效的關聯性是否正相關。
- mixed effect: model III (綜合上述二者,適用two-way ANOVA)
- 研究特定的三個學校學生之學習狀況(fixed)。
- 探究0,5,10mg藥物對身體的影響(random)。
- 前提假設:
- independent observations 獨立性 (不可變動)
- hemogeneity of variance 變異數同質(可接受些微變動)
- normality distribution of scores within each population 常態分配(近似常態即可)
note:上述內容中,關於ANOVA的概念、ANOVA與t-test的比較差異、ANOVA的前提假設以及變異的來源,皆為可能考試之命題。
留言
張貼留言