2014.02.21 (五) 教育及心理統計二


Review
  • 統計名詞
  • 描述統計:以表、圖或量之方式,描述統計結果予人理解。
    • 表、圖
      • 集中趨勢指標
      • 離散趨勢指標
      • 相對地位指標
      • 估計值
        • 好的估計值之條件
  • 推論統計:
    • 常態分配
      • 特性
    • 抽樣分配
      • 中央極限定理(CLT):當樣本數(n)數量大時發生...
        • 母群平均數=樣本平均數抽樣分配之平均數。
        • 母群變異數/根號n=樣本平均數抽樣分配之變異數。
        • 樣本平均數抽樣分配形式同母群分配形式。
        • 樣本平均數抽樣分配之離散程度較母群分配離散程度小。
      • 樣本平均數抽樣分配
        • 平均數
        • 變異數=標準誤(SEM)
    • 假設檢定
      • z test:資料距其來源之族群平均數相聚多少標準差。
      • 臨界值
      • 拒絕區
      • p-value
      • 信賴區間
      • 錯誤風險
        • type I error (alpha)
        • type II error (beta)
        • power:正確拒絕虛無假設之能力,同(1-beta)。
    • 二項分配:由二種結果經多次執行後產生的分配型態。
    • 類別資料:間斷或頻率之資料性質,用以區辨個體。
      • 卡方檢定
        • 卡方分配
    • 平均數之假設檢定
      • 母數檢定法:需對資料分配假設,其假設來自於參數。
      • 無母數檢定法:不需對資料進行假設,故無使用參數問題。
      • t test
        • 常態分配
        • 變異數同質
        • 獨立性
      • 單一樣本
        • 已知母群變異數:Z test
        • 不知母群變異數:t test
      • 雙重樣本
        • 相依樣本:paired t test
        • 獨立樣本
          • 母群變異數已知:Z test
          • 母群變異數未知
        • 已知變異數同質:t test
          • Pool 標準差
        • 已知變異數不同質:Behren-Fisher t' test
          • 修正critical value(直接校正臨界標準)
          • 修正degree of freedom(對應原本的分配)
    • 當資料非常態分配時
    • 當樣本超過二個以上時
      • 有母數方法
        • 樣本獨立:變異數分析 (Analysis of Variance,ANOVA) 比較各組平均數差異。
        • 樣本相依:重複數計量 (repeated measure) 同一樣本多時間點前後測
      • 無母數方法
Today
  • 單因子變異數分析: 如地區(東南西北)
    • F檢定:概括性的檢定,只告知有無差異,不提供那些變項間有差異。
    • 多重比較:提供更細緻的資訊,顯示各變項之差異狀態。
  • 二因子變異數分析: 如地區(東南西北)&性別(男女)
  • 三因子變異數分析: 如地區(東南西北)&性別(男女)&年紀(<6歲,國小,國中,高中)
  • 相關與回歸: 涉及二個因子以上的比較。
    • 相關:變項與變項之間的關係。
    • 回歸:產生預測性。
單一因子變異數分析 (one-way ANOVA)
  • 又稱為simple ANOVA, one-way ANOVA, single factor design.
  • 只有一個獨變項者,稱為"因子(factor)"
  • t-test為ANOVA中的一個類型,恰為只有二個樣本的狀況之下。
  • ANOVA的使用條件:(條件同t-test)
    • interval/ration data 適用於連續變項
    • normal distribution 常態分配
    • equal variances 變異數同質
    • independent 數量點之間各自獨立
Sources of Variability
  • 雖名為變異數分析,實質上並非分析變異數,因前提假設已假定變異數同質。
  • 資料的變異來源有四:
    • 誤差變異(error variance)
      • 隨機測量誤差 (measurement error)
      • 控制誤差(uncontrolled extraneous var.);實指無法改變的變項,多為人口學變項如性別、年齡、社經地位、教育程度。
      • 個體差異(individual difference)
    • 獨立變項效應(independent variable effect):為主要驗證的變項,即研究中操弄的變項。
  • 因此,ANOVA檢驗的重點在於「此獨立變項是否真確造成差異」,實質檢驗方式為比較「獨立變項影響效果與誤差變異影響效果的比值」,換言之,「獨立變項影響是否大於誤差變異之影響」表示「此獨立變項所造成的影響大於誤差之影響程度,因此我們無法排除此獨立變項的影響」。
    • 舉例而言,住在東、西、南、北四個區域的孩子,此地域差異是否造成學業成就的差異?
t-test and ANOVA   基本上是between/within的比例概念,二者相近。
  • t-test邏輯:
    •  H0=H1  表二族群之間沒有差異。
    • t=(x1-x2)/sp:
      • 分子反應二族群之間平均數的差異(between)。對應概念即為獨立變項(treatment, independent factor)之差異。
      • 分母反應二族群內的差異(within),對應概念即為誤差變異(error variation)。
      • 因此,此結果呈現的概念為組間變異/組內變異之比例關係,顯然如果組間變異超過組內變異,則此變項影響大於隨機誤差,因此拒絕虛無假設。
  • ANOVA邏輯:
    • H0:u1=u2=u3=u4   H1:至少一u不同。
    • F=(error variance + independent variable variance)/error variance=(1+I/E)。
      • 分子為between的概念。
      • 分母為within的概念。
      • 因此概念上同t-test。
    • 若 H0發生,則F=1,表示Independent variable variance未造成影響。
    • ANOVA並未考慮error variance如何產生,只管其與獨立變項的影響程度比例。
  • note:此二邏輯比較為重要觀念。
    • t test:between/ within
    • ANOVA:(between+within)/within=1+between/within
  • 不進行多個t-test的理由: t-test為ANOVA的一個特例,既如此,和不讓多個樣本間重複執行多個t-test? 理由有三
    • 犯錯率與控制:執行一個F檢定,可知其犯錯率並管理之;然使用多個t-test,疊加每次檢定產生的0.05誤差,將造成檢定結果可信度存疑。
    • powerful:二者比較之下F檢定的統計檢定力高於多次t-test的組合,表正確拒絕虛無假設的能力較好。
    • F檢定的效能較佳,可考量各變項之影響,並且考量各變項間交互作用之影響。
      • 如變項為性別(男女)及居住地(東西南北),則ANOVA可以處理:
        • 無論居住地,男女族群平均數的差異
        • 無論性別,居住地平均數的差異
        • 同時考慮性別與居住地,共同作用之差異
1-way ANOVA
  • model: Linear Structure
  • 假定J表組別;i表個體編碼;並以Xij表第j組內第i個人的分數,其假設同t-test/ANOVA的基本假設。
    • Xij=uj+eij (cell means model)
      =(u,+aj)+eij (factor effects model)
    • u.表所有總平均(grand mean)
    • aj表uj-u.(第j子的效果),總合為0。
    • eij:xij-uj, eij~N(0,o^2)
      note:但實際操作上,無法取得母群的u,因此操作上都將上述理論為u者轉換為樣本平均數X而處理之。
  • treatment effect:
    • fixed effect: model I (因子樣本取自於欲推論之母群,表示只檢視考慮樣本中的關係與狀態,而不延伸推廣其它樣本外的事情)
      • 如探究三種教學方式的差別、探究東南西北四種居住地的差別,fixed effct指考慮這些已知資訊的關係與狀態。
    • random effect: model II (隨機抽取因子樣本,目的為回推母群,表示只抽取部分作為代表,目的在觀察趨勢以回推母群其它可能)
      • 如只取20,30,50mg的劑量,觀察劑量增加對於成效的關聯性是否正相關。
    • mixed effect: model III (綜合上述二者,適用two-way ANOVA)
      • 研究特定的三個學校學生之學習狀況(fixed)。
      • 探究0,5,10mg藥物對身體的影響(random)。
  • 前提假設:
    • independent observations 獨立性 (不可變動)
    • hemogeneity of variance 變異數同質(可接受些微變動)
    • normality distribution of scores within each population  常態分配(近似常態即可)

note:上述內容中,關於ANOVA的概念ANOVA與t-test的比較差異ANOVA的前提假設以及變異的來源,皆為可能考試之命題。

留言

熱門文章