2014.12.1 心理測驗(十八) 效度

MTMM

  • 使用多元相關矩陣呈現
    • 對角線(測驗與本身的相關),概念同再測信度
      • 故曰測驗信度為測驗間相關的最大值
    • 在MTMM中,假設每個測驗分數有二個來源:(1)測驗建構(trait) (2)測驗方法(method)
      • 測量相同建構,使用相同方法的分數相關即為信度
      • 測量相同建構,使用不同方法的分數相關即為收斂效度
      • 測量不同建構,無論使用相同或者不同的方法,其測驗分數間的相關即為發散效度
    • 名詞解釋(僅限MTMM)
      • 信度:測量相同特質且使用相同方法的測驗分數之相關,落在主對角線上,即為測驗相關的最大值
      • 收斂效度:測量相同特質但使用不同方法的測驗分數之相關
      • 發散效度:測量不同的特質,且不論測量的方法之相關
      • Method bias:測驗信度與收斂效度相似程度高,則其偏差程度較小
      • same pattern of inter-traits relationships
        • 使用相同方法的結果,應較使用不同方法的結果來的更為相關
        • 如有多組比較,這樣的特質應該穩定出現在所有比較中
    • 舉例而言:
      • 測驗建構:生活品質 & 社會功能
      • 測驗方法:受試者自評(問卷) & 受訓評估者(performance-based)
      • 上述的結構可以交織出四種測驗,依序為:
        1. 受試者自評的生活品質問卷
        2. 受訓評估者的生活品質測驗
        3. 受試者自評的社會功能問卷
        4. 受訓者評估的社會功能測驗
      • 解由比較其相關矩陣,而能得到MTMM的比較結果,如信度、收斂/發散效度
    • 注意事項:
      • MTMM是收斂與發散效度定義的延伸,實為其中一種效度指標,而非絕對。 若需考慮收斂與發散效度,仍應使用原始概念
      • 對於相同的測驗建構,至少需有二種以上的資料收集方式(如自評、他評、投射等)
    • 備註:
      • 收斂效度是採用不同方法測驗相同建構的測驗分數間之相關?
        • No, 此定義僅限於MTMM方法中,且MTMM僅為其中一種驗證的方法。
        • 收斂/發散效度的原始定義為「二個評估工具之間的相關性」,如智力測驗量表與憂鬱量表之間的相關性(應該低)。
      • MTMM是1950年代發展,至今仍在討論的方法
        • 但是使用率不高, 因收案成本甚高
        • 現在的MTMM大多使用SEM的方法執行,因此學者聚焦討論如何建構其model以驗證之
      • WAIS的分數與其他智力測驗分數相關係數高,則代表其具有效標關聯效度? 收斂效度? 或者其它?
        • 此相關係數高,可以代表其具有效標關聯效度高,同時也表徵具有收斂效度高
        • 同樣的,如與總分的相關性可做為鑑別度指標,也可做為內部一致性的指標
因素分析(factor analysis):通常用在項目分析以及效度研究
  • 應用
    • 項目分析:選出合適(排除不合適)的題目
    • 效度研究:驗證測驗的結果是否如原先設計具有相同的建構
  • 發展者
    • Charles Edward Spearman
    • Louis Leon Thunstrom
  • Spearman's two factor theory (用於智力測驗,認為測驗結果均與g-factor相關,而其線段間的關係則為因素負荷量)
    • general factor 
    • specific factor
  • 理論:解釋變項之間的相關
  • 備註:(是否該去修一下FA跟SEM。。。)
    • 轉軸
      • 維持90度的轉軸(正交轉軸)
      • 不維持90度的轉軸(斜交轉軸)
    • 針對測驗之間的相關進行分析
    • 起始狀態只要一組因素負荷量,即可在因素空間將變項定位
    • 因素負荷量是單一因素對測驗表現之間的影響
      • simple structure:期望負荷量大的就很大,小的很小,可以一目了然
      • 轉來轉去可以有很多種轉法,但是有一種轉法可以把因素影響看得很清楚
    • 因素負荷量≠變項與因素間的相關(只存在於變項與因素之間零相關時)
    • 如果因素之間有更高階的概念存在,可用high-order FA
      • 如在四個智力的次項度中加上一個普通智力的概念
逕路分析(path analysis)
  • 可用以檢視依文獻建立的模型是否為真
    • 檢視的重點為建構間的相關性
    • 可用以驗證理論的位階
結構方程模型(Structural equation modeling)
  • 是徑路分析與因素分析的結合體
  • 發展者:Karl Gustav Joreskog (LISERL)
  • 應用
    • 驗證性因素分析(CFA)
      • 圈圈:因素,潛在變項
      • 框框:觀察變項
敏感性與特異性(sensitivity & specificity)
  • 如MMSE常用以檢測失智(滿分30,cut-off point為26分)
    • 屬於篩檢量表
    • 為快速篩檢有問題者,因此設立切截分數(cut-off point)
  • 名詞解釋
    • 敏感性:篩檢工具判定有病的個體,實際上有病的百分比。 
    • 特異性:篩檢工具判定沒病的個體,實際上沒病的百分比。
  • 切截分數的設定: 依目標而定(對於錯誤決定的代價有多高)
    • 理想的切截分數應有較高的敏感性與特異性
  • 這是效度研究的一種方式,但是不屬於相關的類別

項目指標 & 測驗信、效度指標
  • item validity index ? 
    • 實際上是幫助挑選具有效標關聯效度的題目(因其計算公式展開即為相關性)
  • 研究者可以自行決定是否使用這些項目指標
    • 也包含使用那些效標作為參考基準

五四三&補充專區:
  • 魯賓遜漂流記的作者Daniel Defoe談學習:
    • 「叫不出課名」的老師,Rev.Charles Morton,認為
      • "教育的目的是培養學生讀更多的書"
      • a scholar V.S a man of learning ? What's the different? 
      • 較是不是販賣知識的地方,而是老師與學生組成教與學的舞台
  • 效度之發展與內容
    • 內容效度
      • 概念於自於教育領域,教師須能判斷測驗的內容是否符合其所考驗的學生能力。 例如教師預測良學生對數學運算(加減)的程度,而須考慮題目是否只測驗到加減而沒有參雜其他要素。
      • 內容效度是指測驗題目是否具有代表性,著重於題目內容本身,而非作答的型態。因此,雖然後續的建構效度有類似的概念(測驗是否測量到其欲測量的特質),但那是依據作答反應而分析的結果。
    • 效標關聯效度
      • 拓展到企業使用,因此重點為選材,著重其績效表現。
      • 效標關聯效度依據推測的績效表現,而可分為同時效度與預測效度。同時效度為與測驗同時的其他測驗之表現,而預測效度則為測驗可預測其他時間點的效標之表現。
      • 具有同時效度的測驗,某種程度也可宣稱其具有收斂效度(依照理論測驗建構與其它建構之間的關係)
    • 建構效度
      • 後續心理學發展過程中重新重視效度的意義,認為效度研究應回歸效度的基本定義,即考驗測驗是否測量到其所欲測量的建構?
      • 前述的內容效度與效標關聯效度,某種程度也間接地支持建構效度的驗證。
      • 常用因素分析、收斂/發散效度或SEM等方式驗證
Summary
  • 傳統的效度
    • 內容
    • 效標
    • 建構
  • 其他的效度議題
    • 並非只考慮技術層面的運算
    • 測驗情境與目的的媒合
    • 測驗結果對個體的潛在影響與風險
  • 五個效度驗證的來源
    • 測驗內容 (內容)
    • 反應過程:著重作答反應的歷程( 建構)
    • 內部結構:題目內部之間的相似性(建構)
    • 與其它變項的相關(效標關聯&建構效度中的收斂與發散)
    • 測驗結果的影響

留言

熱門文章