2014.12.1 心理測驗(十八) 效度

2014.12.1 心理測驗(十八) 效度

MTMM

使用多元相關矩陣呈現

對角線(測驗與本身的相關)，概念同再測信度

故曰測驗信度為測驗間相關的最大值

在MTMM中，假設每個測驗分數有二個來源：(1)測驗建構(trait) (2)測驗方法(method)

測量相同建構，使用相同方法的分數相關即為信度
測量相同建構，使用不同方法的分數相關即為收斂效度
測量不同建構，無論使用相同或者不同的方法，其測驗分數間的相關即為發散效度

名詞解釋(僅限MTMM)

信度：測量相同特質且使用相同方法的測驗分數之相關，落在主對角線上，即為測驗相關的最大值
收斂效度：測量相同特質但使用不同方法的測驗分數之相關
發散效度：測量不同的特質，且不論測量的方法之相關
Method bias：測驗信度與收斂效度相似程度高，則其偏差程度較小
same pattern of inter-traits relationships

使用相同方法的結果，應較使用不同方法的結果來的更為相關
如有多組比較，這樣的特質應該穩定出現在所有比較中

舉例而言：

測驗建構：生活品質 & 社會功能
測驗方法：受試者自評(問卷) & 受訓評估者(performance-based)
上述的結構可以交織出四種測驗，依序為：

受試者自評的生活品質問卷
受訓評估者的生活品質測驗
受試者自評的社會功能問卷
受訓者評估的社會功能測驗

解由比較其相關矩陣，而能得到MTMM的比較結果，如信度、收斂/發散效度

注意事項：

MTMM是收斂與發散效度定義的延伸，實為其中一種效度指標，而非絕對。若需考慮收斂與發散效度，仍應使用原始概念
對於相同的測驗建構，至少需有二種以上的資料收集方式(如自評、他評、投射等)

備註：

收斂效度是採用不同方法測驗相同建構的測驗分數間之相關？

No, 此定義僅限於MTMM方法中，且MTMM僅為其中一種驗證的方法。
收斂/發散效度的原始定義為「二個評估工具之間的相關性」，如智力測驗量表與憂鬱量表之間的相關性(應該低)。

MTMM是1950年代發展，至今仍在討論的方法

但是使用率不高，因收案成本甚高
現在的MTMM大多使用SEM的方法執行，因此學者聚焦討論如何建構其model以驗證之

WAIS的分數與其他智力測驗分數相關係數高，則代表其具有效標關聯效度？收斂效度？或者其它？

此相關係數高，可以代表其具有效標關聯效度高，同時也表徵具有收斂效度高
同樣的，如與總分的相關性可做為鑑別度指標，也可做為內部一致性的指標

因素分析(factor analysis)：通常用在項目分析以及效度研究

應用

項目分析：選出合適(排除不合適)的題目
效度研究：驗證測驗的結果是否如原先設計具有相同的建構

發展者

Charles Edward Spearman
Louis Leon Thunstrom

Spearman's two factor theory (用於智力測驗，認為測驗結果均與g-factor相關，而其線段間的關係則為因素負荷量)

general factor
specific factor

理論：解釋變項之間的相關
備註：(是否該去修一下FA跟SEM。。。)

轉軸

維持90度的轉軸(正交轉軸)
不維持90度的轉軸(斜交轉軸)

針對測驗之間的相關進行分析
起始狀態只要一組因素負荷量，即可在因素空間將變項定位
因素負荷量是單一因素對測驗表現之間的影響

simple structure：期望負荷量大的就很大，小的很小，可以一目了然
轉來轉去可以有很多種轉法，但是有一種轉法可以把因素影響看得很清楚

因素負荷量≠變項與因素間的相關(只存在於變項與因素之間零相關時)
如果因素之間有更高階的概念存在，可用high-order FA

如在四個智力的次項度中加上一個普通智力的概念

逕路分析(path analysis)

可用以檢視依文獻建立的模型是否為真

檢視的重點為建構間的相關性
可用以驗證理論的位階

結構方程模型(Structural equation modeling)

是徑路分析與因素分析的結合體
發展者：Karl Gustav Joreskog (LISERL)
應用

驗證性因素分析(CFA)

圈圈：因素，潛在變項
框框：觀察變項

敏感性與特異性(sensitivity & specificity)

如MMSE常用以檢測失智(滿分30，cut-off point為26分)

屬於篩檢量表
為快速篩檢有問題者，因此設立切截分數(cut-off point)

名詞解釋

敏感性：篩檢工具判定有病的個體，實際上有病的百分比。
特異性：篩檢工具判定沒病的個體，實際上沒病的百分比。

切截分數的設定：依目標而定(對於錯誤決定的代價有多高)

理想的切截分數應有較高的敏感性與特異性

這是效度研究的一種方式，但是不屬於相關的類別

項目指標 & 測驗信、效度指標

item validity index ?

實際上是幫助挑選具有效標關聯效度的題目(因其計算公式展開即為相關性)

研究者可以自行決定是否使用這些項目指標

也包含使用那些效標作為參考基準

五四三&補充專區：

魯賓遜漂流記的作者Daniel Defoe談學習：

「叫不出課名」的老師，Rev.Charles Morton，認為

"教育的目的是培養學生讀更多的書"
a scholar V.S a man of learning ? What's the different?
較是不是販賣知識的地方，而是老師與學生組成教與學的舞台

效度之發展與內容

內容效度

概念於自於教育領域，教師須能判斷測驗的內容是否符合其所考驗的學生能力。例如教師預測良學生對數學運算(加減)的程度，而須考慮題目是否只測驗到加減而沒有參雜其他要素。
內容效度是指測驗題目是否具有代表性，著重於題目內容本身，而非作答的型態。因此，雖然後續的建構效度有類似的概念(測驗是否測量到其欲測量的特質)，但那是依據作答反應而分析的結果。

效標關聯效度

拓展到企業使用，因此重點為選材，著重其績效表現。
效標關聯效度依據推測的績效表現，而可分為同時效度與預測效度。同時效度為與測驗同時的其他測驗之表現，而預測效度則為測驗可預測其他時間點的效標之表現。
具有同時效度的測驗，某種程度也可宣稱其具有收斂效度(依照理論測驗建構與其它建構之間的關係)

建構效度

後續心理學發展過程中重新重視效度的意義，認為效度研究應回歸效度的基本定義，即考驗測驗是否測量到其所欲測量的建構？
前述的內容效度與效標關聯效度，某種程度也間接地支持建構效度的驗證。
常用因素分析、收斂/發散效度或SEM等方式驗證

Summary

傳統的效度

內容
效標
建構

其他的效度議題

並非只考慮技術層面的運算
測驗情境與目的的媒合
測驗結果對個體的潛在影響與風險

五個效度驗證的來源

測驗內容 (內容)
反應過程：著重作答反應的歷程( 建構)
內部結構：題目內部之間的相似性(建構)
與其它變項的相關(效標關聯&建構效度中的收斂與發散)
測驗結果的影響

留言