|
一、信度
信度所談的是測驗資料的可靠性、穩定性與一致性。為了達到可靠、穩定、一致的結果,可從多個方面來驗證測驗的信度。
再測信度:
再測信度是指同一個測驗在不同的時間施作,其結果的一致性,是一種穩定係數。一般的作法是:第一次施測 → 經過一段時間 → 第二次對同一群人施測 → 求取兩次測驗分數的相關。相關係數愈高表測驗結果的穩定性愈高。
內部一致性信度:
前面已經談過一個專業的心理測驗,會以多個試題共同測量一個心理特質,「內部一致性信度」所欲驗證的就是這些題目確實是在測量同一個心理特質。
其原理是檢驗每一個題目的作答反應與總分的相關性,相關愈高表示該題與其他測驗題目愈同質,愈是在測量同一個特質。常見的一致性信度指標為Cronbach's
α係數,其概念類似相關係數,分數介於0~1之間,係數愈高代表一致性愈高,一般而言信度係數在0.6以上是可接受的範圍。
複本信度:
複本指的是當一個測驗有二套以上的平行題本時,就需要驗證這二套題本分數的一致性。一般的作法是:受測樣本同時做二套題本,然後求取兩個測驗分數的相關,相關愈高表二個題本的測驗結果愈一致,日後不論用那一套題本的測驗結果都可以互相的比較。
二、效度
相對於信度所談的測驗分數的穩定、一致與可靠性,效度的概念則是在驗證測驗是否能真實而正確地測量到其所欲測的特質或行為,亦即是否「名實相符」。例如一個聲稱在測量領導能力的測驗,是否真正測量到領導能力而不是其他的能力,則該測驗就需要提供進一步的訊息加以驗證。
在效度上最常使用的是「效標關聯效度」,它是指以驗證性的方法,來探討測驗分數與一些外在效標之間的關係。效標是什麼,就看我們要驗證什麼樣的假設。
常見的作法有:
用已發展好測量相同特質的測驗為效標:
亦即將發展中的測驗與這個測驗同時施測在同一群人身上,然後計算這個測驗分數的相關性,理論上,既然是測相同的特質,所得到的結果應會相近。
以所要預測的某些行為或量數為效標:
例如:一測量工作能力的測驗,可能會使用工作績效、工作滿意度等為效標,一個測量學業學習潛能的測驗,可能會以學校的學期分數為效標。
收集效標分數與測驗分數後,就可求取這兩個分數的相關係數,了解測驗分數與效標分數的相關性;或者,選取在效標分數上高分的(例如前30%)與低分的(例如後30%)人,比較高分組與低分組在測驗的分數上是否真的有顯著的差異存在。總之,我們若假設測驗的分數可以預測其工作或學業的表現,就必須要提出相關的證據來證明。
效度可由多角度多層次去探討,有其特殊性及使用性,所以一個測驗可有多個效度指標,並不限於一個。
簡而言之,效度所要做的就是去「證實測驗所宣稱的事」,例如其宣稱是在測量智力,就要有證據來證明其測量到的真正的是智力,或者測驗宣稱其所測得的智力可預測學業成績,也要有證據來證明這一項假設。
最後,要提醒各位的是,信度與效度雖然關心的是不同的事,但是效度是建基在信度上的,沒有高的信度就不會有高的效度,試想一個測驗今天測一次、明天再測一次的結果相當不同,兩次的結果都會與效標有高度相關嗎?
所以檢驗測驗的品質時,若其所提供的信度指標顯示這個測驗的穩定、一致性不足,則其效度再高仍不足採信。
|