- 罪犯心理測驗理論與技術(shù)
- 施柳周
- 3559字
- 2019-11-22 16:53:27
第二節(jié) 效度
一、效度的定義
效度是指一個測驗或量表實際能測出其所要測的心理特質(zhì)的程度。在測驗理論中,效度被定義為在一組測量中,與測量目標有關(guān)的真實方差(或稱有效方差)與總方差之比,即
公式2-12中,rxy代表測量的效度系數(shù),S2v代表有效變異系數(shù),S2x代表總的變異系數(shù)。
為了準確理解效度的概念,我們要注意:第一,效度是一個相對的概念。每個測量工具都有自己的目的,測驗都是為了特定的目的而設(shè)計的。當使用量表的功能與量表本身的目的一致時,才能保證量表的效度在相對較高的水平。內(nèi)隱特質(zhì)是通過外顯行為間接測得的,因此心理測量的效度只有程度上的差別,不可能百分之百準確,也不可能為零。第二,效度是測量的隨機誤差和系統(tǒng)誤差的綜合反映。只要出現(xiàn)了測量誤差,效度必受影響。第三,判斷一個測量是否有效要從多方面搜集證據(jù)。
二、效度的評估方法
測量效度指的是測量結(jié)果所達到測量目的的程度。就這方面而言,測量效度的估計在很大程度上取決于人們對測量目的的解釋。比較常見的解釋角度有三種:一是用測量內(nèi)容來說明目的,為內(nèi)容效度;二是用心理學上某種理論結(jié)構(gòu)來說明目的,為結(jié)構(gòu)效度;三是用工作實效來說明,為實證效度,也叫校標關(guān)聯(lián)效度。
(一)內(nèi)容效度
內(nèi)容效度指的是測驗題目對有關(guān)內(nèi)容或行為取樣的適當程度,即一個測驗實際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度。估計一個測驗的內(nèi)容效度就是去確定該測驗在多大程度上代表了所要測量的行為。因此,要確定一個測驗的內(nèi)容效度必須具備兩個條件:即要有定義完好的內(nèi)容范圍;題目應是所界定的內(nèi)容范圍的代表性取樣。
內(nèi)容效度主要應用于成就測驗,也適用于某些用于選拔和分類的職業(yè)測驗,不適用于能力傾向測驗和人格測驗。但是內(nèi)容效度缺乏理想的數(shù)量指標是它最突出的問題。另外,內(nèi)容效度經(jīng)常與表面效度混淆。表面效度是由外行對測驗作表面上的檢查確定的,它不反映測驗實際測量的東西,只是指測驗表面上看好像是測量所要測的東西;內(nèi)容效度是由夠資格的判斷者(專家)詳盡地、系統(tǒng)地對測驗作評價而建立的。最高行為測驗注重表面效度,測典型行為時則應該把表面效度降低,盡量不讓被試知道測試的內(nèi)容,這就是內(nèi)容效度與表面效度的區(qū)別。
內(nèi)容效度的評估有以下幾種方法:
1.邏輯分析法
也稱專家判斷法。就是請有關(guān)專家對測驗題目與原定內(nèi)容的符合性做出判斷,看測驗的題目是否代表規(guī)定的內(nèi)容。如果專家認為測驗題目恰當?shù)卮砹怂鶞y內(nèi)容,則測驗具有內(nèi)容效度。這種估計效度的方法,是一個邏輯分析的過程,所以內(nèi)容效度又稱“邏輯效度”。
為了使內(nèi)容效度內(nèi)容確定過程更為客觀,彌補專家的不足,可采用如下幾個步驟:第一,確定測驗內(nèi)容的總體范圍,描述有關(guān)的知識與技能及所用材料的來源;第二,編制雙向細目,確定每個題目所測的內(nèi)容,逐題比較自己的分類與測驗編制者的分類,并作記錄;第三,制定評定量表,從測驗內(nèi)容所測的技能、題目對所定義的范圍的覆蓋率、各種題目數(shù)量和分類的比例以及題目形式的適當性等方面,對測驗做出總的評價。
2.統(tǒng)計分析法
該方法包括:對評分者一致性的評定、兩個測驗復本的相關(guān)性和課程內(nèi)容的學習等分析、再測法等。
3.經(jīng)驗法
即通過實踐來檢驗效度。
(二)結(jié)構(gòu)效度
結(jié)構(gòu)效度是指一個測驗實際測到所要測量的理論結(jié)構(gòu)或特質(zhì)的程度,或者說測驗分數(shù)能夠說明心理學理論的某種結(jié)構(gòu)或特質(zhì)的程度。結(jié)構(gòu)是指用來解釋人類行為的理論框架或心理特質(zhì),是心理學中抽象的假設(shè)性的概念、特性或變量。
結(jié)構(gòu)效度具有以下幾個特點:第一,結(jié)構(gòu)效度的大小取決于事先假設(shè)的心理特質(zhì)理論。具有不同理論構(gòu)思的測驗,其結(jié)構(gòu)效度是無法進行比較的。第二,結(jié)構(gòu)效度有時很難獲得。當實際測量的資料無法證實我們的理論假設(shè)時,并不一定就表明該測量的結(jié)構(gòu)效度。第三,結(jié)構(gòu)效度沒有單一的指標,是由各方面的證據(jù)累積起來進行評價的。
與內(nèi)容效度不同,結(jié)構(gòu)效度的確定首先需要對所研究的結(jié)構(gòu)或特質(zhì)進行界定,提出理論框架,并把這一理論假設(shè)分解成一些細小的綱目,再依據(jù)理論框架提出各種可能的有關(guān)假設(shè),最后用邏輯或?qū)嵶C的方法驗證假設(shè)。
要確定結(jié)構(gòu)效度可以有以下幾種方法:
1.測驗內(nèi)方法
主要包括內(nèi)容效度、被試解答測題時的反應過程和測驗的同質(zhì)性。內(nèi)容效度高,實質(zhì)上,也說明結(jié)構(gòu)效度高;若有證據(jù)顯示某一題目的作答除了反映所要測量的特質(zhì)外,還反映著其他因素的影響,則說明該題沒有較好的體現(xiàn)理論構(gòu)想,該題的存在會降低結(jié)構(gòu)效度;若有證據(jù)表明該測驗不同質(zhì),則可斷定該測驗結(jié)構(gòu)效度不高。
2.測驗間方法
主要包括相容效度法、區(qū)分效度、會聚效度及因素分析法。相容效度法主要計算新的測驗與測量同一特質(zhì)的、已知效度較高的原有測驗的相關(guān)系數(shù)。如果兩個測驗的相關(guān)系數(shù)高,則新的測驗有較高的效度。區(qū)分效度的基本思想是如果兩個測驗是測量同一特質(zhì)的,即使使用相同的方法進行測量,它們之間的相關(guān)也應該很低。會聚效度認為如果兩個測驗是測量同一特質(zhì)的,即使使用不同的測驗方法,它們之間的相關(guān)也應該是高的。因素分析法是通過因素分析找出影響測驗的共同效度,測驗分數(shù)總變異來自有關(guān)因素的比例,即是該測驗結(jié)構(gòu)效度的指標。
3.考察測驗的校標關(guān)聯(lián)效度
從校標的性質(zhì)與種類來推論測量的結(jié)構(gòu)效度。有兩種做法:其一是依據(jù)效度把人分為兩類,考察其得分差異;其二是依據(jù)測驗得分把人分成高分組和低分組,考察這兩組在所測特質(zhì)方面是否有差異。
4.多種特質(zhì)-多種方法矩陣法
其原理是若用多種極不相同的方法測量同一種特質(zhì)相關(guān)很高。若有多種特質(zhì)都接受了多種方法的測查,就可以分別計算出任意兩種方法測量同一特質(zhì)的相關(guān)和測量不同特質(zhì)的相關(guān),以及任意兩種特質(zhì)接受同一方法和不同方法的相關(guān),并以這些相關(guān)系數(shù)為元素構(gòu)成一個矩陣。
(三)校標關(guān)聯(lián)效度
效標效度又稱實證效度,反映的是測驗預測個體在某種情境下行為表現(xiàn)的有效性程度。其中,被估計的行為是檢驗效度的外在標準,簡稱校標,也就是獨立于測驗并可以從實踐中直接獲得的我們所感興趣的行為。根據(jù)效標效度資料收集的時間差異,可以分為同時效度和預測效度。對于同時效度,測驗分數(shù)與校標資料是同時收集的,而預測效度中,先獲得測驗分數(shù),隔一段時間后,再收集校標資料。心理學中常用的校標資料有:學業(yè)成就、臨床診斷、實際工作表現(xiàn)、特殊訓練成績、不同團體的總體表現(xiàn)、先前有效的測驗、等級評定等。
一個好的效標必須具備以下條件:第一,有效性。校標必須能最有效地反映測驗的目標,即效標測量本身必須有效。第二,可靠性。效標必須具有較高的信度,穩(wěn)定可靠,不隨時間等因素而變化。第三,客觀性。效標可以客觀地加以測量,可用數(shù)據(jù)或等級來表示。第四,實用性。效標測量的方法簡單,省時省力,經(jīng)濟實用。
效標效度的評估方法有很多種,通常使用相關(guān)法、區(qū)分法、命中率和功利率等方法。
1.相關(guān)法
相關(guān)法是評估效標效度最常用的方法,它是求測驗分數(shù)與效標資料間的相關(guān)。
2.區(qū)分法
其基本思路是根據(jù)校標測驗的成績把被試分為兩組,然后分析這兩組被試原來接受測驗的分數(shù)差異,若這兩組人的測驗分數(shù)差異顯著,則說明該測驗有較高的效度。
3.命中率法
命中率法是當測驗用來做取舍的依據(jù)時,用其正確決定的比例作為效度指標的一種方法。四種情況:預測成功而且實際也成功;預測成功但實際上失敗;預測失敗而事實成功;預測失敗且實際上也失敗。稱正確的預測為命中,不正確的預測為失誤。命中率高低常隨劃分測驗分數(shù)成功與失敗的臨界分數(shù)的高低而變化。臨界分數(shù)越高,正命中率也越高;反之,臨界分數(shù)越低,則正命中率也越低。
4.功利率
即對使用測驗所需的費用和所得到的收益進行比較,看是否利大于弊。
三、影響效度的因素
凡是與測量目的無關(guān)的穩(wěn)定和不穩(wěn)定的變異都會影響測量的效度。主要有:
(一)測驗的構(gòu)成
測驗中所用詞匯和句型不能過于困難;題目的表達要清楚明了;所編制的測題要適合所要測量的學習結(jié)果;測驗中不能提供額外線索;測題的編制要合理;選擇題的正確答案不能有明顯的組型;測題的難度要適當;測題數(shù)目適當。
(二)測驗的實施過程
測驗在實施過程中,如不遵從指導語的要求,出現(xiàn)意外干擾、評分記分差錯等,都會降低測驗效度。
(三)接受測驗的被試
對單個被試而言,被試的應試動機、情緒、態(tài)度、身體狀態(tài)等都會影響測量信度,造成較大的隨機誤差,進而影響測量的效度。對于被試團體而言,樣本代表性好,同質(zhì)性好,有利于提高測驗效度。
(四)所選校標的性質(zhì)
測量行為與所選校標的相似性越高,效度越高。校標本身的測量越可靠,效度就可能越高。此時有一個因素需要注意,測驗分數(shù)與校標行為之間是否是線性關(guān)系,如果不是,求皮爾遜積差相關(guān)就會得出錯誤的效度結(jié)論。
(五)測量的信度
任何誤差的增加都會降低測量的效度,所以在考慮測量效度時,要注意測驗的信度,信度不高的測驗不可能具有很高的效度。信度高是效度高的必要而非充分條件,一個測驗效度高,其信度必然也高;但一個測驗信度高,效度不一定高,測驗的效度受其信度的制約。