官术网_书友最值得收藏!

第二節(jié) 效度

一、效度的定義

效度是指一個測驗或量表實際能測出其所要測的心理特質(zhì)的程度。在測驗理論中,效度被定義為在一組測量中,與測量目標有關(guān)的真實方差(或稱有效方差)與總方差之比,即

公式2-12中,rxy代表測量的效度系數(shù),S2v代表有效變異系數(shù),S2x代表總的變異系數(shù)。

為了準確理解效度的概念,我們要注意:第一,效度是一個相對的概念。每個測量工具都有自己的目的,測驗都是為了特定的目的而設(shè)計的。當使用量表的功能與量表本身的目的一致時,才能保證量表的效度在相對較高的水平。內(nèi)隱特質(zhì)是通過外顯行為間接測得的,因此心理測量的效度只有程度上的差別,不可能百分之百準確,也不可能為零。第二,效度是測量的隨機誤差和系統(tǒng)誤差的綜合反映。只要出現(xiàn)了測量誤差,效度必受影響。第三,判斷一個測量是否有效要從多方面搜集證據(jù)。

二、效度的評估方法

測量效度指的是測量結(jié)果所達到測量目的的程度。就這方面而言,測量效度的估計在很大程度上取決于人們對測量目的的解釋。比較常見的解釋角度有三種:一是用測量內(nèi)容來說明目的,為內(nèi)容效度;二是用心理學上某種理論結(jié)構(gòu)來說明目的,為結(jié)構(gòu)效度;三是用工作實效來說明,為實證效度,也叫校標關(guān)聯(lián)效度。

(一)內(nèi)容效度

內(nèi)容效度指的是測驗題目對有關(guān)內(nèi)容或行為取樣的適當程度,即一個測驗實際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度。估計一個測驗的內(nèi)容效度就是去確定該測驗在多大程度上代表了所要測量的行為。因此,要確定一個測驗的內(nèi)容效度必須具備兩個條件:即要有定義完好的內(nèi)容范圍;題目應是所界定的內(nèi)容范圍的代表性取樣。

內(nèi)容效度主要應用于成就測驗,也適用于某些用于選拔和分類的職業(yè)測驗,不適用于能力傾向測驗和人格測驗。但是內(nèi)容效度缺乏理想的數(shù)量指標是它最突出的問題。另外,內(nèi)容效度經(jīng)常與表面效度混淆。表面效度是由外行對測驗作表面上的檢查確定的,它不反映測驗實際測量的東西,只是指測驗表面上看好像是測量所要測的東西;內(nèi)容效度是由夠資格的判斷者(專家)詳盡地、系統(tǒng)地對測驗作評價而建立的。最高行為測驗注重表面效度,測典型行為時則應該把表面效度降低,盡量不讓被試知道測試的內(nèi)容,這就是內(nèi)容效度與表面效度的區(qū)別。

內(nèi)容效度的評估有以下幾種方法:

1.邏輯分析法

也稱專家判斷法。就是請有關(guān)專家對測驗題目與原定內(nèi)容的符合性做出判斷,看測驗的題目是否代表規(guī)定的內(nèi)容。如果專家認為測驗題目恰當?shù)卮砹怂鶞y內(nèi)容,則測驗具有內(nèi)容效度。這種估計效度的方法,是一個邏輯分析的過程,所以內(nèi)容效度又稱“邏輯效度”。

為了使內(nèi)容效度內(nèi)容確定過程更為客觀,彌補專家的不足,可采用如下幾個步驟:第一,確定測驗內(nèi)容的總體范圍,描述有關(guān)的知識與技能及所用材料的來源;第二,編制雙向細目,確定每個題目所測的內(nèi)容,逐題比較自己的分類與測驗編制者的分類,并作記錄;第三,制定評定量表,從測驗內(nèi)容所測的技能、題目對所定義的范圍的覆蓋率、各種題目數(shù)量和分類的比例以及題目形式的適當性等方面,對測驗做出總的評價。

2.統(tǒng)計分析法

該方法包括:對評分者一致性的評定、兩個測驗復本的相關(guān)性和課程內(nèi)容的學習等分析、再測法等。

3.經(jīng)驗法

即通過實踐來檢驗效度。

(二)結(jié)構(gòu)效度

結(jié)構(gòu)效度是指一個測驗實際測到所要測量的理論結(jié)構(gòu)或特質(zhì)的程度,或者說測驗分數(shù)能夠說明心理學理論的某種結(jié)構(gòu)或特質(zhì)的程度。結(jié)構(gòu)是指用來解釋人類行為的理論框架或心理特質(zhì),是心理學中抽象的假設(shè)性的概念、特性或變量。

結(jié)構(gòu)效度具有以下幾個特點:第一,結(jié)構(gòu)效度的大小取決于事先假設(shè)的心理特質(zhì)理論。具有不同理論構(gòu)思的測驗,其結(jié)構(gòu)效度是無法進行比較的。第二,結(jié)構(gòu)效度有時很難獲得。當實際測量的資料無法證實我們的理論假設(shè)時,并不一定就表明該測量的結(jié)構(gòu)效度。第三,結(jié)構(gòu)效度沒有單一的指標,是由各方面的證據(jù)累積起來進行評價的。

與內(nèi)容效度不同,結(jié)構(gòu)效度的確定首先需要對所研究的結(jié)構(gòu)或特質(zhì)進行界定,提出理論框架,并把這一理論假設(shè)分解成一些細小的綱目,再依據(jù)理論框架提出各種可能的有關(guān)假設(shè),最后用邏輯或?qū)嵶C的方法驗證假設(shè)。

要確定結(jié)構(gòu)效度可以有以下幾種方法:

1.測驗內(nèi)方法

主要包括內(nèi)容效度、被試解答測題時的反應過程和測驗的同質(zhì)性。內(nèi)容效度高,實質(zhì)上,也說明結(jié)構(gòu)效度高;若有證據(jù)顯示某一題目的作答除了反映所要測量的特質(zhì)外,還反映著其他因素的影響,則說明該題沒有較好的體現(xiàn)理論構(gòu)想,該題的存在會降低結(jié)構(gòu)效度;若有證據(jù)表明該測驗不同質(zhì),則可斷定該測驗結(jié)構(gòu)效度不高。

2.測驗間方法

主要包括相容效度法、區(qū)分效度、會聚效度及因素分析法。相容效度法主要計算新的測驗與測量同一特質(zhì)的、已知效度較高的原有測驗的相關(guān)系數(shù)。如果兩個測驗的相關(guān)系數(shù)高,則新的測驗有較高的效度。區(qū)分效度的基本思想是如果兩個測驗是測量同一特質(zhì)的,即使使用相同的方法進行測量,它們之間的相關(guān)也應該很低。會聚效度認為如果兩個測驗是測量同一特質(zhì)的,即使使用不同的測驗方法,它們之間的相關(guān)也應該是高的。因素分析法是通過因素分析找出影響測驗的共同效度,測驗分數(shù)總變異來自有關(guān)因素的比例,即是該測驗結(jié)構(gòu)效度的指標。

3.考察測驗的校標關(guān)聯(lián)效度

從校標的性質(zhì)與種類來推論測量的結(jié)構(gòu)效度。有兩種做法:其一是依據(jù)效度把人分為兩類,考察其得分差異;其二是依據(jù)測驗得分把人分成高分組和低分組,考察這兩組在所測特質(zhì)方面是否有差異。

4.多種特質(zhì)-多種方法矩陣法

其原理是若用多種極不相同的方法測量同一種特質(zhì)相關(guān)很高。若有多種特質(zhì)都接受了多種方法的測查,就可以分別計算出任意兩種方法測量同一特質(zhì)的相關(guān)和測量不同特質(zhì)的相關(guān),以及任意兩種特質(zhì)接受同一方法和不同方法的相關(guān),并以這些相關(guān)系數(shù)為元素構(gòu)成一個矩陣。

(三)校標關(guān)聯(lián)效度

效標效度又稱實證效度,反映的是測驗預測個體在某種情境下行為表現(xiàn)的有效性程度。其中,被估計的行為是檢驗效度的外在標準,簡稱校標,也就是獨立于測驗并可以從實踐中直接獲得的我們所感興趣的行為。根據(jù)效標效度資料收集的時間差異,可以分為同時效度和預測效度。對于同時效度,測驗分數(shù)與校標資料是同時收集的,而預測效度中,先獲得測驗分數(shù),隔一段時間后,再收集校標資料。心理學中常用的校標資料有:學業(yè)成就、臨床診斷、實際工作表現(xiàn)、特殊訓練成績、不同團體的總體表現(xiàn)、先前有效的測驗、等級評定等。

一個好的效標必須具備以下條件:第一,有效性。校標必須能最有效地反映測驗的目標,即效標測量本身必須有效。第二,可靠性。效標必須具有較高的信度,穩(wěn)定可靠,不隨時間等因素而變化。第三,客觀性。效標可以客觀地加以測量,可用數(shù)據(jù)或等級來表示。第四,實用性。效標測量的方法簡單,省時省力,經(jīng)濟實用。

效標效度的評估方法有很多種,通常使用相關(guān)法、區(qū)分法、命中率和功利率等方法。

1.相關(guān)法

相關(guān)法是評估效標效度最常用的方法,它是求測驗分數(shù)與效標資料間的相關(guān)。

2.區(qū)分法

其基本思路是根據(jù)校標測驗的成績把被試分為兩組,然后分析這兩組被試原來接受測驗的分數(shù)差異,若這兩組人的測驗分數(shù)差異顯著,則說明該測驗有較高的效度。

3.命中率法

命中率法是當測驗用來做取舍的依據(jù)時,用其正確決定的比例作為效度指標的一種方法。四種情況:預測成功而且實際也成功;預測成功但實際上失敗;預測失敗而事實成功;預測失敗且實際上也失敗。稱正確的預測為命中,不正確的預測為失誤。命中率高低常隨劃分測驗分數(shù)成功與失敗的臨界分數(shù)的高低而變化。臨界分數(shù)越高,正命中率也越高;反之,臨界分數(shù)越低,則正命中率也越低。

4.功利率

即對使用測驗所需的費用和所得到的收益進行比較,看是否利大于弊。

三、影響效度的因素

凡是與測量目的無關(guān)的穩(wěn)定和不穩(wěn)定的變異都會影響測量的效度。主要有:

(一)測驗的構(gòu)成

測驗中所用詞匯和句型不能過于困難;題目的表達要清楚明了;所編制的測題要適合所要測量的學習結(jié)果;測驗中不能提供額外線索;測題的編制要合理;選擇題的正確答案不能有明顯的組型;測題的難度要適當;測題數(shù)目適當。

(二)測驗的實施過程

測驗在實施過程中,如不遵從指導語的要求,出現(xiàn)意外干擾、評分記分差錯等,都會降低測驗效度。

(三)接受測驗的被試

對單個被試而言,被試的應試動機、情緒、態(tài)度、身體狀態(tài)等都會影響測量信度,造成較大的隨機誤差,進而影響測量的效度。對于被試團體而言,樣本代表性好,同質(zhì)性好,有利于提高測驗效度。

(四)所選校標的性質(zhì)

測量行為與所選校標的相似性越高,效度越高。校標本身的測量越可靠,效度就可能越高。此時有一個因素需要注意,測驗分數(shù)與校標行為之間是否是線性關(guān)系,如果不是,求皮爾遜積差相關(guān)就會得出錯誤的效度結(jié)論。

(五)測量的信度

任何誤差的增加都會降低測量的效度,所以在考慮測量效度時,要注意測驗的信度,信度不高的測驗不可能具有很高的效度。信度高是效度高的必要而非充分條件,一個測驗效度高,其信度必然也高;但一個測驗信度高,效度不一定高,測驗的效度受其信度的制約。

主站蜘蛛池模板: 临海市| 凤翔县| 阿拉尔市| 汪清县| 乐业县| 林芝县| 两当县| 白朗县| 平利县| 元江| 陵川县| 通州市| 昔阳县| 黄山市| 缙云县| 西宁市| 开阳县| 黄梅县| 商河县| 鸡西市| 迁安市| 忻城县| 法库县| 阿克苏市| 双桥区| 祁阳县| 蛟河市| 鹤峰县| 阿拉尔市| 舒城县| 奉化市| 万源市| 怀仁县| 无为县| 天柱县| 本溪市| 如皋市| 武穴市| 乌鲁木齐县| 洞口县| 乐陵市|