官术网_书友最值得收藏!

1 心理測量概論

1.1 什么是心理測量

心理測量、心理測驗(yàn)與人事測量

心理測量(psychological measurement)是通過科學(xué)、客觀、標(biāo)準(zhǔn)的測量手段對人的特定素質(zhì)進(jìn)行測量、分析和評價(jià)。研究心理測量的學(xué)科叫做心理測量學(xué)(psychometrics)。這里的所謂素質(zhì),是指那些完成特定工作或活動所需要或與之相關(guān)的感知、技能、能力、氣質(zhì)、性格、興趣和動機(jī)等個(gè)人特征,它們是以一定的質(zhì)量和速度完成工作或活動的基礎(chǔ)。

人事測量(personnel assessment)是心理測量技術(shù)在人事管理領(lǐng)域的應(yīng)用,它以心理測量為基礎(chǔ),針對特定的人事管理目的如招聘、安置、考核、晉升、培訓(xùn)、獎懲等,對人的素質(zhì)進(jìn)行多方面的系統(tǒng)評價(jià),從而為人事管理、開發(fā)提供參考依據(jù)。因此,相對來說,人事測量是一個(gè)更廣泛的實(shí)用概念,它通常要求運(yùn)用多種心理測量工具來完成。

心理測驗(yàn)(psychological test)是心理測量的一種具體方法和手段,它是結(jié)合行為科學(xué)和統(tǒng)計(jì)學(xué)以評價(jià)特定個(gè)體在特定素質(zhì)上相對于特定群體所處的水平的手段。心理測驗(yàn)是人事測量中最常采用的方法之一。除測驗(yàn)法之外,人事測量還經(jīng)常采用觀察法、訪談法、調(diào)查法等。以上幾個(gè)概念之間的關(guān)系可由圖1.1來表示:

圖1.1 心理測量、心理測驗(yàn)與人事測量的關(guān)系

就具體方法而言,心理測量是通過對特定個(gè)體的有限的具有代表性的行為進(jìn)行觀察,依據(jù)事先確定的原則,對貫穿在行為活動中的心理特征進(jìn)行推論和數(shù)量化分析。也就是說,由外部行為推及內(nèi)在特征。個(gè)體的心理活動和心理特征是很難用直接測量的手段來度量的,往往要通過對心理特征的外顯結(jié)果——行為進(jìn)行測量,才能推知個(gè)體內(nèi)部的心理活動狀態(tài)和心理特征。因此,心理測量的對象實(shí)際上是行為樣本,而不是心理狀態(tài)。這種由行為表現(xiàn)到心理狀態(tài)的推論并不是主觀隨意的,它必須在成熟的心理測量學(xué)理論的基礎(chǔ)上,采用客觀、科學(xué)的方法進(jìn)行推斷。

心理測驗(yàn)的五個(gè)基本要素

心理測驗(yàn)是人事測量的重要手段,心理測驗(yàn)是對行為樣本的客觀的和標(biāo)準(zhǔn)化的測量。它包含以下五個(gè)基本要素:

1.行為樣本

人們在對一類事物的某種特性進(jìn)行考察時(shí)往往無法對這類事物的每一特定情況進(jìn)行逐個(gè)觀測,而總是抽取這類事物中有典型代表性的一部分進(jìn)行觀測,進(jìn)而推論該類事物的普遍特性。

對個(gè)體行為或行為特征的測查同樣無法做到面面俱到。在進(jìn)行心理測量時(shí),往往只能對經(jīng)過科學(xué)選擇的少數(shù)行為樣本進(jìn)行測查,借以推測個(gè)體的心理特征。例如,要考察個(gè)體的數(shù)學(xué)運(yùn)算能力,可以選擇一定數(shù)量、有代表性的運(yùn)算題進(jìn)行測量。個(gè)體對所抽選出來的問題的解決行為就叫做行為樣本behavioral sample)。通過對這個(gè)行為樣本的測量,可推測個(gè)體對所考察問題的解決行為,進(jìn)一步推斷個(gè)體解決問題能力的優(yōu)劣。

由于實(shí)際上只考察了有限的行為樣本,由此去推論總體行為,結(jié)論是否可靠,取決于所抽選出的行為樣本能否很好地代表總體行為。為此,必須獲取一組能夠提供足夠有用的信息、能恰當(dāng)反映個(gè)體行為特征的行為,即要保證行為樣本具備一定數(shù)量和具有代表性。

首先,行為樣本的數(shù)量必須足夠多,以使從樣本到總體的推測錯(cuò)誤率盡可能低。例如,從個(gè)體對一兩道運(yùn)算題的解決情況來推測個(gè)體的運(yùn)算能力,這種推測的風(fēng)險(xiǎn)是極大的,因?yàn)椴聦Φ母怕屎艽蟆R簿褪钦f,從少數(shù)一兩個(gè)行為,無法判斷被評價(jià)者是在猜測結(jié)果,還是真正具備了解決問題的能力。

其次,要保證所選樣本具有對總體樣本的代表性。例如,不能只靠檢測個(gè)位數(shù)加法題目來代替多位數(shù)加法能力的檢測,因?yàn)閭€(gè)位數(shù)加法只是多位數(shù)加法的一個(gè)特例。又比如,不能只通過測查個(gè)體的計(jì)算能力來判定其財(cái)會技能。因?yàn)榛镜挠?jì)算能力只是財(cái)會技能的一部分,不能代表所有財(cái)會行為。因此,在選擇行為樣本時(shí)一定要十分慎重,盡可能使行為樣本有較強(qiáng)的代表性。

2.標(biāo)準(zhǔn)化

標(biāo)準(zhǔn)化standardization)是指測驗(yàn)編制、實(shí)施、計(jì)分和解釋必須嚴(yán)格遵循統(tǒng)一的科學(xué)程序,保證對所有受測者來說,施測的內(nèi)容、條件、計(jì)分過程和解釋系統(tǒng)都相同。只有這樣才能保證測驗(yàn)的客觀性和準(zhǔn)確性。

要達(dá)到測驗(yàn)的標(biāo)準(zhǔn)化,應(yīng)做到:

(1)測驗(yàn)題目的標(biāo)準(zhǔn)化

對所有屬于同一群體的受測者來說,測驗(yàn)題目本身不存在差異。對同一項(xiàng)心理測驗(yàn),測驗(yàn)題目所引發(fā)的受測者心理狀態(tài)、行為反應(yīng)可以不同,但呈現(xiàn)在受測者面前的測驗(yàn)題目本身應(yīng)該是同樣的。例如,一個(gè)數(shù)理邏輯能力測驗(yàn)題可能引起不同受測者不同的推理過程,但題目本身對所有人來說是一樣的。只有保證題目標(biāo)準(zhǔn)化,即對所有受測者給定的條件一樣,我們才能通過考察不同受測者的不同反應(yīng)來判斷其內(nèi)在素質(zhì)特征。這里,真正的輸入(自)變量是受測者的內(nèi)在素質(zhì),輸出(因)變量是所觀測到的受測者的反應(yīng),即應(yīng)答行為,包括行為的過程和結(jié)果。

(2)實(shí)施過程和計(jì)分的標(biāo)準(zhǔn)化

標(biāo)準(zhǔn)化的人事測量在實(shí)施時(shí)必須保證所有受測者在相同的環(huán)境中接受施測并得到標(biāo)準(zhǔn)化的測量指導(dǎo)說明。只有這樣才能確保測驗(yàn)結(jié)果不受其他無關(guān)因素的影響。比如,如果同樣的測驗(yàn),有的人在炎熱、潮濕、昏暗的環(huán)境接受測量,有的人在舒適明亮的環(huán)境接受測量,或者有的考場主考人口齒不清、說明含糊,而有的考場主考人口齒清晰、解釋明確,由此造成的受測者的反應(yīng)差異,無法判定究竟是由于受測者本人真實(shí)素質(zhì)的差異所致,還是由考場環(huán)境的差異所致。

同理,測驗(yàn)的計(jì)分也必須有標(biāo)準(zhǔn)化的程序。要做到不同的計(jì)分者對同一受測者同一測驗(yàn)答案的計(jì)分方法和結(jié)果是相同的。人事測量中有一部分測驗(yàn)是較為依賴于評分者的主觀判斷的,如“無領(lǐng)導(dǎo)小組討論”測驗(yàn)和“公文筐測驗(yàn)”的部分內(nèi)容,這種類型的測驗(yàn)要做到計(jì)分系統(tǒng)的完全標(biāo)準(zhǔn)化相對較為困難。在這種情況下,雖然很難要求不同計(jì)分者計(jì)分結(jié)果完全一致,但通常要求有較高的相關(guān)性,一般相關(guān)系數(shù)要達(dá)到0.80甚至0.90。目前,由于專業(yè)機(jī)構(gòu)的努力,這類測驗(yàn)在計(jì)分方法和程序上已可達(dá)到相當(dāng)客觀的程度。

(3)選用有代表性的常模

常模norm)是一組具有代表性的受測者樣本的測驗(yàn)成績的分布結(jié)構(gòu),包括它的集中趨勢(通常用平均數(shù)表明)和離散度(通常用標(biāo)準(zhǔn)差表示)。常模是用以比較不同受測者測驗(yàn)分?jǐn)?shù)的標(biāo)準(zhǔn),它能夠說明某一測驗(yàn)結(jié)果分?jǐn)?shù)相對于同類受測者所處的水平。因此,心理測驗(yàn)的常模實(shí)際上起到度量衡的度量定制的作用,就如同確定如何計(jì)量長度(厘米、尺)或重量(克、兩)一樣,心理測驗(yàn)的常模可確定諸如如何表達(dá)能力的水平、工作動機(jī)的高低、職業(yè)興趣的強(qiáng)弱或某種行為傾向(如內(nèi)向和外向)的大小。

平均數(shù)mean)是常模的重要內(nèi)容之一,也是一個(gè)最常用的統(tǒng)計(jì)概念,它的數(shù)學(xué)定義是一個(gè)數(shù)據(jù)序列所有數(shù)據(jù)之和除以數(shù)據(jù)個(gè)數(shù)的商,即:

其中,M為平均數(shù);N為數(shù)據(jù)個(gè)數(shù);Xi為各數(shù)據(jù)值。例如,如果一組大學(xué)生能夠在30分鐘內(nèi)平均正確回答30道邏輯推理題的三分之二,即20道題。則這20題的分?jǐn)?shù)為一般大學(xué)生的平均值。平均分(數(shù))描述了相應(yīng)受測者群體的平均水平。

只有平均數(shù)還不夠。因?yàn)椴荒馨岩粋€(gè)受測者的原始測驗(yàn)分?jǐn)?shù)和平均數(shù)直接比較來判斷它的高低。比如,一個(gè)人在上述的邏輯推理測驗(yàn)中得了17分,比平均分差了3分,但這3分究竟意味著什么?如果所有大學(xué)生的邏輯推理測驗(yàn)得分分布在16—24分,那么,這個(gè)17分可能就相當(dāng)差,因?yàn)樗鼛缀跏窃谒腥顺煽兊淖畹投恕5绻写髮W(xué)生該項(xiàng)測驗(yàn)的分?jǐn)?shù)分布在5—30分,那么,這個(gè)17分就可能是還不錯(cuò)的成績了。所以,只有平均分還不能反應(yīng)一個(gè)測驗(yàn)分?jǐn)?shù)的真實(shí)水平。這就需要常模中的另一個(gè)概念“離散度”,兩者合在一起才能共同確定心理測驗(yàn)的度量定制。

離散度最常用的表示方法是標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)差standard deviation)的數(shù)學(xué)定義為一個(gè)數(shù)據(jù)序列各數(shù)據(jù)與平均數(shù)之差的平方和除以數(shù)據(jù)個(gè)數(shù)之商的平方根,通常記作S,即:

標(biāo)準(zhǔn)差值越大,說明數(shù)據(jù)分布越分散,離散度越大。

一般來說,測驗(yàn)的原始分?jǐn)?shù)并沒有多大的意義,而是要通過以離散度為基準(zhǔn)與平均值的比較來體現(xiàn)受測者的特點(diǎn)。在智力測驗(yàn)中,人們關(guān)心的往往是得分是高于一般水平還是低于一般水平。這就需要將測驗(yàn)的原始分?jǐn)?shù)轉(zhuǎn)換為標(biāo)準(zhǔn)分?jǐn)?shù),如將智力測驗(yàn)的原始分?jǐn)?shù)轉(zhuǎn)換為標(biāo)準(zhǔn)分?jǐn)?shù)。通常這個(gè)轉(zhuǎn)換公式設(shè)定為:

其中,IQ為標(biāo)準(zhǔn)分?jǐn)?shù);X為實(shí)得原始分;M為平均分;S為標(biāo)準(zhǔn)差。

這個(gè)公式很好地體現(xiàn)了常模的作用,其意義是,把智力分?jǐn)?shù)轉(zhuǎn)化為以100為平均分、以15為標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)(智商)分?jǐn)?shù)。舉例來說,如果一個(gè)人的實(shí)得測驗(yàn)分?jǐn)?shù)剛好等于平均分,那么代入公式,末項(xiàng)分式取值為0,最后結(jié)果剛好為100分。如果一個(gè)人的實(shí)得分?jǐn)?shù)剛好高于平均分一個(gè)標(biāo)準(zhǔn)差,那么代入公式,末項(xiàng)分式取值剛好為15,則最后得分為115分。

常模是否可靠,關(guān)鍵是有沒有一個(gè)具有代表性的受測者樣本,即建立常模的這些受測者樣本要有足夠的數(shù)量,而且是依據(jù)隨機(jī)抽樣或分層隨機(jī)抽樣原則抽選出來的。例如,如果要建立一般人的智力測驗(yàn)的常模,就不能用大學(xué)生作為智力測驗(yàn)的受測者樣本,因?yàn)樗麄兊姆謹(jǐn)?shù)往往高于一般水平,而無法代表一般人的水平。

3.難度的客觀測量

測驗(yàn)題目的難度水平影響到測驗(yàn)的客觀性。無論是測驗(yàn)題目太容易,所有人都成功地完成所有項(xiàng)目,得分都很高,還是測驗(yàn)題目太難,使得大部分人的得分很低,都會使所有受測者的反應(yīng)趨于一致,抹消了個(gè)體差異,無法就某一素質(zhì)將不同的受測者很好地區(qū)別開來,致使測驗(yàn)的目的無法達(dá)到。通常將測驗(yàn)題目過于容易,致使大部分個(gè)體得分普遍較高的現(xiàn)象,稱為天花板效應(yīng)ceiling effect);而將測驗(yàn)題目過難,致使大部分個(gè)體得分普遍較低的現(xiàn)象,稱為地板效應(yīng)floor effect)。在編制心理測驗(yàn)題目時(shí)要力求避免出現(xiàn)這兩種情況。選擇題目時(shí),通常以通過某一題目的人數(shù)的百分?jǐn)?shù)來作為難度的指標(biāo)。有關(guān)的具體方法我們將在第9章詳細(xì)介紹。

4.信度

信度credibility,也寫為reliability)是指測驗(yàn)結(jié)果的可靠性、穩(wěn)定性,即測驗(yàn)結(jié)果是否反映了受測者的穩(wěn)定的、一貫性的真實(shí)特征。這種可靠性體現(xiàn)在:

●測驗(yàn)結(jié)果跨時(shí)間的一致性——受測者在不同時(shí)間所測結(jié)果一致;

●測驗(yàn)內(nèi)容的一致性——同一測驗(yàn)內(nèi)的各部分題目所測的是同一種行為或行為特征;

●不同評分者之間的一致性——不同評分者對同一測驗(yàn)結(jié)果的評分一致。

一項(xiàng)成熟的心理測驗(yàn)應(yīng)具有比較理想的信度。信度較低的測驗(yàn)其測驗(yàn)分?jǐn)?shù)的穩(wěn)定性較差,往往不能反映受測者的真實(shí)水平。有關(guān)信度的具體內(nèi)容我們將在第7章詳細(xì)介紹。

5.效度

效度validity)是指所測量到的結(jié)果反映了所想要考察內(nèi)容的程度。測量結(jié)果與要考察的內(nèi)容越吻合,則效度越高;反之,則效度越低。例如,在一項(xiàng)考察管理人員邏輯推理能力的測驗(yàn)中,如果題目的文字表述過于晦澀,行文不暢,又過多使用許多生僻詞匯,可能決定測驗(yàn)分?jǐn)?shù)高低的就主要是受測者的語文理解水平,而不是邏輯推理能力。這樣的測驗(yàn)就沒有測量到其本應(yīng)該測的素質(zhì)特征,其結(jié)果無法用于評價(jià)受測者相應(yīng)的能力,其效度很低。

效度指標(biāo)主要包括效標(biāo)關(guān)聯(lián)效度、內(nèi)容效度和構(gòu)想效度等。具體內(nèi)容將在第8章詳細(xì)介紹。

主站蜘蛛池模板: 泰宁县| 奉贤区| 龙门县| 繁峙县| 兴城市| 大关县| 昌都县| 措勤县| 四川省| 巴东县| 马山县| 平顶山市| 韩城市| 宿州市| 陵川县| 钦州市| 东乡族自治县| 白水县| 罗甸县| 奇台县| 张家港市| 肇庆市| 金湖县| 会泽县| 远安县| 凤翔县| 都江堰市| 麻阳| 尤溪县| 宁陕县| 通化县| 广汉市| 斗六市| 唐海县| 三台县| 环江| 土默特右旗| 普兰县| 林芝县| 迭部县| 台北县|