现代佛龛装修设计图片

書名：實(shí)用心理與人事測量
作者名：王壘
本章字?jǐn)?shù)： 4208字
更新時(shí)間： 2019-12-20 17:13:57

1 心理測量概論

1.1 什么是心理測量

心理測量、心理測驗(yàn)與人事測量

心理測量（psychological measurement）是通過科學(xué)、客觀、標(biāo)準(zhǔn)的測量手段對人的特定素質(zhì)進(jìn)行測量、分析和評價(jià)。研究心理測量的學(xué)科叫做心理測量學(xué)（psychometrics）。這里的所謂素質(zhì)，是指那些完成特定工作或活動所需要或與之相關(guān)的感知、技能、能力、氣質(zhì)、性格、興趣和動機(jī)等個(gè)人特征，它們是以一定的質(zhì)量和速度完成工作或活動的基礎(chǔ)。

人事測量（personnel assessment）是心理測量技術(shù)在人事管理領(lǐng)域的應(yīng)用，它以心理測量為基礎(chǔ)，針對特定的人事管理目的如招聘、安置、考核、晉升、培訓(xùn)、獎懲等，對人的素質(zhì)進(jìn)行多方面的系統(tǒng)評價(jià)，從而為人事管理、開發(fā)提供參考依據(jù)。因此，相對來說，人事測量是一個(gè)更廣泛的實(shí)用概念，它通常要求運(yùn)用多種心理測量工具來完成。

心理測驗(yàn)（psychological test）是心理測量的一種具體方法和手段，它是結(jié)合行為科學(xué)和統(tǒng)計(jì)學(xué)以評價(jià)特定個(gè)體在特定素質(zhì)上相對于特定群體所處的水平的手段。心理測驗(yàn)是人事測量中最常采用的方法之一。除測驗(yàn)法之外，人事測量還經(jīng)常采用觀察法、訪談法、調(diào)查法等。以上幾個(gè)概念之間的關(guān)系可由圖1.1來表示：

圖1.1 心理測量、心理測驗(yàn)與人事測量的關(guān)系

就具體方法而言，心理測量是通過對特定個(gè)體的有限的具有代表性的行為進(jìn)行觀察，依據(jù)事先確定的原則，對貫穿在行為活動中的心理特征進(jìn)行推論和數(shù)量化分析。也就是說，由外部行為推及內(nèi)在特征。個(gè)體的心理活動和心理特征是很難用直接測量的手段來度量的，往往要通過對心理特征的外顯結(jié)果——行為進(jìn)行測量，才能推知個(gè)體內(nèi)部的心理活動狀態(tài)和心理特征。因此，心理測量的對象實(shí)際上是行為樣本，而不是心理狀態(tài)。這種由行為表現(xiàn)到心理狀態(tài)的推論并不是主觀隨意的，它必須在成熟的心理測量學(xué)理論的基礎(chǔ)上，采用客觀、科學(xué)的方法進(jìn)行推斷。

心理測驗(yàn)的五個(gè)基本要素

心理測驗(yàn)是人事測量的重要手段，心理測驗(yàn)是對行為樣本的客觀的和標(biāo)準(zhǔn)化的測量。它包含以下五個(gè)基本要素：

1．行為樣本

人們在對一類事物的某種特性進(jìn)行考察時(shí)往往無法對這類事物的每一特定情況進(jìn)行逐個(gè)觀測，而總是抽取這類事物中有典型代表性的一部分進(jìn)行觀測，進(jìn)而推論該類事物的普遍特性。

對個(gè)體行為或行為特征的測查同樣無法做到面面俱到。在進(jìn)行心理測量時(shí)，往往只能對經(jīng)過科學(xué)選擇的少數(shù)行為樣本進(jìn)行測查，借以推測個(gè)體的心理特征。例如，要考察個(gè)體的數(shù)學(xué)運(yùn)算能力，可以選擇一定數(shù)量、有代表性的運(yùn)算題進(jìn)行測量。個(gè)體對所抽選出來的問題的解決行為就叫做行為樣本（behavioral sample）。通過對這個(gè)行為樣本的測量，可推測個(gè)體對所考察問題的解決行為，進(jìn)一步推斷個(gè)體解決問題能力的優(yōu)劣。

由于實(shí)際上只考察了有限的行為樣本，由此去推論總體行為，結(jié)論是否可靠，取決于所抽選出的行為樣本能否很好地代表總體行為。為此，必須獲取一組能夠提供足夠有用的信息、能恰當(dāng)反映個(gè)體行為特征的行為，即要保證行為樣本具備一定數(shù)量和具有代表性。

首先，行為樣本的數(shù)量必須足夠多，以使從樣本到總體的推測錯(cuò)誤率盡可能低。例如，從個(gè)體對一兩道運(yùn)算題的解決情況來推測個(gè)體的運(yùn)算能力，這種推測的風(fēng)險(xiǎn)是極大的，因?yàn)椴聦Φ母怕屎艽蟆Ｒ簿褪钦f，從少數(shù)一兩個(gè)行為，無法判斷被評價(jià)者是在猜測結(jié)果，還是真正具備了解決問題的能力。

其次，要保證所選樣本具有對總體樣本的代表性。例如，不能只靠檢測個(gè)位數(shù)加法題目來代替多位數(shù)加法能力的檢測，因?yàn)閭€(gè)位數(shù)加法只是多位數(shù)加法的一個(gè)特例。又比如，不能只通過測查個(gè)體的計(jì)算能力來判定其財(cái)會技能。因?yàn)榛镜挠?jì)算能力只是財(cái)會技能的一部分，不能代表所有財(cái)會行為。因此，在選擇行為樣本時(shí)一定要十分慎重，盡可能使行為樣本有較強(qiáng)的代表性。

2．標(biāo)準(zhǔn)化

標(biāo)準(zhǔn)化（standardization）是指測驗(yàn)編制、實(shí)施、計(jì)分和解釋必須嚴(yán)格遵循統(tǒng)一的科學(xué)程序，保證對所有受測者來說，施測的內(nèi)容、條件、計(jì)分過程和解釋系統(tǒng)都相同。只有這樣才能保證測驗(yàn)的客觀性和準(zhǔn)確性。

要達(dá)到測驗(yàn)的標(biāo)準(zhǔn)化，應(yīng)做到：

（1）測驗(yàn)題目的標(biāo)準(zhǔn)化

對所有屬于同一群體的受測者來說，測驗(yàn)題目本身不存在差異。對同一項(xiàng)心理測驗(yàn)，測驗(yàn)題目所引發(fā)的受測者心理狀態(tài)、行為反應(yīng)可以不同，但呈現(xiàn)在受測者面前的測驗(yàn)題目本身應(yīng)該是同樣的。例如，一個(gè)數(shù)理邏輯能力測驗(yàn)題可能引起不同受測者不同的推理過程，但題目本身對所有人來說是一樣的。只有保證題目標(biāo)準(zhǔn)化，即對所有受測者給定的條件一樣，我們才能通過考察不同受測者的不同反應(yīng)來判斷其內(nèi)在素質(zhì)特征。這里，真正的輸入（自）變量是受測者的內(nèi)在素質(zhì)，輸出（因）變量是所觀測到的受測者的反應(yīng)，即應(yīng)答行為，包括行為的過程和結(jié)果。

（2）實(shí)施過程和計(jì)分的標(biāo)準(zhǔn)化

標(biāo)準(zhǔn)化的人事測量在實(shí)施時(shí)必須保證所有受測者在相同的環(huán)境中接受施測并得到標(biāo)準(zhǔn)化的測量指導(dǎo)說明。只有這樣才能確保測驗(yàn)結(jié)果不受其他無關(guān)因素的影響。比如，如果同樣的測驗(yàn)，有的人在炎熱、潮濕、昏暗的環(huán)境接受測量，有的人在舒適明亮的環(huán)境接受測量，或者有的考場主考人口齒不清、說明含糊，而有的考場主考人口齒清晰、解釋明確，由此造成的受測者的反應(yīng)差異，無法判定究竟是由于受測者本人真實(shí)素質(zhì)的差異所致，還是由考場環(huán)境的差異所致。

同理，測驗(yàn)的計(jì)分也必須有標(biāo)準(zhǔn)化的程序。要做到不同的計(jì)分者對同一受測者同一測驗(yàn)答案的計(jì)分方法和結(jié)果是相同的。人事測量中有一部分測驗(yàn)是較為依賴于評分者的主觀判斷的，如“無領(lǐng)導(dǎo)小組討論”測驗(yàn)和“公文筐測驗(yàn)”的部分內(nèi)容，這種類型的測驗(yàn)要做到計(jì)分系統(tǒng)的完全標(biāo)準(zhǔn)化相對較為困難。在這種情況下，雖然很難要求不同計(jì)分者計(jì)分結(jié)果完全一致，但通常要求有較高的相關(guān)性，一般相關(guān)系數(shù)要達(dá)到0.80甚至0.90。目前，由于專業(yè)機(jī)構(gòu)的努力，這類測驗(yàn)在計(jì)分方法和程序上已可達(dá)到相當(dāng)客觀的程度。

（3）選用有代表性的常模

常模（norm）是一組具有代表性的受測者樣本的測驗(yàn)成績的分布結(jié)構(gòu)，包括它的集中趨勢（通常用平均數(shù)表明）和離散度（通常用標(biāo)準(zhǔn)差表示）。常模是用以比較不同受測者測驗(yàn)分?jǐn)?shù)的標(biāo)準(zhǔn)，它能夠說明某一測驗(yàn)結(jié)果分?jǐn)?shù)相對于同類受測者所處的水平。因此，心理測驗(yàn)的常模實(shí)際上起到度量衡的度量定制的作用，就如同確定如何計(jì)量長度（厘米、尺）或重量（克、兩）一樣，心理測驗(yàn)的常模可確定諸如如何表達(dá)能力的水平、工作動機(jī)的高低、職業(yè)興趣的強(qiáng)弱或某種行為傾向（如內(nèi)向和外向）的大小。

平均數(shù)（mean）是常模的重要內(nèi)容之一，也是一個(gè)最常用的統(tǒng)計(jì)概念，它的數(shù)學(xué)定義是一個(gè)數(shù)據(jù)序列所有數(shù)據(jù)之和除以數(shù)據(jù)個(gè)數(shù)的商，即：

其中，M為平均數(shù)；N為數(shù)據(jù)個(gè)數(shù)；Xi為各數(shù)據(jù)值。例如，如果一組大學(xué)生能夠在30分鐘內(nèi)平均正確回答30道邏輯推理題的三分之二，即20道題。則這20題的分?jǐn)?shù)為一般大學(xué)生的平均值。平均分（數(shù)）描述了相應(yīng)受測者群體的平均水平。

只有平均數(shù)還不夠。因?yàn)椴荒馨岩粋€(gè)受測者的原始測驗(yàn)分?jǐn)?shù)和平均數(shù)直接比較來判斷它的高低。比如，一個(gè)人在上述的邏輯推理測驗(yàn)中得了17分，比平均分差了3分，但這3分究竟意味著什么？如果所有大學(xué)生的邏輯推理測驗(yàn)得分分布在16—24分，那么，這個(gè)17分可能就相當(dāng)差，因?yàn)樗鼛缀跏窃谒腥顺煽兊淖畹投恕５绻写髮W(xué)生該項(xiàng)測驗(yàn)的分?jǐn)?shù)分布在5—30分，那么，這個(gè)17分就可能是還不錯(cuò)的成績了。所以，只有平均分還不能反應(yīng)一個(gè)測驗(yàn)分?jǐn)?shù)的真實(shí)水平。這就需要常模中的另一個(gè)概念“離散度”，兩者合在一起才能共同確定心理測驗(yàn)的度量定制。

離散度最常用的表示方法是標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)差（standard deviation）的數(shù)學(xué)定義為一個(gè)數(shù)據(jù)序列各數(shù)據(jù)與平均數(shù)之差的平方和除以數(shù)據(jù)個(gè)數(shù)之商的平方根，通常記作S，即：

標(biāo)準(zhǔn)差值越大，說明數(shù)據(jù)分布越分散，離散度越大。

一般來說，測驗(yàn)的原始分?jǐn)?shù)并沒有多大的意義，而是要通過以離散度為基準(zhǔn)與平均值的比較來體現(xiàn)受測者的特點(diǎn)。在智力測驗(yàn)中，人們關(guān)心的往往是得分是高于一般水平還是低于一般水平。這就需要將測驗(yàn)的原始分?jǐn)?shù)轉(zhuǎn)換為標(biāo)準(zhǔn)分?jǐn)?shù)，如將智力測驗(yàn)的原始分?jǐn)?shù)轉(zhuǎn)換為標(biāo)準(zhǔn)分?jǐn)?shù)。通常這個(gè)轉(zhuǎn)換公式設(shè)定為：

其中，IQ為標(biāo)準(zhǔn)分?jǐn)?shù)；X為實(shí)得原始分；M為平均分；S為標(biāo)準(zhǔn)差。

這個(gè)公式很好地體現(xiàn)了常模的作用，其意義是，把智力分?jǐn)?shù)轉(zhuǎn)化為以100為平均分、以15為標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)（智商）分?jǐn)?shù)。舉例來說，如果一個(gè)人的實(shí)得測驗(yàn)分?jǐn)?shù)剛好等于平均分，那么代入公式，末項(xiàng)分式取值為0，最后結(jié)果剛好為100分。如果一個(gè)人的實(shí)得分?jǐn)?shù)剛好高于平均分一個(gè)標(biāo)準(zhǔn)差，那么代入公式，末項(xiàng)分式取值剛好為15，則最后得分為115分。

常模是否可靠，關(guān)鍵是有沒有一個(gè)具有代表性的受測者樣本，即建立常模的這些受測者樣本要有足夠的數(shù)量，而且是依據(jù)隨機(jī)抽樣或分層隨機(jī)抽樣原則抽選出來的。例如，如果要建立一般人的智力測驗(yàn)的常模，就不能用大學(xué)生作為智力測驗(yàn)的受測者樣本，因?yàn)樗麄兊姆謹(jǐn)?shù)往往高于一般水平，而無法代表一般人的水平。

3．難度的客觀測量

測驗(yàn)題目的難度水平影響到測驗(yàn)的客觀性。無論是測驗(yàn)題目太容易，所有人都成功地完成所有項(xiàng)目，得分都很高，還是測驗(yàn)題目太難，使得大部分人的得分很低，都會使所有受測者的反應(yīng)趨于一致，抹消了個(gè)體差異，無法就某一素質(zhì)將不同的受測者很好地區(qū)別開來，致使測驗(yàn)的目的無法達(dá)到。通常將測驗(yàn)題目過于容易，致使大部分個(gè)體得分普遍較高的現(xiàn)象，稱為天花板效應(yīng)（ceiling effect）；而將測驗(yàn)題目過難，致使大部分個(gè)體得分普遍較低的現(xiàn)象，稱為地板效應(yīng)（floor effect）。在編制心理測驗(yàn)題目時(shí)要力求避免出現(xiàn)這兩種情況。選擇題目時(shí)，通常以通過某一題目的人數(shù)的百分?jǐn)?shù)來作為難度的指標(biāo)。有關(guān)的具體方法我們將在第9章詳細(xì)介紹。

4．信度

信度（credibility，也寫為reliability）是指測驗(yàn)結(jié)果的可靠性、穩(wěn)定性，即測驗(yàn)結(jié)果是否反映了受測者的穩(wěn)定的、一貫性的真實(shí)特征。這種可靠性體現(xiàn)在：

●測驗(yàn)結(jié)果跨時(shí)間的一致性——受測者在不同時(shí)間所測結(jié)果一致；

●測驗(yàn)內(nèi)容的一致性——同一測驗(yàn)內(nèi)的各部分題目所測的是同一種行為或行為特征；

●不同評分者之間的一致性——不同評分者對同一測驗(yàn)結(jié)果的評分一致。

一項(xiàng)成熟的心理測驗(yàn)應(yīng)具有比較理想的信度。信度較低的測驗(yàn)其測驗(yàn)分?jǐn)?shù)的穩(wěn)定性較差，往往不能反映受測者的真實(shí)水平。有關(guān)信度的具體內(nèi)容我們將在第7章詳細(xì)介紹。

5．效度

效度（validity）是指所測量到的結(jié)果反映了所想要考察內(nèi)容的程度。測量結(jié)果與要考察的內(nèi)容越吻合，則效度越高；反之，則效度越低。例如，在一項(xiàng)考察管理人員邏輯推理能力的測驗(yàn)中，如果題目的文字表述過于晦澀，行文不暢，又過多使用許多生僻詞匯，可能決定測驗(yàn)分?jǐn)?shù)高低的就主要是受測者的語文理解水平，而不是邏輯推理能力。這樣的測驗(yàn)就沒有測量到其本應(yīng)該測的素質(zhì)特征，其結(jié)果無法用于評價(jià)受測者相應(yīng)的能力，其效度很低。

效度指標(biāo)主要包括效標(biāo)關(guān)聯(lián)效度、內(nèi)容效度和構(gòu)想效度等。具體內(nèi)容將在第8章詳細(xì)介紹。

官术网_书友最值得收藏!

實(shí)用心理與人事測量

1 心理測量概論

1.1 什么是心理測量

心理測量、心理測驗(yàn)與人事測量

心理測驗(yàn)的五個(gè)基本要素