官术网_书友最值得收藏!

1 心理測(cè)量概論

1.1 什么是心理測(cè)量

心理測(cè)量、心理測(cè)驗(yàn)與人事測(cè)量

心理測(cè)量(psychological measurement)是通過科學(xué)、客觀、標(biāo)準(zhǔn)的測(cè)量手段對(duì)人的特定素質(zhì)進(jìn)行測(cè)量、分析和評(píng)價(jià)。研究心理測(cè)量的學(xué)科叫做心理測(cè)量學(xué)(psychometrics)。這里的所謂素質(zhì),是指那些完成特定工作或活動(dòng)所需要或與之相關(guān)的感知、技能、能力、氣質(zhì)、性格、興趣和動(dòng)機(jī)等個(gè)人特征,它們是以一定的質(zhì)量和速度完成工作或活動(dòng)的基礎(chǔ)。

人事測(cè)量(personnel assessment)是心理測(cè)量技術(shù)在人事管理領(lǐng)域的應(yīng)用,它以心理測(cè)量為基礎(chǔ),針對(duì)特定的人事管理目的如招聘、安置、考核、晉升、培訓(xùn)、獎(jiǎng)懲等,對(duì)人的素質(zhì)進(jìn)行多方面的系統(tǒng)評(píng)價(jià),從而為人事管理、開發(fā)提供參考依據(jù)。因此,相對(duì)來說,人事測(cè)量是一個(gè)更廣泛的實(shí)用概念,它通常要求運(yùn)用多種心理測(cè)量工具來完成。

心理測(cè)驗(yàn)(psychological test)是心理測(cè)量的一種具體方法和手段,它是結(jié)合行為科學(xué)和統(tǒng)計(jì)學(xué)以評(píng)價(jià)特定個(gè)體在特定素質(zhì)上相對(duì)于特定群體所處的水平的手段。心理測(cè)驗(yàn)是人事測(cè)量中最常采用的方法之一。除測(cè)驗(yàn)法之外,人事測(cè)量還經(jīng)常采用觀察法、訪談法、調(diào)查法等。以上幾個(gè)概念之間的關(guān)系可由圖1.1來表示:

圖1.1 心理測(cè)量、心理測(cè)驗(yàn)與人事測(cè)量的關(guān)系

就具體方法而言,心理測(cè)量是通過對(duì)特定個(gè)體的有限的具有代表性的行為進(jìn)行觀察,依據(jù)事先確定的原則,對(duì)貫穿在行為活動(dòng)中的心理特征進(jìn)行推論和數(shù)量化分析。也就是說,由外部行為推及內(nèi)在特征。個(gè)體的心理活動(dòng)和心理特征是很難用直接測(cè)量的手段來度量的,往往要通過對(duì)心理特征的外顯結(jié)果——行為進(jìn)行測(cè)量,才能推知個(gè)體內(nèi)部的心理活動(dòng)狀態(tài)和心理特征。因此,心理測(cè)量的對(duì)象實(shí)際上是行為樣本,而不是心理狀態(tài)。這種由行為表現(xiàn)到心理狀態(tài)的推論并不是主觀隨意的,它必須在成熟的心理測(cè)量學(xué)理論的基礎(chǔ)上,采用客觀、科學(xué)的方法進(jìn)行推斷。

心理測(cè)驗(yàn)的五個(gè)基本要素

心理測(cè)驗(yàn)是人事測(cè)量的重要手段,心理測(cè)驗(yàn)是對(duì)行為樣本的客觀的和標(biāo)準(zhǔn)化的測(cè)量。它包含以下五個(gè)基本要素:

1.行為樣本

人們?cè)趯?duì)一類事物的某種特性進(jìn)行考察時(shí)往往無法對(duì)這類事物的每一特定情況進(jìn)行逐個(gè)觀測(cè),而總是抽取這類事物中有典型代表性的一部分進(jìn)行觀測(cè),進(jìn)而推論該類事物的普遍特性。

對(duì)個(gè)體行為或行為特征的測(cè)查同樣無法做到面面俱到。在進(jìn)行心理測(cè)量時(shí),往往只能對(duì)經(jīng)過科學(xué)選擇的少數(shù)行為樣本進(jìn)行測(cè)查,借以推測(cè)個(gè)體的心理特征。例如,要考察個(gè)體的數(shù)學(xué)運(yùn)算能力,可以選擇一定數(shù)量、有代表性的運(yùn)算題進(jìn)行測(cè)量。個(gè)體對(duì)所抽選出來的問題的解決行為就叫做行為樣本behavioral sample)。通過對(duì)這個(gè)行為樣本的測(cè)量,可推測(cè)個(gè)體對(duì)所考察問題的解決行為,進(jìn)一步推斷個(gè)體解決問題能力的優(yōu)劣。

由于實(shí)際上只考察了有限的行為樣本,由此去推論總體行為,結(jié)論是否可靠,取決于所抽選出的行為樣本能否很好地代表總體行為。為此,必須獲取一組能夠提供足夠有用的信息、能恰當(dāng)反映個(gè)體行為特征的行為,即要保證行為樣本具備一定數(shù)量和具有代表性。

首先,行為樣本的數(shù)量必須足夠多,以使從樣本到總體的推測(cè)錯(cuò)誤率盡可能低。例如,從個(gè)體對(duì)一兩道運(yùn)算題的解決情況來推測(cè)個(gè)體的運(yùn)算能力,這種推測(cè)的風(fēng)險(xiǎn)是極大的,因?yàn)椴聦?duì)的概率很大。也就是說,從少數(shù)一兩個(gè)行為,無法判斷被評(píng)價(jià)者是在猜測(cè)結(jié)果,還是真正具備了解決問題的能力。

其次,要保證所選樣本具有對(duì)總體樣本的代表性。例如,不能只靠檢測(cè)個(gè)位數(shù)加法題目來代替多位數(shù)加法能力的檢測(cè),因?yàn)閭€(gè)位數(shù)加法只是多位數(shù)加法的一個(gè)特例。又比如,不能只通過測(cè)查個(gè)體的計(jì)算能力來判定其財(cái)會(huì)技能。因?yàn)榛镜挠?jì)算能力只是財(cái)會(huì)技能的一部分,不能代表所有財(cái)會(huì)行為。因此,在選擇行為樣本時(shí)一定要十分慎重,盡可能使行為樣本有較強(qiáng)的代表性。

2.標(biāo)準(zhǔn)化

標(biāo)準(zhǔn)化standardization)是指測(cè)驗(yàn)編制、實(shí)施、計(jì)分和解釋必須嚴(yán)格遵循統(tǒng)一的科學(xué)程序,保證對(duì)所有受測(cè)者來說,施測(cè)的內(nèi)容、條件、計(jì)分過程和解釋系統(tǒng)都相同。只有這樣才能保證測(cè)驗(yàn)的客觀性和準(zhǔn)確性。

要達(dá)到測(cè)驗(yàn)的標(biāo)準(zhǔn)化,應(yīng)做到:

(1)測(cè)驗(yàn)題目的標(biāo)準(zhǔn)化

對(duì)所有屬于同一群體的受測(cè)者來說,測(cè)驗(yàn)題目本身不存在差異。對(duì)同一項(xiàng)心理測(cè)驗(yàn),測(cè)驗(yàn)題目所引發(fā)的受測(cè)者心理狀態(tài)、行為反應(yīng)可以不同,但呈現(xiàn)在受測(cè)者面前的測(cè)驗(yàn)題目本身應(yīng)該是同樣的。例如,一個(gè)數(shù)理邏輯能力測(cè)驗(yàn)題可能引起不同受測(cè)者不同的推理過程,但題目本身對(duì)所有人來說是一樣的。只有保證題目標(biāo)準(zhǔn)化,即對(duì)所有受測(cè)者給定的條件一樣,我們才能通過考察不同受測(cè)者的不同反應(yīng)來判斷其內(nèi)在素質(zhì)特征。這里,真正的輸入(自)變量是受測(cè)者的內(nèi)在素質(zhì),輸出(因)變量是所觀測(cè)到的受測(cè)者的反應(yīng),即應(yīng)答行為,包括行為的過程和結(jié)果。

(2)實(shí)施過程和計(jì)分的標(biāo)準(zhǔn)化

標(biāo)準(zhǔn)化的人事測(cè)量在實(shí)施時(shí)必須保證所有受測(cè)者在相同的環(huán)境中接受施測(cè)并得到標(biāo)準(zhǔn)化的測(cè)量指導(dǎo)說明。只有這樣才能確保測(cè)驗(yàn)結(jié)果不受其他無關(guān)因素的影響。比如,如果同樣的測(cè)驗(yàn),有的人在炎熱、潮濕、昏暗的環(huán)境接受測(cè)量,有的人在舒適明亮的環(huán)境接受測(cè)量,或者有的考場(chǎng)主考人口齒不清、說明含糊,而有的考場(chǎng)主考人口齒清晰、解釋明確,由此造成的受測(cè)者的反應(yīng)差異,無法判定究竟是由于受測(cè)者本人真實(shí)素質(zhì)的差異所致,還是由考場(chǎng)環(huán)境的差異所致。

同理,測(cè)驗(yàn)的計(jì)分也必須有標(biāo)準(zhǔn)化的程序。要做到不同的計(jì)分者對(duì)同一受測(cè)者同一測(cè)驗(yàn)答案的計(jì)分方法和結(jié)果是相同的。人事測(cè)量中有一部分測(cè)驗(yàn)是較為依賴于評(píng)分者的主觀判斷的,如“無領(lǐng)導(dǎo)小組討論”測(cè)驗(yàn)和“公文筐測(cè)驗(yàn)”的部分內(nèi)容,這種類型的測(cè)驗(yàn)要做到計(jì)分系統(tǒng)的完全標(biāo)準(zhǔn)化相對(duì)較為困難。在這種情況下,雖然很難要求不同計(jì)分者計(jì)分結(jié)果完全一致,但通常要求有較高的相關(guān)性,一般相關(guān)系數(shù)要達(dá)到0.80甚至0.90。目前,由于專業(yè)機(jī)構(gòu)的努力,這類測(cè)驗(yàn)在計(jì)分方法和程序上已可達(dá)到相當(dāng)客觀的程度。

(3)選用有代表性的常模

常模norm)是一組具有代表性的受測(cè)者樣本的測(cè)驗(yàn)成績(jī)的分布結(jié)構(gòu),包括它的集中趨勢(shì)(通常用平均數(shù)表明)和離散度(通常用標(biāo)準(zhǔn)差表示)。常模是用以比較不同受測(cè)者測(cè)驗(yàn)分?jǐn)?shù)的標(biāo)準(zhǔn),它能夠說明某一測(cè)驗(yàn)結(jié)果分?jǐn)?shù)相對(duì)于同類受測(cè)者所處的水平。因此,心理測(cè)驗(yàn)的常模實(shí)際上起到度量衡的度量定制的作用,就如同確定如何計(jì)量長度(厘米、尺)或重量(克、兩)一樣,心理測(cè)驗(yàn)的常模可確定諸如如何表達(dá)能力的水平、工作動(dòng)機(jī)的高低、職業(yè)興趣的強(qiáng)弱或某種行為傾向(如內(nèi)向和外向)的大小。

平均數(shù)mean)是常模的重要內(nèi)容之一,也是一個(gè)最常用的統(tǒng)計(jì)概念,它的數(shù)學(xué)定義是一個(gè)數(shù)據(jù)序列所有數(shù)據(jù)之和除以數(shù)據(jù)個(gè)數(shù)的商,即:

其中,M為平均數(shù);N為數(shù)據(jù)個(gè)數(shù);Xi為各數(shù)據(jù)值。例如,如果一組大學(xué)生能夠在30分鐘內(nèi)平均正確回答30道邏輯推理題的三分之二,即20道題。則這20題的分?jǐn)?shù)為一般大學(xué)生的平均值。平均分(數(shù))描述了相應(yīng)受測(cè)者群體的平均水平。

只有平均數(shù)還不夠。因?yàn)椴荒馨岩粋€(gè)受測(cè)者的原始測(cè)驗(yàn)分?jǐn)?shù)和平均數(shù)直接比較來判斷它的高低。比如,一個(gè)人在上述的邏輯推理測(cè)驗(yàn)中得了17分,比平均分差了3分,但這3分究竟意味著什么?如果所有大學(xué)生的邏輯推理測(cè)驗(yàn)得分分布在16—24分,那么,這個(gè)17分可能就相當(dāng)差,因?yàn)樗鼛缀跏窃谒腥顺煽?jī)的最低端。但如果所有大學(xué)生該項(xiàng)測(cè)驗(yàn)的分?jǐn)?shù)分布在5—30分,那么,這個(gè)17分就可能是還不錯(cuò)的成績(jī)了。所以,只有平均分還不能反應(yīng)一個(gè)測(cè)驗(yàn)分?jǐn)?shù)的真實(shí)水平。這就需要常模中的另一個(gè)概念“離散度”,兩者合在一起才能共同確定心理測(cè)驗(yàn)的度量定制。

離散度最常用的表示方法是標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)差standard deviation)的數(shù)學(xué)定義為一個(gè)數(shù)據(jù)序列各數(shù)據(jù)與平均數(shù)之差的平方和除以數(shù)據(jù)個(gè)數(shù)之商的平方根,通常記作S,即:

標(biāo)準(zhǔn)差值越大,說明數(shù)據(jù)分布越分散,離散度越大。

一般來說,測(cè)驗(yàn)的原始分?jǐn)?shù)并沒有多大的意義,而是要通過以離散度為基準(zhǔn)與平均值的比較來體現(xiàn)受測(cè)者的特點(diǎn)。在智力測(cè)驗(yàn)中,人們關(guān)心的往往是得分是高于一般水平還是低于一般水平。這就需要將測(cè)驗(yàn)的原始分?jǐn)?shù)轉(zhuǎn)換為標(biāo)準(zhǔn)分?jǐn)?shù),如將智力測(cè)驗(yàn)的原始分?jǐn)?shù)轉(zhuǎn)換為標(biāo)準(zhǔn)分?jǐn)?shù)。通常這個(gè)轉(zhuǎn)換公式設(shè)定為:

其中,IQ為標(biāo)準(zhǔn)分?jǐn)?shù);X為實(shí)得原始分;M為平均分;S為標(biāo)準(zhǔn)差。

這個(gè)公式很好地體現(xiàn)了常模的作用,其意義是,把智力分?jǐn)?shù)轉(zhuǎn)化為以100為平均分、以15為標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)(智商)分?jǐn)?shù)。舉例來說,如果一個(gè)人的實(shí)得測(cè)驗(yàn)分?jǐn)?shù)剛好等于平均分,那么代入公式,末項(xiàng)分式取值為0,最后結(jié)果剛好為100分。如果一個(gè)人的實(shí)得分?jǐn)?shù)剛好高于平均分一個(gè)標(biāo)準(zhǔn)差,那么代入公式,末項(xiàng)分式取值剛好為15,則最后得分為115分。

常模是否可靠,關(guān)鍵是有沒有一個(gè)具有代表性的受測(cè)者樣本,即建立常模的這些受測(cè)者樣本要有足夠的數(shù)量,而且是依據(jù)隨機(jī)抽樣或分層隨機(jī)抽樣原則抽選出來的。例如,如果要建立一般人的智力測(cè)驗(yàn)的常模,就不能用大學(xué)生作為智力測(cè)驗(yàn)的受測(cè)者樣本,因?yàn)樗麄兊姆謹(jǐn)?shù)往往高于一般水平,而無法代表一般人的水平。

3.難度的客觀測(cè)量

測(cè)驗(yàn)題目的難度水平影響到測(cè)驗(yàn)的客觀性。無論是測(cè)驗(yàn)題目太容易,所有人都成功地完成所有項(xiàng)目,得分都很高,還是測(cè)驗(yàn)題目太難,使得大部分人的得分很低,都會(huì)使所有受測(cè)者的反應(yīng)趨于一致,抹消了個(gè)體差異,無法就某一素質(zhì)將不同的受測(cè)者很好地區(qū)別開來,致使測(cè)驗(yàn)的目的無法達(dá)到。通常將測(cè)驗(yàn)題目過于容易,致使大部分個(gè)體得分普遍較高的現(xiàn)象,稱為天花板效應(yīng)ceiling effect);而將測(cè)驗(yàn)題目過難,致使大部分個(gè)體得分普遍較低的現(xiàn)象,稱為地板效應(yīng)floor effect)。在編制心理測(cè)驗(yàn)題目時(shí)要力求避免出現(xiàn)這兩種情況。選擇題目時(shí),通常以通過某一題目的人數(shù)的百分?jǐn)?shù)來作為難度的指標(biāo)。有關(guān)的具體方法我們將在第9章詳細(xì)介紹。

4.信度

信度credibility,也寫為reliability)是指測(cè)驗(yàn)結(jié)果的可靠性、穩(wěn)定性,即測(cè)驗(yàn)結(jié)果是否反映了受測(cè)者的穩(wěn)定的、一貫性的真實(shí)特征。這種可靠性體現(xiàn)在:

●測(cè)驗(yàn)結(jié)果跨時(shí)間的一致性——受測(cè)者在不同時(shí)間所測(cè)結(jié)果一致;

●測(cè)驗(yàn)內(nèi)容的一致性——同一測(cè)驗(yàn)內(nèi)的各部分題目所測(cè)的是同一種行為或行為特征;

●不同評(píng)分者之間的一致性——不同評(píng)分者對(duì)同一測(cè)驗(yàn)結(jié)果的評(píng)分一致。

一項(xiàng)成熟的心理測(cè)驗(yàn)應(yīng)具有比較理想的信度。信度較低的測(cè)驗(yàn)其測(cè)驗(yàn)分?jǐn)?shù)的穩(wěn)定性較差,往往不能反映受測(cè)者的真實(shí)水平。有關(guān)信度的具體內(nèi)容我們將在第7章詳細(xì)介紹。

5.效度

效度validity)是指所測(cè)量到的結(jié)果反映了所想要考察內(nèi)容的程度。測(cè)量結(jié)果與要考察的內(nèi)容越吻合,則效度越高;反之,則效度越低。例如,在一項(xiàng)考察管理人員邏輯推理能力的測(cè)驗(yàn)中,如果題目的文字表述過于晦澀,行文不暢,又過多使用許多生僻詞匯,可能決定測(cè)驗(yàn)分?jǐn)?shù)高低的就主要是受測(cè)者的語文理解水平,而不是邏輯推理能力。這樣的測(cè)驗(yàn)就沒有測(cè)量到其本應(yīng)該測(cè)的素質(zhì)特征,其結(jié)果無法用于評(píng)價(jià)受測(cè)者相應(yīng)的能力,其效度很低。

效度指標(biāo)主要包括效標(biāo)關(guān)聯(lián)效度、內(nèi)容效度和構(gòu)想效度等。具體內(nèi)容將在第8章詳細(xì)介紹。

主站蜘蛛池模板: 高邮市| 平泉县| 海口市| 乌兰县| 同心县| 霍山县| 临江市| 河北区| 怀宁县| 汽车| 龙口市| 库尔勒市| 凉山| 清涧县| 石景山区| 新丰县| 常熟市| 屏南县| 寻乌县| 南城县| 许昌县| 奈曼旗| 三亚市| 礼泉县| 吉林省| 铜鼓县| 读书| 吉林市| 志丹县| 大关县| 柳河县| 西乌珠穆沁旗| 淳安县| 梨树县| 濮阳市| 章丘市| 洛南县| 湖州市| 鞍山市| 阜宁县| 鄂托克前旗|