6.1 測驗結(jié)果解釋的概念
為什么測量的實施與解釋相分離
通過實施測量和對測量結(jié)果的計分,獲得了測量的原始分?jǐn)?shù)。原始分?jǐn)?shù)(raw score)是通過將受測者的反應(yīng)與標(biāo)準(zhǔn)答案相比較而直接獲得的,其本身并不具有多大的實用意義,而只是一個理論上的過渡值。例如,通過邏輯推理能力測驗,得到某位受測者的原始成績是25分。但是,這個成績并不能使主試確定這名受測者的能力優(yōu)秀與否。比如,25分和28分的能力相差到底有多大?25分是高于還是低于平均水平?換言之,我們并不了解原始分?jǐn)?shù)的實際含義,它們相互之間也不能直接比較。
人事測量的目的在于評價和比較應(yīng)試者各方面的素質(zhì)和特點。因此,必須將測量得到的原始分?jǐn)?shù)與一般人的分?jǐn)?shù)進行比較,才能確定這個分?jǐn)?shù)所代表的水平相對于一般人而言到底是平常還是優(yōu)秀。也就是說,原始分?jǐn)?shù)并不能提供一個易于理解、可直接使用的評價,而需要針對一定的標(biāo)準(zhǔn)進行比較,才能得到有用的評價。這個可供比較的分?jǐn)?shù)標(biāo)準(zhǔn),就是常模。
常模來自于測驗總體的分?jǐn)?shù)分布及其特征。原始分?jǐn)?shù)通過與常模的比較(見第1章中給出的方法和公式),可以轉(zhuǎn)換成等值的導(dǎo)出分?jǐn)?shù),叫做標(biāo)準(zhǔn)分(standard score)。這種分?jǐn)?shù)是有意義的,可以進行相互比較,因為它是按照統(tǒng)計公式換算出來的,每一個標(biāo)準(zhǔn)分都對應(yīng)到分?jǐn)?shù)分布中反映分?jǐn)?shù)高低的百分位。比如,IQ就是一個標(biāo)準(zhǔn)分。IQ為100分就意味著智力中等,也就是說,這個分?jǐn)?shù)高于人群中50%的人;如果IQ為115分,就意味著比一般人(平均分)高出一個標(biāo)準(zhǔn)差,這個分?jǐn)?shù)對應(yīng)的百分等級約為84%,也就是說這個分?jǐn)?shù)高于人群中84%的人。
這種由測量的原始分?jǐn)?shù)通過與常模的對照得到可供比較的導(dǎo)出分?jǐn)?shù)的過程,就是測驗分的解釋形式之一,稱為測量分?jǐn)?shù)的常模參照解釋(norm reference explanation)。測量分?jǐn)?shù)的另一種解釋方式是參照效標(biāo)的分?jǐn)?shù)解釋,即效標(biāo)參照解釋(criterion reference explanation),它是依據(jù)外在效標(biāo)作為標(biāo)準(zhǔn)來對應(yīng)試者的分?jǐn)?shù)進行解釋。
常模參照解釋與效標(biāo)參照解釋的區(qū)別在于:常模參照解釋是將受測者的成績與同類群體的其他人(常模樣本)的成績進行比較,而效標(biāo)參照解釋是將受測者成績與外在效標(biāo)(如二級技工的標(biāo)準(zhǔn))進行比較。例如,實施一項機械技術(shù)考試之后,如果將受測者的成績與其他人的成績進行比較,可以知道該受測者的機械技術(shù)知識是優(yōu)秀、一般,還是較差,這就是參照常模的分?jǐn)?shù)解釋;如果將應(yīng)試者的成績與機械師等級標(biāo)準(zhǔn)(外在效標(biāo))進行比較,就可以知道該應(yīng)試者是否達到了某一級機械師的水平,這就是參照效標(biāo)的分?jǐn)?shù)解釋。