官术网_书友最值得收藏!

5.2 實(shí)施測量計分的要領(lǐng)與誤差控制

標(biāo)準(zhǔn)化測量要求對測驗(yàn)結(jié)果進(jìn)行客觀計分。檢驗(yàn)客觀與否,可以以兩個或兩個以上受過訓(xùn)練的合格評分者所評結(jié)果之間的一致性作為指標(biāo)。一般情況下,受過訓(xùn)練的評分者之間的平均一致性達(dá)到90%以上,就認(rèn)為計分是客觀的。只有當(dāng)計分客觀時,才能夠把分?jǐn)?shù)的差異完全歸因于受測者的差異。

計分標(biāo)準(zhǔn)化對于測驗(yàn)的編制者和使用者來說意義有所不同。對前者而言,計分標(biāo)準(zhǔn)化應(yīng)該包括選擇和設(shè)計合適的標(biāo)準(zhǔn)化計分程序,考慮分?jǐn)?shù)的分配、權(quán)重的分配、猜測的處理,以及分?jǐn)?shù)是由原始分?jǐn)?shù)表示還是某種方式轉(zhuǎn)換成其他形式。對后者而言,計分標(biāo)準(zhǔn)化則是要求完全按照測驗(yàn)手冊的規(guī)定和標(biāo)準(zhǔn)答案評定分?jǐn)?shù)。

計分的一般程序

1.計分的基本步驟和要求

(1)記錄反應(yīng)

及時和清楚地記錄受測者的反應(yīng)。如果是紙筆類測驗(yàn),受測者的答案將由受測者自己記錄在答卷上。如果是口頭回答、操作演示回答等,則需要主試進(jìn)行記錄。這種情況下,可以用錄音和錄像等記錄方法,以避免記錄時記憶的困難和記憶錯誤。

(2)檢索標(biāo)準(zhǔn)答案

標(biāo)準(zhǔn)答案有時又稱計分鍵。選擇題測驗(yàn)的計分鍵是每一道題的正確答案的號碼或編排字母;填充題的計分鍵是一系列正確答案以及所允許的變化;問答題的計分鍵為各種可接受的答案的要點(diǎn);操作題的計分鍵則是指具有某種特點(diǎn)或能力的個體的典型反應(yīng)。如果以上反應(yīng)需要加權(quán),權(quán)數(shù)也應(yīng)在計分鍵中標(biāo)明。

(3)反應(yīng)和標(biāo)準(zhǔn)答案的比較

也就是將反應(yīng)歸類或賦予分?jǐn)?shù)值。客觀題的程序很清楚;但當(dāng)評分者的判斷可能成為影響分?jǐn)?shù)的一個因素時(如問答題),就需要對評分的規(guī)則作詳細(xì)的說明。評分時將個人的反應(yīng)和評分說明書上所提供的樣例進(jìn)行比較,按最接近的答案樣例給分。

2.問答題計分

問答題的主要缺點(diǎn)就是評分不夠客觀,也就是說,問答題的計分經(jīng)常受到評分者的情感、態(tài)度的影響。問答題中常見的誤差有:寬容定勢和暈輪效應(yīng)。寬容定勢leniency set)指主試的計分過于寬松,即使沒有回答出題目所要求的答案,評分者也給予較高的分?jǐn)?shù);暈輪效應(yīng)halo effect)指給予受測者某道題較高分?jǐn)?shù)僅僅是由于受測者在另外一些試題上獲得了高分,也就是說對受測者的一般印象影響到具體某個問題的評價。

為了使問答題的計分更加客觀和可信,主試應(yīng)該首先考慮采用何種計分程序,整體計分還是分析計分。整體計分global scoring)就是評分者根據(jù)總體印象給答案評一個總分。整體計分在實(shí)際中應(yīng)用較為普遍。分析計分analytic scoring)是給問答題的不同部分分派不同的權(quán)數(shù),按照各部分的要求對答案中所包括的信息和技能評分,最后將各部分的權(quán)重和得分組合起來得到該問答題的分?jǐn)?shù)。分析計分往往有答題的詳細(xì)標(biāo)準(zhǔn),因此相對更為客觀。

下面是對問答題計分的一般原則:

1)與測量目標(biāo)無關(guān)的回答不予計分,或單獨(dú)給分?jǐn)?shù)。評分應(yīng)依據(jù)受測者對問題的回答是否充分和恰當(dāng),所有其他因素,諸如文風(fēng)、答案長短和書寫等,在計分時應(yīng)盡量不予考慮。

2)確定標(biāo)準(zhǔn)答案。問答題應(yīng)具備一定的標(biāo)準(zhǔn)答案和評分標(biāo)準(zhǔn)。例如,可以列出最佳回答的樣例、答案中必須包含的內(nèi)容或應(yīng)體現(xiàn)的特點(diǎn)或能力,以及如何根據(jù)回答內(nèi)容進(jìn)行評分的詳細(xì)說明。

3)評分時最好按題目順序而不是按受測者順序進(jìn)行,即對所有受測者第一個問題答案計分完畢之后,再給下一題的答案計分。這樣可使計分標(biāo)準(zhǔn)一致,亦可避免暈輪效應(yīng)的影響。

4)最好在評閱時不知道受測者的名字,以減少個人偏見。

5)安排兩個或兩個以上的主試來給問答題計分,取其平均值作為受測者的分?jǐn)?shù)。也可由一人在第一次評閱后,再作第二次審查,以確定評分是否偏頗。

3.客觀題計分

客觀題的一個主要優(yōu)點(diǎn)就是計分簡單、客觀。客觀題的分?jǐn)?shù)可由一個一般的工作人員利用計分套板和計分器很快地、準(zhǔn)確地算出。客觀題的計分由題目的形式?jīng)Q定。能力測驗(yàn)和成就測驗(yàn)中,通常是按正確答案給1分,不正確計0分來統(tǒng)計。例如,一個有50道選擇題或是非題的測驗(yàn),其分?jǐn)?shù)的分布將是0~50分。在人格測驗(yàn)中,沒有答案正確與否的區(qū)分,但每種反映特定傾向的選項(xiàng)都可以用一個數(shù)字或符號進(jìn)行標(biāo)定,最后統(tǒng)計受測者選擇這種選項(xiàng)的次數(shù)。

主站蜘蛛池模板: 方城县| 保康县| 武强县| 乌兰察布市| 龙海市| 搜索| 桂林市| 无为县| 阳春市| 岐山县| 巩留县| 安化县| 遵义市| 寿阳县| 陆河县| 肇东市| 礼泉县| 邯郸市| 凤山市| 虞城县| 漳平市| 荆州市| 鸡泽县| 荔浦县| 封开县| 吉首市| 敦煌市| 北碚区| 东山县| 阳城县| 永登县| 黄石市| 乐山市| 肃北| 中江县| 彭州市| 洪洞县| 含山县| 安图县| 东源县| 海门市|