官术网_书友最值得收藏!

1.1 教學評價的歷史發展

談到教學評價的歷史發展,應該從對教學評價的初步理解開始。

1.1.1 對教學評價的初步理解

我們先來看看什么是價值和價值評價。

1.1.1.1 對價值和價值評價的理解

價值是客體與主體需要之間的一種特定的關系,外部世界作為人的生存和發展的客觀條件,具有滿足人的精神需要和物質需要的屬性,人把外部世界作為自己的生存環境,在于他能在外部世界中,或者說能利用外部世界來滿足自己生存和發展的需要,外部世界同人的主體需要的關系,就叫價值關系。與主體具有價值關系的事物對主體需要的肯定或否定關系就是該事物的價值。通俗地說,事物的價值就是對主體“有用”。

對價值的評價則是價值即客體與主體需要的關系在主體意識中的反映,是主體對價值的主觀判斷、情感體驗、意志保證及它們的綜合。通俗地說,價值評價就是某一事物對主體的“用處有多大”的判定。

價值評價是人們活動的目的和動力,人們要進行什么活動是由人們對它們的價值評價決定的。人們首先要進行的是那些得到較高價值評價的活動,因為這樣的活動對人們的用處更大一些,與人們的利益和需要息息相關,進而和人們的價值觀有密切的關系。人們根據什么判定一個事物價值的高低?或者說,根據什么做出自己的價值評價?那就是依據自己價值評價的標準。只有心中有一個價值評價的標準,才能對事物的價值做出評價。這個價值評價標準就是價值觀。

圖1-2 從價值到價值觀

1.1.1.2 教學評價

依照前面對價值的解說,教學評價就是人們對教學這一社會活動所具有的價值(即教學在滿足人的需要關系方面的主觀判斷、情感體驗、意志保證和它們的綜合)所做出的評價,實際上就是判定教學是否滿足了人的需要。對教學價值的評價是從有教學活動以來就存在的教學行為,人們一直采用各種方法來檢驗教學的效果,追問教學效果如何,也就是在進行教學評價。

例如中國古代就采用考試的辦法進行教學效果的評價,以唐代的數學教育為例。

例1.1 唐代的數學教學評價

唐代國子監既是全國最高學府,也是朝廷的最高教育行政管理機構。國子監設立“六學”,類似于六個專科學校或者六個專業門類。“六學”為:國子學、太學、四門學、律學、書學、算學。前“三學”為“經學”專科學校,入其分校依據的是學生的出身,“三學”的排列顯示著學生出身由高到低的順序。律學是司法專科學校,學習相關的律令;書學是書法專科學校,實際上是藝術專科學校;算學則是數學專科學校。這三個專科學校在世界教育史上具有開創性的地位,尤其數學專科學校。是什么原因促使中國古代數學的超前分化,分化到可以獨立設立專科教育的程度?這是教育史和文化史經久不衰的研究課題。

圖1-3 唐代國子監學科專業狀況

算學分為兩個專業教學,分別采用不同的教材,圖1-3標示出了這一點。第四列是當時采用的10部數學著作,也就是10部數學教材,稱為《算經十書》。后來,《綴術》和《夏侯陽算經》散失,宋代用《數術記遺》代替《綴術》,用另一部書代替《夏侯陽算經》,但仍然用原名,并出版了新的《算經十書》,一直流傳到了現在。

算學的學習效果是通過結業考試評價的。考試題分為兩種:一種是“大義”題,“錄大義本條為問答,明數造術,詳明術理,然后為通”,就是以教科書中的問題作為考試題,要求給出答案(明數)、列出算法(造術)并且寫出這樣解答的道理(術理)。由于多數教材并沒有列出“術理”,因而這種考試是一種比較有難度的考試。“專業1”要求“試《九章》三條,《海島》《孫子》《五曹》《張丘建》《夏侯陽》《周髀》《五經算》各一條,十通六”。“專業2”要求“《綴術》七條,《緝古》三條,十通六”。其中,一個絕妙的要求是“十通六”,相當于現在的百分制中,以60分為及格分,這一直延續到了現在。另一種考試是“帖經”,就是按照原來的教科書出“填空題”,要求10題填對9題才算及格。兩種題都及格了才算算學學習合格。

這里用考試作為算學教學評價的方法,如果進一步問:算學合格對學生有什么進一步的“用處”,即有什么進一步的社會價值呢?那就是:算學合格(畢業)在唐代就相當于通過了當時科舉鄉試(地方考試),可以直接參加科舉的二級考試(中央考試)——制科的明算考試了,中試后再經過一定的程序就可以出任相應的官職。在宋代,算學畢業可以直接得到相應的官職。

可見,有教學就有教學評價,教學評價是自古而然的;考試作為教學評價的方法也有相當漫長的歷史;填空題古已有之;“60分萬歲”也是自古而然的。

1.1.1.3 考試作為一種評價方式

到了近代,捷克的J.A.夸美紐斯(1592—1670)最先提出了班級授課制以及考試考查制度。從那時起,雖然考試的內容和形式有不少變化,但直到現在,考試仍然是一種極其重要的教學評價方式,很多情況下甚至是一種主要的教學評價方式。

想一想,我們經過了多少考試,特別是作為學生經過了多少考試。不算大學以及其以后時間——實際上學生們在大學甚至大學畢業之后所經歷的考試一點也沒減少(例如,學位考試、英語級別考試、研究生入學考試、各種職業的入職考試、各行業各種職務的在職測試、素質測試、各種職務的升級考試等),考試已被社會賦予更多的功能。當然,隨著考試門類的不斷增多,考試系統也日漸龐大,考試制度愈加完善。

一個人在基礎教育階段要經過多少考試?尚沒見到權威的統計數據。有研究者指出,僅在初中階段,一個學生一學期所經歷的考試就有30多次。就大規模的教學考試來說,每個學期中每個學科最起碼要進行兩次;一次是期中考試,一次是期末考試。小學低年級的考試時間是60分鐘,小學高年級是90分鐘,中學則是120分鐘;小學低年級的考試科目是3科,小學高年級是5科,中學則是9科。這些大規模考試的時間一共為15840分鐘,這種考試是以評價學生在這一段時間的學習成績為主。當然,還有評價整個學段學習成績的考試,那就是學段畢業考試。一般小學3科各120分鐘;初中往往與中考合并,中考一般5科各120分鐘,共600分鐘;高中則與高考合并,常見的考法是每人考6科各120分鐘,共720分鐘(現在高考科目有所變化,但是考試依舊);非中考、高考的考試學科獨立進行學業水平考試,都是120分鐘,共有18×120=2160分鐘。以上各項之和就是對終結性考試時間的估計,一共為19320分鐘。而在平時的學習中,更多的是單元考試的形成性考試——不是為了排名次,主要是為了檢測學習中的問題,以便教師改進教學。這樣的考試在主要的學科中幾乎每個月都有一次,每次的時間不長,主要是在計劃課時內解決,因此也就是30分鐘左右(小學時間能少一些,為方便起見,一律算成30分鐘)。按照前面所說中小學的考試科目數,這樣的考試一共有594×30=17820分鐘。實際上許多中學各門考試科目都舉行月考,考試目標還是在于檢測學生成績,也就是仍然是終結性考試,時間是120分鐘,按9科計,則月考時間為4(月次/年,不是每月必考)×9(科)×6(年)×120=25920分鐘。其他非大規模教育考試學科,即所謂“輔科”也是有考試的,特別是形成性考試還是教學需要的,而且期末考試也不可或缺。假設每學段各有4科,考試量減半——30分鐘的考試每兩月1次,60分鐘的考試每學期一次,此種考試的時間為240×4×12=11520分鐘。此外,還有不少“臨時性考試”,例如,為了特定需要的摸底、調研、評價教師、考察學校而組織的統一考試,為了幫助教師改進教學的教學質量考試、學業質量評價考試、某種特別的競賽考試。假設中學(小學不計)每年需要參加兩次考試,每次1個學科120分鐘,這樣又有1440分鐘的考試。合計一下,我們參與的考試時間約為19320+17820+25920+11520+1440=76020分鐘=1267小時。可見,每一個人都是“身經百考”,在考試中成長發展的。

圖1-4 基礎教育階段學生參加測試所用時間分布(估計)

而實際上還有非常多的“準考試”,例如需要不斷地“刷題”,有家長收集的卷子,有教師發的卷子,有培訓機構發的卷子,這些卷子雖然并不算是考試卷,但測試卷和測試題都是需要像考試那樣解答的,盡管一般并沒有人來批改,但仍然像正式考試那樣占用時間。估算基礎教育階段參加考試的時間,只是想說明考試對每個人的成長發展的重要性。

教育部辦公廳《關于加強義務教育學校考試管理的通知》(教基廳函〔2021〕34號)提出要求:

為深入貫徹落實中央關于教育評價改革和“雙減”工作部署要求,嚴格規范學校教育教學行為,切實降低學生考試壓力,促進學生全面發展健康成長,現就加強義務教育學校考試管理通知如下。

…………

二、大幅壓減考試次數

小學一二年級不進行紙筆考試,義務教育其他年級由學校每學期組織一次期末考試,初中年級從不同學科的實際出發,可適當安排一次期中考試。各地不得面向小學各年級和初中非畢業年級組織區域性或跨校際的考試;學校和班級不得組織周考、月考、單元考試等其他各類考試,也不得以測試、測驗、限時練習、學情調研等各種名義變相組織考試。初中畢業年級為適應學生畢業和升學需要,可在下學期正常完成課程教學任務后,在總復習階段組織1~2次模擬考試,堅決禁止搶趕教學進度、提前結課備考。初中學業水平考試仍按國家和省級教育部門有關規定執行,除初中學業水平考試外不得組織任何與升學掛鉤的選拔性考試。

按照文件要求,上面估算的考試時間將會最大限度地減少。考試次數減少,對每次考試的要求就會有提高——提高考試的質量和對考試成績的高效運用,通過較少的考試對學生的學習做出精確的評價就成為考試設計的一項重要任務。

1.1.2 現代教學評價的發展概況

現代教學評價是19世紀在西方產生的,“評價”一詞是對英文詞“evaluation”的翻譯。現代教學評價從產生至今已經歷四代,基本情況如下:

圖1-5 現代教學評價發展簡表

19世紀末產生的現代教學評價是社會發展的需要。隨著電力革命的迅速推進,當時的西方國家特別是美國正處在資本主義工業化大發展的時期,新興產業層出不窮,因而對勞動力、對教育提出了新的要求。同時由于美國的移民政策,大量來自不同國家、不同階層的移民涌入美國。社會需要新的人才培養選拔機制,需要人才培養和選拔的公正和公平。當時,在人才問題上的口號是“無論何人,無論何時都應該得到相同的結論”,打破了嚴重影響社會生產發展的血統、門第、財產、資歷等對人才的限制,相對客觀的“測量”被應用到了人才選拔之中。

第一代教學評價是測量式的“測驗”,其活動主要是考試,有口試和筆試兩種形式。這是教學評價被稱為“教育測量”的緣由。把教學評價與教育測量混同起來的歷史是短暫的,它的最典型的觀點是“學校是人才的加工廠”“學生是原料和產品”“教師是加工者”,在這種教育中能培養出大工業生產急需的各種適合工業化流水線的、規格一致的人才,因此,這種評價產生了相當廣泛的影響。

第二代教學評價被稱為“描述”,時間是從20世紀30年代初到20世紀50年代中期,代表人物是美國著名教育學家泰勒(R.W.Tyler,1902—1994),他提出了泰勒評價模式(或稱泰勒評價原理)。泰勒的思想是用確定學習結果與教育目的之間的達成度來定義教學評價。

泰勒把課程分為教學目標、教學活動、課程內容的組織以及教學評價四個基本要素。教師在課程實施中通常要尋求幾個教育目標,之后通過問卷、抽查“產品”樣本和測驗來評估學生在每個主要目標上的進展情況。因而,評價是一個過程而不僅僅是一兩次考試,評價過程中不僅要報告學生的成績,更要描述教育結果與教育目標的一致程度,這才能體現教育的本質。其主要程序為:

圖1-6 泰勒的科學評價流程

在泰勒的影響下,美、英等國出現了諸多針對評價而設計的教育目標體系。同時,這一時期人們也認識到教育目標不是評價的唯一依據,目標本身的科學性、合理性和可行性也必須受到檢驗。人們認識到用統一的目標模式去評價教育效果,從根本上說是不可接受的,因而相繼推出了許多新的評價理念和模式。其中影響最大的是美國著名的心理學家布盧姆(B.Bloom,1913—1999)的教育目標分類理論。布盧姆研制的目標是為了便于客觀地評價而不是表述教育的理想,并且只安排可測的目標(即具體的外顯行為目標)。他的一個著名公式為:目標=行為=評價技術=測驗問題。

第二代教學評價的基本特點是:評價過程是把教育結果與預定教育目標相對照的過程,是根據預定的教育目標對教育結果進行客觀描述的過程。評價的關鍵是確定清晰的、可操作的行為目標。評價不等于考試和測驗,但考試和測驗可以成為評價的一部分。這一代教學評價即所謂“科學評價”。

第三代教學評價被稱為“判斷”,時間是從20世紀50年代中期到20世紀70年代。這一代教學評價認為,教學評價本質上是判斷,人們對已確定的教育目標質疑,認為它們也應該成為評價的對象,進而涉及對判斷的質疑:判斷是否應作為評價的一項基本活動?判斷是否需要標準?如果需要,又如何建立“價值中立”的客觀標準?(科學評價則認為判斷無條件地具有價值中立性)因此對目標也要加以判斷。這一代教學評價的特點是:把評價視為價值判斷的過程,評價不只是根據預定目標對結果進行描述,預定目標自身也需要進行價值判斷。這樣,目標就不可能成為評價固定不變的標準,因而評價就應該超越固定目標的限制,過程本身的價值也成為評價的重要組成部分。第三代教學評價也有很大的影響,現在常見的“形成性評價”“目標游離評價”“內在評價”“過程性評價”等都體現了第三代教學評價的理念。

第四代教學評價被稱為“建構”,出現于20世紀70年代,其對前三代教學評價進行了批判,認為它們存在以下三個問題:

其一,管理主義傾向,指的是管理者決定了評價,因而在評價中出現了管理者無過失、評價者無決定權、其他評價利益相關者無法表述自己的觀點或維護自己的利益、評價者服從管理者的情況,因而使評價可能有失公允。

其二,忽視了價值的多元性,導致評價不能被多方接受。

其三,過分依賴科學范式即實證科學技術的范式,過分依賴“數”的測量而忽視了“質”的研究。

針對這三個問題,第四代教學評價提出了一種通過“協商”而形成的“心理建構”評價,屬于價值多元的評價。這一代教學評價的特點是:把評價視為評價者和被評價者“協商”進行的共同的心理建構過程。受多元主義價值觀的支配,評價是一種民主協商、行為主體參與的過程,而不是評價者對被評價者的控制過程,學生也是評價的參與者、評價的主體,評價的基本方法是質性研究方法。質性研究也叫質的研究,是以研究者本人為研究工具,在自然情境下采用多種資料收集方法對社會現象進行整體性探究,使用歸納法分析資料和形成理論,通過與研究對象互動對其行為和意義建構獲得解釋性理解的一種活動。質性研究方法常采用觀察、訪談、資料收集等方式,但有著自己的特點。例如:觀察(Observations)。質性研究所用的觀察不同于量化研究的客觀觀察,一般采取的是參與觀察或半參與觀察,觀察者與被觀察者在一起活動、生活,在相互接觸中傾聽、觀看其言行方式和內容。訪談(Interviews)。質性研究的訪談一般是無結構的開放式深度訪談,要求訪談者了解被訪者對研究問題的理解、思維方式,給被訪者留有充分的思考和語言表達余地,并按照被訪者的思路、交往方式、語言表達習慣來討論問題。

今天,中國基礎教育的教學評價處于第一代、第二代和第三代交混使用并努力(至少在理論上)向第四代過渡的時期。努力推進第四代教學評價是新課程教學評價的重要任務之一。

1.1.3 作為評價的測驗

測驗作為教學評價的組成部分對于整個教學評價來說具有非常重要的意義,在某些情況下甚至具有核心的意義,關鍵是成績測驗。

1.1.3.1 成績測驗的兩個特點

在第一代教學評價中,伴隨著教育測量產生了兩種有影響的測驗:一個是成績測驗,一個是心理測驗。

成績測驗的代表性人物是美國的桑代克(E.L.Thorndike,1874—1949),他有一段著名的話:“如果有事物存在,就會表現為某種量的形式:如果以量的形式存在,就可以測量。(If a thing exists,it exists in some amount,it existsin some amount,it can be measured.)”按照這樣的理解,“量化”成為主要的教學評價方式。為了使量化更具客觀性,并且更易于操作,客觀性測驗被大量開發使用(所謂客觀題就源于此),問題解答的準確率和速度成為教學評價的指標。

心理測驗的一個成果是智力量表的研制和使用,從此“智商(IQ)”成為一個標準的教育學和心理學用語。

很快,人們發現了成績測驗、特別是閉卷紙筆成績測驗,對人才的甄別與選拔具有兩大優勢,如下圖所示:

圖1-7 閉卷紙筆成績測驗的兩大優勢

由于這兩大優勢,成績測驗很快就進入所有涉及需要人才甄別和選拔的領域。隨著時間的推移和公眾參與意識的增強,閉卷紙筆成績測驗的公平性日益為社會各個方面所承認,其經濟性則是被廣泛采用的保證。經濟性也是公眾能夠充分理解的原因之一,這也促使教育學、心理學在這之后有了很大的發展,對人的能力的評價有了許多更為先進的方法。雖然在許多場合,推薦、面試、訪談、調查了解等也作為人才甄別和選拔的方式為各方所采用,但在高利害的大規模的人才甄別和選拔的時候,特別是大規模教育考試,例如升學考試中,閉卷紙筆成績測驗至今依然是唯一的方式。設計更好的測驗試卷一直是社會所面臨的重要問題之一。

1.1.3.2 測驗設計面臨的困難

回到教學領域,既然大規模教育考試采用的是閉卷紙筆成績測驗的方式,而參加考試謀求升學又是學生和基礎教育學校一致的努力方向,那么現實生活中必然導致對成績測驗的重視,這種重視達到一定程度之后就會把應對測驗作為實際教學的主要目標。由于升學對學生、學生家長、教師、學校甚至對社會都具有重大的意義,因而受到越來越多的關注和重視,其結果將直接導致前面說的“一定程度”的迅速達成。這實際上就是使測量行為變成了測量目的,測驗由評價的工具變成了評價的目標。這也就是應試教育的由來。

所謂應試教育實際上是把成績測驗的試題當作了教學評價的標準,把分數當作評價的結果。用測驗進行評價的一個必然結果就是將試題變成評價的標準。這在我國高考中具有特別典型的表現,高考的出題范圍和題型將引起學校的極大重視,并且立即就成為下一年的學習標準。因此每年的高考出題都是相當慎重的,考后還要多方征求學校教師甚至考生的意見。高考出題的一個原則就是對高中教學起到引領的作用。

例1.2 一道數學高考題引起的思考

2011年高考數學陜西卷文、理科都有一道解答題,題目是“敘述并證明余弦定理”……聯系到高中數學教學,特別是高三數學復習的現狀,不少人為“敘述并證明余弦定理”成為高考試題而叫好。

其導向是非常正確的,那就是:高考命題可以出教材上的原題。這為今后高中數學教學以及高三復習工作指明了方向,有利于改進教學方法,減輕師生不必要的課業負擔和工作負擔。吳曉英,巨申文.為“敘述并證明余弦定理”成為高考題叫好[J].中學數學教學參考,2011(10,上旬):41-42.

【評說】一道高考題為什么能引起這樣的反響呢?那是因為高考題本質上成為高中學生學習的評價標準,對教學有著巨大的引領作用。這樣一道數學教科書上的原題成為高考題,必將引領數學教學進一步深入教材,做好數學的基礎知識和基本技能的教學。從茫茫題海回歸到數學課本,當然具有減輕課業負擔的重要意義了,無怪人們要叫好歡呼了。

既然大規模教育考試的成績測驗具有遠超出測驗自身的甄別和選拔的意義,這就給測驗設計帶來巨大的困難——要設計出既能夠指導學校教學走向學習本質,又具有遴選功能的測驗題。

這一困難本質上是不可克服的,因為測驗設計只能針對具體的可測目標,而且成績測驗的測驗題只能是一種抽樣產物,對任何一個知識點都可以設計出許許多多不同的題目,每次設計的測驗題能否具有代表性,能否提供更多舉一反三的可能,也是必須考慮的。只有這樣,才能減輕學生和教師過重的課業和工作負擔。

1.1.3.3 對教學評價的影響

這種設計困難,使得以測驗題為標準的教學評價產生了一系列嚴重的問題,在此列舉一二。

以成績測驗題作為評價標準就是用定量的分數來表達評價結果,一般是為了進行選拔和甄別。如果對學生學習的所有評價都是以定量分數的選拔和甄別為目的,就會使評價的功能異化,過分地強調甄別和選拔的功能,忽視改進、激勵與促進學生發展的功能。教師、家長和學生只關心考試得了多少分,排在第幾名,卻很少關心考試中反映出來的學生發展中存在的問題。

反過來看,以測驗為主的評價方式,必然過于重視評價的甄別和選拔功能。在這種情況下,一方面,中、高考為所有的甄別性、選拔性考試提供了可靠有效的樣本;另一方面,中、高考的高利害性質必然受到方方面面的重視,導致評價更全面地為中、高考做準備。于是,無論是學校對學生的評價,還是課堂上教師對學生的評價,都完全以中考或者高考為藍本:評價方法——紙筆考試,評價標準——考試分數,評價內容——考試內容。特別需要指出的是,中考或者高考的考試內容被學校分解到各個學期、各個章節、各個課節上,而且平時考試題型、要求等方面盡可能地模擬中考或者高考。這樣做,使得學校教育就是為了學生能夠順利通過高利害的大規模教育考試,從而升入上一級學校,于是,考試獲得好的成績或者說掌握應對高利害考試的能力就成為學校教育的目標,進而也就成為教學評價的目標,學校的教育也就自然轉化為如何讓學生通過入學考試。日常教學也好,階段性考試也好,都成了促進學生通過入學考試的工具。為了強化應試的努力,提高應試的效果,不少學校管理者一方面制定了各種管理條例,用來調控教師,使得教師將日常教學變為中、高考的練習,這是外顯的;另一方面,則通過將學生評價的結果與教師獲得的各種利益掛鉤,教師不管在課堂中教學如何生動,評價如何具有發展性,可是在學校的統一考試中,所教的學生成績一旦不好,教師的利益就會因此而受損。一個直接的做法就是:中、高考考什么,學校就考什么甚至就學什么;中、高考不考什么,學校就將其排除到評價甚至于教學的范圍之外。學生的情感、態度、價值觀目標的達成,學生的個性培養、全面發展全然被排除在這種評價之外,這必然導致教學評價促進學生發展這一本質功能的缺失。

不僅如此,這種教學評價還會導致教學評價客觀性的缺失。

評價的客觀性指的是評價要能夠真實、全面地反映學生學習水平。要做到這一點,不僅僅要保證評價結果的科學性,還要保證對評價結果解釋的科學性。把評價限于模擬中、高考的紙筆考試,并以分數為評價標準,本身已經無法判定學生的個性差異以及學生的發展前景和潛在能力,這是客觀性缺失的一種表現;客觀性缺失的另一種表現是對考試分數的解釋也與對中、高考分數的解釋運用相對接,即采用常模參照方式用一般描述性統計量解釋,也就是按照考試分數給學生排名次。中考、高考的排名是必要的,只能以分數來選拔學生,但校內評價也采取排名次的方式目的何在?

試問,對學生在校內進行的學業質量測量是一種什么性質的測量呢?就其中的考試而言,是常模參照考試還是標準參照考試?通常認為,測量考試的特點是:先以不同的能力水平或不同的內容領域為參照命題,這無疑具有標準參照考試的特點;對考試結果再以考生群體的表現為參照進行解釋,這又成為以全體考生為常模組的常模參照考試,因此是“標準參照+常模參照”的考試。而這里進行標準參照考試的必要條件是對標準能力水平或內容領域要有詳細的規定。需要注意的是,參照標準是能力水平或內容領域而不是及格分數,考試還可以用考生對課程內容的掌握程度或以培養目標的達成度對學生進行評價。實際上,中考、高考也應該體現這種評價,考試后要有關于考生對課程內容的掌握程度或學校培養目標達成度的分析。

因此,一考試就排名次的做法不符合對學生的學業質量監測的要求,如果考試評價本質功能還不能一步到位的話,應該選擇對考試分數進行標準參照的解釋,以此來客觀地判定學生是不是達成了規定的教學目標,促進學校、教師和學生對達成完整教學目標的關注和努力,加強評價的客觀性。

1.1.4 教學評價的發展

一般來說,人們經常從發展的動力、指向的目標和是否達到了目標的評價來考察一個事物的發展,這里也從這三個方面來考察教學評價的發展。

1.1.4.1 評價發展的動力

把成績測驗的試卷作為教學評價的標準帶來了如前所述的問題,但不可否認的是,這種評價方式直到現在仍然被人們廣泛認可。隨著時代的發展,教學評價的發展與改革就必然提到議事議程上來,因此才有了教學評價多達四代的發展變革,而且人們不僅僅提出變革的設想,也迅速地進行了變革的行動。

成績測驗只是教學評價的一種方法,方法應該為教學評價的目標服務。那么教學評價的目標是什么呢?教學評價的目標就應該是達成教學目標——正是為了達成教學目標才進行教學的,教學評價就是對教學是否達成了教學目標進行判斷。從某種意義上說,對教學目標的探討是進行教學評價改革的動力。

1.1.4.2 教學目標變革行動

正是在這樣的背景下,泰勒評價原理得到普遍的認同。關于教學評價和教學目標,人們提出了三個要點,如圖1-8所示。

圖1-8 教學評價三要點

教學評價的發展在相當程度上就是教學目標設計的發展,所以明確提出課程目標的泰勒提出了教學評價的概念就一點也不奇怪了。泰勒在這個問題上用“評價(evaluation)”取代了“測驗(test)”“考試(examination)”“測量(measurement)”,使測驗恢復到工具的地位,測量的目標及評價的目標都應該是教學目標。

表1-1 教育測量和教育評價的比較田中耕治著.高峽,田輝,項純譯.教育評價[M].北京:北京師范大學出版社,2011:33.

對泰勒科學評價的質疑也是針對教學目標的,或者說首先是針對“基于目標的評價”的。人們認為教學目標是教師設計的,依據教學目標的評價,帶有“自己的對錯自己說”的性質。斯特科(B.Stake)有一段被到處引用的話,“所謂的‘形成性評價(formative evaluation)’就像是廚師本人在品嘗湯的味道,而‘總結性評價(summative evaluation)’則是客人品嘗湯的味道”。廚師是根據自己想要的味道,在做的過程中不斷品嘗和調味;而湯一旦做好了,就會端出去,由客人來評價味道的好壞。這時,客人一般都會根據自己的需求來評價湯的味道,而不必事先知道廚師的制作意圖;如果事先得知廚師為了制作這道湯花費了怎樣的功夫和苦心,反倒難以品嘗出湯的真正味道。這種圍繞評價的微妙關系,和商品管理者與消費者之間的關系是一樣的,消費者不必知道商品管理者的意圖,而只需評價商品的質量好壞即可。

一位美國教育學者斯克里文(M.Scriven)指出,“基于目標的評價”完全就是出于既定的“目標”,是為實現“目標”的評價和改善活動。但因為“基于目標的評價”緊緊圍繞“目標”轉,所以那些超出“目標”的活動往往容易被忽視。由于受到“目標”的限制,全面的狀況很難掌握。為此,他提出了“目標游離評價(goal-free evaluation)”的概念,指的是不受目標限制的評價,目的不是改善行為,而是對活動結果進行“總結性評價”,其實質是評價者不知道教學的目標,不是為了評價教學的意圖,而是為了要弄清楚教學究竟是如何實施的而進行的評價。這種評價不是針對教師確定的教學目標,而是針對教學是否滿足了學生的需要來進行評價的。田中耕治著.高峽,田輝,項純譯.教育評價[M].北京:北京師范大學出版社,2011:55-56.

也就是說,“目標游離評價”的關鍵是考察教育計劃或方案的實際效果而不是預期效果。為此,評價者應該收集大量有關實際效果的資料,評價其在滿足教育要求(例如學生的需要)方面的重要性,而不再收集有關目標及目標達成情況的信息;應收集關于課程效果的有關信息,包括期望之中和預料之外的效果信息,并加以評價。不過這里也有一個問題,當不以教學目標為標準的時候,評價以什么為標準?或者根本就沒有標準,大家隨意判斷?實際上,“目標游離評價”并不是不要教學目標,而是不局限于設計好的教學目標,因此最先游離的其實就是教師,教學評價可以不完全依賴于教學目標的設計者——教師去實施,所以最關鍵的行動改進就是評價者的開放,例如,學生、教師、家長、社區的相關人士都可以成為評價者,為多元評價打下基礎。如果對教學目標適當拓展,例如,把原來既定目標之外的但是與學生發展有關的其他因素也納入教學目標之中,形成多元目標,仍然可以以目標為基礎進行評價,這也就進入了第四代教學評價。注意,這里有個邏輯悖論:形成多元目標就仍然可以以目標為基礎進行評價。多元目標是不是目標?是目標——又回到目標上來,不過目標設計的方式不同而已;不是目標——是什么?怎樣與學生的學習聯系起來?所以第四代教學評價的哲學意味更多些,而實踐操作的意味更少些。現代的教學評價還只能以教學目標為基礎,不過加上了第四代教學評價的某些要素,例如多元評價——評價者多元而且重視學生的自我評價,評價方式多元,評價目標更加全面,叫作新的基于目標的評價。

從上面引述的對泰勒基于目標評價的質疑可以看出,泰勒評價原理包含著形成性評價,倡導在教學中通過對學生學習狀況的不斷評價和反饋引領學生更好地學習,從而更有效地達成教學目標,促進學生的發展,提高教學的質量。這一點在現代教學評價中得到了發展和強化。

1.1.4.3 新的基于目標的評價

一個行動方案:

圖1-9 新的教學評價方案田中耕治著.高峽,田輝,項純譯.教育評價[M].北京:北京師范大學出版社,2011:74-75.

與圖1-6相比較,這個基于目標的評價代表了現代教學評價的發展方向。

1.1.4.4 教學設計流程

圖1-10 教學設計的流程W.迪克,L.凱瑞,J.凱瑞著.龐維國等譯.系統化教學設計[M].上海:華東師范大學出版社,2007:1.

從教學設計的流程中可以發現,教學目標是教學設計的出發點,當然本質上也就是教學過程的歸宿,教學的總結性評價畢竟還是要基于這個教學目標才能確定。

主站蜘蛛池模板: 太原市| 新蔡县| 克什克腾旗| 诸暨市| 南开区| 板桥市| 玛多县| 安宁市| 巫溪县| 遵义市| 安龙县| 延津县| 方正县| 班玛县| 海林市| 彰化县| 沈丘县| 孝感市| 车险| 甘谷县| 富阳市| 蒲城县| 嫩江县| 当阳市| 甘孜| 老河口市| 墨竹工卡县| 石首市| 大埔县| 吴忠市| 枣强县| 安远县| 呼图壁县| 吴桥县| 辛集市| 镶黄旗| 藁城市| 庆阳市| 林芝县| 江油市| 宜昌市|