《深化新時代教育評價改革總體方案》提出,要改進結(jié)果評價,強化過程評價,探索增值評價,健全綜合評價。
在這“四個評價”當中,綜合評價是重點,也是根本。因為如果不指向?qū)W生綜合發(fā)展,結(jié)果評價和增值評價容易變成評價分數(shù),過程性評價也可能走向形式主義,評價便失去了意義和價值。
(資料圖片)
但同時,綜合評價又是痛點、難點和卡點。核心素養(yǎng)時代,究竟如何健全綜合評價?想回答這個問題,我們需要明確兩點: 綜合評價不是什么?綜合評價是什么?
綜合評價不是什么
綜合評價不是知識點的拼接
上世紀80年代,我們引進了布魯姆的教育目標分類學及掌握學習法。當時我是一名教研員,用雙向細目表來架構命題框架,改進考試命題。在那個年代能夠這樣做,是很先進的,因為在雙向細目表的引導下,能夠確保命題的覆蓋面比較廣,也確保教學在某些方面不能超綱。
但這就是我們今天追求的綜合評價嗎?顯然不是,因為綜合不是簡單的匯總、相加。今天強調(diào)素養(yǎng)導向,素養(yǎng)不限于知識點,也不限于認知范疇,而識記、理解、應用都是認知范疇。
如果用一個公式來說, 素養(yǎng)=(知識+能力)*態(tài)度,它強調(diào)態(tài)度價值維度。態(tài)度為正,就是正能量;態(tài)度為負,就是負能量。而雙向細目表限于認知維度,跟素養(yǎng)導向的綜合評價是有偏差的。
而且,雙向細目表強調(diào)考試,即學生要在規(guī)定的時間、規(guī)定的場所,回答相同的問題。這樣能考出真正的素養(yǎng)嗎?我說可以,也并非完全可以,因為 最重要的素養(yǎng)是不能通過考試的方式來評價的。
綜合評價不是五育觀測點的相加
目前,中小學流行的綜合評價,是把學生的綜合素質(zhì)分成了思想品德、學業(yè)水平、身心健康、審美素質(zhì)、勞動與綜合實踐五個方面,每個方面再分解成三級指標。比如,審美素養(yǎng)被分解為美育實踐、美感表達、藝術特長三個指標,每個指標對應4-5個觀測點。整體而言,綜合評價就細分成了五六十個觀測點。
這一套體系對于破除“唯分數(shù)論”是有價值的,它關注到分數(shù)之外的很多方面;像勞動與綜合實踐,就是過去很少關注的維度。這相對于雙向細目表的評價是有進步的。
但是,這樣的綜合評價仍然是有問題的。
第一個問題,綜合評價表現(xiàn)為各個五育觀測點的簡單相加,在非常細致的分解式考評之下,學生的個性、活力、靈氣就被淹沒了。
第二個問題,綜合評價一般都是通過同學評、老師評、家長評來評出等級或者得出分數(shù)。但這些指標缺少一定的可操作性,所以多是憑主觀印象進行評價,不那么客觀;不同學校的把握也不太一樣,缺少一定的可比性。
第三個問題更嚴重,在這樣一套評價指標體系下,課程對接的是學業(yè)水平,課程被狹隘地理解為智育;然后在學業(yè)水平之外,專門突出了德育、體育、美育等,嚴重窄化了課程的育人功能,評價因而容易走向形式主義。
學校育人以課程為載體,同樣,學生綜合評價也應與課程對接,通過健全課程落地的機制,由課程體系予以保證,不是另外設立一套與課程關系不大的評價體系。 如果評價能夠嵌入課程實施過程,落地在每一門課程,學生的綜合素質(zhì)一定能夠得到發(fā)展。
綜合評價不是全時空的跟蹤、監(jiān)控
說到綜合評價,現(xiàn)在學校比較時髦的是 “數(shù)字畫像”,即依靠穿戴設備和圖像設備,對每個學生的行蹤進行全方位地記錄,并在此基礎上得到學生畫像。
數(shù)字畫像有兩個好處,一是便利,可以通過大數(shù)據(jù)的實時記錄、自動匯集、連接,形成龐大的“數(shù)據(jù)自我”;二是比較客觀可靠,不再是憑主觀印象進行評價。
但隨之而來的問題也不少:
第一,數(shù)據(jù)是隨機采集的,缺乏必要的結(jié)構;
第二,被記錄的是某些行為及其模式,而不是動機、情感、態(tài)度、信仰等。學生的動機、情感、態(tài)度、信仰能夠被這些數(shù)據(jù)體現(xiàn)出來嗎?我表示懷疑。
第三,無所不至的“強制性透明”摧毀了所有的有機表達,剩下的只有機器連接的過程,人變成了完全透明的機器。
我們需要思考的是,全時空的跟蹤、監(jiān)控這件事究竟對不對?這件事如果發(fā)生在我們自己身上,是什么感覺?己所不欲,勿施于人。如果我們自己都不愿意接受這一套,請不要把它用在學生身上,何況是未成年兒童。
伴隨著現(xiàn)代化的進程,人的活動有著私人領域和公共領域之分,而私人領域不應該是透明、公開的。但全時空的追蹤把所有東西都記錄下來,產(chǎn)生龐大的數(shù)據(jù),無論是暴露在自己面前還是在別人面前,都會感到非常吃驚。 面對這樣的媒體和數(shù)字“暴力”,我想,應該說“不”。
綜合評價是什么?
接下來,我們就來正面回答“綜合素質(zhì)評價是什么”這一問題。但首先,我們需要明白“綜合是什么”。
綜合是調(diào)動多樣化心理社會資源
應對挑戰(zhàn)、完成任務的過程
下面是兩個學習任務的例子。
示例1:6年級數(shù)學任務設置
規(guī)劃一次出游:教師介紹主題,激活學生以前規(guī)劃出游的知識。
引導學生討論:討論內(nèi)容為以前學校或家庭到哪里出游過或其他外出情況。繪制一個圖表,通過列出學生的首選清單,展示全班的優(yōu)先選擇,然后對他們最想出游的地方投票,全班討論最優(yōu)選擇。
每個學生的任務:基于他們對班級投票情況的分析,建議他們班可以去哪里出游;基于圖表顯示的每個地點的距離、門票價格和公交車費,計算每個學生三個不同地點的出游費用;使用成本圖表中呈現(xiàn)的信息,評價學生要去動物園的提議;基于對所有信息的分析,給教師寫一個短信,對班級應該選擇哪個地點出游給出建議和佐證。
示例2:高中語文任務設置
10-11年級學生編輯一個在線電子版文集《人工智能與勞動世界》,具體任務是為文集準備前言,做如下事情:
決定以什么順序選取哪些文本(至少包含6個文本),這些文本至少體現(xiàn)兩種以上的觀點和文本形式;甄別和討論文本所體現(xiàn)出來的關于兩者關系的不同看法;為每個文本寫一個段話,闡明選取的理由及與其他文本的關聯(lián)性;提出一系列問題,讓讀者集中思考文本中的觀點。
上面這兩個任務有什么特點? 一是真實性,反映真實的生活或工作需求; 二是開放性,有著充分的自主空間; 三是迭代性,完成這樣的挑戰(zhàn)性任務需要較長的時間,允許學生從錯誤中學習。
在完成挑戰(zhàn)性任務的過程中,學生的知識、技能、價值觀自然而然發(fā)生了整合,這個過程叫做綜合。綜合是真實的、自然的,不是預先設定的。 綜合的過程,就是核心素養(yǎng)形成的過程。
所以,素養(yǎng)不是學而即得的知識;按照經(jīng)合組織的定義,素養(yǎng)不只是知識與技能,還包括在特定情境中,通過利用和調(diào)動心理社會資源(包括技能和態(tài)度)滿足復雜需要的能力。
綜合素質(zhì)評價要義的兩個方面
由此,綜合素質(zhì)評價的要義體現(xiàn)在兩個方面。
一是從挑戰(zhàn)性任務的完成過程中看重要素養(yǎng)的發(fā)展情況。
比如上面的示例2,就能看到多方面的素養(yǎng),包括:學生組織安排及闡釋、推介文本、滿足讀者需求的意識和能力;多渠道閱讀獲取信息、梳理探究與書面表達能力;對技術世界與勞動世界的基本態(tài)度。
所以,綜合評價不是評價“今天學會了嗎”“今天作業(yè)交了沒有”“今天晚自習上了沒有”。如果綜合評價被理解為這種方式,我們將把學生引向哪里?到最后,學生就會失去自主性。 評價關注學校課程著力培育的重要素養(yǎng),而非學而即得的知識、技能,以引導教育教學的方向。
二是把學生各方面的情況結(jié)合起來,看個性潛能和特長。
具體來說,是對學生的發(fā)展可能性作出前瞻性評估,對個人潛質(zhì)與院校培養(yǎng)目標的匹配度做出判斷,借以引導后續(xù)學業(yè)、生涯規(guī)劃,決定是否報考或錄取。 它要求把“抽象的人”還原為現(xiàn)實生活中的具體個人,并放在一定情境中去理解。
基于學生作品的綜合評價
基于以上對綜合評價的思考,我認為,未來綜合評價的一個出路或者選擇,是基于學生作品的綜合評價。
作品是學生重要素養(yǎng)發(fā)展
的關鍵證據(jù)
作品是學生完成挑戰(zhàn)性任務過程當中所形成的學習成果,也是學生重要素養(yǎng)發(fā)展的關鍵證據(jù)。
為什么這么說呢?作品集中展示了學生的理解和行動: 選擇做什么,表明他的價值取向; 怎么做的,反映他的思維過程和行為方式;做到什么程度,表明了他的潛能和個性品質(zhì)。
同時,作品具有整合性質(zhì),可涵蓋所有素養(yǎng)發(fā)展過程,而不限于標準化考試所能反映的內(nèi)容。比如,曹雪芹是個什么樣的人呢?我們可以從《紅樓夢》這個作品中找到答案。
這樣的學生作品,不同于一般的課堂作業(yè),而是屬于一種挑戰(zhàn)性任務。剛才提到,學習任務的特點是真實性、開放式、迭代性。同樣,在任務當中所形成的學習成果即作品,也有3 個特性。
第一,真實性。任務是真實的,作品也應該是真實的,反映了學生的真實想法和行動。
第二,專業(yè)性。在完成挑戰(zhàn)性任務時,學生要運用學科和專業(yè)領域的重要觀念、方式去分析解決;同時運用一定領域或者學科的表達方式,包括符號、語言,來呈現(xiàn)成果。這使得學生要像專家一樣思考問題、解決問題。
第三,迭代性。完成挑戰(zhàn)性任務一般不是一次性的,需要反復迭代更新,直到最后個人基本滿意為止。
那么,怎樣的學習成果,才算是作品呢?主要有以下四類。
一是閱讀筆記,致力于掌握給定的學科材料,做整理、歸納、比較、闡釋和評論。比如,圍繞某個專題的書籍資料進行整理,就是典型的閱讀筆記。
二是研究成果,即圍繞某個問題進行觀察、調(diào)查、實驗等,獲得規(guī)律性的認識。通常所說的研究性學習報告,就屬于研究成果。
三是創(chuàng)意表達,即圍繞感興趣的話題,運用多種媒介方法技術,進行個性化地設計、制作、表演、表達等。在高中,學生這方面的創(chuàng)意表達比較豐富多樣。
四是實踐報告,即走向社會、挑戰(zhàn)自我,完成特定目標任務過程的報告,包括改變自我和改變世界兩個方面。比如學生的志愿服務,就是反映學生是否具有一定的責任擔當,能否運用所學去完成任務、接受挑戰(zhàn)的重要證據(jù)。
圍繞關鍵證據(jù)
——作品的綜合評價
有了作品作為關鍵證據(jù),如何進行綜合評價呢?主要有三個環(huán)節(jié)。
第一個環(huán)節(jié),獲取作品;這是評價的基礎。
在課程實施過程中,設計有關項目任務,或者學生自定義項目,對作品形成、記錄過程做必要指導和規(guī)范。比如學生讀書,摘要和筆記可以設計規(guī)定的模板,包括什么時候讀什么書、主要內(nèi)容是什么、作者的觀點是什么、自己是怎么看的,等等。每個學生要在規(guī)定學習領域完成并提交作品。
第二個環(huán)節(jié),解釋作品。這是評價的關鍵和難點。
解釋作品可以有多方面的參照體系,包括學生個人成長經(jīng)歷、所處的社會文化環(huán)境等,以此來解讀作品的意義,對于重要素養(yǎng)的發(fā)展意味著什么,達到了什么目標,進階到了什么水平。
其中,最重要的參照是要有一定領域的通用量規(guī)。關于量規(guī),我舉一個例子。中國學生發(fā)展核心素養(yǎng)中,有一個素養(yǎng)是健康生活,如何來評價這一素養(yǎng)呢?有人把它分解成以下 6 個水平。
水平1:在指導下,我可以嘗試一些新的東西,看看我自己喜歡的程度。
水平2:在指導下,我可以嘗試一些新的東西,看看我自己喜歡的程度;我可以注意到,如果我吃了什么東西后感覺不舒服(如胃痛、皮疹、頭痛),我可以告訴別人。
水平3:我可以嘗試新的東西(如食物、活動、書籍),找出自己喜歡和不喜歡的東西;如果我周圍的東西或我吃過的東西讓我感覺到不舒服(如胃痛、頭痛),我可以開始注意到問題的規(guī)律,并告訴我的照顧者/或另一個我值得信賴的成年人。
水平5:我可以設定一個與鍛煉、營養(yǎng)或睡眠有關的個人目標,并實施一個或多個新的策略或習慣,以幫助我實現(xiàn)我的目標;我可以認識到導致不健康思想或行為的觸發(fā)因素和/或消極影響;我可以定期將時間投入到使我感到快樂、自豪或有使命感的關系和活動中;我可以調(diào)查哪些特定的身體不相容(如過敏原、糖類),我可以積極嘗試避免它們。
可以發(fā)現(xiàn),這個量規(guī)不是在空談健康管理,也不是很具體地談做法,比如要勤洗澡、勤刷牙等,而是介于兩者中間。同時,它的進階非常明晰明了。最后,它是從學生的口吻,通過非常通俗的語言來表達。
學生素養(yǎng)涉及很多方面,關于重要的素養(yǎng),能不能研制出通用、能理解的量規(guī)?這件事挑戰(zhàn)挺大,又相當重要。因為當下的評價,是一個項目設計一個量規(guī),不好用,不科學,看不出進階,彼此之間也不能比較。
第三個環(huán)節(jié),分享作品并改進后續(xù)學習;這是評價的歸屬。
具體來說,通過在線匯集、家校溝通會議等,促進學生思考“作品為什么是這個樣子”,從中反思改進自己的品質(zhì)、能力。教師也要從中反思:這個作品符合你的期待嗎?符合教育的期待嗎?符合素養(yǎng)的要求嗎?并在這個過程當中,與學生展開持續(xù)的對話。
總之,基于作品的綜合評價,指向重要素養(yǎng),比如文化理解、健康生活、高階思維等;學生自主把握,不是被動監(jiān)控;嵌入到課程實施過程當中,不是在課程在另搞一套;連貫一致,貫穿整個小學乃至中學全程。當然,基于作品的評價,也不是唯一的出路。
綜合評價是學生核心素養(yǎng)培育的一個重要支點,希望我們能通過這個支點來撬動教育的未來。
來源 | 整理自作者在2023小學課程周主題峰會的演講
作者 | 柳夕浪
責編 | 張凱
美編 | 姍姍
執(zhí)行主編 |安迪