我國已經(jīng)進入高質(zhì)量、內(nèi)涵式發(fā)展階段。黨的二十大報告,以及《教育事業(yè)發(fā)展“十四五”規(guī)劃》和《教育現(xiàn)代化2035行動綱要》,對我國未來教育特別是基礎(chǔ)教育發(fā)展提出高遠的目標。要實現(xiàn)教育2035目標,我國基礎(chǔ)教育在質(zhì)量、均衡性等方面仍面臨巨大挑戰(zhàn)。其中,評價作為撬動基礎(chǔ)教育乃至整個教育高質(zhì)量發(fā)展的一個杠桿,被賦予很高的期望和特別重要的作用。關(guān)于教育評價工作的現(xiàn)狀與前瞻,隨藝術(shù)素質(zhì)測評系統(tǒng)小編一起了解一下吧——
目前,我們的教育評價仍存在著一系列的問題,制約評價功能的有效發(fā)揮。例如,基礎(chǔ)教育評價還沒有全面體現(xiàn)德智體美勞全面發(fā)展的教育質(zhì)量觀;《深化新時代教育評價改革總體方案》特別強調(diào)“四個評價”,但迄今無論是過程性評價還是綜合性評價,都停留在理論、政策、實踐探討層面;對拔尖創(chuàng)新人才的選拔與培養(yǎng)、對有特殊需要學(xué)生的鑒別與指導(dǎo),也是當前教育評價的短板。
要從政策、管理、技術(shù)等不同角度思考如何解決這些問題,一個值得高度關(guān)注的角度是科技發(fā)展賦能教育監(jiān)測與評價,不斷更新和迭代教育監(jiān)測與評價的手段和方法。從廣義的角度看,教育數(shù)字化和教育的監(jiān)測和評價是一個雙向賦能的過程,公平教育、高質(zhì)量教育,包括適合人人教育,都有賴于更好地發(fā)揮教育評價的功能。
近年來,信息技術(shù)與教育監(jiān)測和評價融合發(fā)展取得一定進展,主要表現(xiàn)在以下八個方面。
第一,評價目標發(fā)生變化。隨著基礎(chǔ)教育課程改革的深化,在政策、學(xué)術(shù)、教育教學(xué)實踐領(lǐng)域,測量評價學(xué)生的核心素養(yǎng)成為共同關(guān)注的焦點問題。在高等教育領(lǐng)域,其功能已經(jīng)發(fā)生變化,高等教育不再以培養(yǎng)學(xué)生具有從事特定職業(yè)或者專業(yè)的基本技能為目標,轉(zhuǎn)向以培養(yǎng)學(xué)生適應(yīng)未來社會不斷變化的工作崗位和要求、更好生存和發(fā)展應(yīng)該具備的核心素養(yǎng)為目標。
第二,評價的信息越來越趨向使用多元化、多模態(tài)的數(shù)據(jù)。評價理論、信息技術(shù)改進評價方法的內(nèi)在研究尚有待進一步拓寬和深化,但評價數(shù)據(jù)的多元化已成為大家普遍關(guān)注或普遍發(fā)生的現(xiàn)象。
第三,過程性評價和結(jié)果性行評價越來越趨于融合。隨著信息技術(shù)、人工智能的飛速發(fā)展,二者之間的二元對立已經(jīng)被打破和消解。在任何一個時間點上,可以把評價看成是一個結(jié)果性評價,但把不同的時間點串連起來,它本身就成為過程性評價。當前,所有服務(wù)于學(xué)生發(fā)展、學(xué)校管理的評價體現(xiàn)出終結(jié)性和過程性融合的特征。
第四,評價的任務(wù)和體驗越來越強調(diào)真實性、情景化和趣味化。隨著素養(yǎng)導(dǎo)向的課程改革的持續(xù)推進,考試和招生制度的重點集中在考試內(nèi)容改革上,命制能力和素養(yǎng)立意的題目成為不斷探索的方向,強調(diào)測試題目的真實性、情景化成為共識,還出現(xiàn)基于網(wǎng)絡(luò)和計算機的交互式測評、游戲化測評以及基于AR和VR技術(shù)的測評等。
第五,伴隨式的數(shù)據(jù)采集和自動挖掘越來越多地被應(yīng)用到評價過程中。評價不再是傳統(tǒng)意義上的紙筆測試和問卷調(diào)查,問卷的形式呈現(xiàn)出越來越多的新樣態(tài),數(shù)據(jù)加工和提取也出現(xiàn)一些新的模式和做法。
第六,評價結(jié)果的反饋越來越強調(diào)個性化的即時反饋。利用人工智能和大數(shù)據(jù)挖掘技術(shù),一些評價結(jié)果得到即時反饋。
第七,評價結(jié)果的應(yīng)用越來越強調(diào)精準改進。隨著信息化、智能化進程的加速,面向群體發(fā)展、精準進行個體改進和調(diào)整成為這個階段教育評價項目普遍關(guān)注的焦點。
第八,評價服務(wù)于教育決策的智能化要求越來越高。評價服務(wù)于決策,也是國家推動教育信息化和數(shù)字化的一項重要任務(wù)。
未來一段時期,要從以下4個方面關(guān)注技術(shù)賦能教育評價的發(fā)展方向。
第一,全力構(gòu)建學(xué)評融合的教育評價新理論。人工智能和大模型等新技術(shù)使教育評價發(fā)生重大變化,傳統(tǒng)的評價理論已經(jīng)不能很好地解釋這一系列變化。從教育評價和未來教育的角度來看,需要建構(gòu)基于學(xué)習(xí)和評價融合的新的評價理論,把握目前評價手段的升級換代,引領(lǐng)教育評價的技術(shù)發(fā)展,更好服務(wù)于整個育人模式和育人環(huán)境的調(diào)整。
第二,充分利用人工智能和大模型技術(shù),系統(tǒng)解決教育評價面臨的關(guān)鍵難題,特別是過程性評價、實時評價的難題。信息技術(shù)的飛速發(fā)展,包括生成式大模型的出現(xiàn),網(wǎng)絡(luò)化、智能化的學(xué)習(xí)與教學(xué),遠程的教學(xué)機器人,陪伴式的學(xué)習(xí)機器人,均表現(xiàn)出廣闊的發(fā)展前景。要把它真正轉(zhuǎn)化到教育場景中,要真正應(yīng)用這些可能的技術(shù),就要從技術(shù)、理論、方法和實踐四個方面共同進行探索。
第三,充分利用技術(shù)進步,全力更新和升級評價方法。評價技術(shù)的升級不是簡單地把信息技術(shù)引進來,還要面對一系列核心技術(shù)難題。如何融合信息技術(shù),真正實現(xiàn)個性化、情感化和測評過程交互式,需要大家共同努力破解。
第四,高度關(guān)注新型評價技術(shù)與方法的信度和效度及其倫理問題。鑒于教育、學(xué)習(xí)評價的復(fù)雜性,對科技賦能教育評價所產(chǎn)生的新技術(shù)與方法的可靠性、有效性,需要積累大量證據(jù)加以驗證。在研究、應(yīng)用新的評價手段時,要高度重視人工智能和大數(shù)據(jù)、大模型的應(yīng)用本身所產(chǎn)生的個人隱私保護等倫理問題。
作者:辛濤,北京師范大學(xué)中國基礎(chǔ)教育質(zhì)量監(jiān)測協(xié)同創(chuàng)新中心主任,教授。
來源:原文刊載于《中國考試》2024年第1期第21—22頁,為專家筆談系列第十篇文章。
版權(quán)聲明:本文為轉(zhuǎn)載文章,版權(quán)歸原作者及原出處所有,如有侵權(quán),請權(quán)利方及時與我們聯(lián)系,我們將及時更正、刪除。