教育評價(jià)數(shù)字化轉(zhuǎn)型既是信息化時(shí)代教育事業(yè)發(fā)展的重要內(nèi)容,也是疫情常態(tài)化背景下教學(xué)實(shí)踐倒逼評價(jià)改革的迫切要求。具體教育評價(jià)數(shù)字化轉(zhuǎn)型內(nèi)容快跟著信息技術(shù)考試系統(tǒng)的小編來看看吧~
教育評價(jià)數(shù)字化轉(zhuǎn)型應(yīng)遵循真實(shí)性、通用性、自動(dòng)性、形成性及安全性原則,從效度、公平、效率、個(gè)性、道德5個(gè)層面規(guī)約改革實(shí)踐行為。網(wǎng)上評閱系統(tǒng)、自適應(yīng)評判系統(tǒng)、數(shù)字評估與反饋系統(tǒng)等相對成熟的評價(jià)技術(shù),在優(yōu)化教育評價(jià)程序、革新評價(jià)方法、整合評價(jià)資源等方面取得明顯成效。教育評價(jià)數(shù)字化將向主體多元化、工具智能化、方式多樣化與功能實(shí)效化方向發(fā)展。
隨著人工智能、大數(shù)據(jù)等現(xiàn)代信息技術(shù)的發(fā)展,教育進(jìn)入以信息智能文明為特征的4.0時(shí)代。2022年2月,教育部部長懷進(jìn)鵬在部黨組理論學(xué)習(xí)中心組集體學(xué)習(xí)會議上指出,習(xí)近平總書記高度重視信息化建設(shè)和數(shù)字經(jīng)濟(jì)、數(shù)字中國建設(shè)發(fā)展,多次強(qiáng)調(diào)數(shù)字化、網(wǎng)絡(luò)化、智能化在中國特色社會主義現(xiàn)代化建設(shè)中的重要意義,教育系統(tǒng)要深入學(xué)習(xí)領(lǐng)會,認(rèn)真貫徹落實(shí),把教育信息化作為發(fā)展的戰(zhàn)略制高點(diǎn),以教育信息化推動(dòng)教育高質(zhì)量發(fā)展,以教育信息化引領(lǐng)教育現(xiàn)代化[1]?!督逃?022年工作要點(diǎn)》中明確提出實(shí)施教育數(shù)字化戰(zhàn)略行動(dòng)?!渡罨聲r(shí)代教育評價(jià)改革總體方案》強(qiáng)調(diào),要充分利用信息技術(shù),提高教育評價(jià)的科學(xué)性、專業(yè)性、客觀性[2]。所有這些要求都呼喚教育評價(jià)向數(shù)字化轉(zhuǎn)型,而疫情常態(tài)化更是加速了在線考試、數(shù)字化評價(jià)的發(fā)展。教育評價(jià)數(shù)字化轉(zhuǎn)型既是信息化時(shí)代教育事業(yè)發(fā)展的重要內(nèi)容,也是疫情常態(tài)化背景下教學(xué)實(shí)踐倒逼教育評價(jià)改革的迫切要求。本文圍繞教育評價(jià)數(shù)字化轉(zhuǎn)型的基本原則、應(yīng)用場域與發(fā)展方向3個(gè)問題,結(jié)合國內(nèi)外教育評價(jià)數(shù)字化建設(shè)的成果與探索,嘗試從價(jià)值、技術(shù)與實(shí)踐3個(gè)層面勾畫我國教育評價(jià)數(shù)字化轉(zhuǎn)型的發(fā)展圖景。
教育評價(jià)數(shù)字化轉(zhuǎn)型的基本原則是由教育評價(jià)的本質(zhì)屬性所決定的,是教育評價(jià)數(shù)字化轉(zhuǎn)型需要明確的首要問題。參考英國聯(lián)合信息系統(tǒng)委員會(Joint Information Systems Committee,JISC)2020年發(fā)布的《評價(jià)的未來:2025年的5項(xiàng)原則與目標(biāo)》(The Future of Assessment: Five Prin ciples, Five Targets for 2025)[3],數(shù)字化時(shí)代的教育評價(jià)應(yīng)遵循真實(shí)性、通用性、自動(dòng)性、形成性與安全性原則[3],從效度、公平、效率、個(gè)性、道德5個(gè)層面規(guī)約改革實(shí)踐行為。
1.1 真實(shí)性原則是教育評價(jià)數(shù)字化轉(zhuǎn)型的效度保證
真實(shí)性指反映事物真實(shí)情況的程度,是教育評價(jià)數(shù)字化轉(zhuǎn)型的效度保證。真實(shí)性原則意味著讓學(xué)習(xí)者在評價(jià)過程中展現(xiàn)出最自然的狀態(tài),使教育評價(jià)能夠測試出學(xué)習(xí)者的真實(shí)水平。
信息技術(shù)有助于提高教育評價(jià)的真實(shí)性。以人機(jī)互動(dòng)為特征的在線考試,為學(xué)習(xí)者創(chuàng)造的網(wǎng)上私密空間,能夠在一定程度上消解學(xué)習(xí)者的緊張情緒。特別是在面試環(huán)節(jié),以計(jì)算機(jī)為中介進(jìn)行的互動(dòng)過程極大減輕了一部分面試者的心理負(fù)擔(dān),有利于學(xué)習(xí)者展現(xiàn)出最真實(shí)的水平與狀態(tài)。利用信息技術(shù)實(shí)現(xiàn)的即時(shí)評價(jià),也突破了傳統(tǒng)教育評價(jià)的時(shí)空限制,實(shí)時(shí)監(jiān)控與行為識別功能可以對學(xué)習(xí)者的學(xué)習(xí)過程進(jìn)行及時(shí)反饋與糾正。然而,信息技術(shù)無形中也帶來了影響評價(jià)真實(shí)性的一些風(fēng)險(xiǎn)因素,其中以考試作弊最為典型。疫情常態(tài)化背景下在線考試作弊事件頻發(fā),如:2020年12月初美國德州農(nóng)工大學(xué)800多名考生購買齊格(Chegg)公司服務(wù),在課程考試中作弊;疫情期間英國大學(xué)生作弊率升高200%,并且出現(xiàn)了代考產(chǎn)業(yè)鏈,每次費(fèi)用約250~300英鎊[4]。
1.2 通用性原則是教育評價(jià)數(shù)字化轉(zhuǎn)型的公平應(yīng)允
通用性指事物適用對象與范圍的普及程度,是教育評價(jià)數(shù)字化轉(zhuǎn)型的重要追求。通用性原則要求數(shù)字化教育評價(jià)工具最大程度上為所有學(xué)習(xí)者無差別使用,這是出于保證教育公平的考量。
常用的數(shù)字技術(shù)通用性功能包括字體大小、顏色的更改、語音到文本和文本到語音的轉(zhuǎn)換,以支持有視力或閱讀障礙的學(xué)習(xí)者。一些發(fā)達(dá)國家已經(jīng)意識到教育評價(jià)工具通用性的重要價(jià)值,如:英國明確了公共部門網(wǎng)站與移動(dòng)應(yīng)用程序的通用標(biāo)準(zhǔn),并在法律層面作出相應(yīng)規(guī)定;挪威在《國家指南》(Norway National Guidance)中建議大學(xué)在數(shù)字評價(jià)上采用屏幕閱讀器或放大鏡技術(shù)、可刷新的盲文顯示器和眼控技術(shù)、全功能的語音控制選項(xiàng)、支持語音合成的閱讀和寫作、支持所有官方語言的音頻輸出等,以便在最大范圍內(nèi)讓每個(gè)人都可以便捷使用[3]。但是,總體來看,教育評價(jià)領(lǐng)域?qū)ぞ咄ㄓ眯缘年P(guān)注仍然不夠,通用性原則并不總是作為檢測教育評價(jià)工具可否交付使用的前提標(biāo)準(zhǔn)。因而,通用性原則要求教育評價(jià)技術(shù)工具在設(shè)計(jì)階段就應(yīng)考慮殘疾人、弱勢群體等特殊背景學(xué)習(xí)者的特別需求,以保證所有學(xué)習(xí)者的無差別體驗(yàn),避免數(shù)字評價(jià)可能帶來新一輪教育不公平風(fēng)險(xiǎn)。
1.3 自動(dòng)性原則是教育評價(jià)數(shù)字化轉(zhuǎn)型的效率要求
自動(dòng)性指評價(jià)工具按照特定規(guī)則與程序運(yùn)行的自動(dòng)化程度,是技術(shù)革新促進(jìn)教育評價(jià)智能化的直接體現(xiàn)。自動(dòng)性原則意味著信息技術(shù)將教師從簡單重復(fù)的活動(dòng)中解放出來,通過技術(shù)工具實(shí)現(xiàn)對學(xué)習(xí)者的自動(dòng)評價(jià)。
傳統(tǒng)教育評價(jià)以人工評閱為主,為教師增添了不少負(fù)擔(dān)。通過技術(shù)優(yōu)化實(shí)現(xiàn)的自動(dòng)化評價(jià)可以改善學(xué)習(xí)者的學(xué)習(xí)體驗(yàn),并為教師節(jié)省出時(shí)間去做更有價(jià)值的工作。2019年,英國在教育科技戰(zhàn)略議程中將利用信息技術(shù)減少教師準(zhǔn)備和批改作業(yè)的時(shí)間列為要解決的重要問題之一[5]。目前,選擇類客觀題型的自動(dòng)評閱技術(shù)臻于成熟,還需要進(jìn)一步將自動(dòng)評閱功能擴(kuò)展到涉及自然語言處理和分類的主觀題型,為學(xué)習(xí)者提供精確及時(shí)的學(xué)習(xí)反饋。英國博爾頓大學(xué)在教學(xué)中試用亞馬遜、谷歌和微軟等公司提供的自然語言處理和分類技術(shù),教師和學(xué)生都給予積極回應(yīng)。學(xué)生喜歡在回答開放式問題時(shí)收到及時(shí)反饋,教師表示自動(dòng)化評價(jià)工具極大減輕了評分工作量[3]。值得注意的是,業(yè)界仍然擔(dān)憂數(shù)字教育評價(jià)自動(dòng)化發(fā)展可能會減少學(xué)習(xí)者與教師的互動(dòng),以及信息技術(shù)能夠在多大程度完全取代人工評判。因此,自動(dòng)性原則要求在利用信息技術(shù)提升評價(jià)效率的同時(shí),也要循序漸進(jìn),把握好自動(dòng)化評價(jià)的尺度。
1.4 形成性原則是教育評價(jià)數(shù)字化轉(zhuǎn)型的個(gè)性需求
形成性指成為某種事物或生成某種特性的發(fā)展變化過程。形成性原則是信息化時(shí)代為學(xué)習(xí)者提供持續(xù)性、定制化教育評價(jià)的要求,也是適應(yīng)學(xué)習(xí)者終身學(xué)習(xí)的需要。
信息技術(shù)使形成性評價(jià)更為便利,極大推動(dòng)了循證教育評價(jià)的進(jìn)程。教育評價(jià)數(shù)字化轉(zhuǎn)型的形成性原則要求教育評價(jià)根植于學(xué)習(xí)者的學(xué)習(xí)過程,將教育評價(jià)作為觀察、反思、改善學(xué)習(xí)者學(xué)習(xí)行為的依據(jù)憑證。例如,荷蘭的量化學(xué)生(Quantified Student)項(xiàng)目,通過開發(fā)一系列應(yīng)用程序?qū)崿F(xiàn)對學(xué)習(xí)者的實(shí)時(shí)學(xué)情分析,讓學(xué)習(xí)者更好了解他們自己的學(xué)習(xí)行為,并將其與同齡人進(jìn)行比較,幫助學(xué)習(xí)者管理學(xué)習(xí)過程[3]。在形成性原則指導(dǎo)下,以往對學(xué)習(xí)者進(jìn)行的統(tǒng)一定期評價(jià)可能會被基于學(xué)習(xí)者需要的非定期教育評價(jià)所取代,使數(shù)字化教育評價(jià)真正滿足學(xué)習(xí)者的個(gè)性化需求,促進(jìn)學(xué)習(xí)者的形成性發(fā)展。
1.5 安全性原則是教育評價(jià)數(shù)字化轉(zhuǎn)型的道德檢視
安全性是規(guī)范教育評價(jià)相關(guān)行為的底線要求。安全性原則從道德層面檢視教育評價(jià)數(shù)字化轉(zhuǎn)型,主要包括防止考生作弊的考試過程安全與防止教育評價(jià)數(shù)據(jù)誤用的信息資源安全。
防止在線考試作弊的常用方法包括對考生面部或指紋等生物特征的數(shù)據(jù)識別,以及對考生異常反應(yīng)模式的數(shù)據(jù)取證。異常反應(yīng)模式取證將考試活動(dòng)視為一個(gè)整體時(shí)間序列,假設(shè)大多數(shù)考生會在相對均勻的時(shí)間內(nèi)思考與作答,作弊則表現(xiàn)出不同的行為模式,如會出現(xiàn)一段時(shí)間不活動(dòng),隨之又有大量答案材料輸入的現(xiàn)象,以此識別出考試中的異常情況。還有研究者認(rèn)為,擊鍵動(dòng)力學(xué)(keystroke dynamics)是高度個(gè)性化的“指紋”,可以辨別考生身份與答題風(fēng)格[6]。防止數(shù)據(jù)誤用的信息資源安全也是教育評價(jià)數(shù)字化轉(zhuǎn)型需要關(guān)注的一個(gè)重要問題。教育評價(jià)數(shù)據(jù)作為學(xué)習(xí)者的私人信息,也是改善教育方式與教學(xué)方法的重要數(shù)據(jù)資源。明確教育評價(jià)數(shù)據(jù)使用、傳播的相關(guān)規(guī)定,既是保護(hù)學(xué)習(xí)者個(gè)人隱私安全的必然要求,也是數(shù)字化教育評價(jià)有序發(fā)展的重要保障。
信息技術(shù)是教育評價(jià)數(shù)字化轉(zhuǎn)型的重要載體與媒介,在一定程度上決定了教育評價(jià)數(shù)字化轉(zhuǎn)型的應(yīng)用場域與范圍。國內(nèi)外相對成熟的數(shù)字化教育評價(jià)技術(shù)包括網(wǎng)上評閱系統(tǒng)、自適應(yīng)評判系統(tǒng)、數(shù)字評估與反饋系統(tǒng)等。這些技術(shù)及場景已應(yīng)用到各類教育評價(jià)實(shí)踐活動(dòng)中,在優(yōu)化評價(jià)程序、革新評價(jià)方法、整合評價(jià)資源等方面取得了明顯成效。
2.1 網(wǎng)上評閱系統(tǒng)優(yōu)化教育評價(jià)程序
傳統(tǒng)人工閱卷存在評卷速度慢、效率低,錄分統(tǒng)計(jì)與數(shù)據(jù)分析困難,閱卷質(zhì)量與公平性難以保證等問題。2005年,教育部下發(fā)通知,要求各地推廣網(wǎng)上閱卷系統(tǒng),最大限度地減少評分誤差,提高工作效率,保證閱卷工作的穩(wěn)定性和可靠性[7]。2007年,教育部頒布《國家教育統(tǒng)一考試網(wǎng)上評卷工作管理辦法》,對答題卡的設(shè)計(jì)、印刷、運(yùn)送和保管、評卷工作的組織管理、數(shù)據(jù)的安全和管理、網(wǎng)上評卷的環(huán)境和設(shè)備及技術(shù)維護(hù)等涉及網(wǎng)上評卷工作的重要事項(xiàng)提出了要求[8]。
作為教育評價(jià)數(shù)字化轉(zhuǎn)型最為基礎(chǔ)的技術(shù)工具之一,網(wǎng)上評閱系統(tǒng)經(jīng)過10多年的發(fā)展取得長足進(jìn)步。以我國科大訊飛網(wǎng)上評閱系統(tǒng)為例,訊飛啟明智能閱卷系統(tǒng)主要由數(shù)據(jù)掃描系統(tǒng)、自動(dòng)評分系統(tǒng)、網(wǎng)上評卷系統(tǒng)與數(shù)據(jù)監(jiān)控系統(tǒng)構(gòu)成,以計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)與圖像處理技術(shù),以及自然語言理解、智能測評等人工智能技術(shù)為依托,對各類考試答卷和文檔進(jìn)行掃描和處理,實(shí)現(xiàn)了客觀題機(jī)器自動(dòng)判定和主觀題智能評分[9]。目前,訊飛啟明智能閱卷系統(tǒng)已在多個(gè)省份的高考、中考、自學(xué)考試及社會證書考試中得到應(yīng)用。
網(wǎng)上評閱系統(tǒng)通過人工智能技術(shù)優(yōu)化教育評價(jià)程序,在提升效率的同時(shí)保證教育評價(jià)的質(zhì)量與公平。第一,網(wǎng)上閱卷系統(tǒng)通過客觀題自動(dòng)批閱與主觀題輔助評閱,能夠加快評分過程,降低教育評價(jià)組織成本,減少閱卷人員的簡單重復(fù)勞動(dòng),極大減輕閱卷人員的工作量,從而明顯提升教育評價(jià)效率。第二,以往在主觀題型的評分過程中,閱卷人員會不可避免地受到諸如考生書面印象、評分進(jìn)度等非客觀因素影響,網(wǎng)上評閱系統(tǒng)智能化的評分過程則不受人為干擾,能夠保證教育評價(jià)的公平公正。第三,網(wǎng)上評閱系統(tǒng)對于考試分?jǐn)?shù)與等級的自動(dòng)計(jì)算與統(tǒng)計(jì),能夠保證考試計(jì)分的準(zhǔn)確性。第四,基于卷面信息提供多維度、精細(xì)化的數(shù)據(jù)分析,有助于提升教育評價(jià)質(zhì)量,持續(xù)改進(jìn)評價(jià)結(jié)果。有研究表明,智能機(jī)器閱卷與人工閱卷在評分結(jié)果的準(zhǔn)確性上相差無幾,但在效率、質(zhì)量和公平上,前者更勝一籌。例如,有研究者選取2017年安徽省841610份高考語文作文和英語作文試卷,對智能閱卷與人工網(wǎng)上評卷進(jìn)行多維度的數(shù)據(jù)比較,發(fā)現(xiàn)智能閱卷基本達(dá)到與評卷教師相當(dāng)?shù)乃?;而智能閱卷始終嚴(yán)格按照統(tǒng)一的評分標(biāo)準(zhǔn),更具客觀公正性,還能為人工網(wǎng)上評卷提供有效的質(zhì)量監(jiān)控[10]。
2.2 自適應(yīng)評判系統(tǒng)革新教育評價(jià)方法
傳統(tǒng)評價(jià)方法通常參照一定的標(biāo)準(zhǔn),更多時(shí)候是依據(jù)標(biāo)準(zhǔn)來進(jìn)行評價(jià)的。不少學(xué)者對這種參考固定標(biāo)準(zhǔn)的絕對化評價(jià)提出質(zhì)疑,開始尋覓一條比較判斷的評價(jià)之路。通過借鑒美國芝加哥大學(xué)心理學(xué)教授 Thurstone提出的比較判斷定律,Pollitt將比較判斷法引入教育評價(jià),最終形成基于網(wǎng)絡(luò)的自適應(yīng)評判系統(tǒng)[11]。
自適應(yīng)評判系統(tǒng)的核心技術(shù)是適應(yīng)性比較判斷(adaptive comparative judgement),主要依據(jù)自適應(yīng)算法,在不參考標(biāo)準(zhǔn)的情況下,根據(jù)特定算法向考官展示考生的成對作品,要求他們判斷哪一個(gè)更好,以此往復(fù)形成對考試作品更直觀的相對評價(jià)與整體判斷。適應(yīng)性比較判斷對于有明確標(biāo)準(zhǔn)答案的評價(jià)項(xiàng)目作用有限,但對寫作、設(shè)計(jì)等復(fù)雜主題和開放創(chuàng)意性題目非常適用。2009年底,Pollitt組織54名專家利用自適應(yīng)評判系統(tǒng)評閱學(xué)生寫作作業(yè),每份作業(yè)在被比較16次后所得分?jǐn)?shù)的可靠性系數(shù)達(dá)到0.96,遠(yuǎn)高于其他評價(jià)方法;進(jìn)一步測驗(yàn)表明,每份作業(yè)進(jìn)行約9次比較判斷后,所得分?jǐn)?shù)的可靠性系數(shù)能達(dá)到0.93[11]。
自適應(yīng)評判系統(tǒng)的技術(shù)魅力在于使教育評價(jià)活動(dòng)更加專業(yè),并且重新調(diào)整了評價(jià)與學(xué)習(xí)之間的關(guān)系。教師與學(xué)生在自適應(yīng)評判系統(tǒng)的引導(dǎo)下,將教育評價(jià)變?yōu)閹熒餐瑢W(xué)習(xí)過程。學(xué)生通過將自己的作業(yè)與更好或更差的相比較,可以更直觀地感受到什么是好、什么是差,以及為什么好和為什么差,對他們來說這是通過比較判斷獲得同輩經(jīng)驗(yàn)的學(xué)習(xí)過程。例如,美國普渡大學(xué)(Purdue University)在技術(shù)設(shè)計(jì)思維課的550名一年級學(xué)生中,隨機(jī)選擇一半學(xué)生參加使用適應(yīng)性比較判斷的教育評價(jià)試驗(yàn),結(jié)果顯示:學(xué)生在與同輩和教師的合作中成功提高了課程成績,評價(jià)過程變成一種學(xué)習(xí)過程[12]。教師在適應(yīng)性比較判斷的過程中,可以更細(xì)致地觀察到不同學(xué)生在不同任務(wù)中的表現(xiàn),有助于優(yōu)化課程設(shè)計(jì)。教師還可以將自己的判斷與其他學(xué)校教師的判斷進(jìn)行比較,也有助于教師的專業(yè)發(fā)展,正如英國一所小學(xué)在聯(lián)合14所學(xué)校采用自適應(yīng)比較判斷法對學(xué)生寫作進(jìn)行評價(jià)后,該校校長指出:適應(yīng)性比較判斷有助于提高學(xué)習(xí)者的學(xué)業(yè)水平與教師的判斷力,他們對高質(zhì)量的寫作有了更清晰的認(rèn)識,促進(jìn)了不同學(xué)校教師之間的專業(yè)對話[13]。
2.3 數(shù)字評估與反饋系統(tǒng)整合教育評價(jià)資源
傳統(tǒng)評價(jià)過程大多是以評價(jià)者為中心的單向度反饋。學(xué)習(xí)者只收到零散評價(jià)信息,很少根據(jù)評價(jià)結(jié)果作出進(jìn)一步行動(dòng)。數(shù)字評估與反饋系統(tǒng)將評價(jià)結(jié)果整合成教育評價(jià)數(shù)據(jù)資源庫,通過對評價(jià)數(shù)據(jù)的整理與分類,幫助學(xué)生制訂符合其學(xué)習(xí)需求的行動(dòng)計(jì)劃,并就相應(yīng)的學(xué)習(xí)資源提出建議,充分發(fā)揮學(xué)習(xí)者在教育評價(jià)過程中的能動(dòng)作用。
英國薩里大學(xué)(University of Surrey)的Winstone博士團(tuán)隊(duì)開發(fā)的反饋參與和追 蹤系統(tǒng)(Feedback Engagement and Tracking System)[14]是數(shù)字評估與反饋系統(tǒng)應(yīng)用的知名案例。該系統(tǒng)獲得了英國員工和教育發(fā)展協(xié)會(The Staff and Educational Development Association)頒發(fā)的2018年度教育發(fā)展倡議獎(jiǎng)(Educational Development Initiative of the Year Award)。反饋參與和追蹤系統(tǒng)包括查看反饋、瀏覽資源與制訂行動(dòng)計(jì)劃3大板塊。查看反饋部分匯集了學(xué)習(xí)者終結(jié)性評價(jià)、形成性評價(jià)、同伴評價(jià)與自我評價(jià)的所有數(shù)據(jù)信息,為學(xué)習(xí)者自動(dòng)分析評價(jià)結(jié)果,明確顯示其需要改進(jìn)的地方,并根據(jù)評價(jià)結(jié)果為學(xué)習(xí)者提供發(fā)展技能評估,以幫助了解他們的發(fā)展優(yōu)勢與不足。瀏覽資源部分是為學(xué)習(xí)者技能發(fā)展提供的資源庫。學(xué)習(xí)者選擇想要學(xué)習(xí)的技能,資源庫自動(dòng)匹配技能發(fā)展需要的學(xué)術(shù)資源。在制訂行動(dòng)計(jì)劃部分,學(xué)習(xí)者可以創(chuàng)建一個(gè)個(gè)行動(dòng)計(jì)劃,選擇計(jì)劃完成的階段性目標(biāo)與最終日期,系統(tǒng)就會根據(jù)學(xué)習(xí)者制定的行動(dòng)計(jì)劃顯示相應(yīng)的完成進(jìn)度。反饋參與和追蹤系統(tǒng)配備的成績追蹤器,還能對學(xué)習(xí)者的學(xué)習(xí)情況進(jìn)行智能追蹤與分析,根據(jù)學(xué)習(xí)者的發(fā)展優(yōu)勢與需求提供個(gè)性化的學(xué)習(xí)建議。針對臨近畢業(yè)的高年級學(xué)生,反饋參與和追蹤系統(tǒng)依據(jù)大量評價(jià)數(shù)據(jù),為學(xué)生提供相應(yīng)的職業(yè)建議與職業(yè)素養(yǎng)培養(yǎng)方案,以此提高畢業(yè)生的就業(yè)能力。Winstone博士指出,以前許多學(xué)生收到評價(jià)反饋后,評價(jià)過程隨之終止;現(xiàn)在通過反饋參與和追蹤系統(tǒng),學(xué)生可以根據(jù)評價(jià)結(jié)果把控自己的學(xué)習(xí)過程,推動(dòng)自己的學(xué)業(yè)發(fā)展[14]??傊?,數(shù)字評估與反饋系統(tǒng)是整合學(xué)習(xí)者教育評價(jià)資源的平臺,將評價(jià)與學(xué)習(xí)更緊密結(jié)合起來。學(xué)習(xí)者可以借助教育評價(jià)結(jié)果與相關(guān)學(xué)習(xí)資源,不斷反思學(xué)習(xí)過程,改進(jìn)學(xué)習(xí)方法,實(shí)現(xiàn)持續(xù)發(fā)展與進(jìn)步。
從國內(nèi)外教育評價(jià)改革實(shí)踐來看,數(shù)字化信息技術(shù)的應(yīng)用為教育評價(jià)帶來嶄新面貌,推動(dòng)教育評價(jià)向著主體多元化、工具智能化、方式多樣化與功能實(shí)效化的方向發(fā)展,將逐步實(shí)現(xiàn)家校社企參與的協(xié)同評價(jià)、人機(jī)交互協(xié)作的精準(zhǔn)評價(jià)、關(guān)注學(xué)習(xí)過程的智慧評價(jià)與彰顯本體價(jià)值的發(fā)展評價(jià)。
3.1 從以教師評價(jià)為主走向家校社企參與的協(xié)同評價(jià),評價(jià)主體日益多元
教育評價(jià)主體是回答誰來評價(jià)的問題,誰來評價(jià)關(guān)乎教育評價(jià)權(quán)的歸屬。以往以教師為代表的校方掌握教育評價(jià)權(quán),學(xué)習(xí)者處于被評價(jià)的位置,家長、社會、企業(yè)等主體的參與感不強(qiáng)。信息技術(shù)的發(fā)展與應(yīng)用使得評價(jià)主體多元化成為可能,家校社企參與的協(xié)同評價(jià)變成教育評價(jià)數(shù)字化轉(zhuǎn)型的重要追求。
家校社企參與的協(xié)同評價(jià)意味著教育評價(jià)立場的轉(zhuǎn)變,“教育評價(jià)是一種價(jià)值判斷,表征教育活動(dòng)之于主體需要的滿足程度。”[15]不同利益主體對教育評價(jià)的需求側(cè)重有所不同。長期以來,學(xué)生、家長、社會與企業(yè)在教育評價(jià)中未能充分發(fā)揮作用,以學(xué)校為單一主體的評價(jià)機(jī)制不利于協(xié)調(diào)各利益主體的需求與意見。特別是在職業(yè)教育評價(jià)中,作為職業(yè)教育的重要利益相關(guān)者,行業(yè)與企業(yè)對職業(yè)人才素質(zhì)的要求在一定程度上決定著職業(yè)教育評價(jià)的內(nèi)容與發(fā)展方向,將行業(yè)與企業(yè)納入評價(jià)主體是改進(jìn)職業(yè)教育質(zhì)量的必要措施。
3.2 從以人工評價(jià)為主走向人機(jī)交互協(xié)作的精準(zhǔn)評價(jià),評價(jià)工具更加智能
教育評價(jià)工具是關(guān)于如何評價(jià)的問題。評價(jià)工具智能化是教育評價(jià)數(shù)字化轉(zhuǎn)型的顯著特征之一。從以人工評價(jià)為主到人機(jī)交互協(xié)作的精準(zhǔn)評價(jià),是信息技術(shù)發(fā)展推動(dòng)教育評價(jià)變革的必然結(jié)果。
當(dāng)前,智能化教育評價(jià)工具的發(fā)展還停留在相對簡單的人機(jī)交互協(xié)作階段,存在依靠機(jī)器的完全自動(dòng)化評價(jià)、機(jī)器輔助的半自動(dòng)化評價(jià)及機(jī)器檢測教育評價(jià)質(zhì)量等應(yīng)用模式。其中,機(jī)器檢測教育評價(jià)質(zhì)量是通過對評價(jià)數(shù)據(jù)的統(tǒng)計(jì)分析,觀測評價(jià)者在教育評價(jià)中的穩(wěn)定性與準(zhǔn)確度,以此判斷評價(jià)者的評價(jià)水平。目前,國內(nèi)外教育評價(jià)數(shù)字化實(shí)踐更多使用的是機(jī)器輔助的半自動(dòng)化評價(jià)模式,距離完全自動(dòng)化評價(jià)尚有一定距離,但可以肯定的是,評價(jià)工具智能化的發(fā)展前景值得期許。在人工智能技術(shù)持續(xù)發(fā)展與不斷革新的將來,以人工智能加持的教育信息技術(shù)可以在教育評價(jià)中完全代替人的判斷,達(dá)到比人工評價(jià)更準(zhǔn)確的評價(jià)效果,實(shí)現(xiàn)更深層次、更優(yōu)體驗(yàn)的人機(jī)交互協(xié)作的精準(zhǔn)評價(jià)。
3.3 從以結(jié)果評價(jià)為主走向關(guān)注學(xué)習(xí)過程的智慧評價(jià),評價(jià)方式更為多樣
教育評價(jià)方式是關(guān)于作何評價(jià)的問題。隨著教育評價(jià)數(shù)字化轉(zhuǎn)型,以結(jié)果評價(jià)為主的教育評價(jià)方式將轉(zhuǎn)變?yōu)樵\斷性、形成性、總結(jié)性、增值性評價(jià)相結(jié)合,形成重點(diǎn)關(guān)注學(xué)習(xí)者學(xué)習(xí)過程的智慧評價(jià)。
智慧評價(jià)的關(guān)鍵在于將評價(jià)扎根于學(xué)習(xí)者的學(xué)習(xí)過程,通過對學(xué)習(xí)者思維動(dòng)態(tài)與行為過程的實(shí)時(shí)監(jiān)控,實(shí)現(xiàn)即時(shí)評價(jià)與反饋。JISC提出,人工智能不僅能夠?yàn)閷W(xué)習(xí)者定制符合他們能力與需求的學(xué)習(xí)內(nèi)容,還能夠理解他們學(xué)習(xí)過程中的行為動(dòng)機(jī)與心理變化,總結(jié)出學(xué)習(xí)者的固定思維方式與行動(dòng)步驟[3]。另外,關(guān)注學(xué)習(xí)過程的智慧評價(jià)能夠超越“抽象的人”,將教育評價(jià)落實(shí)到“具體的人”,即“將人視為一種獨(dú)特的生命,強(qiáng)調(diào)完整的人、參與的人與個(gè)性化的人,突出評價(jià)的全面性、真實(shí)性及欣賞性,追求教育評價(jià)的平易近人,促使人的完整價(jià)值真正實(shí)現(xiàn)”[16]。總之,智慧評價(jià)將評價(jià)落實(shí)到每一個(gè)人與具體的學(xué)習(xí)過程,圍繞學(xué)習(xí)者特點(diǎn)與需求,對學(xué)習(xí)動(dòng)態(tài)進(jìn)行實(shí)時(shí)監(jiān)控,并輔以多種評價(jià)方法開展評價(jià)。
3.4 從以工具性評價(jià)為主走向彰顯本體價(jià)值的發(fā)展評價(jià),評價(jià)功能更加注重實(shí)效
教育評價(jià)功能是回答為何評價(jià)的問題。評價(jià)最重要的意圖不是為了證明,而是為了改進(jìn)[17]。教育評價(jià)的本體價(jià)值在于通過評價(jià)及時(shí)反饋存在的問題,促使評價(jià)對象不斷完善與優(yōu)化。教育評價(jià)數(shù)字化轉(zhuǎn)型要求評價(jià)功能更加注重實(shí)效,從以工具性評價(jià)為主轉(zhuǎn)向彰顯本體價(jià)值的發(fā)展評價(jià)。
長期以來,利用教育評價(jià)結(jié)果對學(xué)生進(jìn)行排名、分類的工具價(jià)值遮蔽了教育評價(jià)促進(jìn)學(xué)生成長、改進(jìn)教育教學(xué)、推動(dòng)教育事業(yè)發(fā)展的本體價(jià)值。作為教育改革的指揮棒,教育評價(jià)的工具價(jià)值凸顯與本體價(jià)值弱化無形中催生了重分?jǐn)?shù)、重排名等不良風(fēng)氣,不利于立德樹人教育目標(biāo)的實(shí)現(xiàn),也不利于學(xué)習(xí)者的終身學(xué)習(xí)與可持續(xù)發(fā)展。因而,以教育評價(jià)數(shù)字化轉(zhuǎn)型為契機(jī),助力教育評價(jià)彰顯本體價(jià)值,具有重要意義。將教育評價(jià)真正融入學(xué)生學(xué)習(xí)成長過程和教師專業(yè)發(fā)展過程,真正發(fā)揮教育評價(jià)的實(shí)際效用,實(shí)現(xiàn)本體價(jià)值與工具價(jià)值的平衡,既是教育評價(jià)發(fā)展的內(nèi)在訴求,也是充分發(fā)揮教育評價(jià)重要作用的關(guān)鍵之舉。
原文刊載于《中國考試》2022年第6期第16—23頁。
作者:黃晶晶,武漢職業(yè)技術(shù)學(xué)院副教授。劉宇佳,武漢大學(xué)教育科學(xué)研究院在讀博士生(通信作者)。
參考文獻(xiàn)