在教育高質(zhì)量發(fā)展時代,教育增值評價實施過程中存在著應(yīng)試傾向明顯、評價實施效度偏低、評價結(jié)果反饋失效差等問題,在此背景下,如何深度挖掘評價數(shù)據(jù)價值、深入推動教育評價改革,一起隨信息技術(shù)上機考試系統(tǒng)小編看看吧——
2020年10月13日,中共中央、國務(wù)院印發(fā)《深化新時代教育評價改革總體方案》,提出改進(jìn)結(jié)果評價,強化過程評價,探索增值評價,健全綜合評價[1]。增值評價關(guān)注學(xué)生在一定時期內(nèi)的進(jìn)步幅度,面向?qū)W生的學(xué)習(xí)過程,與“唯分?jǐn)?shù)”的傳統(tǒng)教育評價不同,它更關(guān)注學(xué)生通過努力產(chǎn)生的發(fā)展變化情況,有利于學(xué)校教學(xué)管理和教師教學(xué)經(jīng)驗總結(jié),對教育評價實踐具有重要意義。然而,在結(jié)果評價占主導(dǎo)的評價氛圍中,教育增值理念被遮蔽,甚至引發(fā)了“天花板”效應(yīng)和“地板”效應(yīng),其背后原因值得全面深入分析。
教育評價是改進(jìn)教育、促進(jìn)學(xué)生發(fā)展的重要途徑,增值評價是教育評價方式之一,將增值概念引入教育評價,使評價更全面、更科學(xué)、更有效,有利于學(xué)生的進(jìn)一步發(fā)展和教育質(zhì)量的進(jìn)一步提高。在反思和審視教育增值評價現(xiàn)狀時發(fā)現(xiàn),評價取向存在應(yīng)試傾向,阻礙了評價活動目標(biāo)和標(biāo)準(zhǔn)的確定;實施過程效度低,降低了評價結(jié)果的客觀程度;結(jié)果反饋實效差,影響了評價結(jié)論使用的有效性。
1.1 增值評價取向:應(yīng)試傾向明顯
增值是對質(zhì)量的衡量,質(zhì)量是教育經(jīng)驗在學(xué)生知識、能力和技能等方面帶來的促進(jìn)程度[2]。評價是根據(jù)一定的標(biāo)準(zhǔn),對教育活動過程中學(xué)生德智體美勞等方面的變化進(jìn)行價值判斷的過程,目的是促進(jìn)學(xué)生的成長并為教師的教學(xué)效果和效率提供反饋。增值評價不應(yīng)僅僅局限于對學(xué)生學(xué)業(yè)增值的分析與判定,而應(yīng)以學(xué)生全面發(fā)展為方向,以改進(jìn)為目的,對學(xué)生在教育過程中產(chǎn)生的思想、行為、個性等方面開展增值評價活動。然而,目前增值評價標(biāo)準(zhǔn)過分依賴學(xué)業(yè)成績,增值取向變成“成績增值”,教育增值評價陷入“唯分?jǐn)?shù)”潮流,呈現(xiàn)明顯的應(yīng)試傾向。增值評價出現(xiàn)應(yīng)試傾向主要有2方面原因。
一是視分?jǐn)?shù)進(jìn)步為增值取向,學(xué)生學(xué)習(xí)目的模糊。教育增值評價試圖消除傳統(tǒng)應(yīng)試教育思想,打破以學(xué)生成績?yōu)橹饕逃繕?biāo)的格局,但其實踐反映的評價依舊以學(xué)生成績?yōu)橹?。例如對某高中學(xué)校教育教學(xué)效能的增值進(jìn)行評價時,基于學(xué)生中考和高考成績,以學(xué)生語文、數(shù)學(xué)和英語等科成績?yōu)橹鬟M(jìn)行增值排序。增值評價之所以繼續(xù)把成績作為評價依據(jù),可能是因為成績數(shù)據(jù)的評價分析相對容易,但也反映了“增值評價的開展無法區(qū)分學(xué)生是為了考試而學(xué)還是為了興趣而學(xué)”[3]。更為確切地說,增值評價給學(xué)生和教師一種只追求“分?jǐn)?shù)增值”的錯覺,致使評價依據(jù)以學(xué)生學(xué)業(yè)成績?yōu)橹鳎⒅貙闪炕蚨鹊耐诰?,但這樣的評價體系培養(yǎng)出來的并不是全面發(fā)展的人,而僅僅是高分學(xué)生。評價不能僅僅著眼于考試成績的提高,而要關(guān)注學(xué)生素質(zhì)在整體上的提升幅度[4]??荚嚦煽儾⒉皇墙逃娜績?nèi)容,簡單地追求分?jǐn)?shù)增值,會導(dǎo)致增值評價走向“唯分?jǐn)?shù)”老路,把教育增值評價推向應(yīng)試教育深淵。
二是評價內(nèi)容過于狹窄,以知識獲得行為內(nèi)容為主。受教育評價專業(yè)化的影響及增值評價技術(shù)的限制,評價證據(jù)普遍以可量化的行為目標(biāo)表現(xiàn)為主。首先,獲取知識的行為更容易進(jìn)行量化評價。增值評價傾向于評價知識等行為性表現(xiàn),成績的增值其實是學(xué)生知識量的積累,但這會導(dǎo)致學(xué)生掌握知識以外的能力被忽視,甚至?xí)乖u價改進(jìn)和發(fā)展的目的傾向于選拔和診斷的舊式評價,導(dǎo)致全面?zhèn)€性發(fā)展的教育理念在教育活動中被遺忘。其次,評價內(nèi)容傾向于學(xué)業(yè)成績,缺乏對除學(xué)生學(xué)科成績以外的思想意識、學(xué)習(xí)能力、人際交往能力等方面的分析和判斷[5],窄化了評價內(nèi)容范圍,忽視了教育過程中思維、行動及個性等方面的發(fā)展。增值評價打著“增值”的口號,卻只追求知識“增量”,缺乏真正全面發(fā)展意義上的“增值”,加重了“唯分?jǐn)?shù)”主義,走上了應(yīng)試教育的老路。最后,將數(shù)據(jù)增值視為學(xué)生進(jìn)步程度,掩蓋了學(xué)生成長“質(zhì)”的本質(zhì)。這些應(yīng)試評價舉動嚴(yán)重阻礙立德樹人根本任務(wù)的落實,也將教育增值評價引向“唯分?jǐn)?shù)”的錯誤軌道。
1.2 增值評價實施:效度偏低
評價的實施在一定程度上決定著增值評價的信效度,進(jìn)而直接影響教育增值評價內(nèi)在功能的有效發(fā)揮。增值評價在實施中存在如下問題。
首先,增值評價標(biāo)準(zhǔn)缺失。評價標(biāo)準(zhǔn)是對教育活動數(shù)量或質(zhì)量的要求和規(guī)定,同時也是對教育教學(xué)現(xiàn)象進(jìn)行有效價值判斷的尺度和依據(jù)[6]。目前,現(xiàn)有的理論研究主要集中于增值評價的理論基礎(chǔ)、內(nèi)涵界定、意義等方面,借鑒國外增值評價經(jīng)驗論述我國增值評價研究應(yīng)用情況,對增值評價的應(yīng)用標(biāo)準(zhǔn)及方法模型適用性缺乏論證,缺少增值評價適用條件范圍的界定和說明等相關(guān)研究。就算提及評價標(biāo)準(zhǔn)一詞,也主要是在宏觀層面對評價標(biāo)準(zhǔn)提出要求,沒有具體的標(biāo)準(zhǔn)界定。此外,從增值評價應(yīng)用研究和實際操作來看,實施方案的標(biāo)準(zhǔn)闡述得過于籠統(tǒng)寬泛,實施指標(biāo)的標(biāo)準(zhǔn)界限不明確或直接缺失,對指標(biāo)維度標(biāo)準(zhǔn)也沒有完整詳細(xì)的陳述和規(guī)定,且大部分評價實施細(xì)則對教育質(zhì)量增值評價的標(biāo)準(zhǔn)并沒有明確說明,這無疑將增值評價引向一種適用于一切活動評價的錯誤方向。
其次,增值評價模型的準(zhǔn)確性不能保證。當(dāng)前比較流行的增值評價模型包括增益分?jǐn)?shù)模型(gain score model)、協(xié)變量校正模型(covariant adjustment model)、田納西模型(Tennessee value?added assessment model)、交叉分類模型(cross?classified model)等,但到底哪些模型更準(zhǔn)確、更易于操作還需要研究探討[7]?;诹炕臄?shù)據(jù)指標(biāo)評價模型存在隨機誤差,加之缺乏針對數(shù)據(jù)缺失模型的科學(xué)計算方法,在實施評價時難以避免數(shù)據(jù)缺失帶來的結(jié)果誤差,由此導(dǎo)致增值分析結(jié)果有效性得不到保證。此外,增值評價模型適用條件有限,對簡單的階段成績、學(xué)校間成績及各學(xué)科間成績等可以進(jìn)行比較分析,但不能對處于同一水平的學(xué)生個體發(fā)展情況進(jìn)行分析。例如在利用成長百分等級模型進(jìn)行評價時,依據(jù)學(xué)生的數(shù)次考試成績或測驗數(shù)據(jù)來評估其在班級、年級或全區(qū)中相對位次的變化,這種方法能夠大致判斷學(xué)生是否取得進(jìn)步,但無法客觀比較不同起點學(xué)生的進(jìn)步程度,也無法避免“天花板”效應(yīng)和“地板”效應(yīng)[8]。由于評價模型適用條件限制,難以呈現(xiàn)優(yōu)秀學(xué)生真正的發(fā)展?fàn)顩r,同樣也缺少針對落后學(xué)生發(fā)展的針對性分析;因此,增值評價方法被簡化,評價模型誤差無法解決,以及“天花板”和“地板”效應(yīng)無法破解等問題直接反映了增值評價模型存在效度問題。
最后,增值評價重視數(shù)據(jù)分析,但價值判斷不足。評價判斷的最后目標(biāo)是發(fā)現(xiàn)或揭示更深一層的數(shù)據(jù)和關(guān)系,這些數(shù)據(jù)和關(guān)系將使一種更充分的價值判斷成為可能[9]。對數(shù)據(jù)的分析是更為客觀深刻的價值判斷,增值評價的數(shù)據(jù)量化分析是對數(shù)據(jù)呈現(xiàn)出的量化關(guān)系及其現(xiàn)象背后深層次原因的分析,但實際操作中往往把重心放在數(shù)據(jù)結(jié)果分析上而缺乏真實意義上的價值判斷。例如在學(xué)生學(xué)業(yè)水平增值評價中,有研究對學(xué)生和教師變量數(shù)據(jù)進(jìn)行了大量差異比較分析,但對差異背后的原因分析和闡述卻只有簡短的一小段話[10]。基于量化數(shù)據(jù)處理結(jié)果為主的評價,依賴高水平評價技術(shù),很容易忽視價值存在主體而喪失真正意義上的價值判斷。人是事實價值存在的載體,增值評價出現(xiàn)價值判斷不足現(xiàn)象很大程度上是因為評價忽視了“人”的價值主體存在的意義,缺乏根據(jù)評價目標(biāo)對數(shù)據(jù)進(jìn)行理論和實踐意義上的分析,這不僅使評價過程弱化了價值判斷,還大大降低了增值評價的完整性和有效性。
1.3 增值評價結(jié)果反饋:實效性差
反饋實效性是指反饋得出決策的可行性及決策實施效果的目的性。增值評價的實施效度直接影響評價結(jié)果的有效性,而評價結(jié)果的有效性又影響決策建議的可行性。評價結(jié)果的呈現(xiàn)方式和評價結(jié)果的使用是教育評價的價值能否有效發(fā)揮的關(guān)鍵[11]。教育增值評價的結(jié)果呈現(xiàn)方式和結(jié)果使用存在以下問題。
一是評價結(jié)果量表化,結(jié)論缺乏深度。第一代教育評價為教育測驗或測量;第二代教育評價為了便于評價而將學(xué)習(xí)目標(biāo)采用行為目標(biāo)方式來表述,行為目標(biāo)的提出使評價代替了測驗;自第三代教育評價起,強調(diào)過程評價,注重質(zhì)性與定性相結(jié)合。從教育評價發(fā)展歷程可以看出,評價活動離不開測量,教育評價就是對教育活動進(jìn)行測量。測量一詞帶有很強的量化傾向,就目前而言,增值評價在依賴大數(shù)據(jù)的背景下對評價內(nèi)容進(jìn)行量化陳述,致使評價結(jié)果數(shù)據(jù)量表化傾向嚴(yán)重,使結(jié)論反饋內(nèi)容過于表面化或形式化,數(shù)據(jù)的價值意義得不到全面體現(xiàn),一定程度上降低了增值評價的專業(yè)性和效用性。量化價值判斷標(biāo)準(zhǔn)的指標(biāo)是量化的,其指標(biāo)的約束條件也是量化的[12],但量化的分析判斷結(jié)論不是量化的,所以評價得出的結(jié)論不應(yīng)只是量表化呈現(xiàn)。同時,如果結(jié)論描述過于籠統(tǒng)且空泛,則很難聚焦具體實際問題給出有針對性的改進(jìn)建議。此外,反饋結(jié)論缺少專業(yè)解釋,運用高級統(tǒng)計模型處理數(shù)據(jù)后得出的結(jié)果也更為復(fù)雜,需要專業(yè)人員進(jìn)行分析和解釋。一般評價者可以分析簡單的百分?jǐn)?shù)或線性回歸結(jié)果,但對大規(guī)模的綜合數(shù)據(jù)庫進(jìn)行統(tǒng)計分析具有較大困難;因此,教育增值評價的實施者和結(jié)果使用者需要具備一定的評價技術(shù)及數(shù)據(jù)意義挖掘能力。
二是評價結(jié)果利用不充分,達(dá)不到改進(jìn)目的。增值評價以促進(jìn)學(xué)生發(fā)展為目的,評價應(yīng)帶有改進(jìn)、發(fā)展和教育功能,但實踐中往往止步于發(fā)布評價報告,后期結(jié)果的運用效果、整改效果等沒有進(jìn)一步跟進(jìn)。評價是為了改進(jìn),改進(jìn)需要準(zhǔn)確理解和運用結(jié)果反饋信息,及時跟進(jìn)整改效果才能充分發(fā)揮評價的功能,否則會導(dǎo)致評價走向形式主義。教育評價的效度包含目的、過程、功能及結(jié)果等內(nèi)容體系,各個效度之間具有較強的邏輯關(guān)系,每一內(nèi)容效度出現(xiàn)問題都將直接影響評價的整體效度。因此,要保證評價結(jié)果的效度,需要從整體考慮評價帶來的作用及價值效能的發(fā)揮,拓寬結(jié)果使用范圍,增強反饋結(jié)論的可理解性和可操作性,提高決策建議的目的性和可行性。
從實踐論的評價范式來看,增值評價對教育評價實踐和發(fā)展、對促進(jìn)教育教學(xué)進(jìn)步具有重要的推動作用。從教育增值評價的實踐來看,制約教育增值評價發(fā)展的原因主要有以下4個方面。
2.1 對教育評價和教學(xué)評價存在認(rèn)識誤區(qū)
教學(xué)評價是一種認(rèn)識活動,是對教學(xué)活動的測驗、分析和評定。教學(xué)活動的直接對象是學(xué)生,促進(jìn)學(xué)生學(xué)習(xí)是評價發(fā)生的核心內(nèi)涵。在闡述教學(xué)評價和教育評價時,容易把二者混淆或等同。一方面,在對教學(xué)評價和教育評價下定義時隨意性強,概念邊界模糊,評價者容易將教育評價視為教學(xué)評價。另一方面,對二者內(nèi)容區(qū)分不清晰,狹義的教育評價認(rèn)為教學(xué)評價就是教育評價,廣義的教育評價則認(rèn)為教學(xué)評價只是教育評價的一部分。實際上,現(xiàn)代教學(xué)評價強調(diào)教學(xué)活動對學(xué)生認(rèn)知、情感、動作技能發(fā)展的綜合促進(jìn)作用,提倡從學(xué)生多方面的發(fā)展結(jié)果來衡量、評判教師的教學(xué)質(zhì)量和水平,并注重對教學(xué)活動過程的靜態(tài)和動態(tài)進(jìn)行全程評價[13],教學(xué)評價的內(nèi)容是個體的認(rèn)知、情感和動作技能等微觀方面,限于對教學(xué)活動過程中對象內(nèi)部的表現(xiàn)進(jìn)行評價。教育評價涉及的內(nèi)容除了教學(xué)活動外,還包括參與教育活動的全部主體及影響教育發(fā)展的一切因素,如行政工作、教學(xué)管理工作、學(xué)校后勤服務(wù)工作等,評價對象涉及教育的全部領(lǐng)域。如果不能準(zhǔn)確把握教學(xué)評價與教育評價的內(nèi)容,在操作過程中會使教學(xué)評價內(nèi)容擴大化,缺乏針對性,也會使教育評價內(nèi)容窄化,失去教育評價的整體意義。
2.2 量化方法難以保證評價的真實性
行為目標(biāo)評價法采用可觀測的行為目標(biāo)作為評價依據(jù),其實質(zhì)是評價內(nèi)容的具體化和評價標(biāo)準(zhǔn)的客觀化[14]。在行為目標(biāo)的測量和評估中經(jīng)常對評價對象加以量化,量化是以數(shù)量為衡量標(biāo)準(zhǔn)的科學(xué)方法,教育增值評價內(nèi)容的確定在一定程度上取決于對內(nèi)容加以量化測量的可能性?;诖髷?shù)據(jù)的增值評價傾向于量化行為目標(biāo)。首先,行為表現(xiàn)易于量化描述。教育活動中學(xué)生、教師的行為表現(xiàn)更容易進(jìn)行量化表征,如教學(xué)過程中學(xué)生主動提問的次數(shù)、教師回應(yīng)學(xué)生提問的次數(shù)、學(xué)生參與討論的次數(shù)等,但諸如此類的測量并不能反映客觀事物全部,它雖然可以測量學(xué)生的知識,卻難以測量學(xué)生的學(xué)習(xí)態(tài)度、興趣及情感等。測量只能針對學(xué)習(xí)者特定的、有限的行為進(jìn)行,難以全面、準(zhǔn)確地反映學(xué)習(xí)者的真實狀態(tài)和學(xué)習(xí)成果[15]。其次,評價時難以對情境性表現(xiàn)進(jìn)行追蹤測量。增值評價對教育過程中一些特定的、穩(wěn)定的表征進(jìn)行追蹤相對容易,如教育活動中的學(xué)科教學(xué)活動表現(xiàn)、學(xué)生學(xué)習(xí)行為表現(xiàn)、課堂特定環(huán)境等,但該過程包含的教育思想、情感及道德思維等不易追蹤的表現(xiàn)則難以進(jìn)行量化測量。教育活動中影響學(xué)生學(xué)習(xí)活動的學(xué)習(xí)內(nèi)容、學(xué)習(xí)方式和學(xué)生認(rèn)知特征等環(huán)境總和是構(gòu)成教育情境的要素,這些要素再現(xiàn)了教育情境的復(fù)雜性和多樣性,而教育活動的復(fù)雜性、多樣性又導(dǎo)致評價無法準(zhǔn)確描述不同情境的具體表現(xiàn)內(nèi)容。因此,量化不是萬能的,量化雖然把復(fù)雜的教育現(xiàn)象簡單化,但“它不僅無法從本質(zhì)上保證評價的真實性,而且往往會丟失教育中最有意義、最根本的內(nèi)容”[16]。
2.3 對增值數(shù)據(jù)意義的挖掘不充分
對增值數(shù)據(jù)的解釋和深度挖掘,是教育增值評價有效實施的重要前提條件。但就現(xiàn)狀而言,評價實施過程過于注重量化數(shù)據(jù)指標(biāo),并沒有注意到數(shù)據(jù)背后的意義,造成這種現(xiàn)象的原因主要有2個:一是相對比較法沒有充分運用。目前對學(xué)生的增值評價一般采用個體內(nèi)縱向比較,缺乏學(xué)生同知識水平和整體的比較分析。由于不同水平之間的增值空間不一樣,所以會出現(xiàn)“天花板”效應(yīng)和“地板”效應(yīng),基礎(chǔ)較好的學(xué)生在進(jìn)行個體內(nèi)比較時進(jìn)步幅度不明顯,基礎(chǔ)較差的學(xué)生在個體內(nèi)比較時雖然能激發(fā)學(xué)習(xí)動力,但可能讓學(xué)生滿足于個體內(nèi)進(jìn)步,降低學(xué)業(yè)追求。二是分?jǐn)?shù)進(jìn)步原因分析不夠深入。對分?jǐn)?shù)增值的分析僅看到學(xué)生的學(xué)科成績提高,即卷面分?jǐn)?shù)提高,對其背后原因分析不夠深入,如沒有考慮學(xué)生在一段時間內(nèi)的分?jǐn)?shù)進(jìn)步可能受題型難易程度、學(xué)習(xí)努力程度、教學(xué)方法改進(jìn)與變化等因素影響,這是運用增值評價方法的共性問題。不同測試形式的評價內(nèi)容會不同質(zhì),只描述學(xué)生成長過程的做法無法準(zhǔn)確分析影響學(xué)生成長的諸多因素。此外,已有研究多止步于通過增值數(shù)據(jù)大小判斷學(xué)生進(jìn)步程度,雖然也嘗試解讀分?jǐn)?shù)提高的原因,但實際評價中往往趨于表面,沒有具體對應(yīng)的評價模型或分析解讀策略。
2.4 教育評價主體能力不足
教育增值評價的主體是評價活動的組織者和實施者。組織者對評價思想和評價價值的把握直接影響評價活動目的和標(biāo)準(zhǔn)的確定,實施者對評價標(biāo)準(zhǔn)和目的的正確理解是評價有效實施的前提條件。評價主體對評價指標(biāo)體系的健全是實施評價的基礎(chǔ),對數(shù)據(jù)背后意義的充分挖掘是評價結(jié)論具有實效性的必要程序。在教育增值評價中,評價主體存在能力與評價需要不匹配的現(xiàn)象。其一,評價指標(biāo)體系健全能力有限。評價指標(biāo)是評價內(nèi)容的具體項目,直接影響教育目標(biāo)、內(nèi)容及方法的確定和使用,評價指標(biāo)具有公平性和有效性是評價活動可持續(xù)推進(jìn)的重要基礎(chǔ)。由于受評價主體理論知識缺乏、專業(yè)經(jīng)驗欠缺、預(yù)測能力弱等影響和限制,在實施評價時依然存在指標(biāo)權(quán)重嚴(yán)重失衡的現(xiàn)象。比如,個別指標(biāo)占比突出,不同指標(biāo)維度之間占比相差較大,增值賦權(quán)缺乏科學(xué)依據(jù),指標(biāo)維度下具體內(nèi)容占比隨意等。增值評價的指標(biāo)和權(quán)重都具有強大的導(dǎo)向性,如果評價指標(biāo)失衡,則所有的評價活動都將失去評價價值。其二,評價主體數(shù)據(jù)挖掘能力有限。數(shù)據(jù)挖掘能力表現(xiàn)為能得出學(xué)生學(xué)習(xí)成績以外的學(xué)習(xí)態(tài)度、學(xué)習(xí)動機、學(xué)習(xí)策略等方面的進(jìn)步與發(fā)展。數(shù)據(jù)是評價實踐中最重要的資源,“通過數(shù)據(jù)挖掘可以找準(zhǔn)規(guī)律、發(fā)現(xiàn)問題、預(yù)測趨勢,從而提高評價的應(yīng)用效能和專業(yè)水平”[17]。學(xué)生成長的數(shù)據(jù)庫不應(yīng)僅是成績數(shù)據(jù),還應(yīng)包括學(xué)習(xí)過程的所有影響因素。由于評價研究人員和管理人員統(tǒng)計分析知識不足,對數(shù)據(jù)的挖掘也僅從量化結(jié)果得出結(jié)論,分析層級單一,缺少整體視角,缺乏結(jié)合相關(guān)影響主體的分析,評價數(shù)據(jù)的應(yīng)用價值沒有得到充分體現(xiàn)。因此,在信息技術(shù)高速發(fā)展的時代背景下,教育增值評價者的專業(yè)性有待進(jìn)一步提高,教育增值評價主體的能力需要與時俱進(jìn)。
通過對教育增值評價現(xiàn)有問題進(jìn)行分析發(fā)現(xiàn),教育增值評價應(yīng)圍繞立德樹人根本任務(wù)開展評價活動,從而避免其落入技術(shù)異化窠臼。
3.1 厘清增值理念本質(zhì),正確認(rèn)識教育增值評價導(dǎo)向
“教育增值”理念的提出為增值評價奠定了理論基礎(chǔ)。只有正確認(rèn)識和理解增值理念,把握增值的價值,洞悉增值是學(xué)生發(fā)展的本質(zhì),才能真正立足學(xué)生發(fā)展的教育目的而開展教育活動?;诖耍梢詮囊韵?個方面樹立正確的增值理念,進(jìn)而厘清增值評價中增值的本質(zhì)。一方面,樹立正確的評價導(dǎo)向,摒棄用學(xué)生成績評一切的做法。學(xué)校應(yīng)樹立正確的育人導(dǎo)向,一切以學(xué)生未來發(fā)展為重點,成績只是評價依據(jù)的組成部分,而不是教育活動的全部內(nèi)容。學(xué)校應(yīng)該打破把學(xué)生成績作為教師教學(xué)評價主要依據(jù)、以成績判斷教師教學(xué)能力和教育質(zhì)量的思維范式。另一方面,教師應(yīng)積極發(fā)揮增值導(dǎo)向作用,關(guān)注學(xué)生全面而有個性的發(fā)展。班主任及科任教師建立學(xué)期、學(xué)年增值評價系統(tǒng),完整記錄學(xué)生進(jìn)入學(xué)校以來的所有情況,包括成績數(shù)據(jù)、德育表現(xiàn)、體育表現(xiàn)及其他有關(guān)學(xué)生成長的獲獎資料,并不斷完善評價資料庫。各學(xué)科教師應(yīng)將教與評一體化,關(guān)注學(xué)生過程性發(fā)展,將過程性評價資料與成績數(shù)據(jù)結(jié)合起來分析、判斷學(xué)生的學(xué)習(xí)效果。
3.2 設(shè)置增值評價培訓(xùn)課程,提高評價者的增值評價能力
在大數(shù)據(jù)時代,要利用評價結(jié)果數(shù)據(jù)驅(qū)動教育質(zhì)量提升,“教育管理者和廣大教師必須不斷提高數(shù)據(jù)應(yīng)用意識和數(shù)據(jù)解讀能力,善于挖掘數(shù)據(jù)背后的價值,以更好地服務(wù)于學(xué)校改革、區(qū)域改進(jìn)以及科學(xué)決策”[18]。當(dāng)前,評價者對數(shù)據(jù)的認(rèn)識和分析并不全面,只能看到數(shù)據(jù)反映的表面內(nèi)容,無法從不同視角、利用不同方法解讀大數(shù)據(jù)背后的真正意義。要使增值評價落地,就要培養(yǎng)增值評價專業(yè)技術(shù)人員,可以聘請增值評價領(lǐng)域的專家和一線實踐者開發(fā)增值評價培訓(xùn)課程,從上到下形成聯(lián)動機制,評價主體部門建立增值評價培訓(xùn)制度,地方學(xué)校確定人員參加培訓(xùn)。首先,開展增值評價理論基礎(chǔ)培訓(xùn)。由評價專家向?qū)W習(xí)者講授增值評價發(fā)展歷程、基本內(nèi)涵及意義等,引導(dǎo)評價者深入理解增值評價,以便在實施評價時準(zhǔn)確把握評價目的并創(chuàng)新融合增值評價運用。其次,開展增值評價數(shù)據(jù)統(tǒng)計方法培訓(xùn),特別是對數(shù)據(jù)解讀和意義挖掘能力的培訓(xùn)。增值評價相對結(jié)果評價、過程評價,對評價技術(shù)要求更高,應(yīng)在基礎(chǔ)數(shù)據(jù)統(tǒng)計方法的基礎(chǔ)上設(shè)置高級統(tǒng)計分析方法課程,如回歸分析、交叉分析及多種數(shù)據(jù)來源分析等。最后,地方學(xué)校為教學(xué)人員開設(shè)培訓(xùn)講座,邀請有增值評價經(jīng)驗的一線教師分享經(jīng)驗,為新手提供可靠的增值評價實踐經(jīng)驗,以便其更好地實施評價活動,從而有利于教學(xué)的改進(jìn)并最終促進(jìn)學(xué)生全面而有個性的發(fā)展。
3.3 創(chuàng)建評價數(shù)據(jù)鏈接平臺,提升教育增值評價的專業(yè)化程度
教育增值評價專業(yè)化和精準(zhǔn)化需要大量完整的數(shù)據(jù)信息,而完整的數(shù)據(jù)信息需要借助信息技術(shù)對靜態(tài)和動態(tài)信息進(jìn)行長期的收集和整理。目前,教育增值評價數(shù)據(jù)缺失現(xiàn)象嚴(yán)重,評價的效用得不到保障?;诖?,健全教育評價數(shù)據(jù)庫,創(chuàng)建不同主體間數(shù)據(jù)信息鏈條尤其重要。首先,依靠智能技術(shù)收集學(xué)生發(fā)展全過程、全方面的數(shù)據(jù)。通過大數(shù)據(jù)、人工智能技術(shù)采集學(xué)生的知識、情感、態(tài)度、思維、道德行為等全過程數(shù)據(jù)[19],并利用信息技術(shù)整理、存儲過程性的動態(tài)情境數(shù)據(jù)。其次,創(chuàng)建學(xué)生、教師、學(xué)校等數(shù)據(jù)庫之間的鏈接,達(dá)到數(shù)據(jù)之間的有效整合。教育增值評價需要學(xué)生、教師、學(xué)校等主體間的數(shù)據(jù)進(jìn)行有效鏈接,以形成一個完整的追蹤數(shù)據(jù)庫,為教育增值評價有效開展創(chuàng)建完整的數(shù)據(jù)信息鏈條。最后,為數(shù)據(jù)庫建立共享平臺,實現(xiàn)數(shù)據(jù)共享。教育增值評價是一項極其復(fù)雜且專業(yè)程度較高的評價活動,教育活動中涉及的要素及產(chǎn)生的各類發(fā)展變化數(shù)據(jù)繁雜,因此,要充分利用現(xiàn)代信息技術(shù)賦能教育增值評價。在評價對象數(shù)據(jù)完整且具備共享的基礎(chǔ)上搭建數(shù)據(jù)信息共享平臺,提供各個對象的全過程數(shù)據(jù)信息,實現(xiàn)數(shù)據(jù)收集、處理和共享一體化。平臺系統(tǒng)包含所有采集的信息及統(tǒng)計分析結(jié)果,評價者和研究人員能夠隨時調(diào)取數(shù)據(jù),實現(xiàn)不同主體數(shù)據(jù)的共享,避免由數(shù)據(jù)缺失引起的評價誤差問題,提高評價活動的有效性和精準(zhǔn)性。
3.4 兼顧融合多種評價方式,提高教育增值評價實施的有效性
評價方法或手段的科學(xué)性和有效性對教育增值評價實施效度具有深刻的影響?,F(xiàn)有的增值評價方式簡化了過程性發(fā)展,忽視了不同水平學(xué)生增值空間不同的特征,導(dǎo)致學(xué)生個體內(nèi)相對進(jìn)步效度低,群體間絕對進(jìn)步不顯著。對此,在數(shù)據(jù)完備的基礎(chǔ)上,教育活動需要創(chuàng)新融合評價方式方法,激發(fā)學(xué)生發(fā)展的可能性,促進(jìn)不同水平學(xué)生增值空間的最大限度開發(fā)。其一,充分運用常模參照評價方式,提高學(xué)生個體的絕對進(jìn)步程度。轉(zhuǎn)變用個體成績計算一切的傳統(tǒng)評價方式,充分利用常模參照評價厘清學(xué)生個體在群體中的水平位置。在常模參照物的作用下,“借助大數(shù)據(jù)技術(shù)、云計算等方式把數(shù)據(jù)轉(zhuǎn)化為可以獲利和增值的資本”[20]。其二,定性評價和定量評價相結(jié)合,提升個體相對水平的增值空間。以教育測量為基礎(chǔ),在數(shù)據(jù)庫完整的前提下,充分利用完備的數(shù)據(jù)資料,運用數(shù)學(xué)統(tǒng)計分析方法對教育活動中學(xué)生的過程性發(fā)展情況進(jìn)行動態(tài)評價。同時,增加質(zhì)性評價,對照教育教學(xué)活動中學(xué)生的動態(tài)表現(xiàn)、行為表現(xiàn)及情感態(tài)度表現(xiàn)等作出客觀實際的價值判斷。評價者應(yīng)利用專業(yè)知識、實踐經(jīng)驗和判斷標(biāo)準(zhǔn)給出評語或等級,充分關(guān)注學(xué)生的優(yōu)缺點,既要注重學(xué)生絕對的進(jìn)步,也要關(guān)注學(xué)生相對的發(fā)展空間,堅持多維度、多視角評價學(xué)生的連續(xù)性進(jìn)步。其三,自評與他評相結(jié)合,促進(jìn)學(xué)生全面發(fā)展。增值評價不只是評價者對教育活動中學(xué)生主體的評價,也可以是學(xué)生內(nèi)部評價。提高教育增值評價的信度和效度,需要將自我評價與他人評價相結(jié)合??傊盐赵鲋翟u價是量化與質(zhì)性相結(jié)合的評價,它不是靜態(tài)的固定評價,不能僅局限于學(xué)業(yè)成績的輸入與產(chǎn)出量化數(shù)據(jù)的結(jié)果性評價,否則會將增值評價禁錮于數(shù)字符號評價模式,降低教育增值評價實施的效度。
來源:《中國考試》2022年第10期第31-38頁
作者:王天平,系教育部西南基礎(chǔ)教育課程研究中心副主任,西南大學(xué)教育學(xué)部教授
參考文獻(xiàn):
[1] 中共中央國務(wù)院印發(fā)《深化新時代教育評價改革總體方案》[A/OL]. (2020-10-13) [2021-11-21]. http://www .gov .cn/zhengce/2020- 10/ 13/content_ 555 1032.htm.
[2] 章建石.基于學(xué)生增值發(fā)展的教學(xué)質(zhì)量評價與保障研究[M].北京:北京師范大學(xué)出版社,2014: 72.
[3]謝小蓉,張輝蓉.五育并舉視域下學(xué)生增值評價的發(fā)展困境與破解策略[J].中國電化教育,2021(11): 32-38.
[4] 王天平。教學(xué)活動論[M].北京:人民教育出版社,2019:211.
[5] 羅瀟.何為增值?增什么值?如何測量增值?對增值評價的三點認(rèn)識[J].今日教育, 2021(1): 10-13.
[6]李森,鄭嵐.促進(jìn)質(zhì)量提升的課堂教學(xué)評價改革[J].課程.教材●教法,2019, 39(12):56-62.
[7]辛濤.探索增值評價的幾個關(guān)鍵問題[J].中小學(xué)管理,2020( 10): 1.
[8] 王帥鳴,姚守梅,王夢,等.基于成長百分等級模型開展增值評價的實證研究[J].中國考試,2020(9):46-51.
[9] 康海燕.評價與創(chuàng)新型人才:基于杜威價值哲學(xué)的探討[J].上海師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版), 2015,44(6): 11-16.
[10]胡志橋,鐘陽,汪晶.中小學(xué)生學(xué)業(yè)水平增值評價模型的構(gòu)建與實踐:基于廣州市義務(wù)教育階段陽光評價的研究[J].教育理論與實踐, 2022, 42(11): 18-22.
[11] 彭波,王偉清,張進(jìn)良,等.人工智能視域下教育評價改革何以可能[J].當(dāng)代教育論壇,2021(1): 1-15.
[12] 馮平.評價論[M].北京:東方出版社,1995: 155.
[13] 李森.現(xiàn)代教學(xué)綱要[M].北京:人民教育出版社,2005: 351.
[14] 胡中鋒.教育評價學(xué)[M].北京:中國人民大學(xué)出版社, 2008: 58-59.
[15]陳晨,楊成,王曉燕,等.學(xué)習(xí)測量:大數(shù)據(jù)時代教育質(zhì)量提升的新力量[J].現(xiàn)代教育技術(shù),2017, 27(2):33-39.
[16] 涂艷國.教育評價[M].北京:高等教育出版社, 2007:94-95.
[17]劉邦奇,袁婷婷,紀(jì)玉超,等.智能技術(shù)賦能教育評價:內(nèi)涵、總體框架與實踐路徑[].中國電化教育,2021(8): 16-24.
[18]楊現(xiàn)民,顧佳妮,邢蓓蓓.“互聯(lián)網(wǎng)+”時代數(shù)據(jù)驅(qū)動的教育評價體系構(gòu)架與實踐進(jìn)展[J]浙江師范大學(xué).學(xué)報(社會科學(xué)版), 2019, 44(4): 16-26.
[19]楊宗凱.利用信息技術(shù)促進(jìn)教育教學(xué)評價改革創(chuàng)新[J]. 人民教育,2020(21): 30-32.
[20]張以哲.數(shù)據(jù)資本權(quán)力:數(shù)字現(xiàn)代性批判的重要維度[J].西南大學(xué)學(xué)報(社會科學(xué)版), 2021, 47(1):42-51.