在教育高質(zhì)量發(fā)展時(shí)代,教育增值評(píng)價(jià)實(shí)施過程中存在著應(yīng)試傾向明顯、評(píng)價(jià)實(shí)施效度偏低、評(píng)價(jià)結(jié)果反饋失效差等問題,在此背景下,如何深度挖掘評(píng)價(jià)數(shù)據(jù)價(jià)值、深入推動(dòng)教育評(píng)價(jià)改革,一起隨信息技術(shù)上機(jī)考試系統(tǒng)小編看看吧——
2020年10月13日,中共中央、國務(wù)院印發(fā)《深化新時(shí)代教育評(píng)價(jià)改革總體方案》,提出改進(jìn)結(jié)果評(píng)價(jià),強(qiáng)化過程評(píng)價(jià),探索增值評(píng)價(jià),健全綜合評(píng)價(jià)[1]。增值評(píng)價(jià)關(guān)注學(xué)生在一定時(shí)期內(nèi)的進(jìn)步幅度,面向?qū)W生的學(xué)習(xí)過程,與“唯分?jǐn)?shù)”的傳統(tǒng)教育評(píng)價(jià)不同,它更關(guān)注學(xué)生通過努力產(chǎn)生的發(fā)展變化情況,有利于學(xué)校教學(xué)管理和教師教學(xué)經(jīng)驗(yàn)總結(jié),對(duì)教育評(píng)價(jià)實(shí)踐具有重要意義。然而,在結(jié)果評(píng)價(jià)占主導(dǎo)的評(píng)價(jià)氛圍中,教育增值理念被遮蔽,甚至引發(fā)了“天花板”效應(yīng)和“地板”效應(yīng),其背后原因值得全面深入分析。
教育評(píng)價(jià)是改進(jìn)教育、促進(jìn)學(xué)生發(fā)展的重要途徑,增值評(píng)價(jià)是教育評(píng)價(jià)方式之一,將增值概念引入教育評(píng)價(jià),使評(píng)價(jià)更全面、更科學(xué)、更有效,有利于學(xué)生的進(jìn)一步發(fā)展和教育質(zhì)量的進(jìn)一步提高。在反思和審視教育增值評(píng)價(jià)現(xiàn)狀時(shí)發(fā)現(xiàn),評(píng)價(jià)取向存在應(yīng)試傾向,阻礙了評(píng)價(jià)活動(dòng)目標(biāo)和標(biāo)準(zhǔn)的確定;實(shí)施過程效度低,降低了評(píng)價(jià)結(jié)果的客觀程度;結(jié)果反饋實(shí)效差,影響了評(píng)價(jià)結(jié)論使用的有效性。
1.1 增值評(píng)價(jià)取向:應(yīng)試傾向明顯
增值是對(duì)質(zhì)量的衡量,質(zhì)量是教育經(jīng)驗(yàn)在學(xué)生知識(shí)、能力和技能等方面帶來的促進(jìn)程度[2]。評(píng)價(jià)是根據(jù)一定的標(biāo)準(zhǔn),對(duì)教育活動(dòng)過程中學(xué)生德智體美勞等方面的變化進(jìn)行價(jià)值判斷的過程,目的是促進(jìn)學(xué)生的成長并為教師的教學(xué)效果和效率提供反饋。增值評(píng)價(jià)不應(yīng)僅僅局限于對(duì)學(xué)生學(xué)業(yè)增值的分析與判定,而應(yīng)以學(xué)生全面發(fā)展為方向,以改進(jìn)為目的,對(duì)學(xué)生在教育過程中產(chǎn)生的思想、行為、個(gè)性等方面開展增值評(píng)價(jià)活動(dòng)。然而,目前增值評(píng)價(jià)標(biāo)準(zhǔn)過分依賴學(xué)業(yè)成績(jī),增值取向變成“成績(jī)?cè)鲋怠?,教育增值評(píng)價(jià)陷入“唯分?jǐn)?shù)”潮流,呈現(xiàn)明顯的應(yīng)試傾向。增值評(píng)價(jià)出現(xiàn)應(yīng)試傾向主要有2方面原因。
一是視分?jǐn)?shù)進(jìn)步為增值取向,學(xué)生學(xué)習(xí)目的模糊。教育增值評(píng)價(jià)試圖消除傳統(tǒng)應(yīng)試教育思想,打破以學(xué)生成績(jī)?yōu)橹饕逃繕?biāo)的格局,但其實(shí)踐反映的評(píng)價(jià)依舊以學(xué)生成績(jī)?yōu)橹?。例如?duì)某高中學(xué)校教育教學(xué)效能的增值進(jìn)行評(píng)價(jià)時(shí),基于學(xué)生中考和高考成績(jī),以學(xué)生語文、數(shù)學(xué)和英語等科成績(jī)?yōu)橹鬟M(jìn)行增值排序。增值評(píng)價(jià)之所以繼續(xù)把成績(jī)作為評(píng)價(jià)依據(jù),可能是因?yàn)槌煽?jī)數(shù)據(jù)的評(píng)價(jià)分析相對(duì)容易,但也反映了“增值評(píng)價(jià)的開展無法區(qū)分學(xué)生是為了考試而學(xué)還是為了興趣而學(xué)”[3]。更為確切地說,增值評(píng)價(jià)給學(xué)生和教師一種只追求“分?jǐn)?shù)增值”的錯(cuò)覺,致使評(píng)價(jià)依據(jù)以學(xué)生學(xué)業(yè)成績(jī)?yōu)橹鳎⒅貙?duì)可量化向度的挖掘,但這樣的評(píng)價(jià)體系培養(yǎng)出來的并不是全面發(fā)展的人,而僅僅是高分學(xué)生。評(píng)價(jià)不能僅僅著眼于考試成績(jī)的提高,而要關(guān)注學(xué)生素質(zhì)在整體上的提升幅度[4]??荚嚦煽?jī)并不是教育的全部?jī)?nèi)容,簡(jiǎn)單地追求分?jǐn)?shù)增值,會(huì)導(dǎo)致增值評(píng)價(jià)走向“唯分?jǐn)?shù)”老路,把教育增值評(píng)價(jià)推向應(yīng)試教育深淵。
二是評(píng)價(jià)內(nèi)容過于狹窄,以知識(shí)獲得行為內(nèi)容為主。受教育評(píng)價(jià)專業(yè)化的影響及增值評(píng)價(jià)技術(shù)的限制,評(píng)價(jià)證據(jù)普遍以可量化的行為目標(biāo)表現(xiàn)為主。首先,獲取知識(shí)的行為更容易進(jìn)行量化評(píng)價(jià)。增值評(píng)價(jià)傾向于評(píng)價(jià)知識(shí)等行為性表現(xiàn),成績(jī)的增值其實(shí)是學(xué)生知識(shí)量的積累,但這會(huì)導(dǎo)致學(xué)生掌握知識(shí)以外的能力被忽視,甚至?xí)乖u(píng)價(jià)改進(jìn)和發(fā)展的目的傾向于選拔和診斷的舊式評(píng)價(jià),導(dǎo)致全面?zhèn)€性發(fā)展的教育理念在教育活動(dòng)中被遺忘。其次,評(píng)價(jià)內(nèi)容傾向于學(xué)業(yè)成績(jī),缺乏對(duì)除學(xué)生學(xué)科成績(jī)以外的思想意識(shí)、學(xué)習(xí)能力、人際交往能力等方面的分析和判斷[5],窄化了評(píng)價(jià)內(nèi)容范圍,忽視了教育過程中思維、行動(dòng)及個(gè)性等方面的發(fā)展。增值評(píng)價(jià)打著“增值”的口號(hào),卻只追求知識(shí)“增量”,缺乏真正全面發(fā)展意義上的“增值”,加重了“唯分?jǐn)?shù)”主義,走上了應(yīng)試教育的老路。最后,將數(shù)據(jù)增值視為學(xué)生進(jìn)步程度,掩蓋了學(xué)生成長“質(zhì)”的本質(zhì)。這些應(yīng)試評(píng)價(jià)舉動(dòng)嚴(yán)重阻礙立德樹人根本任務(wù)的落實(shí),也將教育增值評(píng)價(jià)引向“唯分?jǐn)?shù)”的錯(cuò)誤軌道。
1.2 增值評(píng)價(jià)實(shí)施:效度偏低
評(píng)價(jià)的實(shí)施在一定程度上決定著增值評(píng)價(jià)的信效度,進(jìn)而直接影響教育增值評(píng)價(jià)內(nèi)在功能的有效發(fā)揮。增值評(píng)價(jià)在實(shí)施中存在如下問題。
首先,增值評(píng)價(jià)標(biāo)準(zhǔn)缺失。評(píng)價(jià)標(biāo)準(zhǔn)是對(duì)教育活動(dòng)數(shù)量或質(zhì)量的要求和規(guī)定,同時(shí)也是對(duì)教育教學(xué)現(xiàn)象進(jìn)行有效價(jià)值判斷的尺度和依據(jù)[6]。目前,現(xiàn)有的理論研究主要集中于增值評(píng)價(jià)的理論基礎(chǔ)、內(nèi)涵界定、意義等方面,借鑒國外增值評(píng)價(jià)經(jīng)驗(yàn)論述我國增值評(píng)價(jià)研究應(yīng)用情況,對(duì)增值評(píng)價(jià)的應(yīng)用標(biāo)準(zhǔn)及方法模型適用性缺乏論證,缺少增值評(píng)價(jià)適用條件范圍的界定和說明等相關(guān)研究。就算提及評(píng)價(jià)標(biāo)準(zhǔn)一詞,也主要是在宏觀層面對(duì)評(píng)價(jià)標(biāo)準(zhǔn)提出要求,沒有具體的標(biāo)準(zhǔn)界定。此外,從增值評(píng)價(jià)應(yīng)用研究和實(shí)際操作來看,實(shí)施方案的標(biāo)準(zhǔn)闡述得過于籠統(tǒng)寬泛,實(shí)施指標(biāo)的標(biāo)準(zhǔn)界限不明確或直接缺失,對(duì)指標(biāo)維度標(biāo)準(zhǔn)也沒有完整詳細(xì)的陳述和規(guī)定,且大部分評(píng)價(jià)實(shí)施細(xì)則對(duì)教育質(zhì)量增值評(píng)價(jià)的標(biāo)準(zhǔn)并沒有明確說明,這無疑將增值評(píng)價(jià)引向一種適用于一切活動(dòng)評(píng)價(jià)的錯(cuò)誤方向。
其次,增值評(píng)價(jià)模型的準(zhǔn)確性不能保證。當(dāng)前比較流行的增值評(píng)價(jià)模型包括增益分?jǐn)?shù)模型(gain score model)、協(xié)變量校正模型(covariant adjustment model)、田納西模型(Tennessee value?added assessment model)、交叉分類模型(cross?classified model)等,但到底哪些模型更準(zhǔn)確、更易于操作還需要研究探討[7]?;诹炕臄?shù)據(jù)指標(biāo)評(píng)價(jià)模型存在隨機(jī)誤差,加之缺乏針對(duì)數(shù)據(jù)缺失模型的科學(xué)計(jì)算方法,在實(shí)施評(píng)價(jià)時(shí)難以避免數(shù)據(jù)缺失帶來的結(jié)果誤差,由此導(dǎo)致增值分析結(jié)果有效性得不到保證。此外,增值評(píng)價(jià)模型適用條件有限,對(duì)簡(jiǎn)單的階段成績(jī)、學(xué)校間成績(jī)及各學(xué)科間成績(jī)等可以進(jìn)行比較分析,但不能對(duì)處于同一水平的學(xué)生個(gè)體發(fā)展情況進(jìn)行分析。例如在利用成長百分等級(jí)模型進(jìn)行評(píng)價(jià)時(shí),依據(jù)學(xué)生的數(shù)次考試成績(jī)或測(cè)驗(yàn)數(shù)據(jù)來評(píng)估其在班級(jí)、年級(jí)或全區(qū)中相對(duì)位次的變化,這種方法能夠大致判斷學(xué)生是否取得進(jìn)步,但無法客觀比較不同起點(diǎn)學(xué)生的進(jìn)步程度,也無法避免“天花板”效應(yīng)和“地板”效應(yīng)[8]。由于評(píng)價(jià)模型適用條件限制,難以呈現(xiàn)優(yōu)秀學(xué)生真正的發(fā)展?fàn)顩r,同樣也缺少針對(duì)落后學(xué)生發(fā)展的針對(duì)性分析;因此,增值評(píng)價(jià)方法被簡(jiǎn)化,評(píng)價(jià)模型誤差無法解決,以及“天花板”和“地板”效應(yīng)無法破解等問題直接反映了增值評(píng)價(jià)模型存在效度問題。
最后,增值評(píng)價(jià)重視數(shù)據(jù)分析,但價(jià)值判斷不足。評(píng)價(jià)判斷的最后目標(biāo)是發(fā)現(xiàn)或揭示更深一層的數(shù)據(jù)和關(guān)系,這些數(shù)據(jù)和關(guān)系將使一種更充分的價(jià)值判斷成為可能[9]。對(duì)數(shù)據(jù)的分析是更為客觀深刻的價(jià)值判斷,增值評(píng)價(jià)的數(shù)據(jù)量化分析是對(duì)數(shù)據(jù)呈現(xiàn)出的量化關(guān)系及其現(xiàn)象背后深層次原因的分析,但實(shí)際操作中往往把重心放在數(shù)據(jù)結(jié)果分析上而缺乏真實(shí)意義上的價(jià)值判斷。例如在學(xué)生學(xué)業(yè)水平增值評(píng)價(jià)中,有研究對(duì)學(xué)生和教師變量數(shù)據(jù)進(jìn)行了大量差異比較分析,但對(duì)差異背后的原因分析和闡述卻只有簡(jiǎn)短的一小段話[10]?;诹炕瘮?shù)據(jù)處理結(jié)果為主的評(píng)價(jià),依賴高水平評(píng)價(jià)技術(shù),很容易忽視價(jià)值存在主體而喪失真正意義上的價(jià)值判斷。人是事實(shí)價(jià)值存在的載體,增值評(píng)價(jià)出現(xiàn)價(jià)值判斷不足現(xiàn)象很大程度上是因?yàn)樵u(píng)價(jià)忽視了“人”的價(jià)值主體存在的意義,缺乏根據(jù)評(píng)價(jià)目標(biāo)對(duì)數(shù)據(jù)進(jìn)行理論和實(shí)踐意義上的分析,這不僅使評(píng)價(jià)過程弱化了價(jià)值判斷,還大大降低了增值評(píng)價(jià)的完整性和有效性。
1.3 增值評(píng)價(jià)結(jié)果反饋:實(shí)效性差
反饋實(shí)效性是指反饋得出決策的可行性及決策實(shí)施效果的目的性。增值評(píng)價(jià)的實(shí)施效度直接影響評(píng)價(jià)結(jié)果的有效性,而評(píng)價(jià)結(jié)果的有效性又影響決策建議的可行性。評(píng)價(jià)結(jié)果的呈現(xiàn)方式和評(píng)價(jià)結(jié)果的使用是教育評(píng)價(jià)的價(jià)值能否有效發(fā)揮的關(guān)鍵[11]。教育增值評(píng)價(jià)的結(jié)果呈現(xiàn)方式和結(jié)果使用存在以下問題。
一是評(píng)價(jià)結(jié)果量表化,結(jié)論缺乏深度。第一代教育評(píng)價(jià)為教育測(cè)驗(yàn)或測(cè)量;第二代教育評(píng)價(jià)為了便于評(píng)價(jià)而將學(xué)習(xí)目標(biāo)采用行為目標(biāo)方式來表述,行為目標(biāo)的提出使評(píng)價(jià)代替了測(cè)驗(yàn);自第三代教育評(píng)價(jià)起,強(qiáng)調(diào)過程評(píng)價(jià),注重質(zhì)性與定性相結(jié)合。從教育評(píng)價(jià)發(fā)展歷程可以看出,評(píng)價(jià)活動(dòng)離不開測(cè)量,教育評(píng)價(jià)就是對(duì)教育活動(dòng)進(jìn)行測(cè)量。測(cè)量一詞帶有很強(qiáng)的量化傾向,就目前而言,增值評(píng)價(jià)在依賴大數(shù)據(jù)的背景下對(duì)評(píng)價(jià)內(nèi)容進(jìn)行量化陳述,致使評(píng)價(jià)結(jié)果數(shù)據(jù)量表化傾向嚴(yán)重,使結(jié)論反饋內(nèi)容過于表面化或形式化,數(shù)據(jù)的價(jià)值意義得不到全面體現(xiàn),一定程度上降低了增值評(píng)價(jià)的專業(yè)性和效用性。量化價(jià)值判斷標(biāo)準(zhǔn)的指標(biāo)是量化的,其指標(biāo)的約束條件也是量化的[12],但量化的分析判斷結(jié)論不是量化的,所以評(píng)價(jià)得出的結(jié)論不應(yīng)只是量表化呈現(xiàn)。同時(shí),如果結(jié)論描述過于籠統(tǒng)且空泛,則很難聚焦具體實(shí)際問題給出有針對(duì)性的改進(jìn)建議。此外,反饋結(jié)論缺少專業(yè)解釋,運(yùn)用高級(jí)統(tǒng)計(jì)模型處理數(shù)據(jù)后得出的結(jié)果也更為復(fù)雜,需要專業(yè)人員進(jìn)行分析和解釋。一般評(píng)價(jià)者可以分析簡(jiǎn)單的百分?jǐn)?shù)或線性回歸結(jié)果,但對(duì)大規(guī)模的綜合數(shù)據(jù)庫進(jìn)行統(tǒng)計(jì)分析具有較大困難;因此,教育增值評(píng)價(jià)的實(shí)施者和結(jié)果使用者需要具備一定的評(píng)價(jià)技術(shù)及數(shù)據(jù)意義挖掘能力。
二是評(píng)價(jià)結(jié)果利用不充分,達(dá)不到改進(jìn)目的。增值評(píng)價(jià)以促進(jìn)學(xué)生發(fā)展為目的,評(píng)價(jià)應(yīng)帶有改進(jìn)、發(fā)展和教育功能,但實(shí)踐中往往止步于發(fā)布評(píng)價(jià)報(bào)告,后期結(jié)果的運(yùn)用效果、整改效果等沒有進(jìn)一步跟進(jìn)。評(píng)價(jià)是為了改進(jìn),改進(jìn)需要準(zhǔn)確理解和運(yùn)用結(jié)果反饋信息,及時(shí)跟進(jìn)整改效果才能充分發(fā)揮評(píng)價(jià)的功能,否則會(huì)導(dǎo)致評(píng)價(jià)走向形式主義。教育評(píng)價(jià)的效度包含目的、過程、功能及結(jié)果等內(nèi)容體系,各個(gè)效度之間具有較強(qiáng)的邏輯關(guān)系,每一內(nèi)容效度出現(xiàn)問題都將直接影響評(píng)價(jià)的整體效度。因此,要保證評(píng)價(jià)結(jié)果的效度,需要從整體考慮評(píng)價(jià)帶來的作用及價(jià)值效能的發(fā)揮,拓寬結(jié)果使用范圍,增強(qiáng)反饋結(jié)論的可理解性和可操作性,提高決策建議的目的性和可行性。
從實(shí)踐論的評(píng)價(jià)范式來看,增值評(píng)價(jià)對(duì)教育評(píng)價(jià)實(shí)踐和發(fā)展、對(duì)促進(jìn)教育教學(xué)進(jìn)步具有重要的推動(dòng)作用。從教育增值評(píng)價(jià)的實(shí)踐來看,制約教育增值評(píng)價(jià)發(fā)展的原因主要有以下4個(gè)方面。
2.1 對(duì)教育評(píng)價(jià)和教學(xué)評(píng)價(jià)存在認(rèn)識(shí)誤區(qū)
教學(xué)評(píng)價(jià)是一種認(rèn)識(shí)活動(dòng),是對(duì)教學(xué)活動(dòng)的測(cè)驗(yàn)、分析和評(píng)定。教學(xué)活動(dòng)的直接對(duì)象是學(xué)生,促進(jìn)學(xué)生學(xué)習(xí)是評(píng)價(jià)發(fā)生的核心內(nèi)涵。在闡述教學(xué)評(píng)價(jià)和教育評(píng)價(jià)時(shí),容易把二者混淆或等同。一方面,在對(duì)教學(xué)評(píng)價(jià)和教育評(píng)價(jià)下定義時(shí)隨意性強(qiáng),概念邊界模糊,評(píng)價(jià)者容易將教育評(píng)價(jià)視為教學(xué)評(píng)價(jià)。另一方面,對(duì)二者內(nèi)容區(qū)分不清晰,狹義的教育評(píng)價(jià)認(rèn)為教學(xué)評(píng)價(jià)就是教育評(píng)價(jià),廣義的教育評(píng)價(jià)則認(rèn)為教學(xué)評(píng)價(jià)只是教育評(píng)價(jià)的一部分。實(shí)際上,現(xiàn)代教學(xué)評(píng)價(jià)強(qiáng)調(diào)教學(xué)活動(dòng)對(duì)學(xué)生認(rèn)知、情感、動(dòng)作技能發(fā)展的綜合促進(jìn)作用,提倡從學(xué)生多方面的發(fā)展結(jié)果來衡量、評(píng)判教師的教學(xué)質(zhì)量和水平,并注重對(duì)教學(xué)活動(dòng)過程的靜態(tài)和動(dòng)態(tài)進(jìn)行全程評(píng)價(jià)[13],教學(xué)評(píng)價(jià)的內(nèi)容是個(gè)體的認(rèn)知、情感和動(dòng)作技能等微觀方面,限于對(duì)教學(xué)活動(dòng)過程中對(duì)象內(nèi)部的表現(xiàn)進(jìn)行評(píng)價(jià)。教育評(píng)價(jià)涉及的內(nèi)容除了教學(xué)活動(dòng)外,還包括參與教育活動(dòng)的全部主體及影響教育發(fā)展的一切因素,如行政工作、教學(xué)管理工作、學(xué)校后勤服務(wù)工作等,評(píng)價(jià)對(duì)象涉及教育的全部領(lǐng)域。如果不能準(zhǔn)確把握教學(xué)評(píng)價(jià)與教育評(píng)價(jià)的內(nèi)容,在操作過程中會(huì)使教學(xué)評(píng)價(jià)內(nèi)容擴(kuò)大化,缺乏針對(duì)性,也會(huì)使教育評(píng)價(jià)內(nèi)容窄化,失去教育評(píng)價(jià)的整體意義。
2.2 量化方法難以保證評(píng)價(jià)的真實(shí)性
行為目標(biāo)評(píng)價(jià)法采用可觀測(cè)的行為目標(biāo)作為評(píng)價(jià)依據(jù),其實(shí)質(zhì)是評(píng)價(jià)內(nèi)容的具體化和評(píng)價(jià)標(biāo)準(zhǔn)的客觀化[14]。在行為目標(biāo)的測(cè)量和評(píng)估中經(jīng)常對(duì)評(píng)價(jià)對(duì)象加以量化,量化是以數(shù)量為衡量標(biāo)準(zhǔn)的科學(xué)方法,教育增值評(píng)價(jià)內(nèi)容的確定在一定程度上取決于對(duì)內(nèi)容加以量化測(cè)量的可能性?;诖髷?shù)據(jù)的增值評(píng)價(jià)傾向于量化行為目標(biāo)。首先,行為表現(xiàn)易于量化描述。教育活動(dòng)中學(xué)生、教師的行為表現(xiàn)更容易進(jìn)行量化表征,如教學(xué)過程中學(xué)生主動(dòng)提問的次數(shù)、教師回應(yīng)學(xué)生提問的次數(shù)、學(xué)生參與討論的次數(shù)等,但諸如此類的測(cè)量并不能反映客觀事物全部,它雖然可以測(cè)量學(xué)生的知識(shí),卻難以測(cè)量學(xué)生的學(xué)習(xí)態(tài)度、興趣及情感等。測(cè)量只能針對(duì)學(xué)習(xí)者特定的、有限的行為進(jìn)行,難以全面、準(zhǔn)確地反映學(xué)習(xí)者的真實(shí)狀態(tài)和學(xué)習(xí)成果[15]。其次,評(píng)價(jià)時(shí)難以對(duì)情境性表現(xiàn)進(jìn)行追蹤測(cè)量。增值評(píng)價(jià)對(duì)教育過程中一些特定的、穩(wěn)定的表征進(jìn)行追蹤相對(duì)容易,如教育活動(dòng)中的學(xué)科教學(xué)活動(dòng)表現(xiàn)、學(xué)生學(xué)習(xí)行為表現(xiàn)、課堂特定環(huán)境等,但該過程包含的教育思想、情感及道德思維等不易追蹤的表現(xiàn)則難以進(jìn)行量化測(cè)量。教育活動(dòng)中影響學(xué)生學(xué)習(xí)活動(dòng)的學(xué)習(xí)內(nèi)容、學(xué)習(xí)方式和學(xué)生認(rèn)知特征等環(huán)境總和是構(gòu)成教育情境的要素,這些要素再現(xiàn)了教育情境的復(fù)雜性和多樣性,而教育活動(dòng)的復(fù)雜性、多樣性又導(dǎo)致評(píng)價(jià)無法準(zhǔn)確描述不同情境的具體表現(xiàn)內(nèi)容。因此,量化不是萬能的,量化雖然把復(fù)雜的教育現(xiàn)象簡(jiǎn)單化,但“它不僅無法從本質(zhì)上保證評(píng)價(jià)的真實(shí)性,而且往往會(huì)丟失教育中最有意義、最根本的內(nèi)容”[16]。
2.3 對(duì)增值數(shù)據(jù)意義的挖掘不充分
對(duì)增值數(shù)據(jù)的解釋和深度挖掘,是教育增值評(píng)價(jià)有效實(shí)施的重要前提條件。但就現(xiàn)狀而言,評(píng)價(jià)實(shí)施過程過于注重量化數(shù)據(jù)指標(biāo),并沒有注意到數(shù)據(jù)背后的意義,造成這種現(xiàn)象的原因主要有2個(gè):一是相對(duì)比較法沒有充分運(yùn)用。目前對(duì)學(xué)生的增值評(píng)價(jià)一般采用個(gè)體內(nèi)縱向比較,缺乏學(xué)生同知識(shí)水平和整體的比較分析。由于不同水平之間的增值空間不一樣,所以會(huì)出現(xiàn)“天花板”效應(yīng)和“地板”效應(yīng),基礎(chǔ)較好的學(xué)生在進(jìn)行個(gè)體內(nèi)比較時(shí)進(jìn)步幅度不明顯,基礎(chǔ)較差的學(xué)生在個(gè)體內(nèi)比較時(shí)雖然能激發(fā)學(xué)習(xí)動(dòng)力,但可能讓學(xué)生滿足于個(gè)體內(nèi)進(jìn)步,降低學(xué)業(yè)追求。二是分?jǐn)?shù)進(jìn)步原因分析不夠深入。對(duì)分?jǐn)?shù)增值的分析僅看到學(xué)生的學(xué)科成績(jī)提高,即卷面分?jǐn)?shù)提高,對(duì)其背后原因分析不夠深入,如沒有考慮學(xué)生在一段時(shí)間內(nèi)的分?jǐn)?shù)進(jìn)步可能受題型難易程度、學(xué)習(xí)努力程度、教學(xué)方法改進(jìn)與變化等因素影響,這是運(yùn)用增值評(píng)價(jià)方法的共性問題。不同測(cè)試形式的評(píng)價(jià)內(nèi)容會(huì)不同質(zhì),只描述學(xué)生成長過程的做法無法準(zhǔn)確分析影響學(xué)生成長的諸多因素。此外,已有研究多止步于通過增值數(shù)據(jù)大小判斷學(xué)生進(jìn)步程度,雖然也嘗試解讀分?jǐn)?shù)提高的原因,但實(shí)際評(píng)價(jià)中往往趨于表面,沒有具體對(duì)應(yīng)的評(píng)價(jià)模型或分析解讀策略。
2.4 教育評(píng)價(jià)主體能力不足
教育增值評(píng)價(jià)的主體是評(píng)價(jià)活動(dòng)的組織者和實(shí)施者。組織者對(duì)評(píng)價(jià)思想和評(píng)價(jià)價(jià)值的把握直接影響評(píng)價(jià)活動(dòng)目的和標(biāo)準(zhǔn)的確定,實(shí)施者對(duì)評(píng)價(jià)標(biāo)準(zhǔn)和目的的正確理解是評(píng)價(jià)有效實(shí)施的前提條件。評(píng)價(jià)主體對(duì)評(píng)價(jià)指標(biāo)體系的健全是實(shí)施評(píng)價(jià)的基礎(chǔ),對(duì)數(shù)據(jù)背后意義的充分挖掘是評(píng)價(jià)結(jié)論具有實(shí)效性的必要程序。在教育增值評(píng)價(jià)中,評(píng)價(jià)主體存在能力與評(píng)價(jià)需要不匹配的現(xiàn)象。其一,評(píng)價(jià)指標(biāo)體系健全能力有限。評(píng)價(jià)指標(biāo)是評(píng)價(jià)內(nèi)容的具體項(xiàng)目,直接影響教育目標(biāo)、內(nèi)容及方法的確定和使用,評(píng)價(jià)指標(biāo)具有公平性和有效性是評(píng)價(jià)活動(dòng)可持續(xù)推進(jìn)的重要基礎(chǔ)。由于受評(píng)價(jià)主體理論知識(shí)缺乏、專業(yè)經(jīng)驗(yàn)欠缺、預(yù)測(cè)能力弱等影響和限制,在實(shí)施評(píng)價(jià)時(shí)依然存在指標(biāo)權(quán)重嚴(yán)重失衡的現(xiàn)象。比如,個(gè)別指標(biāo)占比突出,不同指標(biāo)維度之間占比相差較大,增值賦權(quán)缺乏科學(xué)依據(jù),指標(biāo)維度下具體內(nèi)容占比隨意等。增值評(píng)價(jià)的指標(biāo)和權(quán)重都具有強(qiáng)大的導(dǎo)向性,如果評(píng)價(jià)指標(biāo)失衡,則所有的評(píng)價(jià)活動(dòng)都將失去評(píng)價(jià)價(jià)值。其二,評(píng)價(jià)主體數(shù)據(jù)挖掘能力有限。數(shù)據(jù)挖掘能力表現(xiàn)為能得出學(xué)生學(xué)習(xí)成績(jī)以外的學(xué)習(xí)態(tài)度、學(xué)習(xí)動(dòng)機(jī)、學(xué)習(xí)策略等方面的進(jìn)步與發(fā)展。數(shù)據(jù)是評(píng)價(jià)實(shí)踐中最重要的資源,“通過數(shù)據(jù)挖掘可以找準(zhǔn)規(guī)律、發(fā)現(xiàn)問題、預(yù)測(cè)趨勢(shì),從而提高評(píng)價(jià)的應(yīng)用效能和專業(yè)水平”[17]。學(xué)生成長的數(shù)據(jù)庫不應(yīng)僅是成績(jī)數(shù)據(jù),還應(yīng)包括學(xué)習(xí)過程的所有影響因素。由于評(píng)價(jià)研究人員和管理人員統(tǒng)計(jì)分析知識(shí)不足,對(duì)數(shù)據(jù)的挖掘也僅從量化結(jié)果得出結(jié)論,分析層級(jí)單一,缺少整體視角,缺乏結(jié)合相關(guān)影響主體的分析,評(píng)價(jià)數(shù)據(jù)的應(yīng)用價(jià)值沒有得到充分體現(xiàn)。因此,在信息技術(shù)高速發(fā)展的時(shí)代背景下,教育增值評(píng)價(jià)者的專業(yè)性有待進(jìn)一步提高,教育增值評(píng)價(jià)主體的能力需要與時(shí)俱進(jìn)。
通過對(duì)教育增值評(píng)價(jià)現(xiàn)有問題進(jìn)行分析發(fā)現(xiàn),教育增值評(píng)價(jià)應(yīng)圍繞立德樹人根本任務(wù)開展評(píng)價(jià)活動(dòng),從而避免其落入技術(shù)異化窠臼。
3.1 厘清增值理念本質(zhì),正確認(rèn)識(shí)教育增值評(píng)價(jià)導(dǎo)向
“教育增值”理念的提出為增值評(píng)價(jià)奠定了理論基礎(chǔ)。只有正確認(rèn)識(shí)和理解增值理念,把握增值的價(jià)值,洞悉增值是學(xué)生發(fā)展的本質(zhì),才能真正立足學(xué)生發(fā)展的教育目的而開展教育活動(dòng)?;诖?,可以從以下2個(gè)方面樹立正確的增值理念,進(jìn)而厘清增值評(píng)價(jià)中增值的本質(zhì)。一方面,樹立正確的評(píng)價(jià)導(dǎo)向,摒棄用學(xué)生成績(jī)?cè)u(píng)一切的做法。學(xué)校應(yīng)樹立正確的育人導(dǎo)向,一切以學(xué)生未來發(fā)展為重點(diǎn),成績(jī)只是評(píng)價(jià)依據(jù)的組成部分,而不是教育活動(dòng)的全部?jī)?nèi)容。學(xué)校應(yīng)該打破把學(xué)生成績(jī)作為教師教學(xué)評(píng)價(jià)主要依據(jù)、以成績(jī)判斷教師教學(xué)能力和教育質(zhì)量的思維范式。另一方面,教師應(yīng)積極發(fā)揮增值導(dǎo)向作用,關(guān)注學(xué)生全面而有個(gè)性的發(fā)展。班主任及科任教師建立學(xué)期、學(xué)年增值評(píng)價(jià)系統(tǒng),完整記錄學(xué)生進(jìn)入學(xué)校以來的所有情況,包括成績(jī)數(shù)據(jù)、德育表現(xiàn)、體育表現(xiàn)及其他有關(guān)學(xué)生成長的獲獎(jiǎng)資料,并不斷完善評(píng)價(jià)資料庫。各學(xué)科教師應(yīng)將教與評(píng)一體化,關(guān)注學(xué)生過程性發(fā)展,將過程性評(píng)價(jià)資料與成績(jī)數(shù)據(jù)結(jié)合起來分析、判斷學(xué)生的學(xué)習(xí)效果。
3.2 設(shè)置增值評(píng)價(jià)培訓(xùn)課程,提高評(píng)價(jià)者的增值評(píng)價(jià)能力
在大數(shù)據(jù)時(shí)代,要利用評(píng)價(jià)結(jié)果數(shù)據(jù)驅(qū)動(dòng)教育質(zhì)量提升,“教育管理者和廣大教師必須不斷提高數(shù)據(jù)應(yīng)用意識(shí)和數(shù)據(jù)解讀能力,善于挖掘數(shù)據(jù)背后的價(jià)值,以更好地服務(wù)于學(xué)校改革、區(qū)域改進(jìn)以及科學(xué)決策”[18]。當(dāng)前,評(píng)價(jià)者對(duì)數(shù)據(jù)的認(rèn)識(shí)和分析并不全面,只能看到數(shù)據(jù)反映的表面內(nèi)容,無法從不同視角、利用不同方法解讀大數(shù)據(jù)背后的真正意義。要使增值評(píng)價(jià)落地,就要培養(yǎng)增值評(píng)價(jià)專業(yè)技術(shù)人員,可以聘請(qǐng)?jiān)鲋翟u(píng)價(jià)領(lǐng)域的專家和一線實(shí)踐者開發(fā)增值評(píng)價(jià)培訓(xùn)課程,從上到下形成聯(lián)動(dòng)機(jī)制,評(píng)價(jià)主體部門建立增值評(píng)價(jià)培訓(xùn)制度,地方學(xué)校確定人員參加培訓(xùn)。首先,開展增值評(píng)價(jià)理論基礎(chǔ)培訓(xùn)。由評(píng)價(jià)專家向?qū)W習(xí)者講授增值評(píng)價(jià)發(fā)展歷程、基本內(nèi)涵及意義等,引導(dǎo)評(píng)價(jià)者深入理解增值評(píng)價(jià),以便在實(shí)施評(píng)價(jià)時(shí)準(zhǔn)確把握評(píng)價(jià)目的并創(chuàng)新融合增值評(píng)價(jià)運(yùn)用。其次,開展增值評(píng)價(jià)數(shù)據(jù)統(tǒng)計(jì)方法培訓(xùn),特別是對(duì)數(shù)據(jù)解讀和意義挖掘能力的培訓(xùn)。增值評(píng)價(jià)相對(duì)結(jié)果評(píng)價(jià)、過程評(píng)價(jià),對(duì)評(píng)價(jià)技術(shù)要求更高,應(yīng)在基礎(chǔ)數(shù)據(jù)統(tǒng)計(jì)方法的基礎(chǔ)上設(shè)置高級(jí)統(tǒng)計(jì)分析方法課程,如回歸分析、交叉分析及多種數(shù)據(jù)來源分析等。最后,地方學(xué)校為教學(xué)人員開設(shè)培訓(xùn)講座,邀請(qǐng)有增值評(píng)價(jià)經(jīng)驗(yàn)的一線教師分享經(jīng)驗(yàn),為新手提供可靠的增值評(píng)價(jià)實(shí)踐經(jīng)驗(yàn),以便其更好地實(shí)施評(píng)價(jià)活動(dòng),從而有利于教學(xué)的改進(jìn)并最終促進(jìn)學(xué)生全面而有個(gè)性的發(fā)展。
3.3 創(chuàng)建評(píng)價(jià)數(shù)據(jù)鏈接平臺(tái),提升教育增值評(píng)價(jià)的專業(yè)化程度
教育增值評(píng)價(jià)專業(yè)化和精準(zhǔn)化需要大量完整的數(shù)據(jù)信息,而完整的數(shù)據(jù)信息需要借助信息技術(shù)對(duì)靜態(tài)和動(dòng)態(tài)信息進(jìn)行長期的收集和整理。目前,教育增值評(píng)價(jià)數(shù)據(jù)缺失現(xiàn)象嚴(yán)重,評(píng)價(jià)的效用得不到保障?;诖?,健全教育評(píng)價(jià)數(shù)據(jù)庫,創(chuàng)建不同主體間數(shù)據(jù)信息鏈條尤其重要。首先,依靠智能技術(shù)收集學(xué)生發(fā)展全過程、全方面的數(shù)據(jù)。通過大數(shù)據(jù)、人工智能技術(shù)采集學(xué)生的知識(shí)、情感、態(tài)度、思維、道德行為等全過程數(shù)據(jù)[19],并利用信息技術(shù)整理、存儲(chǔ)過程性的動(dòng)態(tài)情境數(shù)據(jù)。其次,創(chuàng)建學(xué)生、教師、學(xué)校等數(shù)據(jù)庫之間的鏈接,達(dá)到數(shù)據(jù)之間的有效整合。教育增值評(píng)價(jià)需要學(xué)生、教師、學(xué)校等主體間的數(shù)據(jù)進(jìn)行有效鏈接,以形成一個(gè)完整的追蹤數(shù)據(jù)庫,為教育增值評(píng)價(jià)有效開展創(chuàng)建完整的數(shù)據(jù)信息鏈條。最后,為數(shù)據(jù)庫建立共享平臺(tái),實(shí)現(xiàn)數(shù)據(jù)共享。教育增值評(píng)價(jià)是一項(xiàng)極其復(fù)雜且專業(yè)程度較高的評(píng)價(jià)活動(dòng),教育活動(dòng)中涉及的要素及產(chǎn)生的各類發(fā)展變化數(shù)據(jù)繁雜,因此,要充分利用現(xiàn)代信息技術(shù)賦能教育增值評(píng)價(jià)。在評(píng)價(jià)對(duì)象數(shù)據(jù)完整且具備共享的基礎(chǔ)上搭建數(shù)據(jù)信息共享平臺(tái),提供各個(gè)對(duì)象的全過程數(shù)據(jù)信息,實(shí)現(xiàn)數(shù)據(jù)收集、處理和共享一體化。平臺(tái)系統(tǒng)包含所有采集的信息及統(tǒng)計(jì)分析結(jié)果,評(píng)價(jià)者和研究人員能夠隨時(shí)調(diào)取數(shù)據(jù),實(shí)現(xiàn)不同主體數(shù)據(jù)的共享,避免由數(shù)據(jù)缺失引起的評(píng)價(jià)誤差問題,提高評(píng)價(jià)活動(dòng)的有效性和精準(zhǔn)性。
3.4 兼顧融合多種評(píng)價(jià)方式,提高教育增值評(píng)價(jià)實(shí)施的有效性
評(píng)價(jià)方法或手段的科學(xué)性和有效性對(duì)教育增值評(píng)價(jià)實(shí)施效度具有深刻的影響?,F(xiàn)有的增值評(píng)價(jià)方式簡(jiǎn)化了過程性發(fā)展,忽視了不同水平學(xué)生增值空間不同的特征,導(dǎo)致學(xué)生個(gè)體內(nèi)相對(duì)進(jìn)步效度低,群體間絕對(duì)進(jìn)步不顯著。對(duì)此,在數(shù)據(jù)完備的基礎(chǔ)上,教育活動(dòng)需要?jiǎng)?chuàng)新融合評(píng)價(jià)方式方法,激發(fā)學(xué)生發(fā)展的可能性,促進(jìn)不同水平學(xué)生增值空間的最大限度開發(fā)。其一,充分運(yùn)用常模參照評(píng)價(jià)方式,提高學(xué)生個(gè)體的絕對(duì)進(jìn)步程度。轉(zhuǎn)變用個(gè)體成績(jī)計(jì)算一切的傳統(tǒng)評(píng)價(jià)方式,充分利用常模參照評(píng)價(jià)厘清學(xué)生個(gè)體在群體中的水平位置。在常模參照物的作用下,“借助大數(shù)據(jù)技術(shù)、云計(jì)算等方式把數(shù)據(jù)轉(zhuǎn)化為可以獲利和增值的資本”[20]。其二,定性評(píng)價(jià)和定量評(píng)價(jià)相結(jié)合,提升個(gè)體相對(duì)水平的增值空間。以教育測(cè)量為基礎(chǔ),在數(shù)據(jù)庫完整的前提下,充分利用完備的數(shù)據(jù)資料,運(yùn)用數(shù)學(xué)統(tǒng)計(jì)分析方法對(duì)教育活動(dòng)中學(xué)生的過程性發(fā)展情況進(jìn)行動(dòng)態(tài)評(píng)價(jià)。同時(shí),增加質(zhì)性評(píng)價(jià),對(duì)照教育教學(xué)活動(dòng)中學(xué)生的動(dòng)態(tài)表現(xiàn)、行為表現(xiàn)及情感態(tài)度表現(xiàn)等作出客觀實(shí)際的價(jià)值判斷。評(píng)價(jià)者應(yīng)利用專業(yè)知識(shí)、實(shí)踐經(jīng)驗(yàn)和判斷標(biāo)準(zhǔn)給出評(píng)語或等級(jí),充分關(guān)注學(xué)生的優(yōu)缺點(diǎn),既要注重學(xué)生絕對(duì)的進(jìn)步,也要關(guān)注學(xué)生相對(duì)的發(fā)展空間,堅(jiān)持多維度、多視角評(píng)價(jià)學(xué)生的連續(xù)性進(jìn)步。其三,自評(píng)與他評(píng)相結(jié)合,促進(jìn)學(xué)生全面發(fā)展。增值評(píng)價(jià)不只是評(píng)價(jià)者對(duì)教育活動(dòng)中學(xué)生主體的評(píng)價(jià),也可以是學(xué)生內(nèi)部評(píng)價(jià)。提高教育增值評(píng)價(jià)的信度和效度,需要將自我評(píng)價(jià)與他人評(píng)價(jià)相結(jié)合??傊盐赵鲋翟u(píng)價(jià)是量化與質(zhì)性相結(jié)合的評(píng)價(jià),它不是靜態(tài)的固定評(píng)價(jià),不能僅局限于學(xué)業(yè)成績(jī)的輸入與產(chǎn)出量化數(shù)據(jù)的結(jié)果性評(píng)價(jià),否則會(huì)將增值評(píng)價(jià)禁錮于數(shù)字符號(hào)評(píng)價(jià)模式,降低教育增值評(píng)價(jià)實(shí)施的效度。
來源:《中國考試》2022年第10期第31-38頁
作者:王天平,系教育部西南基礎(chǔ)教育課程研究中心副主任,西南大學(xué)教育學(xué)部教授
參考文獻(xiàn):
[1] 中共中央國務(wù)院印發(fā)《深化新時(shí)代教育評(píng)價(jià)改革總體方案》[A/OL]. (2020-10-13) [2021-11-21]. http://www .gov .cn/zhengce/2020- 10/ 13/content_ 555 1032.htm.
[2] 章建石.基于學(xué)生增值發(fā)展的教學(xué)質(zhì)量評(píng)價(jià)與保障研究[M].北京:北京師范大學(xué)出版社,2014: 72.
[3]謝小蓉,張輝蓉.五育并舉視域下學(xué)生增值評(píng)價(jià)的發(fā)展困境與破解策略[J].中國電化教育,2021(11): 32-38.
[4] 王天平。教學(xué)活動(dòng)論[M].北京:人民教育出版社,2019:211.
[5] 羅瀟.何為增值?增什么值?如何測(cè)量增值?對(duì)增值評(píng)價(jià)的三點(diǎn)認(rèn)識(shí)[J].今日教育, 2021(1): 10-13.
[6]李森,鄭嵐.促進(jìn)質(zhì)量提升的課堂教學(xué)評(píng)價(jià)改革[J].課程.教材●教法,2019, 39(12):56-62.
[7]辛濤.探索增值評(píng)價(jià)的幾個(gè)關(guān)鍵問題[J].中小學(xué)管理,2020( 10): 1.
[8] 王帥鳴,姚守梅,王夢(mèng),等.基于成長百分等級(jí)模型開展增值評(píng)價(jià)的實(shí)證研究[J].中國考試,2020(9):46-51.
[9] 康海燕.評(píng)價(jià)與創(chuàng)新型人才:基于杜威價(jià)值哲學(xué)的探討[J].上海師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版), 2015,44(6): 11-16.
[10]胡志橋,鐘陽,汪晶.中小學(xué)生學(xué)業(yè)水平增值評(píng)價(jià)模型的構(gòu)建與實(shí)踐:基于廣州市義務(wù)教育階段陽光評(píng)價(jià)的研究[J].教育理論與實(shí)踐, 2022, 42(11): 18-22.
[11] 彭波,王偉清,張進(jìn)良,等.人工智能視域下教育評(píng)價(jià)改革何以可能[J].當(dāng)代教育論壇,2021(1): 1-15.
[12] 馮平.評(píng)價(jià)論[M].北京:東方出版社,1995: 155.
[13] 李森.現(xiàn)代教學(xué)綱要[M].北京:人民教育出版社,2005: 351.
[14] 胡中鋒.教育評(píng)價(jià)學(xué)[M].北京:中國人民大學(xué)出版社, 2008: 58-59.
[15]陳晨,楊成,王曉燕,等.學(xué)習(xí)測(cè)量:大數(shù)據(jù)時(shí)代教育質(zhì)量提升的新力量[J].現(xiàn)代教育技術(shù),2017, 27(2):33-39.
[16] 涂艷國.教育評(píng)價(jià)[M].北京:高等教育出版社, 2007:94-95.
[17]劉邦奇,袁婷婷,紀(jì)玉超,等.智能技術(shù)賦能教育評(píng)價(jià):內(nèi)涵、總體框架與實(shí)踐路徑[].中國電化教育,2021(8): 16-24.
[18]楊現(xiàn)民,顧佳妮,邢蓓蓓.“互聯(lián)網(wǎng)+”時(shí)代數(shù)據(jù)驅(qū)動(dòng)的教育評(píng)價(jià)體系構(gòu)架與實(shí)踐進(jìn)展[J]浙江師范大學(xué).學(xué)報(bào)(社會(huì)科學(xué)版), 2019, 44(4): 16-26.
[19]楊宗凱.利用信息技術(shù)促進(jìn)教育教學(xué)評(píng)價(jià)改革創(chuàng)新[J]. 人民教育,2020(21): 30-32.
[20]張以哲.數(shù)據(jù)資本權(quán)力:數(shù)字現(xiàn)代性批判的重要維度[J].西南大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2021, 47(1):42-51.