在教育高質量發(fā)展時代,教育增值評價實施過程中存在著應試傾向明顯、評價實施效度偏低、評價結果反饋失效差等問題,在此背景下,如何深度挖掘評價數(shù)據(jù)價值、深入推動教育評價改革,一起隨信息技術上機考試系統(tǒng)小編看看吧——
2020年10月13日,中共中央、國務院印發(fā)《深化新時代教育評價改革總體方案》,提出改進結果評價,強化過程評價,探索增值評價,健全綜合評價[1]。增值評價關注學生在一定時期內(nèi)的進步幅度,面向學生的學習過程,與“唯分數(shù)”的傳統(tǒng)教育評價不同,它更關注學生通過努力產(chǎn)生的發(fā)展變化情況,有利于學校教學管理和教師教學經(jīng)驗總結,對教育評價實踐具有重要意義。然而,在結果評價占主導的評價氛圍中,教育增值理念被遮蔽,甚至引發(fā)了“天花板”效應和“地板”效應,其背后原因值得全面深入分析。
教育評價是改進教育、促進學生發(fā)展的重要途徑,增值評價是教育評價方式之一,將增值概念引入教育評價,使評價更全面、更科學、更有效,有利于學生的進一步發(fā)展和教育質量的進一步提高。在反思和審視教育增值評價現(xiàn)狀時發(fā)現(xiàn),評價取向存在應試傾向,阻礙了評價活動目標和標準的確定;實施過程效度低,降低了評價結果的客觀程度;結果反饋實效差,影響了評價結論使用的有效性。
1.1 增值評價取向:應試傾向明顯
增值是對質量的衡量,質量是教育經(jīng)驗在學生知識、能力和技能等方面帶來的促進程度[2]。評價是根據(jù)一定的標準,對教育活動過程中學生德智體美勞等方面的變化進行價值判斷的過程,目的是促進學生的成長并為教師的教學效果和效率提供反饋。增值評價不應僅僅局限于對學生學業(yè)增值的分析與判定,而應以學生全面發(fā)展為方向,以改進為目的,對學生在教育過程中產(chǎn)生的思想、行為、個性等方面開展增值評價活動。然而,目前增值評價標準過分依賴學業(yè)成績,增值取向變成“成績增值”,教育增值評價陷入“唯分數(shù)”潮流,呈現(xiàn)明顯的應試傾向。增值評價出現(xiàn)應試傾向主要有2方面原因。
一是視分數(shù)進步為增值取向,學生學習目的模糊。教育增值評價試圖消除傳統(tǒng)應試教育思想,打破以學生成績?yōu)橹饕逃繕说母窬?,但其實踐反映的評價依舊以學生成績?yōu)橹?。例如對某高中學校教育教學效能的增值進行評價時,基于學生中考和高考成績,以學生語文、數(shù)學和英語等科成績?yōu)橹鬟M行增值排序。增值評價之所以繼續(xù)把成績作為評價依據(jù),可能是因為成績數(shù)據(jù)的評價分析相對容易,但也反映了“增值評價的開展無法區(qū)分學生是為了考試而學還是為了興趣而學”[3]。更為確切地說,增值評價給學生和教師一種只追求“分數(shù)增值”的錯覺,致使評價依據(jù)以學生學業(yè)成績?yōu)橹鳎⒅貙闪炕蚨鹊耐诰?,但這樣的評價體系培養(yǎng)出來的并不是全面發(fā)展的人,而僅僅是高分學生。評價不能僅僅著眼于考試成績的提高,而要關注學生素質在整體上的提升幅度[4]??荚嚦煽儾⒉皇墙逃娜績?nèi)容,簡單地追求分數(shù)增值,會導致增值評價走向“唯分數(shù)”老路,把教育增值評價推向應試教育深淵。
二是評價內(nèi)容過于狹窄,以知識獲得行為內(nèi)容為主。受教育評價專業(yè)化的影響及增值評價技術的限制,評價證據(jù)普遍以可量化的行為目標表現(xiàn)為主。首先,獲取知識的行為更容易進行量化評價。增值評價傾向于評價知識等行為性表現(xiàn),成績的增值其實是學生知識量的積累,但這會導致學生掌握知識以外的能力被忽視,甚至會使評價改進和發(fā)展的目的傾向于選拔和診斷的舊式評價,導致全面?zhèn)€性發(fā)展的教育理念在教育活動中被遺忘。其次,評價內(nèi)容傾向于學業(yè)成績,缺乏對除學生學科成績以外的思想意識、學習能力、人際交往能力等方面的分析和判斷[5],窄化了評價內(nèi)容范圍,忽視了教育過程中思維、行動及個性等方面的發(fā)展。增值評價打著“增值”的口號,卻只追求知識“增量”,缺乏真正全面發(fā)展意義上的“增值”,加重了“唯分數(shù)”主義,走上了應試教育的老路。最后,將數(shù)據(jù)增值視為學生進步程度,掩蓋了學生成長“質”的本質。這些應試評價舉動嚴重阻礙立德樹人根本任務的落實,也將教育增值評價引向“唯分數(shù)”的錯誤軌道。
1.2 增值評價實施:效度偏低
評價的實施在一定程度上決定著增值評價的信效度,進而直接影響教育增值評價內(nèi)在功能的有效發(fā)揮。增值評價在實施中存在如下問題。
首先,增值評價標準缺失。評價標準是對教育活動數(shù)量或質量的要求和規(guī)定,同時也是對教育教學現(xiàn)象進行有效價值判斷的尺度和依據(jù)[6]。目前,現(xiàn)有的理論研究主要集中于增值評價的理論基礎、內(nèi)涵界定、意義等方面,借鑒國外增值評價經(jīng)驗論述我國增值評價研究應用情況,對增值評價的應用標準及方法模型適用性缺乏論證,缺少增值評價適用條件范圍的界定和說明等相關研究。就算提及評價標準一詞,也主要是在宏觀層面對評價標準提出要求,沒有具體的標準界定。此外,從增值評價應用研究和實際操作來看,實施方案的標準闡述得過于籠統(tǒng)寬泛,實施指標的標準界限不明確或直接缺失,對指標維度標準也沒有完整詳細的陳述和規(guī)定,且大部分評價實施細則對教育質量增值評價的標準并沒有明確說明,這無疑將增值評價引向一種適用于一切活動評價的錯誤方向。
其次,增值評價模型的準確性不能保證。當前比較流行的增值評價模型包括增益分數(shù)模型(gain score model)、協(xié)變量校正模型(covariant adjustment model)、田納西模型(Tennessee value?added assessment model)、交叉分類模型(cross?classified model)等,但到底哪些模型更準確、更易于操作還需要研究探討[7]?;诹炕臄?shù)據(jù)指標評價模型存在隨機誤差,加之缺乏針對數(shù)據(jù)缺失模型的科學計算方法,在實施評價時難以避免數(shù)據(jù)缺失帶來的結果誤差,由此導致增值分析結果有效性得不到保證。此外,增值評價模型適用條件有限,對簡單的階段成績、學校間成績及各學科間成績等可以進行比較分析,但不能對處于同一水平的學生個體發(fā)展情況進行分析。例如在利用成長百分等級模型進行評價時,依據(jù)學生的數(shù)次考試成績或測驗數(shù)據(jù)來評估其在班級、年級或全區(qū)中相對位次的變化,這種方法能夠大致判斷學生是否取得進步,但無法客觀比較不同起點學生的進步程度,也無法避免“天花板”效應和“地板”效應[8]。由于評價模型適用條件限制,難以呈現(xiàn)優(yōu)秀學生真正的發(fā)展狀況,同樣也缺少針對落后學生發(fā)展的針對性分析;因此,增值評價方法被簡化,評價模型誤差無法解決,以及“天花板”和“地板”效應無法破解等問題直接反映了增值評價模型存在效度問題。
最后,增值評價重視數(shù)據(jù)分析,但價值判斷不足。評價判斷的最后目標是發(fā)現(xiàn)或揭示更深一層的數(shù)據(jù)和關系,這些數(shù)據(jù)和關系將使一種更充分的價值判斷成為可能[9]。對數(shù)據(jù)的分析是更為客觀深刻的價值判斷,增值評價的數(shù)據(jù)量化分析是對數(shù)據(jù)呈現(xiàn)出的量化關系及其現(xiàn)象背后深層次原因的分析,但實際操作中往往把重心放在數(shù)據(jù)結果分析上而缺乏真實意義上的價值判斷。例如在學生學業(yè)水平增值評價中,有研究對學生和教師變量數(shù)據(jù)進行了大量差異比較分析,但對差異背后的原因分析和闡述卻只有簡短的一小段話[10]?;诹炕瘮?shù)據(jù)處理結果為主的評價,依賴高水平評價技術,很容易忽視價值存在主體而喪失真正意義上的價值判斷。人是事實價值存在的載體,增值評價出現(xiàn)價值判斷不足現(xiàn)象很大程度上是因為評價忽視了“人”的價值主體存在的意義,缺乏根據(jù)評價目標對數(shù)據(jù)進行理論和實踐意義上的分析,這不僅使評價過程弱化了價值判斷,還大大降低了增值評價的完整性和有效性。
1.3 增值評價結果反饋:實效性差
反饋實效性是指反饋得出決策的可行性及決策實施效果的目的性。增值評價的實施效度直接影響評價結果的有效性,而評價結果的有效性又影響決策建議的可行性。評價結果的呈現(xiàn)方式和評價結果的使用是教育評價的價值能否有效發(fā)揮的關鍵[11]。教育增值評價的結果呈現(xiàn)方式和結果使用存在以下問題。
一是評價結果量表化,結論缺乏深度。第一代教育評價為教育測驗或測量;第二代教育評價為了便于評價而將學習目標采用行為目標方式來表述,行為目標的提出使評價代替了測驗;自第三代教育評價起,強調過程評價,注重質性與定性相結合。從教育評價發(fā)展歷程可以看出,評價活動離不開測量,教育評價就是對教育活動進行測量。測量一詞帶有很強的量化傾向,就目前而言,增值評價在依賴大數(shù)據(jù)的背景下對評價內(nèi)容進行量化陳述,致使評價結果數(shù)據(jù)量表化傾向嚴重,使結論反饋內(nèi)容過于表面化或形式化,數(shù)據(jù)的價值意義得不到全面體現(xiàn),一定程度上降低了增值評價的專業(yè)性和效用性。量化價值判斷標準的指標是量化的,其指標的約束條件也是量化的[12],但量化的分析判斷結論不是量化的,所以評價得出的結論不應只是量表化呈現(xiàn)。同時,如果結論描述過于籠統(tǒng)且空泛,則很難聚焦具體實際問題給出有針對性的改進建議。此外,反饋結論缺少專業(yè)解釋,運用高級統(tǒng)計模型處理數(shù)據(jù)后得出的結果也更為復雜,需要專業(yè)人員進行分析和解釋。一般評價者可以分析簡單的百分數(shù)或線性回歸結果,但對大規(guī)模的綜合數(shù)據(jù)庫進行統(tǒng)計分析具有較大困難;因此,教育增值評價的實施者和結果使用者需要具備一定的評價技術及數(shù)據(jù)意義挖掘能力。
二是評價結果利用不充分,達不到改進目的。增值評價以促進學生發(fā)展為目的,評價應帶有改進、發(fā)展和教育功能,但實踐中往往止步于發(fā)布評價報告,后期結果的運用效果、整改效果等沒有進一步跟進。評價是為了改進,改進需要準確理解和運用結果反饋信息,及時跟進整改效果才能充分發(fā)揮評價的功能,否則會導致評價走向形式主義。教育評價的效度包含目的、過程、功能及結果等內(nèi)容體系,各個效度之間具有較強的邏輯關系,每一內(nèi)容效度出現(xiàn)問題都將直接影響評價的整體效度。因此,要保證評價結果的效度,需要從整體考慮評價帶來的作用及價值效能的發(fā)揮,拓寬結果使用范圍,增強反饋結論的可理解性和可操作性,提高決策建議的目的性和可行性。
從實踐論的評價范式來看,增值評價對教育評價實踐和發(fā)展、對促進教育教學進步具有重要的推動作用。從教育增值評價的實踐來看,制約教育增值評價發(fā)展的原因主要有以下4個方面。
2.1 對教育評價和教學評價存在認識誤區(qū)
教學評價是一種認識活動,是對教學活動的測驗、分析和評定。教學活動的直接對象是學生,促進學生學習是評價發(fā)生的核心內(nèi)涵。在闡述教學評價和教育評價時,容易把二者混淆或等同。一方面,在對教學評價和教育評價下定義時隨意性強,概念邊界模糊,評價者容易將教育評價視為教學評價。另一方面,對二者內(nèi)容區(qū)分不清晰,狹義的教育評價認為教學評價就是教育評價,廣義的教育評價則認為教學評價只是教育評價的一部分。實際上,現(xiàn)代教學評價強調教學活動對學生認知、情感、動作技能發(fā)展的綜合促進作用,提倡從學生多方面的發(fā)展結果來衡量、評判教師的教學質量和水平,并注重對教學活動過程的靜態(tài)和動態(tài)進行全程評價[13],教學評價的內(nèi)容是個體的認知、情感和動作技能等微觀方面,限于對教學活動過程中對象內(nèi)部的表現(xiàn)進行評價。教育評價涉及的內(nèi)容除了教學活動外,還包括參與教育活動的全部主體及影響教育發(fā)展的一切因素,如行政工作、教學管理工作、學校后勤服務工作等,評價對象涉及教育的全部領域。如果不能準確把握教學評價與教育評價的內(nèi)容,在操作過程中會使教學評價內(nèi)容擴大化,缺乏針對性,也會使教育評價內(nèi)容窄化,失去教育評價的整體意義。
2.2 量化方法難以保證評價的真實性
行為目標評價法采用可觀測的行為目標作為評價依據(jù),其實質是評價內(nèi)容的具體化和評價標準的客觀化[14]。在行為目標的測量和評估中經(jīng)常對評價對象加以量化,量化是以數(shù)量為衡量標準的科學方法,教育增值評價內(nèi)容的確定在一定程度上取決于對內(nèi)容加以量化測量的可能性。基于大數(shù)據(jù)的增值評價傾向于量化行為目標。首先,行為表現(xiàn)易于量化描述。教育活動中學生、教師的行為表現(xiàn)更容易進行量化表征,如教學過程中學生主動提問的次數(shù)、教師回應學生提問的次數(shù)、學生參與討論的次數(shù)等,但諸如此類的測量并不能反映客觀事物全部,它雖然可以測量學生的知識,卻難以測量學生的學習態(tài)度、興趣及情感等。測量只能針對學習者特定的、有限的行為進行,難以全面、準確地反映學習者的真實狀態(tài)和學習成果[15]。其次,評價時難以對情境性表現(xiàn)進行追蹤測量。增值評價對教育過程中一些特定的、穩(wěn)定的表征進行追蹤相對容易,如教育活動中的學科教學活動表現(xiàn)、學生學習行為表現(xiàn)、課堂特定環(huán)境等,但該過程包含的教育思想、情感及道德思維等不易追蹤的表現(xiàn)則難以進行量化測量。教育活動中影響學生學習活動的學習內(nèi)容、學習方式和學生認知特征等環(huán)境總和是構成教育情境的要素,這些要素再現(xiàn)了教育情境的復雜性和多樣性,而教育活動的復雜性、多樣性又導致評價無法準確描述不同情境的具體表現(xiàn)內(nèi)容。因此,量化不是萬能的,量化雖然把復雜的教育現(xiàn)象簡單化,但“它不僅無法從本質上保證評價的真實性,而且往往會丟失教育中最有意義、最根本的內(nèi)容”[16]。
2.3 對增值數(shù)據(jù)意義的挖掘不充分
對增值數(shù)據(jù)的解釋和深度挖掘,是教育增值評價有效實施的重要前提條件。但就現(xiàn)狀而言,評價實施過程過于注重量化數(shù)據(jù)指標,并沒有注意到數(shù)據(jù)背后的意義,造成這種現(xiàn)象的原因主要有2個:一是相對比較法沒有充分運用。目前對學生的增值評價一般采用個體內(nèi)縱向比較,缺乏學生同知識水平和整體的比較分析。由于不同水平之間的增值空間不一樣,所以會出現(xiàn)“天花板”效應和“地板”效應,基礎較好的學生在進行個體內(nèi)比較時進步幅度不明顯,基礎較差的學生在個體內(nèi)比較時雖然能激發(fā)學習動力,但可能讓學生滿足于個體內(nèi)進步,降低學業(yè)追求。二是分數(shù)進步原因分析不夠深入。對分數(shù)增值的分析僅看到學生的學科成績提高,即卷面分數(shù)提高,對其背后原因分析不夠深入,如沒有考慮學生在一段時間內(nèi)的分數(shù)進步可能受題型難易程度、學習努力程度、教學方法改進與變化等因素影響,這是運用增值評價方法的共性問題。不同測試形式的評價內(nèi)容會不同質,只描述學生成長過程的做法無法準確分析影響學生成長的諸多因素。此外,已有研究多止步于通過增值數(shù)據(jù)大小判斷學生進步程度,雖然也嘗試解讀分數(shù)提高的原因,但實際評價中往往趨于表面,沒有具體對應的評價模型或分析解讀策略。
2.4 教育評價主體能力不足
教育增值評價的主體是評價活動的組織者和實施者。組織者對評價思想和評價價值的把握直接影響評價活動目的和標準的確定,實施者對評價標準和目的的正確理解是評價有效實施的前提條件。評價主體對評價指標體系的健全是實施評價的基礎,對數(shù)據(jù)背后意義的充分挖掘是評價結論具有實效性的必要程序。在教育增值評價中,評價主體存在能力與評價需要不匹配的現(xiàn)象。其一,評價指標體系健全能力有限。評價指標是評價內(nèi)容的具體項目,直接影響教育目標、內(nèi)容及方法的確定和使用,評價指標具有公平性和有效性是評價活動可持續(xù)推進的重要基礎。由于受評價主體理論知識缺乏、專業(yè)經(jīng)驗欠缺、預測能力弱等影響和限制,在實施評價時依然存在指標權重嚴重失衡的現(xiàn)象。比如,個別指標占比突出,不同指標維度之間占比相差較大,增值賦權缺乏科學依據(jù),指標維度下具體內(nèi)容占比隨意等。增值評價的指標和權重都具有強大的導向性,如果評價指標失衡,則所有的評價活動都將失去評價價值。其二,評價主體數(shù)據(jù)挖掘能力有限。數(shù)據(jù)挖掘能力表現(xiàn)為能得出學生學習成績以外的學習態(tài)度、學習動機、學習策略等方面的進步與發(fā)展。數(shù)據(jù)是評價實踐中最重要的資源,“通過數(shù)據(jù)挖掘可以找準規(guī)律、發(fā)現(xiàn)問題、預測趨勢,從而提高評價的應用效能和專業(yè)水平”[17]。學生成長的數(shù)據(jù)庫不應僅是成績數(shù)據(jù),還應包括學習過程的所有影響因素。由于評價研究人員和管理人員統(tǒng)計分析知識不足,對數(shù)據(jù)的挖掘也僅從量化結果得出結論,分析層級單一,缺少整體視角,缺乏結合相關影響主體的分析,評價數(shù)據(jù)的應用價值沒有得到充分體現(xiàn)。因此,在信息技術高速發(fā)展的時代背景下,教育增值評價者的專業(yè)性有待進一步提高,教育增值評價主體的能力需要與時俱進。
通過對教育增值評價現(xiàn)有問題進行分析發(fā)現(xiàn),教育增值評價應圍繞立德樹人根本任務開展評價活動,從而避免其落入技術異化窠臼。
3.1 厘清增值理念本質,正確認識教育增值評價導向
“教育增值”理念的提出為增值評價奠定了理論基礎。只有正確認識和理解增值理念,把握增值的價值,洞悉增值是學生發(fā)展的本質,才能真正立足學生發(fā)展的教育目的而開展教育活動。基于此,可以從以下2個方面樹立正確的增值理念,進而厘清增值評價中增值的本質。一方面,樹立正確的評價導向,摒棄用學生成績評一切的做法。學校應樹立正確的育人導向,一切以學生未來發(fā)展為重點,成績只是評價依據(jù)的組成部分,而不是教育活動的全部內(nèi)容。學校應該打破把學生成績作為教師教學評價主要依據(jù)、以成績判斷教師教學能力和教育質量的思維范式。另一方面,教師應積極發(fā)揮增值導向作用,關注學生全面而有個性的發(fā)展。班主任及科任教師建立學期、學年增值評價系統(tǒng),完整記錄學生進入學校以來的所有情況,包括成績數(shù)據(jù)、德育表現(xiàn)、體育表現(xiàn)及其他有關學生成長的獲獎資料,并不斷完善評價資料庫。各學科教師應將教與評一體化,關注學生過程性發(fā)展,將過程性評價資料與成績數(shù)據(jù)結合起來分析、判斷學生的學習效果。
3.2 設置增值評價培訓課程,提高評價者的增值評價能力
在大數(shù)據(jù)時代,要利用評價結果數(shù)據(jù)驅動教育質量提升,“教育管理者和廣大教師必須不斷提高數(shù)據(jù)應用意識和數(shù)據(jù)解讀能力,善于挖掘數(shù)據(jù)背后的價值,以更好地服務于學校改革、區(qū)域改進以及科學決策”[18]。當前,評價者對數(shù)據(jù)的認識和分析并不全面,只能看到數(shù)據(jù)反映的表面內(nèi)容,無法從不同視角、利用不同方法解讀大數(shù)據(jù)背后的真正意義。要使增值評價落地,就要培養(yǎng)增值評價專業(yè)技術人員,可以聘請增值評價領域的專家和一線實踐者開發(fā)增值評價培訓課程,從上到下形成聯(lián)動機制,評價主體部門建立增值評價培訓制度,地方學校確定人員參加培訓。首先,開展增值評價理論基礎培訓。由評價專家向學習者講授增值評價發(fā)展歷程、基本內(nèi)涵及意義等,引導評價者深入理解增值評價,以便在實施評價時準確把握評價目的并創(chuàng)新融合增值評價運用。其次,開展增值評價數(shù)據(jù)統(tǒng)計方法培訓,特別是對數(shù)據(jù)解讀和意義挖掘能力的培訓。增值評價相對結果評價、過程評價,對評價技術要求更高,應在基礎數(shù)據(jù)統(tǒng)計方法的基礎上設置高級統(tǒng)計分析方法課程,如回歸分析、交叉分析及多種數(shù)據(jù)來源分析等。最后,地方學校為教學人員開設培訓講座,邀請有增值評價經(jīng)驗的一線教師分享經(jīng)驗,為新手提供可靠的增值評價實踐經(jīng)驗,以便其更好地實施評價活動,從而有利于教學的改進并最終促進學生全面而有個性的發(fā)展。
3.3 創(chuàng)建評價數(shù)據(jù)鏈接平臺,提升教育增值評價的專業(yè)化程度
教育增值評價專業(yè)化和精準化需要大量完整的數(shù)據(jù)信息,而完整的數(shù)據(jù)信息需要借助信息技術對靜態(tài)和動態(tài)信息進行長期的收集和整理。目前,教育增值評價數(shù)據(jù)缺失現(xiàn)象嚴重,評價的效用得不到保障。基于此,健全教育評價數(shù)據(jù)庫,創(chuàng)建不同主體間數(shù)據(jù)信息鏈條尤其重要。首先,依靠智能技術收集學生發(fā)展全過程、全方面的數(shù)據(jù)。通過大數(shù)據(jù)、人工智能技術采集學生的知識、情感、態(tài)度、思維、道德行為等全過程數(shù)據(jù)[19],并利用信息技術整理、存儲過程性的動態(tài)情境數(shù)據(jù)。其次,創(chuàng)建學生、教師、學校等數(shù)據(jù)庫之間的鏈接,達到數(shù)據(jù)之間的有效整合。教育增值評價需要學生、教師、學校等主體間的數(shù)據(jù)進行有效鏈接,以形成一個完整的追蹤數(shù)據(jù)庫,為教育增值評價有效開展創(chuàng)建完整的數(shù)據(jù)信息鏈條。最后,為數(shù)據(jù)庫建立共享平臺,實現(xiàn)數(shù)據(jù)共享。教育增值評價是一項極其復雜且專業(yè)程度較高的評價活動,教育活動中涉及的要素及產(chǎn)生的各類發(fā)展變化數(shù)據(jù)繁雜,因此,要充分利用現(xiàn)代信息技術賦能教育增值評價。在評價對象數(shù)據(jù)完整且具備共享的基礎上搭建數(shù)據(jù)信息共享平臺,提供各個對象的全過程數(shù)據(jù)信息,實現(xiàn)數(shù)據(jù)收集、處理和共享一體化。平臺系統(tǒng)包含所有采集的信息及統(tǒng)計分析結果,評價者和研究人員能夠隨時調取數(shù)據(jù),實現(xiàn)不同主體數(shù)據(jù)的共享,避免由數(shù)據(jù)缺失引起的評價誤差問題,提高評價活動的有效性和精準性。
3.4 兼顧融合多種評價方式,提高教育增值評價實施的有效性
評價方法或手段的科學性和有效性對教育增值評價實施效度具有深刻的影響。現(xiàn)有的增值評價方式簡化了過程性發(fā)展,忽視了不同水平學生增值空間不同的特征,導致學生個體內(nèi)相對進步效度低,群體間絕對進步不顯著。對此,在數(shù)據(jù)完備的基礎上,教育活動需要創(chuàng)新融合評價方式方法,激發(fā)學生發(fā)展的可能性,促進不同水平學生增值空間的最大限度開發(fā)。其一,充分運用常模參照評價方式,提高學生個體的絕對進步程度。轉變用個體成績計算一切的傳統(tǒng)評價方式,充分利用常模參照評價厘清學生個體在群體中的水平位置。在常模參照物的作用下,“借助大數(shù)據(jù)技術、云計算等方式把數(shù)據(jù)轉化為可以獲利和增值的資本”[20]。其二,定性評價和定量評價相結合,提升個體相對水平的增值空間。以教育測量為基礎,在數(shù)據(jù)庫完整的前提下,充分利用完備的數(shù)據(jù)資料,運用數(shù)學統(tǒng)計分析方法對教育活動中學生的過程性發(fā)展情況進行動態(tài)評價。同時,增加質性評價,對照教育教學活動中學生的動態(tài)表現(xiàn)、行為表現(xiàn)及情感態(tài)度表現(xiàn)等作出客觀實際的價值判斷。評價者應利用專業(yè)知識、實踐經(jīng)驗和判斷標準給出評語或等級,充分關注學生的優(yōu)缺點,既要注重學生絕對的進步,也要關注學生相對的發(fā)展空間,堅持多維度、多視角評價學生的連續(xù)性進步。其三,自評與他評相結合,促進學生全面發(fā)展。增值評價不只是評價者對教育活動中學生主體的評價,也可以是學生內(nèi)部評價。提高教育增值評價的信度和效度,需要將自我評價與他人評價相結合??傊盐赵鲋翟u價是量化與質性相結合的評價,它不是靜態(tài)的固定評價,不能僅局限于學業(yè)成績的輸入與產(chǎn)出量化數(shù)據(jù)的結果性評價,否則會將增值評價禁錮于數(shù)字符號評價模式,降低教育增值評價實施的效度。
來源:《中國考試》2022年第10期第31-38頁
作者:王天平,系教育部西南基礎教育課程研究中心副主任,西南大學教育學部教授
參考文獻:
[1] 中共中央國務院印發(fā)《深化新時代教育評價改革總體方案》[A/OL]. (2020-10-13) [2021-11-21]. http://www .gov .cn/zhengce/2020- 10/ 13/content_ 555 1032.htm.
[2] 章建石.基于學生增值發(fā)展的教學質量評價與保障研究[M].北京:北京師范大學出版社,2014: 72.
[3]謝小蓉,張輝蓉.五育并舉視域下學生增值評價的發(fā)展困境與破解策略[J].中國電化教育,2021(11): 32-38.
[4] 王天平。教學活動論[M].北京:人民教育出版社,2019:211.
[5] 羅瀟.何為增值?增什么值?如何測量增值?對增值評價的三點認識[J].今日教育, 2021(1): 10-13.
[6]李森,鄭嵐.促進質量提升的課堂教學評價改革[J].課程.教材●教法,2019, 39(12):56-62.
[7]辛濤.探索增值評價的幾個關鍵問題[J].中小學管理,2020( 10): 1.
[8] 王帥鳴,姚守梅,王夢,等.基于成長百分等級模型開展增值評價的實證研究[J].中國考試,2020(9):46-51.
[9] 康海燕.評價與創(chuàng)新型人才:基于杜威價值哲學的探討[J].上海師范大學學報(哲學社會科學版), 2015,44(6): 11-16.
[10]胡志橋,鐘陽,汪晶.中小學生學業(yè)水平增值評價模型的構建與實踐:基于廣州市義務教育階段陽光評價的研究[J].教育理論與實踐, 2022, 42(11): 18-22.
[11] 彭波,王偉清,張進良,等.人工智能視域下教育評價改革何以可能[J].當代教育論壇,2021(1): 1-15.
[12] 馮平.評價論[M].北京:東方出版社,1995: 155.
[13] 李森.現(xiàn)代教學綱要[M].北京:人民教育出版社,2005: 351.
[14] 胡中鋒.教育評價學[M].北京:中國人民大學出版社, 2008: 58-59.
[15]陳晨,楊成,王曉燕,等.學習測量:大數(shù)據(jù)時代教育質量提升的新力量[J].現(xiàn)代教育技術,2017, 27(2):33-39.
[16] 涂艷國.教育評價[M].北京:高等教育出版社, 2007:94-95.
[17]劉邦奇,袁婷婷,紀玉超,等.智能技術賦能教育評價:內(nèi)涵、總體框架與實踐路徑[].中國電化教育,2021(8): 16-24.
[18]楊現(xiàn)民,顧佳妮,邢蓓蓓.“互聯(lián)網(wǎng)+”時代數(shù)據(jù)驅動的教育評價體系構架與實踐進展[J]浙江師范大學.學報(社會科學版), 2019, 44(4): 16-26.
[19]楊宗凱.利用信息技術促進教育教學評價改革創(chuàng)新[J]. 人民教育,2020(21): 30-32.
[20]張以哲.數(shù)據(jù)資本權力:數(shù)字現(xiàn)代性批判的重要維度[J].西南大學學報(社會科學版), 2021, 47(1):42-51.