国产特级特黄一级片|在线嘿咻嘿咻视频|91本色超碰在线|波多野结衣一区无码|精品一区二区束缚|国内视频在线观看一区二区不卡|日韩美女视频网址|免费无码婬片AAAA片直播中文|高清无码在线网站|国产网站日韩四季

教育資訊 首頁  》  新聞資訊  》  教育資訊

看點丨場景化評價:技術賦能新時代教育評價改革的新趨向

2025-03-28 | 2249|

技術賦能教育評價不僅是縱深推進教育評價改革的關鍵途徑和重要突破口,而且是加快推動教育高質量發(fā)展的必然選擇。場景化評價作為一種能夠評估學生在真實性場景中的行為表現的評價方法,不僅能使評價更具場景真實性、智能動態(tài)性、融合連接性和內隱聯(lián)結性,還能更全面、更真實地反映學生的能力與素養(yǎng),是當前智能化評價階段的新趨向。

快跟著信息科技考試系統(tǒng)的小編一起來看,技術賦能教育評價有哪些現實困境?如何科學設計場景化評價?



發(fā)揮智能技術優(yōu)化教育評價結構,創(chuàng)新教育評價手段的支撐作用,可以讓教育評價改革牽引育人方式轉變,使教育評價回歸促進學生全面發(fā)展本位。然而,目前技術賦能教育評價仍面臨學生復雜特征難以表征、評價工具的發(fā)展瓶頸難以突破、評價結果的人機互信危機難以規(guī)避等評價能力不足的現實困境。場景化評價作為一種能夠評估學生在真實性場景中的行為表現的評價方法,不僅能使評價更具場景真實性、智能動態(tài)性、融合連接性和內隱聯(lián)結性,還能更全面、更真實地反映學生的能力與素養(yǎng),從而提供更準確、更具指導意義的評價結果,促進學生全面發(fā)展。


技術賦能教育評價的現實困境



近年來,國際測評和教育評價改革實踐強調技術賦能推動學生核心素養(yǎng)發(fā)展與評價,以引導教育教學改革。但由于核心素養(yǎng)具有綜合性、復雜性和內隱性的特征,目前還難以對其進行準確和客觀的評價。此外,現有技術手段在表征學生復雜特征、突破評價工具發(fā)展瓶頸、規(guī)避人機互信危機等方面仍面臨評價能力不足的困境,未能有效地對學生關鍵能力與素養(yǎng)進行評價,也無法滿足創(chuàng)新人才培養(yǎng)和選拔需求,制約著教育評價改革的縱深推進。


學生復雜特征難以表征


核心素養(yǎng)評價要求全面深入地表征學生復雜特征,但現有評價模式側重單次、單一知識點的評價,評價結果只能提供對學生特征的簡單化表征,無法全面反映學生能力與素養(yǎng)。其中存在的主要問題有二。一是缺少人機交互的表現性任務。盡管我們普及了在線測試,但多是將傳統(tǒng)紙筆測試以電子化形式“搬運”到在線平臺,偏向于知識傳遞與獲得的標準化任務,缺乏動態(tài)環(huán)境下對能力與素養(yǎng)的評估,限制了學生展現自我的機會。二是評價標準難以調整。評價標準仍以知識記憶和理解為主,缺少對問題解決、批判性思維、創(chuàng)造力等素養(yǎng)指標的評價,適用性和可操作性不強,導致評價難以捕捉學生復雜特征,亦難以真實反映學生能力與素養(yǎng)發(fā)展情況。


評價工具的發(fā)展瓶頸難以突破


為實現全面評價學生的核心素養(yǎng),評價工具需要超越對知識記憶和理解的評價范疇,轉向通過模擬真實性場景下的評價任務,以獲取學生能力與素養(yǎng)評價的多維度信息。然而,這一轉變面臨技術局限、數據利用問題和場景適應性不足三個發(fā)展瓶頸:一是技術支持的不充分使得實時反饋和持續(xù)評估難以實施,在很大程度上限制了教學、學習與評價的一體化遷移至多樣化學習環(huán)境中,進而影響了教學精準化、學習個性化和評價智能化的實現;二是多模型評價數據利用問題,包括數據采集的局限性,難以精準捕捉表現性和非結構化學習任務中的復雜、動態(tài)和多維數據,導致許多評價研究僅限于特定情境,同時數據運用方法尚未成熟,在構建評價模型時需要克服多模態(tài)數據之間的同步性、互補性、冗余性以及特征提取和整合等一系列問題;三是評價工具的場景適應性不足,難以靈活應對復雜多變的教育環(huán)境和場景,特別是在資源有限和數字化基礎設施不健全的情況下,無法在不同場景間實現有效應用,進而造成評價與實踐的分離。


評價結果的人機互信危機難以規(guī)避


評價模型的可解釋性是指其產生的評價結果能夠被人們理解和接受的程度。隨著深度學習和機器學習技術的發(fā)展,可解釋性評價模型主要分為三類:獨立于模型的方法、依賴于模型的方法以及因果解釋方法。盡管人工智能可解釋性評價模型的準確性顯著提升,但仍存在精度不穩(wěn)定、教育場景適應能力弱、單一模型分析不足等問題,導致人機信任危機,影響教育評價結果的公平性和科學性,容易誤導教育決策。究其根本:一是源于算法偏見,評價結果可能嵌入技術構建者的價值觀,導致價值觀窄化;二是由于認知決策偏差,現有技術未能完全模擬人類思維和缺乏情感理解,加劇了智能機器決策過程中的不確定性;三是因為缺乏對可解釋性評價模型效度的驗,預測準確性驗證相對較多,而對可解釋性的驗證相對缺乏。



技術賦能場景化評價的特征



場景真實性


學生需要完成的真實性任務,包括任務的性質和要求等,必須基于真實性場景。真實性場景作為真實性任務的實踐場域,包括時空背景和數字化資源等,需要貼近現實,評價目標被精心融入場景中,從而引導學生解決現實和未來生活問題,促進能力與素養(yǎng)的逐層深化。同時,通過創(chuàng)設涉及現實世界中經濟、社會和環(huán)境等方面的人機交互真實性任務,不僅能夠測試學生的知識記憶和理解,更能助推學生將知識和技能遷移到現實生活場景中,實現對學生能力與素養(yǎng)的直接評價,并發(fā)揮場景化評價在“主動育人”方面的積極作用。


智能動態(tài)性


智能動態(tài)性體現為通過高度智能化和動態(tài)適應能力,使場景化評價能夠根據學生學習進度和實時反饋,靈活調整真實性場景和個性化評價方案。具體表現在:一方面,真實性場景可動態(tài)調整,通過利用追蹤技術、動態(tài)模擬技術和事件觸發(fā)器,實時接收、傳輸和整合來自現實世界的變化與數據,智能化調整場景設置,能夠增強場景的真實感知、動態(tài)互動和智能適應,使評價工具與教育實踐、教育場景、教育環(huán)境相銜接,從而為學生提供最適宜的真實性場景;另一方面,個性化評價方案的智能適配,借助智能監(jiān)測和多模態(tài)學習情感計算等技術,持續(xù)跟蹤分析學生的認知過程、自我調節(jié)過程、情感狀態(tài)變化等全過程學習行為表現,進而向學生提供智能化、個性化的學習資源和學習策略等服務與支持,以提升評價的精確度。


融合連接性


場景化評價環(huán)境依托“AI+真實性場景”的教學評一體化數字空間,不僅消除了傳統(tǒng)教育場景的壁壘,還實現了學校、社區(qū)、場館、工作等多場景聯(lián)動、數據互通共享以及技術、教學、評價的深度融合。一是人機融合互動。利用可穿戴和嵌入式傳感器等智能設備,提供豐富的學生體驗視角,使學生能夠無意識地、自然地融入虛實融合的真實性場景中,并在多個場景間自由切換,從而全面捕捉和記錄學生學習行為表現。二是角色與場景的融合。真實性場景提供情感沉浸體驗,不僅能夠充分調動學生的多感官參與,還能增強人與人之間以及人與場景之間的價值觀傳遞,有效促進學生在真實性場景中實現情感與認知的深度互動。三是評價過程與評價結果的緊密結合。通過應用貝葉斯知識追蹤模型、知識情境感知的深度知識追蹤模型等自適應學習技術,能夠持續(xù)監(jiān)測和診斷學生與真實性任務的互動情況,為教師和學生提供實時且有意義的反饋信息,有效彌合教學、學習與評價之間的鴻溝。


內隱聯(lián)結性


場景化評價的內隱聯(lián)結性體現在其以一種不易被學生察覺的方式,持續(xù)且穩(wěn)定地對學生在真實性場景中展現的、難以直接觀測到的個人能力與素養(yǎng)進行評估,并能夠預測學生的未來潛力和發(fā)展趨勢,為學生全面成長提供堅實的支撐。場景化評價通過與教學活動的無縫對接,使得評價過程自然地融入真實性場景之中,學生幾乎不會察覺到評價的存在,確保了教學與評價的同步性和連貫性。在真實性任務的完成過程中,學生能夠獲得持續(xù)的學習支持和即時反饋,這將幫助他們超越現有能力,向更高層次發(fā)展。同時,借助腦機交互和信號傳遞等技術,場景化評價能精確捕捉并映射學生實時的思維活動、意識細胞功能變化、神經元動態(tài)突變以及認知過程進展,從而揭示他們在創(chuàng)新思維、問題解決、溝通協(xié)作和價值觀形成等方面的發(fā)展情況。



場景化評價的設計路徑



學習者模型:明確學生評價指標體系,構建學生評價觀測指標框架


學習者模型旨在確立評價目標和描述學生能力與素養(yǎng),通過明確學生評價指標體系和構建學生評價觀測指標框架兩個環(huán)節(jié),確保教育工作者能夠捕捉和觀察到更為精細、微觀的學生學習行為表現。


為了精準、客觀和科學地評價學生的能力與素養(yǎng),首先需要明確學生評價指標,深入分析所要評價的學生能力與素養(yǎng)的內涵與特征,并有機整合權威評價指標體系/框架,進行指標的系統(tǒng)提取和優(yōu)化,最終形成學生評價指標體系的一級和二級維度。在此基礎上,為了構建一個更精準、可操作的學生評價觀測指標框架,還需要深入分析評價指標體系的一級和二級維度,明確各個評價維度與學生行為之間的具體聯(lián)系和表現特征,并據此分別確立每個評價維度的觀測指標、具體行為表現及其相對應的數據采集類型。例如在“師范生智能教育素養(yǎng)測評”的場景化評價中,以已有的“師范生智能教育素養(yǎng)框架”為基礎,將其3個一級維度和9個二級維度作為師范生智能教育素養(yǎng)評價指標體系,并分別確立35個觀測指標、具體行為表現及所對應的數據采集類型,形成師范生智能教育素養(yǎng)評價觀測指標框架。


真實性任務模型:創(chuàng)建真實性場景,設計真實性任務


真實性任務模型需要創(chuàng)建真實性場景,并在場景中設計真實性任務,引發(fā)學生展現出與評價觀測指標緊密相關的行為表現,為收集學生行為過程流數據提供基礎,以便深入理解學生如何應用知識和技能解決實際問題。


第一,創(chuàng)建真實性場景,通過構建數字技術豐富的評價環(huán)境,為學生提供與現實世界緊密相連、直面真實性問題的線上線下、課堂內外虛實融合的實踐場域。通過利用元宇宙、AI大模型、動態(tài)模擬等技術,整合人物、時間、空間、事件等場景數據維度,創(chuàng)建硬件設備場景、軟件操作場景和任務解決場景,使評價活動和內容與現實世界、學科領域、工作場景保持高度一致,促進學生在與場景實時融合互動中有效應對真實性問題。此外,真實性場景的設計還需嵌入問題解決材料、認知發(fā)展資源、探究活動工具等支架,并結合場景識別算法和頻繁序列挖掘算法,對學生在場景中的特征狀態(tài)進行感知分析,從而提供實時的、持續(xù)的引導和支持。


第二,以真實性場景為基礎,緊扣觀測指標,力求貼近現實生活且具備認知挑戰(zhàn)性,設計基于遞進式問題鏈的學習理解型、應用實踐型、遷移創(chuàng)新型三類真實性任務,通過邏輯關聯(lián)、層次遞進的任務活動,引導學生在解決現實問題的過程中循序漸進地展現出全面的行為表現。同時,結合自適應學習和生成式人工智能等技術,根據學生表現動態(tài)提供模塊化任務,確保學生持續(xù)保持在最優(yōu)學習路徑上,提升學生能力與素養(yǎng)發(fā)展水平的可見性。


正日信息科技考試系統(tǒng)基于對學生能力的評定及考查而設計,并依據2022年版課程標準及理念設計多種“新”考查形式?;谡鎸嵡榫诚?,設計考查學生信息感知能力、信息社會責任意識及綜合利用數字技術計算、處理應用能力的試題,借助綜合式、大單元式、項目式的考查形式,多維度呈現學生數字行為考查結果。目前,基于情景下的綜合式考查形式已在多個地市成功應用,例如在某地市數字素養(yǎng)考查上,借助信息科技考試系統(tǒng)設計了情景式綜合式材料分析題、流程圖題、網絡拓撲題等,綜合評定學生學科核心素養(yǎng)在知、情、意、行等方面協(xié)調發(fā)展情況,有效檢驗學生的創(chuàng)新能力及素養(yǎng)應用實踐能力。


評價分析模型:提取數據證據,建立評價分析模型


學生行為表現數據是揭示他們在完成真實性任務時知識掌握、能力展現與素養(yǎng)體現的重要依據。為了精確評估這些能力,需要在過程流數據與具體推論或假設之間建立聯(lián)系,從而使數據能夠作為有效證據使用。為此,通過提取數據證據和建立評價分析模型兩個方面,將過程流數據與觀測指標緊密關聯(lián),以此來推斷學生在知識、能力與素養(yǎng)等方面的真實情況。


一方面要提取數據證據。首先,建立證據規(guī)則,將過程流數據與評價目標相關聯(lián),并制定評分機制為數據直接賦予分值或通過算法程序進行計算;其次,通過數據預處理和行為模式識別,篩選出與觀測指標高度相關的數據證據;最后,將這些數據證據與觀測指標建立映射關系,為評價分析模型和評價結果提供可靠支持。


另一方面要建立評價分析模型。可以通過數據證據特征提取、模型建立與訓練和模型信效度檢驗,并依據各觀測指標,構建準確性和可解釋性能力強的智能評價分析模型,實現各維度能力與素養(yǎng)的智能分析、評價反饋和預測發(fā)展?;诖?,可以通過文本報告、可視化畫像等多種方式,全方位輸出學生個體或群體的特征型、發(fā)展型和比較型評價結果,并能夠提供包括個性化反饋和差異性建議的評價反饋,從而實現對學生素養(yǎng)水平與發(fā)展?jié)撃艿木珳士坍嫞橹贫ㄅ囵B(yǎng)方案和相關教育決策提供科學依據。


來源丨節(jié)選自中國遠程教育微刊,作者丨郭炯(西北師范大學教育技術學院教授),鄒佳人(西北師范大學教育技術學院);本文轉載自號“中關村互聯(lián)網教育創(chuàng)新中心(ID:zgc-mtb)”。

版權聲明:以上圖文,貴在分享,版權歸原作者及原出處所有。如涉及侵權,請權利方及時與我們聯(lián)系,我們將及時更正、刪除或依法處理。

?