智能裝備支持下的學習績效預測模型構建與應用
胡航 杜爽 康忠琳
隨著教育大數據的廣泛應用,學習預測研究已成為學習分析技術的一個重要研究方向。目前,學習分析技術已從原理探究、應用價值等理論研究轉向基于教育大數據的學習行為分析、數據可視化、學習預測等實際應用研究(胡航,等,2020)。盡管學習預測研究有了一些初步成果,但以優化學習過程和改善學習成效為目標的學習預測研究還未在教育領域得到深入實踐和應用,距離準確和大規模的應用還較遠(牟智佳,等,2017)。如何建立具有較高預測性能,兼具易讀性、易操作性的學習預測方法,并依據預測結果進行差異化干預與推薦的應用成為亟待解決的問題。本研究采用深度神經網絡結合機器學習分析技術,運用多場景學習行為數據,構建學習行為診斷模型,以期為學習績效預測分析和學習干預提供指導和參照,并基于學習績效預測模型,依據不同評判策略對運動、課堂行為與學習績效進行關系挖掘,建立預測模型應用研究框架,通過多類行為數據、多機器學習模型的組合應用模式,實現兩種學習行為對學習績效的預警。
一、數據信息采集
本研究以C市S高校大學生作為研究對象,經過了兩次數據采集,數據采集的時間為一學年。數據采集有五個來源:一是學習場景數據,來源于在線課程學習數據,包括學校學習平臺中的學習日志數據;二是生活場景數據,來源于圖書借閱數據和早起數據(杜爽,等,2020)、圖書館業務日志和一卡通消費日志數據;三是學習績效數據,來自于學習平臺的在線測試成績和學校教務系統中對應課程的期末筆試成績;四是運動日志數據,通過運動移動端應用程序的后臺采集學生一學期的運動數據,包括每次跑步的時間、里程等信息;五是課堂學習數據,通過智慧教室監控系統采集學生上課過程,錄制一學期(12周)一門人文社科類必修課程的課堂視頻,共有23個班級,每周錄制兩節課90分鐘視頻,共采集到約420小時的課堂視頻。
數據采集過程中所選用的智能裝備如下:
(1)課堂教學分析系統。本研究所采用的課堂教學分析系統的教學評估功能分為校級評估、班級評估、個人評估。教學評估功能針對站立、舉手、閱讀、書寫、玩手機、趴桌子六種行為,針對高興、困惑、難過、害怕、憤怒、厭惡、驚訝七種表情。校級評估分為今日關注度、重點關注班級、近30日統計(關注度、行為、表情統計)三個模塊。在近30日統計模塊,支持鼠標停留顯示詳細統計分值和時間。在重點關注班級模塊點擊班級名稱可跳轉至班級評估。
班級評估分為班級檢索與選擇、統計分析、歷史課堂評估三個模塊。其中班級檢索與統計可以選擇查看的班級,同時支持選擇兩個班級進行班級間課堂行為的對比,對比結果顯示在統計展示模塊。統計分析模塊可以針對近30日、14日、7日的班級行為按照專注度、行為、表情三個維度進行趨勢性展現,支持鼠標停留顯示詳細統計分值和時間。歷史課堂評估模塊針對單節課堂給出專注度評分、正面行為統計次數、負面行為統計次數三個維度的信息,具體課堂可跳轉到該堂課的課堂評估。
課堂評估模塊分為課堂檢索、課堂信息展示、統計分析三個模塊。其中課堂檢索模塊可以針對班級、日期、課程進行篩選。課堂信息展示模塊展示課程名稱、班級、人數、任課教師等信息。統計分析模塊含有時域趨勢圖和統計雷達圖,分別針對專注度、行為、表情按時間排序進行趨勢統計,同時針對行為和表情給出次數雷達圖。在統計雷達圖中點擊統計信息可以跳轉到課堂抓拍記錄界面。
(2)運動健康管理App。該App利用互聯網技術幫助學生在移動端完成跑步運動、考勤簽到、場館預約、學期體測等。學校管理人員可從網站中登錄“學校管理后臺”,進行相應的運動設置以及數據信息查看。
(3)學習平臺。用戶可以在平臺上自助查閱學習資料、下載電子文獻、學習學校課程、進行小組討論等。教師注冊后,可進行課程建設和教學管理,學生可通過平臺選擇海量、豐富、免費的數字化教育資源進行在線學習。在線課程學習數據、學習績效數據等均來自該平臺。
二、學習績效預測模型構建及應用
(一)學習績效預測模型的構建
預測變量分為傾向性指標和行為表現指標兩類,傾向性指標為學生的基本信息,包括性別、院系、專業;行為表現指標包括學習場景(在線課程)、生活場景(早起行為、借閱行為),預測結果為學習績效變量。本研究將兩類指標進行結合,采集兩類指標所對應的預測變量值,在后期數據處理階段對其進行篩選。具體預測指標如表1所示。
表1 預測變量
(二)學習績效預測模型的應用
1.運動行為預測指標的構建
研究運動指標主要包括運動次數、平均跑步時間、平均里程數、運動規律四個指標。
運動次數:在一學期12周中一名學生參與跑步的次數累加的平均值。
平均跑步時間:在一學期12周中,學生每次跑步用時(秒)的平均值。
平均跑步里程數:在一學期12周中,學生每次跑步距離(米)的平均值。
運動規律是根據運動次數的分布計算的熵值,運動規律值反映每周學生參加運動的連續性,其中fjm為第m個學生第j周運動次數在n個周運動總次數中的比重,如式5所示。
運動規律指標的取值范圍為0—1,取值越高說明學生每周的運動越有規律。
2.課堂行為預測指標的構建
課堂整體教學效果的行為特征指標有三個:專注次數、參與度、專注時間。專注次數:將視頻以45分鐘為一個周期,每隔2.5秒進行關鍵幀提取,一節課中共有1 080次識別。識別每個關鍵幀中學生頭部的變化角度,如果頭部角度的垂直區間和水平區間均在0°—60°,說明學生是在直視或仰頭,可統計為有1次專注數。
參與度:如果頭部角度垂直區間大于0°—60°或水平區間大于0°—60°,說明學生是在低頭或扭頭,識別出學生處于非傾聽狀態,同時統計教學時間內無法識別的次數,運用式6得到學生的課堂參與度指標。
專注時間:以分鐘作為單位,若在關鍵幀識別到整個班級的專注率高于75%,則關鍵幀之間的時間間隔統計為專注時間段。
3.依據決策樹與規則模型關聯研判,構建行為預警策略
基于決策樹。采用Modeler決策樹中C&R(分類和回歸)對兩種行為特征值生成運動與課堂兩種行為的預測分類結構圖。根據運動行為生成的決策樹分類結構圖,可以直觀地分析出運動行為指標與學習績效之間的關系。
基于規則模型生成運動與課堂行為規則集。采用貪婪算法構造規則集,能進一步簡化規則集規模,生成的規則集按照分類比例進行排序,比例越高說明代表的規則信度越高。
依據上述兩種關聯結果,生成預警閾值。每種行為類型分別有兩個閾值點,分為三個閾值區間,同時可將三個區間對應于三種行為等級。確定行為閾值等級,使得對行為判斷的依據更加明確和易于操作,為構建行為預警策略提供依據?;陬A警閾值,構建行為預警策略。將運動與課堂行為的行為特征值按每周的平均數績效統計,并按照預警閾值區間分別構建12周A、B類學生的行為預警,表中所在區域的顏色越淺行為等級越低,顏色最深的區域代表行為等級為“優秀”(見表2、表3)。由表2和表3可以看出,A類學生無論是運動還是課堂行為特征值均有較高的等級,說明成績好的學生在課堂中更加專注聽課,而且運動越好的學生可能會有更好的學習績效。
表2 A類學生運動與課堂行為特征12周預警
表3 B類學生運動與課堂行為特征12周預警
三、研究結論
(一)早起、借閱行為的認知規律及關系
依據已有數據采用非監督學習分析方法,將學習個體劃分成最具代表性的行為數據集合,通過聚類和關聯分析后發現不同行為特征的表現有顯著差異。在早起行為中整體的早起規律較高,且專業必修課和公共必修課成績較好,這一方面說明養成良好早起習慣對學習績效有正面的影響,另一方面反映出學習成績較好的大學生表現出更好的早起規律和更早的早起時間。從平均早起時間上對學習績效進行分析,早起18分鐘,學習成績的平均績效提高2.5分左右,這從側面反映出早起時間與學習績效的相關程度。雖然早起次數可能是因為8點上課的被動安排,但早起時間是由大學生自己把控的。早起型的大學生不僅有更多時間用于學習活動的開展,提升元認知體驗效果,還能促進自我認知的重新定位與評估,增強元認知監控能力。
在借閱行為的借閱量、平均借書時間、閱讀深度三個屬性中,學習績效較好的大學生表現出更多的借閱數量、更集中的借閱類型和更短的借閱時間。特別是借閱時間更短的學生在學習中表現更加突出。其中一種合理的解釋是借閱時間越少閱讀速度越快,而閱讀速度較快反映出對閱讀內容的快速理解,比閱讀總時間呈現出更豐富的內涵。借閱行為與學習績效的相關關系反映出行為與認知、認知與學習績效的間接影響關系。
通過早起和借閱行為的分析,建議大學打造深度學習環境,激發大學生自我學習能動性。優良的學習場所能促進大學生深度學習和深度思考,增強自我效能和元認知體驗(胡航,等,2020)。一是打造晨讀空間,不僅能為大學生提供一個良好的深度學習氛圍,而且晨讀活動也可引領大學生養成規律的早起習慣,逐漸提高大學生自我規劃能力和自我約束能力。二是提供智能化學習體驗場所,提升數字化資源服務能力,推出符合大學生學習習慣的多種借閱方式,順應大學生閱讀方式的改變。如按需提供數字資源推送服務,將大學生需要的電子圖書發送至手機或平板電腦;或直接提供采用電子墨水屏的閱讀器借閱服務,降低由長時間使用普通顯示屏導致的近視發生風險。
(二)運動與課堂行為對學習績效的影響程度
采用決策樹和規則算法生成具體閾值區間,作為行為預警可視化的判別依據,預測結果易讀性強、便于理解,結果能對行為判斷進行等級分類。例如一名學生課堂行為中平均專注時間及平均專注次數大于某個閥值,那么模型在一定的預測準確率下可預測該學生的學習績效是A類還是B類,同時可從預警圖中發現該學生一學期每周各個行為特征在預警區間的行為等級,教師可依據此行為等級對該生進行針對性的、及時的課堂行為預判和干預。
學習行為預警策略在運動與課堂行為中的應用,無論是運動的時間、強度、規律,還是課堂行為中專注的次數、時間、比例,都會對學生的學習績效產生影響。學習行為預警策略結合多類學習行為指標共同預警的效果比單一采用行為指標或學習成績有更好的預測效果,將預警結果用于教學管理人員對學生具體行為的指導和干預中,可有效增強學校整體的教學管理能力。
在課堂行為預警策略應用中,教師可以及時發現學生的學習行為共同問題,如若發現A、B類學生在行為預警模型中第6周均出現了等級下降的情況(也就是有一個明顯的下降趨勢),教師可以在第5—6周的課堂上進行及時的課程提醒和指導;同時也可以針對不同類型的學生進行區別化、個性化的調整,若B類學生專注度和專注時間前3周均處于“未達標”等級,教師可以在開學時調整教學設計和教學方式,讓這部分學生盡快進入良好的學習狀態。
(三)學習行為表現指標有較強預測能力
學習績效預測的目的不僅是通過計算機計算出較高準確率的分類結果,更重要的是通過預測結果為學習者提供服務,促使學習者優化學習路徑、改善學習成效?;诙鄨鼍皵祿念A測模型能較為全面地反映學習績效與場景中不同學習行為之間的關系,不僅預測的準確率、效果會有較大提升,而且預測診斷后可以基于結果為學生提供不同學習場景中學習策略的改善意見。如一名學生經過預測模型診斷為A類型后,說明該學生有較好的學習能動性,生活規律一般,則可以通過在生活場景中鼓勵該學生定制學習規劃表、推薦與學科專業相關的圖書,在學習場景中推薦相關網絡課程、提供數字化學習資源等手段,為學生提升學習效率、改進學習方法、提升學習效果提供幫助和指導。隨著智能影像分析、情感識別等技術的日益完善,未來可以獲取到學習者更多場景的數據,如在課程學習過程中內在心理狀態的變化數據,通過學習表情、學習情感、學習注意力等方面信息的收集整理,從心理學視角分析學習行為和狀態,探究更多影響學習結果的因素。
(四)學習績效預測機制與教育價值
基于學習行為預測的應用之一,學習行為干預一般是根據被預測的等級進行對應級別的干預措施,如對預測為學習較差類的學生進行級別較大的干預(Perelmutter,et al,2017),然而由于預測等級的具體原因不清晰,常以一類學生為單位進行集體干預。
而本研究提供的學習行為診斷模型,可以反過來從判斷結果中找到每個學生學習行為中的問題和薄弱點,避免采取以群體為單位的粗顆粒度干預方式,從而為每個學生提供針對性的干預措施,使個性化的“精準干預”成為可能(胡航,等,2019)。如一名學生經過模型診斷為B類型后,發現平均早起時間和網絡課程學習訪問量低于某個預設閾值,則觸發B類干預策略。因此教師可以針對該學生的具體情況采取鼓勵早起學習、增加網絡課程學習時間等干預措施,從而激發和調動學生的學習意識和學習積極性,同時也為教育政策制定、教學資源規劃和教學方法實施提供決策支撐。
同時,從教育決策來看,大數據分析與預測技術的發展為教育決策的制定提供了新的契機,同時也帶來了新的挑戰。大數據、智能技術的發展,特別是面向異構大數據的新一代統計推斷體系,以及適用于噪聲數據挖掘方法、預測方法的不斷完善,為學校教育管理者、教師分析教育現象和結果之間的聯系提供了更加可靠的數據基礎,從而增加教育決策的成功率,降低教育決策的風險和成本。
(五)學習績效預測模型的應用前景
智能裝備可以有效支持教育領域相關研究。本研究的前期數據采集來源于課堂教學分析系統、運動健康管理App以及學習平臺等智能裝備。除了通過相關數據的采集,不少學者還通過智能裝備支持下的相關實驗等進行教育領域的探索研究??梢?,智能裝備在教育研究領域中的應用越來越廣泛,發揮著重要作用。
學習行為與學習績效關系的揭示是一個涉及腦科學、認知科學、教育學的交叉研究,需要更多實證和理論探索,從生理、認知和心理三個層面達到相互印證的統合關系,才能說明學習的發生有深度、有意義(胡航,等,2019)。通過對學生行為數據的分析,行為預警策略能較好地對課堂行為進行分析和評測。應用學習績效預測模型也能較準確地預測運動與課堂行為特征對學習績效的影響,但基于現有的數據與方法僅能呈現行為與學習績效的關系,還未能得出運動、課堂行為之間的聯系,特別是運 動對課堂行為或是運動對學習績效產生影響的其他中介效應未能從模型中反映出來。因此需要更多模態、場景的學習數據來檢測模型對數據變化的容忍度,減小模型對不同應用場景、學習行為類型中數據噪聲的干擾(C.Herrmann,et al,2016),通過不斷調優預測算法與應用策略來提高整體學習績效預測模型的魯棒性,實現高效課堂管理與視頻分析技術的融合,構建學生的綜合數字畫像,研判學生的學習與認知水平。
(作者單位:胡航,西南大學學習與教學智能化研究中心;杜爽,四川外國語大學語言智能學院;康忠琳,西南大學教育學部)
參考文獻
[1] 胡航,李雅馨,郎啟娥,等. 深度學習的發生過程、設計模型與機理闡釋[J]. 中國遠程教育,2020(01):54-61,77.
[2] 牟智佳,武法提. MOOC學習結果預測指標探索與學習群體特征分析[J]. 現代遠程教育研究,2017(03):58-66,93.
[3] 杜爽,飛云倩,何牧,等. 大學生“早起”和“借閱”行為與學習績效的關系研究[J]. 中國遠程教育,2020(11):47-58,77.
[4] 陳子健,朱曉亮. 基于教育數據挖掘的在線學習者學業成績預測建模研究[J]. 中國電化教育,2017(12):75-81,89.
[5] 胡航,李雅馨,曹一凡,等. 腦機交互促進學習有效發生的路徑及實驗研究:基于在線學習系統中的注意力干預分析[J]. 遠程教育雜志,2019,37(04):54-63.
[6] PERELMUTTER B, MC GREGOR K K,GORDON K R. Assistive technology interventions foradolescents and adults with learning disabilities[J]. Computers in Education, 2017(114):139-163.