一、引言 智能革命浪潮正席卷全球。2017年開年,神秘棋手Master連勝中日韓多名世界級頂尖棋手的跨年圍棋大戰(zhàn)落下帷幕,隨即Master被證實(shí)正是2016年3月戰(zhàn)勝李世石的AlphaGo。這是人工智能(Artifi-cial Intelligence,AI)史上絕對的“歷史事件”。AI也正沖擊著人們的日常生活。Google提出的自動(dòng)駕駛汽車(Autonomous Vehicles)已經(jīng)從教科書照進(jìn)了現(xiàn)實(shí),依靠車內(nèi)的智能駕駛儀便可實(shí)現(xiàn)無人駕駛。機(jī)器人的腳步也從探索火星拓展到人體內(nèi),一種可吞服的微型折疊機(jī)器人進(jìn)入人體,可以幫助修復(fù)傷口或挪走被誤食的紐扣電池 在研究領(lǐng)域,美國國家安全與技術(shù)理事會于2016年5月和10月分別發(fā)布了《為人工智能的未來做準(zhǔn)備》和《國家人工智能研發(fā)戰(zhàn)略規(guī)劃》兩份報(bào)告,指出人工智能研究在經(jīng)歷了20世紀(jì)80年代“專注于人類知識”和21世紀(jì)00年代“機(jī)器學(xué)習(xí)的興起”兩次浪潮后,即將迎來“解釋性和通用人工智能技術(shù)”的第三次浪潮。而實(shí)現(xiàn)和推動(dòng)AI研究的核心技術(shù)正是當(dāng)下最熱門的機(jī)器學(xué)習(xí)(Machine Learning)。 教育領(lǐng)域在人工智能研究浪潮的影響和滲透下,也正發(fā)生改變。一方面,人工智能和學(xué)習(xí)科學(xué)相結(jié)合形成新領(lǐng)域——教育人工智能(Educational Ar-tificial Intelligence,EAI),其核心目標(biāo)是“通過計(jì)算獲得精準(zhǔn)和明確的教育、心理和社會知識形式,這些知識往往是隱式的”。知識以學(xué)習(xí)者模型、領(lǐng)域知識模型和教學(xué)模型等形式呈現(xiàn),算法是獲得這些知識的核心技術(shù)。目前,已有大量教育人工智能系統(tǒng)被應(yīng)用于學(xué)校,這些系統(tǒng)整合了教育人工智能和教育數(shù)據(jù)挖掘(Educational Data Mining,EDM)技術(shù)(如,機(jī)器學(xué)習(xí)算法)來跟蹤學(xué)生行為數(shù)據(jù),預(yù)測其學(xué)習(xí)表現(xiàn)以支持個(gè)性化學(xué)習(xí)。 另一方面,以智慧教育引領(lǐng)教育信息化的創(chuàng)新發(fā)展,從而帶動(dòng)教育教學(xué)的創(chuàng)新發(fā)展,已成為信息時(shí)代的必然趨勢。個(gè)性化學(xué)習(xí)作為智慧教育的核心要素,如何通過技術(shù)更好地支持和促進(jìn)個(gè)性化學(xué)習(xí)的開展,已經(jīng)成為智慧教育研究領(lǐng)域的訴求。目前,個(gè)性化學(xué)習(xí)的實(shí)踐應(yīng)用主要集中于自定步調(diào)學(xué)習(xí)、個(gè)別化指導(dǎo)和學(xué)習(xí)內(nèi)容自適應(yīng)等方面,但在整個(gè)學(xué)習(xí)過程中尚未實(shí)現(xiàn)差異化的學(xué)習(xí)服務(wù),主要原因在于技術(shù)的發(fā)展尚不能充分滿足個(gè)性化學(xué)習(xí)的需求。 美國2017國家教育技術(shù)計(jì)劃《重塑技術(shù)的教育角色》,在學(xué)習(xí)部分指出:在移動(dòng)數(shù)據(jù)收集工具和在線協(xié)作平臺的支持下,能夠?yàn)樗袑W(xué)生獲得個(gè)性化學(xué)習(xí)服務(wù)提供機(jī)遇;在領(lǐng)導(dǎo)力部分指出:個(gè)性化學(xué)生學(xué)習(xí)將作為有效領(lǐng)導(dǎo)力的核心關(guān)注領(lǐng)域之一,技術(shù)能夠?yàn)閷W(xué)生提供個(gè)性化學(xué)習(xí)路徑;在測評部分指出:形成性和總結(jié)性評價(jià)數(shù)據(jù)的收集和整合,能支持學(xué)習(xí)者生成個(gè)性化數(shù)字學(xué)習(xí)體驗(yàn),以及教師制定教學(xué)干預(yù)和決策。由此可見,收集和整合大量的、不同源的數(shù)據(jù)支持實(shí)現(xiàn)個(gè)性化學(xué)習(xí)是必然趨勢,而人工智能技術(shù)的應(yīng)用將是實(shí)現(xiàn)這些數(shù)據(jù)價(jià)值最大化的關(guān)鍵。 機(jī)器學(xué)習(xí)作為人工智能領(lǐng)域最核心、最熱門的技術(shù),能夠基于大量數(shù)據(jù)的自動(dòng)識別模式、發(fā)現(xiàn)規(guī)則,預(yù)測學(xué)生學(xué)習(xí)表現(xiàn),為滿足智慧教育和個(gè)性化學(xué)習(xí)的需求提供了可能。目前,國內(nèi)外尚未有研究對機(jī)器學(xué)習(xí)的教育應(yīng)用進(jìn)行系統(tǒng)梳理。為此,我們試圖通過全方位地梳理機(jī)器學(xué)習(xí)教育應(yīng)用的發(fā)展現(xiàn)狀、潛力和進(jìn)展、面臨的挑戰(zhàn)等,為研究者和教育者開展智慧教育和個(gè)性化學(xué)習(xí)提供一定的理論和實(shí)踐依據(jù)。 二、機(jī)器學(xué)習(xí)的概念梳理(一)機(jī)器學(xué)習(xí)的定義 機(jī)器學(xué)習(xí)是人工智能和數(shù)據(jù)挖掘中最重要也是最熱門的算法。國外有些學(xué)者對機(jī)器學(xué)習(xí)進(jìn)行了定義,Mitchell認(rèn)為,機(jī)器學(xué)習(xí)是對能通過經(jīng)驗(yàn)自動(dòng)改進(jìn)的計(jì)算機(jī)算法的研究[10];Alpaydin認(rèn)為,機(jī)器學(xué)習(xí)是指利用數(shù)據(jù)或以往的經(jīng)驗(yàn),以此優(yōu)化計(jì)算機(jī)程序的性能標(biāo)準(zhǔn)[11]。由此可知,機(jī)器學(xué)習(xí)是通過經(jīng)驗(yàn)或數(shù)據(jù)來改進(jìn)算法的研究,旨在通過算法讓機(jī)器從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,自動(dòng)發(fā)現(xiàn)模式并用于預(yù)測。換句話說,機(jī)器學(xué)習(xí)即機(jī)器從數(shù)據(jù)中學(xué)習(xí),其處理的數(shù)據(jù)越多,預(yù)測就越精準(zhǔn)。 (二)機(jī)器學(xué)習(xí)的兩大階段 機(jī)器學(xué)習(xí)的發(fā)展可以分為兩個(gè)階段:淺層學(xué)習(xí)(Shallow Learning) 和深度學(xué)習(xí)(Deep Learing)。 1、淺層學(xué)習(xí) 20世紀(jì)80年代末期,用于人工神經(jīng)網(wǎng)絡(luò)的反向傳播算法(也稱為Back Propagation算法或者BP算法)[12]的出現(xiàn),拉開了淺層學(xué)習(xí)的帷幕。利用BP算法可以讓人工神經(jīng)網(wǎng)絡(luò)模型從大量樣本中學(xué)習(xí)出規(guī)律,并進(jìn)行預(yù)測。但是,淺層學(xué)習(xí)模型依靠人工經(jīng)驗(yàn)來抽取樣本的特征,往往要求開發(fā)人員挖掘出好的特征。 2、深度學(xué)習(xí) 2006年,加拿大多倫多大學(xué)教授、機(jī)器學(xué)習(xí)領(lǐng)域的泰斗Hinton和學(xué)生Salakhutdinov在上Science發(fā)表文章Reducing the Dimensionalitg of Data with Neural Networks[13],翻開了深度學(xué)習(xí)的新篇章。隨后,深度學(xué)習(xí)在學(xué)術(shù)界持續(xù)升溫,目前有多所知名高校紛紛加入深度學(xué)習(xí)的研究。與淺層學(xué)習(xí)模型依賴人工經(jīng)驗(yàn)不同,深層學(xué)習(xí)模型通過構(gòu)建機(jī)器學(xué)習(xí)模型和海量的訓(xùn)練數(shù)據(jù),來學(xué)習(xí)更有用的特征,從而最終提升分類或預(yù)測的準(zhǔn)確性。2013年4月,深度學(xué)習(xí)技術(shù)被《麻省理工學(xué)院技術(shù)評論》(MIT Technology Review)雜志列為2013年十大突破性技術(shù)(Break-through Technology)之首[14]。 (三)機(jī)器學(xué)習(xí)的發(fā)展現(xiàn)狀 機(jī)器學(xué)習(xí)的研究主要分為基于小數(shù)據(jù)和大數(shù)據(jù)環(huán)境下兩類。一般而言,小數(shù)據(jù)指的是基于內(nèi)存的數(shù)據(jù)。基于小數(shù)據(jù)環(huán)境下的機(jī)器學(xué)習(xí)通常被認(rèn)為是傳統(tǒng)的機(jī)器學(xué)習(xí),研究問題主要包括理解并模擬人類的學(xué)習(xí)過程、研究計(jì)算機(jī)系統(tǒng)和人類用戶之間的自然語言接口、針對不完全的信息進(jìn)行推理的能力、構(gòu)造可發(fā)現(xiàn)新事物的程序[15]。而隨著傳感器和連接設(shè)備的廣泛使用,每年都有數(shù)百“澤字節(jié)”(ZettaByte,簡稱ZB,)數(shù)據(jù)產(chǎn)生[16],可見,大數(shù)據(jù)時(shí)代已經(jīng)來臨。一般而言,大數(shù)據(jù)是無法裝載進(jìn)內(nèi)存的數(shù)據(jù),如何從復(fù)雜、真實(shí)、凌亂和無模式的大數(shù)據(jù)中挖掘出對人類有用的知識,是目前迫切需要解決的問題,也是大數(shù)據(jù)時(shí)代下機(jī)器學(xué)習(xí)面臨的挑戰(zhàn)。目前,大數(shù)據(jù)環(huán)境下的機(jī)器學(xué)習(xí)研究主要包括大數(shù)據(jù)分治策略與抽樣、特征選擇、分類、聚類和關(guān)聯(lián)分析等[17]。 三、機(jī)器學(xué)習(xí)與智慧教育的適切性技術(shù)中介的智慧教育已經(jīng)成為教育信息化的新境界、新訴求[18],通過構(gòu)建技術(shù)融合的學(xué)習(xí)環(huán)境,讓教師能夠施展高效的教學(xué)法,讓學(xué)習(xí)者能夠獲得適宜的個(gè)性化學(xué)習(xí)服務(wù)和美好的發(fā)展體驗(yàn),是智慧教育的核心目標(biāo)[19]。在智慧教育環(huán)境中,學(xué)習(xí)者的數(shù)據(jù)被收集形成教育大數(shù)據(jù),迫切需要智能化手段挖掘這些數(shù)據(jù),以發(fā)現(xiàn)潛在模式和知識來支持智慧教育的創(chuàng)新發(fā)展。機(jī)器學(xué)習(xí)的本質(zhì)是使用計(jì)算機(jī)從大量數(shù)據(jù)中學(xué)習(xí)規(guī)律,自動(dòng)發(fā)現(xiàn)模式并用于預(yù)測。因此,機(jī)器學(xué)習(xí)助力智慧教育深度理解學(xué)習(xí)者的學(xué)習(xí)是確定無疑的。 (一)作用對象和環(huán)境 機(jī)器學(xué)習(xí)方法的作用對象是教育數(shù)據(jù),包括學(xué)習(xí)者與教育系統(tǒng)交互產(chǎn)生的所有數(shù)據(jù),以及人口統(tǒng)計(jì)、情感、協(xié)作和管理數(shù)據(jù)等,這些數(shù)據(jù)源來自不同的教育環(huán)境。Romero和Ventura認(rèn)為,教育環(huán)境可以分為傳統(tǒng)教育環(huán)境和基于計(jì)算機(jī)的教育環(huán)境[20];Papamitsiou和Economides認(rèn)為,教育環(huán)境包括虛擬學(xué)習(xí)環(huán)境(Virtual Learning Environment,VLE)和學(xué)習(xí)管理系統(tǒng)(Learning Management System,LMS)、MOOCs和社會性學(xué)習(xí)、基于網(wǎng)絡(luò)的教育、認(rèn)知導(dǎo)師系統(tǒng)、基于計(jì)算機(jī)的教育、多模態(tài)和移動(dòng)環(huán)境[21]。 我們認(rèn)為,智慧教育環(huán)境可以分為傳統(tǒng)教育環(huán)境和網(wǎng)絡(luò)教育環(huán)境,如圖1所示。 傳統(tǒng)教育環(huán)境一般基于學(xué)?;蛘n堂。根據(jù)數(shù)據(jù)存儲的不同,可分為封閉式教學(xué)環(huán)境和開放式教學(xué)環(huán)境。其中,封閉式教學(xué)環(huán)境指單機(jī)版、在本地部署的教學(xué)平臺或桌面版應(yīng)用,數(shù)據(jù)存儲于內(nèi)存;開放式教學(xué)環(huán)境指基于網(wǎng)絡(luò)的遠(yuǎn)程教育平臺(受控環(huán)境,用來收集學(xué)習(xí)者和活動(dòng)數(shù)據(jù)),數(shù)據(jù)存儲于網(wǎng)絡(luò)空間。 網(wǎng)絡(luò)教育環(huán)境分為開放式教學(xué)環(huán)境和非正式社會性教育環(huán)境,其中,非正式社會性教育環(huán)境是指基于智能終端(如,PC、移動(dòng)終端等)和以自主學(xué)習(xí)為主的學(xué)習(xí)環(huán)境,數(shù)據(jù)存儲于網(wǎng)絡(luò)空間。從數(shù)據(jù)的角度看,封閉式教學(xué)環(huán)境是教育小數(shù)據(jù)環(huán)境,開放式教學(xué)環(huán)境和網(wǎng)絡(luò)教育環(huán)境是教育大數(shù)據(jù)環(huán)境。 (二)作用過程 機(jī)器學(xué)習(xí)一般作用于教育數(shù)據(jù)挖掘過程。教育數(shù)據(jù)挖掘涉及開發(fā)、研究和應(yīng)用計(jì)算機(jī)方法在收集的大量教育數(shù)據(jù)中檢測模式,是教育與數(shù)據(jù)挖掘的融合。數(shù)據(jù)挖掘技術(shù)最早于1995年應(yīng)用于教育領(lǐng)域,拉開了教育數(shù)據(jù)挖掘研究的帷幕,此后逐漸發(fā)展成為獨(dú)立的研究領(lǐng)域。教育數(shù)據(jù)挖掘涉及的學(xué)科主要包括教育學(xué)、計(jì)算機(jī)科學(xué)和統(tǒng)計(jì)學(xué)[22],如圖2所示。其中,機(jī)器學(xué)習(xí)作為計(jì)算機(jī)科學(xué)和統(tǒng)計(jì)學(xué)的融合,為教育數(shù)據(jù)挖掘提供了強(qiáng)有力的技術(shù)支持。 在教育數(shù)據(jù)挖掘過程中,機(jī)器學(xué)習(xí)主要作用于數(shù)據(jù)挖掘和解釋部分,實(shí)現(xiàn)傳統(tǒng)教育中缺少或人工難以完成的功能,通過對數(shù)據(jù)進(jìn)行自動(dòng)化分析來發(fā)現(xiàn)未知的新知識和模式,如圖3所示。 其中,在數(shù)據(jù)解釋部分,機(jī)器學(xué)習(xí)方法通過建立預(yù)測模型(Predictive Model)和描述模型(Descriptive Model)分析教育數(shù)據(jù)來發(fā)現(xiàn)模式和知識。預(yù)測模型通過已知的數(shù)據(jù)預(yù)測未知的數(shù)據(jù),例如,通過分析學(xué)生的成績來預(yù)測學(xué)習(xí)表現(xiàn);描述模型通過分析數(shù)據(jù)發(fā)現(xiàn)新的模式或結(jié)構(gòu)。 知識是機(jī)器學(xué)習(xí)的發(fā)現(xiàn),主要分為原理類、實(shí)踐類和優(yōu)化類知識[23]。其中,原理類知識旨在驗(yàn)證或修正現(xiàn)有的教育理論,例如,發(fā)現(xiàn)新的學(xué)習(xí)規(guī)律;實(shí)踐類知識旨在幫助教師開展教學(xué)實(shí)踐,例如,預(yù)測學(xué)生表現(xiàn)和成績;優(yōu)化類知識旨在改進(jìn)學(xué)習(xí)系統(tǒng)的效果和性能,例如,通過分析學(xué)習(xí)者知識提高系統(tǒng)的自適應(yīng)能力。這些知識將最終反饋給教育系統(tǒng)進(jìn)行迭代循環(huán),以促進(jìn)和改善學(xué)習(xí)。 (三)作用方法 目前,應(yīng)用于教育領(lǐng)域的機(jī)器學(xué)習(xí)方法有很多,例如,分類、回歸、聚類、文本挖掘、異常檢查、關(guān)聯(lián)規(guī)則挖掘、社會網(wǎng)絡(luò)分析、模式發(fā)現(xiàn)和序列模式分析等[24-26]。其中,預(yù)測和聚類是目前最熱門的。 1、預(yù)測(Prediction) 預(yù)測旨在開發(fā)一個(gè)模型,從數(shù)據(jù)其他方面的集合(預(yù)測變量)中,推斷數(shù)據(jù)的一個(gè)單一方面(被預(yù)測變量)。簡言之,就是從已知事件推測未知事件的過程。在教育應(yīng)用中,常用的預(yù)測方法是分類(Classi-fication)和回歸(Regression),一般用來預(yù)測學(xué)生的表現(xiàn)和檢測學(xué)生行為。 (1)分類:一般用于預(yù)測學(xué)生的學(xué)習(xí)表現(xiàn),常用算法有決策樹、隨機(jī)森林、角色規(guī)則、逐步回歸和邏輯回歸等。例如,Lauria等使用邏輯回歸、支持向量機(jī)和C4.5決策樹等機(jī)器學(xué)習(xí)方法分析了不同數(shù)據(jù)源的學(xué)生數(shù)據(jù)集[27];Thammasiri等使用邏輯回歸、決策樹、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等機(jī)器學(xué)習(xí)技術(shù)對七年的學(xué)生學(xué)習(xí)數(shù)據(jù)進(jìn)行分析,來預(yù)測新生是否會在第二學(xué)期繼續(xù)學(xué)習(xí)[28]。 (2)回歸:一般用于分析學(xué)習(xí)行為與學(xué)習(xí)表現(xiàn)之間的關(guān)系,常用算法有線性回歸和回歸樹等。例如,Kotsiantis采用回歸算法分析學(xué)生在線提交作業(yè)的評分?jǐn)?shù)據(jù)和學(xué)生的關(guān)鍵人口特征數(shù)據(jù),來預(yù)測學(xué)生的學(xué)習(xí)表現(xiàn)[29];Hachey等采用二元邏輯回歸算法分析學(xué)生在線課程記錄及其GPA,來預(yù)測學(xué)生能否完成在線課程[30]。 2、聚類(Clustering) 聚類通常用于發(fā)現(xiàn)數(shù)據(jù)集中事先未知的常見分類。在教育應(yīng)用中,通常用來基于學(xué)生學(xué)習(xí)和交互模式對學(xué)生分組或?qū)ο嗨频恼n程材料分組。例如,Yanto等基于使用屬性變精度的近似值的精度均值,論證了使用變精度粗糙集模型對焦慮學(xué)生進(jìn)行聚類的適用性[31];Aher和Lobo采用聚類算法和關(guān)聯(lián)規(guī)則挖掘,對Moodle課程的學(xué)習(xí)記錄進(jìn)行聚類和分析,然后向?qū)W習(xí)者推薦合適的課程[32]。 (四)利益相關(guān)者與目標(biāo) 我們通過梳理文獻(xiàn)發(fā)現(xiàn),機(jī)器學(xué)習(xí)教育應(yīng)用的利益相關(guān)者包括學(xué)習(xí)者、教育者、教育管理者、教育研究者和開發(fā)人員(課程或軟件)等,如表1所示。其中主要目標(biāo)體現(xiàn)在:支持學(xué)習(xí)者開展個(gè)性化學(xué)習(xí),通過學(xué)習(xí)行為分析預(yù)測和可視化反饋,提高學(xué)習(xí)者的學(xué)習(xí)表現(xiàn);支持教育者掌握整體和個(gè)體學(xué)生的學(xué)習(xí)情況,自動(dòng)獲得實(shí)時(shí)客觀的教學(xué)反饋,促進(jìn)教學(xué)表現(xiàn)的改善;支持教育管理者制定決策,提供客觀全面的教育反饋;支持教育研究者和開發(fā)人員更精準(zhǔn)地評估和維護(hù)教育系統(tǒng)和在線課程。 綜上可知,機(jī)器學(xué)習(xí)方法能夠自動(dòng)從大量數(shù)據(jù)中提取隱含的、未知的、卻潛在有用的信息和知識,支持智慧教育教師開展智能化教學(xué)和學(xué)生進(jìn)行個(gè)性化學(xué)習(xí)。因此,機(jī)器學(xué)習(xí)應(yīng)用于智慧教育是適合的,也是必要的。 四、機(jī)器學(xué)習(xí)教育應(yīng)用的潛力與進(jìn)展如前文所述,機(jī)器學(xué)習(xí)屬于數(shù)據(jù)挖掘的分析技術(shù),而數(shù)據(jù)挖掘技術(shù)最早于1995年應(yīng)用于教育領(lǐng)域。由此推論,機(jī)器學(xué)習(xí)教育應(yīng)用的研究于1995年拉開序幕。同時(shí),通過文獻(xiàn)梳理發(fā)現(xiàn),教育數(shù)據(jù)挖掘的研究成果在2000年前僅有7篇[33],其具有代表性的文獻(xiàn)綜述主要集中于2009-2010年前后[34-36],這一階段的教育數(shù)據(jù)挖掘研究正接近青春期[37]。因此,從2010年起至今的國外基于真實(shí)數(shù)據(jù)的機(jī)器學(xué)習(xí)以教育應(yīng)用案例研究成果為主,我們通過對機(jī)器學(xué)習(xí)技術(shù)在教育數(shù)據(jù)挖掘青春期階段的研究進(jìn)展及其教育應(yīng)用的潛力進(jìn)行梳理,以期為教育者、教育研究者和開發(fā)人員等在智慧教育中的應(yīng)用提供理論和實(shí)踐指導(dǎo)。 其中,機(jī)器學(xué)習(xí)教育應(yīng)用概念圖如圖4所示。 (一)研究目標(biāo) 我們通過對文獻(xiàn)梳理發(fā)現(xiàn),機(jī)器學(xué)習(xí)教育應(yīng)用主要集中在學(xué)生建模、學(xué)生行為建模、預(yù)測學(xué)習(xí)表現(xiàn)、預(yù)警失學(xué)風(fēng)險(xiǎn)、學(xué)習(xí)支持和評測以及資源推薦等方面(見表2)。 1、學(xué)生建模 學(xué)生建模是創(chuàng)建和維護(hù)學(xué)生模型模塊的過程,學(xué)生模型模塊主要負(fù)責(zé)學(xué)生當(dāng)前知識狀態(tài)模型的開發(fā)和維護(hù),旨在對學(xué)生的誤解和次優(yōu)表現(xiàn)做出假設(shè),以便教師能夠指出并建議修正。學(xué)生建模包括學(xué)生模型和診斷模型,學(xué)生模型存儲學(xué)生知識的數(shù)據(jù)結(jié)構(gòu),診斷模型執(zhí)行診斷過程并更新學(xué)生模型。其中,領(lǐng)域模型是學(xué)生模型的基礎(chǔ)。例如,Yudelson等通過使用自動(dòng)化方法提取領(lǐng)域模型來支持大學(xué)生編程語言的學(xué)習(xí),在解決程序練習(xí)的過程中對學(xué)生知識進(jìn)行建模,以支持系統(tǒng)推薦下一個(gè)解決問題。該研究所用的數(shù)據(jù)來自某大學(xué)三門程序入門課程的代碼快照數(shù)據(jù),處理方法主要基于兩點(diǎn):在每個(gè)程序提交之后,使用程序語言的內(nèi)在結(jié)構(gòu)來建模知識;使用一組測驗(yàn)自動(dòng)測試程序的正確性。該研究選擇Null模型和Rasch模型用于學(xué)生建模,并使用AFM模型結(jié)合PC算法對學(xué)生學(xué)習(xí)建模。研究發(fā)現(xiàn),PC算法的使用能夠提高AFM模型對過濾概念列表的精準(zhǔn)度。 貝葉斯知識跟蹤作為一種用戶建模方法,常被應(yīng)用于智能教學(xué)系統(tǒng)。例如,Eagle等在傳統(tǒng)貝葉斯知識跟蹤模型中插入學(xué)生個(gè)體參數(shù),基于學(xué)生的活動(dòng)數(shù)據(jù),來預(yù)測其在智能教學(xué)系統(tǒng)中學(xué)習(xí)和表現(xiàn)的個(gè)體差異權(quán)重。該方法的優(yōu)點(diǎn)是,如果個(gè)體差異權(quán)重在學(xué)生開始使用系統(tǒng)前能被賦值,將更容易集成入智能教學(xué)系統(tǒng)。研究中的學(xué)生活動(dòng)數(shù)據(jù)包括閱讀表現(xiàn)數(shù)據(jù)和概念知識預(yù)備測試數(shù)據(jù),其中,閱讀表現(xiàn)數(shù)據(jù)包括閱讀時(shí)間和重訪文本頁面(與元認(rèn)知自我監(jiān)管技能有關(guān));概念知識預(yù)備測試數(shù)據(jù)包括預(yù)備測試的準(zhǔn)確性、問題變化和任務(wù)完成時(shí)間。研究結(jié)果得到了四組最佳匹配的個(gè)體差異權(quán)重和三個(gè)貝葉斯知識跟蹤模型的變體模型。研究發(fā)現(xiàn),學(xué)生閱讀文本的數(shù)據(jù)在智能教學(xué)系統(tǒng)中對于預(yù)測學(xué)習(xí)和表現(xiàn)非常有用。 類似的,Baker等采用貝葉斯知識跟蹤和線性回歸等方法構(gòu)建學(xué)生模型,對學(xué)生在特定問題步驟中已獲得技能的可能性進(jìn)行檢測。研究基于232名中學(xué)生的數(shù)學(xué)課程數(shù)據(jù),主要分為兩步建模:使用標(biāo)準(zhǔn)貝葉斯知識跟蹤結(jié)合數(shù)據(jù)和貝葉斯定理來預(yù)測學(xué)生知識,生成可能性的標(biāo)簽;訓(xùn)練模型,使用更廣泛的特征集來預(yù)測標(biāo)簽數(shù)據(jù)。 2、學(xué)生行為建模 學(xué)生行為建模是分析學(xué)生表現(xiàn)、排除潛在的誤區(qū)、呈現(xiàn)學(xué)生目標(biāo)和計(jì)劃、確定先驗(yàn)和獲得的知識、保持情景記憶,以及描述個(gè)性特征等的過程。機(jī)器學(xué)習(xí)方法能夠支持學(xué)習(xí)行為的自動(dòng)檢測、識別和建模,旨在通過描述或預(yù)測模式行為讓系統(tǒng)適應(yīng)學(xué)習(xí)者的偏好傾向。例如,Doleck等使用機(jī)器學(xué)習(xí)方法來挖掘?qū)W習(xí)環(huán)境中與診斷推理的過程、結(jié)果相關(guān)的學(xué)習(xí)者行為,其中,隱馬爾可夫模型用于問題解決的行為熟練指標(biāo)建模,文本分類算法用于分析學(xué)習(xí)者的案例總結(jié)報(bào)告,這些算法的應(yīng)用描述了不同問題解決階段的學(xué)習(xí)者行為,旨在為系統(tǒng)的維護(hù)提供設(shè)計(jì)指導(dǎo)。 類似的,Huang等使用歸納推理(基于相似的學(xué)習(xí))、演繹推理(基于解釋的學(xué)習(xí))和類比推理(案例推理)等多策略機(jī)器學(xué)習(xí)構(gòu)建了黑板多策略機(jī)器學(xué)習(xí)模型,學(xué)習(xí)和發(fā)現(xiàn)學(xué)生學(xué)習(xí)過程中不一致行為的屬性。根據(jù)這些屬性,智能教學(xué)系統(tǒng)可以采取適當(dāng)?shù)姆椒ǚ乐箤W(xué)生不一致行為的再次發(fā)生,例如,加強(qiáng)教學(xué)和實(shí)踐。 Wen和Rosé提出通過點(diǎn)擊流分析確定學(xué)生的行為模式,以便為學(xué)生搜索信息和在線學(xué)習(xí)提供更有效的個(gè)性化支持。該研究分析了與課程成功高低有關(guān)的學(xué)生習(xí)慣性行為,以及情境信息對會話的影響。通過挖掘?qū)W生單個(gè)會話的習(xí)慣性行為,描述了MOOCs中的會話類型,采用局部6元模型對學(xué)習(xí)會話進(jìn)行建模,以支持系統(tǒng)自動(dòng)分配學(xué)習(xí)活動(dòng)和活動(dòng)序列。 也有研究對學(xué)生的分心行為進(jìn)行了分析,例如,等提出使用機(jī)器學(xué)習(xí)模型來支持智能教學(xué)系統(tǒng)自動(dòng)檢測學(xué)生的分心行為,數(shù)據(jù)來源于12名小學(xué)生行為記錄的日志文件,方法采用最小二乘法和脊回歸算法。該研究發(fā)現(xiàn),結(jié)合時(shí)間、表現(xiàn)和鼠標(biāo)移動(dòng)等特征的模型對檢測分心行為最有用,而考慮學(xué)生的個(gè)性化也能提高檢測的有效性;同時(shí)發(fā)現(xiàn),使用脊回歸算法的模型比使用標(biāo)準(zhǔn)最小二乘法的表現(xiàn)更佳。 3、預(yù)測學(xué)習(xí)表現(xiàn) 預(yù)測學(xué)習(xí)表現(xiàn),一般包括預(yù)測學(xué)生的最終分?jǐn)?shù)或?qū)W術(shù)表現(xiàn)等,主要影響因素包括人口特征、分?jǐn)?shù)(平時(shí)測驗(yàn)和最終成績)、學(xué)生學(xué)檔、多模能力、學(xué)生參與、活動(dòng)的注冊和參與以及情緒情感狀態(tài)等。有些研究通過分析學(xué)生數(shù)據(jù)直接預(yù)測學(xué)習(xí)結(jié)果。例如,使用機(jī)器學(xué)習(xí)回歸算法,對學(xué)生少量寫作任務(wù)的分?jǐn)?shù)和學(xué)生的關(guān)鍵人口特征數(shù)據(jù)進(jìn)行分析,以預(yù)測學(xué)生的成績。研究實(shí)驗(yàn)分為兩個(gè)階段,其中,訓(xùn)練階段使用收集的數(shù)據(jù)來訓(xùn)練算法;測試階段使用收集的10組數(shù)據(jù)來檢測算法的精確度。 San Pedro等將學(xué)生知識、學(xué)生情感和行為的細(xì)粒度模型,應(yīng)用于3747名學(xué)生的數(shù)據(jù)分析來理解學(xué)生學(xué)習(xí)的發(fā)展和投入,以預(yù)測學(xué)生能否考上大學(xué)。該研究開發(fā)了一個(gè)邏輯回歸模型,并且發(fā)現(xiàn),學(xué)生投入和學(xué)生成功的特征組合作為預(yù)測指標(biāo),可以辨別出將考入大學(xué)的學(xué)生。 類似的,Hachey等使用二元邏輯斯蒂回歸算法,對962名學(xué)生的先前在線課程結(jié)果和GPA進(jìn)行分析,來預(yù)測學(xué)生完成在線課程的成功率。其中,先前在線課程結(jié)果和GPA作為自變量,在線課程成功率作為因變量。在二元邏輯斯蒂回歸模型中,GPA作為連續(xù)變量。該研究結(jié)果發(fā)現(xiàn),先前在線學(xué)習(xí)體驗(yàn)作為預(yù)測指標(biāo)比GPA能更好地預(yù)測成功率。 也有研究對學(xué)習(xí)表現(xiàn)的影響因素進(jìn)行了分析。Firmin等米用邏輯回歸,基于三門MOOCs課程分析了學(xué)生及格與學(xué)習(xí)努力程度和個(gè)人基本特征的相關(guān)性。該研究采用二元邏輯斯蒂回歸算法,發(fā)現(xiàn)學(xué)生的努力變量是學(xué)生及格唯一有效的預(yù)測指標(biāo),如,登錄次數(shù)、學(xué)習(xí)時(shí)長和完成作業(yè)情況等,與學(xué)生基本特征無關(guān),如,性別、年齡和家庭收入等。 4、預(yù)警失學(xué)風(fēng)險(xiǎn) 綴學(xué)率一直是教育管理領(lǐng)域的重要指標(biāo)。機(jī)器學(xué)習(xí)方法能夠?qū)W(xué)生數(shù)據(jù)特征進(jìn)行分析和歸類,分析學(xué)生綴學(xué)原因,預(yù)測綴學(xué)行為。雖然教育管理部門存有大量的學(xué)生數(shù)據(jù),但是由于缺乏適當(dāng)?shù)臄?shù)據(jù)或受數(shù)據(jù)隱私性限制,預(yù)警失學(xué)的定量研究相對較少。 例如,Thammasiri等和Lauía等基于大量的真實(shí)學(xué)生數(shù)據(jù)對學(xué)生的學(xué)術(shù)成功展開了研究。其中,Thammasiri等使用機(jī)器學(xué)習(xí)技術(shù)對長達(dá)七年、特征豐富的真實(shí)學(xué)生數(shù)據(jù)進(jìn)行分析,來預(yù)測新生是否會在第二個(gè)學(xué)期注冊繼續(xù)學(xué)習(xí)。該研究比較了不同的數(shù)據(jù)平衡技術(shù)來提高少數(shù)類的預(yù)測準(zhǔn)確度,其中包括過抽樣算法、欠抽樣算法和合成少數(shù)類過抽樣算法,并連同邏輯回歸、決策樹、人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等四種流行的分類方法,構(gòu)建預(yù)測模型來進(jìn)行比較。研究結(jié)果發(fā)現(xiàn),支持向量機(jī)結(jié)合合成少數(shù)類過抽樣算法數(shù)據(jù)平衡技術(shù)是表現(xiàn)最佳的分類器,三個(gè)數(shù)據(jù)平衡技術(shù)都能提高少數(shù)類的預(yù)測準(zhǔn)確度。在開發(fā)的模型中應(yīng)用靈敏度分析,能夠?yàn)閷W(xué)生流失的準(zhǔn)確預(yù)測識別出最重要的變量。這些模型的應(yīng)用能夠預(yù)測高危學(xué)生,開發(fā)有效的干預(yù)方法來減少學(xué)生的失學(xué)率。 類似的,Lauría等使用數(shù)據(jù)挖掘方法檢測學(xué)生的學(xué)術(shù)危機(jī)來提高大學(xué)生的保留率。該研究的數(shù)據(jù)挖掘模型基于監(jiān)督式學(xué)習(xí)技術(shù),用來區(qū)分表現(xiàn)好和不好的學(xué)生。研究的方法框架包括收集數(shù)據(jù)、轉(zhuǎn)化數(shù)據(jù)、分割數(shù)據(jù)、平衡訓(xùn)練數(shù)據(jù)、構(gòu)建預(yù)測模型和使用測試數(shù)據(jù)評價(jià)模型。在構(gòu)建預(yù)測模型階段,該研究方法選用了三個(gè)分類器作比較:邏輯回歸、支持向量機(jī)和C4.5決策樹。數(shù)據(jù)來自四個(gè)不同數(shù)據(jù)源的3877條記錄:學(xué)生履歷數(shù)據(jù)和課程相關(guān)數(shù)據(jù)、課程管理事件數(shù)據(jù)和Sakai成績單數(shù)據(jù)。研究結(jié)果發(fā)現(xiàn),邏輯回歸和支持向量機(jī)算法比C4.5決策樹能夠更精準(zhǔn)地分類。 人口統(tǒng)計(jì)和學(xué)習(xí)成績是預(yù)測學(xué)生綴學(xué)的重要數(shù)據(jù)。例如,Aulck等采用機(jī)器學(xué)習(xí)方法跟蹤32500名學(xué)生收集成績數(shù)據(jù)和人口統(tǒng)計(jì)數(shù)據(jù),使用邏輯回歸正則化、k最近鄰算法和隨機(jī)森林等方法來預(yù)測輟學(xué)變量,并對學(xué)生數(shù)據(jù)中預(yù)測輟學(xué)的最佳要素進(jìn)行了檢測。研究結(jié)果發(fā)現(xiàn),邏輯回歸正則化相比另外兩種算法能夠提供最有力的預(yù)測,并檢測出學(xué)生流失的個(gè)人預(yù)測指標(biāo),包括數(shù)學(xué)、英語、化學(xué)和心理學(xué)課程的GPA以及入學(xué)和出生年月等。 5、學(xué)習(xí)支持和評測 學(xué)習(xí)支持和反饋是増強(qiáng)在線教育系統(tǒng)個(gè)性化和定制化的關(guān)鍵。在學(xué)習(xí)者與系統(tǒng)交互的過程中,學(xué)習(xí)支持提供個(gè)性化學(xué)習(xí)服務(wù)提高學(xué)習(xí)表現(xiàn),或者糾正學(xué)生的學(xué)習(xí)誤區(qū)。前者是“先發(fā)制人”,后者是“亡羊補(bǔ)牢”。例如,Ahadi等將機(jī)器學(xué)習(xí)方法和大學(xué)生編程過程中的源代碼快照數(shù)據(jù)相結(jié)合,讓系統(tǒng)能夠在課程入門第一周,就精準(zhǔn)地檢測出高表現(xiàn)和低表現(xiàn)的學(xué)生。該研究首先對特征進(jìn)行了抽取和選擇,然后選擇最精確的分類器來檢測預(yù)測模型。其中,選取了貝葉斯(樸素貝葉斯、貝葉斯網(wǎng)絡(luò))、規(guī)則學(xué)習(xí)者(決策表、連接規(guī)則和PART)和決策樹(AD樹、J48、隨機(jī)森林和決策樹)等分類器進(jìn)行評估,發(fā)現(xiàn)決策樹分類器的整體準(zhǔn)確度最高,而在決策樹中隨機(jī)森林的預(yù)測準(zhǔn)確度最高,因此,選擇隨機(jī)森林作為分類器來評價(jià)學(xué)生的表現(xiàn)。 Xing等結(jié)合學(xué)習(xí)分析和教育數(shù)據(jù)挖掘方法,基于小數(shù)據(jù)來預(yù)測學(xué)生在CSCL學(xué)習(xí)環(huán)境中的表現(xiàn),從而為學(xué)生提供相應(yīng)的教學(xué)干預(yù)。該研究使用活動(dòng)理論來整體量化環(huán)境中的學(xué)生參與情況,并得到六個(gè)特征變量,然后使用遺傳規(guī)劃技術(shù)來構(gòu)建預(yù)測模型。結(jié)果顯示,基于遺傳規(guī)劃的模型是可解釋的,并且與傳統(tǒng)建模算法相比預(yù)測率得到優(yōu)化。 對學(xué)習(xí)者的領(lǐng)域知識獲取、技能發(fā)展和完成結(jié)果,以及反思、探究和情緒等的監(jiān)控和評價(jià),也是機(jī)器學(xué)習(xí)研究的重要主題。例如,Kinnebrew和Biswas使用探索性數(shù)據(jù)挖掘方法,從學(xué)生的交互軌跡中評測和比較學(xué)生的學(xué)習(xí)行為。其中,核心方法結(jié)合迭代行為抽象和逐段線性分割,迭代行為抽象是區(qū)別識別頻繁活動(dòng)模式的序列挖掘技術(shù),逐段線性分割是關(guān)于評估表現(xiàn)或進(jìn)展衡量的活動(dòng)階段。研究結(jié)果發(fā)現(xiàn),高表現(xiàn)和低表現(xiàn)學(xué)生具有不同的閱讀行為模式和監(jiān)控行為。 6、資源推薦 資源推薦通過分析學(xué)習(xí)者學(xué)習(xí)記錄來預(yù)測學(xué)習(xí)者的喜好,為學(xué)習(xí)者推薦最合適的資源(內(nèi)容、活動(dòng)或服務(wù))或資源序列。其最大的特征是通過分析學(xué)習(xí)者的行為,來“猜”學(xué)習(xí)者的表現(xiàn)和興趣,并生成個(gè)性化推薦,旨在幫助學(xué)習(xí)者選擇感興趣的課程、科目、學(xué)習(xí)材料和學(xué)習(xí)活動(dòng)等。例如,等使用機(jī)器學(xué)習(xí)方法構(gòu)建編程學(xué)習(xí)系統(tǒng)的推薦模型,能夠自動(dòng)地適應(yīng)學(xué)習(xí)者的興趣和知識水平。系統(tǒng)通過測試學(xué)習(xí)者學(xué)習(xí)風(fēng)格和挖掘服務(wù)日志,來識別學(xué)習(xí)風(fēng)格和學(xué)習(xí)者習(xí)慣的不同模式。研究首先基于不同的學(xué)習(xí)風(fēng)格處理集群,然后,通過AprioriAll算法挖掘頻繁序列,分析學(xué)習(xí)者的習(xí)慣和興趣,最后,系統(tǒng)根據(jù)頻繁序列的等級推薦個(gè)性化學(xué)習(xí)內(nèi)容。 Wang和Liao設(shè)計(jì)了一個(gè)基于不同學(xué)生特征推薦個(gè)性化教學(xué)內(nèi)容的英語自適應(yīng)學(xué)習(xí)系統(tǒng)。系統(tǒng)的核心技術(shù)是人工神經(jīng)網(wǎng)絡(luò)(ANN),并選擇ANN的BP算法用于學(xué)生特征和學(xué)習(xí)表現(xiàn)的監(jiān)督聚類分類。該研究應(yīng)用了一個(gè)四步核心方法來構(gòu)建每個(gè)學(xué)生的特征與詞匯、語法和閱讀的學(xué)習(xí)表現(xiàn)的關(guān)系,方法步驟包括構(gòu)建學(xué)生特征和學(xué)習(xí)表現(xiàn)的關(guān)系、獲得所有不同特征組合的學(xué)習(xí)表現(xiàn)、設(shè)置α-截和不同學(xué)習(xí)表現(xiàn)水平的α-截,以及為不同學(xué)生特征組合設(shè)置教學(xué) 內(nèi)容的不同等級。該方法支持系統(tǒng)根據(jù)學(xué)生的性別、性格和學(xué)習(xí)焦慮程度等特征,來適應(yīng)、推薦不同層次的學(xué)習(xí)內(nèi)容。 同樣,Aher和Lobo發(fā)現(xiàn)聚類和關(guān)聯(lián)規(guī)則算法等數(shù)據(jù)挖掘技術(shù)可用于課程推薦系統(tǒng),系統(tǒng)能夠基于其他學(xué)生在Moodle選擇的課程來為學(xué)生推薦相關(guān)課程。該研究發(fā)現(xiàn),使用樸素K均值聚類技術(shù)和Apriori關(guān)聯(lián)規(guī)則算法的綜合方法,無需經(jīng)歷數(shù)據(jù)準(zhǔn)備階段,而且關(guān)聯(lián)規(guī)則的數(shù)目還更多。課程推薦系統(tǒng)能夠根據(jù)學(xué)生的興趣,幫助學(xué)生選擇適當(dāng)?shù)恼n程組合。 (二)典型應(yīng)用:個(gè)性化自適應(yīng)學(xué)習(xí)平臺 個(gè)性化學(xué)習(xí)是指優(yōu)化學(xué)習(xí)步調(diào)和教學(xué)方法來滿足每位學(xué)習(xí)者需求的教學(xué)[58]。基于學(xué)習(xí)者的需求,學(xué)習(xí)目標(biāo)、教學(xué)方法和教學(xué)內(nèi)容是不同的,并且對于學(xué)習(xí)者來說,學(xué)習(xí)活動(dòng)是有意義且相關(guān)的,是受興趣驅(qū)動(dòng)且經(jīng)常是自我發(fā)起的。智慧教育的發(fā)展目標(biāo)之一就是為學(xué)習(xí)者提供個(gè)性化學(xué)習(xí)服務(wù),體現(xiàn)學(xué)生的差異化,改變傳統(tǒng)教育一刀切的局面。 根據(jù)前文的梳理可知,機(jī)器學(xué)習(xí)能夠結(jié)合學(xué)生的知識、行為和情緒等有效地支持個(gè)性化自適應(yīng)學(xué)習(xí)平臺的構(gòu)建。其中,在知識維度,機(jī)器學(xué)習(xí)支持學(xué)生建模,能夠?qū)γ總€(gè)學(xué)生的知識進(jìn)行建模和跟蹤,支持生成形成性評價(jià),為學(xué)習(xí)者推薦自適應(yīng)的課程和資源。在行為維度,機(jī)器學(xué)習(xí)支持學(xué)習(xí)行為建模,根據(jù)學(xué)生不同學(xué)習(xí)表現(xiàn)的行為模式對學(xué)生自動(dòng)分組,提供相應(yīng)的學(xué)習(xí)支持;通過分析學(xué)習(xí)歷史(如,活動(dòng)日志、學(xué)習(xí)結(jié)果等)和人口特征等數(shù)據(jù),來預(yù)測學(xué)生的學(xué)習(xí)表現(xiàn)和成績。在情感維度,機(jī)器學(xué)習(xí)能夠發(fā)現(xiàn)學(xué)習(xí)者情緒狀態(tài)與學(xué)習(xí)行為、結(jié)果的相關(guān)性,從而根據(jù)學(xué)生的情緒狀態(tài)推薦課程資源。 目前,Knewton、DreamBox、ALEKS、Gooru等個(gè)性化自適應(yīng)學(xué)習(xí)平臺,結(jié)合機(jī)器學(xué)習(xí)技術(shù)已經(jīng)得到了廣泛應(yīng)用。其中,Knewton作為目前影響力最大的自適應(yīng)學(xué)習(xí)平臺,能夠?yàn)閷W(xué)習(xí)者提供自適應(yīng)學(xué)習(xí)體驗(yàn)和預(yù)測分析,來提高學(xué)生的學(xué)習(xí)成就。在技術(shù)層面,平臺使用機(jī)器學(xué)習(xí)方法作為核心技術(shù),構(gòu)建了分析引擎和推薦引擎,分析引擎結(jié)合內(nèi)容數(shù)據(jù)和學(xué)生響應(yīng)數(shù)據(jù)實(shí)時(shí)地對學(xué)生能力進(jìn)行推斷,然后,推斷結(jié)果與學(xué)生學(xué)習(xí)結(jié)果結(jié)合,支持預(yù)測學(xué)生的學(xué)習(xí)表現(xiàn),從而為學(xué)習(xí)者生成下一步的個(gè)性化學(xué)習(xí)路徑。 隨著收集的數(shù)據(jù)越來越多,基于機(jī)器學(xué)習(xí)的推薦引擎和分析引擎模型和參數(shù)會不斷修改與更新,讓預(yù)測更加精準(zhǔn)。Knewton在學(xué)習(xí)過程中主要提供三種工具和三種核心服務(wù),其中,工具包括個(gè)別化指導(dǎo)、預(yù)測分析和學(xué)習(xí)報(bào)告;服務(wù)包括為學(xué)生提供個(gè)性化推薦、為教師和學(xué)生提供分析、為應(yīng)用和內(nèi)容創(chuàng)建者提供內(nèi)容解讀。通過使用Knewton自適應(yīng)學(xué)習(xí)平臺,學(xué)生的通過率、退出率、提早完成率均有顯著變化。 五、機(jī)器學(xué)習(xí)應(yīng)用于智慧教育的幾點(diǎn)建議機(jī)器學(xué)習(xí)作為人工智能的核心技術(shù)作用于教育大數(shù)據(jù),將幫助我們更好地理解數(shù)據(jù)、信息、知識與智慧之間的關(guān)系。但機(jī)器學(xué)習(xí)教育應(yīng)用在技術(shù)方面尚不成熟,在教育框架下也沒有規(guī)模化。因此,基于智慧教育框架,對機(jī)器學(xué)習(xí)的教育應(yīng)用提出以下建議: (一)跨界方面——支持智慧教育與機(jī)器學(xué)習(xí)的融合創(chuàng)新 1、機(jī)器學(xué)習(xí)與智慧教育的跨界融合 機(jī)器學(xué)習(xí)與智慧教育的融合存在跨界問題。一般情況下,懂教育的未必懂技術(shù),懂技術(shù)的則未必深度理解教育。這就容易導(dǎo)致技術(shù)人員對數(shù)據(jù)挖掘結(jié)果無法從教育的本質(zhì)出發(fā)進(jìn)行解讀,而教育者無法從技術(shù)的角度對機(jī)器學(xué)習(xí)應(yīng)用提出準(zhǔn)確需求,對預(yù)測結(jié)果也無法充分理解。因此,研究教育領(lǐng)域與機(jī)器學(xué)習(xí)和人工智能領(lǐng)域如何深度融合非常必要。例如,加大兩個(gè)領(lǐng)域人員的合作、交流和協(xié)同開發(fā)等;在高校中加大機(jī)器學(xué)習(xí)與學(xué)習(xí)科學(xué)的跨學(xué)科人才培養(yǎng);目前,利用可視化技術(shù)開發(fā)人機(jī)界面,可有效幫助教育者理解機(jī)器學(xué)習(xí)和人工智能系統(tǒng),以促進(jìn)跨領(lǐng)域深度融合??梢暬瘜W(xué)術(shù)交互平臺也能支持教育領(lǐng)域人員更好地理解機(jī)器學(xué)習(xí),例如,谷歌日前聯(lián)手OpenAI等發(fā)布了一個(gè)交互視覺化期刊平臺Distill(http://distill.pub/),支持讀者理解機(jī)器學(xué)習(xí)的研究成果。 2、機(jī)器學(xué)習(xí)應(yīng)用的教學(xué)場景提煉 機(jī)器學(xué)習(xí)助力智慧教育發(fā)展的潛力和價(jià)值是毋庸置疑的,但目前缺少機(jī)器學(xué)習(xí)教育應(yīng)用的成熟案例,尤其是在不同教學(xué)場景中的應(yīng)用,這將是機(jī)器學(xué)習(xí)應(yīng)用發(fā)展的一大短板。機(jī)器學(xué)習(xí)雖然本身具有智能性,但是也具有一定局限性,尤其表現(xiàn)為容易被復(fù)雜的場景所迷惑,人們可能很容易完成的場景分析,對于機(jī)器來說卻依舊困難。如果一直強(qiáng)調(diào)機(jī)器學(xué)習(xí)技術(shù)本身,而不直接面向教育應(yīng)用提供整體的解決方案,隨著技術(shù)壁壘越來越低,其教育應(yīng)用的未來價(jià)值可能會越來越小。因此,基于智慧教育框架梳理和提煉機(jī)器學(xué)習(xí)不同教學(xué)場景應(yīng)用的案例,將有助于體現(xiàn)機(jī)器學(xué)習(xí)的教學(xué)應(yīng)用價(jià)值。 (二)技術(shù)方面——支持智慧環(huán)境的技術(shù)創(chuàng)新 1、教育大數(shù)據(jù)治理 教育大數(shù)據(jù)是機(jī)器學(xué)習(xí)應(yīng)用研究的基礎(chǔ),其大量的、復(fù)雜的和凌亂的特點(diǎn),給數(shù)據(jù)的采集和存儲帶來了難度。同時(shí),在數(shù)據(jù)共享方面通常涉及數(shù)據(jù)隱私和倫理問題,如何保護(hù)人們隱私又最大化地合理利用數(shù)據(jù)支持科學(xué)研究,也是當(dāng)前面臨的挑戰(zhàn)。因此,需要協(xié)同多方開展教育大數(shù)據(jù)治理,以提升教育數(shù)據(jù)質(zhì)量、保障數(shù)據(jù)合理使用、保護(hù)數(shù)據(jù)隱私安全,以及促進(jìn)數(shù)據(jù)合法共享。例如,建立健全的教育大數(shù)據(jù)治理模式,制定教育數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)和管理規(guī)范,規(guī)范化采集和匯聚、共享不同平臺的數(shù)據(jù),形成智慧教育數(shù)據(jù)中心等。 2、數(shù)據(jù)標(biāo)準(zhǔn)化 在機(jī)器學(xué)習(xí)應(yīng)用之前,通常使用標(biāo)準(zhǔn)化之后的數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)標(biāo)準(zhǔn)化是支撐機(jī)器學(xué)習(xí)應(yīng)用和發(fā)展的重要基礎(chǔ)。因此,為了實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)化,需要對智慧環(huán)境技術(shù)架構(gòu)進(jìn)一步作頂層設(shè)計(jì)和研究,以考慮數(shù)據(jù)標(biāo)準(zhǔn)化,以及不同工具和平臺之間的兼容性。智慧環(huán)境的技術(shù)架構(gòu)應(yīng)該融合學(xué)習(xí)內(nèi)容、軟件和平臺等支持系統(tǒng)集成和資源共享,以開放標(biāo)準(zhǔn)和相關(guān)服務(wù)(網(wǎng)絡(luò)服務(wù)和應(yīng)用編程接口)為中心,制定統(tǒng)一的數(shù)據(jù)交換標(biāo)準(zhǔn),實(shí)現(xiàn)低成本、敏捷無縫整合和數(shù)據(jù)交換。 (三)教學(xué)方面——支持智慧教學(xué)法的方法創(chuàng)新 1、提升教師素養(yǎng) 機(jī)器學(xué)習(xí)作為一種新型技術(shù),容易造成教師對新型機(jī)器學(xué)習(xí)支持的教育軟件和服務(wù)的用戶體驗(yàn)不佳,原因在于教師信息素養(yǎng)與此類新型軟件的不匹配。使用新型軟件加重了教師的工作負(fù)載,如何將其與現(xiàn)有的教學(xué)進(jìn)行整合,對教師來說也是一大挑戰(zhàn)。因此,一方面需要不斷提升教師的信息素養(yǎng)來適應(yīng)新型技術(shù)的應(yīng)用,另一方面在軟件開發(fā)過程中需要考慮教師的需求,幫助教師更容易地接受新型技術(shù)并融入教學(xué)中。 2、提高教師參與 機(jī)器學(xué)習(xí)常應(yīng)用于智能教學(xué)系統(tǒng)中,而這類系統(tǒng)通常會弱化教師的參與,學(xué)習(xí)者根據(jù)自己的學(xué)習(xí)步調(diào)就能開展學(xué)習(xí)。從短期來看,智能化推送減少了學(xué)習(xí)者的認(rèn)知負(fù)載;但從長遠(yuǎn)來看,過度依賴系統(tǒng)建議,學(xué)習(xí)者自我反省、自我意識和自主學(xué)習(xí)的能力將不斷弱化。雖然機(jī)器學(xué)習(xí)應(yīng)用能夠?qū)崿F(xiàn)智能化和自動(dòng)化,但是教師能為學(xué)生提供情感交互、學(xué)習(xí)輔導(dǎo)和教學(xué)法設(shè)計(jì),這是機(jī)器學(xué)習(xí)目前無法實(shí)現(xiàn)的。因此,應(yīng)該強(qiáng)調(diào)機(jī)器學(xué)習(xí)應(yīng)用系統(tǒng)與教師的協(xié)作而非取代教師來優(yōu)化效能。在應(yīng)用過程中需要不斷提高教師的參與并激發(fā)其積極性,從而與系統(tǒng)優(yōu)勢互補(bǔ)、共同參與,促進(jìn)教學(xué)法的創(chuàng)新。 綜上所述,機(jī)器學(xué)習(xí)可以有效助力智慧教育,其在教育人工智能和教育數(shù)據(jù)挖掘方面發(fā)揮的作用也是其他技術(shù)無法取代的。隨著機(jī)器學(xué)習(xí)技術(shù)的不斷發(fā)展和應(yīng)用,其與教育領(lǐng)域的融合定會不斷推動(dòng)教育創(chuàng)新。 本文轉(zhuǎn)載自MOOC |
|