陳筱語(yǔ)
摘 要 伴隨互聯(lián)網(wǎng)發(fā)展,以云計(jì)算和大數(shù)據(jù)為代表的信息技術(shù),已經(jīng)開(kāi)始滲透至各個(gè)領(lǐng)域。以深度學(xué)習(xí)為代表的機(jī)器學(xué)習(xí)技術(shù),在諸多行業(yè)逐步開(kāi)始發(fā)揮革命性作用。而在教育領(lǐng)域,大部分學(xué)校依然遵循傳統(tǒng)的教育模式,教學(xué)參與者如學(xué)校、教師、學(xué)生和家長(zhǎng)普遍感到異常辛苦。本文就利用基于互聯(lián)網(wǎng)和大數(shù)據(jù)的最新機(jī)器學(xué)習(xí)技術(shù),實(shí)現(xiàn)自主學(xué)習(xí),進(jìn)而提高高中階段教學(xué)效率的可能性和應(yīng)用過(guò)程進(jìn)行探討。
關(guān)鍵詞 機(jī)器學(xué)習(xí) 統(tǒng)計(jì) 數(shù)據(jù)挖掘 互聯(lián)網(wǎng)
中圖分類號(hào):TP181 文獻(xiàn)標(biāo)識(shí)碼:A
1機(jī)器學(xué)習(xí)技術(shù)介紹
根據(jù)南京大學(xué)教授周志華的《機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘》對(duì)機(jī)器學(xué)習(xí)的定義,“機(jī)器學(xué)習(xí)”是人工智能的核心研究領(lǐng)域之一,其最初的研究動(dòng)機(jī)是為了讓計(jì)算機(jī)系統(tǒng)具有人的學(xué)習(xí)能力以便實(shí)現(xiàn)人工智能。目前被廣泛采用的機(jī)器學(xué)習(xí)的定義是“利用經(jīng)驗(yàn)來(lái)改善計(jì)算機(jī)系統(tǒng)自身的性能”。事實(shí)上,由于“經(jīng)驗(yàn)”在計(jì)算機(jī)系統(tǒng)中主要是以數(shù)據(jù)的形式存在的,因此機(jī)器學(xué)習(xí)設(shè)法要對(duì)數(shù)據(jù)進(jìn)行分析,從海量的數(shù)據(jù)中,利用各種機(jī)器學(xué)習(xí)算法,提煉具有洞察價(jià)值的信息。
2機(jī)器學(xué)習(xí)核心技術(shù)簡(jiǎn)介
機(jī)器學(xué)習(xí)是人工智能研究發(fā)展到一定階段的必然產(chǎn)物。R.S.Michalski等人把機(jī)器學(xué)習(xí)研究劃分成“從例子中學(xué)習(xí)”、“在問(wèn)題求解和規(guī)劃中學(xué)習(xí)”、“通過(guò)觀察和發(fā)現(xiàn)學(xué)習(xí)”、“從指令中學(xué)習(xí)”等范疇。20世紀(jì)80年代以來(lái),研究次數(shù)最多、應(yīng)用最廣的是“從例子中學(xué)習(xí)”(即廣義的歸納學(xué)習(xí)),它涵蓋了監(jiān)督學(xué)習(xí)(如分類、回歸)、非監(jiān)督學(xué)習(xí)(例如聚類)等眾多內(nèi)容。歸納學(xué)習(xí)另一個(gè)重要分支是神經(jīng)網(wǎng)絡(luò)和支持向量機(jī),自從80年代BP“反向傳播算法”的發(fā)明以來(lái),神經(jīng)網(wǎng)絡(luò)得到了極大的發(fā)展,現(xiàn)在已經(jīng)形成“深度學(xué)習(xí)”這一獨(dú)立的領(lǐng)域,在圖像識(shí)別和音頻識(shí)別方面發(fā)揮著重要的作用。以下是主要機(jī)器學(xué)習(xí)核心技術(shù)的介紹:
2.1分類算法
分類算法屬于監(jiān)督式學(xué)習(xí)算法,其原理是通過(guò)研究歷史數(shù)據(jù),提取數(shù)據(jù)特征指標(biāo),依據(jù)歷史數(shù)據(jù)結(jié)果,形成分類規(guī)則集合,通過(guò)信息熵最大算法,不斷對(duì)這些規(guī)則進(jìn)行篩選,最終形成對(duì)數(shù)據(jù)進(jìn)行有效分類的規(guī)則集合,以對(duì)將來(lái)數(shù)據(jù)進(jìn)行預(yù)測(cè)。分類算法包括決策樹(shù)、隨機(jī)森林等。
2.2聚類算法
聚類算法屬于非監(jiān)督式學(xué)習(xí)算法,與分類算法等監(jiān)督式學(xué)習(xí)不同,聚類算法不包含數(shù)據(jù)標(biāo)簽,而是對(duì)原始數(shù)據(jù)特征運(yùn)用距離算法,以推斷出數(shù)據(jù)標(biāo)簽。常見(jiàn)的聚類算法包括k-Means、分層聚類等。
2.3關(guān)聯(lián)算法
關(guān)聯(lián)算法是從一個(gè)數(shù)據(jù)集中發(fā)現(xiàn)數(shù)據(jù)項(xiàng)直接關(guān)聯(lián)規(guī)則的算法,關(guān)聯(lián)算法的代表是基于頻繁項(xiàng)集的Apriori算法。如果存在一條關(guān)聯(lián)規(guī)則,它的支持度和置信度都大于預(yù)先定義好的最小支持度與置信度,我們就稱它為強(qiáng)關(guān)聯(lián)規(guī)則。強(qiáng)關(guān)聯(lián)規(guī)則就可以用來(lái)了解項(xiàng)之間的隱藏關(guān)系。所以關(guān)聯(lián)分析的主要目的就是尋找強(qiáng)關(guān)聯(lián)規(guī)則,而Apriori算法則主要用來(lái)幫助尋找強(qiáng)關(guān)聯(lián)規(guī)則。
2.4回歸算法
回歸算法基于統(tǒng)計(jì)學(xué)的線性回歸和邏輯回歸分析技術(shù),線性回歸是通過(guò)“最小二乘法”,對(duì)觀測(cè)數(shù)據(jù)進(jìn)行擬合,以對(duì)未來(lái)數(shù)據(jù)進(jìn)行預(yù)測(cè);邏輯回歸與線性回歸算法非常類似,但使用的是離散的數(shù)據(jù)分類特征,使用sigmoid函數(shù),將線性回歸的計(jì)算結(jié)果轉(zhuǎn)化為0或1的概率,然后根據(jù)這個(gè)概率進(jìn)行預(yù)測(cè)。
2.5支持向量機(jī)
支持向量機(jī)(SVM)屬于基于核的算法,是90年代中期發(fā)展起來(lái)的基于統(tǒng)計(jì)學(xué)習(xí)理論的一種機(jī)器學(xué)習(xí)方法,通過(guò)尋求結(jié)構(gòu)化風(fēng)險(xiǎn)最小來(lái)提高學(xué)習(xí)機(jī)泛化能力,實(shí)現(xiàn)經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍的最小化,從而達(dá)到在統(tǒng)計(jì)樣本量較少的情況下,亦能獲得良好統(tǒng)計(jì)規(guī)律的目的。
2.6神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)算法模擬生物神經(jīng)網(wǎng)絡(luò),是一類模式匹配算法。通常用于解決分類和回歸問(wèn)題。人工神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)的一個(gè)龐大的分支,有幾百種不同的算法,重要的人工神經(jīng)網(wǎng)絡(luò)算法包括:感知器神經(jīng)網(wǎng)絡(luò)(Perceptron Neural Network),反向傳遞(Back Propagation),學(xué)習(xí)矢量量化(Learning Vector Quantization,LVQ)等。
以上是對(duì)機(jī)器學(xué)習(xí)核心技術(shù)和算法的簡(jiǎn)要介紹,實(shí)際上機(jī)器學(xué)習(xí)領(lǐng)域發(fā)展很快,各種算法層出不窮。據(jù)統(tǒng)計(jì),現(xiàn)有的機(jī)器學(xué)習(xí)算法已經(jīng)超過(guò)1000種。我們這里主要介紹一些應(yīng)用比較廣泛的機(jī)器學(xué)習(xí)技術(shù),為后續(xù)在高中階段學(xué)生自主學(xué)習(xí)中應(yīng)用做鋪墊。
3基于機(jī)器學(xué)習(xí)的自主學(xué)習(xí)
高中階段學(xué)生要實(shí)現(xiàn)自主學(xué)習(xí),除了前文提到的機(jī)器學(xué)習(xí)技術(shù)已經(jīng)成熟之外,還有兩個(gè)先決條件也已經(jīng)具備。一是隨處可得的數(shù)據(jù)收集和處理技術(shù);另一個(gè)是基于互聯(lián)網(wǎng)的豐富的教學(xué)資源和多樣的教學(xué)手段,包括課件、題庫(kù)、多媒體課堂等。
3.1大數(shù)據(jù)技術(shù)
大數(shù)據(jù)技術(shù)是隨著互聯(lián)網(wǎng)發(fā)展起來(lái)的最新數(shù)據(jù)處理技術(shù),它處理的規(guī)模和吞吐量是之前的計(jì)算機(jī)系統(tǒng)的幾百上千倍,因而,隨地收集各種數(shù)據(jù)成為可能。
大數(shù)據(jù)技術(shù)主要包括四個(gè)方面:
3.1.1海量數(shù)據(jù)收集
大數(shù)據(jù)收集技術(shù)能夠?qū)崟r(shí)地收集各種格式的海量數(shù)據(jù),不僅包括原有各種格式化數(shù)據(jù),還包括傳統(tǒng)計(jì)算機(jī)無(wú)法收集的數(shù)據(jù),如設(shè)備運(yùn)行日志、視頻和音頻數(shù)據(jù)。
3.1.2數(shù)據(jù)處理和存儲(chǔ)
大數(shù)據(jù)技術(shù)支持PB直至ZB級(jí)數(shù)據(jù)的處理和存儲(chǔ),有人統(tǒng)計(jì)過(guò),現(xiàn)在Google一天處理的數(shù)據(jù)量,已經(jīng)超過(guò)20年前全世界1年產(chǎn)生的數(shù)據(jù)量。
3.1.3數(shù)據(jù)挖掘和分析
大數(shù)據(jù)技術(shù)利用大規(guī)模計(jì)算機(jī)集群的超級(jí)計(jì)算能力,使原有的性能低下的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)算法高速運(yùn)行,從而使實(shí)時(shí)數(shù)據(jù)挖掘和分析成為可能。
3.1.4數(shù)據(jù)展現(xiàn)
大數(shù)據(jù)技術(shù)利用計(jì)算機(jī)圖形學(xué)和認(rèn)知心理學(xué)的最新研究成果,利用豐富的數(shù)據(jù)展示圖表,支持各種圖形界面的數(shù)據(jù)展示,提高了信息送達(dá)和知識(shí)傳播的效率。
3.2互聯(lián)網(wǎng)教學(xué)資源
互聯(lián)網(wǎng)及其相關(guān)的數(shù)據(jù)搜索和數(shù)據(jù)服務(wù)技術(shù),使傳統(tǒng)的線下以書(shū)本中心的教學(xué)資源體系,轉(zhuǎn)變?yōu)橐曰ヂ?lián)網(wǎng)為中心的教學(xué)資源體系。以互聯(lián)網(wǎng)為中心的教學(xué)資源體系,無(wú)論是容量、檢索速度還是展現(xiàn)方式,都是傳統(tǒng)的書(shū)本教學(xué)資源無(wú)法比擬的。
目前,在互聯(lián)網(wǎng)上可以檢索到高中階段各科目的各種教學(xué)電子教材、教學(xué)課件、作業(yè)試題、考試試卷等,而且很多教學(xué)資源能夠以具體、生動(dòng)的方式來(lái)傳播知識(shí)。因而降低了教學(xué)資源的獲取門(mén)檻,拓寬了教學(xué)資源的獲取途徑,客觀上非常有利于高中階段學(xué)生進(jìn)行自主學(xué)習(xí)。
4基于機(jī)器學(xué)習(xí)技術(shù)的自主學(xué)習(xí)過(guò)程
雖然有了互聯(lián)網(wǎng)、大數(shù)據(jù)和機(jī)器學(xué)習(xí)等技術(shù),但要實(shí)現(xiàn)高中階段學(xué)生自主學(xué)習(xí),即在提高學(xué)生學(xué)習(xí)興趣的同時(shí),提高應(yīng)試水平,還需要采取很多切實(shí)措施。
具體措施包括以下幾個(gè)部分:
4.1過(guò)程數(shù)據(jù)收集
要實(shí)現(xiàn)自主學(xué)習(xí),必須對(duì)學(xué)生學(xué)習(xí)的行為過(guò)程和學(xué)習(xí)的結(jié)果數(shù)據(jù)進(jìn)行全面收集,學(xué)習(xí)相關(guān)數(shù)據(jù)包括以下內(nèi)容:
(1)學(xué)生基本信息:包括年齡、性別、地域、家庭條件等;
(2)學(xué)習(xí)過(guò)程數(shù)據(jù):包括遲到、曠課、上課提問(wèn)次數(shù)、聽(tīng)課積極度評(píng)價(jià)、作業(yè)完成時(shí)間、作業(yè)完成次數(shù)、作業(yè)未交次數(shù)、考試完成時(shí)間等;
(3)學(xué)習(xí)結(jié)果數(shù)據(jù):包括作業(yè)、測(cè)驗(yàn)、考試的試題數(shù)據(jù)、分?jǐn)?shù)數(shù)據(jù)、試題相關(guān)的章節(jié)、知識(shí)點(diǎn)等;
(4)學(xué)習(xí)相關(guān)其他數(shù)據(jù):包括教師基本信息、教師對(duì)學(xué)生評(píng)價(jià)、高考數(shù)據(jù)等。
4.2行為和模式分析
心智模式是學(xué)生的思想方法、思維習(xí)慣、思維風(fēng)格和心理素質(zhì)的綜合反映,是學(xué)生各項(xiàng)思維能力的“總和”,用以感受、觀察、理解、判斷、選擇、記憶、想象、假設(shè)、推理,而后指導(dǎo)其學(xué)習(xí)行為。現(xiàn)代教育心理學(xué)認(rèn)為,高中階段學(xué)生已經(jīng)形成一定的心智模式,且心智模式對(duì)學(xué)生的學(xué)習(xí)行為有很大的影響,進(jìn)而對(duì)學(xué)習(xí)的成果起決定作用。
目前可以通過(guò)學(xué)生外在表征行為數(shù)據(jù),對(duì)學(xué)生的心智模式進(jìn)行建模。高中階段學(xué)生的心智模式主要由三個(gè)維度構(gòu)成:
(1)智力結(jié)構(gòu):包括觀察力、注意力、記憶力、實(shí)踐力;
(2)思維能力:思維的廣度和深度、思維的邏輯性、思維的獨(dú)立性;
(3)動(dòng)力結(jié)構(gòu):主要是學(xué)習(xí)動(dòng)機(jī)的強(qiáng)弱,包括學(xué)習(xí)興趣、學(xué)習(xí)態(tài)度、學(xué)習(xí)目標(biāo)和學(xué)習(xí)適應(yīng)能力。
根據(jù)學(xué)生的心智模型,可以通過(guò)機(jī)器學(xué)習(xí)技術(shù),對(duì)學(xué)生心智模式進(jìn)行集群分析,定位學(xué)生心智模式,然后分析學(xué)生歷史學(xué)習(xí)數(shù)據(jù),確定有效的、針對(duì)不同學(xué)生心智模式的個(gè)性化學(xué)習(xí)方案。
4.3個(gè)性化路徑定制
在確定每個(gè)學(xué)生心智模式的基礎(chǔ)上,結(jié)合過(guò)往的優(yōu)秀學(xué)習(xí)案例數(shù)據(jù),為學(xué)生制定個(gè)性化的自主學(xué)習(xí)路徑。自主學(xué)習(xí)是按照新課標(biāo)的進(jìn)度要求,為不同學(xué)生確定基本的學(xué)習(xí)路線圖,而且根據(jù)反饋,及時(shí)調(diào)整自主學(xué)習(xí)路徑,動(dòng)態(tài)地適應(yīng)學(xué)生的實(shí)際狀況。
自主學(xué)習(xí)路徑本質(zhì)上是一個(gè)時(shí)間軸上的各個(gè)學(xué)習(xí)目標(biāo)的動(dòng)態(tài)關(guān)聯(lián)??傮w目標(biāo)由階段性目標(biāo)質(zhì)變而成,(例如,總體學(xué)習(xí)目標(biāo)可以是高考一本線,那么在高中三年中,每個(gè)學(xué)年每個(gè)學(xué)期都要有月度目標(biāo),月度目標(biāo)之下還應(yīng)有周目標(biāo))最終形成一個(gè)基于每個(gè)學(xué)生心智模式的高效學(xué)習(xí)路徑。
4.4預(yù)測(cè)與推薦
機(jī)器學(xué)習(xí)技術(shù)利用系統(tǒng)積累的大量學(xué)生的學(xué)習(xí)案例數(shù)據(jù),實(shí)現(xiàn)對(duì)學(xué)生學(xué)習(xí)趨勢(shì)的預(yù)測(cè),并根據(jù)實(shí)際學(xué)習(xí)產(chǎn)出,調(diào)整預(yù)測(cè)模型。在預(yù)測(cè)模型的基礎(chǔ)上,可以利用各種推薦算法,在適當(dāng)?shù)臅r(shí)間點(diǎn)向每個(gè)學(xué)生推薦最佳的學(xué)習(xí)資源。即根據(jù)自主學(xué)習(xí)路徑,參照正常的課程進(jìn)度,提供微課、作業(yè)、測(cè)驗(yàn)等適合每個(gè)學(xué)生的學(xué)習(xí)資源,確保階段性目標(biāo)的達(dá)成。
4.5監(jiān)控與干預(yù)
機(jī)器學(xué)習(xí)系統(tǒng)收集學(xué)生的學(xué)習(xí)數(shù)據(jù),按照自主學(xué)習(xí)路徑,監(jiān)控每個(gè)學(xué)生的學(xué)習(xí)異常,及時(shí)向?qū)W生、老師和家長(zhǎng)提出預(yù)警,以便對(duì)學(xué)生學(xué)習(xí)進(jìn)行幫助,確保學(xué)習(xí)路徑與各階段目標(biāo)不偏離。
由于高中階段學(xué)生還處于青春叛逆期,很容易出現(xiàn)抗拒學(xué)習(xí)的行為,因此在學(xué)習(xí)干預(yù)的觸發(fā)設(shè)計(jì)上,必須保證有一定的余量,必須注意不能引起學(xué)生的逆反心理。
參考文獻(xiàn)
[1] 周志華.機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘[J].中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊,2007(9).
[2] T.M.Mitchell.Machine Learning.New York:McGraw-Hill,1997.
[3] R.S.Michalski,J.G.Carbonell,T.M.Mitchell,eds.Machine Learning:An Artificial IntelligenceApproach,Palo Alto,CA:Tioga Publishing Co.,1983.