馬麗?侯強
摘要:培養(yǎng)本科生科研能力是社會發(fā)展對高校人才培養(yǎng)提出的必然要求。模式識別既有嚴(yán)密的理論基礎(chǔ),又有廣泛的實際應(yīng)用,是一個不斷發(fā)展的活躍領(lǐng)域,其作為高年級本科生課程,通過科學(xué)的教學(xué)設(shè)計,適合用來培養(yǎng)學(xué)生的創(chuàng)新思維和科研能力。教學(xué)采用以實際模式識別科研任務(wù)為主線和以啟發(fā)科學(xué)思維為核心的教學(xué)方法,培養(yǎng)學(xué)生獨立分析問題、解決問題的能力,為以后進行相關(guān)科學(xué)研究打下良好基礎(chǔ)。
關(guān)鍵詞:模式識別;本科教學(xué);科研能力
中圖分類號:G642.0 文獻標(biāo)識碼:A 文章編號:1007-0079(2014)36-0133-02
具備初步的科研工作能力是本科生重要的學(xué)業(yè)標(biāo)準(zhǔn),培養(yǎng)本科生科研能力是社會發(fā)展對高校人才培養(yǎng)提出的必然要求[1]。模式識別是一個既有著嚴(yán)密的理論基礎(chǔ),又有著廣泛的實際應(yīng)用的學(xué)科[2-4],并且模式識別的發(fā)展非常迅速,各種新思想新算法不斷涌現(xiàn),任何算法都不是完美的,都有很多工作可以繼續(xù),因此,模式識別課程可以很好的用來培養(yǎng)學(xué)生的科研能力和創(chuàng)新思維。針對培養(yǎng)學(xué)生科研能力的教學(xué)目標(biāo),本課程的教學(xué)重點是理論與實踐相結(jié)合,以具體科研任務(wù)貫穿整個教學(xué)過程,引導(dǎo)學(xué)生積極思考,啟發(fā)學(xué)生科學(xué)思維。
隨著模式識別學(xué)科的日益發(fā)展,模式識別的教學(xué)也從研究生教學(xué)逐漸延伸到本科教學(xué)[5]。對于培養(yǎng)高年級本科生科研能力這個目標(biāo),我們采取以下三種方法:一是授課方式選擇幾種經(jīng)典的模式識別算法來講,包括k均值聚類(k-means)算法;k近鄰(k-nearest-neighbor, kNN)、Bayes、和支持向量機(Support Vector Machine, SVM)三種有監(jiān)督分類算法;主成分分析(Principle Component Analysis, PCA)和線性判別分析(Linear Discriminant Analysis, LDA)兩種特征提取算法。這幾種經(jīng)典的算法,能夠很好的代表模式識別這門課程。掌握好這些算法,就可以較快較好的適應(yīng)模式識別相關(guān)課題的研究。二是采用以實際模式識別科研任務(wù)為主線的教學(xué)方法,學(xué)生帶著具體的科研任務(wù)聽課,更容易理解復(fù)雜算法,提高聽課效率;實踐環(huán)節(jié)也都圍繞同一個科研任務(wù),便于前后關(guān)聯(lián),比較不同算法。通過獨立完成科研任務(wù),學(xué)生的文獻閱讀能力,編程能力,分析問題、解決問題的能力,都可以得到鍛煉和提高。三是注重引導(dǎo)學(xué)生積極思考,培養(yǎng)學(xué)生的創(chuàng)新思維,將知識灌輸為主的教學(xué)方法轉(zhuǎn)變?yōu)橐詥l(fā)科學(xué)思維為核心的教學(xué)方法。在授課和實驗過程中,有意識的提出科學(xué)問題,先給出幾種可能的解決方案,擴展思路,然后引導(dǎo)學(xué)生自己思考解決方法,培養(yǎng)學(xué)生獨立思考的意識,克服人云亦云的傾向。
一、模式識別教學(xué)內(nèi)容
模式識別作為高年級選修課,我們安排16學(xué)時上課時間,以及16學(xué)時上機時間,給學(xué)生留出充分的自主完成科研任務(wù)的時間。模式識別主要討論的問題是分類和特征提取,其中分類主要包括無監(jiān)督分類和有監(jiān)督分類,特征提取也有無監(jiān)督和有監(jiān)督之分。所以,對于每一個關(guān)鍵問題,我們都選擇最經(jīng)典的算法來講授:對于無監(jiān)督分類,選擇k-means算法;對于有監(jiān)督分類,選擇Bayes分類器,kNN分類器,以及SVM分類器;對于無監(jiān)督特征提取,選擇PCA算法;對于有監(jiān)督特征提取,選擇LDA算法。另外,課程最初4個學(xué)時,用來介紹模式識別基礎(chǔ)概念,講授相關(guān)的數(shù)學(xué)基礎(chǔ),以及介紹具體的模式識別科研任務(wù),即遙感圖像分類,講解遙感圖像的數(shù)據(jù)特點。
對于16學(xué)時上機實驗安排,我們圍繞遙感圖像分類任務(wù),布置四次作業(yè),第一次實驗是認(rèn)識遙感圖像,學(xué)會使用ENVI軟件。第二次實驗是使用MATLAB實現(xiàn)k-means算法對遙感圖像進行聚類,重點分析初始類心的選擇,迭代終止條件,相似性度量方法的選擇等關(guān)鍵問題。第三次實驗是使用MATLAB實現(xiàn)kNN分類,分析參數(shù)k的選擇以及相似性度量方法的選擇。第四次是實現(xiàn)PCA或LDA降維,并對降維數(shù)據(jù)采用kNN分類,然后與第三次實驗結(jié)果做比較分析。四次上機實驗,都針對遙感圖像分類這一科研任務(wù),既可以采用最基本算法,又有很大的算法改進空間,適合不同層次學(xué)生的科研能力的培養(yǎng)。
二、以實際模式識別科研任務(wù)為主線的教學(xué)方法
模式識別是一門實用性很強的課程,每種算法都有很好的應(yīng)用實例,我們以具體的科研任務(wù)貫穿整個教學(xué)過程。科研任務(wù)選擇為“遙感圖像分類”,目標(biāo)是獲得好的圖像分類精度。這個課題可以采用簡單的模式識別分類算法完成,但是分類精度可能不高,所以學(xué)生可以通過文獻閱讀、實驗仿真等方式尋找提高圖像分類精度的方法,這個科研任務(wù)既易于著手,又有很大的發(fā)揮空間。
1.授課環(huán)節(jié)
我們把具體科研任務(wù)“遙感圖像分類”貫穿在整個授課環(huán)節(jié),這樣學(xué)生更容易理解復(fù)雜的公式和算法。每次授課,首先重復(fù)并明確科研任務(wù),然后講解本次課所講授算法對完成科研任務(wù)所起到的作用,并對于每一個抽象的公式,結(jié)合科研任務(wù)中的具體實例進行講解。例如Bayes分類器,對于公式中先驗概率的計算,假設(shè)遙感圖像只包含兩類地物,分別是水和草地,其中水域占圖像場景的70%,草地占圖像的30%,那么先驗概率就是地物存在的比例,所以水存在的先驗概率為0.7,草地存在的先驗概率為0.3。Bayes公式的概率表達很抽象,但結(jié)合遙感圖像分類任務(wù),講解公式中每一項如何求解,學(xué)生就能較容易理解并學(xué)會使用該公式。以具體科研任務(wù)為主線,所講解算法不會停留在抽象的公式層面上,而是看到公式,就可以通過實例來把握公式中每一項的物理含義。
2.實踐環(huán)節(jié)
實踐環(huán)節(jié)對于培養(yǎng)學(xué)生科研能力非常重要,通過實驗,學(xué)生可以更深刻的理解算法,并進行思考和探索,以解決實驗中出現(xiàn)的問題,更好的完成科研任務(wù)。四次上機任務(wù)全部圍繞“遙感圖像分類”,互相關(guān)聯(lián),逐步深入。第一次上機采用ENVI軟件中已有算法進行分類,對不同算法的分類效果有直觀認(rèn)識和性能比較,后面上機任務(wù)就是自己用MATLAB編程來實現(xiàn)這些算法(不是直接調(diào)用MATLAB工具箱函數(shù)直接實現(xiàn)[6])。第二次和第三次分別對遙感圖像進行k-means聚類和kNN分類,通過這兩次實驗,學(xué)生可以體會有監(jiān)督分類算法的分類效果優(yōu)于無監(jiān)督分類算法,認(rèn)識到訓(xùn)練樣本的重要性。第四次進行PCA或者LDA降維,可以體會降維對于分類的作用,并且,通過PCA和LDA的比較,可以認(rèn)識到,一般情況下,有監(jiān)督的降維算法得到的降維數(shù)據(jù),相比較無監(jiān)督算法得到的降維數(shù)據(jù),具有更好的可分性能。四次上機,面向同一個任務(wù),能夠更好的理解和比較不同算法的作用和性能。并且,實驗中我們要求學(xué)生對算法參數(shù)進行分析,以更深刻理解算法對于參數(shù)的敏感性,學(xué)生在這個過程中可以學(xué)習(xí)到該如何全面的評價一個算法,這些都是進行科學(xué)研究的必要環(huán)節(jié)。
三、以啟發(fā)創(chuàng)新思維為核心的教學(xué)方法
我們將創(chuàng)新思想有意識的貫穿于教學(xué)過程始終,引導(dǎo)學(xué)生積極思考,培養(yǎng)學(xué)生發(fā)現(xiàn)問題,思考問題,解決問題,并提出新思想,新方法的能力。對學(xué)生創(chuàng)新思維的培養(yǎng)體現(xiàn)在以下幾個方面。
1.對已有科研成果的學(xué)習(xí)和評價
閱讀文獻是科學(xué)研究的重要環(huán)節(jié),這個過程是一個學(xué)習(xí)、積累、思考、創(chuàng)新的過程。我們要求學(xué)生自己檢索并閱讀文獻(包含一篇英文文獻),在閱讀過程中思考:每篇論文主要使用什么算法實現(xiàn)什么任務(wù)?論文有沒有對算法做出改進(為什么改進,原算法存在什么問題,改進方法是什么)?論文中做了什么對比試驗,實驗結(jié)論是什么?論文還存在什么問題或者缺點?論文所作出的改進策略是否好?你自己對算法有沒有什么改進的想法?通過這樣的思考,可以有效引導(dǎo)學(xué)生對已有科研成果進行學(xué)習(xí)和評價,并在這個過程中提出自己的想法,培養(yǎng)創(chuàng)新思維。
2.改進型創(chuàng)新思維的培養(yǎng)
對已有方法存在的問題進行改進,以提高算法性能,屬于改進型創(chuàng)新。在模式識別領(lǐng)域,任何方法都不是完美的,授課過程中要引導(dǎo)學(xué)生思考影響算法性能的因素有哪些,算法可以從哪些方面進行改進?例如k-means聚類算法,第一步是隨機選擇K個類心,第二步是最小距離分類,第三步是判斷算法是否收斂。對于這個算法,引導(dǎo)大家思考,每一步存在什么問題?對于第一步,隨機選擇初始類心,那么隨機選擇是否會得到不同的聚類結(jié)果?算法的穩(wěn)定性是否受到影響?有什么方法可以得到更好的初始類心?對于第二步,主要采用最小距離分類,那么距離度量方法如何選擇?第三步對于收斂的判斷,采用什么準(zhǔn)則更好?這些都是算法存在的問題,在這些方面都可以對k-means算法進行改進。這個過程,重點引導(dǎo)學(xué)生如何提出問題,并從哪些方向可以分析和解決問題。
3.結(jié)合型創(chuàng)新思維的培養(yǎng)
將兩種或者多種方法結(jié)合起來,以達到更好的分析精度,屬于結(jié)合型創(chuàng)新。在第四次實驗中,先對數(shù)據(jù)進行PCA或者LDA降維,然后對降維數(shù)據(jù)進行kNN分類,這就是降維算法和分類算法的結(jié)合。與第三次實驗結(jié)果進行比較,學(xué)生可以體會到無監(jiān)督的PCA算法和kNN算法結(jié)合,無法提高分類精度,而有監(jiān)督的LDA算法和kNN算法結(jié)合,就可以提高分類精度。通過實際訓(xùn)練,培養(yǎng)學(xué)生多種方法相結(jié)合的創(chuàng)新思維。這種創(chuàng)新思維的建立,需要有較為完備的理論基礎(chǔ),是本科生所缺乏的,所以要鼓勵學(xué)生多學(xué)習(xí)新方法,并多閱讀文獻,學(xué)習(xí)尋找算法結(jié)合點。
4.應(yīng)用型創(chuàng)新思維的培養(yǎng)
將一個領(lǐng)域的已有知識和方法有效的應(yīng)用到另外一個領(lǐng)域,屬于應(yīng)用型創(chuàng)新,是比較難的創(chuàng)新,需要對兩個領(lǐng)域的知識都有好的掌握。模式識別課程中有較多這樣的成功實例,例如Bayes分類器,就是概率論中學(xué)習(xí)過的Bayes公式,引導(dǎo)學(xué)生思考,算法是如何建立橋梁,將公式中每一項賦予特定的物理意義,并將公式應(yīng)用到遙感圖像分類中的。對于培養(yǎng)本科生的應(yīng)用型創(chuàng)新思維,要多分析實例,在實例中帶領(lǐng)學(xué)生積極思考。
四、結(jié)語
模式識別是一門理論性和實用性都很強的課程,作為一門高年級本科課程,我們以培養(yǎng)學(xué)生的科研能力為目標(biāo),采用理論與實踐相結(jié)合,以具體模式識別科研任務(wù)貫穿整個教學(xué)過程,并以啟發(fā)科學(xué)思維為核心的教學(xué)方法,提高學(xué)生的科研能力和創(chuàng)新能力。實踐證明,學(xué)生在學(xué)習(xí)過程中,改變了問題具有唯一正確答案的思維模式,積極思考各種解決問題的方法,體會到了科研的樂趣,提高了獨立分析問題、解決問題的能力。
參考文獻:
[1]姜長寶.本科生科研能力培養(yǎng)的途徑與方法探討[J].科技管理研究,2010,(8):152-154.
[2]孫即祥.現(xiàn)代模式識別[M].第二版.北京:高等教育出版社,
2008.
[3]邊肇祺,張學(xué)工.模式識別[M].第二版.北京:清華大學(xué)出版社,
2001.
[4]楊淑瑩.模式識別與智能計算:Matlab技術(shù)實現(xiàn)[M].第二版.北京:電子工業(yè)出版社,2011.
[5]戚玉濤,劉芳,焦李成.模式識別教學(xué)實踐與課程改革[J].計算機教育,2010,(19):24-26.
[6]楊勃,歐陽竟成,潘理.Matlab在“模式識別”課程教學(xué)中的應(yīng)用研究[J].中國電力教育,2012,(34):63-64.
(責(zé)任編輯:劉麗娜)