摘要:模式識(shí)別是智能科學(xué)與技術(shù)本科專業(yè)的專業(yè)基礎(chǔ)選修課程之一,屬于信息、控制和系統(tǒng)科學(xué)的范疇。這門課程要求學(xué)生掌握模式識(shí)別的基本概念、原理、方法和應(yīng)用等,了解模式識(shí)別的研究現(xiàn)狀和發(fā)展趨勢(shì),對(duì)已有成果展開分析與討論,為進(jìn)一步的學(xué)科探索打好基礎(chǔ)。本文介紹了國內(nèi)外的教學(xué)內(nèi)容、授課方式和學(xué)生評(píng)價(jià)方式,在此基礎(chǔ)上對(duì)模式識(shí)別課程的教學(xué)內(nèi)容、授課方式和評(píng)價(jià)方式進(jìn)行了探索。
關(guān)鍵詞:模式識(shí)別;教學(xué)內(nèi)容;授課方式;評(píng)價(jià)方式
模式識(shí)別是60年代迅速發(fā)展起來的一門學(xué)科,該技術(shù)用于自動(dòng)將物理對(duì)象或抽象的多維模式分類到已知或可能未知的類別。目前,市場(chǎng)已經(jīng)存在一些能進(jìn)行字符識(shí)別、手寫體識(shí)別、文檔分類、指紋分類、語音和說話人識(shí)別、白細(xì)胞分類以及其他軍事目標(biāo)識(shí)別的商業(yè)模式識(shí)別系統(tǒng)。低成本、高分辨率傳感器(如CCD攝像機(jī)、麥克風(fēng)和掃描儀)和互聯(lián)網(wǎng)上共享的數(shù)據(jù)為我們提供了關(guān)于文本、語音、圖像和視頻的巨大數(shù)字化資源庫,對(duì)這些資源進(jìn)行有效的歸檔和檢索,極大推動(dòng)了模式識(shí)別算法在新領(lǐng)域的應(yīng)用,例如文本、圖像和視頻檢索,生物信息學(xué)和面部識(shí)別等。
由于模式識(shí)別是一門理論與實(shí)踐緊密結(jié)合的學(xué)科,理論基礎(chǔ)涉及高等數(shù)學(xué)、線性代數(shù)、數(shù)理統(tǒng)計(jì)、小樣本統(tǒng)計(jì)學(xué)習(xí)理論、模糊數(shù)學(xué)等學(xué)科,因此該課程具有一定的抽象性和難度,學(xué)生不容易理解所學(xué)內(nèi)容。為了使學(xué)生從抽象中理解具體,更好地、自主地、創(chuàng)新地學(xué)習(xí),教師要在知識(shí)的傳授過程中注重學(xué)習(xí)方法的傳授,故教學(xué)探索成為模式識(shí)別課程中重要的研討內(nèi)容之一。隨著社會(huì)的發(fā)展、國際交流的頻繁及網(wǎng)絡(luò)技術(shù)的完善,如何借鑒先進(jìn)的國外教學(xué)理念,更好地培養(yǎng)具有創(chuàng)新能力的學(xué)生,也成為教學(xué)探索的一個(gè)主要問題。
1國內(nèi)外教學(xué)比較
下面就從教學(xué)內(nèi)容、授課方式和學(xué)生評(píng)價(jià)方式三個(gè)方面來闡明國內(nèi)外模式識(shí)別教學(xué)。
1.1教學(xué)內(nèi)容
模式識(shí)別領(lǐng)域的國內(nèi)外研究者和學(xué)者已編著了大量?jī)?yōu)秀教材,由于篇幅關(guān)系,下面僅對(duì)部分教材進(jìn)行簡(jiǎn)要介紹。
Richard O. Duda等編寫的《Pattern Classification》清晰地闡明了模式識(shí)別的經(jīng)典方法和新方法[1]。Sergios Theodoridis編寫的《Pattern Recognition》全面闡述了模式識(shí)別的基礎(chǔ)理論、最新方法以及各種應(yīng)用[2]。Andrew R. Webb編寫的《Statistical Pattern Recognition》對(duì)統(tǒng)計(jì)模式識(shí)別的基本理論和技術(shù)作了全面且詳盡的介紹[3]。J.P.Marques de Sá編寫的《Pattern Recognition:concepts,methods,and applications》詳細(xì)介紹了有關(guān)模式識(shí)別的概念和方法,并附加多個(gè)領(lǐng)域的實(shí)際應(yīng)用案例[4]。M.Narasimha Murty等編寫的《Pattern Recognition:An Algorithmic Approach》講解了模式識(shí)別在算法中應(yīng)用的主要原則,并對(duì)模式識(shí)別的概念和最近取得的進(jìn)步進(jìn)行了詳細(xì)介紹[5]。Brian D.Pipley編寫的《Pattern recognition and neural networks》對(duì)模式識(shí)別和神經(jīng)網(wǎng)絡(luò)進(jìn)行了介紹,并給出了模式識(shí)別領(lǐng)域的許多實(shí)際例子[6]。Satoshi Watanab編寫的《Pattern recognition:human and mechanical》為模式識(shí)別提供了一個(gè)統(tǒng)一的標(biāo)準(zhǔn),并介紹了該學(xué)科的廣闊前景[7]。Robert J.Schalkoff編寫的《Pattern Recognition:statistical,structural,and neural approaches》探究了模式識(shí)別的核心概念、方法和應(yīng)用[8]。Keinosuke Fukunaga編寫的《Introduction to statistical pattern recognition》,每章都含有大量習(xí)題[9]。
清華大學(xué)的邊肇祺教授等編寫的《模式識(shí)別》主要討論了統(tǒng)計(jì)模式識(shí)別理論和方法,還介紹了人臉識(shí)別、說話人語音識(shí)別及字符識(shí)別等應(yīng)用實(shí)例[10]。干曉蓉教授編寫的《模式識(shí)別》主要內(nèi)容包括貝葉斯決策理論、概率密度估計(jì)、線形判別函數(shù)、無監(jiān)督學(xué)習(xí)和聚類、特征選擇與提取、模糊模式識(shí)別、人工神經(jīng)網(wǎng)絡(luò)、線形代數(shù)、多維隨機(jī)變量[11]。王碧泉教授等編寫的《模式識(shí)別:理論、方法和應(yīng)用》介紹了特征選擇、聚類和判別等方面的常用模型和算法,模式識(shí)別在地震學(xué)、數(shù)字圖像處理和決策管理等領(lǐng)域中的應(yīng)用[12]。楊光正教授等編寫的《模式識(shí)別》介紹統(tǒng)計(jì)識(shí)別方法和句法方法的基本理論[13]。張學(xué)工教授編寫的《模式識(shí)別》系統(tǒng)地討論了模式識(shí)別的基本概念和代表性方法[14]。齊敏教授等編寫的《模式識(shí)別導(dǎo)論》按照統(tǒng)計(jì)模式識(shí)別、句法模式識(shí)別、模糊模式識(shí)別法和神經(jīng)網(wǎng)絡(luò)模式識(shí)別法四大理論體系來組織全書[15]。蔣先剛教授編寫的《數(shù)字圖像模式識(shí)別工程軟件設(shè)計(jì)》介紹圖像模式識(shí)別的基礎(chǔ)理論和程序?qū)崿F(xiàn)技術(shù),從工程應(yīng)用的角度全面介紹了圖像模式識(shí)別應(yīng)用軟件設(shè)計(jì)的基本方法和實(shí)用技術(shù)[16]。孫即祥教授等編寫的《模式識(shí)別》系統(tǒng)地論述了各類經(jīng)典的模式識(shí)別的理論與方法,較全面地反映了本學(xué)科的新近科技成果[17]。
2.2授課方式
國外的授課方式往往注重內(nèi)容的學(xué)習(xí)、知識(shí)的掌握和學(xué)生獨(dú)立思考。課堂教學(xué)理念重參與性、積極性、創(chuàng)造性和靈活性。課堂相對(duì)活躍,講授和討論相輔相成,學(xué)生能積極地參與到課堂教學(xué)中,學(xué)生參與發(fā)問或發(fā)表個(gè)人意見,課堂上的參與往往是學(xué)期分?jǐn)?shù)的一部分,被認(rèn)為是評(píng)估學(xué)生所學(xué)習(xí)的知識(shí)的方法,并注重學(xué)生是否有能力與教師和同學(xué)進(jìn)行知性的對(duì)話。
國內(nèi)的課堂教學(xué)主要以教師講授為主,學(xué)生被動(dòng)接受,留給學(xué)生的自主空間較狹窄,課堂教學(xué)理念注重系統(tǒng)性、完整性、邏輯性、生動(dòng)性、計(jì)劃性。課堂相對(duì)平靜,討論較少,學(xué)生加入到課堂教學(xué)中的情況不多,學(xué)生參與發(fā)問或發(fā)表個(gè)人意見少。
2.3評(píng)價(jià)方式
國外對(duì)學(xué)生的培養(yǎng)重經(jīng)驗(yàn)、過程、體驗(yàn)和運(yùn)用。學(xué)生的學(xué)習(xí)過程只是其成長(zhǎng)的一部分,教師評(píng)價(jià)學(xué)生時(shí)十分注重多渠道收集學(xué)生在校、在家和參加社會(huì)活動(dòng)的情況,通過綜合分析,對(duì)學(xué)生進(jìn)行全方位的、細(xì)化的評(píng)價(jià),其中不僅有教師對(duì)學(xué)生的評(píng)價(jià),還包括學(xué)生的自評(píng)、學(xué)生之間的互評(píng)、家長(zhǎng)的評(píng)價(jià)和學(xué)生參加社會(huì)活動(dòng)獲得的評(píng)價(jià)。
國內(nèi)的教學(xué)目標(biāo)是追求知識(shí)、結(jié)果、記憶和會(huì)考試。由于教學(xué)中以教師為主,往往只注意知識(shí)的傳授,忽略了學(xué)生能力和全面素質(zhì)的培養(yǎng)。學(xué)生能牢固地掌握知識(shí),但知識(shí)運(yùn)用能力差,主動(dòng)和創(chuàng)新能力欠缺。教師對(duì)學(xué)生的評(píng)價(jià)注重期中、期末考試,忽略了學(xué)生參加社會(huì)活動(dòng)的情況。
3教學(xué)探索
基于如下的研究結(jié)果:有效教學(xué)本質(zhì)上取決于教師建立能夠?qū)崿F(xiàn)預(yù)期教育成果的學(xué)習(xí)經(jīng)驗(yàn)的能力,而每個(gè)學(xué)生都參與教學(xué)活動(dòng)是實(shí)施有效教學(xué)的前提[18],我們從教學(xué)內(nèi)容、授課方式、評(píng)價(jià)方式三個(gè)方面進(jìn)行模式識(shí)別課程的教學(xué)探索。
3.1教學(xué)內(nèi)容
教學(xué)內(nèi)容的安排應(yīng)與本科學(xué)生的學(xué)習(xí)特點(diǎn)和目前所掌握的知識(shí)程度相吻合,才能使學(xué)生牢固掌握知識(shí)。借鑒國內(nèi)外教學(xué)內(nèi)容情況,我們的模式識(shí)別課程的教學(xué)內(nèi)容共分9個(gè)章節(jié),分別介紹模式識(shí)別綱要、貝葉斯決策理論、極大似然估計(jì)和貝葉斯參數(shù)估計(jì)、隱馬爾可夫模型、統(tǒng)計(jì)語言模型、支持向量機(jī)、最大熵模型、人工神經(jīng)網(wǎng)絡(luò)、決策樹。
第1章 通過提出問題“智能科學(xué)與技術(shù)專業(yè)的學(xué)生為什么要學(xué)習(xí)模式識(shí)別”和“應(yīng)當(dāng)怎樣學(xué)習(xí)模式識(shí)別課程”展開,具體介紹內(nèi)容包括模式、模式識(shí)別、有監(jiān)督的分類、無監(jiān)督的分類、模式識(shí)別的主要方法和模式識(shí)別系統(tǒng)。
第2章 “貝葉斯決策理論”介紹了在概率結(jié)構(gòu)都知道的理想情況下的模式分類問題。雖然這種情況在實(shí)際中很少出現(xiàn),但它為我們提供了一個(gè)能夠與其他分類器進(jìn)行對(duì)比的評(píng)價(jià)依據(jù),即“最優(yōu)貝葉斯分類器”,幫助我們預(yù)測(cè)推廣到新模式時(shí)的最小誤差率。
第3章 主要圍繞“極大似然估計(jì)和貝葉斯參數(shù)估計(jì)”來展開。在先驗(yàn)概率和類條件概率密度已知的情況下,我們可使用“貝葉斯決策理論”來設(shè)計(jì)最優(yōu)分類器。但是在實(shí)際應(yīng)用中,通常不能得到和問題相關(guān)的全部概率結(jié)構(gòu)知識(shí),因此我們利用已有的信息,對(duì)問題中涉及的先驗(yàn)概率和條件概率函數(shù)進(jìn)行估計(jì),并把估計(jì)結(jié)果當(dāng)做實(shí)際的先驗(yàn)概率和條件概率,再來設(shè)計(jì)分類器。
第4章 “隱馬爾可夫模型”在解決一些與時(shí)間序列相關(guān)的問題,即某一過程隨著時(shí)間的流逝而進(jìn)行,而且某個(gè)時(shí)刻發(fā)生的事件受到前一時(shí)刻發(fā)生事件的直接影響中得到了很好的應(yīng)用,隱馬爾可夫模型在語音識(shí)別領(lǐng)域的應(yīng)用是最成功的例子。
第5章 “統(tǒng)計(jì)語言模型”是用來計(jì)算句子概率的模型,在很多自然語言處理的任務(wù),如機(jī)器翻譯、語音識(shí)別、印刷體或手寫體識(shí)別、拼寫糾錯(cuò)、漢字輸入中都有廣泛的應(yīng)用。在獨(dú)立假設(shè)的前提下,句子的概率公式可被簡(jiǎn)化,并被計(jì)算出來。
第6章 “支持向量機(jī)”的基本思想是尋找一個(gè)能夠?qū)維空間的樣本數(shù)據(jù)準(zhǔn)確地分為兩個(gè)類別的超平面。但是,由于樣本數(shù)據(jù)經(jīng)常是不可以被線性分割的,所以通過引入核函數(shù),將樣本數(shù)據(jù)映射到一個(gè)可以線性分割這些數(shù)據(jù)的高維特征空間。而將數(shù)據(jù)映射到這樣的一個(gè)空間,通常會(huì)引起計(jì)算和過度適應(yīng)問題,但是支持向量機(jī)在高維空間中不需要直接處理,這就消除了前面提到的顧慮。并且支持向量機(jī)不像神經(jīng)元網(wǎng)絡(luò)等其他的學(xué)習(xí)算法,很難衡量其學(xué)習(xí)的性能,我們能夠清楚地計(jì)算出其在未知數(shù)據(jù)集上的VC維。
第7章 “最大熵模型”在對(duì)一個(gè)隨機(jī)事件的概率分布進(jìn)行預(yù)測(cè)時(shí),滿足全部已知的條件,而對(duì)未知的情況不進(jìn)行任何主觀假設(shè)。因?yàn)樵谶@種情況下,概率分布最均勻,預(yù)測(cè)的風(fēng)險(xiǎn)最小,概率分布的信息熵最大,所以被稱為最大熵模型。
第8章 “人工神經(jīng)網(wǎng)絡(luò)”是在現(xiàn)代神經(jīng)科學(xué)研究的基礎(chǔ)上提出的,它并沒有完全真正反映大腦的功能,只是對(duì)生物神經(jīng)網(wǎng)絡(luò)進(jìn)行某種抽象、簡(jiǎn)化和模擬。人工神經(jīng)網(wǎng)絡(luò)中的信息處理是通過神經(jīng)元之間的相互作用來實(shí)現(xiàn)的,知識(shí)與信息的存儲(chǔ)表現(xiàn)為網(wǎng)絡(luò)元件互連分布式的物理聯(lián)系,各種神經(jīng)元連接權(quán)系數(shù)的動(dòng)態(tài)演化過程決定了人工神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)和識(shí)別。
第9章 “決策樹”是一種廣泛應(yīng)用的歸納推理算法,它采用逼近離散值函數(shù)的方法,具有很好的健壯性,能根據(jù)訓(xùn)練數(shù)據(jù)學(xué)習(xí)出析取表達(dá)式。決策樹學(xué)習(xí)方法通過搜索一個(gè)完整表示的假設(shè)空間,從而避免了受限假設(shè)空間的不足。
3.2授課方式
遵循學(xué)生的認(rèn)知規(guī)律和和學(xué)習(xí)特點(diǎn),結(jié)合作者從事的模式識(shí)別課程教學(xué),我們對(duì)模式識(shí)別的授課方式給出了如下建議。
首先,教師將不再單純地講解,而是引導(dǎo)學(xué)生進(jìn)行學(xué)習(xí)和組織學(xué)生進(jìn)行課堂活動(dòng),使學(xué)生由原來的單純聽講、被動(dòng)接受灌輸轉(zhuǎn)變?yōu)橹鲃?dòng)參與課堂教學(xué),親自去發(fā)現(xiàn)結(jié)論和規(guī)律,使學(xué)生學(xué)會(huì)思考和善于思考,培養(yǎng)學(xué)生分析和解決問題的能力。通過教師和學(xué)生互相提問和共同討論,來發(fā)揮學(xué)生的主動(dòng)性,使兩者在教學(xué)過程中相互聯(lián)系和作用,教學(xué)過程成為雙方主動(dòng)介入的過程。由于模式識(shí)別具有一定的抽象性和難度,因此教師講解時(shí)要盡可能通過實(shí)例引出問題,讓學(xué)生親睹實(shí)例,增加感性認(rèn)識(shí),通過圖像、動(dòng)畫和視頻的生動(dòng)畫面和聲音吸引學(xué)生的注意力,將抽象的理論形象化,使學(xué)生印象深刻而又便于理解。
其次,教師在傳授知識(shí)的同時(shí)也應(yīng)該力所能及地幫助學(xué)生解決在生活、學(xué)習(xí)過程中遇到的疑問,對(duì)他們提出的問題給予認(rèn)真、耐心的解答,幫助他們克服困難。教師在教學(xué)過程中留出一定的時(shí)間,以朋友的身份和學(xué)生交流,了解他們的想法,從中獲得一些好的意見和建議。
再次,在講解理論部分時(shí),教師應(yīng)該理論聯(lián)系實(shí)際,注重學(xué)生實(shí)踐能力的培養(yǎng)。適當(dāng)引入一些實(shí)際生活的例子,幫助學(xué)生理解所學(xué)知識(shí),如介紹最大熵模型,可使用“投資時(shí)不要把所有的雞蛋放在一個(gè)籃子里,這樣可以降低風(fēng)險(xiǎn)”的例子,使學(xué)生對(duì)模型的認(rèn)識(shí)不再抽象。簡(jiǎn)要告訴學(xué)生下次課的內(nèi)容,鼓勵(lì)學(xué)生課后查閱相關(guān)資料,并對(duì)遇到的問題進(jìn)行分析和解決,帶著問題參與下一次的課堂教學(xué)。針對(duì)每一章的授課內(nèi)容,教師應(yīng)精心設(shè)計(jì)和安排相關(guān)實(shí)驗(yàn),加深和鞏固學(xué)生所掌握的知識(shí)。
3.3評(píng)價(jià)方式
模式識(shí)別是智能科學(xué)與技術(shù)專業(yè)的一門重要專業(yè)基礎(chǔ)選修課,對(duì)學(xué)生將來的學(xué)習(xí)、工作都起著非常重要的作用。該課程不僅僅是讓學(xué)生掌握知識(shí),更重要的是培養(yǎng)學(xué)生的能力。因此,教師應(yīng)該積極鼓勵(lì)學(xué)生多參加社會(huì)實(shí)踐,評(píng)價(jià)時(shí)應(yīng)從多渠道和多方面收集學(xué)生在校和參加社會(huì)活動(dòng)的信息,通過綜合分析,對(duì)學(xué)生做出全方位的、細(xì)化和合理的評(píng)價(jià),促進(jìn)學(xué)生全面素質(zhì)的培養(yǎng),最終提高學(xué)生的創(chuàng)新能力。
4結(jié)語
模式識(shí)別是一門理論與實(shí)踐緊密結(jié)合的學(xué)科,教與學(xué)的方式值得我們研究和探索。在今后的教學(xué)工作中,我們要多從模式識(shí)別理論涉及的學(xué)科廣泛,而本科生目前還沒有完全掌握這些知識(shí)等特點(diǎn)出發(fā),不斷改革、實(shí)踐和創(chuàng)新。同時(shí),教師也要不斷提高自身素質(zhì)和業(yè)務(wù)水平,不斷提高課堂教學(xué)質(zhì)量,為國家培養(yǎng)更多合格的應(yīng)用型本科人才。
參考文獻(xiàn):
[1] Richard O. D