莊家俊,王前
(仲愷農(nóng)業(yè)工程學(xué)院計算科學(xué)學(xué)院,廣州510225)
數(shù)字圖像是人類社會活動中最主要的一種信息載體,約占據(jù)人類所能獲取信息的75%,它是對客觀對象相似性的一種生動模仿或數(shù)字化描述[1]。一般的數(shù)字圖像處理任務(wù)可視為利用計算機技術(shù),通過各種加工手段改變輸入圖像的視覺效果并為后續(xù)圖像分析與高級理解奠定基礎(chǔ)。《數(shù)字圖像處理》課程是高等院校計算機、信息和自動化等多學(xué)科的重要專業(yè)基礎(chǔ)課程[2-3],該課程對學(xué)生的綜合能力要求較高,需要學(xué)生具備扎實的基礎(chǔ)數(shù)學(xué)知識、熟練的高級語言編程能力和算法設(shè)計與實現(xiàn)技巧,不僅是一門集理論和技術(shù)應(yīng)用為一體的綜合型專業(yè)課程,還作為學(xué)生課程設(shè)計和畢業(yè)設(shè)計所涉及理論的一種重要知識體系。
傳統(tǒng)教學(xué)模式理論學(xué)時較多、實驗學(xué)時較少,而理論教學(xué)內(nèi)容普遍側(cè)重于圖像處理方法的數(shù)學(xué)原理、模型建立依據(jù)和相關(guān)理論推導(dǎo)等方面的問題,課程的理論性偏強,在實驗學(xué)時數(shù)量較少的課程實踐環(huán)節(jié),則更多地傾向于數(shù)字圖像處理基礎(chǔ)方法的實驗室驗證層面。因此,傳統(tǒng)教學(xué)模式并沒有很好地將圖像處理理論和方法融入到解決實際工程問題中,學(xué)生大都只能被動接受相關(guān)的理論基礎(chǔ)知識,而缺乏動手能力與解決實際工程問題的能力的培養(yǎng)。另外,計算機、人工智能與傳感技術(shù)在近幾年中的顯著發(fā)展及普及,亦推動數(shù)字圖像處理領(lǐng)域產(chǎn)生了眾多更實用、更有效的新理論和新方法[4-5],故亟需在《數(shù)字圖像處理》課程的理論教學(xué)與實踐環(huán)節(jié)中,融入與專業(yè)背景密切結(jié)合的最新研究成果和前沿性新知識,逐步更新甚至替換部分思想陳舊、實用性較差的教學(xué)內(nèi)容,推動以工程應(yīng)用為導(dǎo)向的教學(xué)模式建立與課程改革[6-9]。
目前,國內(nèi)外廣泛采用的經(jīng)典教材有美國Rafael C.Gonzalez 等人著的Digital Image Processing[2]、清華大學(xué)章毓晉等人編著的《圖像工程(上冊):圖像處理(第4版)》[10]、北京交通大學(xué)阮秋琦等人編著的《數(shù)字圖像處理學(xué)》[3]等,不難發(fā)現(xiàn),《數(shù)字圖像處理》課程具有如下顯著特點:①包含的教學(xué)內(nèi)容較多,包括圖像采集與描述、圖像幾何變換、空間域濾波、頻率域濾波、圖像增強與復(fù)原、小波變換與分析、圖像壓縮、形態(tài)學(xué)處理、圖像分割、圖像特征分析與理解、圖像分類和目標檢測與跟蹤等,幾乎所有的教學(xué)章節(jié)都可單獨形成一個重要的研究方向,所以難以做到在有限的學(xué)時內(nèi)講授所有章節(jié);②課程理論性偏強、內(nèi)容更新速度快,不僅與基礎(chǔ)數(shù)學(xué)和物理學(xué)、計算機高級編程語言、信號分析與處理等課程密切結(jié)合,還與眾多實際應(yīng)用或行業(yè)聯(lián)系緊密,通常涉及人工智能與模式識別、計算機與軟件工程、遙感與地理信息系統(tǒng)、通訊與電信工程、測繪工程、醫(yī)學(xué)、印刷業(yè)等。作為一門融合多學(xué)科的課程,課程內(nèi)容涉及的知識點會不斷得到更新,所以與專業(yè)和行業(yè)應(yīng)用背景相結(jié)合,適當配置或優(yōu)化教學(xué)內(nèi)容,將新理論和新方法融入《數(shù)字圖像處理》課程是教學(xué)改革的必經(jīng)之路。
傳統(tǒng)教學(xué)模式下,通常視《數(shù)字圖像處理》課程為一門理科課程,傾向于注重各類圖像處理方法的數(shù)學(xué)原理與推導(dǎo),因而學(xué)生在面臨實際工程問題可能不知如何下手??紤]到該課程的顯著特點,我們對信息與計算科學(xué)(軟件工程)專業(yè)的《數(shù)字圖像處理》課程進行了教學(xué)改革,重點結(jié)合實際工程應(yīng)用開展相關(guān)的理論與實踐教學(xué),通過教師科研子課題或任務(wù)驅(qū)動的形式來培養(yǎng)學(xué)生的應(yīng)用能力和軟件開發(fā)能力,并進行課程考核。
我院信息與計算科學(xué)系的學(xué)生主要以算法設(shè)計、軟件開發(fā)為主要培養(yǎng)目標之一,普遍擁有一定的數(shù)學(xué)功底、計算機高級語言編程基礎(chǔ)和算法設(shè)計能力,并且他們畢業(yè)后大部分樂意從事信息技術(shù)行業(yè),學(xué)生的上述特點很有利于教師優(yōu)化《數(shù)字圖像處理》課程的教學(xué)內(nèi)容。為此,以美國Rafael C.Gonzalez 教授等人著的Digital Image Processing (3rd Edition)教材為基礎(chǔ),調(diào)整和優(yōu)化了部分教學(xué)內(nèi)容。近幾年來,深度學(xué)習(xí)策略對數(shù)字圖像處理領(lǐng)域帶來了巨大的影響,這也是眾多有關(guān)人工智能應(yīng)用和圖像分析與深層理解的基礎(chǔ),當前最為常用的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu),其深層抽象特征均源自淺層的基本梯度信息,而淺層梯度信息的獲取通常與圖像的空間域濾波和卷積原理關(guān)系密切,并結(jié)合工程應(yīng)用中常見的圖像語義分割、圖像分類、目標檢測與跟蹤和目標行為識別與理解等方向,將重點講授圖像信息的表示與描述、圖像的幾何變換、空間域濾波原理、圖像分割、形態(tài)學(xué)圖像處理、圖像特征分析和深度學(xué)習(xí)策略等部分的內(nèi)容。并在該課程的教學(xué)改革中,利用本院學(xué)生具備一定動手能力的特點,通過院系教師的科研課題和外界對數(shù)字圖像處理任務(wù)的需求,同時引入數(shù)字圖像處理中常用的開發(fā)平臺和開源工具包,如OpenCV、MATLAB IPT 和TensorFlow 等,以進一步強化理論知識的實際運用,將教學(xué)重心轉(zhuǎn)移到對具體知識的理解和實踐能力的培養(yǎng)上。
即使經(jīng)過教學(xué)內(nèi)容的調(diào)整和優(yōu)化,《數(shù)字圖像處理》課程涉及的基本知識點仍較多,而該課程在我院開設(shè)的總學(xué)時是56,其中16 學(xué)時為實驗教學(xué),在有限的學(xué)時內(nèi)容詳細講授所有知識點是不太可能的,并且所能提供的教學(xué)案例數(shù)量也是有限的,因此有必要提出針對本院學(xué)生基礎(chǔ)和教學(xué)內(nèi)容的教學(xué)方法。實際工程問題層出不窮,是否能通過有限的教學(xué)案例讓學(xué)生學(xué)會舉一反三,成功將學(xué)習(xí)與實踐經(jīng)驗移植到其他類似的項目中,對于切實改善實踐教學(xué)效果是非常關(guān)鍵的。
綜上,我們結(jié)合實際工程項目,通過引入啟發(fā)式教學(xué)方法詳細講授重要及基礎(chǔ)的知識點。例如,在講授圖像分割章節(jié)中點、線和邊緣檢測的相關(guān)知識點時,通過課題組提供的行人檢測任務(wù)來深入解析點、線檢測理論中涉及的像素梯度和方向等基本信息對目標特征描述的重要作用,不會讓學(xué)生覺得空間域濾波原理過于單調(diào)與枯燥。另外,為了進一步提高學(xué)生的學(xué)習(xí)興趣與創(chuàng)新思維能力,通過充分調(diào)動學(xué)生的學(xué)習(xí)主觀能動性,讓他們切實去思考如何運用所學(xué)知識處理實際問題。例如,將常見圖像處理App 和學(xué)生日常生活中的實際使用感受相結(jié)合,討論和指出可以進一步改善的軟件功能極其設(shè)計與實現(xiàn)思路;并多采用引導(dǎo)式手段鼓勵學(xué)生積極思考和參與互動過程,如移動端圖像處理軟件Faceu 在人臉貼圖之前可以考慮添加人臉性別或年齡識別功能模塊等,并通過MATLAB 和Python等平臺以直觀的方式向?qū)W生演示相關(guān)系統(tǒng)功能改善的流程與運行結(jié)果分析,對于學(xué)生興趣濃厚的學(xué)生來說,這些較為新穎的想法更有利于鍛煉他們的動手、實踐和自我創(chuàng)新能力。
此外,我校作為項目牽頭單位主持了2018 年第一批Google 支持教育部產(chǎn)學(xué)合作協(xié)同育人項目——人工智能技術(shù)領(lǐng)域的數(shù)字圖像處理課程建設(shè),將TensorFlow引入到該課程的實踐教學(xué)中。
傳統(tǒng)考核與評價體系中,課程考核主要通過期末閉卷考試與平時出勤的方式執(zhí)行,一般期末閉卷考試在課程總評中占據(jù)的比重為70%。顯然,對于以理論和實踐聯(lián)系密切的《數(shù)字圖像處理》課程來說,傳統(tǒng)考核模式并不合適。為了考察該課程改革措施帶來的教學(xué)效果,我們替換傳統(tǒng)的期末閉卷考試,取而代之,在該課程結(jié)束前的4 星期布置開放性的小課題,要求學(xué)生以2 人一組的小團隊形式開展為期約2-3 星期的課后課程設(shè)計。由于課題具有開放性,所以學(xué)生可結(jié)合平時使用桌面端或移動端相關(guān)數(shù)字圖像處理軟件的體驗與感受,或選擇本院課題組教師提供的選題依據(jù)或背景材料,如用于光學(xué)相機的人臉檢測與笑臉拍照、自然場景中的成熟果實檢測與果柄定位、文本文檔重排、車牌定位與識別、工件表面缺陷檢測、專用濾鏡設(shè)計與自動美圖、快遞單號自動批量導(dǎo)入、基于內(nèi)容理解的圖像檢索、無人機航拍圖像序列匹配與全景拼接、面向植保無人機的相關(guān)航空圖像處理應(yīng)用等。以解決實際問題為導(dǎo)向,通過組隊成員調(diào)研課題背景、存在的問題,完成項目需求分析、確立課后課程設(shè)計題目及擬采用的技術(shù)方案,分工合作并上機編程實現(xiàn),要求最終完成一款面向桌面端和/或移動端的數(shù)字圖像處理系統(tǒng)(軟件),同時按照本院軟件工程類本科畢業(yè)論文的設(shè)計要求與格式,撰寫相關(guān)的課程設(shè)計報告,并參加課程設(shè)計作品的現(xiàn)場答辯,教師在該過程中的作用主要是引導(dǎo)、啟發(fā)學(xué)生及答疑,課程設(shè)計的評價方式采用類似畢業(yè)答辯的形式開展。這種課程考核方法有利于綜合評價學(xué)生在新教學(xué)模式中凝練的概括、歸納、分析、比較、抽象和綜合演講等能力,這種開放性的課題執(zhí)行方式,給學(xué)生提供了更多了的思考與實踐機會,逐步讓他們體會到學(xué)習(xí)與實踐的樂趣、體驗“l(fā)earning to learn”的思維方式(機器學(xué)習(xí))。
《數(shù)字圖像處理》具有很強的理論與實踐并重的課程特點,結(jié)合信息與計算科學(xué)(軟件工程)專業(yè)學(xué)生的前續(xù)修學(xué)課程和擬從事的行業(yè),以工程應(yīng)用為導(dǎo)向進行課程教學(xué)改革,重新定位了課程的教學(xué)重心,并調(diào)整和優(yōu)化了相應(yīng)的教學(xué)內(nèi)容、提出了基于工程案例的理論教學(xué)方法,同時將項目分組執(zhí)行模式等引入《數(shù)字圖像處理》的課程教學(xué)過程與考核體系,有利于學(xué)生更好地掌握數(shù)字圖像處理技術(shù)的基本理論知識,能從根本上提高學(xué)生的數(shù)字圖像處理算法編程技巧、切實增強學(xué)生的實踐操作能力。