范照勇,詹翠麗
(湖北商貿(mào)學院 人工智能學院, 武漢 430079)
在國家全面實施人工智能戰(zhàn)略的背景下,無論從國家政策還是從市場供給需求來看,加強人工智能人才培養(yǎng)、補齊人才短板,都是亟待解決的問題。近年來,各高校紛紛設立了智能科學與技術、人工智能、數(shù)據(jù)科學與大數(shù)據(jù)技術等培養(yǎng)人工智能人才的相關專業(yè)[1,2]。2019年3月,教育部公布了2018年度全國普通高等學校本科專業(yè)備案和審批結果,35所高校獲首批建設人工智能本科專業(yè)的資格。從獲準的高校名單來看,除了一些老牌名校之外,也有江蘇科技大學、安徽工程大學等專業(yè)特色鮮明的地方性高校??梢灶A見,在人工智能迎來第三次發(fā)展浪潮的背景下,將有更多高校結合發(fā)展定位與學科優(yōu)勢特色,探索適合于自身的人工智能專業(yè)建設之路。
人工智能多學科交叉、高度復雜、強滲透性的特點決定了其人才培養(yǎng)具有高度挑戰(zhàn)性,而其中人才培養(yǎng)方案和課程體系是保證人才培養(yǎng)質(zhì)量的前提[1]。從開設人工智能專業(yè)的應用型高校培養(yǎng)方案看,對人工智能相關專業(yè)學生的工程知識要求可以歸納為:能夠?qū)?shù)學、自然科學、信息科學基礎和人工智能專業(yè)知識應用于解決復雜人工智能工程問題。在課程設置上,著重強調(diào)知識的實用性,更加突出概率、統(tǒng)計、隨機過程、優(yōu)化理論等數(shù)學方法的重要性,同時開設了諸多人工智能和機器學習的算法及應用實踐課程。然而,部分高校卻忽視了融合微積分、概率論和統(tǒng)計學等人工智能深度學習基本組成部分的信息論課程。對于人工智能相關專業(yè)學生的知識體系而言,這在一定程度上將會導致數(shù)學基礎和具體算法應用之間“形成溝壑”,使得培養(yǎng)方案中先修人工智能數(shù)學基礎課程和后續(xù)人工智能應用課程之間難以良好銜接。
本文針對應用型高校人工智能相關專業(yè)課程體系的建設需求,分析信息論與人工智能的強關聯(lián)性,區(qū)分人工智能核心專業(yè)(人工智能、智能科學與技術、計算機科學與技術、通信、電子信息等)和“人工智能+”專業(yè)(金融、統(tǒng)計、電商、管理等),改革教學內(nèi)容、教學方法和考核方式,為學生學習后續(xù)課程和解決專業(yè)現(xiàn)實問題打下堅實的理論基礎。
信息論是現(xiàn)代信息科學和計算機技術的重要基礎理論之一,源于對現(xiàn)代通信的深入研究[3]。1948年,香農(nóng)發(fā)表的學術論文“通信的數(shù)學理論”開啟了經(jīng)典信息理論,主要內(nèi)容包括信息度量理論、信源編碼理論、糾錯編碼理論等。
此后,信息論作為一門獨立的學科不斷發(fā)展,新時代下的信息論所研究的內(nèi)容不僅僅包括信息的度量、獲取、處理等問題,還逐漸與其他相關領域融合,例如語義學、神經(jīng)心理學、語言學等等;應用場景更是涉及到高校思想政治教育、科技英語翻譯、數(shù)字營銷、經(jīng)濟學等各個領域[4-6]。但是,在高校本科教育階段,《信息論》課程依然僅僅面向通信工程專業(yè)學生講授。近年,也有相關院校逐步將信息論課程開設至網(wǎng)絡安全、計算機科學等與通信工程相近的專業(yè)[7]。
信息論是現(xiàn)代信息科學的重要組成部分,人工智能是一門研究如何使機器具有人類智能的學科,是當下最熱門的行業(yè)方向,二者之間一直是“一體兩面”的關系。例如,對于人工智能領域的機器學習,劍橋大學教授David MacKay說“Information theory and machine learning are the two sides of the same coin”[8]。信息論與機器學習同為涉及計算機科學和應用數(shù)學等學科的分支領域,二者在起源和應用上有很多相似之處。信息論方法在人工智能方向多種應用算法中同樣有重要作用,特別對信息統(tǒng)計、數(shù)據(jù)挖掘等領域的發(fā)展有重要意義。
2.2.1 典型機器學習過程中信息論的運用
在人工智能方法實際應用中,通常需要利用信息論理論知識。類似機器學習、模式識別和深度學習等實現(xiàn)人工智能的具體手段,其原理與信息論的理論具有較強的關聯(lián)性。例如,對于人工智能領域常見的分類問題,為了提升智能識別效果,在數(shù)據(jù)準備過程中,即將數(shù)據(jù)送入分類器前,需要利用信息度量標準——信息論中熵的概念來區(qū)分數(shù)據(jù)中的有用信息或冗余消息,并通過分析進一步提取具有代表性的特征,使得數(shù)據(jù)集更加合理。在貝葉斯網(wǎng)絡中,還可以使用交互信息來確定變量之間的關系結構。為了提高識別速率,通常需要選擇適合的編碼技術(如壓縮編碼技術)對數(shù)據(jù)進行降維。模型評價過程中使用交叉熵作為作為損失函數(shù)計算預測偏離真實輸出情況。即交叉熵損失函數(shù)是深度學習框架中流行的損失函數(shù),最大信息增益(互信息)為構建決策樹提供了理論基礎,維特比算法廣泛應用于自然語言處理和語音處理,編碼器-解碼器的概念廣泛使用于機器翻譯的卷積神經(jīng)網(wǎng)絡等模型中。可以看出,信息論和編碼技術參與了整個模式識別過程中數(shù)據(jù)預處理、特征提取、模型評價等重要環(huán)節(jié)。因此,對于人工智能應用型人才的培養(yǎng),不能僅強調(diào)眼前的“實用性”,在學習各類機器學習算法工具的同時,理解和掌握好信息論的基本概念和理論,能夠為學生學習后續(xù)課程打下堅實的理論基礎,厚實培養(yǎng)人才的職業(yè)發(fā)展?jié)摿Α?/p>
2.2.2 基于信息論的機器學習原理
從前面的論述可以看出,信息論和人工智能,尤其是機器學習互有交叉,但主要是機器學習中借用信息論的方法以此拓展理論研究和應用場景,比較典型的就是借鑒信息理論創(chuàng)造和改進學習算法。事實上,當前人工智能的基礎理論依然還在繼續(xù)深入研究之中。90年代初,信息論和人工智能專家鐘義信開始對人工智能理論進行系統(tǒng)研究,出版著作《智能理論與技術》后又提出信息、知識、智能轉換理論、機制主義人工智能理論等,在國內(nèi)外產(chǎn)生重要影響。他曾經(jīng)指出“信息理論、知識理論、人工智能理論之間相互脫節(jié)的研究狀況, 不利于信息科學技術、知識科學技術和人工智能科學技術的發(fā)展, 更不利于信息理論、知識理論、智能理論的一體化研究,不能適應現(xiàn)代科學技術和經(jīng)濟社會發(fā)展的需要”[9]。中國科學院自動化研究所胡包鋼研究員提出:統(tǒng)計學與優(yōu)化理論主要是“怎么學”層面中的基礎理論,它們無法回答“學什么”這樣的機器學習中首要問題,而信息論將會扮演重要角色。他提出:機器學習中關于學習目標選擇的計算表達均可以應用信息(熵)理論函數(shù)優(yōu)化方式予以解釋或描述。如果將人類大腦以及神經(jīng)系統(tǒng)看成連接的網(wǎng)絡(如同現(xiàn)有的通信網(wǎng)絡),就能夠理解為什么信息論是不可或缺的基礎支撐之一[10]。信息論準則已經(jīng)應用在生成式對抗網(wǎng)絡(GAN)學習中,基于信息論的機器學習還將為人工智能研究帶來新的發(fā)展空間。在此基礎上,提出基于信息理論的機器學習原理,即基于信息理論為學習準則的機器 (分類、聚類)學習原理就是將無序(類標、特征)數(shù)據(jù)轉變?yōu)橛行?類標、特征)數(shù)據(jù)的過程,其中轉變效果是以信息熵為測量尺度。
可見,無論是從應用層面,還是從理論基礎層面來看,信息論都和人工智能息息相關。同時,從香農(nóng)、鐘義信等信息論專家在人工智能領域的諸多建樹也可以看出,信息論基礎知識將對人工智能相關專業(yè)學生職業(yè)發(fā)展有重要影響。因此,信息理論是人工智能人才必須掌握的基礎知識,也是人工智能相關專業(yè)不可或缺的專業(yè)基礎課程。
目前,各高校信息論課程目前僅針對通信專業(yè)開設,近年一些高校才逐步在信息安全、計算機等專業(yè)開設?,F(xiàn)有的教材中不可避免地存在著通信中的一些術語和名詞,再加上書中有很煩瑣的數(shù)學證明,同時概率論、隨機過程和數(shù)理統(tǒng)計等先修課程也是應用型高校學生普遍的薄弱環(huán)節(jié)。此外,在信息論教學中還存在實驗設置不足和課程資源相對缺乏等問題。針對人工智能相關專業(yè)開設信息論課程,需要將信息論基礎知識與人工智能、機器學習應用知識融合進行教學,才能達到理想的教學效果;同時對于人工智能核心專業(yè)和“人工智能+”專業(yè),培養(yǎng)目標不同,所需的信息論基礎知識也不盡相同。為解決上述問題,需要從課程教學團隊、課程教學體系建設,實驗資源開發(fā)、教學方法等方面著手進行教學改革,實施跨專業(yè)信息論課程教學與建設的探索與實踐。
針對應用型高校人才培養(yǎng)需求,圍繞人工智能產(chǎn)業(yè)鏈(技術鏈),本著專業(yè)技術相關、專業(yè)基礎相通、就業(yè)背景相同、環(huán)境資源共享原則構建人工智能專業(yè)核心群,重點專業(yè)有人工智能、智能科學與技術、計算機科學與技術、通信、電子信息等專業(yè),這些專業(yè)分別定位人工智能的“云、管、端”產(chǎn)業(yè)鏈需求,涵蓋人工智能所需的云計算、分布式計算、大數(shù)據(jù)等技術要素,在人才培養(yǎng)過程中將其定位為人工智能核心專業(yè)。同時,基于人工智能跨學科的特點,從學科建設角度而言,重視人工智能與傳統(tǒng)學科的交叉融合,不僅有利于人工智能學科的特色發(fā)展,還可以輔助發(fā)掘金融、統(tǒng)計、電商、管理等相關學科專業(yè)的潛力,促進彼此共同發(fā)展。研究認為,通過人工智能實現(xiàn)跨越“大文大理”的學科融合創(chuàng)新存在現(xiàn)實可能性[11]?;趹眯透咝嶋H,可將金融、統(tǒng)計、電商、管理等人工智能交叉專業(yè)定位為“人工智能+”專業(yè)。
不同專業(yè)對信息論的要求完全不同,但其共同點就是各專業(yè)均要求對基礎信息理論進行全面掌握,能夠運用信息思維方法去解決經(jīng)濟、管理、語言處理等方面的問題。而對于核心專業(yè)而言,在此基礎上,還需要利用信息論原理,調(diào)整優(yōu)化算法模型。因此,在應用型高校理論基礎知識“夠用即可”的前提下,著眼人工智能核心專業(yè)、“人工智能+”專業(yè)教學內(nèi)容差異,通過對信息論基礎知識的講授,引入與專業(yè)相關的應用實例,將信息論與各專業(yè)相關聯(lián)的內(nèi)容,進行總結、歸納和拓展,建立課程之間的交叉聯(lián)系,將不同科目的相關理論綜合起來,聯(lián)系實際應用,多舉例展現(xiàn),以提升學生的學習興趣。此外,信息論基礎知識的教學還需要順應信息技術發(fā)展需求,在當前信息處理和編碼技術普遍數(shù)字化的背景下,適當刪減連續(xù)信源理論、連續(xù)信道容量等內(nèi)容,側重離散信源和離散信道理論,滿足智能時代人才培養(yǎng)需求。
信息論課程具有較強的理論性和抽象性,針對應用型人才培養(yǎng),其教學需理論教學與實驗教學并重。在理論教學中,強化概念理解、弱化公式推導,并注重結合工程實例增強對基本概念的理解,例如通過文字信源和圖像信源的信源熵對比機器學習實例,講授圖像編碼的碼字需求,使學生理解圖像信源更大的不確定性,以及信息度量對編碼的意義,同時簡要介紹人工智能自然語言處理和機器視覺案例,使學生獲得更多應用和實踐的直觀感受。信息論是一門理論性很強的課程,理論教學過程以講授、公式推導等方法為主,但適當采用現(xiàn)代教育技術,如借助“微助教”、“雨課堂”等平臺實施教學,輔助完成課堂教學管理、互動、教學資源管理等工作,如課堂簽到、點答搶答、前課內(nèi)容復習測試、PPT/Flash等教學材料管理,既可以增加課堂互動活躍氣氛以增強教學效果,又可提供學生自主學習、作業(yè)上傳的平臺,對于學時安排較少的高??梢越鉀Q學時少與教學內(nèi)容容量大的矛盾,鼓勵學生自主學習,發(fā)揮其學習的主體作用,還可為過程性考核提供原始數(shù)據(jù)。
在理論教學的同時,還需注重信息論基本原理、基本方法的靈活應用,結合實驗教學培養(yǎng)學生的創(chuàng)新和實際動手能力。對人工智能核心專業(yè),加強對課程的實驗要求,在對已有算法的驗證性實驗基礎上,引導學生進行綜合性、仿真性實驗的設計。比如對無失真和限失真信源編碼、二進制信道和高斯信道容量的計算進行實驗驗證,甚至在壓縮編碼和信息安全方面自行設計一些實驗,在學會使用Matlab、 SystemView等仿真軟件的基礎上,應用 C++ 、Python等程序語言進行開發(fā)性試驗,以提高學生獨立思維和動手能力。對人工智能+專業(yè),以信息熵計算、信源編碼等演示實驗為主,增強學生對信息論基礎知識的直觀體驗。
為了更準確的檢驗學生學習效果,采用過程性考核方法,更加重視學生的平時成績和實驗考核成績。對學生的考核采用“考試+過程測評”的綜合評價方案,課程成績由“平時成績(20%)+實驗成績(20%)+期末考試(60%)”三部分構成。其中,平時成績涵蓋“微助教”平臺簽到情況、課堂復習小測試成績、課堂互動答題成績、作業(yè)成績,上機成績涵蓋實驗課程過程的實施、代碼優(yōu)化和總結等各種形式實踐能力的考核(基礎上機實驗成績50%,綜合創(chuàng)新實驗50%),三個部分綜合評價學習效果。實驗作業(yè)要求學生在信源編碼和信道編碼部分自選完成兩個實驗題目,并寫出完整報告,說明原理和實現(xiàn)方法,提交程序和運行結果。實驗成績依據(jù)學生在實驗過程中的動手能力、分析與解決問題能力等給予不同的權重。期末考試注重考核學生對基本概念、原理和方法的掌握情況,弱化使用公式進行機械計算。過程性方式通過對學生學習知識過程和綜合應用能力形成過程進行監(jiān)督和評價,促使學生在學習的過程中持續(xù)用功,提升教學質(zhì)量和效果。
人工智能處于第四次科技革命的核心地位,在該領域的競爭意味著一個國家未來綜合國力的較量。其中,人才的培養(yǎng)起著基礎性的支撐作用。本文通過分析信息論基礎理論在數(shù)據(jù)預處理、特征提取、模型評價等方面的應用,結合基于信息論的機器學習原理,梳理了信息論課程與人工智能相關專業(yè)人才培養(yǎng)之間的強關聯(lián)性。結合應用型高校人才培養(yǎng)實際,從教學內(nèi)容、教學方法、考核方式等方面實施教學改革探索,應用技術特色鮮明,體現(xiàn)了多學科思維融合、產(chǎn)業(yè)技術與學科理論融合、跨專業(yè)能力融合、多學科項目實踐融合的新工科高水平課程的要求。以此為基礎實施信息論課程教學,以學生發(fā)展為中心,創(chuàng)新教學方法,激發(fā)學生內(nèi)在潛力和學習動力,從而保障跨學科、創(chuàng)新復合型應用人才培養(yǎng)的質(zhì)量。