董 飛, 聶秀山
(1. 山東師范大學(xué) 新聞與傳媒學(xué)院, 濟(jì)南 250014; 2. 山東財(cái)經(jīng)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 濟(jì)南 250014)
隨著現(xiàn)代社會的發(fā)展,以計(jì)算機(jī)軟件、硬件、電子技術(shù)、數(shù)據(jù)庫等為核心的信息技術(shù)已經(jīng)成為推動社會生產(chǎn)力發(fā)展的主要動力。另外,AlphaGo在圍棋的人機(jī)大賽中取得的巨大成功,也使得人工智能成為產(chǎn)業(yè)界和學(xué)術(shù)界的研究熱點(diǎn),特別是2017年7月份國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,使得人工智能上升為國家戰(zhàn)略。因此,信息技術(shù)人才需求量會越來越大,高校作為信息技術(shù)人才培養(yǎng)的主要來源,對信息技術(shù)類專業(yè)(包括計(jì)算機(jī)科學(xué)與技術(shù)、網(wǎng)絡(luò)工程、數(shù)字媒體技術(shù)和藝術(shù)專業(yè)等)知識教學(xué)至關(guān)重要[1-3]。在信息技術(shù)類專業(yè)的課程體系中,數(shù)學(xué)類課程,包括高等數(shù)學(xué)、線性代數(shù)和概率論與數(shù)理統(tǒng)計(jì),是信息技術(shù)類專業(yè)的基礎(chǔ)學(xué)科,也是核心課程,對后續(xù)專業(yè)課程的學(xué)習(xí)具有舉足輕重的作用。因此,高等數(shù)學(xué)課程的設(shè)置和教學(xué)體系對信息技術(shù)類專業(yè)人才的培養(yǎng)有著重要影響。
高校數(shù)學(xué)課程不同于高中階段所學(xué)的數(shù)學(xué)[4],高校數(shù)學(xué)課程和學(xué)生的專業(yè)課程有著緊密的聯(lián)系,正因如此,數(shù)學(xué)課程成為高校各專業(yè)特別是理工類專業(yè)的基礎(chǔ)課程。但是,目前高校數(shù)學(xué)課程的教學(xué)主要是采用傳統(tǒng)的理論教學(xué)模式[5],教師對所有專業(yè)的學(xué)生“一視同仁”,灌輸大批定義、定理和解題技巧。往往這種模式培養(yǎng)出來的學(xué)生更適合參加考試,學(xué)生在學(xué)完數(shù)學(xué)課程中,普遍感覺是“數(shù)學(xué)難,數(shù)學(xué)很重要”,但是究竟怎么使用,特別是在本專業(yè)領(lǐng)域如何使用,仍然比較迷茫。針對這一問題,作者結(jié)合近年來的教學(xué)經(jīng)驗(yàn),在本文中以信息技術(shù)類專業(yè)學(xué)生為研究對象,以概率論與數(shù)理統(tǒng)計(jì)這門數(shù)學(xué)課程為例,探討信息技術(shù)類專業(yè)中的數(shù)學(xué)課程實(shí)驗(yàn)教學(xué)模式。
目前,國內(nèi)高校大部分專業(yè),特別是理工類專業(yè)都開設(shè)了數(shù)學(xué)類課程,但是數(shù)學(xué)課程的教學(xué)還是以傳統(tǒng)的課堂理論教學(xué)模式為主,學(xué)生被動學(xué)習(xí),而且教學(xué)內(nèi)容與學(xué)生的專業(yè)知識聯(lián)系不緊密,無法適應(yīng)人才培養(yǎng)和現(xiàn)代教學(xué)培養(yǎng)體系的需要[6-8]??傮w來說,目前高等學(xué)校數(shù)學(xué)課程教學(xué)存在以下2個問題。
(1) 教學(xué)內(nèi)容單一,與專業(yè)知識聯(lián)系不緊密。在高校的現(xiàn)行體制內(nèi),數(shù)學(xué)課程的授課教師隊(duì)伍一般是由基礎(chǔ)教學(xué)部(系)或數(shù)學(xué)學(xué)院的老師組成。不可否認(rèn),這些老師大多是數(shù)學(xué)相關(guān)專業(yè)出身,對數(shù)學(xué)知識的研究和理解比較深入,對數(shù)學(xué)知識的講解也是得心應(yīng)手,但是這部分授課老師大多對其他專業(yè)的了解有限。另外,數(shù)學(xué)授課老師的教學(xué)活動、課程建設(shè)也一般局限在本系部內(nèi)進(jìn)行,與其他各專業(yè)的交流也比較少。這些現(xiàn)象導(dǎo)致的問題就是,任課老師對所有專業(yè)數(shù)學(xué)課程的教學(xué)幾乎千篇一律,使得學(xué)生所學(xué)的數(shù)學(xué)知識與專業(yè)知識關(guān)聯(lián)不大。而數(shù)學(xué)知識與專業(yè)知識的關(guān)聯(lián)對于學(xué)生專業(yè)能力的培養(yǎng)又至關(guān)重要。大部分學(xué)生又無法通過自學(xué),把數(shù)學(xué)知識和專業(yè)知識有機(jī)結(jié)合起來。這就使得通過當(dāng)前高校數(shù)學(xué)課程的教學(xué)培養(yǎng)出來的學(xué)生更適合于進(jìn)行考試,而不是對知識的靈活應(yīng)用,特別是在專業(yè)領(lǐng)域的應(yīng)用。
(2) 理論教學(xué)多,實(shí)際動手機(jī)會少。數(shù)學(xué)類課程是一類理論性較強(qiáng)的課程,而傳統(tǒng)的數(shù)學(xué)教學(xué)模式往往也是更注重于理論的教學(xué),授課教師在課堂上會花費(fèi)大量的時間講解定義、定理證明以及解題技巧。不可否認(rèn),這些定義和定理的證明對學(xué)生理解知識點(diǎn)具有重要的幫助。但是傳統(tǒng)的教學(xué)模式忽視了對學(xué)生實(shí)踐能力和創(chuàng)新研究能力的培養(yǎng)[9],學(xué)生僅僅會用定理、公式解題,而不能利用定理、公式對實(shí)際問題,特別是專業(yè)領(lǐng)域的問題進(jìn)行建模、邏輯推理和解決問題。令人欣慰的是,隨著近年來數(shù)學(xué)建模比賽的流行和普及,上述問題得到一定程度的緩解,但是,數(shù)學(xué)建模畢竟是少數(shù)學(xué)生參加的活動,在平時教學(xué)中注重實(shí)踐教學(xué),是數(shù)學(xué)課程教學(xué)需要關(guān)注的問題[10-12]。
基于以上兩個方面,以信息技術(shù)類專業(yè)為對象,以概率論與數(shù)理統(tǒng)計(jì)課程為例,探索高校數(shù)學(xué)課程的實(shí)驗(yàn)教學(xué)設(shè)計(jì)模式。
信息技術(shù)類專業(yè)教學(xué)課程實(shí)驗(yàn)教學(xué)模式如圖1所示,共有3層構(gòu)成,第1層主要是課程基礎(chǔ)理論知識學(xué)習(xí),第2層是實(shí)驗(yàn)類型模塊,第3層是實(shí)驗(yàn)創(chuàng)新能力提升。在此模式中,目前的課程教學(xué)主要集中在第1層,對第2和第3層涉及較少,本文針對第2和第3層進(jìn)行詳細(xì)分析。
圖1 實(shí)驗(yàn)教學(xué)模式
本文提出的實(shí)驗(yàn)教學(xué)模式中,依據(jù)對學(xué)生能力的培養(yǎng)和與專業(yè)知識結(jié)合的原則,設(shè)計(jì)了2類實(shí)驗(yàn):
(1) 設(shè)計(jì)型實(shí)驗(yàn)。設(shè)計(jì)型實(shí)驗(yàn)主要是針對具體的專業(yè)問題,要求學(xué)生根據(jù)所學(xué)的理論、定理或公式設(shè)計(jì)實(shí)驗(yàn)?zāi)P秃瓦^程,解決實(shí)際問題。主要是培養(yǎng)學(xué)生利用所學(xué)知識解決實(shí)際問題,特別是專業(yè)領(lǐng)域問題的能力。
(2) 驗(yàn)證型實(shí)驗(yàn)。此類實(shí)驗(yàn)需要借助Matlab[13]、R[14]等編程工具,驗(yàn)證相關(guān)定理和公式,使學(xué)生對知識點(diǎn)有更加直觀的認(rèn)識,從而更好地理解和掌握知識點(diǎn)。
實(shí)踐教學(xué)的成果,最終體現(xiàn)在學(xué)生的動手能力和應(yīng)用能力上,而競賽正是學(xué)生鍛煉動手能力和應(yīng)用能力的最好方式。讓學(xué)生積極參加國家和省級各類相關(guān)競賽,特別是各類數(shù)學(xué)建模大賽,通過比賽既培養(yǎng)了學(xué)生的實(shí)際動手能力和邏輯分析能力,也可以為日后走向工作崗位打好基礎(chǔ)。信息技術(shù)類專業(yè)作為一個對實(shí)踐能力要求很強(qiáng)的專業(yè),每年諸如ACM程序設(shè)計(jì)大賽、信息安全大賽以及省內(nèi)的軟件設(shè)計(jì)大賽等競賽項(xiàng)目很多,這類競賽除了考核學(xué)生的編程能力之外,在算法的設(shè)計(jì)和實(shí)現(xiàn)部分,也很大程度上鍛煉了學(xué)生的數(shù)學(xué)思維和數(shù)學(xué)工具的靈活應(yīng)用能力[15]。
近年來在從事信息技術(shù)類相關(guān)專業(yè)(計(jì)算機(jī)科學(xué)與技術(shù)、網(wǎng)絡(luò)工程、電子商務(wù)、數(shù)字媒體技術(shù))的課程教學(xué)工作中,在平時的教學(xué)科研中,結(jié)合概率論與數(shù)理統(tǒng)計(jì)課程的內(nèi)容,通過設(shè)計(jì)型實(shí)驗(yàn)和驗(yàn)證型實(shí)驗(yàn)的案例,展示如何讓學(xué)生結(jié)合專業(yè)知識進(jìn)行數(shù)學(xué)類課程的實(shí)驗(yàn)設(shè)計(jì)。
電子郵件是網(wǎng)絡(luò)用戶工作和生活交流的主要方式,但是,隨著近年來互聯(lián)網(wǎng)信息的發(fā)展,越來越多垃圾郵件出現(xiàn)在用戶的郵箱里,給用戶正常的生活和工作造成了影響,如何讓計(jì)算機(jī)自動地對正常郵件和垃圾郵件進(jìn)行分類是一個重要的問題。郵件分類問題是計(jì)算機(jī)和人工智能領(lǐng)域的一個重要問題,其基礎(chǔ)理論和模型就是概率論中的貝葉斯模型。而貝葉斯模型是概率論里重要的知識,因此,教學(xué)團(tuán)隊(duì)設(shè)計(jì)了一個利用貝葉斯模型進(jìn)行郵件分類實(shí)驗(yàn)案例。
實(shí)驗(yàn)內(nèi)容給定一個郵件數(shù)據(jù)集,通過全概率公式和貝葉斯公式建立一個分類模型,實(shí)現(xiàn)郵件自動分類(正常郵件和垃圾郵件)。
實(shí)驗(yàn)?zāi)康耐ㄟ^本實(shí)驗(yàn),讓學(xué)生更加深入地理解和掌握全概率公式和貝葉斯公式,同時給學(xué)生展示如何把數(shù)學(xué)理論和公式與專業(yè)領(lǐng)域的應(yīng)用結(jié)合起來。
3.1.1全概率公式和貝葉斯公式
定義1(全概率公式) 設(shè)試驗(yàn)E的樣本空間為S,A為E的事件,B1,B2,…,Bn為樣本空間S的一個劃分,P(Bi)>0 (i=1,2,…,n), 則全概率公式為:
(1)
定義2(貝葉斯公式) 設(shè)B1,B2,…,Bn是完備事件組,則對任一事件A,有貝葉斯公式:
(2)
全概率公式是概率論中的重要公式,它將對一個復(fù)雜事件A的概率求解問題轉(zhuǎn)化為對不同情況下發(fā)生的簡單事件的概率進(jìn)行求和的問題。具體步驟是首先建立一個完備事件組的思想,其實(shí)就是已知第1階段求第2階段,比如第1階段分為B1,B2,B33種,B1,B2,B3中均有A發(fā)生的概率,則第2階段求A的概率為:
P(A)=P(B1)·P(A|B1)+P(B2)·P(A|B2)+
P(B3)·P(A|B3)
(3)
貝葉斯公式,也叫逆概公式,在全概率公式理解的基礎(chǔ)上,其實(shí)就是已知第2階段反推第1階段,關(guān)鍵是利用條件概率公式做變換,跟上面建立的模型一樣,已知P(A),求在A發(fā)生的條件下Bi發(fā)生的概率,這就是貝葉斯公式。具體如下:
(4)
3.1.2郵件的概率模型
實(shí)驗(yàn)情形描述給定兩類郵件集合,分別是垃圾郵件集合B1和正常郵件集合B2,今收到一封新郵件,內(nèi)容為:“我司可辦理正規(guī)發(fā)票(保真),17%增值稅發(fā)票點(diǎn)數(shù)優(yōu)惠!”。如何建立模型自動判定此郵件是正常郵件還是垃圾郵件。
實(shí)驗(yàn)步驟
(1) 建立數(shù)學(xué)模型。令B1=“垃圾郵件”,B2=“正常郵件”,A=“新郵件”,則
(5)
(6)
顯然,新郵件A是否為垃圾郵件的問題轉(zhuǎn)換為判斷式(5)和(6)哪一個概率值更大的問題,如果P(B1|A)>P(B2|A),則把郵件A歸類為垃圾郵件集合B1,反之郵件為正常郵件。
(2) 問題簡化。通常情況下概率值P(Bi)是作為先驗(yàn)知識給定的,而且相等,因此上述問題轉(zhuǎn)化為比較P(A|B1)和P(A|B2)大小的問題。
(3) 計(jì)算給定數(shù)據(jù)集中垃圾郵件和正常郵件里各自的詞/語句的分布,如表1所示。
表1 郵件語句內(nèi)容分布表
根據(jù)表1數(shù)據(jù),概率值計(jì)算如下:
P(A|B1)=P(我司,可,辦理,正規(guī),發(fā)票,保真,發(fā)票,點(diǎn)數(shù),優(yōu)惠|垃圾)=2.1×10-14
P(A|B2)=P(我司,可,辦理,正規(guī),發(fā)票,保真,發(fā)票,點(diǎn)數(shù),優(yōu)惠|正常)=1.7×10-19
(4) 根據(jù)P(A|B1)和P(A|B2)大小做出結(jié)論。
以上給出了該實(shí)驗(yàn)的基本步驟,要求學(xué)生自己編寫程序?qū)崿F(xiàn)以上實(shí)驗(yàn)過程。
實(shí)驗(yàn)思考
(1) 該實(shí)驗(yàn)案例中所做假設(shè)的合理性,以及對實(shí)驗(yàn)可能造成的影響。
(2) 影響郵件分類精度的因素有哪些?考慮這些因素在實(shí)際應(yīng)用中的影響大小。
驗(yàn)證型實(shí)驗(yàn)的目的是通過實(shí)驗(yàn)來驗(yàn)證相關(guān)定義、公式或定理。本類實(shí)驗(yàn)主要利用Matlab作為程序語言工具[16],對于典型公式、定理進(jìn)行編程實(shí)現(xiàn),以符合高斯分布的二維隨機(jī)變量為例,進(jìn)行說明。
在信息技術(shù)領(lǐng)域,特別是計(jì)算機(jī)的數(shù)據(jù)挖掘領(lǐng)域,經(jīng)常處理大量的數(shù)據(jù),并從數(shù)據(jù)里挖掘有用的資料和信息。在數(shù)據(jù)挖掘之前,通常需要觀察一下數(shù)據(jù)的分布情況,本實(shí)驗(yàn)就是以高斯分布為例進(jìn)行講述。
實(shí)驗(yàn)內(nèi)容利用Matlab可視化高斯分布信號的形態(tài)。
實(shí)驗(yàn)?zāi)康淖寣W(xué)生熟悉如何可視化隨機(jī)變量,如何利用Matlab實(shí)現(xiàn)隨變量分布的可視化操作。
實(shí)驗(yàn)步驟設(shè)定數(shù)據(jù)參數(shù),可視化高斯分布,結(jié)果如圖2所示。
圖2 高斯隨機(jī)變量分布圖
主要實(shí)驗(yàn)代碼和結(jié)果如下:
u1=0.5; %設(shè)定數(shù)據(jù)第一維的均值
u2=0.6; %設(shè)定數(shù)據(jù)第二維的均值
g1=8; %設(shè)定數(shù)據(jù)第一維的標(biāo)準(zhǔn)差
g2=6; %設(shè)定數(shù)據(jù)第二維的標(biāo)準(zhǔn)差
p=0.1;
[x,y]=meshgrid(-15:0.6:15);
mesh(f);
實(shí)驗(yàn)思考
(1) 符合高斯分布的數(shù)據(jù)形態(tài)有哪些參數(shù)決定?
(2) 高斯數(shù)據(jù)分布的形狀和參數(shù)有什么關(guān)系?
高校數(shù)學(xué)課程對專業(yè)課程的學(xué)習(xí)具有重要的幫助,但是現(xiàn)有數(shù)學(xué)課程的教學(xué)模式并沒有和學(xué)生的專業(yè)知識背景相結(jié)合。為此,本文以概率論、數(shù)理統(tǒng)計(jì)課程為例,以信息技術(shù)類專業(yè)學(xué)生為對象,提出了一種信息技術(shù)類專業(yè)數(shù)學(xué)課程實(shí)驗(yàn)教學(xué)模式。該實(shí)驗(yàn)教學(xué)模式是對數(shù)學(xué)課程與專業(yè)背景結(jié)合模式的初步探索,目前作者已經(jīng)在授課班級進(jìn)行了初步推廣,學(xué)生反映情況良好,下一步,將繼續(xù)修正實(shí)踐過程中出現(xiàn)的問題,并進(jìn)一步在其他專業(yè)進(jìn)行推廣。