摘要:信息熵是信息論中的最重要的概念,各類教材都給出了詳細(xì)的定義和數(shù)學(xué)推導(dǎo),但是由于概念較為抽象,致使許多學(xué)生都無法準(zhǔn)確理解和應(yīng)用該部分的教學(xué)內(nèi)容。以“核酸混合檢測”從消除新冠病毒攜帶者的不確定性出發(fā),貫穿課程理論知識的疫情防控案例和典型例題的構(gòu)建,引導(dǎo)學(xué)生利用信息熵的理論知識,指導(dǎo)探究解決問題的方法與技術(shù)。理論知識與生活實(shí)踐的結(jié)合,既讓學(xué)生充分理解信息熵的概念,又可以體會信息論對實(shí)踐的指導(dǎo)意義。
關(guān)鍵詞:信息熵;核酸混合檢測;信息論;課程思政
中圖分類號:TB文獻(xiàn)標(biāo)識碼:Adoi:10.19311/j.cnki.16723198.2024.20.090
0引言
習(xí)近平總書記指出:要用好課堂教學(xué)這個(gè)主渠道,思想政治理論課要堅(jiān)持在改進(jìn)中加強(qiáng),提升思想政治教育親和力和針對性,滿足學(xué)生成長發(fā)展需求和期待,其他各門課程都要守好一段渠、種好責(zé)任田,使各類課程與思想政治理論課同向同行,形成協(xié)同效應(yīng)。2020年5月,教育部印發(fā)《高等學(xué)校課程思政建設(shè)綱要》指出,全面推進(jìn)高校課程思政建設(shè),發(fā)揮好每門課程的育人作用。
信息論與編碼是以概率論和隨機(jī)過程等數(shù)學(xué)方法研究信息在通信系統(tǒng)中的存儲、傳輸、處理和控制的學(xué)科,是信息與計(jì)算科學(xué)專業(yè)的專業(yè)核心課程,是數(shù)學(xué)理論在信息科學(xué)中的典型應(yīng)用,結(jié)合信息論與編碼的課程內(nèi)容,以講好中國故事為主線,將科學(xué)探索精神、嚴(yán)于律己精神、愛國精神、科技報(bào)國的家國情懷與擔(dān)當(dāng)?shù)热琨}化水般融入課堂教學(xué),使學(xué)生獲得專業(yè)知識的同時(shí),不斷提高思想道德素養(yǎng),提高服務(wù)國家服務(wù)人民的社會責(zé)任感。最大限度地激發(fā)學(xué)生自主學(xué)習(xí)的內(nèi)在動(dòng)力?!靶畔㈧亍笔切畔⒍攘康闹匾拍?,是后續(xù)內(nèi)容學(xué)習(xí)的基礎(chǔ)。
從“核酸混合檢測”要消除新冠病毒攜帶者的不確定性,需要獲取的信息量出發(fā),設(shè)立問題,引出本節(jié)內(nèi)容——信息熵,在解決問題的過程中學(xué)習(xí)知識,提高學(xué)生的參與度和興趣,培養(yǎng)學(xué)生獨(dú)立思考的能力。利用理論工具指導(dǎo)編碼實(shí)踐。既讓學(xué)生深刻理解信息的本質(zhì),又讓學(xué)生體會到信息論的使用價(jià)值。在教學(xué)過程中適當(dāng)嵌入課程思政要素,在信息論基礎(chǔ)專業(yè)課程中潛移默化地影響和教育學(xué)生。
1課程設(shè)計(jì)
圍繞“疫情防控”這一社會熱點(diǎn),構(gòu)造案例和典型例題,貫穿本節(jié)課程的理論教學(xué)。通過回答核酸混合檢測的數(shù)學(xué)原理,展開信息熵的講解,在理論指導(dǎo)下引導(dǎo)學(xué)生探索具體實(shí)現(xiàn)方法。既讓學(xué)生深刻理解信息的本質(zhì),又能讓學(xué)生體會到信息論的使用價(jià)值。在專業(yè)課程的教學(xué)過程中潛移默化地影響和教育學(xué)生。
1.1問題提出
根據(jù)統(tǒng)計(jì)資料,我國的陽性人群的感染率低于01%,通常采用10合1的混合檢測技術(shù)。
問題1:10合1的核酸檢測技術(shù)的原理?為什么美國不能使用這種混合檢測技術(shù)?
問題2:在陽性人群的概率是01%的地區(qū),檢測出1名病毒攜帶者,該事件攜帶信息量?
問題3:設(shè)A地,陽性人群的概率是50%;B地陽性人群的概率是1%。何地的核酸檢測(單檢)提供的信息量更大?
問題1設(shè)立問題,引發(fā)學(xué)生思考,提示學(xué)生可以利用本節(jié)學(xué)習(xí)的知識,得到核酸混檢技術(shù)的原理,并能夠計(jì)算出最少的檢測次數(shù);問題2,3用于回顧前面的內(nèi)容-自信息量;并可以得到
pA(陽)=pA(陰)=1bit,pB(陽)=-log001=664bit,pB(陰)=-log099=001bit.
有
pB(陽)>pA(陽),pB(陰)<pA(陰)
可以看出平均一IIjpt8uILSg0V8Yd4vgi6Myk+icm7zUVDoghdx9i0q0=次核酸檢測結(jié)果能夠提供的信息量無法用自信息量刻畫,引出本節(jié)的內(nèi)容——信息熵.
1.2熵的定義
定義1:信源空間X為
XP(X)=x1,x2,…,xi,…,xnp(x1),p(x2),…,p(xi),…p(xn)
各離散消息自信息量的數(shù)學(xué)期望定義為平均自信息量(信息熵)
H(X)=E[I(xi)]=-∑ni=1p(xi)logp(xi)(2.1)
其物理意義為:信息熵H(X)表示信源發(fā)出符號之前,確定信源X中每個(gè)符號平均需要的信息量;信息熵H(X)表示信源發(fā)出符號之后,平均每個(gè)符號所攜帶的信息量;
定義2.信源符號集X和信宿符號集Y中,每對元素xiyj聯(lián)合自信息量的數(shù)學(xué)期望定義為聯(lián)合熵H(XY)
H(XY)=EX,Y[I(xiyj)]=∑ni=1∑mj=1p(xiyj)I(xiyj)=-∑ni=1∑mj=1p(xiyj)logp(xiyj)(2.2)
定義3.信源符號集X,和信宿符號集Y中,條件自信息量I(yj|xi)的數(shù)學(xué)期望定義為條件熵H(Y|X)
H(Y|X)=EX,Y[I(yj|xi)]=∑ni=1∑mj=1p(xiyj)I(yj|xi)=-∑ni=1∑mj=1p(xiyj)logp(yj|xi)(2.3)
類似地有X相對Y的條件熵H(X|Y)定義為
H(X|Y)=-∑ni=1∑mj=1p(xiyj)logp(xi|yj)
1.3核酸混合檢測的原理
為了加強(qiáng)學(xué)生對信息熵概念的理解和應(yīng)用信息熵理論分析解決實(shí)際問題,結(jié)合核酸檢測問題,詳細(xì)講解例題。
例1.某地感染陽性的概率0.1%,即1000人中有且只有1人為病毒攜帶者,假設(shè)感染病毒是等概率的,求需要多少支試劑能鎖定病毒攜帶者?
問題分析:設(shè)等概率分布的1000人建立信源空間X
XP(X)=x1x2…x10001100011000…11000
利用試劑檢測1次,檢測結(jié)果為陰性或陽性也是等概率的,建立核酸檢測結(jié)果的信源空間Y
YP(Y)=y0(陽)y1(陰)1212
因此要鎖定病毒攜帶者,需要利用核酸檢測獲取的信息量要大于等于信源空間X的不確定性即可。
解答:信源X的不確定性
H(X)=-∑ni=1p(xi)logp(xi)=-11000log11000×1000=9.97bit
1支試劑完成檢測能夠獲得的信息量為
H(Y)=-∑1i=0p(yi)logp(yi)=-12log12+12log12=1bit
假設(shè)需要k只試劑確定病毒攜帶者,
k·H(Y)H(X)=9.97
因此至少需要做10支試劑才能夠確定病毒攜帶者,任何想低于這個(gè)檢測次數(shù)的努力都是徒勞的。
問題擴(kuò)展:利用信息論知識確定了核酸檢測次數(shù),如何檢測?
方法一:分半混合檢測
第一步:每組500人混合,檢測其中1組,利用1份試劑可以排除1半陰性人員;
第二步:將陽性組的液體再對半分成兩組,利用第2支試劑檢測1組,又可以排除1半陰性人員,
反復(fù)進(jìn)行下去,只需要10步,即需要10支試劑??梢越鉀Q問題。但是這種檢測方法共需要10輪檢測,每輪都需要數(shù)小時(shí),時(shí)間耗費(fèi)過長。
思考2.1:有沒有更好的方法利用10支試劑,1輪即可得到檢測結(jié)果?
第一步:二進(jìn)制編碼,對待檢測人員按0~999進(jìn)行編號,將數(shù)字轉(zhuǎn)化為二進(jìn)制序列。如表1。
第二步:檢測,根據(jù)二進(jìn)制編碼的數(shù)字進(jìn)行檢測,編碼的第幾位是數(shù)字“1”,就用第幾號試劑進(jìn)行檢測,第一號試劑只檢測第一位是1的人員。例如第153號檢測人員,二進(jìn)制編碼為0001011001,體液分別放入第4,6,7,10號試劑進(jìn)行檢測。
第三步:確認(rèn),最后根據(jù)試劑的值,鎖定陽性人員,例如:試劑顯示0010110110(0代表陰性,1代表陽性),則該二進(jìn)制對應(yīng)的第182號為病毒攜帶者。
該方法是最節(jié)省試劑,檢測最快的方法,但是由于人員組織過于繁瑣,通常沒有在實(shí)際中采用,實(shí)際生活中通常采用易于操作的10混1的混合檢測方法,只需要110支試劑,即可鎖定病毒攜帶者。
思考2.2:當(dāng)感染陽性的概率p取什么值時(shí),不能使用10混1的檢測方法?
答案為p=0.206可以作為課后思考題,讓同學(xué)們思考推導(dǎo)。這說明,感染率高的西方國家不能采用這樣的混合檢測技術(shù)。
例3.將A地的核酸檢測結(jié)果通過有干擾的信道傳送到B地,“0”表示陰性,“1”表示陽性,已知A地的檢測結(jié)果p(0)=14,已知p(0|0)=34,p(0|1)=14,
(1)求由B地陽性結(jié)果獲得A地陽性結(jié)果的信息量?
(2)求A、B兩地檢測結(jié)果不確定性?
(3)根據(jù)B地收到的檢測結(jié)果,求A地檢測結(jié)果仍然剩余的不確定性?
問題分析:
a)首先讓學(xué)生分析待求解問題的數(shù)學(xué)描述,分別計(jì)算的是
I(x1;y1),H(XY),H(X|Y)
b)這是典型的信息傳輸問題,信道輸入為A地值,輸出為B地收到的結(jié)果,如圖1所示。
解:經(jīng)過分析,已知A地的先驗(yàn)概率p(0)=14,p(1)=34,計(jì)算條件熵與聯(lián)合熵,需要先確定聯(lián)合概率和后驗(yàn)概率。已知的條件概率矩陣
PY|X=p(yj|xi)2×2=3/41/41/43/4
由p(xy)=p(x)p(y|x),可以得到聯(lián)合概率矩陣
PXY=p(xiyj)2×2=34×1414×1414×3434×34=316116316916
后驗(yàn)概率矩陣
PX|Y=p(xiyj)p(yj)2×2=1211012910
(1)計(jì)算的是由Y=y1獲得關(guān)于X=x1的互信息量,即
I(x1;y1)=logp(x1|y1)p(x1)=log9/103/4=0.263bit
(2)計(jì)算XY的聯(lián)合熵為
H(XY)=-∑ni=1∑mj=1p(xiyj)logp(xiyj)=-316log316×2+116log116+916log916=1.6626bit
(3)計(jì)算Y已知時(shí),X的條件熵
H(X|Y)=-∑ni=1∑mj=1p(xiyj)logp(xi|yj)=-316log12×2+116log110+916log910=0.6681bit
或者先計(jì)算H(Y),然后利用熵的性質(zhì),計(jì)算條件熵
H(Y)=-∑1j=0p(yj)logp(yj)=
-38log38+58log58=0.9544bit
H(X|Y)=H(XY)-H(Y)=1.6626-0.9544=0.6681bit
1.4課程思政的設(shè)計(jì)
在信息熵的理論教學(xué)過程中,利用信息熵給出了核酸混合檢測技術(shù)的理論基礎(chǔ),并且給出了最少檢測次數(shù)的理論極限值,利用二進(jìn)制編碼(信源編碼)方法給出了具體實(shí)現(xiàn)的途徑,從該案例可以看出,信息論知識對生活實(shí)踐中的實(shí)際問題的解決具有非常重要的指導(dǎo)意義,進(jìn)而激發(fā)學(xué)生對信息論強(qiáng)烈的學(xué)習(xí)興趣。
傳輸核酸檢測結(jié)果的典型例題可以作為一個(gè)簡單的含干擾的通信系統(tǒng),準(zhǔn)確說明了各種熵的計(jì)算依賴于信息傳輸過程中概率的分布。傳輸錯(cuò)誤的后果(隔離、封城),使學(xué)生更好地體會通信系統(tǒng)的本質(zhì),信源編碼能夠提高系統(tǒng)傳輸?shù)男?,僅僅提高系統(tǒng)的效率,并不能提高通信的效率。還需要利用信道編碼能提升通信系統(tǒng)的可靠性,降低信息傳輸?shù)腻e(cuò)誤率。培養(yǎng)學(xué)生的系統(tǒng)思維和“大局意識”。
2結(jié)論
貫穿課程理論知識的疫情防控案例和典型例題的構(gòu)建,從“核酸混合檢測”,要消除新冠病毒攜帶者的不確定性(即確定病毒攜帶者),需要獲取的信息量出發(fā),引出主要理論內(nèi)的講授。
(a)有機(jī)融合疫情防控課程思政點(diǎn)的理論教學(xué),將抽象的理論問題學(xué)習(xí)具象化、生動(dòng)化,將脫離實(shí)際的熵的計(jì)算,融入國情、民情,使學(xué)生由單純的知識學(xué)習(xí)變?yōu)閱栴}的解決者,將跟隨式學(xué)習(xí)變?yōu)橹鲃?dòng)式學(xué)習(xí),降低了理論學(xué)習(xí)的枯燥性,提升了學(xué)習(xí)專業(yè)的興趣。
(b)案例及例題的設(shè)計(jì),充分體現(xiàn)了理論對實(shí)踐的指導(dǎo)意義;樹立認(rèn)真學(xué)習(xí)的信心。
參考文獻(xiàn)
[1]高德毅,宗愛東.從思政課程到課程思政:從戰(zhàn)略高度構(gòu)建高校思想政治教育課程體系[J].中國高等教育,2017,(1):4346.
[2]周蔭清.信息論基礎(chǔ)(第5版)[M].北京航空航天大學(xué)出版社,2020.
[3]朱春華.信息論編碼技術(shù)(MATLAB實(shí)現(xiàn)),清華大學(xué)出版社,2020.
[4]董宏杰,張俊梅等.新型冠狀病毒混合樣品監(jiān)測研究[J].山東大學(xué)學(xué)報(bào)(醫(yī)學(xué)版),2021,59(4):15.
[5]孫兵,李建楠等.平均互信息量的案例是教學(xué)方法研究[J].電氣電子教學(xué)學(xué)報(bào),2022,44(4):7881.
[6]新冠病毒核酸10合1混采檢測技術(shù)規(guī)范[J].中國病毒病雜志,2020,10(5):330332.