王雨芹
(北京師范大學(xué)物理學(xué)系 北京市 100875)
能源利用與環(huán)境保護(hù)已然成為我國和國際社會關(guān)注的焦點(diǎn)。2020年我國首次提出:“中國將提高國家自主貢獻(xiàn)力度,采取更加有力的政策和措施,二氧化碳排放力爭于2030年前達(dá)到峰值,努力爭取2060年前實(shí)現(xiàn)碳中和。”要實(shí)現(xiàn)這一目標(biāo)則需要加快我國能源的轉(zhuǎn)型,解決好開發(fā)利用非化石能源這一關(guān)鍵問題。在此背景下,核能無疑會得到廣泛的利用,如何安全利用核能,如何做好輻射防護(hù),突破輻射防護(hù)的困境也會成為熱門研究方向。而現(xiàn)代人工智能計(jì)算方法的發(fā)展給輻射防護(hù)的困境帶來了新的突破,其中遺傳算法更是眾多算法中的佼佼者。
遺傳算法(GA)是一種基于自然界遺傳法則和適者生存規(guī)律而產(chǎn)生的算法,這一術(shù)語首次出現(xiàn)于1967年J.Holland教授的學(xué)生的博士論文中,1975年J. Holland教授出版了專著《自然系統(tǒng)和人工系統(tǒng)的適配》,系統(tǒng)闡述了遺傳算法的基本理論和方法。經(jīng)過幾十年的發(fā)展,遺傳算法憑借著其優(yōu)點(diǎn)被廣泛應(yīng)用于自動控制、生產(chǎn)計(jì)劃、圖像處理等需要處理多目標(biāo)優(yōu)化問題的領(lǐng)域。而在輻射防護(hù)領(lǐng)域,遺傳算法也在中子解譜、輻射屏蔽設(shè)計(jì)、放射治療、強(qiáng)輻射場下人員工作安排等輻射防護(hù)工作領(lǐng)域中有著廣泛的應(yīng)用。
遺傳算法的靈感來自于“自然選擇,適者生存”的自然進(jìn)化原則,是一個從種群的初始解決方案開始搜索,通過有選擇地變化生成更優(yōu)良的子代,最終滿足目標(biāo)的算法。群體中的每個個體,即一個可行解,被稱為染色體,在循環(huán)迭代過程中染色體的不斷更新稱為遺傳。而遺傳算法主要分為篩選父本、交叉、變異幾個階段。染色體是否更滿足要求通常通過適應(yīng)性來評估,在算法中表現(xiàn)為適應(yīng)度函數(shù)值。根據(jù)適合度函數(shù)值的大小,從當(dāng)前所有染色體(父代和后代)中選擇一定比例的個體作為下一代群體,然后再次進(jìn)入循環(huán),不斷迭代計(jì)算直到收斂到全局最佳染色體,即得到解決問題需要的解。
遺傳算法的流程圖如圖1所示,其主要組成部分包括編碼方式,適應(yīng)度函數(shù),遺傳操作和終止條件。在考慮輻射屏蔽等多目標(biāo)優(yōu)化問題時(shí),常常補(bǔ)充罰函數(shù)來約束可行解。
圖1:遺傳算法流程圖
1.2.1 編碼方式
遺傳算法通常根據(jù)問題本身進(jìn)行編碼,通俗而言就是根據(jù)實(shí)際問題的需求選擇染色體的形式。常用的編碼方法包括實(shí)數(shù)編碼,即組成染色體的為一串實(shí)數(shù);二進(jìn)制編碼,染色體為由0和1組成的數(shù)組;整數(shù)編碼,即組成染色體的為一串整數(shù)和符號編碼,即染色體由一些具有代碼意義的符號組成。
1.2.2 適應(yīng)度函數(shù)
適應(yīng)度函數(shù),即為目標(biāo)函數(shù),一般用F(i, j)表示,其中i表示該個體處于第i代,j表示個體為該代的第j個染色體,其中每代個體總數(shù)一般相同,一般用n表示。適應(yīng)度函數(shù)是對個體與其適應(yīng)度之間的對應(yīng)關(guān)系的描述,也是遺傳算法解決問題的關(guān)鍵。一般而言,適應(yīng)度函數(shù)要滿足其值越大,其所代表的個體在解決該問題上表現(xiàn)更佳。
1.2.3 遺傳操作
基本的遺傳操作包括:選擇、交叉、變異。選擇操作即對個體進(jìn)行適應(yīng)度評估,并根據(jù)自然選擇的規(guī)律適應(yīng)度高的個體基因被保留的概率高,適應(yīng)度低的個體雖然更容易被淘汰,但仍有一定概率會被保留。具體的算法表達(dá)即為在選擇用于遺傳的父代時(shí),父代個體被選擇的概率p應(yīng)與F(i, j)成正比。常見的選擇策略原理及其優(yōu)缺點(diǎn)見表1,合適的選擇策略會顯著提升算法的搜索效率和速度。
表1:三種常見選擇策略及其優(yōu)缺點(diǎn)
在自然界生物繁衍的過程中,下一代產(chǎn)生的核心環(huán)節(jié)為兩條染色體通過基因重組形成新的染色體。作為來源于這一自然過程的算法,交叉操作也是遺傳算法的核心環(huán)節(jié)。在算法中即將父代兩條染色體的部分結(jié)構(gòu)加以替換重組而生成新個體的操作。變異操作是用于生成新個體的輔助算法。變異在自然界為染色體上部分基因發(fā)生隨機(jī)變化,這些變化與染色體的其他部分是無關(guān)的。表現(xiàn)在算法中為染色體數(shù)組中的兩個隨機(jī)選擇的元素?cái)?shù)值交換或者其中一個元素的數(shù)值發(fā)生隨機(jī)變化等。和自然界中的變異相似,算法中也會有一個較低的變異概率(一般在0.3左右),只有當(dāng)隨機(jī)出來的概率小于變異概率才會發(fā)生變異。
1.2.4 算法終止條件
算法終止一般指適應(yīng)度函數(shù)值的變化趨于穩(wěn)定或者與已知理論值的誤差極小,也可以是迭代到指定代數(shù)后停止進(jìn)化。
1.2.5 罰函數(shù)
對于多目標(biāo)優(yōu)化問題,其眾多約束條件很難在一個適應(yīng)度函數(shù)中體現(xiàn),故常通過引進(jìn)一個懲罰因子把約束條件連接到適應(yīng)度函數(shù)上,從而將有約束的最優(yōu)化問題轉(zhuǎn)化為無約束條件的問題。合理的罰函數(shù)可以在個體不滿足約束條件時(shí),使適應(yīng)度函數(shù)值偏離預(yù)期,即對個體施行不滿足約束條件的懲罰,離約束條件越遠(yuǎn)懲罰力度越大,偏離就越遠(yuǎn)。
與其他優(yōu)化算法相比,遺傳算法具有以下優(yōu)點(diǎn):
(1)由于遺傳算法的初始種群一般為隨機(jī)生成的多條染色體,故遺傳算法的搜索是從多個初始點(diǎn)而不是單個初始點(diǎn)開始的,因此遺傳算法前期收斂速度較快,能夠較快找到一些較優(yōu)的區(qū)域;
(2)由于一條染色體上有多個“基因”,故遺傳算法具有天生的并行性,可以在對群體進(jìn)行運(yùn)算的同時(shí)對個體中的多個“基因”進(jìn)行探索,也就是進(jìn)行多目標(biāo)探索;
(3)遺傳算法具有良好的尋找全局最優(yōu)解的能力。由于變異、交叉操作具有隨機(jī)性,故遺傳算法不會過于依賴探索環(huán)境,可以大概率在非連續(xù),多峰和嘈雜的環(huán)境中收斂到滿意的解。
但是遺傳算法也有其缺點(diǎn),最大的缺點(diǎn)為過早收斂,即“早熟”。研究表明遺傳算法可以很快達(dá)到最優(yōu)解的90%左右,即局部最優(yōu)解,但要找到真正的最優(yōu)解則需要花費(fèi)很長時(shí)間。這很明顯是由于面對已經(jīng)很好的染色體,交叉和變異都很難形成更優(yōu)的染色體了,即遺傳算法后期探索不足。除此之外,遺傳算法還存在運(yùn)行效率低,穩(wěn)定性差等缺點(diǎn)。
輻射屏蔽設(shè)計(jì)是一個典型的受輻射防護(hù)代價(jià)(防護(hù)層厚度,所用材料等)、輻射危害代價(jià)(輻射劑量)以及其他目標(biāo)約束的多目標(biāo)組合優(yōu)化問題。一個優(yōu)秀的輻射屏蔽方案可以應(yīng)用于醫(yī)療器材防護(hù),軍用潛艇核動力和核電站安全等方面,在醫(yī)學(xué),軍事,能源,航空航天等領(lǐng)域都能有所建樹。但輻射屏蔽卻是一個難題,其難點(diǎn)在于需要滿足的各個目標(biāo)之間往往是相互沖突的,某設(shè)計(jì)目標(biāo)的改善可能會引起其他目標(biāo)的劣化。例如,輻射防護(hù)效果變好或危險(xiǎn)系數(shù)下降通常會導(dǎo)致用于輻射防護(hù)的成本上升……由此可以發(fā)現(xiàn),對于輻射屏蔽問題,多個設(shè)計(jì)目標(biāo)同時(shí)達(dá)到最優(yōu)是很難甚至不可能實(shí)現(xiàn)的,故我們需要利用一些方法需找到各個目標(biāo)都達(dá)到較優(yōu)但綜合起來最優(yōu)的輻射屏蔽方案。
而利用遺傳算法就可以通過設(shè)置合適的適應(yīng)度函數(shù),平衡各個因素的權(quán)重,進(jìn)而在較短時(shí)間內(nèi)得到較優(yōu)的輻射屏蔽設(shè)計(jì)方案。其基本原理為設(shè)置一組染色體代表不同的設(shè)計(jì)方案,一條染色體中不同的基因代表一個設(shè)計(jì)方案中不同參數(shù)的具體設(shè)置,例如屏蔽層厚度,屏蔽材料,受輻射劑量等。設(shè)置綜合考慮了輻射防護(hù)代價(jià)和輻射危害代價(jià)的適應(yīng)度函數(shù),使代價(jià)大小與適應(yīng)度函數(shù)值滿足一定比例關(guān)系。隨后通過“交叉”,“變異”的遺傳操作和適應(yīng)度函數(shù)的篩選即可得到各個目標(biāo)都達(dá)到較優(yōu)且綜合最優(yōu)的輻射屏蔽方案。
目前,已經(jīng)有不少研究致力于利用遺傳算法得到更優(yōu)的輻射屏蔽設(shè)計(jì)方案:越南的Pham Hong Thin,韓國的Byeong Soo Kima和Joo Hyun Moonb等人,利用遺傳算法進(jìn)行了輻射屏蔽問題的設(shè)計(jì)優(yōu)化研究并取得了令人滿意的結(jié)果。西安交通大學(xué)的胡華四等人用遺傳算法建立了屏蔽材料的優(yōu)化設(shè)計(jì)方案,并應(yīng)用該方法對4種輻射屏蔽材料進(jìn)行了檢驗(yàn),還探討了該材料優(yōu)化方案進(jìn)一步應(yīng)用于航空航天器和聚變中子、γ混合輻射場的輻射屏蔽設(shè)計(jì)中的可能性。清華大學(xué)的熊華等人引入了遺傳算法建立了組合屏蔽自動設(shè)計(jì)方法。南華大學(xué)的廖伶元等人利用遺傳算法對衰減公式進(jìn)行了優(yōu)化計(jì)算,得出了屏蔽材料組分含量的最佳配比,并發(fā)現(xiàn)了遺傳算法計(jì)算得出的配比材料屏蔽效果最好……以上種種研究都表明了遺傳算法在輻射屏蔽設(shè)計(jì)優(yōu)化中有著重要應(yīng)用。
中子劑量的測量與估算仍是輻射防護(hù)領(lǐng)域的一個難題。目前測量放射性工作場所中子能譜的主要方法為多球中子譜儀。多球譜儀用于測量不同尺寸聚乙烯球內(nèi)探測器的計(jì)數(shù),將計(jì)數(shù)和預(yù)先建立的探測器響應(yīng)矩陣進(jìn)行反卷積解譜運(yùn)算,從而獲得輻射場中子能譜信息,即根據(jù)測量結(jié)果反解得到中子能譜信息,如圖2所示。
圖2:中子能譜解譜原理示意圖
圖2中(cc……c)為各探頭的計(jì)數(shù),(??……?)為代表中子通量的矩陣(即中子譜),中間m×n的矩陣為探頭響應(yīng)矩陣。編程思路為先隨機(jī)生成(??……?)矩陣,與響應(yīng)矩陣作乘法后得到計(jì)算值(cc……c),不斷篩選優(yōu)化(??……?)矩陣后使得|c/c|≈1即可。
但在某些情況下需要對熱中子到數(shù)百M(fèi)eV范圍內(nèi)的中子譜進(jìn)行解譜,工作難度很大。很多中子解譜程序如SAND-II、LOUHI-83等都需要在進(jìn)行解譜過程前給出預(yù)置譜,解譜結(jié)果的精確度和準(zhǔn)確度首先依賴于預(yù)置譜的給出。德國開發(fā)的ANDI-03程序則利用遺傳算法避免了預(yù)置譜的給出過程。最終在不給出預(yù)置譜的情況下利用遺傳算法對中子進(jìn)行了解譜并與另外一個中子解譜程序SAND-II的結(jié)果進(jìn)行了比較。結(jié)果表明在同一位置處在允許的誤差范圍內(nèi)兩者的結(jié)果是一致的,即可以利用遺傳算法進(jìn)行準(zhǔn)確的中子解譜。
遺傳算法還應(yīng)用在輻射防護(hù)的其它領(lǐng)域,如:優(yōu)化放射治療射野參數(shù),在提高對腫瘤控制率的同時(shí)保護(hù)正常組織受到最小的放射損傷;優(yōu)化在強(qiáng)輻射場下人員的工作安排從而達(dá)到降低輻射劑量的目的;實(shí)現(xiàn)了放射性藥物內(nèi)照射生物動力學(xué)數(shù)據(jù)分析中的數(shù)據(jù)擬合等。
基于本人在研究燃燒場二維分布重建時(shí)創(chuàng)造性地發(fā)現(xiàn)了結(jié)合模擬退火算法的遺傳算法能夠有效地避免遺傳算法最大的缺點(diǎn)——過早收斂。且在輻射防護(hù)領(lǐng)域也有很多將遺傳算法與其他算法和模型相結(jié)合的先例,例如混沌算法,人工神經(jīng)網(wǎng)絡(luò)模型等。故接下來我將簡單分析遺傳模擬退火算法應(yīng)用于輻射防護(hù)問題的可能性和優(yōu)越性。
模擬退火算法是基于物理中固體物質(zhì)的退火過程與一般組合優(yōu)化問題之間的相似性而誕生的算法。其從某一較高初溫出發(fā),伴隨溫度參數(shù)的不斷下降,結(jié)合概率突跳特性在解空間中隨機(jī)尋找目標(biāo)函數(shù)的全局最優(yōu)解,即在陷入局部較優(yōu)解時(shí)能概率性地跳出并最終趨于全局最優(yōu)。
其基本編程思路為設(shè)置一個n維變量的“粒子”(xx……x),不同的維度代表不同的變量,在搜索空間內(nèi)隨機(jī)生成初始粒子。由于搜索空間較大,給粒子加擾動前后其適應(yīng)度函數(shù)值可能發(fā)生很大的變化,因此需要設(shè)置一個較高的初溫保證“粒子”具有足夠大的搜索范圍。設(shè)置主程序控制溫度下降,一般采取指數(shù)降溫的方式,在每個溫度下粒子進(jìn)行一定次數(shù)的探索,即(xx……x)發(fā)生變化。由于模擬退火算法僅有一個解在空間中進(jìn)行探索,因此在搜索前期,應(yīng)采用較大范圍的搜索,即探索步長較大。可以令“粒子”在其與區(qū)域邊界距離范圍內(nèi)隨機(jī)移動,以搜索適應(yīng)度值較低的區(qū)域。而到了探索后期則需要進(jìn)行局部探索,即探索步長顯著減小。探索后期容易出現(xiàn)連續(xù)降溫但當(dāng)前最優(yōu)解不發(fā)生變化的情況,此時(shí)需要進(jìn)行回溫操作,即令溫度升高,使“粒子”的與探索能力再次變強(qiáng)。
由編程思路可以發(fā)現(xiàn)模擬退火的優(yōu)點(diǎn)是既能夠大面積探索又能精細(xì)搜索,且不容易陷入局部較優(yōu)解中。缺點(diǎn)是只有一個解在偌大的空間中探索,對于自變量維數(shù)多的問題隨機(jī)游走達(dá)到最優(yōu)解的概率低。
結(jié)合了模擬退火算法的遺傳模擬退火算法的流程圖如圖3所示。其主要思路是利用遺傳算法的大規(guī)模種群搜索到適應(yīng)度函數(shù)值較優(yōu)的區(qū)域,當(dāng)適應(yīng)度函數(shù)值達(dá)到一定值后再間隔一定的遺傳代數(shù)對每個個體進(jìn)行一次模擬退火操作,這一步的主要目的是使得每個解向著自己領(lǐng)域內(nèi)的更優(yōu)位置移動,盡管它不一定能直接導(dǎo)致全局最優(yōu)的更新,但能讓每個粒子盡量更新到自己領(lǐng)域內(nèi)的局部最優(yōu),推動全局最后在遺傳過程中更新。
圖3:遺傳模擬退火算法流程圖
在研究燃燒場分布重建這一領(lǐng)域上,模擬遺傳退火算法在重建精度,重建速度和穩(wěn)定性各個方面都優(yōu)于遺傳算法。而在輻射防護(hù)領(lǐng)域,中子能譜解譜與燃燒場分布重建的原理極為相似,都是需要通過多個計(jì)數(shù)器的測量結(jié)果反演出實(shí)際的能量或者物質(zhì)分布,故將遺傳模擬退火算法應(yīng)用于中子解譜中也應(yīng)該能夠更快更準(zhǔn)確地得到更穩(wěn)定的中子能譜信息。對于輻射屏蔽方案優(yōu)化問題,由于模擬退火具有概率突跳特性,即它可以強(qiáng)制性地讓算法去往不同空間進(jìn)行探索,故模擬遺傳退火算法能夠很好地解決遺傳算法收斂較快,陷入局部較優(yōu)解的缺點(diǎn)。即能夠更充分地探索解空間,得到更優(yōu)秀的輻射屏蔽設(shè)計(jì)方案??偠灾c模擬退火算法結(jié)合是從算法原理上解決了遺傳算法的缺點(diǎn),理論上會給所有應(yīng)用遺傳算法的領(lǐng)域,包括輻射防護(hù),帶來更高效更準(zhǔn)確的研究工具。
隨著環(huán)境和能源問題的日益嚴(yán)重,如何把握好核能這一雙刃劍,解決建立輻射防護(hù)問題,安全和平地利用核能是迫在眉睫的。而隨著人工智能和計(jì)算機(jī)的發(fā)展,遺傳算法也發(fā)展迅速,并能夠很好地解決輻射防護(hù)目前面對的問題?;诖?,本文總結(jié)了遺傳算法在輻射防護(hù)領(lǐng)域中的主要應(yīng)用,并類比燃燒場重建分析了遺傳模擬退火算法應(yīng)用于輻射防護(hù)領(lǐng)域的可能性和優(yōu)越性。雖然現(xiàn)在輻射防護(hù)領(lǐng)域應(yīng)用遺傳算法的發(fā)展主流方向結(jié)合蒙德卡羅方法,神經(jīng)網(wǎng)絡(luò)模型和遺傳算法的混合算法。但我相信遺傳模擬退火算法的優(yōu)越性也可以為輻射防護(hù)的研究提供一條新的思路和更廣闊的發(fā)展前景。