石向成,趙志堅,鞏金龍
(1天津大學(xué)化工學(xué)院,綠色合成與轉(zhuǎn)化教育部重點實驗室,天津300072;2天津化學(xué)化工協(xié)同創(chuàng)新中心,天津300072;3天津大學(xué)-新加坡國立大學(xué)福州聯(lián)合學(xué)院,福建福州350207)
物質(zhì)通常以能量最低的狀態(tài)存在,即基態(tài)結(jié)構(gòu)(global minimum structure),其能量處于勢能面上的全局最小值點。對于催化體系而言,了解基態(tài)結(jié)構(gòu)對于預(yù)測催化劑結(jié)構(gòu)(如金屬團(tuán)簇體系)[1]、分析吸附特性(如吸附位點[2]、吸附結(jié)構(gòu)[3]及表面生長過程[4])、研究多相催化反應(yīng)機理[5-7]、認(rèn)識反應(yīng)物與催化劑的相互作用關(guān)系[8]、構(gòu)建反應(yīng)路徑[9]、解釋實驗現(xiàn)象[10]等研究至關(guān)重要,并為催化劑的理性設(shè)計提供基礎(chǔ)?;鶓B(tài)結(jié)構(gòu)是反應(yīng)中最可能生成的結(jié)構(gòu)[10],但由于表征技術(shù)受限,通過實驗觀測基態(tài)結(jié)構(gòu)的代價非常昂貴,所以理論模擬方法常被用以預(yù)測催化體系的基態(tài)結(jié)構(gòu)。勢能面具有高度復(fù)雜性和多維度性,并且隨著原子數(shù)的增加,勢能面上極小值點的數(shù)量以指數(shù)方式增加[11]。在現(xiàn)有計算條件下,通過遍歷勢能面上的所有結(jié)構(gòu)來搜索基態(tài)結(jié)構(gòu),幾乎不可能。所以,需要借助全局優(yōu)化方法,實現(xiàn)在合理的計算時間內(nèi)高效地搜尋催化體系勢能面上的基態(tài)結(jié)構(gòu)。
遺傳算法(genetic algorithm)是一種基于自然選擇機制的全局優(yōu)化算法。它通過交叉、變異和選擇等操作,模擬了自然淘汰進(jìn)化過程,來搜索勢能面上的基態(tài)結(jié)構(gòu)。與其他基于單一的初始結(jié)構(gòu)進(jìn)行演化的算法(如盆地跳躍法、模擬退火法等)相比,遺傳算法作為無偏(unbiased)優(yōu)化算法,其優(yōu)化效率及結(jié)果不受初始結(jié)構(gòu)的影響[12],具有很強的全局搜索能力。遺傳算法尤其適合對體系的基態(tài)結(jié)構(gòu)沒有先驗認(rèn)知的優(yōu)化問題。早在1993年,遺傳算法就被成功用于Si4團(tuán)簇的全局結(jié)構(gòu)優(yōu)化[13]。隨后,Deaven等[14]引入了幾何剪貼法(cut-and-splice pairing),將交叉和變異等結(jié)構(gòu)操作在實空間中得到了實現(xiàn),并找到了C60團(tuán)簇的基態(tài)結(jié)構(gòu),而模擬退火法并不能解決這一問題。在催化領(lǐng)域中,遺傳算法已被應(yīng)用于各種復(fù)雜的全局結(jié)構(gòu)優(yōu)化問題中,例如團(tuán)簇體系[1,10,15]、表面吸附模型[16]、過渡態(tài)結(jié)構(gòu)[17]、反應(yīng)路徑構(gòu)建[6,18]等。近年來,通過引入并行計算、聯(lián)用多種優(yōu)化技術(shù)等方法而提出的改進(jìn)遺傳算法框架,降低了尋找基態(tài)結(jié)構(gòu)所需要的計算成本,并提高了優(yōu)化效果。如Hartke[19]引入“小生態(tài)環(huán)境”(niches)改進(jìn)的遺傳算法,就可以找到標(biāo)準(zhǔn)遺傳算法所不能找到的LJ75團(tuán)簇的基態(tài)結(jié)構(gòu)。而在不斷發(fā)展過程中,一批成熟的、針對特定問題而開發(fā)的遺傳算法程序也被提出、改進(jìn)和應(yīng)用,例如晶體結(jié)構(gòu)預(yù)測程序USPEX[20]、團(tuán)簇體系優(yōu)化程序BPGA[21]等。
在大數(shù)據(jù)時代下,遺傳算法可以無偏地生成個體結(jié)構(gòu)[17],為機器學(xué)習(xí)提供訓(xùn)練數(shù)據(jù),以此來構(gòu)建結(jié)構(gòu)與能量的構(gòu)效關(guān)系,幫助設(shè)計高效催化劑材料[22-23]。而在遺傳算法優(yōu)化過程中,昂貴的能量計算可以被機器學(xué)習(xí)模型所取代,在保證計算精度的前提下,近百倍地提高優(yōu)化性能[24]。未來,遺傳算法將繼續(xù)向并行化(充分利用計算資源)、智能化(使用機器學(xué)習(xí)方法降低不必要的高精度計算次數(shù))、通用化(能處理各類復(fù)雜的體系)的方向發(fā)展,加快優(yōu)化速度,以較少的計算代價獲得基態(tài)結(jié)構(gòu)。
本文主要針對遺傳算法在催化體系中的全局結(jié)構(gòu)優(yōu)化技術(shù)進(jìn)行了討論,首先介紹了用于全局結(jié)構(gòu)優(yōu)化的遺傳算法的基本程序框架,并綜述了近年來為提高結(jié)構(gòu)優(yōu)化效率而發(fā)展出的改進(jìn)框架,結(jié)合了相關(guān)應(yīng)用實例進(jìn)行說明,為遺傳算法的進(jìn)一步改進(jìn)以及更廣泛的應(yīng)用提供理論指導(dǎo)。但由于篇幅有限,且不同優(yōu)化問題的程序框架差別較大,涉及催化體系中的參數(shù)優(yōu)化問題,如反應(yīng)器設(shè)計、反應(yīng)條件優(yōu)化等,非本文討論重點。
目前在實空間中對催化體系進(jìn)行全局結(jié)構(gòu)優(yōu)化的遺傳算法,基本沿用Deaven 等[14]設(shè)計的框架。除了基于原子坐標(biāo),基因編碼亦可以作為遺傳算子[25],即完全模擬基因遺傳的過程,將待優(yōu)化的信息(如原子坐標(biāo))進(jìn)行編碼(如二進(jìn)制編碼),然后在編碼層面上進(jìn)行交叉、變異,生成子代。但在基因編碼過程中,能量較低的結(jié)構(gòu)特征很容易遭到遺失,并難以在生成子代時得以保留。并且,編碼方式的選擇也會對優(yōu)化效率造成影響[26],選擇不恰當(dāng)?shù)木幋a方式可能會降低優(yōu)化效率[27]。而Deaven 等設(shè)計的遺傳算法框架是基于原子坐標(biāo)進(jìn)行交叉和變異等結(jié)構(gòu)操作,所以能很好地保留低能量的結(jié)構(gòu)特征,并將其從父代傳遞到子代[10]。即便由于體系過于復(fù)雜而難以得到基態(tài)結(jié)構(gòu)時,也可以通過分析優(yōu)化過程中出現(xiàn)的低能量結(jié)構(gòu)特征,得到部分結(jié)論[2]。本文主要介紹在實空間中進(jìn)行結(jié)構(gòu)優(yōu)化的遺傳算法框架。
遺傳算法在優(yōu)化中不依賴于輸入結(jié)構(gòu),其初始種群通常是隨機產(chǎn)生。最簡單的方式是在一定空間區(qū)域內(nèi)隨機位置放置原子來生成初始種群。為了保證結(jié)構(gòu)合理性、減少不必要的計算負(fù)擔(dān),需要對原子間距進(jìn)行限制,防止出現(xiàn)原子分布過于零散或過于緊密的情況。一般以兩原子間的共價鍵長為標(biāo)尺,設(shè)定原子間的最短距離及最長距離。不符合距離要求的結(jié)構(gòu)將會被拒絕。初始種群的個體數(shù)量并沒有嚴(yán)格的限制,但初始種群的數(shù)量越多,結(jié)構(gòu)多樣性越豐富,則越有利于提高遺傳算法的優(yōu)化效率。而每代的個體數(shù)量對優(yōu)化性能同樣有所影響[28]。
基于對基態(tài)結(jié)構(gòu)的先驗認(rèn)知,在初始種群生成時引入限制條件,使個體盡可能生成在最優(yōu)解可能存在的范圍內(nèi),可以提高初始種群的質(zhì)量。例如,對于晶體結(jié)構(gòu)而言,除了原子坐標(biāo),晶格參數(shù)也可以用來描述其結(jié)構(gòu)特征。通過結(jié)合空間群特征,將生成的原子隨機放置在Wyckoff 位置上,并進(jìn)行對稱性操作,生成帶有對稱性的初始種群,能提高初始種群中能量較低結(jié)構(gòu)的比例,減少搜索空間和優(yōu)化參數(shù),提高優(yōu)化效率。如圖1 所示,Lv 等[29]分別以38 和100 個原子Lennard-Jones 團(tuán)簇(LJ38和LJ100)為例進(jìn)行了測試。結(jié)果表明,在引入對稱性限制以后,結(jié)構(gòu)整體的能量分布明顯地向能量較低的區(qū)域進(jìn)行了移動。相似的結(jié)果也在Lyakhov 等[30]和Wang等[31]的工作中得到報道。除了對對稱性進(jìn)行限制,Zhai 等[32]則從鍵長入手,發(fā)現(xiàn)基態(tài)結(jié)構(gòu)的鍵長基本服從一個均值接近共價鍵長的正態(tài)分布。當(dāng)種群初始化時,可以要求個體的鍵長服從正態(tài)分布,使生成的結(jié)構(gòu)更加合理。
圖1 包含和不包含對稱性時隨機產(chǎn)生的LJ38(a)和LJ100(b)團(tuán)簇的能量分布(能量值是相對基態(tài)結(jié)構(gòu)的相對值)[29]Fig.1 Energetic distributions of randomly generated structures for LJ38(a)and LJ100(b)clusters with and without symmetry(energies are shown relative to the global minimum)[29]
所有新生成的結(jié)構(gòu)都需要進(jìn)行局部優(yōu)化[30]。根據(jù)優(yōu)化問題的不同,可以使用經(jīng)驗勢函數(shù)、密度泛函或量子Monte Carlo 等方法進(jìn)行優(yōu)化。但作為群體搜索方法,遺傳算法需要迭代多次,對大量候選結(jié)構(gòu)進(jìn)行能量評估[33],才能發(fā)現(xiàn)基態(tài)結(jié)構(gòu),計算量較大。所以對于原子數(shù)較多的復(fù)雜體系,很難使用精度較高的密度泛函方法進(jìn)行,通常使用經(jīng)驗勢函數(shù)進(jìn)行[34],如Lennard-Jones勢函數(shù)、Gupta勢函數(shù)等。
個體的適應(yīng)度(fitness)與優(yōu)化問題中的目標(biāo)函數(shù)值相關(guān)。不同優(yōu)化問題所選取的目標(biāo)函數(shù)值也不同。如果以找到勢能面上的基態(tài)結(jié)構(gòu)為優(yōu)化目標(biāo),通常取熱力學(xué)數(shù)值作為目標(biāo)函數(shù)值。
對于一個優(yōu)化問題而言,如果其目標(biāo)函數(shù)值的范圍已知,可以將目標(biāo)函數(shù)值作為絕對適應(yīng)度(absolute fitness)進(jìn)行衡量。但對大多數(shù)結(jié)構(gòu)優(yōu)化問題而言,熱力學(xué)數(shù)值的范圍并不可知,所以應(yīng)采取動態(tài)適應(yīng)度方法,即個體的適應(yīng)度值取決于其所在種群中最優(yōu)個體和最差個體的目標(biāo)函數(shù)值,并僅在同一代中衡量不同個體結(jié)構(gòu)的適應(yīng)度[1]。根據(jù)優(yōu)化問題的不同,適應(yīng)度的計算公式有所不同,一個基于能量的常用公式如式(1)所示[35]:
其中,fi和Ei分別為每代中每個個體的適應(yīng)度和能量,Emax和Emin分別為此代中所有結(jié)構(gòu)的最高能量和最低能量。
優(yōu)化問題也可以有多個目標(biāo)函數(shù)值,例如Maldonis 等[36]基于遺傳算法,開發(fā)了用于構(gòu)建與實驗數(shù)據(jù)相吻合的復(fù)雜納米體系的多目標(biāo)全局優(yōu)化算法,在優(yōu)化過程中,不僅要求結(jié)構(gòu)的能量趨于穩(wěn)定,亦要求結(jié)構(gòu)的模擬電鏡譜圖與實驗數(shù)據(jù)吻合良好。但是,這類多目標(biāo)優(yōu)化問題通常需要在多目標(biāo)下選取折中方案。正如帕累托最優(yōu)理論表明,提升一個目標(biāo)函數(shù)值,必然損害另一個目標(biāo)的達(dá)成[25]。可以使用多目標(biāo)遺傳算法對這類問題進(jìn)行優(yōu)化,如非支配排序遺傳算法Ⅱ(NSGA-Ⅱ)[37]和強度帕累托進(jìn)化算法2(SPEA2)[26]。
自然選擇模擬了生物進(jìn)化中的“適者生存”,按照適應(yīng)度選擇父代,進(jìn)行交叉生成子代。常見的選擇方法[38]有輪盤賭選擇法(roulette wheel selection)和錦標(biāo)賽選擇法(tournament selection),其核心思路均是根據(jù)每代個體的適應(yīng)度,按概率選出父代,適應(yīng)度越高,則被選中的概率也越大。如果直接選擇適應(yīng)度靠前的若干個體作為下一代,會損害優(yōu)化過程中的結(jié)構(gòu)多樣性,最終導(dǎo)致“早熟”現(xiàn)象,即優(yōu)化過程過早陷入局部極值[39]。
交叉(crossover)是根據(jù)父代的結(jié)構(gòu)信息來構(gòu)造新的子代結(jié)構(gòu)的過程。交叉使優(yōu)良基因得以從父代遺傳至子代,是遺傳算法中最重要的一步[16]。目前使用的交叉方法思路基本沿用Deaven 等的幾何剪貼法,并在不同優(yōu)化問題中有不同的形式。其基本思路如圖2(a)所示,通過劃定一個空間面,將父代的結(jié)構(gòu)分為兩部分,然后分別取兩個父代的部分結(jié)構(gòu),并確保前后原子數(shù)目、化學(xué)計量比保持一致且原子間距合理,組成一個新的子代。另外,切割面也可以為非平面,圖2(b)的例子展示了使用環(huán)切面進(jìn)行交叉,形成新子代的過程[33]。
一般選取兩個父代進(jìn)行交叉,但也有使用單個或多個父代進(jìn)行交叉的報道。2000 年,Rata 等[40]提出了單母體遺傳算法,并用于帶不同電荷的Si13到Si23團(tuán)簇的全局結(jié)構(gòu)優(yōu)化,成功得到比之前報道能量更低的團(tuán)簇結(jié)構(gòu)。單母體遺傳算法只需剪切和組合運算,不需要考慮團(tuán)簇中原子的個數(shù)與比例。J?ger 等[41]則在幾何剪貼法的基礎(chǔ)上,發(fā)展出了三母體的交叉算子,用以進(jìn)一步增加種群中的結(jié)構(gòu)多樣性。
圖2 父代通過幾何剪貼法交叉形成新子代的過程Fig.2 The cut-and-splice pairing used on the crossover process for the generation of new structure
但交叉僅是將已有的基因材料混合,并未產(chǎn)生新的基因材料。單純依賴交叉生成新結(jié)構(gòu),不利于結(jié)構(gòu)多樣性。所以,需要引入變異(mutation)機制,對現(xiàn)有結(jié)構(gòu)進(jìn)行調(diào)整,產(chǎn)生新結(jié)構(gòu),引入新的基因材料。一般按比例選取部分交叉后的結(jié)構(gòu)進(jìn)行變異。常見的變異操作有移動(rattle,選取部分原子發(fā)生隨機位移)、置換(permutation,選取部分不同類型的原子交換位置)、對映(mirror,劃定一個過質(zhì)心的空間面,選取某一邊的所有原子旋轉(zhuǎn)180度)等[16]。
另外,為保證結(jié)構(gòu)多樣性,需要對新生成的結(jié)構(gòu)進(jìn)行相似性檢測,避免生成與現(xiàn)有個體相似的結(jié)構(gòu)[42]。通常是通過基于原子間距離的辦法來判斷結(jié)構(gòu)的相似性[16]。Wang 等[31]通過構(gòu)建成鍵特征矩陣,涵括了鍵長、鍵角和成鍵種類,能夠更全面反映結(jié)構(gòu)的所有成鍵信息,避免相似結(jié)構(gòu)的生成。
遺傳算法的收斂標(biāo)準(zhǔn)依照實際優(yōu)化問題以及所使用的遺傳算法框架的不同而各有不同。常見的收斂標(biāo)準(zhǔn)有[43]:(1)設(shè)定執(zhí)行優(yōu)化的代數(shù),迭代達(dá)到指定代數(shù)后停止優(yōu)化;(2)設(shè)定最優(yōu)結(jié)構(gòu)的期待能量值,當(dāng)出現(xiàn)某一結(jié)構(gòu)的能量達(dá)到預(yù)值時,停止優(yōu)化;(3)當(dāng)最優(yōu)結(jié)構(gòu)的能量在多次迭代后基本不變或變化不大,停止優(yōu)化。
在Deaven 等[14]所設(shè)計的遺傳算法框架的基礎(chǔ)上,為了提升優(yōu)化效率,近年來亦有許多改進(jìn)的遺傳算法框架的報道。主要方式包括引入并行計算、機器學(xué)習(xí)等技術(shù),充分利用計算資源,降低不必要的高精度計算次數(shù),在更短的時間以更高的效率找到基態(tài)結(jié)構(gòu)。
遺傳算法通常是基于逐代演化。每代生成數(shù)個結(jié)構(gòu)后,再進(jìn)入下一代。但由于不同結(jié)構(gòu)的生成、計算時間不同,每代的運算時間總受限于其中運算速度最慢的結(jié)構(gòu)。所以,有必要引入并行計算,充分利用計算資源,加快運行速度。目前在遺傳算法中,主要的并行方式有兩種[43]:(1)并行生成子代結(jié)構(gòu)及進(jìn)行能量計算;(2)并行運行多個相互獨立的遺傳算法優(yōu)化。
一個典型的并行式遺傳算法的例子是Shayeghi等[21]提出的基于池的遺傳算法(Pool-GA)框架。它淡化了“代”的概念。如圖3(a)所示,該框架設(shè)計了一個公用的結(jié)構(gòu)池,并利用靈活的并行計算,同時運行多個遺傳算法優(yōu)化,并將得到的子代結(jié)構(gòu)實時共享在池內(nèi),實現(xiàn)了更高的運算效率。如圖3(b)所示,基于池的遺傳算法比基于代的遺傳算法能更充分地利用多核處理器資源,在相同時間內(nèi)能處理更多的結(jié)構(gòu)。該框架后來被進(jìn)一步發(fā)展成了伯明翰并行遺傳算法(Birmingham parallel genetic algorithm),并被應(yīng)用于不同大小及不同計量比的Ir團(tuán)簇[44]、Au-Pd 納米合金[45]、Ru-Pt 團(tuán)簇[46]、MgO(100)表面吸附的Au-Ir[3]以及Au-Pd團(tuán)簇[47]的全局優(yōu)化。
2003年時,Habershon 等[48]提出了用于全局結(jié)構(gòu)優(yōu)化的多種群遺傳算法框架,并用于復(fù)雜體系的結(jié)構(gòu)優(yōu)化。種群即代表一個獨立運行的遺傳算法優(yōu)化。與標(biāo)準(zhǔn)框架相比,多種群框架除了并行執(zhí)行多個優(yōu)化任務(wù),同時也需要考慮如何在種群間交換結(jié)構(gòu)。常用的交換方式為移民(migrate),即將某個種群的結(jié)構(gòu)移至其他種群。Hajinazar 等[33]將多種群遺傳算法用于優(yōu)化Cu-Pd-Ag 團(tuán)簇,不同大小的團(tuán)簇獨立運行一個遺傳算法。在迭代一定次數(shù)后,選擇種群內(nèi)適應(yīng)度高的團(tuán)簇結(jié)構(gòu),通過添加/刪除表面原子改變團(tuán)簇大小,并移民至其他并行運行的遺傳算法優(yōu)化中。交換到大小不同的其他種群中。這樣的策略提高了優(yōu)化過程中的多樣性,避免過早收斂至局部極值。相似的多種群策略也被Fan 等[49]用以優(yōu)化Fe 團(tuán)簇和Cr 團(tuán)簇的結(jié)構(gòu)。此處并行運行的遺傳算法不僅相互獨立,而且采取不同的變異策略,大大增加了優(yōu)化過程中的結(jié)構(gòu)多樣性。
圖3 基于池的遺傳算法框架及其性能測試[21]Fig.3 The framework of pool-GA and its performance test results
2.2.1 使用機器學(xué)習(xí)加速遺傳算法 在遺傳算法進(jìn)行全局結(jié)構(gòu)優(yōu)化的過程中,所有生成的結(jié)構(gòu)都需要進(jìn)行局部優(yōu)化[30],以此來描述勢能面。但全局結(jié)構(gòu)優(yōu)化往往需要對大量候選結(jié)構(gòu)進(jìn)行局部優(yōu)化[33],計算量巨大。對于原子數(shù)較多的復(fù)雜體系,很難使用精度較高的密度泛函方法進(jìn)行,通常需要使用經(jīng)驗勢函數(shù)。而機器學(xué)習(xí)(machine learning)作為一種非線性的擬合工具,可以被足夠多的結(jié)構(gòu)-能量數(shù)據(jù)訓(xùn)練,構(gòu)建高維勢能面[50],并用作計算上較為便宜但精度較高的能量計算器[51],加快遺傳算法的收斂。Hajinazar 等[33]的工作表明,使用基于密度泛函方法級別下的計算數(shù)據(jù),訓(xùn)練得到的機器學(xué)習(xí)模型,其精度比經(jīng)驗勢函數(shù)更高。
比較常用的用以構(gòu)建勢能面的機器學(xué)習(xí)方法有神經(jīng)網(wǎng)絡(luò)[52]、高斯過程回歸[53]、核嶺回歸[54]等。Chen 等[55]提出了一種沒有經(jīng)驗參數(shù)的簡化結(jié)構(gòu)描述符“k-Bags”,用以將結(jié)構(gòu)描述成具有置換不變性、可用以機器學(xué)習(xí)訓(xùn)練的編碼。然后使用已有的數(shù)據(jù)集(QM7[56]、GDB-9[57]等)對使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,所得到的模型的能量預(yù)測誤差在1.0 kcal/mol以內(nèi)。Chen 等將該模型用以遺傳算法的全局優(yōu)化中,對比使用密度泛函方法的遺傳算法,使用機器學(xué)習(xí)模型的遺傳算法無論在小分子、團(tuán)簇、表面吸附模型的全局結(jié)構(gòu)優(yōu)化中,都顯示出明顯的加速。
機器學(xué)習(xí)的訓(xùn)練高度依賴于訓(xùn)練集的大小及質(zhì)量。除了使用公開的數(shù)據(jù)集,也可以使用第一性原理計算一批相似結(jié)構(gòu),作為訓(xùn)練集。Hajinazar等[33]使用密度泛函方法,得到一批用以機器學(xué)習(xí)的訓(xùn)練集,使用神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練后得到機器學(xué)習(xí)模型,并將該模型與遺傳算法聯(lián)用,成功獲得了不同尺寸下的二元Cu-Ag 團(tuán)簇、Pd-Ag 團(tuán)簇以及三元Cu-Pd-Ag 團(tuán)簇的基態(tài)結(jié)構(gòu)。關(guān)于使用機器學(xué)習(xí)構(gòu)建勢能面的討論已超出本文的范圍,如有興趣可參考文獻(xiàn)[58]。
遺傳算法亦可以實現(xiàn)個體結(jié)構(gòu)的無偏生成[17]。對缺少數(shù)據(jù)集的體系,可以使用遺傳算法生成數(shù)據(jù),由一個不完整的小型訓(xùn)練集出發(fā),訓(xùn)練機器學(xué)習(xí)模型,同時使用該模型加速遺傳算法搜索。在遺傳算法迭代的過程中,再將新生成的數(shù)據(jù)用以更新模型,逐步增加模型的精度。這樣的思想在機器學(xué)習(xí)中被稱為主動學(xué)習(xí)(active learning)[59]。一個典型的工作來自Jennings 等[34]用以優(yōu)化納米合金的遺傳算法框架。如圖4(a)所示,遺傳算法生成的初始種群被用以訓(xùn)練機器學(xué)習(xí)模型,模型被用于高通量篩選遺傳算法生成的個體結(jié)構(gòu)數(shù)據(jù),僅選部分適應(yīng)度高的結(jié)構(gòu)在密度泛函級別下計算能量,并用以更新機器學(xué)習(xí)模型。與標(biāo)準(zhǔn)遺傳算法相比,該框架所需高精度計算的次數(shù)減少至1/50,大大加速了優(yōu)化效率。Bisbo等[24]使用高斯過程回歸,開發(fā)出了GOFEE的機器學(xué)習(xí)框架,用以研究Ir(111)上石墨烯的基態(tài)結(jié)構(gòu)。圖4(b)表明,在研究表面重構(gòu)的過程中,引入主動學(xué)習(xí)框架的遺傳算法,其性能要比僅基于第一性原理的遺傳算法高2 個數(shù)量級。Kolsbjerg 等[60]將主動學(xué)習(xí)技術(shù)與遺傳算法結(jié)合,用以對MgO 負(fù)載上的Pt13團(tuán)簇進(jìn)行全局優(yōu)化,更快地得到了比之前報道更穩(wěn)定的基態(tài)結(jié)構(gòu)。
圖4 結(jié)合主動學(xué)習(xí)進(jìn)行加速的遺傳算法框架及性能表現(xiàn)Fig.4 Flowchart for the active learning-accelerated genetic algorithm method and its performance test results
2.2.2 與聚類算法結(jié)合 大多數(shù)遺傳算法根據(jù)適應(yīng)度隨機選擇父代,適應(yīng)度越高,則被選擇的概率也越大。但單純依賴此規(guī)則,可能造成少數(shù)適應(yīng)度值較大的個體反復(fù)被選中,數(shù)次迭代后在種群中占很大的比例,導(dǎo)致優(yōu)化收斂至局部極值。聚類算法(clustering)是把相似的對象通過靜態(tài)分類的方法分成不同的組別或者更多的子集的非監(jiān)督式機器學(xué)習(xí)算法。在全局結(jié)構(gòu)優(yōu)化中,可用于分析個體間結(jié)構(gòu)上的相似性,并將相似個體聚成類簇,并做進(jìn)一步 篩 選。 J?rgensen 等[42]使 用 層 次 聚 類 法(agglomerative hierarchical clustering),在每代運行后對現(xiàn)有種群進(jìn)行聚類分析,按照相似度分成不同類簇,并基于聚類結(jié)果,對不同個體的適應(yīng)度進(jìn)行調(diào)整。若某個體的結(jié)構(gòu)單獨形成類簇,則在生成子代時將被始終選為父代。同時,若某個體所在的類簇較大,則說明與該個體相似的結(jié)構(gòu)在種群中占的比例較大,其適應(yīng)度將會受到懲罰。這樣,獨特的結(jié)構(gòu)(即便能量未必最低)將更高概率地得到保存。比起僅根據(jù)適應(yīng)度隨機選擇父代,引入聚類算法后的遺傳算法結(jié)構(gòu)效率更高,能夠更快找到全局最小值點。聚類算法也同樣被Curtis等[35]采用,用在分子晶體結(jié)構(gòu)預(yù)測程序GAtor 中,抑制相似結(jié)構(gòu)的適應(yīng)度。而Lyakhov等[30]在聚類后,僅將每類中最好的結(jié)構(gòu)傳遞到下一代,拋棄其他相似結(jié)構(gòu),最大限度地保證了結(jié)構(gòu)多樣性。
除了用于抑制相似結(jié)構(gòu),聚類算法亦可用于結(jié)構(gòu)的大數(shù)據(jù)分析,提煉基態(tài)結(jié)構(gòu)的特征。S?rensen等[61]使用聚類算法對TiO2表面結(jié)構(gòu)特征進(jìn)行聚類,發(fā)現(xiàn)基態(tài)結(jié)構(gòu)的鍵長特征,并發(fā)展為生成子代的新方法:采用梯度下降法,將父代的鍵長指向基態(tài)結(jié)構(gòu)的鍵長特征進(jìn)行優(yōu)化,生成子代。測試結(jié)果表明,新方法能更快發(fā)現(xiàn)基態(tài)結(jié)構(gòu),同時證明聚類算法提煉的特征有很好的普適性,在不同大小的TiO2結(jié)構(gòu)優(yōu)化中均提升了優(yōu)化效果。
2.2.3 與貝葉斯優(yōu)化結(jié)合 作為無偏優(yōu)化算法,遺傳算法在勢能面上的優(yōu)化方向有一定的隨機性。而引入貝葉斯優(yōu)化(Bayesian optimization)的思想,可以指引優(yōu)化的方向,加快效率。貝葉斯優(yōu)化可根據(jù)勢能面上的現(xiàn)有信息,將未知點分為“開發(fā)”(exploitation)和“探索”(exploration):“開發(fā)”代表著勢能面上未探索的陌生區(qū)域(也許存在基態(tài)結(jié)構(gòu)),“探索”則代表已知具有低能量結(jié)構(gòu)的區(qū)域。何時“開發(fā)”,何時“探索”的權(quán)衡由固定的權(quán)重值控制。貝葉斯優(yōu)化依賴先驗知識,來推測勢能面的后驗分布。J?rgensen 等[62]將貝葉斯優(yōu)化引入遺傳算法框架中,由遺傳算法生成的數(shù)據(jù)提供先驗分布,探究了“開發(fā)”和“探索”的權(quán)重值與優(yōu)化結(jié)果的關(guān)系,并用于C10H6O2體系的結(jié)構(gòu)優(yōu)化中,得到了比標(biāo)準(zhǔn)遺傳算法更快的優(yōu)化效率。該框架也被后續(xù)開發(fā)為全局結(jié)構(gòu)優(yōu)化的遺傳算法工具包GOFEE[24]。
在一些優(yōu)化問題中,將多種全局優(yōu)化方法聯(lián)用,取長補短,能收獲更好的效果[63]。例如,遺傳算法的優(yōu)勢在于其強大的全局搜索能力,但其局部搜索能力受限,即難以在某一限定區(qū)域內(nèi)優(yōu)化目標(biāo)函數(shù)[64]。相反,模擬退火等算法則具有很強的集中性搜索能力,但多樣化能力很弱。Zacharias 等[65]將模擬退火和遺傳算法結(jié)合,用以優(yōu)化硅團(tuán)簇。在優(yōu)化前期使用遺傳算法,快速搜索解空間,而后期使用模擬退火,在局部進(jìn)行集中搜索。結(jié)果表明,兩者結(jié)合的混合方法比單一算法更高效地收斂。Liu 等[4]在優(yōu)化不同大小及化學(xué)計量比的硫醇鹽保護(hù)的金團(tuán)簇時,使用由盆地跳躍得到的局域極小值作為初始個體,再使用遺傳算法進(jìn)行優(yōu)化,亦避免了使用單一優(yōu)化方法容易陷入局域極小值的缺點。Cai 等[66]將模擬退火算法和遺傳算法相結(jié)合,開發(fā)出了團(tuán)簇全局結(jié)構(gòu)優(yōu)化的程序包PFAEA,成功優(yōu)化了包含了數(shù)百個原子Lennard-Jones 團(tuán)簇,證明了混合算法在解決原子數(shù)較多的復(fù)雜體系的潛力。
金屬團(tuán)簇作為化工生產(chǎn)中最重要的催化劑之一,其催化性能與結(jié)構(gòu)有緊密的關(guān)系。只有找到了團(tuán)簇的基態(tài)結(jié)構(gòu),才能在此基礎(chǔ)上研究其電子催化活性等各種性質(zhì)。但團(tuán)簇的結(jié)構(gòu)多變,可呈現(xiàn)鏈狀、管狀、平面、核殼等多種結(jié)構(gòu)形式,使其具有更加復(fù)雜的勢能面。并且,改變團(tuán)簇中任一原子的位置,都可能造成催化性質(zhì)的巨大差異。而由于團(tuán)簇結(jié)構(gòu)的復(fù)雜性,實驗上很難系統(tǒng)地觀測團(tuán)簇的基態(tài)結(jié)構(gòu),需要結(jié)合理論計算來確定基態(tài)結(jié)構(gòu)。并且隨著原子數(shù)增加,團(tuán)簇可能的構(gòu)型數(shù)目急劇增加,通過窮舉找到基態(tài)結(jié)構(gòu)是極其困難的。
由于其在各領(lǐng)域中的廣泛應(yīng)用和相應(yīng)優(yōu)化問題的困難性,金屬團(tuán)簇的全局結(jié)構(gòu)優(yōu)化問題一直是遺傳算法的應(yīng)用熱點。早在20世紀(jì)末,遺傳算法就被成功用于Si4[13]和C60[14]團(tuán)簇的結(jié)構(gòu)優(yōu)化中,并可能實現(xiàn)比其他技術(shù)更高的優(yōu)化效率[67]。針對團(tuán)簇結(jié)構(gòu)優(yōu)化問題,一系列成熟的遺傳算法框架也被提出和應(yīng)用,例如Alexandrova 等[68]開發(fā)的嵌入式梯度遺傳算法(gradient embedded genetic algorithm)、Dieterich等[69]開發(fā)的OGOLEM 框架、Davis 等[3]開發(fā)的伯明翰并行遺傳算法以及Vargas 等[70]開發(fā)的墨西哥增強遺傳算法(Mexican enhanced genetic algorithm)等。
3.1.1 單金屬團(tuán)簇 Au 團(tuán)簇的結(jié)構(gòu)可以在分子水平進(jìn)行調(diào)控,因此被認(rèn)為是團(tuán)簇研究中良好的模型系統(tǒng)[71]。對Au 團(tuán)簇體系進(jìn)行全局結(jié)構(gòu)優(yōu)化研究,有助于理解團(tuán)簇的結(jié)構(gòu)與性能之間的關(guān)系。如圖5(a)所示,Assadollahzadeh 等[72]通過遺傳算法,對中性Au2-20團(tuán)簇的基態(tài)結(jié)構(gòu)進(jìn)行了研究,計算結(jié)果表明中性Aun團(tuán)簇由二維向三維的轉(zhuǎn)變發(fā)生在Au13與Au15之間,且Au20團(tuán)簇呈現(xiàn)高對稱四面體形狀。Au20團(tuán)簇的結(jié)構(gòu)形貌圖也在近年通過簇束沉積和低溫掃描隧道顯微鏡等表征手段而獲得[23],驗證了遺傳算法的可靠性。Li 等[73]對Au38-55團(tuán)簇的全局優(yōu)化結(jié)果則表明,隨著尺寸的增加,Au 團(tuán)簇的基態(tài)結(jié)構(gòu)將從緊密堆積結(jié)構(gòu)轉(zhuǎn)變?yōu)楹藲そY(jié)構(gòu),并由于短程作用力的存在,能量最低的基態(tài)結(jié)構(gòu)傾向于無序結(jié)構(gòu)。
3.1.2 合金團(tuán)簇 由于可以充分利用多種金屬間的協(xié)同效應(yīng),合金團(tuán)簇通過調(diào)控,可以實現(xiàn)多功能性和高反應(yīng)性,在催化領(lǐng)域具有較大的應(yīng)用潛力[77]。Xie 等[78]報道了Pd 摻雜后的Au25團(tuán)簇,對苯甲醇的催化轉(zhuǎn)化率從22%顯著提高到74%。Liu 等[79]報道了Ag 原子的引入可以縮小Au23-xAgx團(tuán)簇的禁帶寬度并增強反應(yīng)穩(wěn)定性,提高光催化性能。而合金團(tuán)簇的基態(tài)結(jié)構(gòu)是研究其催化活性、設(shè)計合金團(tuán)簇催化劑的重要基礎(chǔ)。由于存在等位(homotopic)同分異構(gòu)體,即原子成分和幾何結(jié)構(gòu)相同,但原子排布不同的結(jié)構(gòu),合金團(tuán)簇的結(jié)構(gòu)優(yōu)化難度更高,需要使用全局優(yōu)化等方法進(jìn)行解決。
Heiles 等[80]使用伯明翰簇并行遺傳算法,研究了中性八聚體Au-Ag 團(tuán)簇的計量比與結(jié)構(gòu)的關(guān)系,并預(yù)測基態(tài)結(jié)構(gòu)由二維向三維的轉(zhuǎn)變發(fā)生在Au6Ag2和Au5Ag3之間。Demiroglu 等[46]對Pt-Ru 團(tuán)簇的全局結(jié)構(gòu)優(yōu)化則表明,在基態(tài)結(jié)構(gòu)下,鉑原子更喜歡外圍位置,而釕原子則傾向處于中心位點,并生成更強的Ru-Ru 鍵。而對PdnIrN-n(N=8~10)團(tuán)簇的全局結(jié)構(gòu)優(yōu)化則表明,當(dāng)Ir含量較多時,團(tuán)簇為立方體結(jié)構(gòu),而當(dāng)Pd量較多時,則為緊密堆積結(jié)構(gòu),且偏析效應(yīng)嚴(yán)重[81]。另外,對于常見的合金催化劑,如Au-Pd團(tuán)簇[45]、Au-Cu 團(tuán)簇[82]等,亦有全局結(jié)構(gòu)優(yōu)化的工作報道。
圖5 不同尺寸和電荷下的Au團(tuán)簇的基態(tài)結(jié)構(gòu)Fig.5 The global minimum structure of Au cluster with different size
3.1.3 團(tuán)簇生長過程 對催化劑材料生長過程的精確理解,對實現(xiàn)催化劑的按需設(shè)計具有重要意義。實驗上,團(tuán)簇催化劑的表面成長過程可通過電噴霧電離-質(zhì)譜等方法[83]鑒定,但僅從實驗出發(fā),缺少在分子尺度上,對團(tuán)簇生長機理的尺寸效應(yīng)的理解。而從理論計算上,結(jié)合遺傳算法,可通過對不同尺寸的團(tuán)簇進(jìn)行全局優(yōu)化,構(gòu)建其成核、成長過程,幫助理解團(tuán)簇的結(jié)構(gòu)隨尺寸變化的過程。Liu 等[4]將遺傳算法與盆地跳躍法聯(lián)用,計算了不同大小及計量比的硫醇配體保護(hù)的Au 團(tuán)簇的基態(tài)結(jié)構(gòu),成功分析了Au 團(tuán)簇的逐步成核與生長規(guī)律,如圖6(a)所示。Hussein 等[84]使用伯明翰遺傳算法,闡明了中性Pb16-18為類球形的籠狀結(jié)構(gòu),其生長過程呈現(xiàn)出fcc 的特征。而對Ni-Al 合金的全局結(jié)構(gòu)優(yōu)化則表明[85],往Ni28Al10團(tuán)簇添加1 個Ni 原子生成Ni29Al10團(tuán)簇的過程,基態(tài)結(jié)構(gòu)將從截角八面體變?yōu)槎骟w。而繼續(xù)添加原子,基態(tài)結(jié)構(gòu)仍然維持二十面體構(gòu)型,直到形成雙層二十面體的Ni41Al14結(jié)構(gòu)。
除了全局最小值結(jié)構(gòu),遺傳算法在搜索過程中產(chǎn)生的亞穩(wěn)態(tài)結(jié)構(gòu)亦可以用于構(gòu)建反應(yīng)路徑,揭示反應(yīng)中團(tuán)簇催化劑結(jié)構(gòu)的動態(tài)演化過程。如圖6(b)所示,Liu等[4]在研究Au團(tuán)簇的逐步成核與生長規(guī)律時,同時選擇了一批與基態(tài)結(jié)構(gòu)相似的亞穩(wěn)態(tài)結(jié)構(gòu),作為Au 團(tuán)簇生長過程中的中間體,更動態(tài)地了解團(tuán)簇成核及生長過程。
由于產(chǎn)物易分離,耐高溫等特性,負(fù)載型催化劑有著較好的催化性能[86]。對于負(fù)載型催化劑而言,載體的影響時常是不可忽視的。載體能夠影響催化劑在其表面的分散情況、粒徑大小等,導(dǎo)致催化劑的結(jié)構(gòu)與氣相中有很大不同[87]。通過調(diào)變載體與催化劑之間的相互作用,亦可以調(diào)控催化性能。對負(fù)載型催化劑進(jìn)行全局結(jié)構(gòu)優(yōu)化,有助于了解載體對催化劑結(jié)構(gòu)影響,理解表面催化過程,幫助理性設(shè)計新型、高效催化劑[3]。針對負(fù)載型金屬催化劑的全局結(jié)構(gòu)優(yōu)化,常用使用周期性平板模型,相關(guān)的遺傳算法框架有Vilhelmsen 等[16]開發(fā)的內(nèi)置于原子模擬環(huán)境(atomic simulation environment,ASE)[88]的遺傳算法模塊以及Sierka[12]開發(fā)的混合從頭算遺傳算法(hybrid ab initio genetic algorithm)等。
圖6 不同尺寸硫醇配體保護(hù)的Au團(tuán)簇及其成核、成長過程[4]Fig.6 Schematic illustrations of the size-evolution of Aum(SR)n clusters
3.2.1 催化劑結(jié)構(gòu) Zhang等[86]使用遺傳算法,分別對氣相及不同載體負(fù)載的Au8團(tuán)簇進(jìn)行了全局結(jié)構(gòu)優(yōu)化,結(jié)果顯示,氣相中Au8團(tuán)簇傾向于片狀結(jié)構(gòu),而在氧化石墨烯上,則錨定在環(huán)氧位點上,生成三維結(jié)構(gòu)。Au8團(tuán)簇吸附在金紅石TiO2(110)時形成了牢固的Ti-Au 鍵,基態(tài)結(jié)構(gòu)同樣也三維結(jié)構(gòu)。Davis等[3]使用伯明翰并行遺傳算法,分別對氣相下和MgO(100)吸附時的Au-Ir 團(tuán)簇進(jìn)行全局結(jié)構(gòu)優(yōu)化。如圖7(a)、(b)所示,MgO(100)負(fù)載的Au-Ir 團(tuán)簇傾向于最大程度增加Ir-O 鍵的數(shù)量,并形成低自旋結(jié)構(gòu),與氣相下的結(jié)構(gòu)有著顯著差異。Vilhelmsen等[89]則研究了金屬有機框架(metal-organic framework,MOF)吸附的Au8、Pd8和Au4Pd4團(tuán)簇的基態(tài)結(jié)構(gòu),結(jié)果表明Pd 比Au 對MOF 的結(jié)合力更強,Au 和Pd 并不傾向于形成合金團(tuán)簇。同時,MOF 上的金屬位點對金屬催化劑的吸附未有明顯作用。該結(jié)果可以幫助了解和預(yù)測MOF 上的局部環(huán)境如何影響對催化劑的結(jié)構(gòu)。
在使用遺傳算法優(yōu)化負(fù)載型催化劑的結(jié)構(gòu)時,亞穩(wěn)態(tài)結(jié)構(gòu)同樣也可以用于構(gòu)建結(jié)構(gòu)的演化過程。但在使用亞穩(wěn)態(tài)結(jié)構(gòu)作為中間體,分析反應(yīng)路徑時,一個無法避免的問題是如何對遺傳算法產(chǎn)生的大量亞穩(wěn)態(tài)結(jié)構(gòu)進(jìn)行匹配。對亞穩(wěn)態(tài)結(jié)構(gòu)匹配不合理時,所構(gòu)建的反應(yīng)路徑也將不合理。Zhai等[9]使用圖論中的匈牙利算法,利用兩個結(jié)構(gòu)間的相似度等信息,對大量亞穩(wěn)態(tài)進(jìn)行兩兩配對,并使用微動彈性帶(nudged elastic band,NEB)方法搜尋它們間的過渡態(tài)結(jié)構(gòu),構(gòu)建了Pt7團(tuán)簇在α-Al2O3表面上的各個結(jié)構(gòu)形態(tài)間相對能量關(guān)系以及變化過程,結(jié)果如圖8所示。另外,值得一提的是,遺傳算法也被用于尋找復(fù)雜的過渡態(tài)結(jié)構(gòu)(勢能面反應(yīng)路徑上的極大值點)。Yang 等[17]使用遺傳算法,搜索含非共價相互作用的催化反應(yīng)體系的過渡態(tài),并成功應(yīng)用于不對稱斯特雷克反應(yīng)和不對稱醇解反應(yīng)的過渡態(tài)搜索中。
3.2.2 反應(yīng)物對結(jié)構(gòu)的影響 亞納米尺度的金屬催化劑(包括單個原子和團(tuán)簇)由于其結(jié)構(gòu)的靈活性,在與反應(yīng)物相互作用時會呈現(xiàn)動態(tài)的結(jié)構(gòu)演化,導(dǎo)致真實的活性結(jié)構(gòu)與其初期吸附結(jié)構(gòu)有所差異,從而難以確定催化活性結(jié)構(gòu)。He 等[90]通過環(huán)境電子透射顯微鏡,觀察到在反應(yīng)氣氛下,CeO2(111)上單層Au 團(tuán)簇會從面心立方密堆積轉(zhuǎn)變?yōu)闊o定形狀態(tài)。通過理論計算,確定催化劑在反應(yīng)物參與下的真實活性結(jié)構(gòu),對從分子水平了解反應(yīng)機理和設(shè)計更有效的催化劑至關(guān)重要。
Sierka 等[87]使用遺傳算法,研究了Mo(112)表面吸附的SiO2基態(tài)結(jié)構(gòu)隨硅覆蓋率以及氧氣壓力的變化,并繪制相圖。計算結(jié)果成功預(yù)測了在高氧氣壓力下形成的未被報道的二維SiO2薄膜結(jié)構(gòu):除了形成角共享[SiO4]四面體外,部分氧原子還直接吸附在Mo (112)表面上。該結(jié)構(gòu)亦被紅外反射吸收光譜(IRAS)和X 射線光電子能譜(XPS)所確認(rèn)。Sun 等[91]使用遺傳算法,研究了α-Al2O3(0001)和γ-Al2O3(100)表面上不同氫原子吸附下形成的Pt8團(tuán)簇的基態(tài)結(jié)構(gòu)。如圖9 所示,不同的載體并不影響氫原子的最佳吸附數(shù)量,但對團(tuán)簇的結(jié)構(gòu)影響很大。在較少氫原子吸附時,α-Al2O3(0001)表面的Pt8Hx團(tuán)簇呈現(xiàn)擬二層狀,而γ-Al2O3(100)的則為單層;而在較多氫原子吸附時,α-Al2O3(0001)表面的Pt8Hx團(tuán)簇呈現(xiàn)完全平整狀,而γ-Al2O3(100)的則為三維球狀結(jié)構(gòu)。
Vilhelmsen 等[92]使用遺傳算法研究了MgO(100)負(fù)載的Au8團(tuán)簇吸附O2的過程。在確定O2能量最低的吸附位點后,通過遺傳算法對Au8團(tuán)簇的結(jié)構(gòu)進(jìn)行優(yōu)化,揭示了O2吸附后Au8團(tuán)簇的結(jié)構(gòu)變化過程,結(jié)果如圖10 所示。Fang 等[6]使用遺傳算法,研究了Au(100)表面的CO 氧化過程,結(jié)果表明氧化過程中,Au(100)表面將重構(gòu)為六角形相,并生成O-Au-O 物種。由于O-Au-O物種能直接與吸附的CO反應(yīng),重構(gòu)后的Au(100)表面對CO 有更好的催化性能。而Fang 等[6]同樣將遺傳算法優(yōu)化過程中產(chǎn)生的亞穩(wěn)態(tài)結(jié)構(gòu)作為中間體,用以構(gòu)建重構(gòu)過程的勢能面,闡明了表面重構(gòu)過程的反應(yīng)路徑。
圖8 Pt7團(tuán)簇在α-Al2O3表面上的演化過程[9]Fig.8 The evolutionary process of Pt7 cluster on α-Al2O3 surface[9]
圖9 α-Al2O3(0001)吸附的Pt8H4團(tuán)簇(a),γ-Al2O3(100)吸附的Pt8H5團(tuán)簇(b),α-Al2O3(0001)吸附的Pt8H24團(tuán)簇(c)和γ-Al2O3(100)吸附的Pt8H24團(tuán)簇(d)的基態(tài)結(jié)構(gòu)[91]Fig.9 Global minimum structure of Pt8H4 on α-Al2O3(0001)(a),Pt8H5 on γ-Al2O3(100)(b),Pt8H24 on α-Al2O3(0001)(c),and Pt8H24 on γ-Al2O3(100)(d)[91]
圖10 O2在MgO(100)負(fù)載的Au12團(tuán)簇的吸附過程[92]Fig.10 The adsorption process of O2 on the MgO(100)-supported Au12clusters[92]
遺傳算法作為一種無偏優(yōu)化算法,在優(yōu)化中不依賴于已有的結(jié)構(gòu),具有很強的全局搜索能力。將遺傳算法應(yīng)用于催化體系中各種復(fù)雜的優(yōu)化問題中,為催化研究提供了新的視角。然而,該領(lǐng)域的研究仍舊存在一些亟待解決的問題:(1)現(xiàn)有遺傳算法難以用于原子數(shù)較多的復(fù)雜體系中,勢能面的復(fù)雜程度隨著體系原子數(shù)目的增加而增加,極小值點個數(shù)也以指數(shù)形式增長,而現(xiàn)有優(yōu)化策略在處理復(fù)雜體系勢能面時,面臨著取樣效率不足的缺陷,同時,越復(fù)雜的體系,優(yōu)化過程往往需要對大量候選結(jié)構(gòu)進(jìn)行能量評估,對計算資源的要求也隨之增加;(2)現(xiàn)有遺傳算法仍具有很大的隨機性,由于缺少對基態(tài)結(jié)構(gòu)的普遍性先驗認(rèn)知,無法對遺傳算法的搜索方向進(jìn)行引導(dǎo),只能依賴結(jié)構(gòu)能量作為唯一標(biāo)準(zhǔn),導(dǎo)致遺傳算法效率較低,需要進(jìn)行多次迭代、計算大量的候選結(jié)構(gòu)才能發(fā)現(xiàn)基態(tài)結(jié)構(gòu)。
未來遺傳算法將繼續(xù)向并行化(充分利用計算資源)、智能化(使用機器學(xué)習(xí)方法降低不必要的高精度計算次數(shù))、通用化(能處理各類復(fù)雜的體系)的方向發(fā)展,加快優(yōu)化速度,以較少的計算代價獲得基態(tài)結(jié)構(gòu)。同時,亦有必要繼續(xù)加深對基態(tài)結(jié)構(gòu)的理解,以實現(xiàn)對優(yōu)勢構(gòu)象的增強采樣,減少在勢能面的盲目探索,進(jìn)一步提高遺傳算法的搜索效率。相信遺傳算法在面對催化體系中各種復(fù)雜的結(jié)構(gòu)優(yōu)化問題中能發(fā)揮更重要的作用。