国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于MATLAB的長春花生物堿含量的分析與預測

2019-07-01 02:35陳志遠王云耿趙萬里賀耀欽穆麗新劉英
智能計算機與應(yīng)用 2019年3期
關(guān)鍵詞:人工神經(jīng)網(wǎng)絡(luò)遺傳算法激素

陳志遠 王云耿 趙萬里 賀耀欽 穆麗新 劉英

摘 要:長春堿是一種重要的天然抗癌藥物。土壤營養(yǎng)成分(土壤含水量,土壤PH,有機碳,全氮,全磷,速效磷,堿解氮),和激素(6-BA(6-芐氨基腺嘌呤),IAA(吲哚-3-乙酸),ABA(脫落酸)),對長春堿含量有重要影響。本文采集了這10個研究條件和長春堿含量的原始數(shù)據(jù),并且用MATLAB中的人工神經(jīng)網(wǎng)絡(luò)和遺傳算法工具箱進行分析。結(jié)果顯示土壤條件中全磷含量和土壤含水量的降低有利于提高長春堿含量,土壤PH,有機碳,全氮,堿解氮含量的升高有利于提高長春堿含量,土壤中速效磷和長春堿含量的關(guān)系不明顯。激素中,IAA含量的降低有利于提高長春堿含量,6-BA,ABA含量的升高有利于提高長春堿含量。

關(guān)鍵詞: 長春花;土壤條件;激素;長春堿;人工神經(jīng)網(wǎng)絡(luò);遺傳算法

文章編號: 2095-2163(2019)03-0190-05 中圖分類號: S567.9 文獻標志碼: A

0 引 言

長春花(Catharanthus roseus(L.)G.Don)是夾竹桃科(Apocynaceae)長春花屬(Catharanthus G.Don)植物,又稱雁來紅、日日新、四時春、三萬花等,中醫(yī)臨床以全株入藥。原產(chǎn)于非洲馬達加斯加島西印度一帶的熱帶森林地區(qū),早在宋代以前就傳入中國[1]。長春花中含有多種生物堿。其中長春堿主要用于治療何杰金氏病和絨毛上皮癌,對何杰金氏病治療的有效率為68%,完全緩解率為30% 對淋巴肉瘤、黑色素瘤、卵巢癌、白血病等也有一定療效[2]。長春堿是一種重要的藥用生物堿。

植物次生代謝的概念最早于1891年由Kossel明確提出。植物的次生代謝是指由植物體內(nèi)有機化合物的初生代謝途徑衍生而來,最終合成一些具有種屬特異性的有機化合物的代謝過程[3]。長春花體內(nèi)可以產(chǎn)生大量的次生代謝產(chǎn)物,主要是化學結(jié)構(gòu)屬于萜類的生物堿,這類生物堿具有非常重要的藥用價值。長春堿(Vinblastine)是其中的一種。植物的次生代謝是植物在長期進化中與環(huán)境(生物的和非生物的)相互作用的結(jié)果,次生代謝產(chǎn)物在植物提高自身保護和生存競爭能力、協(xié)調(diào)與環(huán)境關(guān)系上充當著重要的角色,其產(chǎn)生和變化比初生代謝產(chǎn)物與環(huán)境有著更強的相關(guān)性和對應(yīng)性[4]。由于環(huán)境條件在次生代謝產(chǎn)物合成積累中具有重要誘導作用,在植物藥材種植中為了保證和提高所需成分的質(zhì)量,研究產(chǎn)物產(chǎn)量和環(huán)境因素的關(guān)系即已成為亟待探索的焦點研發(fā)課題。土壤和激素是植物生長所需環(huán)境因素的重要組成部分,土壤條件和激素對植物次生代謝產(chǎn)物有著重大影響。對此擬展開研究闡述如下。

1 研究現(xiàn)狀

長春花作為重要的藥用植物,體內(nèi)含有豐富的次生產(chǎn)物,因其獨特的藥用價值、尤其是抗腫瘤成分而使長春堿備受多方關(guān)注。經(jīng)過多年研究,植物領(lǐng)域中已經(jīng)有多種手段用在生物堿含量的提高上。例如,采用遮光培育或干旱脅迫等方法對長春花植株進行干預,目前均已取得了一定的成果。但是當下國內(nèi)外對長春花中生物堿含量與土壤和激素之間關(guān)系發(fā)表的研究,則主要集中在實驗手段上并且對于直接作用于相應(yīng)的土壤條件和激素,改變土壤水分含量、微量元素含量等方面研究較少。因為長春花培育需要一定的周期,土壤和激素中可能影響長春花生物堿含量的研究對象比較多,單純用實驗方法取得數(shù)據(jù)進行分析將嚴重影響后續(xù)研究。迄今為止也還未見到有利用計算機的聚類分析方法以及仿真方法對長春花生物堿含量與土壤、激素關(guān)系進行分析的先例。

2 BP神經(jīng)網(wǎng)絡(luò)和遺傳算法

2.1 BP神經(jīng)網(wǎng)絡(luò)簡介

BP神經(jīng)網(wǎng)絡(luò)是人工神經(jīng)網(wǎng)絡(luò)的一個基礎(chǔ)組成部分。人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks),是一種模仿動物神經(jīng)網(wǎng)絡(luò)行為、進行分布式信息存儲的數(shù)字算法模型[5-6]。通過將模擬神經(jīng)元逐層排列,人工神經(jīng)網(wǎng)絡(luò)可以在無需事前揭示描述映射關(guān)系的數(shù)學方程的情況下,建立輸入-輸出模式映射關(guān)系。人工神經(jīng)網(wǎng)絡(luò)現(xiàn)已成為人工智能研究的重要領(lǐng)域之一。BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是一種單向傳播的多層前饋網(wǎng)絡(luò),是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一[7]。BP神經(jīng)網(wǎng)絡(luò)的核心思想在于將神經(jīng)網(wǎng)絡(luò)的預測值和原始數(shù)據(jù)的真實值加以比較,將輸出誤差以某種形式逐層反傳,即將誤差分攤給各層的所有單元,通過各層單元的誤差信號來修正各單元權(quán)值。這種訓練方式使得BP神經(jīng)網(wǎng)絡(luò)對輸入變量較多的復雜問題有良好的應(yīng)用效果。在收集到土壤條件和長春堿含量的基礎(chǔ)上利用BP神經(jīng)網(wǎng)絡(luò)可以建立土壤中10個輸入變量和長春堿的輸入-輸出模式映射。

2.2 遺傳算法簡介

遺傳算法是一種進化算法,其基本原理是仿效生物界中的“物競天擇,適者生存”的演化法則。遺傳算法是把問題參數(shù)編碼為染色體,再利用迭代的方式進行選擇、交叉以及變異等運算來交換種群中染色體的信息,最終生成符合優(yōu)化目標的染色體[8]。當問題的輸入輸出函數(shù)或模式映射確定時,用遺傳算法可以先利用染色體(二進制串)隨機生成對應(yīng)問題輸入變量的幾組輸入值。當獲得輸入值后,自然而然地可以得到輸入值對應(yīng)的輸出。如果希望得到解空間內(nèi)的近似最大值或最小值,就可分別根據(jù)輸出選擇輸出值更大/更小的染色體。讓其發(fā)生交叉變異,生成新的一代繼續(xù)參與運算。最后經(jīng)過指定代數(shù)的選擇、交叉和變異,就可以得到輸入輸出函數(shù)或模式映射內(nèi)的近似最大或最小輸出以及對應(yīng)的輸入值。在使用BP神經(jīng)網(wǎng)絡(luò)處理原始數(shù)據(jù)后,研究得到了土壤的10個輸入變量到長春堿的輸入輸出映射,此時利用遺傳算法就可以找到長春堿含量的近似最大值和對應(yīng)的輸入變量的取值,從而為下一步的分析做準備。遺傳算法的研發(fā)包括以下幾個步驟:

(1)初始化:設(shè)置進化代數(shù)計數(shù)器t=0,設(shè)置最大進化代數(shù)T,隨機生成M個個體作為初始群體P(0)。

(2)個體評價:計算群體P(t)中各個個體的適應(yīng)度。

(3)選擇運算:將選擇算子作用于群體。選擇的目的是把優(yōu)化的個體直接遺傳到下一代或通過配對交叉產(chǎn)生新的個體再遺傳到下一代。選擇操作是建立在群體中個體的適應(yīng)度評估基礎(chǔ)上的。

(4)交叉運算:將交叉算子作用于群體。遺傳算法中起核心作用的就是交叉算子。

(5)變異運算:將變異算子作用于群體。即是對群體中的個體串的某些基因座上的基因值作變動。

群體P(t)經(jīng)過選擇、交叉、變異運算后得到下一代群體P(t+1)。

(6)終止條件判斷:若t=T,則以進化過程中所得到的具有最大適應(yīng)度個體作為最優(yōu)解輸出,終止計算。

3 實驗方法

3.1 獲得初始數(shù)據(jù)

在實驗區(qū)域劃分4塊土地,對每塊土地的土壤進行不同的操作,從而建立4個實驗組。4個實驗組分別為:對照組(CK)、對土壤使用一氧化碳供體的SNP的SNP組(SNP)、遮陰組、SNP+遮陰組,測量4組處理下土壤的7種物質(zhì),即:土壤含水量(%)、土壤PH、有機碳(g/kg)、全氮(g/kg)、全磷(g/kg)、速效磷(mg/kg)、堿解氮(mg/kg)和植物中的激素的含量,即:6-BA(6-芐氨基腺嘌呤)、IAA(吲哚-3-乙酸)、ABA(脫落酸)(以葉片為研究對象 單位為ug/g)與對應(yīng)的長春花中長春堿(以葉片為研究對象,單位為ug/g)的含量,每個操作組收集3組數(shù)據(jù)建立初始數(shù)據(jù)表格,見表1。

3.2 確定BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

3.2.1 網(wǎng)絡(luò)層數(shù)的設(shè)計

人工神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)的確定對訓練效果有很大影響。隱含層一般為1~2層,考慮到本實驗有10個輸入?yún)?shù),復雜性較高,故設(shè)置2層隱含層,即BP神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)包括4層:輸入層、2個隱含層和輸出層。

3.2.2 各層神經(jīng)元數(shù)目的確定

一般來說,輸入層和輸出層神經(jīng)元的數(shù)目由具體問題決定。輸入層節(jié)點數(shù)目等于輸入變量的個數(shù),本實驗有10個條件,因此輸入層節(jié)點數(shù)取10。輸出層節(jié)點的數(shù)目等于輸出變量的個數(shù),本實驗研究長春堿含量,因此取1。隱含層節(jié)點的數(shù)目對于網(wǎng)絡(luò)的性能起著至關(guān)重要的作用,但目前尚無統(tǒng)一的標準來確定,常以經(jīng)驗公式作為參考。隱含層節(jié)點數(shù)在采用經(jīng)驗取值的基礎(chǔ)上反復試湊,測試顯示隱含層采用21-21結(jié)構(gòu)的平均相對誤差最小,最終確定BP神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)為10-21-21-1。

3.2.3 學習函數(shù)與傳遞函數(shù)以及其它參數(shù)的設(shè)定

本實驗使用訓練速度最快的traincgf作為學習函數(shù),考慮到長春堿輸出的范圍在0~1之間,使用logsig作為傳遞函數(shù)。本模型的學習率lr的初始值取為經(jīng)驗值0.01。為了能夠使神經(jīng)網(wǎng)絡(luò)達到比較小的誤差,研究選定的訓練目標為1e-8,訓練次數(shù)為5 000次。

3.3 選擇訓練集與測試集訓練并測試神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)的訓練效果不僅要看其是否能夠很好地符合給定的訓練數(shù)據(jù),也要視其是否能夠?qū)π聰?shù)據(jù)做出合理的預測,因此有必要在原始數(shù)據(jù)中劃分訓練集和測試集。

取表1中第六行、第九行、第十二行作為測試集,其它作為訓練集??紤]到10個輸入變量由于自身性質(zhì)在土壤中含量相差很大,直接訓練會導致訓練誤差和預測誤差過大。因此需要對2個集合中的10個輸入變量做適當處理,例如將某個輸入變量擴大,某個輸入變量縮小,使得數(shù)據(jù)間的數(shù)值差距減小。在關(guān)于如何處理數(shù)據(jù)、從而獲得好的訓練效果上,目前還沒有固定模式。通常的做法是不斷進行測試,找到對每個自變量合理的處理方式。經(jīng)過大量測試發(fā)現(xiàn),當土壤含水量、土壤PH、6-BA、IAA、ABA、有機碳、全氮、全磷、速效磷、堿解氮這10個變量分別擴大0.1、1、100、100、100、0.1、10、10、10、1倍后訓練效果最好,誤差最小。

訓練集負責訓練BP神經(jīng)網(wǎng)絡(luò),測試集負責測試訓練好的神經(jīng)網(wǎng)絡(luò)的預測能力。具體方法為:輸入測試集的10個輸入變量,將神經(jīng)網(wǎng)絡(luò)給出的預測值和真實值進行比較,用MATLAB默認的MSE函數(shù)計算誤差。

3.4用遺傳算法尋找有利于提高長春堿含量的土壤條件

遺傳算法可以生成設(shè)定范圍內(nèi)的值作為訓練好的神經(jīng)網(wǎng)絡(luò)的輸入變量,這里則是把初始數(shù)據(jù)中每個輸入變量的最大、最小值當作該變量取值范圍。輸入變量的最大精度為小數(shù)點后四位,考慮到每個輸入變量的取值范圍,個體長度取20即可滿足需求。其它參數(shù)設(shè)定較為寬松,研究將其設(shè)為經(jīng)驗值。遺傳代數(shù)取為20,代溝設(shè)為0.95,重組(交叉)概率和變異概率分別設(shè)為0.7和0.01。經(jīng)過20代的遺傳,可以得出在長春堿取值較大時輸入變量的取值。記錄下10組數(shù)據(jù)。將初始數(shù)據(jù)中每個輸入變量的最大、最小值的平均值設(shè)為A。統(tǒng)計10組數(shù)據(jù)中每個輸入變量小于A和大于等于A的個數(shù),分別設(shè)為B和C,當B與C之間的差值在4或4以上時可以認為該輸入變量取升高或降低有利于長春堿含量提高。否則認為該輸入變量與長春堿含量聯(lián)系不顯著。

4 實驗結(jié)果與結(jié)論

選定的BP神經(jīng)網(wǎng)絡(luò)經(jīng)過訓練后取得了比較好的效果,使用MATLAB軟件默認的誤差計算方式MSE使訓練集誤差達到了7.28e-11,同時神經(jīng)網(wǎng)絡(luò)對測試集的預測值和實際值之間的誤差也達到了9.72e-05。

神經(jīng)網(wǎng)絡(luò)訓練過程中誤差的變化情況如圖1所示。由圖1可以看出,traincgf函數(shù)的訓練速度非常快,在第26次訓練時就達到了1e-8的目標誤差。

用遺傳算法尋找長春堿獲取近似最大值時,可得各條件的預測值,并記錄10組數(shù)據(jù),結(jié)果見表2。在理想條件下,神經(jīng)網(wǎng)絡(luò)預測長春堿的含量可以進一步提高到0.27 ug/g以上。

研究求得初始數(shù)據(jù)的長春堿平均含量為0.124 929 ug/g,遺傳算法找到的10組數(shù)據(jù)中長春堿的平均含量為0.270 437 ug/g,且數(shù)值波動小,相對于初始數(shù)據(jù)有較大提高。

將初始數(shù)據(jù)中每個輸入變量的最大、最小值的平均值設(shè)為A。統(tǒng)計10組數(shù)據(jù)中每個輸入變量小于A和大于等于A的個數(shù),分別設(shè)為B和C,當B與C之間的差值在4或4以上時,可以認為該輸入變量取升高或降低,有利于長春堿含量提高。否則認為該輸入變量與長春堿含量聯(lián)系不顯著。經(jīng)過統(tǒng)計,得到結(jié)果見表3。

由表3中可以看出在設(shè)定的取值范圍內(nèi),土壤條件中全磷含量和土壤含水量的降低有利于提高長春堿含量,土壤PH、有機碳、全氮、堿解氮含量的升高有利于提高長春堿含量,土壤中速效磷和長春堿含量的關(guān)系不明顯。激素中,IAA含量的降低有利于提高長春堿含量,6-BA,ABA含量的升高有利于提升長春堿含量。

5 結(jié)束語

探究環(huán)境條件與植物體內(nèi)的激素表達水平之間的關(guān)系是目前生物領(lǐng)域的一大重點問題。由于目前對各種植物體內(nèi)代謝的微觀過程了解程度尚屬有限,大規(guī)模、長時間的栽培實驗依然是主流研究手段。本文用人工神經(jīng)網(wǎng)絡(luò)探討了長春花的10個研究條件和長春堿表達水平的關(guān)系。訓練出的模型既有效地擬合了訓練數(shù)據(jù),同時也有較好的預測能力。得到的結(jié)論縮短了傳統(tǒng)實驗的周期,也是對下一步實驗方向的有益指引。這種研究方式對相關(guān)研究領(lǐng)域提供了新的思路。

參考文獻

[1] 楊瑩瑩, 張廣晶,徐雅娟,等. 長春花化學成分研究進展[J]. 世界中醫(yī)藥,2014,9(7):955-957,960.

[2] 祖元剛,羅猛,牟璠松,等. 長春花生物堿成分及其藥理作用研究進展[J]. 天然產(chǎn)物研究與開發(fā),2006(2):325-329,294.

[3] 華曉雨,陶爽,孫盛楠,等. 植物次生代謝產(chǎn)物-酚類化合物的研究進展[J]. 生物技術(shù)通報,2017,33(12):22-29.

[4] 閆秀峰,王洋,李一蒙. 植物次生代謝及其與環(huán)境的關(guān)系[J]. 生態(tài)學報,2007,27(6):2554-2562.

[5] 于源. 人工神經(jīng)網(wǎng)絡(luò)在機械優(yōu)化設(shè)計中的應(yīng)用[J]. 設(shè)備管理與維修,2018(22):154-155.

[6] 張德豐. MATLAB神經(jīng)網(wǎng)絡(luò)仿真與應(yīng)用[M]. 北京:電子工業(yè)出版社,2009.

[7] 沈花玉,王兆霞,高成耀,等. BP神經(jīng)網(wǎng)絡(luò)隱含層單元數(shù)的確定[J]. 天津理工大學學報,2008,24(5):13-15.

[8] 郁磊,史峰,王輝,等. MATLAB智能算法30個案例分析[M]. 2版.? 北京:北京航空航天大學出版社,2012.

猜你喜歡
人工神經(jīng)網(wǎng)絡(luò)遺傳算法激素
談激素色變?沒必要!
激素怎么用才安全
基于人工神經(jīng)網(wǎng)絡(luò)的故障診斷專利淺析
激素草莓能吃嗎
人工神經(jīng)網(wǎng)絡(luò)發(fā)展歷史與訓練算法概述
基于遺傳算法對廣義神經(jīng)網(wǎng)絡(luò)的優(yōu)化
基于遺傳算法對廣義神經(jīng)網(wǎng)絡(luò)的優(yōu)化
基于遺傳算法的臨床路徑模式提取的應(yīng)用研究
基于遺傳算法的臨床路徑模式提取的應(yīng)用研究
遺傳算法在校園聽力考試廣播系統(tǒng)施工優(yōu)化中的應(yīng)用