国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于IABC-SVR算法的拉曼光譜定量分析山羊血清蛋白含量

2021-02-03 08:03:12付興虎王振興付廣偉畢衛(wèi)紅
光譜學(xué)與光譜分析 2021年2期
關(guān)鍵詞:曼光譜蜜源蜂群

付興虎,趙 飛,王振興,蘆 鑫,付廣偉,金 娃,畢衛(wèi)紅

燕山大學(xué)信息科學(xué)與工程學(xué)院,河北省特種光纖與光纖傳感重點(diǎn)實(shí)驗(yàn)室,河北 秦皇島 066004

引 言

血清總蛋白(total protein,TP)是血清中各種蛋白質(zhì)的總稱,是各種蛋白的復(fù)雜混合物[1],包含白蛋白、α1球蛋白、α2球蛋白、β球蛋白等,是人體保持健康的重要組成部分。人體生理機(jī)能的變化會引起血漿中蛋白質(zhì)發(fā)生質(zhì)和量的變化,檢測血清生化成分,可作為協(xié)助診斷腫瘤、肝病、腎病綜合征等疾病的方法[2]。例如,郭麗等通過對比健康人和患者的血清拉曼光譜,為乳腺癌的診測提供了新的方法。王玉等[3]利用不同批次人血白蛋白的拉曼光譜,結(jié)合拉曼光譜峰位移和峰強(qiáng)度的相似度計(jì)算結(jié)果,來判斷血液白蛋白樣品的真假偽劣。本文提出了一種基于拉曼光譜和改進(jìn)人工蜂群算法優(yōu)化支持向量機(jī)回歸(IABC-SVR)算法快速定量檢測山羊血清蛋白含量的方法。

血清總蛋白測定方法有很多,最主要的有凱氏定氮法、雙縮脲法、酚試劑法等,目前檢測血清蛋白總量的常規(guī)方法為雙縮脲法[4],其原理是蛋白質(zhì)分子中的肽鍵(—CO—NH—)與雙縮脲試劑反應(yīng),形成紫色化合物,其紫色深淺程度與樣品中蛋白質(zhì)濃度成正比,根據(jù)所測樣品吸光度值,在標(biāo)準(zhǔn)曲線上查出相應(yīng)蛋白質(zhì)含量,從而計(jì)算出樣品溶液蛋白質(zhì)含量。該方法需消耗多種試劑,步驟較繁瑣,存在污染試劑、精度差、容易交叉污染等缺點(diǎn)。而拉曼光譜技術(shù)是一種非破壞性測試技術(shù),幾乎無需試樣制備,用很少量的試樣就能獲得足夠的信號,所表征的是分子振動的信息,水的拉曼散射極微弱,因而水溶液樣品可直接進(jìn)行測量,這對生物大分子的研究非常有利。從拉曼光譜的譜圖中可以得到頻率、強(qiáng)度、偏振特性、峰形等信息,在生物、材料、環(huán)保、地質(zhì)等領(lǐng)域得到應(yīng)用。這種生化法拉曼光譜技術(shù)具有靈敏度高、無需樣品預(yù)處理、操作簡便、信息含量豐富、能夠獲取分子的結(jié)構(gòu)信息等特點(diǎn)。本文將拉曼光譜技術(shù)與IABC-SVR算法相結(jié)合,對山羊血清蛋白總量進(jìn)行快速定量分析。

1 模型原理和方法

1.1 支持向量機(jī)回歸

(1)

(2)

1.2 改進(jìn)的人工蜂群算法

標(biāo)準(zhǔn)人工蜂群算法(artificial bee colony,ABC)是由土耳其學(xué)者Karaboga于2005年提出模擬蜜蜂尋覓花蜜過程的一種群體智能算法[6]。在人工蜂群的框架下,蜜源的位置表示要優(yōu)化問題的可能候選解,蜜源中花蜜的數(shù)量與候選解的適應(yīng)度(目標(biāo)值函數(shù))相對應(yīng),而蜂群的規(guī)模等于待優(yōu)化解的數(shù)量。ABC算法更新種群采用隨機(jī)選取的方法,在ABC算法搜索過程中存在收斂速度較慢、不能實(shí)現(xiàn)全局收斂的問題,針對此問題,提出改進(jìn)的人工蜂群算法(improved artificial bee colony,IABC),在對蜜源更新公式中引入柯西變異算子[7]。同時改進(jìn)隨機(jī)解生成方法,隨著迭代次數(shù)增加,步長從一個較小的數(shù)逐漸增長到一個較大數(shù)值。改進(jìn)后的算法保證模型前期能夠進(jìn)行全面的局部搜索,且后期保持全局搜索能力,并加快收斂速度。

設(shè)初始種群含有NP個解,每個解xi(i=1,2,…,NP)為一個d維向量,對應(yīng)的解的適應(yīng)度值fit,個體最大更新次數(shù)為G,最大迭代次數(shù)為T。具體步驟為

第1步:初始階段,隨機(jī)產(chǎn)生蜜源的初始位置,即

xij=xmin+logTt(xmax-xmin)

(3)

第2步:初始蜜源周圍搜索產(chǎn)生一個新的蜜源,即

vij=(xij+xij×Cij)+φij(xij-xkj)

(4)

其中,Cij為對應(yīng)xij服從柯西分布C(0,1)的隨機(jī)數(shù),k∈{i=1,2,…,NP},j∈{1,2,…,d}且k≠i。φij為[-1,1]內(nèi)的隨機(jī)數(shù)。

第3步:評價蜜源的適用度,如果新的蜜源適應(yīng)度高于原先的蜜源,則新的蜜源代替原先的蜜源,否則保留原先的蜜源,即

(5)

其中fi為解的函數(shù)值。此外,基于輪盤賭原則,找到新蜜源被跟隨的概率Pi為

(6)

某蜜源經(jīng)過G次循環(huán)后沒有得到優(yōu)化,則放棄該蜜源尋找下一個。若運(yùn)算迭代次數(shù)達(dá)到T或者最優(yōu)適應(yīng)度,運(yùn)算結(jié)束,否則返回式(4),迭代出最優(yōu)解。

2 實(shí)驗(yàn)部分

2.1 儀器與樣品

本次實(shí)驗(yàn)使用的山羊血清為經(jīng)過無菌過濾處理的山羊血清,血清蛋白初始濃度為0.042 34 g·mL-1。實(shí)驗(yàn)中用于稀釋血清濃度的試劑為生理鹽水,生理鹽水對實(shí)驗(yàn)結(jié)果影響極小且不影響生物樣本的活性。按體積比配置不同濃度的血清蛋白樣本,配置的單個液體樣本體積為3 mL,共計(jì)35組,隨機(jī)選取8組實(shí)驗(yàn)樣本作為模型測試集,剩余27組作為模型訓(xùn)練集。配置好的樣本在4 ℃恒溫箱中靜置24 h,確保樣本混合均勻。光譜測量過程中易受外界光干擾,所以在實(shí)驗(yàn)中進(jìn)行避光處理,防止外界干擾。

本次實(shí)驗(yàn)使用的是BWS465-785S型拉曼光譜儀,由美國必達(dá)泰克公司生產(chǎn),光譜測量范圍0~3 500 cm-1,激發(fā)光源波長為785 nm,設(shè)置拉曼光譜激光功率為300 mW,每個樣本連續(xù)掃描取光譜穩(wěn)定后的數(shù)值,積分時間10 000 ms,光譜儀的采集分辨率為5 cm-1。

2.2 光譜采集與數(shù)據(jù)處理

使用拉曼光譜儀采集樣本拉曼光譜,通過BWRam4軟件進(jìn)行光譜讀取。測量光譜前,將拉曼光譜儀打開預(yù)熱20 min。用超純水清洗樣品池,控干池內(nèi)水分,并使用擦鏡紙清理樣品池表面(測量各組樣品前重復(fù)此步驟)。將試劑樣本緩慢移入樣品池,避免氣泡進(jìn)入,放入遮光罩中進(jìn)行避光處理,待樣品靜置2 min后,進(jìn)行光譜采集。拉曼光譜處理過程如圖1所示。

通過對圖1分析可知,隨著樣品中血清蛋白濃度變化,拉曼光譜原始數(shù)據(jù)強(qiáng)度發(fā)生明顯變化。原始光譜信噪比較高,影響了對特征峰的觀察和數(shù)據(jù)處理。在建模之前對數(shù)據(jù)進(jìn)行預(yù)處理,隨機(jī)選取一條拉曼光譜為例進(jìn)行處理。

每組樣品采集前進(jìn)行暗電流采集并扣除。采集的原始拉曼光譜如圖1(a)所示(選取光譜范圍300~1 300 cm-1)。為了消除CCD噪聲、采集電路的噪聲以及激光功率抖動等對拉曼信號強(qiáng)度的影響,同時簡化計(jì)算量,采用平滑處理、背景扣除、歸一化三種預(yù)處理方法對測得的原始拉曼光譜進(jìn)行數(shù)據(jù)預(yù)處理。平滑采用Savitzky-Golay平滑法進(jìn)行處理,該方法在濾除噪聲的同時可保持原信號譜寬、強(qiáng)度及形狀不發(fā)生改變,其濾波原理是局部多項(xiàng)式時域最小二乘法擬合[8],處理結(jié)果如圖1(b)所示;背景扣除采用扣除基線的方法,采用非對稱最小二乘平滑建立基線,可將有效拉曼信號保存下來,去除掉背景熒光信號如圖1(c)所示,黑色線代表拉曼光譜數(shù)據(jù),紅色線代表需要扣除的基線;數(shù)據(jù)歸一化處理的作用是簡化計(jì)算,縮小量值,提高數(shù)學(xué)預(yù)測模型的準(zhǔn)確度,如圖1(d)所示,黑色線代表拉曼光譜扣除基線后的數(shù)據(jù),紅色線代表執(zhí)行歸一化處理后的數(shù)據(jù)。

圖1 拉曼光譜處理過程(a):原始拉曼光譜;(b):平滑處理;(c):背景基線扣除;(d):歸一化處理Fig.1 Raman processing(a):26 groups of original Raman spectra;(b):Smoothing processing;(c):Background baseline deduction;(d):Normalization

2.3 特征峰歸屬

經(jīng)過處理的山羊血清樣本拉曼光譜,在379.05,451.87,568.07,636.12,709.73,797.08,864.21,920.15,1 009.95和1 072.24 cm-1處表現(xiàn)出明顯的特征峰,如圖1(d)所示。通過比對,對山羊血清蛋白特征峰進(jìn)行歸屬[9-10],峰值標(biāo)記如圖2所示,特征峰歸屬如表1所示。

圖2 血清蛋白拉曼光譜特征峰Fig.2 Characteristic peak of Raman spectrum of serum protein

表1 血清蛋白特征峰及其歸屬Table 1 Characteristic peak of serum protein and its attribution

3 結(jié)果與討論

在35組實(shí)驗(yàn)樣品中隨機(jī)選取27組樣本作訓(xùn)練集,通過拉曼光譜的數(shù)據(jù)采集及預(yù)處理,提取的特征峰強(qiáng)度值和訓(xùn)練集已知濃度信息作為輸入,余下8組樣本作為測試集,同訓(xùn)練集一樣,將特征峰強(qiáng)度作為模型的輸入,通過模型運(yùn)算的濃度信息作為輸出。分別建立基于改進(jìn)人工蜂群算法優(yōu)化支持向量機(jī)回歸算法(IABC-SVR)的預(yù)測模型和人工蜂群算法優(yōu)化支持向量機(jī)回歸算法(ABC-SVR)模型,并與經(jīng)典BP(back propagation)神經(jīng)網(wǎng)絡(luò)算法建模結(jié)果比較。IABC屬于迭代優(yōu)化,可優(yōu)化SVR中的懲罰因子C和函數(shù)參數(shù)σ,以提升該模型的泛化能力及預(yù)測精度。建立IABC-SVR模型流程如圖3所示。

圖3 建模過程流程Fig.3 Modeling process flow chart

將測試集已知血清蛋白濃度與預(yù)測結(jié)果進(jìn)行均方差運(yùn)算來評價模型精準(zhǔn)度,相關(guān)系數(shù)來評價模型預(yù)測關(guān)聯(lián)度。樣本為M的均方誤差定義為

(7)

均方根誤差可以顯示出預(yù)測結(jié)果與真實(shí)結(jié)果平方和的平均數(shù),由于對誤差進(jìn)行了平方處理,就避免了誤差出現(xiàn)正負(fù)值而相抵消的情況,從而提高了對誤差分析的準(zhǔn)確性。相關(guān)系數(shù)r定義為

(8)

r值越接近 1,則反映定量預(yù)測模型精度越高,預(yù)測集建模相關(guān)度曲線如圖4所示,相關(guān)系數(shù)為0.990 27,顯示出極高的相關(guān)性,表明模型結(jié)果較好。預(yù)測結(jié)果殘差如圖5所示,殘差均小于0.001 g·mL-1,預(yù)測準(zhǔn)確率為99.8%。

圖4 模型測試集中真實(shí)值與預(yù)測值相關(guān)度擬合Fig.4 Correlation curve between actual value and predicted value in model test set

圖5 模型預(yù)測值殘差Fig.5 Residual of model prediction

將數(shù)據(jù)分別導(dǎo)入ABC-SVR 算法和BP神經(jīng)網(wǎng)路算法進(jìn)行建模,并將預(yù)測模型進(jìn)行對比,建模結(jié)果如圖6所示,得到的各模型均方差(MSE),相關(guān)系數(shù)(r)與建模時間(Time)如表2所示。

圖6 三種模型預(yù)測結(jié)果中真實(shí)值與預(yù)測值相關(guān)度曲線Fig.6 Correlation curve between actual value and predicted value in three models’ prediction results

表2 三種建模方法模型評價結(jié)果Table 2 Evaluation results of three modeling methods

由表2可知,經(jīng)典BP神經(jīng)網(wǎng)絡(luò)算法的預(yù)測精度低于ABC-SVR算法建模精度,IABC-SVR算法預(yù)測模型在ABC-SVR算法基礎(chǔ)上有明顯提升,說明IABC-SVR算法能較好的避免局部最優(yōu)解,有較好的全局搜索能力。建模時間為1.9 s,具有更好的工作效率。由實(shí)驗(yàn)結(jié)果可以看出,文中提出的基于IABC-SVR算法預(yù)測模型定量分析山羊血清蛋白總量的方法能有效實(shí)現(xiàn)預(yù)期功能,并在ABC-SVR算法基礎(chǔ)上提高了精度,加快了算法收斂運(yùn)算速度,達(dá)到了更好的效果。

4 結(jié) 論

提出了一種基于拉曼光譜和IABC-SVR算法對山羊血清蛋白含量快速、無損的定量檢測方法。拉曼光譜儀采集實(shí)驗(yàn)樣本光譜,結(jié)合三種光譜預(yù)處理的方法對原光譜進(jìn)行處理,標(biāo)定的光譜特征峰強(qiáng)度作為模型輸入;針對傳統(tǒng)人工蜂群算法在區(qū)域規(guī)模較大時收斂速度逐漸減慢,會出現(xiàn)效率低、精準(zhǔn)度下降、局部最優(yōu)解概率高等弊端,改進(jìn)了蜂群的初始化和位置更新方法,旨在提高預(yù)測模型的全局搜索能力和準(zhǔn)確性;建立了IABC-SVR山羊血清蛋白定量檢測模型,對山羊血清蛋白總含量進(jìn)行定量分析。結(jié)果表明,該方法能快速、準(zhǔn)確、無損的預(yù)測山羊血清蛋白總量,具有較高的可行性。建立模型的相關(guān)系數(shù)為0.990 27,均方誤差為0.244 3,建模時間為1.9 s,預(yù)測準(zhǔn)確率為99.8%。說明該方法能較好的完成山羊血清蛋白總量的快速定量分析。在下一步的實(shí)驗(yàn)中,將樣品的濃度梯度進(jìn)一步細(xì)化,增加模型的訓(xùn)練集和測試集,提升模型的精度和預(yù)測能力。

猜你喜歡
曼光譜蜜源蜂群
貴州寬闊水國家級自然保護(hù)區(qū)蜜源植物資源調(diào)查研究*
林下拓蜜源 蜂業(yè)上臺階
“蜂群”席卷天下
指示蜜源的導(dǎo)蜜鳥
改進(jìn)gbest引導(dǎo)的人工蜂群算法
蜂群夏季高產(chǎn)管理
我有我味道
跟我一起來跳舞
BMSCs分化為NCs的拉曼光譜研究
便攜式薄層色譜-拉曼光譜聯(lián)用儀重大專項(xiàng)獲批
新丰县| 柳州市| 临潭县| 郎溪县| 津南区| 双江| 宾川县| 无棣县| 南投市| 大连市| 遵义市| 扶余县| 宾川县| 铁力市| 秦皇岛市| 长汀县| 岱山县| 三门峡市| 渑池县| 晴隆县| 莒南县| 古田县| 嵊泗县| 通道| 任丘市| 高邑县| 玉屏| 留坝县| 新蔡县| 颍上县| 隆林| 原平市| 乐昌市| 赤城县| 来宾市| 布尔津县| 海盐县| 江达县| 宁陕县| 出国| 富锦市|