王慧鋒 黃飛 顧震 胡正利 應(yīng)佚倫 顏秉勇 龍億濤
摘 要 為實(shí)現(xiàn)納米孔道單分子檢測(cè)中對(duì)微弱電流信號(hào)的快速精準(zhǔn)處理,考察了納米孔道實(shí)驗(yàn)數(shù)據(jù)的信號(hào)特征,提出了基于雙緩沖數(shù)據(jù)結(jié)構(gòu)和有限沖擊響應(yīng)濾波的實(shí)時(shí)自適應(yīng)閾值法,并基于這一算法設(shè)計(jì)了納米孔道信號(hào)在線識(shí)別與分析系統(tǒng),實(shí)現(xiàn)了實(shí)驗(yàn)數(shù)據(jù)實(shí)時(shí)采集存儲(chǔ)和信號(hào)在線分析處理的同步進(jìn)行。為驗(yàn)證所建立的納米孔道信號(hào)在線識(shí)別和分析系統(tǒng)性能,采用噪音為20~100 pA和帶寬區(qū)間為3~100 kHz的仿真信號(hào)進(jìn)行信號(hào)識(shí)別分析。結(jié)果表明,本系統(tǒng)能夠滿足強(qiáng)噪聲、低帶寬、高采樣率(250 kHz)環(huán)境下對(duì)實(shí)驗(yàn)數(shù)據(jù)處理的要求。將此系統(tǒng)應(yīng)用于單個(gè)poly(dA)4分子的Aerolysin納米孔道分析實(shí)驗(yàn)中,實(shí)驗(yàn)結(jié)果表明,本系統(tǒng)能夠?qū)Υ髷?shù)據(jù)量的納米孔道實(shí)驗(yàn)數(shù)據(jù)進(jìn)行實(shí)時(shí)、快速、精準(zhǔn)的分析處理。
關(guān)鍵詞 納米孔道; 實(shí)時(shí)采集存儲(chǔ); 在線分析處理; 雙緩沖區(qū); 自適應(yīng)閾值法
1 引 言
納米孔道檢測(cè)技術(shù)是一種快速靈敏、無(wú)需標(biāo)記、低成本的單分子分析技術(shù),具有巨大的應(yīng)用潛力[1~3]。目前,納米孔道已經(jīng)被成功應(yīng)用于DNA[4~6]、RNA[7]、蛋白質(zhì)[8,9]、多肽[10,11]以及金屬離子[12]等物質(zhì)的研究中。納米孔道檢測(cè)平臺(tái)主要包括納米孔檢測(cè)池、數(shù)據(jù)采集裝置及信號(hào)處理軟件3個(gè)部分。檢測(cè)過(guò)程中,在外加電場(chǎng)的驅(qū)動(dòng)下,待測(cè)物質(zhì)穿越納米孔道時(shí)會(huì)改變孔道阻抗,使得流經(jīng)納米孔道的離子電流發(fā)生變化,形成阻斷事件(圖1),這些事件的阻斷幅值、阻斷時(shí)間、頻率及形狀等信息是研究被測(cè)物質(zhì)組成、結(jié)構(gòu)的重要依據(jù)[13]。因此,通過(guò)對(duì)待測(cè)分析物穿越納米孔道時(shí)產(chǎn)生的微弱(pA級(jí)別)電流數(shù)據(jù)進(jìn)行基線分析和事件識(shí)別,并完成阻斷事件的提取分析和統(tǒng)計(jì)處理(圖1B),能夠?qū)崿F(xiàn)在單分子水平上對(duì)待測(cè)分析物個(gè)體行為信息的解讀[14]。
為了精確地還原和分析待測(cè)物質(zhì)的組成和結(jié)構(gòu)等信息,一方面需要采用高精度、低噪聲的電流放大器[15]結(jié)合高速數(shù)據(jù)采集儀器完成實(shí)驗(yàn)數(shù)據(jù)的測(cè)量和采集;另一方面需要從復(fù)雜多變的測(cè)量數(shù)據(jù)中提取有用的分析信號(hào)。現(xiàn)有的納米孔道數(shù)據(jù)分析軟件包括OpenNanopore[16]、Transalyzer[17]、MOSAIC[18]及本課題組研發(fā)的Nanopore Analysis[19~21]。這些軟件需要在數(shù)據(jù)采集完成后才能對(duì)數(shù)據(jù)進(jìn)行阻斷事件檢測(cè)、提取和修正等處理[16,17,20]。實(shí)驗(yàn)中,由于高速(采樣頻率>100 kHz)連續(xù)采集獲取的數(shù)據(jù)量巨大(GB級(jí)別),上述處理步驟會(huì)消耗大量處理時(shí)間,降低了納米孔道數(shù)據(jù)的分析效率。因此,研究和開(kāi)發(fā)納米孔道信號(hào)在線識(shí)別與分析系統(tǒng)對(duì)于納米孔道單分子檢測(cè)技術(shù)的發(fā)展和應(yīng)用具有重要意義。
本研究建立了能夠?qū)崟r(shí)采集、識(shí)別、分析以及存儲(chǔ)納米孔道測(cè)量數(shù)據(jù)的在線識(shí)別與分析系統(tǒng)。此系統(tǒng)實(shí)現(xiàn)了納米孔道電流阻斷事件的在線識(shí)別和分析,能夠在獲取和存儲(chǔ)實(shí)驗(yàn)數(shù)據(jù)的同時(shí)完成實(shí)驗(yàn)數(shù)據(jù)的處理,使得研究人員在實(shí)驗(yàn)過(guò)程中即可獲取待測(cè)物穿過(guò)納米孔道的統(tǒng)計(jì)信息。為驗(yàn)證此系統(tǒng)的實(shí)時(shí)性和準(zhǔn)確度,采用仿真信號(hào)以及實(shí)際實(shí)驗(yàn)對(duì)系統(tǒng)進(jìn)行了測(cè)試。
2 實(shí)驗(yàn)部分
2.1 實(shí)驗(yàn)設(shè)計(jì)
2.1.1 試劑 納米孔道蛋白(Aerolysin,實(shí)驗(yàn)室自制);正癸烷(≥99%,美國(guó)Sigma-Aldrich公司);1,2-Diphytanoly-sn-glycero-3-phosphocholine(氯仿,≥99%,美國(guó)Avanti Polar Lipids 公司)。檢測(cè)池中的緩沖液由1 mol/L KCl、10 mmol/L Tris-HCl, 1 mmol/L EDTA配制而成,pH 8.0。所有試劑均為分析純。待測(cè)分子poly(dA)4由上海生科公司合成并通過(guò)高效液相色譜提純。
2.1.2 仿真信號(hào)實(shí)驗(yàn) 采用任意波形函數(shù)發(fā)生器(AFG3052C,Tektronix公司)模擬生成仿真實(shí)驗(yàn)所需的帶寬為3~100 kHz、噪聲為20~100 pA、阻斷時(shí)間為150~350 μs的仿真實(shí)驗(yàn)信號(hào),并將信號(hào)輸入到本研究組自主研發(fā)的納米孔道單分子電化學(xué)工作站(Cube-D1)[22],進(jìn)行實(shí)驗(yàn)信號(hào)的采集、調(diào)理和發(fā)送。采用自主研發(fā)的納米孔道信號(hào)在線識(shí)別與分析系統(tǒng)(SmartNanopore V1.04)通過(guò)USB接口完成數(shù)據(jù)的接收與轉(zhuǎn)換,對(duì)仿真信號(hào)進(jìn)行在線識(shí)別、分析和存儲(chǔ)。仿真實(shí)驗(yàn)的時(shí)間均設(shè)置為30 s,Cube-D1的數(shù)據(jù)采樣頻率為250 kHz,事件檢測(cè)閾值設(shè)置為基線噪聲標(biāo)準(zhǔn)差的5倍。
2.1.3 納米孔道實(shí)驗(yàn) 首先,將1,2-Diphytanoly-sn-glycero-3-phosphocholine溶解于30 mg/mL正癸烷中,并涂抹在直徑為150 μm的裝有緩沖液的液池孔(美國(guó)Warner Instruments公司)上,形成磷脂雙分子層。如圖1A所示,檢測(cè)池的兩端分別為cis室和trans室。在cis端注射入Aerolysin蛋白單體。Aerolysin蛋白單體將在磷脂雙分子層上自組裝形成納米尺寸的蛋白孔道結(jié)構(gòu)。隨后,在液池兩端分別置入Ag/AgCl電極,在實(shí)驗(yàn)過(guò)程中施加100 mV的偏置電壓。待測(cè)分子從cis端注入。使用Cube-D1進(jìn)行電流信號(hào)采集。兩個(gè)電極分別連接到的探頭正負(fù)端,由Cube-D1進(jìn)行電流數(shù)據(jù)的檢測(cè)和傳輸。獲取的電流數(shù)據(jù)通過(guò)USB接口連接到SmartNanopore上進(jìn)行分析研究。
2.2 系統(tǒng)總體設(shè)計(jì)
納米孔道信號(hào)在線識(shí)別與分析系統(tǒng)采用面向?qū)ο蠛湍K化設(shè)計(jì)思想,結(jié)合Open Graphics Library(OpenGL)圖形接口技術(shù)和Immediate mode graphical user interface (IMGUI)實(shí)現(xiàn)模式,運(yùn)用C/C++混合語(yǔ)言編寫實(shí)現(xiàn)。整個(gè)系統(tǒng)包含了USB通信模塊、參數(shù)設(shè)置模塊、曲線顯示模塊、信息記錄模塊以及數(shù)據(jù)分析模塊等部分。
其中,USB通信模塊用于數(shù)據(jù)采集裝置與信號(hào)在線識(shí)別分析系統(tǒng)之間的指令發(fā)送以及數(shù)據(jù)傳輸。參數(shù)設(shè)置模塊用于納米孔道實(shí)驗(yàn)參數(shù)(包括采樣頻率、濾波頻率、命令電壓以及偏移校準(zhǔn)等)的設(shè)置。曲線顯示模塊包含坐標(biāo)設(shè)置、電流曲線以及電壓曲線3個(gè)子模塊,用于監(jiān)測(cè)實(shí)驗(yàn)過(guò)程中納米孔道阻塞情況、納米孔道數(shù)量及物質(zhì)穿孔狀態(tài)等信息。信息記錄模塊用于記錄原始實(shí)驗(yàn)數(shù)據(jù)、阻斷事件信息及阻斷電流數(shù)據(jù),用戶可以根據(jù)需求選擇需要保存的內(nèi)容。數(shù)據(jù)分析模塊采用基于雙緩沖結(jié)構(gòu)的實(shí)時(shí)自適應(yīng)閾值法(詳細(xì)分析見(jiàn)2.3節(jié)數(shù)據(jù)分析模塊)完成對(duì)阻斷事件的檢測(cè),從而獲取局部電流基線、起始位置、終止位置、阻斷幅值、阻斷時(shí)間等阻斷事件基本信息[16~18,20,23]。
2.3 數(shù)據(jù)分析模塊
納米孔道測(cè)量數(shù)據(jù)的采集實(shí)驗(yàn)呈現(xiàn)頻率快、數(shù)量多、噪音大等特點(diǎn),給數(shù)據(jù)分析模塊的設(shè)計(jì)和實(shí)現(xiàn)帶來(lái)了挑戰(zhàn)。為了實(shí)時(shí)精確地完成阻斷事件的識(shí)別和分析,數(shù)據(jù)分析模塊在設(shè)計(jì)時(shí)考慮了實(shí)時(shí)性、穩(wěn)定性、快速性等原則,其具體的模塊功能結(jié)構(gòu)如圖2所示。首先,本模塊設(shè)計(jì)了雙緩沖結(jié)構(gòu)來(lái)解決高速采樣數(shù)據(jù)的實(shí)時(shí)緩存問(wèn)題。雙緩沖結(jié)構(gòu)借鑒了乒乓緩存(Ping-pong buffers)技術(shù)[24]的工作原理,緩沖區(qū)1與緩沖區(qū)2交替接收來(lái)自USB通信模塊的實(shí)驗(yàn)數(shù)據(jù),同時(shí)另一緩沖區(qū)的數(shù)據(jù)用于進(jìn)行阻斷事件的識(shí)別和分析。通過(guò)緩沖區(qū)1與緩沖區(qū)2之間的配合和切換,提高實(shí)驗(yàn)數(shù)據(jù)的緩存和處理速度,實(shí)現(xiàn)數(shù)據(jù)的無(wú)縫傳輸和處理。此結(jié)構(gòu)的使用簡(jiǎn)化了阻斷事件識(shí)別分析算法的設(shè)計(jì)流程,節(jié)約了緩存數(shù)據(jù)的內(nèi)存空間,從而降低了分析模塊對(duì)硬件資源的消耗,確保數(shù)據(jù)的實(shí)時(shí)快速處理。
對(duì)于雙緩沖結(jié)構(gòu)中緩存的納米孔道電流數(shù)據(jù),需要根據(jù)數(shù)據(jù)特征設(shè)計(jì)適當(dāng)?shù)姆治鏊惴▉?lái)實(shí)時(shí)完成對(duì)阻斷事件的識(shí)別、提取和分析。在納米孔道離線分析軟件中,通常采用閾值法[16,17,20]進(jìn)行阻斷事件識(shí)別。然而,傳統(tǒng)閾值法需要預(yù)知電流基線等先驗(yàn)信息,并且計(jì)算復(fù)雜度高、耗時(shí)長(zhǎng),無(wú)法滿足在線識(shí)別的要求。為此,本研究根據(jù)在線處理要求對(duì)傳統(tǒng)閾值法進(jìn)行了改進(jìn),引入了有限沖擊響應(yīng)濾波(FIR filter)方法[25]對(duì)電流基線進(jìn)行降噪分析,并據(jù)此設(shè)計(jì)了用于阻斷事件在線識(shí)別分析的實(shí)時(shí)自適應(yīng)閾值法。
實(shí)時(shí)自適應(yīng)閾值法針對(duì)測(cè)量數(shù)據(jù)的基線、噪聲以及形態(tài)特征進(jìn)行了定制化改進(jìn)。文獻(xiàn)[16,17,20]中指出,納米孔道的測(cè)量數(shù)據(jù)滿足公式(1):
所提出的自適應(yīng)閾值法在進(jìn)行阻斷事件分析時(shí),首先根據(jù)采集的電流基線數(shù)據(jù)計(jì)算出基線的平均值,作為FIR法追蹤電流基線變化的初始值Ibaseline(t-1)。此后,所述閾值法根據(jù)式(4)自適應(yīng)跟蹤電流基線變化。當(dāng)檢測(cè)到低于設(shè)定閾值的阻斷事件時(shí),所述閾值法會(huì)從FIR法分析電流基線過(guò)程切換到阻斷事件信息分析過(guò)程。在進(jìn)行阻斷事件信息分析時(shí),阻斷事件的局部電流基線保持事件發(fā)生前的數(shù)值不變,以此來(lái)保證電流基線數(shù)據(jù)分析的準(zhǔn)確性。此外,所述閾值法引入了本研究組近期提出的二階差分校正法(DBC)和電流積分法[20]以實(shí)現(xiàn)對(duì)不同持續(xù)時(shí)間的阻斷事件進(jìn)行分析。
基于雙緩沖結(jié)構(gòu)和FIR法的自適應(yīng)閾值法能夠?qū)崟r(shí)掃描緩沖區(qū)中的實(shí)驗(yàn)電流數(shù)據(jù)并跟隨基線的波動(dòng),當(dāng)出現(xiàn)低于設(shè)定閾值的阻斷事件時(shí),能立即從原始實(shí)驗(yàn)數(shù)據(jù)中定位、識(shí)別、回溯和追蹤得到完整的阻斷事件數(shù)據(jù),并同步進(jìn)行阻斷事件基本信息的分析和記錄。
3 結(jié)果與討論
3.1 仿真信號(hào)的產(chǎn)生
首先采用仿真信號(hào)進(jìn)行性能測(cè)試。生物納米孔道實(shí)驗(yàn)獲取的阻斷事件的阻斷幅值(ΔI)通常為101~102 pA,阻斷時(shí)間(Δt)在102 μs級(jí)別。因此,在仿真實(shí)驗(yàn)時(shí),本研究采用ΔI=100 pA, Δt分別為150、200、250、300及350 μs的仿真信號(hào)進(jìn)行測(cè)試。為了更真實(shí)地模擬實(shí)際實(shí)驗(yàn)信號(hào),在生成仿真信號(hào)時(shí)考慮了噪聲以及帶寬對(duì)信號(hào)形態(tài)的影響。噪聲的影響會(huì)造成阻斷事件電流幅值上的變化,圖3A為5種不同電流噪音峰-峰值(Ip-p)的仿真信號(hào)(Δt=300 μs),其附加的噪聲均為高斯白噪音。5種噪音的譜密度曲線如圖3B所示,由于未進(jìn)行低通濾波,在大于1 kHz的高頻區(qū)域噪音具有較高能量,且噪音越大,在頻域的能量越高,相比實(shí)際實(shí)驗(yàn)系統(tǒng)有更高的噪音[15,26]。帶寬(fC)的影響會(huì)導(dǎo)致阻斷事件波形上升沿和下降沿的變化(圖3C所示,Ip-p=40 pA, Δt=300 us), 系統(tǒng)帶寬越低,事件波形的畸變程度越大。
3.2 噪聲對(duì)系統(tǒng)性能的影響
納米孔道采集的實(shí)驗(yàn)信號(hào)為pA級(jí)微弱電流,易受檢測(cè)裝置及其周圍環(huán)境的影響而引入噪聲。噪聲的增加會(huì)給阻斷事件的識(shí)別與分析帶來(lái)困難。為檢驗(yàn)所述系統(tǒng)在噪聲干擾下的準(zhǔn)確度,采用函數(shù)發(fā)生器分別生成圖3A所示的不同噪音(20~100 pA)下的阻斷事件(fC=10 kHz, Δt為150~350 μs)各3000個(gè)進(jìn)行實(shí)驗(yàn)。采用本系統(tǒng)進(jìn)行數(shù)據(jù)采集和信號(hào)分析,分析結(jié)果以文件的形式實(shí)時(shí)存儲(chǔ)在計(jì)算機(jī)中。對(duì)系統(tǒng)識(shí)別的阻斷事件信息進(jìn)行統(tǒng)計(jì)分析,得出噪聲影響下阻斷事件檢出數(shù)、電流基線以及阻斷幅值的誤差率結(jié)果,如圖4所示,其誤差率均采用公式(5)計(jì)算得出:
Error rate=|ValueR-ValueI|ValueI×100%(5)
其中,ValueR表示由數(shù)據(jù)分析模塊得出的阻斷事件信息的實(shí)際值, ValueI表示阻斷事件信息的理想值。
由圖4A可見(jiàn),當(dāng)Ip-p≤60 pA時(shí),事件檢出數(shù)誤差率<0.2%。隨著噪聲增加到100 pA,阻斷事件檢出數(shù)誤差率會(huì)由于誤檢測(cè)事件數(shù)的增加而上升,但始終維持在1%以下。仿真實(shí)驗(yàn)的電流基線Ibaseline理想值為100 pA。實(shí)驗(yàn)時(shí),為了濾除噪聲對(duì)基線的影響,電流基線是通過(guò)對(duì)FIR法分析出的阻斷事件局部電流基線進(jìn)行高斯擬合得出的。噪聲對(duì)電流基線的影響如圖4B所示,信號(hào)中噪聲強(qiáng)度的增加會(huì)使基線檢測(cè)誤差增大。比較圖4B中Δt為150~350 μs的仿真信號(hào)實(shí)驗(yàn)結(jié)果可知,Δt=350 μs的阻斷事件受噪聲影響程度最小,在Ip-p=100 pA時(shí)其誤差率僅為0.4%;Δt=150 μs的事件受噪聲影響程度最大,但在Ip-p=100 pA時(shí)其誤差率也僅為1.1%。通過(guò)對(duì)不同噪聲環(huán)境下阻斷幅值的實(shí)際值和理想值進(jìn)行分析,進(jìn)一步得出了阻斷幅值檢測(cè)的誤差結(jié)果,如圖4C所示,系統(tǒng)對(duì)阻斷幅值的檢測(cè)會(huì)受到噪聲的影響,噪聲越大,檢測(cè)誤差越大,其最大誤差≤3%。綜合圖4的研究結(jié)果可知,在實(shí)際實(shí)驗(yàn)條件下(Ip-p≤40 pA),本系統(tǒng)能夠?qū)⒄`差控制在1.5%以內(nèi)。
3.3 帶寬對(duì)系統(tǒng)性能的影響
在納米孔道檢測(cè)實(shí)驗(yàn)中,為了濾除檢測(cè)數(shù)據(jù)中高頻噪聲的干擾,通常會(huì)在數(shù)據(jù)采集裝置中加入不同截止頻率的低通濾波器,其濾波頻率一般設(shè)置為3、5、10及100 kHz等。低通濾波會(huì)導(dǎo)致阻斷事件的上升時(shí)間Tr發(fā)生變化[20,23],這一變化導(dǎo)致的波形畸變會(huì)對(duì)阻斷事件的分析產(chǎn)生影響。為了研究本系統(tǒng)在不同帶寬下的性能,對(duì)圖3C所示的5種帶寬下的仿真信號(hào)進(jìn)行了采集和處理實(shí)驗(yàn),結(jié)果如圖5所示。
由圖5A可見(jiàn),帶寬會(huì)對(duì)阻斷事件檢出數(shù)產(chǎn)生影響。帶寬越低,事件受帶寬影響產(chǎn)生的畸變?cè)酱螅钄嗍录z出數(shù)誤差率越高。當(dāng)帶寬>10 kHz時(shí),阻斷事件檢出數(shù)誤差率≤0.1%。為了評(píng)估不同帶寬對(duì)阻斷時(shí)間的影響,本研究計(jì)算了阻斷時(shí)間平均相對(duì)誤差率(Mean relative error rate,MRER):
其中,N為一次實(shí)驗(yàn)中相同阻斷時(shí)間的阻斷事件檢出數(shù),ΔtR為系統(tǒng)分析得出的阻斷時(shí)間,ΔtI為阻斷時(shí)間的理想值。不同帶寬對(duì)阻斷時(shí)間檢測(cè)的影響如圖5B所示,帶寬越低,系統(tǒng)檢測(cè)阻斷時(shí)間的誤差越大,帶寬為3 kHz時(shí),MRER的最大值約為6%。隨著帶寬的增大,MRER會(huì)逐漸降低。這一結(jié)果說(shuō)明帶寬降低導(dǎo)致的阻斷事件上升時(shí)間Tr的增加會(huì)對(duì)系統(tǒng)的檢測(cè)性能產(chǎn)生影響。同時(shí),對(duì)比圖5B中阻斷時(shí)間不同的事件的分析結(jié)果可知,時(shí)間越短的事件受帶寬影響產(chǎn)生的誤差越大,反之時(shí)間越長(zhǎng)的事件受帶寬影響越小。圖5表明,在實(shí)際實(shí)驗(yàn)帶寬下(3~10 kHz),系統(tǒng)檢測(cè)性能受帶寬影響程度較大,但其誤差均在6%以內(nèi)。綜合圖4和圖5的分析結(jié)果可知,本系統(tǒng)能夠滿足實(shí)驗(yàn)環(huán)境下對(duì)納米孔道測(cè)量數(shù)據(jù)的實(shí)時(shí)分析要求。
3.4 Aerolysin納米孔道信號(hào)在線識(shí)別與分析
為了測(cè)試納米孔道信號(hào)在線識(shí)別與分析系統(tǒng)在采集和分析實(shí)際實(shí)驗(yàn)數(shù)據(jù)時(shí)的性能,本研究采用Aerolysin納米孔進(jìn)行了poly(dA)4分子的納米孔道分析實(shí)驗(yàn)。 Cube-D1的截止頻率設(shè)置為10 kHz,采樣頻率設(shè)置為250 kHz,系統(tǒng)檢測(cè)閾值設(shè)置為基線噪音標(biāo)準(zhǔn)差的5倍。實(shí)驗(yàn)中采集的原始電流數(shù)據(jù)、系統(tǒng)數(shù)據(jù)分析模塊識(shí)別的阻斷事件數(shù)據(jù)以及分析得出的阻斷事件信息均保存在計(jì)算機(jī)的硬盤中。
圖6A是poly(dA)4分子的Aerolysin納米孔道分析實(shí)驗(yàn)中采集到的一段時(shí)間為4 s的原始電流數(shù)據(jù),其基線數(shù)據(jù)的噪音譜密度曲線如圖6B所示,對(duì)比圖3B可知,實(shí)驗(yàn)信號(hào)的噪音在高頻區(qū)域的能量低于仿真信號(hào),因此本研究所述算法能夠滿足實(shí)驗(yàn)噪聲下的分析要求。在采集原始電流數(shù)據(jù)的同時(shí),系統(tǒng)的數(shù)據(jù)分析模塊實(shí)時(shí)對(duì)原始數(shù)據(jù)的基線進(jìn)行分析,
得出平穩(wěn)的局部電流基線(圖6A中白色曲線所示)。根據(jù)局部基線和設(shè)定的閾值,本系統(tǒng)能夠在采集存儲(chǔ)數(shù)據(jù)時(shí)同步進(jìn)行阻斷事件識(shí)別分析。在圖6A所示的這段原始數(shù)據(jù)中, 共檢測(cè)到30個(gè)阻斷事件(紅色標(biāo)記)。圖6C中藍(lán)色曲線示出了圖6A中檢測(cè)到的第10個(gè)阻斷事件(典型阻斷事件),系統(tǒng)分析模塊得出其局部電流基線值為45.71 pA,阻斷幅值為23.81 pA,阻斷時(shí)間為5.764 ms。對(duì)比原始電流數(shù)據(jù)(藍(lán)色)和算法分析結(jié)果(紅色)可知,系統(tǒng)能夠準(zhǔn)確分析出這類事件的阻斷基本信息。圖6D是系統(tǒng)檢測(cè)到的阻斷時(shí)間較短的阻斷事件(藍(lán)色),由于實(shí)驗(yàn)儀器的低通濾波影響,這些短事件波形會(huì)發(fā)生畸變[20]。系統(tǒng)的數(shù)據(jù)分析模塊實(shí)時(shí)采用二階差分校正法和電流積分法分別對(duì)其阻斷時(shí)間和阻斷幅值進(jìn)行了校正,校正后得到的分析結(jié)果如圖6D中紅色曲線所示。最后,根據(jù)系統(tǒng)在10 min內(nèi)采集和分析得到的阻斷事件基本信息進(jìn)行了統(tǒng)計(jì)處理,得出阻斷時(shí)間-阻斷電流散點(diǎn)圖(圖6E),處理結(jié)果與文獻(xiàn)\[3\]中采用MOSAIC軟件分析出的實(shí)驗(yàn)結(jié)果基本一致。
圖6表明,本研究所提出的在線識(shí)別與分析系統(tǒng)能夠在實(shí)驗(yàn)數(shù)據(jù)采集記錄的同時(shí),實(shí)時(shí)分析得出阻斷事件及其相關(guān)信息,顯著提高了納米孔道電流信號(hào)的處理效率。
4 結(jié) 論
設(shè)計(jì)了一種基于實(shí)時(shí)自適應(yīng)閾值法的納米孔道信號(hào)在線識(shí)別與分析系統(tǒng)。相比于傳統(tǒng)的納米孔道數(shù)據(jù)離線分析軟件,本系統(tǒng)能夠在采集納米孔道實(shí)驗(yàn)數(shù)據(jù)的同時(shí)完成對(duì)阻斷事件的識(shí)別和分析,顯著提高了實(shí)驗(yàn)數(shù)據(jù)的分析處理效率。仿真實(shí)驗(yàn)和實(shí)際實(shí)驗(yàn)結(jié)果表明,系統(tǒng)性在高噪聲和低帶寬環(huán)境下能夠保持穩(wěn)定,滿足實(shí)驗(yàn)數(shù)據(jù)處理的精度要求。本研究為納米孔道數(shù)據(jù)分析處理系統(tǒng)的研究提供了新思路,對(duì)于納米孔道單分子檢測(cè)技術(shù)的發(fā)展具有促進(jìn)作用。
References
1 Kasianowicz J J, Brandin E, Branton D, Deamer D W. Proc. Natl. Acad. Sci. USA, 1996, 93(24): 13770-13773
2 Clarke J, Wu H C, Jayasinghe L, Patel A, Reid S, Bayley H. Nat. Nanotechnol., 2009, 4(4): 265-270
3 Cao C, Ying Y L, Hu Z L, Liao D F, Tian H, Long Y T. Nat. Nanotechnol., 2016, 11(8): 713-718
4 Simpson J T, Workman R E, Zuzarte P C, David M, Dursi L J, Timp W. Nat. Methods, 2017, 14(4): 407-410
5 Loose M, Malla S, Stout M. Nat. Methods, 2016, 13(9): 751-754
6 Ying Y L, Long Y T. Sci. China Chem., 2017, 60(9): 1187-1190
7 Ayub M, Hardwick S W, Luisi B F, Bayley H. Nano Lett., 2013, 13(12): 6144-6150
8 Hsu W L, Daiguji H. Anal. Chem., 2016, 88(18): 9251-9258
9 YING Yi-Lun, ZHANG Xing, LIU Yu, XUE Meng-Zhu, LI Hong-Lin, LONG Yi-Tao. Acta Chim. Sin., 2013, 71(1): 44-50
應(yīng)佚倫, 張 星, 劉 鈺, 薛夢(mèng)竹, 李洪林, 龍億濤. 化學(xué)學(xué)報(bào), 2013, 71(1): 44-50
10 Ying Y L, Li D W, Liu Y, Dey S K, Kraatz H B, Long Y T. Chem. Commun., 2012, 48(70): 8784-8786
11 Asandei A, Schiopu I, Chinappi M, Chang H S, Park Y, Luchian T. ACS Appl. Mater. Interfaces, 2016, 8(20): 13166-13179
12 Mayne L J, Christie S D, Platt M. Nanoscale, 2016, 8(45): 19139-19147
13 Ying Y L, Cao C, Long Y T. Analyst, 2014, 139(16): 3826-3835
14 CAO Chan, LIAO Dong-Fang, YING Yi-Lun, LONG Yi-Tao. Acta Chim. Sin., 2016, 74(9): 734-737
曹 嬋, 廖冬芳, 應(yīng)佚倫, 龍億濤. 化學(xué)學(xué)報(bào), 2016, 74(9): 734-737
15 YAN Bing-Yong, GU Zhen, GAO Rui, CAO Chan, YING Yi-Lun, MA Wei, LONG Yi-Tao. Chinese J. Anal. Chem., 2015, 43(7): 971-976
顏秉勇, 顧 震, 高 瑞, 曹 嬋, 應(yīng)佚倫, 馬 巍, 龍億濤. 分析化學(xué), 2015, 43(7): 971-976
16 Raillon C, Granjon P, Graf M, Steinbock L J, Radenovic A. Nanoscale, 2012, 4(16): 4916-4924
17 Plesa C, Dekker C. Nanotechnology, 2015, 26(8): 1-7
18 Forstater J H, Briggs K, Robertson J W F, Ettedgui J, Marie-Rose O, Vaz C, Kasianowicz J J, Tabard-Cossa V, Balijepalli A. Anal. Chem., 2016, 88(23): 11900-11907
19 Zhang N, Hu Y X, Gu Z, Ying Y L, He P G, Long Y T. Chin. Sci. Bull., 2014, 59(35): 4942-4945
20 Gu Z, Ying Y L, Cao C, He P G, Long Y T. Anal. Chem., 2015, 87(2): 907-913
21 Gu Z, Ying Y L, Cao C, He P G, Long Y T. Anal. Chem., 2015, 87(20): 10653-10656
22 Gu Z, Wang H F, Ying Y L, Long Y T. Sci. Bull., 2017, 62(18): 1245-1250
23 Pedone D, Firnkes M, Rant U. Anal. Chem., 2009, 81(23): 9689-9694
24 Swaminathan K, Lakshminarayanan G, Ko S B. IEEE ISED, 2012: 72-76
25 Morales L J, Shmaliy Y. IEEE Lat. Am. T., 2010, 8(1): 9-16
26 Gao R, Ying Y L, Yan B Y, Long Y T. Chin. Sci. Bull., 2014, 59(35): 4968-4973
Abstract To achieve fast and accurate analysis of weak current signal of nanopore-based single molecule detection, we designed a real-time adaptive threshold data processing algorithm with data buffering technique and finite impulse response filtering. The system, which is designed based on the data processing algorithm, could realize real-time recognition and analysis of nanopore events during the data recording process. In order to verify the performance of the system, the ideal signals with different noise level (20-100 pA) and recording bandwidth (3-100 kHz) was generated. The results showed that the system was stable to analyze the generated signals even at high noise. In addition, the system was also suitable for the data recording conditions of low bandwidth and high sampling rate (250 kHz). The proposed nanopore data processing system was further applied in the Aerolysin nanopore experiment for the detection of poly(dA)4 molecules. The results showed that the data processing system could be applied in real nanopore recording system with high accuracy and speed.
Keywords Nanopore; Data acquisition and storage; Real-time data analysis and processing; Data buffering; Adaptive threshold algorithm
(Received 4 December 2017; accepted 27 December 2017)