周虎 張承明 張仁堂 楊曉霞 陳巖
摘 要 準(zhǔn)確完整地模擬紅棗黑變過程中主要成分的連續(xù)變化過程,對于明確黑變過程中的變化機(jī)理、提高成品質(zhì)量具有重要的意義。論文首先分析了黑變過程中主要成分變化的時(shí)序狀態(tài)特征,明確模擬過程中必須同時(shí)考慮狀態(tài)變化信息和數(shù)值變化信息,選擇能夠模擬時(shí)序狀態(tài)變化的長短時(shí)間記憶網(wǎng)絡(luò)(Long Short Term Memory networks,LSTM)作為基礎(chǔ)方法;然后根據(jù)實(shí)驗(yàn)數(shù)據(jù)采集困難,狀態(tài)間相關(guān)性強(qiáng)的特點(diǎn),構(gòu)建卷積長短時(shí)間記憶網(wǎng)絡(luò)模型(Convolutional Long Short Term Memory networks,LSTM ,CLSTM),設(shè)計(jì)了模型的訓(xùn)練方法,使新模型能夠較好地模擬黑變過程主要成分連續(xù)變化;選擇糠醛為實(shí)驗(yàn)對象進(jìn)行了數(shù)值模擬實(shí)驗(yàn),并使用最近插值法、為階梯插值、線性插值法、2階B樣條曲線插值、3階B樣條曲線插值法作為對比方法,實(shí)驗(yàn)分析結(jié)果表明,本文提出的方法在平均方差、平均誤差、最大誤差、最小誤差等各個(gè)指標(biāo)上增多明顯優(yōu)于其它方法,能夠更好地捕捉黑變過程中主要成分的變化特征,對于揭示黑變過程機(jī)理,具有重要的參考和借鑒價(jià)值。
關(guān)鍵詞 紅棗 黑變過程 時(shí)序變化 卷積長短時(shí)間記憶網(wǎng)絡(luò)模型
中圖分類號:TS255 文獻(xiàn)標(biāo)識碼:A
0引言
紅棗是我國所特有的果蔬資源,具有極高的營養(yǎng)價(jià)值,素有“木本糧食,滋補(bǔ)佳品”的美譽(yù),具有藥食兩用價(jià)值,富含有糖、蛋白質(zhì)、粗脂肪、粗纖維、磷、鈣、鐵、鉀、胡蘿卜素、硫胺素、核黃素、尼克酸等。紅棗中還含有18種氨基酸,包括8種人體必須氨基酸和嬰兒體內(nèi)無法合成的精氨酸和組氨酸。另外,紅棗中含有環(huán)磷酸腺苷、多糖、三萜類化合物、黃酮等生理活性物質(zhì),對人體健康起到有益作用。但是由于紅棗本身的含糖量過高,造成了部分不耐糖及糖尿病患者不敢食用。研究者在對紅棗加工過程中,通過控制溫度和濕度,在不添加任何添加劑的情況下,使紅棗經(jīng)過一段時(shí)間的高溫熟化,通過黑變過程形成黑棗。通過黑變這一深加工過程,能夠較明顯地降低了蔗糖含量,升高了還原糖、總酸、果糖、糠醛等有益成分,同時(shí)能夠使得到的黑棗具有較強(qiáng)的生理活性,更適合于糖尿病及高血糖、糖耐偏高人群及現(xiàn)代消費(fèi)者的健康要求,顯著提高紅棗的附加值。
但由于紅棗黑變過程中各種物質(zhì)變化復(fù)雜,其品質(zhì)形成,特別是所含成分的變化機(jī)理尚不清楚,迫切需要研究影響黑棗品質(zhì)形成的因素,成分變化規(guī)律及機(jī)理,以達(dá)到有效控制黑變過程,控制環(huán)磷酸腺苷的減少,促進(jìn)其功能物質(zhì)的生成,保證黑棗產(chǎn)品的品質(zhì)、功能作用和安全性,提高人群適用范圍的目標(biāo)。([1]張仁堂, 喬旭光, 谷端銀, 等. 固態(tài)發(fā)酵黑棗深加工技術(shù)研究進(jìn)展及其產(chǎn)業(yè)發(fā)展趨勢[A]. 第四屆農(nóng)產(chǎn)品產(chǎn)地初加工科技交流大會(huì)論文集[C], 2017年)
由于紅棗黑變是在密封的環(huán)境中進(jìn)行的,直接獲取紅棗變化過程的成分含量的邊續(xù)變化極為困難,唯一有效的通途就是利用化學(xué)實(shí)驗(yàn)手段,定期獲取黑變過程中主要成分的含量,在此基礎(chǔ)上通過數(shù)學(xué)模擬的手段,推測變化過程,捕捉變化的特征。數(shù)學(xué)插值是將離散量模擬得到邊續(xù)量的常用方法,主要有最近插值法、為階梯插值、線性插值法、2階B樣條曲線插值、3階B樣條曲線插值法等方法,但這些方法不能考慮樣本的狀態(tài)間的強(qiáng)關(guān)聯(lián)關(guān)系,得到的結(jié)果很難捕捉黑變過程中主要成分的變化特征,達(dá)不到揭示變化機(jī)理的目的。
隨著人們在深度學(xué)習(xí)方面研究的不斷深入,研究者提出并發(fā)展了能夠有效表征狀態(tài)間遷移關(guān)系的長短時(shí)間記憶網(wǎng)絡(luò)(Long Short Term Memory networks,LSTM),該模型最初是為處理時(shí)序信息提出來的,LSTM網(wǎng)絡(luò)模型最大的特點(diǎn)就是能夠在數(shù)據(jù)處理過程中有效地表達(dá)前后一段時(shí)間內(nèi)的狀態(tài)間的遷移關(guān)系,使前一狀態(tài)對后一狀態(tài)的影響能夠充分表達(dá),因而非常適合時(shí)序信號的處理。在研究者的不斷努力下,LSTM及其變形在時(shí)序信號處理上取得了明顯的成功。
目前,LSTM模型主要應(yīng)用在語音識別、語言建模、網(wǎng)絡(luò)監(jiān)測、文本識別等領(lǐng)域,已公開的文獻(xiàn)中尚沒發(fā)現(xiàn)將其應(yīng)用于食品加工過程中成分變化模擬問題。從前面的分析可以看出,由于食品加工過程中成分變化的時(shí)序相關(guān)性強(qiáng)的特點(diǎn),用LSTM模型作為工具是非常合適的。本文正是從這一思想出發(fā),以LSTM模型為基礎(chǔ)開展紅棗黑變過程中主要成分連續(xù)變化模擬研究,以期能夠更好地捕捉糠醛、總酸、還原糖、果糖等主要成分的變化特征,揭示變化機(jī)理。進(jìn)一步改善加工工藝,獲取質(zhì)量更佳的黑棗產(chǎn)品。
1模擬方法
LSTM模型的基礎(chǔ)原理在文獻(xiàn)[1]中已經(jīng)有非常詳細(xì)的介紹,本文重點(diǎn)是在LSTM模型的基礎(chǔ)上,根據(jù)黑變實(shí)驗(yàn)過程的特點(diǎn),搭建適宜的模型并制定訓(xùn)練方法。
1.1 CLSTM模型構(gòu)建
由于黑變需要在密封的環(huán)境中進(jìn)行的,為了盡可能保持黑變過程的連續(xù)性,采樣的間隔應(yīng)盡可能長,但過長的時(shí)間間隔可能會(huì)導(dǎo)致失去變化過程中的觀測點(diǎn),本文實(shí)驗(yàn)中,采取每6小時(shí)取樣一次,以盡可能多地獲取變化的細(xì)節(jié)信息。盡管如此,由于黑變的過程一般只有96個(gè)小時(shí),樣本量仍然偏少,直接利用原始數(shù)據(jù)進(jìn)行模擬的偏差仍然較大。
利用小波分析在信號處理方面的優(yōu)勢,將原始的時(shí)間序列數(shù)據(jù)分解成低頻和高頻兩部分,其中低頻部分是信號的近似部分,代表了數(shù)據(jù)的整體特征,高頻部分是信號的細(xì)節(jié)部分,代表了數(shù)據(jù)的細(xì)節(jié)特征,例如信號的局部跳變等。對信息的低頻部分不再進(jìn)行處理,直接作為LSTM的輸入;而高頻部分則通過卷積綜合樣本點(diǎn)的細(xì)節(jié)特征,形成全局化的特征描述信息,再作為LSTM的輸入;最后通過LSTM得到模擬結(jié)果。CLTSM模型整體結(jié)構(gòu)如圖1所示。
CLSTM模型結(jié)構(gòu)最大的優(yōu)勢在于綜合利用了人工先驗(yàn)知識和LSTM的自學(xué)習(xí)優(yōu)勢,有效克服樣本點(diǎn)少的問題,保證能夠捕捉到樣本的全局分布特征和局部分分布特征。
1.2模型訓(xùn)練方法
在構(gòu)造CLSTM模型過程中,本文通過最小化模型輸出參數(shù)與檢驗(yàn)點(diǎn)參數(shù)間誤差平方和方法進(jìn)行模型訓(xùn)練。對于結(jié)點(diǎn)數(shù)為M輸入序列L,其誤差函數(shù)定義為:
(1)
其中,和分別表示真實(shí)值與模型輸出
2模擬實(shí)驗(yàn)
2.1實(shí)驗(yàn)設(shè)計(jì)
實(shí)驗(yàn)設(shè)計(jì)分為化學(xué)實(shí)驗(yàn)和數(shù)值實(shí)驗(yàn)兩個(gè)部分,其中化學(xué)實(shí)驗(yàn)的目的是獲取時(shí)序的糠醛觀測值,每組實(shí)驗(yàn)分三個(gè)獨(dú)立組進(jìn)行,取平均值作為樣點(diǎn)值。(5-羥甲基糠醛(5-HMF)檢測方法:稱取5g黑棗泥于50ml燒杯中,加入10ml甲醇溶解,搗碎攪勻,加入少量水磁力攪拌10min,轉(zhuǎn)移至50ml棕色容量瓶中用水稀釋至刻度,充分混勻,超聲30min,過濾,棄去初濾液,后續(xù)濾液過0.45 m有機(jī)濾膜至進(jìn)樣瓶,進(jìn)行液相分析。重復(fù)以上操作三次,進(jìn)行三個(gè)平行樣準(zhǔn)備。)
數(shù)值實(shí)驗(yàn)從化學(xué)實(shí)驗(yàn)得到的實(shí)測數(shù)據(jù)中隨機(jī)抽取了20組作為數(shù)據(jù)源進(jìn)行模擬。為了更好地觀測CLSTM模型的性能,對每一組數(shù)據(jù)同時(shí)選擇了最近插值法、為階梯插值、線性插值法、2階B樣條曲線插值、3階B樣條曲線插值法作為對比方法,選擇平均方差、平均誤差、最大誤差、最小誤差等4個(gè)指標(biāo)作為考察指標(biāo)。
2.2實(shí)驗(yàn)結(jié)果與討論
圖2和圖3給出了其中一組對比實(shí)驗(yàn)的情況。
圖3中, nearest表示最近插值法,zero表示階梯插值法,slinear表示線性插值,quadratic表示2階B樣條曲線插值,cubic表示3階B樣條曲線插值,表1給出了各組實(shí)驗(yàn)的綜合對比分析情況(百分比)
表1:各組實(shí)驗(yàn)的綜合對比分析情況
3結(jié)論
本文針對準(zhǔn)確完整地模擬紅棗黑變過程中主要成分的連續(xù)變化過程的需要,從黑變過程的機(jī)理和樣點(diǎn)數(shù)據(jù)特點(diǎn)出發(fā),以能夠模擬時(shí)序狀態(tài)變化的LSTM為基礎(chǔ)方法;構(gòu)建了CLSTM。實(shí)驗(yàn)表明,CLSTM方法在平均方差、平均誤差、最大誤差、最小誤差等各個(gè)指標(biāo)上增多明顯優(yōu)于其它方法,能夠更好地捕捉黑變過程中主要成分的全局變化特征和局部分變化特征,對于揭示黑變過程機(jī)理,具有重要的參考和借鑒價(jià)值,能夠進(jìn)一步促進(jìn)紅棗黑變過程的的質(zhì)量。
基金項(xiàng)目:山東省重點(diǎn)研發(fā)計(jì)劃項(xiàng)目“紅棗微發(fā)酵工藝關(guān)鍵技術(shù)研究與產(chǎn)品開發(fā)”(項(xiàng)目編號:2016GNC113015);山東省2017年度農(nóng)業(yè)重大應(yīng)用技術(shù)創(chuàng)新項(xiàng)目“高附加值固態(tài)發(fā)酵黑棗深加工關(guān)鍵技術(shù)集成與產(chǎn)業(yè)化”。
參考文獻(xiàn)
[1] Graves,A.Supervised Sequence Labelling with Recurrent Neural Networks[J].Textbook,Studies inComputational Intelligence,Springer,2012.
[2] 舒帆,屈丹,張文林,等.采用長短時(shí)記憶網(wǎng)絡(luò)的低資源語音識別方法[J].西安交通大學(xué)學(xué)報(bào),2017,51(10):120-127.
[3] 劉加,張衛(wèi)強(qiáng).低資源語音識別若干關(guān)鍵技術(shù)研究進(jìn)展[J].數(shù)據(jù)采集與處理,2017,32(02):205-220.
[4] 張瑞茂,彭杰鋒,吳恙.融合語義知識的深度表達(dá)學(xué)習(xí)及在視覺理解中的應(yīng)用[J].計(jì)算機(jī)研究與發(fā)展,2017,54(6):1251-1266
[5] 陽珊,樊博,謝磊等.基于BLSTM-RNN的語音驅(qū)動(dòng)逼真面部動(dòng)畫合成[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,57(03):250-256.
[6] 張亮,黃曙光,石昭祥.基于LSTM型RNN的CAPTCHA識別方法[J].模式識別與人工智,2011,24(01):40-48
[7] 黃步添,劉琦,何欽等.基于語義嵌入模型與交易信息的智能合約自動(dòng)分類系統(tǒng)[J].自動(dòng)化學(xué)報(bào),2017,43(09):1531-1543.