龔中良, 易宗霈, 文 韜, 李大鵬, 王鵬凱, 劉 豪
(中南林業(yè)科技大學機電工程學院,長沙 410000)
熱風干燥是現(xiàn)階段最常用的農(nóng)產(chǎn)品干燥方式,而實現(xiàn)干燥過程農(nóng)產(chǎn)品含水量在線檢測對提高農(nóng)產(chǎn)品干燥品質(zhì)、降低干燥能耗具有重要意義[1-3]。油茶籽干燥是茶油生產(chǎn)工序中的第一步[4],其含水量是干燥過程控制的一個重要參數(shù),干燥后含水量的高低直接影響油茶籽儲藏與茶油的制取[5]。因此,為了有效降低干燥能耗和提高干燥品質(zhì),有必要對油茶籽含水量進行在線檢測。
目前,對于物料含水量的檢測方法主要分為直接檢測和間接檢測兩類[6],直接檢測法中最具有代表性的是烘干法,此方法檢測時間長,不適合用于在線檢測。在間接檢測法中電學法是最為常見的檢測方法,國內(nèi)外學者利用介電參數(shù)實現(xiàn)了柑桔葉片[7]、高粱[8]、綠茶[9]含水量的預測。光譜技術、微波技術近年來在含水量檢測領域的研究也較為普遍,基于光譜技術成功實現(xiàn)了對小麥籽[10]、油茶籽[11]、玉米葉片[12]的含水量預測,采用微波測量模塊對谷物[13]、核桃[14]含水量進行預測,同樣也取得了較好的結(jié)果。這些檢測方法準確預測了不同農(nóng)產(chǎn)品的含水量,然而檢測裝置復雜,大多都受限于干燥裝置與物料種類,且對檢測環(huán)境有一定要求,干燥過程在線檢測的實用性不足。
實際上,由熱質(zhì)傳遞的基本原理可知,通過物料干燥層后空氣濕熱參數(shù)的變化與物料本身的干燥速率相關[15]。根據(jù)對油茶籽干燥特性的研究[16-18],油茶籽熱風干燥速率以降速期為主,在干燥過程中不斷變化。因此有望利用空氣濕熱參數(shù)的變化趨勢間接檢測油茶籽含水量。
熱風干燥過程實質(zhì)上是一個復雜的傳熱傳質(zhì)過程,很難用一個精確的數(shù)學模型描述。而隨機森林作為一種具有代表性的機器學習算法,不僅對解決非線性問題有顯著的優(yōu)勢,而且對噪聲數(shù)據(jù)不敏感[19]。本文通過干燥實驗探究油茶籽干燥過程含水量與空氣濕熱參數(shù)之間的關系,并建立基于隨機森林算法的油茶籽含水量預測模型,實現(xiàn)油茶籽干燥過程中含水量的在線預測。
本實驗選用10月中旬從湖南省長沙市望城區(qū)雪峰山油茶基地收集的成熟油茶籽,在干燥實驗之前,對油茶籽進行人工脫蒲,選取大小均勻、無發(fā)芽、無霉變的鮮油茶籽,單粒油茶籽平均質(zhì)量為4 g,初始干基含水量為(0.98±0.05)kg/kg。
熱風干燥裝置如圖1所示,其中,干燥器腔體尺寸為80 mm(R)×230 mm(H), 底部入風口設有目數(shù)為4目的鐵網(wǎng),以保證熱風可以均勻的穿過物料。使用PRAH2工業(yè)熱風機提供風速、溫度可控的熱風。溫濕度傳感器布置如圖2所示,采用溫濕度傳感器測量干燥裝置進出口的溫濕度參數(shù)(溫度精度±0.5 ℃,濕度精度±3%RH),其中,干燥裝置入口對稱放置有2個溫濕度傳感器,伸入干燥腔體深度為40 mm干燥裝置出口溫濕度傳感器陣列設置在物料層上方100 mm處,共包含A、B、C、D 4個溫濕度傳感器,均固定在半徑90 mm的鐵網(wǎng)上,除A布置在陣列正中心以外,B、C、D 3個以中心角120度分布,距離中心點45 mm。傳感器數(shù)據(jù)通過SIN-R6000C無紙記錄儀進行連續(xù)的采集。
注:1 溫濕度傳感器陣列;2 風速檢測點;3 干燥腔;4目鐵網(wǎng);5 干燥腔入口溫濕度傳感器;6 風速調(diào)節(jié)閥;7 加熱器;8 離心風機。圖1 熱風干燥裝置
圖2 溫濕度傳感器布置圖
在干燥實驗前,開啟熱風干燥裝置,設定所需熱風溫度、風速,對干燥腔進行預熱。實驗參數(shù)的設置如表1所示。
表1 實驗參數(shù)
稱取600 g鮮油茶籽,將其均勻放置在干燥腔內(nèi),堆積孔隙率約為45%。在干燥過程中,使用無紙記錄儀實時采集溫濕度傳感器數(shù)據(jù),采樣周期設置為1 s,每隔30 min對油茶籽進行1次稱重,記錄油茶籽當前質(zhì)量以及稱質(zhì)量時刻溫濕度傳感器數(shù)值。當相鄰2次稱量油茶籽質(zhì)量差小于2 g時停止干燥。
將干燥結(jié)束后的油茶籽放入恒溫烘箱內(nèi),以105 ℃干燥至恒重停止,以此質(zhì)量作為干基質(zhì)量可計算出此前每次稱重時的油茶籽干基含水量。
每一稱重時刻油茶籽干基含水量的計算公式如式(1)所示:
(1)
式中:MC為油茶籽的干基含水量/kg/kg;mt為油茶籽干燥至t時刻的質(zhì)量/kg;m為油茶籽的干基質(zhì)量/kg。
1.4.1 干燥數(shù)據(jù)獲取
現(xiàn)有裝置獲得的實驗數(shù)據(jù)包括干燥腔進出口熱風溫度T1、T2,干燥腔進出口相對濕度RH1、RH2和干燥風速v,其中T1與RH1由干燥腔入口處溫濕度傳感器的平均值得到,T2與RH2由干燥腔出口處溫濕度傳感器陣列的平均值得出。根據(jù)熱質(zhì)傳遞平衡原理選取干燥腔進出口溫差與含濕量差數(shù)據(jù),含濕量的定義為每千克質(zhì)量的干空氣中所混合的水蒸氣的質(zhì)量,用符號d來表示,單位為g/kg。
(2)
式中:φ為相對濕度/%;ps為水蒸氣分壓力/Pa;p為空氣壓力/Pa;d為含濕量/g/kg。
考慮到進出口含濕量差在干燥過程中的變化率會隨著干燥時間的變化而逐漸減小,且在不同工況下的變化率也有區(qū)別,采用公式進一步計算干燥腔進出口溫差變化率δ1與含濕量差變化率δ2。
(3)
(4)
式中:?d、?T為干燥腔進出口含濕量差與溫差的變化量;Δt為發(fā)生這一變化所用的時間。
最終,干燥模型所考慮的輸入?yún)?shù)如表2所示。
表2 干燥模型可利用的輸入?yún)?shù)
1.4.2 數(shù)據(jù)預處理
在干燥過程中,由于干燥環(huán)境溫濕度變化的影響,傳感器采集數(shù)據(jù)存在較多噪音,同時每次稱重對整個檢測過程存在干擾,故本實驗需要對干燥過程中存在較大噪聲的參數(shù)進行濾波處理。圖3是實驗溫度70 ℃,風速1 m/s的工況下進出口溫差和含濕量差的變化曲線,數(shù)據(jù)由無紙記錄儀每秒采集的溫濕度數(shù)據(jù)計算得來。由圖3原始數(shù)據(jù)可以看出,兩參數(shù)隨干燥時間的變化下均存在隨機噪聲??紤]到干燥過程數(shù)據(jù)需要進行實時處理,故采用卡爾曼濾波來對數(shù)據(jù)進行濾波處理??柭鼮V波作為一種時域濾波方法被廣泛的應用于數(shù)據(jù)噪聲處理之中[20-22],此算法采用線性狀態(tài)方程對系統(tǒng)狀態(tài)進行最優(yōu)估計,在保證數(shù)據(jù)真實性的同時,可以有效去除了原始數(shù)據(jù)中的隨機噪聲。
圖3 原始數(shù)據(jù)與卡爾曼濾波對比效果圖
1.5.1 隨機森林回歸模型
實時預測油茶籽干燥過程中含水量要求模型在保證運算速度的同時能有效地克服干燥過程中的信號干擾。與其他機器學習算法相比,隨機森林算法避免了復雜的結(jié)構(gòu),并在非線性分析中有著廣泛的應用[23,24]。該算法最早是由Breiman與Cutler提出,其原理如圖4所示。此算法通過集成學習的思想將大量決策樹集成,以此來提高模型的精度。在訓練樣本時,每一棵決策樹隨機的采集樣本數(shù)據(jù)中的一小部分進行訓練,以此來保證每一棵決策樹的相互獨立性,當所有決策樹都完成訓練后,再通過均值的方法將每一顆決策樹的訓練結(jié)果整合在一起進行輸出,因此樹的數(shù)量是建立隨機森林模型中最重要的參數(shù),提高樹的數(shù)量可以提升模型的預測精度,但模型訓練和預測的時間也會相應的增加,并且邊際收益會隨樹數(shù)量的不斷提升而遞減,所以要在保證預測精度的同時選取合適的決策樹數(shù)量。
圖4 隨機森林算法結(jié)構(gòu)圖
1.5.2 模型評價指標
為了對模型的相關性進行檢驗,引入決定系數(shù)(R2) 、均方根誤差(RSME)兩種常用的評價指標,分別由式(5)和式(6)表示。
(5)
(6)
2.1.1 不同溫度下濕熱參數(shù)與含水量變化規(guī)律
圖5為干燥風速0.5 m/s,不同溫度下油茶籽含水量與干燥腔進出口含濕量差、溫差隨時間變化曲線。油茶籽含水量隨著干燥的進行逐漸下降,并且溫度越高,含水量下降速度越快。溫度越高,含濕量差和溫差越大,且兩者隨時間的下降趨勢越明顯。這是因為油茶籽內(nèi)部水分的擴散速率會隨溫度的升高而加快,水分的蒸發(fā)量一定程度上可以等效為干燥腔出口濕熱空氣所增加的水分,因此含濕量差參數(shù)隨溫度的升高而增大。而水分蒸發(fā)所需的熱量又與干燥腔出口濕熱空氣消耗的熱量相關。水分蒸發(fā)速率越快,消耗的熱量越多,即干燥腔進出口溫差值越大。
2.1.2 不同風速下濕熱參數(shù)與含水量的變化規(guī)律
圖6為干燥溫度50 ℃,不同干燥風速下油茶籽含水量與干燥腔進出口含濕量差、溫差隨時間變化曲線。在干燥初期,油茶籽含水量下降速率隨風速增加呈加快趨勢,這是因為油茶籽干燥初期以表面水分蒸發(fā)為主,干燥風速越快,表面水分蒸發(fā)速率越快;而隨著干燥的進行,油茶籽干燥過程變成以內(nèi)部水分擴散為主的降速干燥,干燥風速不再是影響油茶籽干燥速率的主要因素。整體上看,干燥風速對油茶籽干燥速率的影響較小,但是干燥風速卻對干燥腔進出口含濕量差和溫差有顯著影響。干燥進出口含濕量差、溫差與風速的大小成反比,且干燥風速越大,變化趨勢越平緩。干燥風速的增加使得單位時間內(nèi)經(jīng)過干燥腔的空氣體積流量增大,而油茶籽水分蒸發(fā)速率并沒有因風速的增加而產(chǎn)生明顯的變化。風速增加,單位時間內(nèi)油茶籽蒸發(fā)的水分與消耗的熱量增幅不大。因此,干燥腔進出口溫差值與含濕量差值均隨干燥風速的增加而減小。
圖5 不同溫度下的參數(shù)對比圖
圖6 不同風速下的參數(shù)對比圖
在預測模型中,合適的輸入?yún)?shù)能有效提高預測模型的準確性。當輸入?yún)?shù)過多時,會增加模型的計算時間,同時,如果存在某些輸入?yún)?shù)對預測目標變量沒有貢獻,模型的預測性能也會受到影響,因此,需要消除預測模型中不重要的輸入?yún)?shù)。
通過5折交叉驗證,將表1中9組工況下的實驗數(shù)據(jù)劃分為5份,每份互不相交,輪流將其中的4份作為訓練集,1份做測試集。使用不同輸入?yún)?shù)組合進行訓練,以確定最適合含水量預測的參數(shù)組合。表3為8種參數(shù)組合與對應的建模結(jié)果??梢钥闯?,相比只包含基本干燥參數(shù)(序號1)下的模型,不同濕熱參數(shù)的加入均提升高了模型的預測精度。同時,加入含濕量差參數(shù)的模型(序號3)預測效果比加入溫差參數(shù)的模型(序號2)預測效果更好,說明含濕量差參數(shù)與油茶籽含水量的相關性更高。其次,采用序號5變量組的RF模型效果最佳,測試集決定系數(shù)和測試集均方根誤差分別為0.955和0.046 5,并且優(yōu)于采用全變量組(序號8)預測的結(jié)果。從表3中還可以得到,輸入?yún)?shù)越多,所需要的運算時間越長,但不同參數(shù)組對應的運算時間差距不大。
表3 不同參數(shù)組合訓練結(jié)果
考慮到干燥是熱惰性較大的系統(tǒng),在線預測含水量不需要較快的響應時間[25],所以可以忽略不同輸入?yún)?shù)組合對運算時間的影響。因此綜合考慮,選擇序號5變量組合為最優(yōu)的RF模型輸入?yún)?shù)。
在確定好模型的輸入變量后,需要確定隨機森林算法中樹的最佳數(shù)量。以RMSE為評價指標,通過試錯法,采用5折交叉驗證建立的RF模型來確定樹的最佳數(shù)量,數(shù)據(jù)集同樣選用表1中9組工況下的實驗數(shù)據(jù)。圖7為不同決策樹數(shù)數(shù)量下預測模型的RMSE。RMSE先隨著決策樹數(shù)量的增加開始急劇下降,隨后逐漸趨于穩(wěn)定。這是由于油茶籽含水量與輸入變量之間的相關性是非線性的,而對于非線性問題,有限的決策樹個數(shù)容易讓模型欠擬合,讓預測準確性降低。提升決策樹數(shù)量,可以讓模型擁有更好的性能,但當決策樹數(shù)量超過一定數(shù)值后,模型的性能不再會有顯著的提升,而模型的運行時間會隨決策樹數(shù)量的增加相應增長。因此需要保證在RMSE最小的同時,決策樹數(shù)量也要最小。由圖7可知最優(yōu)的決策樹數(shù)量為65。
圖7 隨機森林模型參數(shù)優(yōu)化
采用表1所給出9組工況下的全部數(shù)據(jù)作為訓練集構(gòu)建RF模型,使用訓練集之外兩組不同干燥工況下的油茶籽實驗數(shù)據(jù)構(gòu)建預測集(表4),以評價RF模型的預測性能。根據(jù)預測模型的預測結(jié)果,兩組工況下的油茶籽含水量預測集的R2分別為0.994 3和0.990 8,RMSE分別為0.042和0.027 9,整體預測結(jié)果較好。
表4 預測集實驗工況
為了進一步驗證RF模型的預測性能,分別采用此模型與其他常用機器學習模型預測表4的實驗工況下油茶籽含水量。其他機器學習模型包括決策樹回歸(DTR)、支持向量機(SVR),模型參數(shù)均采用默認值,模型訓練集采用表1中9組工況的實驗數(shù)據(jù)。通過不同模型對比分析可知RF模型的預測值與實測值最接近(圖8),兩組工況下的RF模型的RMSE較DTR模型降低了0.021,較SVR模型降低了0.026。由此說明RF模型在預測油茶籽含水量上存在優(yōu)勢。
圖8 不同模型預測性能對比圖
本研究提出了一種利用濕熱參數(shù)結(jié)合隨機森林(RF)模型的干燥過程油茶籽含水量在線檢測方法。通過實驗得到了不同干燥溫度、風速下油茶籽含水量與干燥腔內(nèi)濕熱參數(shù)的變化關系。實驗結(jié)果表明,干燥溫度越高,干燥腔進出口含濕量差、溫差數(shù)值越大,變化速率也越大;干燥腔進出口含濕量差、溫差隨干燥風速的增大而減小,不同風速下的變化速率區(qū)別不大。通過RF模型在不同輸入?yún)?shù)組合下的預測結(jié)果對比,選擇最優(yōu)輸入?yún)?shù)組合,包括干燥腔進出口含濕量差、含濕量差變化率和入口溫度、風速以及干燥時間。并且基于最優(yōu)輸入?yún)?shù)組合建立了RF模型,確定了最佳決策樹數(shù)量為65。利用不同實驗條件下預測集數(shù)據(jù)測試了RF模型的預測性能,模型預測值與實測值的均方根誤差為0.035;進一步通過對比得到,RF模型的預測精度明顯高于決策樹模型、支持向量機模型。表明該方法可以有效對油茶籽干燥過程含水量進行在線預測。