張子波 何驍勇 臧瑋
摘 要 針對油氣生產(chǎn)行業(yè)數(shù)字化轉型促使結構化生產(chǎn)數(shù)據(jù)被廣泛應用的現(xiàn)狀,提出基于BP神經(jīng)網(wǎng)絡的輕烴回收裝置生產(chǎn)參數(shù)預測模型,以中海油某終端生產(chǎn)數(shù)據(jù)進行網(wǎng)絡訓練和測試,結果表明:BP神經(jīng)網(wǎng)絡應用在該業(yè)務場景可行,現(xiàn)有數(shù)據(jù)條件下網(wǎng)絡隱藏層節(jié)點數(shù)取30、學習率取0.2,可獲得相對較好的測試效果。
關鍵詞 BP神經(jīng)網(wǎng)絡 結構化生產(chǎn)數(shù)據(jù) 輕烴回收 歸一化 網(wǎng)絡訓練
中圖分類號 TP18? ?文獻標志碼 A? ?文章編號 1000-3932(2023)05-0689-06
油氣行業(yè)數(shù)字化轉型已成為國內(nèi)外石油公司的發(fā)展趨勢[1~3],中海油也將數(shù)字化、智能化作為公司未來發(fā)展的四個跨越之一[4]。隨著數(shù)字化發(fā)展和智能化程度的提高,越來越多的結構化數(shù)據(jù)將應用于企業(yè)管理和研究設計中,促進企業(yè)管理水平的提升和技術水平的高質(zhì)量發(fā)展。
海上油氣田生產(chǎn)的天然氣常通過海底管道輸送至陸地終端進行輕烴回收[5]以提高經(jīng)濟效益。隨著區(qū)域開發(fā)和海底管網(wǎng)的日趨完善,海上新區(qū)塊小規(guī)模開發(fā)常利用已建陸地終端進行油氣處理。在前期研究項目進行經(jīng)濟性評價時,傳統(tǒng)方法是通過工藝模擬計算產(chǎn)品產(chǎn)量和能耗數(shù)據(jù),但部分終端投產(chǎn)時間較早,裝置運行多年,且各終端輕烴回收裝置的技術水平也不盡相同,工藝模擬往往與實際生產(chǎn)存在一定差異,限制了對產(chǎn)品產(chǎn)量和能耗數(shù)據(jù)預測的準確度。
隨著大數(shù)據(jù)時代的到來,人工神經(jīng)網(wǎng)絡也逐步在油氣生產(chǎn)領域獲得應用[6~9]。筆者通過收集某終端歷史生產(chǎn)數(shù)據(jù)和分析化驗數(shù)據(jù),提出基于反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡的輕烴回收裝置預測模型,對模型參數(shù)進行優(yōu)化研究,并采用部分生產(chǎn)數(shù)據(jù)作為測試數(shù)據(jù),分析預測結果,最后對人工神經(jīng)網(wǎng)絡應用于輕烴回收生產(chǎn)參數(shù)預測研究前景進行了展望。
1 生產(chǎn)參數(shù)預測模型
中海油已建陸地終端輕烴回收裝置多采用膨脹機+重接觸塔制冷工藝,主要通過對壓力能的利用來分離天然氣中的重組分。終端產(chǎn)出產(chǎn)品主要有干氣、LPG和穩(wěn)定輕烴,能耗主要包括壓縮機電耗和導熱油爐燃料氣消耗。影響產(chǎn)品產(chǎn)量和能耗的主要因素有:進站組分、進站物流流量、進站壓力、出站壓力?;贐P神經(jīng)網(wǎng)絡的輕烴回收裝置生產(chǎn)參數(shù)預測模型如圖1所示。
2 BP神經(jīng)網(wǎng)絡算法
BP神經(jīng)網(wǎng)絡算法是模擬人腦神經(jīng)元接收信號并做出反應的工作過程,具有容錯能力強、學習能力強、結構簡單和易于編程實現(xiàn)[10~13]的優(yōu)點,能夠適用于輕烴回收裝置生產(chǎn)參數(shù)的預測問題。圖2展示了一個3層結構、每層3個節(jié)點的BP神經(jīng)網(wǎng)絡。
BP神經(jīng)網(wǎng)絡學習的一般過程為:從隱藏層開始,各節(jié)點接收前一層所有節(jié)點經(jīng)權重分配后的輸入,應用激活函數(shù),經(jīng)權重分配后作為后一層的輸入;最終輸出與結果對比后計算誤差,并將誤差根據(jù)連接到該節(jié)點的權重向前一層反饋,最后應用梯度下降法[14~16]調(diào)整權重值完成一次學習。通過不斷學習,不斷調(diào)整連接權重矩陣,樣本學習完畢即為一個訓練世代。學習完畢可對網(wǎng)絡進行測試,直至達到預期精度。神經(jīng)網(wǎng)絡單世代訓練流程如圖3所示。
輸入層與隱藏層連接權重調(diào)整量矩陣為:
3 數(shù)據(jù)歸一化
研究數(shù)據(jù)源于中海油已建某終端,該終端投產(chǎn)于20世紀90年代,為了盡可能減少干擾因素,取該終端近兩年的日生產(chǎn)數(shù)據(jù)和分析化驗數(shù)據(jù)進行研究。
生產(chǎn)數(shù)據(jù)和分析化驗數(shù)據(jù)主要為電子表格文件,首先采用Python第三方庫Openpyxl讀取生產(chǎn)日報和分析化驗日報中所需數(shù)據(jù)并進行整理用于訓練,整理后的部分數(shù)據(jù)列于表1、2。
輕烴回收生產(chǎn)參數(shù)預測神經(jīng)網(wǎng)絡模型采用Sigmoid作為激活函數(shù),為避免各特征參數(shù)在數(shù)值、量綱上差異過大,激活函數(shù)過于“扁長”,導致梯度下降改進誤差的過程曲折且耗時,需在訓練前對各特征變量進行歸一化[17~19],消除不同變量數(shù)值范圍和不同量綱對網(wǎng)絡訓練帶來的影響。歸一化公式如下:
其中,zi為樣本數(shù)據(jù)中第i個特征參數(shù)的歸一化結果;c為歸一因子,對于輸入?yún)?shù)(如進站氣量等)取值0.99,對于輸出參數(shù)(如LPG產(chǎn)量等)取值0.98;max(xi)為特征參數(shù)xi在所有樣本數(shù)據(jù)中的最大值;min(xi)為特征參數(shù)xi在所有樣本數(shù)據(jù)中的最小值。
通過數(shù)據(jù)歸一化,使樣本數(shù)據(jù)輸入?yún)?shù)部分取值范圍在[0.01,1],輸出參數(shù)部分取值范圍在[0.01,0.99]。輸入?yún)?shù)避開取值0是為了避免權重更新表達式置0,從而造成學習能力的喪失;輸出參數(shù)避開0和1是因為Sigmoid函數(shù)只能漸近于0和1,取這兩個值可能會驅動產(chǎn)生過大權重,導致權重更新錯誤。
結合輕烴回收裝置實際運行情況,在獲取特征變量上下邊界max(xi)和min(xi)時,比實際值適當放大或縮小約10%,以提高神經(jīng)網(wǎng)絡模型的適應性,避免測試網(wǎng)絡時輸入值在接近邊界時得到錯誤結果。
在網(wǎng)絡模型訓練結束進行測試時,需要對輸出結果進行反歸一化操作,即將歸一化到[0.01,0.99]范圍內(nèi)的輸出參數(shù)zi進行反譯,得到真實結果xi。
4 權重矩陣初始化
網(wǎng)絡訓練開始前需對權重矩陣進行初始化,為避免隨機采樣可能產(chǎn)生較大權重值而偏置激活函數(shù)[10],采用正態(tài)分布采樣權重,從均值為0、標準方差等于該節(jié)點傳入連接數(shù)量平方根倒數(shù)的正態(tài)分布中進行采樣。
5 網(wǎng)絡訓練
對于輕烴回收生產(chǎn)參數(shù)預測問題,設計輸入層節(jié)點數(shù)13個、輸出層節(jié)點數(shù)5個。隱藏層節(jié)點數(shù)和學習率分別設置不同的值進行試算,確定最佳取值。
訓練樣本數(shù)據(jù)共約500組,通過設置不同的訓練世代數(shù)反復進行訓練,以確定最佳的世代數(shù)。
6 模型測試及分析
選取不在訓練數(shù)據(jù)中的20個樣本對訓練完成的神經(jīng)網(wǎng)絡進行結果測試,對所有測試樣本全部輸出參數(shù)求取相對誤差絕對值的平均數(shù)作為結果準確度的衡量指標。
6.1 網(wǎng)絡參數(shù)
6.1.1 訓練世代
隱藏層節(jié)點數(shù)取30,學習率取0.2,訓練世代與結果平均相對誤差關系如圖4所示。
6.1.2 學習率
隱藏層節(jié)點數(shù)取30,訓練世代取1 100,不同學習率對應的相對誤差見表3,可以看出,較低的學習率能獲得較好的網(wǎng)絡性能,最佳學習率取0.2。
6.1.3 隱藏層節(jié)點數(shù)
學習率取0.2,訓練世代取1 100,不同隱藏層節(jié)點數(shù)對應的相對誤差見表4。
隱藏層節(jié)點數(shù)的最佳值確定,與訓練樣本數(shù)量、訓練世代及輸入層和輸出層節(jié)點數(shù)都有關系,對于該網(wǎng)絡訓練條件,隱藏層節(jié)點數(shù)取30,可以獲得相對較好的表現(xiàn)。
6.2 預測精度分析
對于訓練世代1 100代、學習率0.2、隱藏層節(jié)點數(shù)30的網(wǎng)絡,測試樣本的各參數(shù)分別求取的相對誤差見表5。
計算結果顯示,干氣產(chǎn)量的預測精度相對較高,實際上網(wǎng)絡參數(shù)設置為不同值時(如訓練世代取100代左右),干氣產(chǎn)量預測能夠達到更高的準確率,最高時相對誤差可在0.005以下。這意味著1 100代實際上對干氣產(chǎn)量預測而言處于過度訓練的狀態(tài)。而LPG產(chǎn)量、穩(wěn)定輕烴產(chǎn)量等預測相對誤差較大,即使訓練世代達到1 100代仍然不能取得較高的精度,原因分析如下:
a. 干氣產(chǎn)量與進站氣量相關性高,輕烴回收裝置回收的重組分對干氣氣態(tài)體積的影響相對于較大的進站氣量而言,占比較小,因此無論重組分回收情況如何,干氣產(chǎn)量波動主要取決于進站氣量。
b. LPG、穩(wěn)定輕烴產(chǎn)量、終端耗氣、耗電量除受組分、氣量影響外,還與進出站壓力直接相關。目前終端記錄方式為每日24:00的進出站壓力計入該日生產(chǎn)日報,不能有效體現(xiàn)當日整體壓力狀況。部分生產(chǎn)日報提及當日進站壓力低,但實際記錄的24:00的進站壓力與往日并無太大差別。原始數(shù)據(jù)的準確度是影響參數(shù)誤差的最主要因素。隨著企業(yè)數(shù)字化轉型的實施,傳統(tǒng)記錄方式有望革新,更準確便捷的結構化數(shù)據(jù)或可應用于該業(yè)務場景。
7 結束語
BP神經(jīng)網(wǎng)絡應用于輕烴回收裝置生產(chǎn)參數(shù)預測可行,但受制于基礎數(shù)據(jù)尤其是進出站壓力記錄方式,部分參數(shù)預測精度欠佳。未來數(shù)字化轉型完成后,更先進的數(shù)據(jù)記錄和處理方式有望提高數(shù)據(jù)準確性,進而促進該模型的進一步應用。基于現(xiàn)有訓練數(shù)據(jù),在隱藏層節(jié)點30個、學習率為0.2時能取得相對較好的測試結果。訓練樣本數(shù)據(jù)偏少,需要的訓練世代數(shù)約1 100代,獲取更多的生產(chǎn)數(shù)據(jù)可進一步提升網(wǎng)絡性能。
基礎數(shù)據(jù)獲取便捷的前提下,可對該模型應用進行拓展,對相同工藝流程的終端取更多的生產(chǎn)數(shù)據(jù)進行訓練,提高各參數(shù)的訓練范圍,隨著訓練數(shù)據(jù)的豐富,有望獲得一個普適性網(wǎng)絡模型,在前期研究項目和生產(chǎn)實際中提升產(chǎn)量能耗預測的準確度和速度,并可用于各類輕烴回收裝置的優(yōu)化研究。
參 考 文 獻
[1] 楊劍鋒,杜金虎,楊勇,等.油氣行業(yè)數(shù)字化轉型研究與實踐[J].石油學報,2021,42(2):248-258.
[2] 賈承造.中國石油工業(yè)上游發(fā)展面臨的挑戰(zhàn)與未來科技攻關方向[J].石油學報,2020,41(12):1445-1464.
[3] 《中國石油報》評論員.全力推進數(shù)字化轉型智能化發(fā)展[N].中國石油報,2021-09-28(1).
[4] 王秀強.全面建成“智慧海油”,搶占新一輪產(chǎn)業(yè)競爭制高點——專訪中國海洋石油集團有限公司科技信息部總經(jīng)理周建良[J].能源,2021(11):19-22.
[5] 張超,金海剛,王俊美,等.天然氣丙烷回收率的優(yōu)化[J].現(xiàn)代化工,2021,41(11):201-205.
[6] 蔣偉,佟國香.基于改進PCA-RFR算法的汽油辛烷值損失預測模型的構建與分析[J].石油學報(石油加工),2022,38(1):220-226.
[7] 楊帆,周敏,金繼民,等.智能優(yōu)化算法及人工神經(jīng)網(wǎng)絡在催化裂化模型分析中的應用進展[J].石油學報(石油加工),2020,36(4):878-888.
[8] MOHAMADI-BAGHMOLAEI M,AZIN R,OSFOURIS ,et al.Prediction of gas compressibility factor using intelligent models[J].Natural Gas Industry B,2015,2(4):283-294.
[9] AFSHIN A,ALI B H,HOSSEIN M,et al.Prediction of w- ater formation temperature in natural gas dehydrators using radial basis function(RBF)neural networks[J].Natural Gas Industry B,2016,3(2):173-180.
[10] [英]塔里克·拉希德.Python神經(jīng)網(wǎng)絡編程[M].林賜,譯.北京:人民郵電出版社,2018.
[11] 廖藤藤,李國慶,李若溪.基于帶搜索約束的神經(jīng)網(wǎng)絡實現(xiàn)吸收穩(wěn)定系統(tǒng)操作優(yōu)化[J].石油學報(石油加工),2017,33(6):1138-1145.
[12] ZHOU Q,RYOZO O.Performance of neural network for indoor airflow prediction:Sensitivity towards weight initialization[J].Energy & Buildings,2021,246:111106.1-111106.13.
[13] JIN T T,YAN C L,CHEN C H,et al.Light neural network with fewer parameters based on CNN for fault diagnosis of rotating machinery[J].Measurement,2021,181:109639-1-109639-15.
[14] 周金應,桂碧雯,李茂,等.基于巖控的人工神經(jīng)網(wǎng)絡在滲透率預測中的應用[J].石油學報,2010,31(6):985-988.
[15] 葉文靜,王莉華.基于反向傳播神經(jīng)網(wǎng)絡的疲勞裂紋擴展分析[J].力學季刊,2021,42(4):752-762.
[16] LIN W,YI Z,TAO C.Back propagation neural network with adaptive differential evolution algorithm for time series forecasting[J].Expert Systems with Applications,2015,42(2):855-863.
[17] KAVZOGLU T,MATHER P M.The use of backpropagating artificial neural networks in land cover classification[J].International Journal of Remote Sensing,2003,24(23):4907-4938.
[18] HAYKIN S S,GWYNN R.Neural Networks and Learning Machines[M].Beijing:China Machine Press,2009.
[19] VASILKOSKI Z,AMES H,CHANDLER B,et al.Revi- ew of stability properties of neural plasticity rules for implementation on memristive neuromorphic hardware[C]//International Joint Conference on Neural Networks.2011:2563-2569.
(收稿日期:2023-03-01,修回日期:2023-07-26)
A Prediction Method for Production Parameters of Light Hydrocarbon Recovery Unit Based on BP Artificial Neural Network
ZHANG Zi-bo1, HE Xiao-yong1, ZANG Wei2
(1. CNOOC Research Institute Co., Ltd.; 2. CNOOC Tianjing Branch Co.)
Abstract? ?Considering the fact that in digital transformation of the oil and gas production industry, the structured production data are widely used, a prediction model for production parameters of the light hydrocarbon recovery unit based on BP artificial neural network was proposed and trained and tested with the production data of a CNOOC terminal unit. The results show that, BP neural network application is feasible in this business scenario and relatively good test results can be obtained when the number of nodes in the hidden layer of the network is 30 and the learning rate is 0.2 under the existing data conditions.
Key words? ?BP neural network, structured production data, light hydrocarbon recovery, normalization, network training
基金項目:中海石油(中國)有限公司綜合科研項目“陵水半潛式生產(chǎn)平臺研究專項”(LSZX 2020 HN 05)。
作者簡介:張子波(1985-),高級工程師,從事油氣處理工藝的設計和研究工作,zhangzb3@cnooc.com.cn。
引用本文:張子波,何驍勇,臧瑋.基于BP神經(jīng)網(wǎng)絡的輕烴回收裝置生產(chǎn)參數(shù)預測方法[J].化工自動化及儀表,2023,50(5):689-694.