馬立艷 陳桂芬
摘要:為提高基層企業(yè)管理效率,根據(jù)吉林省東豐縣開發(fā)區(qū)2015年企業(yè)調查數(shù)據(jù),使用粗糙集與RBF神經(jīng)網(wǎng)絡算法結合算法對企業(yè)工業(yè)生產(chǎn)總值、用電量、用工量等3個主要影響因素進行分析,并根據(jù)各參數(shù)之間差異劃分企業(yè)等級。研究結果表明:根據(jù)算法對數(shù)據(jù)分類結果,該結果與東豐縣開發(fā)區(qū)企業(yè)分級情況比較接近,說明基于粗糙集RBF神經(jīng)網(wǎng)絡算法, 是一種在企業(yè)綠色發(fā)展分級方面有效的評價方法;通過2種算法之間的可視化圖形對比,得出粗糙集RBF神經(jīng)網(wǎng)絡算法較 BP神經(jīng)網(wǎng)絡算法分類效果更加明顯; 因而,基于 粗糙集RBF神經(jīng)網(wǎng)絡算法對東豐縣開發(fā)區(qū)進行企業(yè)劃分準確性強、效率高、易于推廣,為東豐縣開發(fā)區(qū)關于企業(yè)管理工作起到技術指導作用。
關鍵詞:東豐縣開發(fā)區(qū);綠色發(fā)展;BP神經(jīng)網(wǎng)絡;RBF神經(jīng)網(wǎng)絡;粗糙集
中圖分類號:S-3文獻標識碼:ADOI:10.19754/j.nyyjs.20190615002
引言
企業(yè)是開發(fā)區(qū)生存與發(fā)展的重要基礎,企業(yè)的綠色發(fā)展是開發(fā)區(qū)健康發(fā)展的重要保障,確保開發(fā)區(qū)可持續(xù)發(fā)展的核心基礎保障,經(jīng)濟發(fā)展、綠色發(fā)展、科技發(fā)展成為開發(fā)區(qū)企業(yè)發(fā)展的3個重要因素[15]。以往對于企業(yè)的評估中,企業(yè)經(jīng)濟發(fā)展作為評估企業(yè)的重中之重,然后系統(tǒng)分析企業(yè)經(jīng)濟總值、納稅值等情況[16],根據(jù)單一的經(jīng)濟數(shù)據(jù)決定企業(yè)在園區(qū)內的幫扶力度和去留等工作,然而企業(yè)的規(guī)模、發(fā)展都不是均一的,是隨著社會因素的總體影響的,使用單一的幫扶企業(yè)政策既不能滿足多數(shù)企業(yè)的需求,甚至會使高能耗、高污染的企業(yè)在開發(fā)區(qū)中密集出現(xiàn)。于是,各地開發(fā)區(qū)紛紛提出了綠色企業(yè),根據(jù)企業(yè)多種變量來確定最適合區(qū)內發(fā)展的企業(yè),目標是在降低能耗、提高科技的前提下,企業(yè)經(jīng)濟展情況最佳。
隨著科技在開發(fā)區(qū)管理中應用的不斷進步,為有效提高開發(fā)區(qū)管理能力,數(shù)據(jù)挖掘被廣泛應用到企業(yè)管理中,神經(jīng)網(wǎng)絡是數(shù)據(jù)挖掘算法最廣泛使用的分類方法之一,已經(jīng)在模式識別、智能機器人、預測評估、經(jīng)濟等領域廣泛的領域解決了實際問題,其適用于非線性數(shù)據(jù)的處理,其主要功能有自學習、聯(lián)想儲存、高速尋找優(yōu)化解等,典型算法有:BP神經(jīng)網(wǎng)絡、RBF神經(jīng)網(wǎng)絡等。本研究根據(jù)東豐縣開發(fā)區(qū)企業(yè)的多樣性和差異性,利用數(shù)據(jù)挖掘中的BP神經(jīng)網(wǎng)絡、RBF神經(jīng)網(wǎng)絡,對研究區(qū)域的人員投入、經(jīng)濟產(chǎn)出、能源消耗3種主要影響開發(fā)區(qū)進行了分別研究,分析研究結果,為開發(fā)區(qū)企業(yè)綠色發(fā)展情況劃分起到指導作用。
1關鍵技術及算法介紹
1943年神經(jīng)網(wǎng)絡初期模型MP被提出,獨立神經(jīng)元能夠實現(xiàn)執(zhí)行邏輯功能。
W.S.McCulloch和W.Pitts建立MP模型,實現(xiàn)了單獨神經(jīng)元能執(zhí)行相關邏輯功能。直到1986年,神經(jīng)網(wǎng)絡逐步發(fā)展成為BP算法, BP神經(jīng)網(wǎng)絡能夠解決實際問題。1988年,Broomhead和Lowe用徑向基函數(shù)(Radial basis function, RBF)提出分層網(wǎng)絡的設計方法[5]。
BP神經(jīng)網(wǎng)絡是一種多層的前向型神經(jīng)網(wǎng)絡,被稱為誤差反向傳播神經(jīng)網(wǎng)絡,在BP神經(jīng)網(wǎng)絡中,信號是前向傳播的,而誤差是反向傳播的,BP網(wǎng)絡通常由有一個至多個隱層以及一個輸出層構成,能夠對具有有限性個不連續(xù)點的函數(shù)進行逼近。人工神經(jīng)網(wǎng)絡常用來解決非線性分類問題,它通過對訓練樣本的學習,自動提取合理的的規(guī)則,對測試樣本具有良好的預測能力。但是,BP神經(jīng)網(wǎng)絡算法也存在局限性,對輸入樣本的預處理功能不強,易在局部極值點滯留,導致網(wǎng)絡收斂遲緩、或過早收斂等情況出現(xiàn)[6]。
BP神經(jīng)網(wǎng)絡的性能指標為下:如公式1(節(jié)點之間權值為w,節(jié)點的閾值為b,輸出層節(jié)點數(shù)目為n,輸出層結果為d):
E(w,b)=∑n-1j=0(dj-yj)2(1)
RBF神經(jīng)網(wǎng)絡同時前饋型神經(jīng)網(wǎng)絡。它以任意精度逼近任意的非線性函數(shù),且具有全網(wǎng)絡逼近能力[2],其性能極其優(yōu)良。它的網(wǎng)絡和模糊邏輯能夠實現(xiàn)合作,真正提高算法的泛化能力。RBF神經(jīng)網(wǎng)絡的激活函數(shù)可表示為:如公式2
f(x)=∑n-1j=0(dj-yj)2(2)
RBF神經(jīng)網(wǎng)絡與BP神經(jīng)網(wǎng)絡存在以下區(qū)別:RBF在泛化能力上高于BP神經(jīng)網(wǎng)絡,在同精度的情況下,BP結構更簡單[3,13];RBF神經(jīng)網(wǎng)絡精度高于BP神經(jīng)網(wǎng)絡,RBF神經(jīng)網(wǎng)絡以完全接近真實程度,隨著訓練樣本增多的前提下,其隱藏層增多,且明顯神經(jīng)元高于BP神經(jīng)網(wǎng)絡,使得網(wǎng)絡結構復雜,復雜程度也增大,運算量也隨之增加;RBF神經(jīng)網(wǎng)絡可以實現(xiàn)完全逼近能力,且收斂速度快;結構不同,RBF神經(jīng)網(wǎng)絡通過不停調整全職直接逼近最小誤差,BP神經(jīng)網(wǎng)絡是通過梯度下降來接近預期目標;RBF具有最逼近性能和全域最優(yōu)特性,訓練速度較快,BP神經(jīng)網(wǎng)絡速度較慢,學習速度基本是固定的,需要較長的訓練時間;局限性不同,BP神經(jīng)網(wǎng)絡在計算過程中容易產(chǎn)生極小值現(xiàn)象,RBF會完全逼近真實值,不會陷入局部極小值[4,11]。
粗糙集理論能夠對不確定、不完整的數(shù)據(jù)進行有效處理的一種數(shù)學方法[8,9]。它建立在分類的基礎之上,對精確、不確定的數(shù)據(jù)處理比較客觀,在處理過程中,無需前期驗算信息,僅需要提供戶數(shù)據(jù)集合[10]。針對該理論對原始數(shù)據(jù)中不確定、不完整的能力,使得其與處理不確定問題的理論形成互補[1]。
2粗糙集RBF神經(jīng)網(wǎng)絡在企業(yè)分級上的應用2.1實驗數(shù)據(jù)來源
實驗數(shù)據(jù)來自吉林省東豐縣經(jīng)濟開發(fā)區(qū),該區(qū)成立于2005年11月。經(jīng)過多年的發(fā)展,現(xiàn)已形成了以中小企業(yè)創(chuàng)業(yè)孵化基地、以梅花鹿特色產(chǎn)業(yè)、鑫達冶金鑄造產(chǎn)業(yè)、低碳產(chǎn)業(yè)孵化為特色的“三園一基地”的模式,開發(fā)區(qū)建筑面積為4.34km2,總面積約為13.41km2,共設置可租借使用廠房8棟24500m2,目前,開發(fā)區(qū)區(qū)內企業(yè)達到220戶,其中工業(yè)企業(yè)82戶。收集整理該開發(fā)區(qū)2016年部分企業(yè)的生產(chǎn)總值、能耗情況、用工情況等數(shù)據(jù)(表 1),為建立企業(yè)綠色發(fā)展評價模型工作提供基礎數(shù)據(jù)。
2.2結果與分析
企業(yè)綠色發(fā)展狀況企業(yè)人員、企業(yè)用電總量、企業(yè)生產(chǎn)等因素的影響,部分影響因素無法通過直觀數(shù)據(jù)得到。生產(chǎn)總值等于0時說明企業(yè)可能已經(jīng)停工或搬遷,企業(yè)發(fā)展情況受生產(chǎn)總值的直接影響容易產(chǎn)生異常,為了使得數(shù)據(jù)更加準確剔除生產(chǎn)總值為0的數(shù)據(jù)。
針對東豐縣開發(fā)區(qū)企業(yè)狀況數(shù)據(jù),對企業(yè)數(shù)據(jù)中的企業(yè)人員、企業(yè)用電總量、企業(yè)生產(chǎn)總值3個指標分別進行歸一化處理。對開發(fā)區(qū)管理系統(tǒng)中的生產(chǎn)總值、用電量、用工情況分攤至單位使用土地面積,利用粗糙集理論進行處理,并實現(xiàn)數(shù)據(jù)的歸一化。由多年工作在基層開發(fā)區(qū)工作人員根據(jù)工作、研究經(jīng)驗分析總結,得出該基層開發(fā)區(qū)在單位土地面積的工業(yè)生產(chǎn)總值、用電量、用人工量權重,因為以上屬性之間依賴度較高,所以去除任一屬性,分類情況都需要重新確定,在綜合考慮屬性之間的重要度,得到工業(yè)生產(chǎn)總值、用電量、用人工量的綜合屬性值為0.55、0.25、0.2。
根據(jù)前期對數(shù)據(jù)的處理,利用最終權重對RBF神經(jīng)網(wǎng)絡算法進行分析,借助數(shù)據(jù)歸一化處理更能有效的處理開發(fā)區(qū)管理數(shù)據(jù)??紤]開發(fā)區(qū)企業(yè)綠色發(fā)展情況將將開發(fā)區(qū)企業(yè)綠色發(fā)展等級劃分為4個等級,用S代表企業(yè)綠色發(fā)展等級區(qū)間,其中一類企業(yè)得分為<0.8,二類企業(yè)得分為≥0.8、<1.5,三類企業(yè)得分為≥1.5、<3.5,四類企業(yè)得分為≥3.5。 在上述基礎上,利用BP神經(jīng)網(wǎng)絡算法和粗糙集RBF神經(jīng)網(wǎng)絡算法對東豐縣開發(fā)區(qū)2015年企業(yè)綠色發(fā)展情況情況數(shù)據(jù)進行對比分析。
從表2可知,BP神經(jīng)網(wǎng)絡所得分類結果中一類企業(yè)1個,二類企業(yè)4個,三類企業(yè)11個,四類企業(yè)6個。粗糙集RBF神經(jīng)網(wǎng)絡所得分類結果為一類企業(yè)3個,二類企業(yè)3個,三類企業(yè)9個,四類企業(yè)7個。兩種算法均無孤立點現(xiàn)象出現(xiàn)。
從表3可以看出2015年粗糙集RBF神經(jīng)網(wǎng)絡與BP神經(jīng)網(wǎng)絡分類精度是95.45%、86.3%,從結果可以看出粗糙集RBF對屬性數(shù)據(jù)能得到精準劃分,無孤立點現(xiàn)象出現(xiàn),分類誤差率底,對開發(fā)區(qū)企業(yè)綠色發(fā)展情況分級具有實用價值。
可視化的圖形模式分析。通過粗糙集RBF神經(jīng)網(wǎng)絡與BP神經(jīng)網(wǎng)絡對分類結果分別以可視化圖形模式進行對比分析。對比結果如圖2所示,從圖2可以明顯看出:2種分類結果于專家給定數(shù)據(jù)吻合度較高,粗糙集RBF神經(jīng)網(wǎng)絡算法分類效果較BP神經(jīng)網(wǎng)絡算法明顯,尤其是在分級內的吻合度更高一些,RBF神經(jīng)網(wǎng)絡分類與專家給出的實際情況相符,說明粗糙集RBF神經(jīng)網(wǎng)絡算法更能夠高效、精準的進行企業(yè)綠色發(fā)展等級的劃分。
3結果與討論
本文分別通過運用BP神經(jīng)網(wǎng)絡和粗糙集RBF神經(jīng)網(wǎng)絡算法,對東豐縣的企業(yè)綠色發(fā)展數(shù)據(jù)進行等級劃分,在綜合考慮了影響企業(yè)分級的各類數(shù)據(jù)權重問題,驗證了神經(jīng)網(wǎng)絡算法在開發(fā)區(qū)企業(yè)綠色評價上的可行性。經(jīng)過對比分析可以看出,粗糙集 RBF神經(jīng)網(wǎng)絡算法能較好地實現(xiàn)企業(yè)綠色發(fā)展的評價。
提出改進的RBF神經(jīng)網(wǎng)絡,將粗糙集與RBF進行有效結合,兩者的結合能夠具有互補性,數(shù)據(jù)結構在具有完整性的同時提高精度。
基于粗糙集RBF神經(jīng)網(wǎng)絡算法屬性權值因子的提取和確定,通過對各屬性權重的綜合測定,確定該基層開發(fā)區(qū)企業(yè)發(fā)展管理數(shù)據(jù)工業(yè)生產(chǎn)總值、用電量、用人工量的綜合權重為0.55、0.25、0.2。
將改進的RBF神經(jīng)網(wǎng)絡算法與BP神經(jīng)網(wǎng)絡算法運用在2015年開發(fā)區(qū)企業(yè)發(fā)展管理數(shù)據(jù)進行對比分析,RBF神經(jīng)網(wǎng)絡算法能較好的實現(xiàn)企業(yè)管理數(shù)據(jù)的分析,其中粗糙集RBF神經(jīng)網(wǎng)絡、BP神經(jīng)網(wǎng)絡在15a數(shù)據(jù)的準確率分別為95.45%、86.3%,結合可視化的圖形模式對比分析結果更加明顯。
上述分析結果表明,對企業(yè)綠色發(fā)展情況的劃分使得開發(fā)區(qū)發(fā)展趨于向上,對區(qū)域經(jīng)濟、生態(tài)效能的提高具有長久的現(xiàn)實意義。本實驗在企業(yè)數(shù)據(jù)應用上僅選擇1a數(shù)據(jù),其結果只說明了算法的應用性,本文將要繼續(xù)通過更多的實驗結果進行驗證。
參考文獻
[1] 賈晨光,陳桂芬.基于粗糙集C4.5算法的應用[J].中國農機化學報,2016,37(7):149-153.
[2] 朱玉榮,呂建新.基于RBF神經(jīng)網(wǎng)絡的柴油機故障診斷[J].農機化研究,2012(5):212-215.
[3] 王啟. 人工神經(jīng)網(wǎng)絡在函數(shù)逼近中的應用研究[J]. 電腦開發(fā)與應用, 2012, 25(7):85-86.
[4] 孫紅輝, 張清華, 宋賢征. 基于RBF神經(jīng)網(wǎng)絡的柴油機故障診斷[J]. 小型內燃機與車輛技術, 2009, 38(1):70-72.
[5] 王晶晶. 一種改進的Elman神經(jīng)網(wǎng)絡算法的研究[J]. 華中師范大學學報(自然科學版), 2016, 50(3):349-352.
[6] 吳潔, 曲暢, 王華. 基于BP神經(jīng)網(wǎng)絡的腦卒中患者分類方法研究[J]. 無線互聯(lián)科技, 2016(24):140-142.
[7] 馬斌, 張麗艷. 一種基于徑向基神經(jīng)網(wǎng)絡的短期風電功率直接預測方法[J]. 電力系統(tǒng)保護與控制, 2015, 43(19):78-82.
[8] 楊玉琴, 陳桂芬, 郭宏亮. 大數(shù)據(jù)處理技術在土壤肥力評價中的研究[J]. 中國農機化學報, 2016, 37(4):233-236.
[9] 蔡麗霞, 陳桂芬. 基于數(shù)據(jù)挖掘算法土壤肥力狀況的分析研究[J]. 中國農機化學報, 2014, 35(3):252-255.
[10] 于合龍, 劉杰, 馬麗. 基于 Web 的設施農業(yè)物聯(lián)網(wǎng)遠程智能控制系統(tǒng)的設計與實現(xiàn)[J]. 中國農機化學報, 2014, 35(2):240-245.
[11] 陳軍令. 基于徑向基神經(jīng)網(wǎng)絡的財務預警研究[D]. 中南大學, 2013.
[12] 吳浩亮, 孟令啟, 王建勛. 基于RBF神經(jīng)網(wǎng)絡的中厚板軋制寬展模型[J]. 機械設計, 2010, 27(4):21-24.
[13] 胡勁松, 楊世錫. EMD方法基于徑向基神經(jīng)網(wǎng)絡預測的數(shù)據(jù)延拓與應用[J]. 機械強度, 2007, 29(6):894-899.
[14] 曾慶謙. 基于神經(jīng)網(wǎng)絡的船舶運動姿態(tài)建模預報[D]. 哈爾濱工程大學, 2008.
[15] 鄒鵬. 基于數(shù)據(jù)倉庫的遼寧省中小企業(yè)產(chǎn)業(yè)集群戰(zhàn)略設計[D]. 沈陽理工大學.
[16] 諸克軍. 經(jīng)濟管理中軟計算的理論與方法[M]. 華中科技大學出版社, 2009.
作者簡介:馬立艷(1987-),女,研究方向:人工智能與計算機農業(yè)應用;陳桂芬(1956-),女,教授,研究方向:人工智能與數(shù)據(jù)挖掘、精準農業(yè)。