邵正澤
摘 要 文章針對(duì)日常經(jīng)濟(jì)數(shù)據(jù)的特點(diǎn),結(jié)合人工神經(jīng)網(wǎng)絡(luò)對(duì)大數(shù)據(jù)的處理能力,研究了數(shù)據(jù)的智能化處理技術(shù)。以農(nóng)村快遞業(yè)務(wù)數(shù)據(jù)分析為例,預(yù)測(cè)得到農(nóng)村經(jīng)濟(jì)發(fā)展的程度,從而驗(yàn)證了分析方法的有效性。最后對(duì)智能化數(shù)據(jù)處理技術(shù)存在的問(wèn)題進(jìn)行了探討與對(duì)策分析。
關(guān)鍵詞 數(shù)據(jù);智能化處理;經(jīng)濟(jì);人工神經(jīng)網(wǎng)絡(luò)
中圖分類(lèi)號(hào) TP3 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2018)225-0136-02
隨著社會(huì)的不斷進(jìn)步,諸多行業(yè)都引入了計(jì)算機(jī)技術(shù)和互聯(lián)網(wǎng)技術(shù)。與之而來(lái)的,便是大量的數(shù)據(jù)。在許多行業(yè)的運(yùn)行中,數(shù)據(jù)起著至關(guān)重要的作用。高效率地處理數(shù)據(jù)是行業(yè)發(fā)展的需要,也是社會(huì)進(jìn)步的標(biāo)志。然而,隨著數(shù)據(jù)量與日俱增,傳統(tǒng)的智能數(shù)據(jù)處理方式逐漸顯現(xiàn)出了不足之處,如無(wú)法處理非線性信息,抽象信息等。而人工神經(jīng)網(wǎng)絡(luò)正是基于上述問(wèn)題發(fā)展而來(lái)的智能信息數(shù)據(jù)處理技術(shù),該技術(shù)可以有效滿足人們?cè)谏a(chǎn)生活中對(duì)數(shù)據(jù)處理的需求,并已在諸多領(lǐng)域得到應(yīng)用。
經(jīng)濟(jì)數(shù)據(jù)的分析,正在對(duì)行政管理和經(jīng)濟(jì)政策的制定起著重要作用。通過(guò)分析一個(gè)地區(qū)的經(jīng)濟(jì)水平,有關(guān)部門(mén)可以評(píng)估當(dāng)?shù)亟?jīng)濟(jì)的發(fā)展形勢(shì),并依據(jù)分析結(jié)果進(jìn)行決策。傳統(tǒng)的經(jīng)濟(jì)學(xué)統(tǒng)計(jì)方法,因?yàn)槠渌惴八悸返木窒扌裕y以對(duì)經(jīng)濟(jì)形勢(shì)做出較為準(zhǔn)確的分析。本文利用人工神經(jīng)網(wǎng)絡(luò)利于處理不完整的、模糊的、不確定的、無(wú)規(guī)律的數(shù)據(jù)的優(yōu)勢(shì),通過(guò)對(duì)人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)及其算法進(jìn)行深入分析,并將某農(nóng)村的快遞量與當(dāng)?shù)氐慕?jīng)濟(jì)狀況建立聯(lián)系,通過(guò)人工神經(jīng)網(wǎng)絡(luò)的智能處理,得到的結(jié)果為有關(guān)部門(mén)提供決策依據(jù)。
1 數(shù)據(jù)智能化處理技術(shù)
1.1 概況
在當(dāng)今時(shí)代,隨著數(shù)據(jù)量的不斷擴(kuò)大,傳統(tǒng)的智能數(shù)據(jù)分析法越來(lái)越難以滿足人們對(duì)數(shù)據(jù)處理的需求。但一些經(jīng)典的方法依然可以沿用:首先是決策樹(shù)。它基于信息論基礎(chǔ),輸出的數(shù)據(jù)易于為人理解,但其面對(duì)復(fù)雜的數(shù)據(jù)時(shí)有所欠缺。其次是相關(guān)規(guī)則,它通常用于解決龐大數(shù)據(jù)量的分析,人們常用它來(lái)削減搜索空間。第三種是遺傳算法。它利用生物學(xué)上的相關(guān)理念進(jìn)行問(wèn)題搜索,運(yùn)用生物進(jìn)化等理念構(gòu)造適應(yīng)函數(shù),并引入選擇、復(fù)制、交配和突變等情形以達(dá)到優(yōu)化數(shù)據(jù)的目的。第四種是粗糙集。它可以將未知的、不準(zhǔn)確的數(shù)據(jù)用已知的、準(zhǔn)確的數(shù)據(jù)來(lái)模糊刻畫(huà),從而達(dá)到分析數(shù)據(jù)的目的。最后是人工神經(jīng)網(wǎng)絡(luò),是通過(guò)借助大量處理器構(gòu)造成類(lèi)似人腦的神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)對(duì)數(shù)據(jù)的處理目的。
本文正式基于對(duì)人工神經(jīng)網(wǎng)絡(luò)的研究與應(yīng)用現(xiàn)狀,通過(guò)結(jié)合人工神經(jīng)網(wǎng)絡(luò)在大數(shù)據(jù)處理中的優(yōu)勢(shì),探討其在經(jīng)濟(jì)數(shù)據(jù)處理中的應(yīng)用,下面將對(duì)人工神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)處理技術(shù)進(jìn)行深入分析總結(jié)。
1.2 基于人工神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)處理技術(shù)
人工神經(jīng)網(wǎng)絡(luò)最早于1943年由心理學(xué)家W.S.McCulloch和數(shù)理邏輯學(xué)家W.Pitts提出。人工神經(jīng)網(wǎng)絡(luò)技術(shù)是基于現(xiàn)代神經(jīng)科學(xué)的研究成果,通過(guò)各單元的信息交流,模擬大腦神經(jīng)突觸的方式進(jìn)行數(shù)據(jù)處理。作為當(dāng)今智能數(shù)據(jù)處理的主要技術(shù)之一,已經(jīng)在信息科學(xué)、心理學(xué)、認(rèn)知科學(xué)、醫(yī)學(xué)等理論學(xué)科以及控制、交通、氣象監(jiān)測(cè)等實(shí)踐領(lǐng)域被廣泛應(yīng)用。其建構(gòu)基礎(chǔ)是類(lèi)似于人腦中的神經(jīng)元處理單元,在不同領(lǐng)域的應(yīng)用中,處理單元可以表示為不同的對(duì)象,例如某個(gè)特定的數(shù)據(jù)、字母、概念、或者一些有意義的抽象模式。處理單元通??梢苑譃?類(lèi):輸入單元、隱含單元和輸出單元,一般結(jié)構(gòu)如圖1所示。輸入單元負(fù)責(zé)向人工神經(jīng)網(wǎng)絡(luò)輸入數(shù)據(jù),輸出單元負(fù)責(zé)向操作者傳送處理后的數(shù)據(jù),真正的數(shù)據(jù)處理由隱含單元實(shí)現(xiàn)。各個(gè)單元之間的連接強(qiáng)度可以通過(guò)連接權(quán)值反應(yīng),操作者增加或減少某條通路上的權(quán)值便可以達(dá)到優(yōu)化神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)處理目的,其中圖2是一個(gè)典型節(jié)點(diǎn)處理模型。
人工神經(jīng)網(wǎng)絡(luò)采用了與傳統(tǒng)數(shù)據(jù)處理方法完全不同的思路,克服了傳統(tǒng)的基于邏輯符號(hào)的人工智能處理系統(tǒng)在處理非線性信息,非直接化信息方面的不足,具有自適應(yīng)、自學(xué)習(xí)等特點(diǎn),也具有聯(lián)想存儲(chǔ)及高效尋找優(yōu)化解的能力。
2 經(jīng)濟(jì)數(shù)據(jù)處理案例分析
2.1 案例背景介紹
近年來(lái),隨著電商業(yè)務(wù)的不斷蓬勃發(fā)展,生活在農(nóng)村的百姓也逐漸習(xí)慣網(wǎng)上購(gòu)物,農(nóng)村地區(qū)快遞與物流業(yè)持續(xù)繁榮,互聯(lián)網(wǎng)經(jīng)濟(jì)在農(nóng)村整體經(jīng)濟(jì)的占比持續(xù)提升。
判斷一個(gè)村的經(jīng)濟(jì)發(fā)展情況需要對(duì)一系列經(jīng)濟(jì)指標(biāo)進(jìn)行綜合判斷,但這種方法耗時(shí)耗力且需要一定的統(tǒng)計(jì)周期,并不利于管理者快速?zèng)Q策。快遞與物流業(yè)務(wù)數(shù)據(jù)雖然只是農(nóng)村經(jīng)濟(jì)發(fā)展各項(xiàng)指標(biāo)中的很小一部分,但通過(guò)數(shù)據(jù)挖掘建模,可以在大概率上預(yù)測(cè)成功農(nóng)村發(fā)展的水平,為高效管理決策做支持。
2.2 數(shù)據(jù)分析模型
2.2.1 數(shù)據(jù)來(lái)源
由于鄉(xiāng)村經(jīng)濟(jì)發(fā)展和快遞物流數(shù)據(jù)難以完全獲得,且本文只是為了證明通過(guò)數(shù)據(jù)挖掘技術(shù)可以高效預(yù)測(cè)農(nóng)村經(jīng)濟(jì)發(fā)展水平,即挖掘技術(shù)在經(jīng)濟(jì)決策中的可行性,因此分析模型共模擬了村莊的快遞、物流和經(jīng)濟(jì)發(fā)展水平信息,如圖3所示。
圖3為對(duì)1 000個(gè)農(nóng)村數(shù)據(jù)的散點(diǎn)圖展示,橫軸為快遞業(yè)務(wù)量(件/月),縱軸為物流業(yè)務(wù)量(噸/月),大的散點(diǎn)代表經(jīng)濟(jì)發(fā)達(dá)的村莊,小的散點(diǎn)代表經(jīng)濟(jì)欠發(fā)達(dá)的村莊,從圖中可以大致看出,快遞業(yè)務(wù)和物流業(yè)務(wù)越發(fā)達(dá)的地區(qū),農(nóng)村經(jīng)濟(jì)發(fā)展越好
2.2.2 數(shù)據(jù)處理
運(yùn)用統(tǒng)計(jì)軟件來(lái)進(jìn)行數(shù)據(jù)讀取,剔除異常值后,進(jìn)行數(shù)據(jù)建模。隨機(jī)選取70%的數(shù)據(jù)定義為訓(xùn)練集,30%為測(cè)試集。用訓(xùn)練集來(lái)做BP神經(jīng)網(wǎng)絡(luò)模型,再用測(cè)試集進(jìn)行效果驗(yàn)證,通過(guò)調(diào)整參數(shù),選取混淆矩陣中預(yù)測(cè)準(zhǔn)確率最高的模型,最終選取的參數(shù)為:隱藏節(jié)點(diǎn)數(shù)為3,權(quán)值的衰減參數(shù)為0.05,迭代次數(shù)為10 000次。
2.3 處理結(jié)果分析
訓(xùn)練集、測(cè)試集的混淆矩陣如圖4所示。訓(xùn)練集中分類(lèi)準(zhǔn)確率為81%,測(cè)試集中分類(lèi)的準(zhǔn)確率為77%,表明如果已知農(nóng)村快遞量和物流量,我們有77%的把握預(yù)測(cè)對(duì)該農(nóng)村經(jīng)濟(jì)發(fā)展的程度。
3 智能數(shù)據(jù)處理技術(shù)存在的問(wèn)題及對(duì)策
3.1 存在問(wèn)題分析
對(duì)于數(shù)據(jù)本身而言,在某些行業(yè)運(yùn)用智能數(shù)據(jù)處理技術(shù)處理數(shù)據(jù)往往會(huì)遇到非常大的困難。許多行業(yè)的數(shù)據(jù)積累在數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范上缺乏預(yù)先定義可廣泛適用的描述,在數(shù)據(jù)的分類(lèi)上也會(huì)有不完全的現(xiàn)象,甚至出現(xiàn)分類(lèi)出錯(cuò)的問(wèn)題,使智能處理數(shù)據(jù)技術(shù)遠(yuǎn)不能達(dá)到其預(yù)期作用。
對(duì)于本文所提到的人工神經(jīng)網(wǎng)絡(luò)而言,因其采用了與傳統(tǒng)數(shù)據(jù)處理方法完全不同的思路,克服了傳統(tǒng)的基于邏輯符號(hào)的人工智能處理系統(tǒng)在處理非線性信息和非直接化信息方面的不足,人們更希望將它用于處理回歸估計(jì)型的問(wèn)題。目前在國(guó)內(nèi),人工神經(jīng)網(wǎng)絡(luò)回歸型結(jié)構(gòu)研究還很少。在建立人工神經(jīng)網(wǎng)絡(luò)時(shí),人們更加注重的是規(guī)則對(duì)于計(jì)算機(jī)的可理解性,這會(huì)犧牲一定的預(yù)測(cè)結(jié)果保真性。在不斷錄入數(shù)據(jù)的同時(shí),需要對(duì)整個(gè)人工神經(jīng)網(wǎng)絡(luò)進(jìn)行不斷訓(xùn)練,從而使預(yù)測(cè)結(jié)果盡可能準(zhǔn)確,這個(gè)過(guò)程會(huì)耗費(fèi)大量的人力物力。
3.2 相關(guān)解決措施
在提高數(shù)據(jù)質(zhì)量上,需要人們?cè)谀承?shù)據(jù)質(zhì)量欠佳的行業(yè)整合異構(gòu)數(shù)據(jù)源,如在多個(gè)數(shù)據(jù)源擁有者之間建立具有一致性的協(xié)議,并提供相應(yīng)的接口;加強(qiáng)數(shù)據(jù)質(zhì)量監(jiān)督,系統(tǒng)地記錄并跟蹤數(shù)據(jù)質(zhì)量,如增加對(duì)數(shù)據(jù)的溯源、處理歷史、演化及更新等方面的標(biāo)準(zhǔn)研究;促進(jìn)數(shù)據(jù)的開(kāi)放共享,建立一些大數(shù)據(jù)公共資源庫(kù),通過(guò)多方的數(shù)據(jù)處理而得到平均結(jié)果,從而提高人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的準(zhǔn)確度。
在完善人工神經(jīng)網(wǎng)絡(luò)上,需要相關(guān)機(jī)構(gòu)在回歸估計(jì)問(wèn)題領(lǐng)域?qū)θ斯ど窠?jīng)網(wǎng)絡(luò)進(jìn)行研究,提出解決方案,提高人工神經(jīng)網(wǎng)絡(luò)的普適性;在輸入人工神經(jīng)網(wǎng)絡(luò)處理規(guī)則時(shí),人們需要在保真性與可理解性之間尋找平衡點(diǎn),使人工神經(jīng)網(wǎng)絡(luò)在可以理解并計(jì)算的同時(shí)提供最大限度準(zhǔn)確的結(jié)果;在處理不斷錄入的數(shù)據(jù)時(shí),如果人工神經(jīng)網(wǎng)絡(luò)可以具備增量學(xué)習(xí)能力,其便可以不斷完善自身,不必再耗費(fèi)人力物力完善。
4 結(jié)論
通過(guò)本文實(shí)例研究,發(fā)現(xiàn)利用人工神經(jīng)網(wǎng)絡(luò)模型,可以通過(guò)少量的局部經(jīng)濟(jì)指標(biāo)參數(shù)預(yù)測(cè)全局經(jīng)濟(jì)指標(biāo),相比傳統(tǒng)統(tǒng)計(jì)方法,人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)速度更快,且計(jì)算精度并未降低,較傳統(tǒng)的統(tǒng)計(jì)學(xué)分析方法消耗的人力物力更少。因此,相比傳統(tǒng)統(tǒng)計(jì)方法,采用人工神經(jīng)網(wǎng)絡(luò)模型處理經(jīng)濟(jì)數(shù)據(jù)、輔助經(jīng)濟(jì)決策,是更為科學(xué)合理的選擇。
參考文獻(xiàn)
[1]朱大奇,史慧.人工神經(jīng)網(wǎng)絡(luò)原理及應(yīng)用[M].北京:科學(xué)出版社,2006.
[2]李騫,郭慧玲. 經(jīng)濟(jì)預(yù)測(cè)與分析的智能數(shù)據(jù)挖掘[J].煤炭技術(shù),2011,30(10):223-225.
[3]徐坤.OLAP在宏觀經(jīng)濟(jì)智能決策支持系統(tǒng)中的研究與應(yīng)用[D].南昌:南昌大學(xué),2012.
[4]徐緒松,吳健謀,胡則成.金融數(shù)據(jù)分析智能信息處理技術(shù)[J].科技進(jìn)步與對(duì)策,2000,17(6):95-96.
[5]畢春杰.數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計(jì)中的應(yīng)用探究[J].經(jīng)濟(jì)視野,2013(19).