杜元偉,楊 娜
(1.中國海洋大學管理學院, 山東 青島 266100;2.昆明理工大學管理與經濟學院, 云南 昆明 650093)
?
大數據環(huán)境下雙層分布式融合決策方法
杜元偉1,楊 娜2
(1.中國海洋大學管理學院, 山東 青島 266100;2.昆明理工大學管理與經濟學院, 云南 昆明 650093)
為了解決大數據環(huán)境下雙層分布式決策中存在的決策推理難題和信息冗余難題,基于該類決策中存在的參與主體龐雜性和業(yè)務關系交叉性分析給出了有關推斷信息之間存在相關性的假設,并結合證據理論中的基本概率分配函數提出了具有柔性表達優(yōu)勢的推斷信息描述機理,在此基礎上分別針對上下兩層部門構建了能夠剔除管理者影響、上層部門影響且可以對部門內部所有決策主體的元推斷信息進行科學融合的定理和推論,最后按照“由上至下”的決策秩序構建了大數據環(huán)境下雙層分布式融合決策的方法步驟。數值對比分析結果表明提出方法具有科學性和可行性,有利于拓展大數據環(huán)境下組織管理決策問題的解決思路,探索處理不完備性數據、相關性數據的“大”模式。
大數據環(huán)境;雙層決策;分布式決策;證據理論;信息融合
隨著技術的進步和社會的發(fā)展,傳統的集中式決策越來越難以滿足組織對科學化、系統化、民主化決策的現實需要,分布式決策應運而生并逐漸成為一種重要的決策方法。所謂分布式決策,是由多個部門(群體)遵循一定秩序獨立地開展決策并通過綜合各部門決策結果做出系統滿意決策的分析判斷過程。近年來,已有專家學者注意到分布式決策問題并對其開展了一些具有普適性或者特殊性的研究。普適性研究側重從現實分布式決策問題中探索出具有一般性的決策架構和模型方法。如:Schneeweiss、Soubie等通過研究若干領域的分布式決策問題,抽象出能夠實現分布式信息有效集成的支持框架與決策方法[1-2];Wernz[3]、Tiryaki等[4]以大型分布式決策系統為研究對象,構建了允許決策群體在多維尺度上存在交互作用的信息集成模型;范波[6]、魏守智等[5]針對多源分布式問題,基于證據理論、神經網絡等方法提出了新的融合模型與決策方法。特殊性研究是通過分析某些特定決策問題的性質特征提煉出相應的解決方案或者開發(fā)出相應的技術平臺。如:LingQing等[7]、Wise等[8]構建了適用于敏捷軍事無線電網絡和在線結構健康監(jiān)測系統的分布式控制/決策算法;Alemany[9]、張偉等[10]分析了能夠支持供應鏈協同規(guī)劃的分布式決策過程和適用于航空發(fā)電機智能溫度傳感器的分布式數據融合判決方法;Moskowitz[11]、陳宏偉等[12]應用Java等技術開發(fā)出了可以提升高危機情況下分布式決策能力的應用工具以及基于多智能代理的分布式決策支持系統??v觀上述研究不難發(fā)現,分布式決策已經引起了國內外專家學者的關注,不管是在普適性研究方面還是在特殊性研究方面都取得了一定的成果,為促進該類研究日趨成熟奠定了重要的基礎。分布式決策的關鍵在于:一方面要從不同層面有效地提取各個部門對特定決策問題的分析判斷信息,另一方面還要對這些信息進行科學融合以做出系統滿意決策。然而,人、機、物三元世界的高度融合引發(fā)了數據規(guī)模的爆炸式增長和管理模式的復雜化演變,我們已經進入大數據(BigData)時代[13],在新時代背景下,現有成果是否依舊適用是值得商榷的。
大數據的發(fā)展與應用給經濟、社會、生活等方方面面的發(fā)展與變革帶來了極其深遠的影響,其數據體量大、流動快、形態(tài)多樣、價值密度低以及真實性不高等特點也加劇了對其開展研究的難度。目前該領域的主流研究思路是從機器或計算機的角度出發(fā),以各種高性能處理算法、智能搜索或挖掘算法等為主要研究內容,重在提高機器的計算能力和人工智能[14, 15],如基于Hadoop和MapReduce框架的大數據處理方法以及各類面向大數據的機器學習和數據挖掘方法等[16]。舍恩伯格指出:大數據的“大”,并不是指數據本身絕對數量大,而是指處理數據所使用的模式“大”——盡可能地收集全面數據、完整數據和綜合數據,同時使用數學方法對其進行分析和建模,挖掘出背后的關系,從而預測事件發(fā)生的概率[17]。令人遺憾的是,目前對于“大數據”的研究尚側重于應用數據挖掘算法從海量的數據中提煉知識,而忽視了該種環(huán)境對決策模式的沖擊和變革研究[16, 18]。
作為一種典型的決策模式,分布式決策憑借其在信息并行化處理和多元化集成方面的獨特優(yōu)勢,無疑會對組織基于大數據開展現代化管理起到異常重要的作用。在大數據環(huán)境下,組織為了實現數據驅動決策(Data-DrivenDecisionMaking)的目的,往往需要盡可能多地提取并整合各個部門的決策信息(如:數據、文本、態(tài)度等)[19]。當部門數量較少且部門之間彼此獨立時(小數據環(huán)境),這些信息既易于處理又具有互補關系,有利于輔助組織做出高質量的決策;當部門數量較多且部門之間聯系緊密時(大數據環(huán)境),則不僅存在信息處理困難的問題,而且還會因為決策中重復吸納大量冗余信息而造成決策失效的后果。另外,各個部門為了開展日常管理工作采集并保存了大量的結構化數據文件,當面對由內外部環(huán)境變化所帶來的一系列新問題時,這些數據就會變成半結構化或者非結構化的,無法直接用于決策。按照大數據中可視化分析和人機交互的觀點,在利用計算機自動化分析能力的同時,要充分挖掘人對于可視化信息的認知能力優(yōu)勢,將人、機的各自強項進行有機融合,借助人機交互式分析方法和交互技術輔助人們更為直觀和高效地洞悉大數據背后的信息、知識與智慧[20]。也就是說,雖然已有數據難以直接用于決策,但卻可以由具有主觀能動性的人基于自身經驗和對數據的理解而給出決策所需要的信息。此時,如何科學地從半結構化/非結構化的數據中推理出面向特定決策問題的結構化決策信息(稱之為決策推理難題),以及如何有效地剔除其中存在的冗余性信息并開展最終決策(稱之為信息冗余難題),是大數據環(huán)境下分布式決策面臨的兩個重要難題。顯然,現有研究成果無法解決上述難題。
從層次觀點來看,大數據系統包含基礎設施層、計算層和應用層三個層次[13],其中應用層側重于從管理層面利用大數據分析結果解決實際決策問題。在大數據環(huán)境下,參與分布式決策的部門類別眾多、人員數量龐大,他們在業(yè)務上既可能存在相互獨立、彼此互補的橫向平行關系,又可能存在宏觀管制、微觀執(zhí)行上的縱向層次關系。我們認為,上述參與主體的龐雜性和業(yè)務關系的交叉性是導致決策推理難題和信息冗余難題的根本原因(具體請參見后文)。有鑒于此,本文結合日趨扁平化的雙層分布式決策結構,在分析上下兩層決策主體推斷信息之間關系的基礎上,從應用層面構建大數據環(huán)境下雙層分布式融合決策方法。
在科層制的組織框架下,分布式決策通常由組織中存在管理與被管理關系的上層部門和下層部門共同參與完成。遵循決策分析的建模架構,設決策問題是要從備選方案集合{ar|r=1,…,R}中選擇出最優(yōu)方案a*,參與決策的上下兩層部門分別為{Ui|i=1,…,I}和{Vj|j=1,…,J}。因參與決策的主體是各個部門中的管理者及成員,并由他們基于非結構化或者半結構化的數據信息開展推理判斷,故設上層部門Ui中參與決策的主體為{uik|k=0,…,Ki}、由uik給出的推斷信息為eik,下層部門Vi中參與決策的主體為{vjk|k=0,…,Kj}、由vjk給出的推斷信息為fik。當k=0時uik和vjk表示部門的管理者,當k≠0時二者表示部門的成員?;谏鲜龇枠擞洠疚难芯繂栴}可以描述為,提取上下兩層部門中各個決策主體對最優(yōu)方案的推斷信息eik(?i,?k)和fjk(?j,?k),并通過對推斷信息的融合集成(融合集成之后的信息表示為Q)選擇出最優(yōu)方案a*的分析判斷過程。上述問題可以由圖1進行描述。
圖1 雙層分布式決策問題描述
雙層分布式決策的結構特征決定了上下兩層部門之間、部門內部成員之間均存在著管理與被管理的關系,導致了源于上下兩層部門各個成員的推斷信息中可能存在著大量的冗余之處。為了剔除冗余推斷信息、提高決策質量,這里在充分考慮雙層分布式決策結構特征的基礎上提出以下相關性合理性假設(冗余是由相關導致的)。
假設1 由存在管理與被管理關系的決策主體所給出的推斷信息之間存在相關性。
首先,由隸屬于同一部門的決策主體給出的推斷信息之間存在相關性。無論是上層還是下層,同一部門的成員因長期共事可能積累了許多相同或類似的知識,導致針對同一問題所給出的推斷信息之間具有相關性。之所以存在上述問題,其關鍵原因在于這些成員接受同一管理者的命令和監(jiān)督,不管在信息接收還是在信息處理方面都會受到該管理者的影響。當面對特定決策問題時,同一部門的成員在部門管理者的領導下,各自結合自身工作經驗和專業(yè)知識進行分析并給出相應的推斷信息,在這一過程中就可能或直接或間接地體現出管理者意志的成分,即部門成員給出的推斷信息是他們的自身意愿與管理者意志相融合的結果。因此,由隸屬于同一部門的決策主體給出的是存在相關性的推斷信息,其中管理者意志(體現為推斷信息)可能重復存在于部門成員給出的推斷信息之中。需要說明的是,雖然部門成員在給出推斷信息時可能會考慮管理者的意志,但由于每個人的固有性格、職業(yè)習慣、處事原則等諸多差異,使其受管理者意志的影響程度也會有所不同。對于一個性格強硬、做事自信、有主見、有原則的成員,他幾乎能夠不受管理者影響、給出自己本意的推斷信息;相反,對于一個性格軟弱、優(yōu)柔寡斷、無主見、無原則的成員,他很可能會被管理者強烈影響、給出幾乎等同于管理者意志的推斷信息。當然,大多數部門成員是居于這兩種極端性格之間的,即給出的推斷信息中既有融合管理者意志的成分也有表達自身意愿的成分,兩種成分的比例結構要視每個成員受管理者的影響程度而定。
其次,由下層各個部門給出的推斷信息之間存在相關性。上下兩層之間是管理與被管理的關系,不同的下層部門可能要服從同一上層部門的指揮和領導,導致由它們給出的推斷信息之間存在相關性。當面對特定決策問題時,下層部門可能會顧忌與本部門聯系比較密切的上層部門的意志與偏好而自覺或不自覺地給出融合自身部門意志和上層部門意志的復合性推斷信息,容易造成受同一上層部門影響的多個下層部門所給出的推斷信息之間存在著一定的重合之處,其中上層部門意志(體現為推斷信息)可能重復存在于下層部門給出的推斷信息之中。更具體地說,下層部門管理者作為介于上層部門和部門成員的中間媒介,既要領會上層部門的政策方針,又要向部門成員貫徹本部門的指導思想,所以上層部門的意志一般是先影響下層部門的管理者進而再影響部門成員的。因此在下層部門中,管理者給出的是融合其自身意志和上層部門意志的推斷信息,而部門成員給出的則可能是融合自身意志、管理者意志、上層部門意志的推斷信息(上層部門意志隱含于管理者的推斷信息之中)。類似于假設1中的觀點,與下層某一部門聯系緊密的多個上層部門對該下層部門的影響程度是不同的,即上層某部門與該下層部門在組織上的直接領導關系越強、工作內容聯系越密切,則該下層部門在決策中受到該上層部門的影響就可能越大,其給出的推斷信息中融合該上層部門意志的成分也可能越多,反之亦然。
值得說明的是,由上層各個部門給出的推斷信息之間通常是相互獨立的。首先,同處于上層的多個部門在等級上互為平行結構,相互之間并無領導、被領導關系,且在工作內容上不存在交叉重疊,因而在決策中能夠保持彼此獨立關系、不會相互影響或制約。其次,從組織結構設計理論來看,所構建的職能部門都是從某個或某些方面服務于組織整體的,即在目標管理上彼此互補、互不重合,故上層各部門結合自身部門性質與工作職責給出特定決策問題的推理信息之間理應不存在相關性。
雙層分布式決策涉及組織的兩個層次、多個部門,決策主體之間不僅類型跨度大而且推斷能力差異也大。針對特定的決策問題,決策主體基于部門獲取的數據并結合自身掌握的業(yè)務知識開展推斷,而數據信息的結構化程度、業(yè)務知識的專業(yè)化程度決定了一般不能期望所有決策主體都能給出完備的推斷信息??紤]到證據理論作為一種不確定性推理技術,能夠利用基本概率分配(BasicProbabilityAssignment,BPA)函數描述不完備性信息,并且已經在人工智能、信息融合等方面得到了廣泛應用[21],因此這里采用BPA函數描述由決策主體給出的不完備性推斷信息。
同前文定義,若用于解決問題的備選方案集合{ar|r=1,…,R}中所有元素互斥且可窮舉,其中的最優(yōu)方案a*是唯一正確答案,則{ar|r=1,…,R}即構成了該問題的識別框架Θ。該識別框架的任意非空子集為A,其可信程度為m(A),若映射函數m:2Θ→[0,1]滿足m(?)=0且∑A?Θm(A)=1,則稱m為Θ上的BPA函數。若m(A)>0,則稱A為Θ的焦元。決策主體通過分析半結構化/非結構化的數據信息,結合自身知識、經驗會對決策問題有一定程度的認識。當認識程度極其深刻時,決策主體能對每一個方案都給出推斷信息,設推斷ar為最優(yōu)方案的可能性為m(ar),則其給出的所有推斷信息可描述為{m(ar)|m(ar)≥0,r=1,…,R;∑rm(ar)=1};當認識程度極其膚淺時,決策主體可能無法給出任何推斷信息,或者說完全不知道哪個才可能是最優(yōu)方案,此時其推斷信息可描述為{m(Θ)=1};更一般的情形是當認識程度介于上述兩種極端之間時,決策主體雖然不能對每個備選方案都進行推斷,但至少能對其中的一部分給出一些推斷信息,此時若設由其推斷給出的方案組A(其中可以只包含一個方案,也可以包含多個方案)中可能存在的最優(yōu)方案的可能性為m(A),則由其給出的所有推斷信息可描述為{m(A)|m(A)≥0,A?Θ;∑A?Θm(A)=1}。顯然,對于前兩種推斷信息的描述都是第三種描述形式的特例,而第三種描述形式恰好是BPA函數的一般形式。由此可見,采用BPA函數能夠為決策主體依據自身推斷能力給出合適的決策信息提供平臺,在此基礎上便可以借助證據理論中的組合規(guī)則對部門內部或者部門之間的推斷信息進行融合。
基于BPA函數m,可以計算出描述事件發(fā)生概率下限與上限的信任函數Bel(A)=∑B?Am(B)和似然函數Pl(A)=∑A∩B≠?m(B)。特別地,眾信度函數Q是信度函數的另一種表達方式,其定義為Q(A)=∑A?Xm(X),且對于任意焦元X均滿足∑?≠X?Θ(-1)|X|+1Q(X)=1。眾信度函數與BPA函數、信度函數、似然函數是一一對應的關系,若設|B|表示命題B中含有元素的個數,|A-B|表示命題A與B的差集中含有元素的個數,則三者之間可由以下公式進行相互轉換[22]。
(1)
若設由兩個決策主體推斷給出的BPA函數分別為m′和m″,計算出的眾信度函數為Q′和Q″,G=∑?≠X?Θ(-1)|X|+1Q′(X)Q″(X),則在二者相互獨立的條件下能夠對他們進行有效融合的組合規(guī)則為
Q(A)=G-1Q′(A)Q″(A)
(2)
對于存在多個決策主體的情形,可對式(2)開展兩兩融合并在多次迭代后算得最終融合結果。不難證明,該規(guī)則與傳統Dempster組合規(guī)則等價[23]。
因為式(2)所示的組合規(guī)則僅適用于推斷信息之間相互獨立時的證據融合,但無論是在上下兩層部門內部還是在下層部門之間,推斷信息之間都存在著相關性,所以并不能直接應用該組合規(guī)則開展推斷信息融合。下面結合上層部門和下層部門的信息融合問題特征分別進行研究。
(1)上層部門的推斷信息融合
圖2 上層部門信息推斷機理
(3)
[μikQi0(X)+1-μik],k=1,…,Ki,A為其推斷信息中的焦元,Qi0(A)和Qik(A)分別為由ei0和eik計算的眾信度函數。
證畢。
推論1 設上層部門內由管理者ui0和成員uik給出的推斷信息ei0和eik,其對應的眾信度函數分別為Qi0和Qik,k=1,…,Ki其中uik受ui0的影響程度為μik,0<μik<1,則能夠剔除ui0重復影響且對部門內所有元推斷信息進行融合的結果必為
(4)
證畢。
由此可見,下層部門中的部門成員僅受管理者影響,故只要上層部門中的管理者和成員給出以BPA函數形式存在的推斷信息,結合部門成員受管理者影響程度,就一定能夠基于定理1和推論1對它們進行科學融合并得到以眾信度函數形式存在的、代表部門意見的部門推斷信息。
(2)下層部門的推斷信息融合
圖3 下層部門信息推斷機理
(5)
(6)
在科層制的組織框架下,決策總是按照“由上至下”的秩序執(zhí)行[26],即在部門之間先由上層部門決策再由下層部門決策、在部門內部先由管理者決策再由部門成員決策,以此保證決策過程的方向性與原則性。其中:方向性體現在上層部門從宏觀層面把握決策方向,下層部門從微觀層面開展具體實施;原則性體現在部門管理者制定決策原則,部門成員負責決策操作。在大數據環(huán)境下雙層分布式決策中,只有將上述決策主體的決策信息盡可能地收集完整并科學融合,才能做出“大”模式下的系統滿意決策。為此,本文將前文提出的推斷信息描述機理和推斷信息融合定理分別作為解決“決策推理難題”和“信息冗余難題”的技術手段,并遵循“由上至下”的決策秩序構建大數據環(huán)境下雙層分布式融合決策方法。具體如下:
步驟1 針對決策問題制定備選方案。為了解決決策問題,集合群體智慧構建相應的備選方案集{ar|r=1,…,R}。因為備選方案之間是互斥且可窮舉的,并且方案集中有且僅有一個方案a*是解決問題的最優(yōu)方案,所以{ar|r=1,…,R}即構成了該問題的識別框架Θ。
步驟5融合上下兩層部門推斷信息。由步驟3和步驟4可以得到上層部門推斷信息{E1,…,EI}和下層部門推斷信息{F1,…,Fj}。因為上述信息均是剔除上層部門、管理者等重復影響后的部門元推斷信息,彼此之間是相互獨立的,故可以直接使用如式(2)所示的組合規(guī)則對其予以融合,最終得到能夠對兩層所有部門元推斷信息進行融合的最終結果Q,該結果即是反映所有決策主體真實推斷意見的集成結果。
步驟6 依據特定標準做出最終決策。根據BPA函數和眾信度函數之間的轉換關系,基于式(1)可以計算出與Q對應的以BPA函數形式存在的最終融合結果m。通過計算m中各焦元的信任函數或者似然函數,按照特定的評價標準即可做出最終決策。本文推薦將能有效集成信任函數和似然函數的Pignistic概率作為判別方案優(yōu)劣的評價標準[27],即基于最終融合結果m,按照信度函數和似然函數的定義計算方案ar的信任度Bel(ar)和似然度Pl(ar),并按照下式計算二者的折合因子:
πr=[1-∑ar?ΘBel(ar)]/∑ar?ΘPl(ar)
(7)
則ar的Pignistic概率為P(ar)=Bel(ar)+πr·Pl(ar),r=1,…,R。因為P(ar)取值越大表明為最優(yōu)方案的可能性越大,所以可由取值對所有方案進行全排序并據此作出最終決策。
設制定的用于解決決策問題的備選方案集為{ar|r=1,…,5},參與決策的共有3個上層部門{U1,U2,U3}和2個下層部門{V1,V2},每個部門均有1個管理者和3個成員,其中ui0和vj0為各個部門的管理者,其余uik和vjk(k≠0)為部門成員,i,j=1,2,3。上述信息以及部門成員受管理者的影響程度參數μik和ηjk(?i,j)、下層部門受上層部門的影響程度參數γjk(?i,j)具體如圖4所示。下面借鑒科學研究中經常使用的一種對比方式,分別采用標準方法、傳統方法、本文方法進行模擬求解[28, 29],并通過三者之間的結果對比來分析方法的科學性和可行性。
圖4 上下兩層決策主體及影響程度參數
(1)標準方法
上述推斷信息詳見表1-5。為便于表述,表中ID表示識別框架Θ={a1,…,a5}中冪集元素的序號,即2Θ=({a1),…,{a5},{a1,a2},{a1,a3},…,{a1,…,a5})。如:表1中第7行第2列數據具體含義是m(a1,a2)=0.060。
因為表中數據是決策主體的元推斷信息,彼此之間既無重復之處又無相關關系,所以利用Dempster組合規(guī)則對它們進行融合所得到的就是能夠全面、真實反映上下兩層所有決策主體意見的科學融合結果。具體而言:首先將表1-5中所有元推斷信息轉化為相應的眾信度函數,然后以部門為單位將所有決策主體的元推斷信息代入式(2)計算部門內部的融合結果,在此基礎上將經過上述融合得到的所有部門的推斷信息再代入式(2),計算得到上下兩層中所有部門的綜合集成結果,最后按照上一節(jié)中的步驟6計算備選方案的Pignistic概率,并據此實現所有方案的優(yōu)劣排序(見表6第2-3列)。需要說明的是,之所以給出表1-5所示的元推斷信息,一方面是為模擬生成傳統方法和本文方法的輸入數據提供來源,保證輸入數據的同源性,另一方面是其計算結果可以為方法對比提供參照標準,保證模擬結果的可比性。為便于表述,這里將元推斷信息、上述融合過程、由其計算的結果分別稱為標準數據、標準方法和標準結果。
表1 上層部門U1中的元推斷信息
表2 上層部門U2中的元推斷信息
表3 上層部門U3中的元推斷信息
表4 下層部門V1中的元推斷信息
(2)傳統方法
表5 下層部門中V2的元推斷信息
(3)本文方法
本文方法采用兩組數據分別進行求解。一組是采用與傳統方法完全相同的模擬輸入數據,即傳統方法中生成的eik、fjk以及圖4中的μik、ηjk、γij,?i,j,k;另一組是刪除?eik、?fjk中大約15%的信息(對第一組數據每個決策主體的推斷信息隨機刪除1條),并將刪除信息理解為“不知道”、其值被賦值給全局不確定(識別框架)。本文方法承認決策主體會受部門管理者和上層部門影響的客觀事實,以決策主體在現實中給出的實際推斷信息為研究對象,利用推論1計算得到能夠剔除管理者影響、對部門內部決策主體的元推斷信息進行融合的結果,再利用定理2、推論2計算得到能夠剔除上層部門影響、對所有部門的元推斷信息進行融合的結果,最后通過計算Pignistic概率實現方案的優(yōu)劣全排序(具體過程見前文步驟2-步驟6,模擬求解結果見表6中6-9列)。
(4)對比分析
針對a1,…,a5五個方案的排序擇優(yōu)問題,基于同一來源數據信息分別采用標準方法、傳統方法、本文方法進行模擬求解,并將上述三種方法所求得的方案Pignistic概率及其排序進行整理,得到如表6所示的對比結果。
表6 方案的Pignistic概率及其排序
由表6可知,基于傳統方法得到的方案排序與標準方法中的存在較大差異,其用于評價方案優(yōu)劣的Pignistic概率與標準結果之間的總偏差程度(兩種方法計算得到的各個方案概率值差異之和)為0.218。而基于本文方法對第一組數據進行求解所得到的無論是方案排序還是Pignistic概率均與標準方法的完全相同(表6中6-7列)。之所以出現上述結果是因為,傳統方法并未考慮推斷信息之間的相關性,故應用存在重復性的推斷信息開展融合勢必會放大某些推斷信息的作用而造成結果偏差,而本文方法則能通過剔除現實中的重復推斷信息,得到與標準數據完全相同的元推斷信息(表1-5),因此才會得到與標準方法完全相同的結果。不僅如此,本文方法還對第二組數據進行求解,得到的方案排序與標準排序完全相同(表6中8-9列),Pignistic概率與標準結果之間的總偏差為0.091,說明利用傳統方法中85%的推斷信息依然能夠得到與標準排序完全相同的結論,并且Pignistic概率總偏差程度是傳統方法的42%。由此可見,本文方法較傳統方法更具科學性與可行性。需要說明的是,標準方法僅為模擬生成傳統方法和本文方法的輸入提供數據來源(元推斷信息)、為結果優(yōu)劣樹立評判標準,而傳統方法的適用前提是假定決策主體給出的推斷信息之間是相互獨立的,上述兩種方法適用的是完全理想化的和相對理想化的決策環(huán)境。相對而言,本文方法考慮了現實與理想之間的差異,使得上述兩種理想化假設得以進一步放松,其適用的決策環(huán)境范圍更廣、得到的結果也更精準。
為了解決大數據環(huán)境下雙層分布式決策中存在的決策推理難題和信息冗余難題,本文首先基于該類決策中存在的參與主體龐雜性和業(yè)務關系交叉性分析給出了有關推斷信息之間存在相關性的假設,然后將證據理論中的BPA函數引入到對決策主體的推斷信息提取之中,提出了具有柔性表達優(yōu)勢的推斷信息描述機理,在此基礎上分別針對上層部門和下層部門構建了能夠剔除管理者影響、對上下兩層部門內部決策主體的元推斷信息進行融合的定理和推論,最后遵循“由上至下”的決策秩序構建了大數據環(huán)境下雙層分布式融合決策的方法步驟,并通過數值對比分析驗證了本文方法的科學性和可行性。本文方法的特色之處在于:一是利用推斷信息描述機理可以有效地從半結構化/非結構化的業(yè)務數據中推理出面向特定決策問題的結構化決策信息,解決決策推理難題,二是利用推斷信息融合定理可以科學地審視并融合源于決策主體的現實推斷信息,解決信息冗余難題。需要說明的是:其一,本文提出的決策方法步驟側重于解決遵循“由上至下”秩序的決策問題,但其同樣適用于限于現實時間壓力而不得不同時開展決策的情形(部門內部的管理者與成員同時開展決策或者上下兩層部門同時開展決策),此時僅需將影響程度參數調整(一般是縮小)至應有的影響程度數值即可。其二,本文方法借助人機交互的優(yōu)勢,基于證據理論解決大數據環(huán)境下管理決策中存在的決策推理難題和信息冗余難題,其建模過程有利于拓展大數據環(huán)境下組織管理決策問題的解決思路,探索處理不完備性數據、相關性數據的“大”模式。
[1]ZarateSJ.Distributeddecisionmaking:Aproposalofsupportthroughcooperativesystems[J].GroupDecisionandNegotiation,2005, 14(2): 147-158.
[2]SchneeweissC.Distributeddecisionmaking—aunifiedapproach[J].EuropeanJournalofOperationalResearch,2003, 150(2): 237-252.
[3]WernzC,DeshmukhA.Multiscaledecision-making:Bridgingorganizationalscalesinsystemswithdistributeddecision-makers[J].EuropeanJournalofOperationalResearch,2010, 202(3): 828-840.
[4]TiryakiF.Interactivecompensatoryfuzzyprogrammingfordecentralizedmulti-levellinearprogramming(DM-LLP)problems[J].FuzzySetsandSystems,2006, 157 (33): 3072-3090.
[5] 魏守智,趙海,王剛,等. 復雜信息系統分布式決策融合模型及應用研究[J]. 計算機科學,2005, 32(4): 22-23.
[6] 范波,潘泉,張洪才. 一種基于可傳遞置信模型的分布式決策方法[J]. 系統仿真學報,2004, 16(11): 2622-2624.
[7]LingQing,TianZhi,LiYue.Distributeddecision-makinginwirelesssensornetworksforonlinestructuralhealthmonitoring[J].JournalofCommunicationsandNetworks, 2009, 11(4): 350-358.
[8]WiseJ,SmithG,SaltJ,etal.Distributeddecision-makingandcontrolforagilemilitaryradionetworks[M].BerlinHeidelberg:Springer, 2006.
[9]AlemanyMME,AlarcónF,LarioF,etal.Anapplicationtosupportthetemporalandspatialdistributeddecision-makingprocessinsupplychaincollaborativeplanning[J].ComputersinIndustry, 2011, 62(5): 519-540.
[10] 張偉,錢坤,謝壽生. 航空發(fā)動機智能溫度傳感器最優(yōu)分布式決策研究[J]. 傳感技術學報. 2007, 20(3): 528-531.
[11]MoskwitzH,DrnevichP,ErsoyO.Usingreal-timedecisiontoolstoimprovedistributeddecision-makingcapabilitiesinhigh-magnitudecrisissituations[J].DecisionSciences, 2011, 42(2): 477-493.
[12] 陳宏偉,袁國斌. 基于多智能代理的分布式決策系統實現[J]. 計算機應用研究, 2002(08): 46-50.
[13]PhilipChenCL,ZhangChunyang.Data-intensiveapplications,challenges,techniquesandtechnologies:AsurveyonBigData[J].InformationSciences, 2014, 275: 314-347.
[14]FanShaokun,LauRYK,ZhaoJL.Demystifyingbigdataanalyticsforbusinessintelligencethroughthelensofmarketingmix[J].BigDataResearch, 2015, 2(1): 28-32.
[15]QinYiming,YalamanchiliHK,QinJing,etal.Thecurrentstatusandchallengesincomputationalanalysisofgenomicbigdata[J].BigDataResearch, 2015, 2(1): 12-18.
[16]ZikopoulosP,EatonC.Understandingbigdata:Analyticsforenterpriseclasshadoopandstreamingdata[M].NewYork:McGraw-HillOsborneMedia, 2011.
[17] 何軍. 大數據對企業(yè)管理決策影響分析[J]. 科技進步與對策, 2014, 31(3): 65-68.
[18] 馮芷艷,郭迅華,曾大軍,等. 大數據背景下商務管理研究若干前沿課題[J]. 管理科學學報, 2013, 16(1): 1-9.
[19] 徐宗本,馮芷艷,郭迅華,等.大數據驅動的管理與決策前沿課題[J].管理世界, 2014,(11): 158-163.
[20]ChangRM,KauffmanRJ,KwonY.Understandingtheparadigmshifttocomputationalsocialscienceinthepresenceofbigdata[J].DecisionSupportSystems, 2014, 63(0): 67-80.
[21]DengXinyang,HuYong,ChanFTS,etal.Parameterestimationbasedoninterval-valuedbeliefstructures[J].EuropeanJournalofOperationalResearch, 2015, 241(2): 579-582.
[22] 楊風暴,王曉霞.D-S證據理論的沖突證據合成方法[M]. 北京: 國防工業(yè)出版社, 2010.
[23]ShaferG.Amathematicaltheoryofevidence[M].Princeton:PrincetonUniversityPress, 1976.
[24]YangJianbo,XuDongling.Evidentialreasoningruleforevidencecombination[J].ArtificialIntelligence, 2013, 205: 1-29.
[25] 肖文,王正友,王耀德. 一種相關證據的合成規(guī)則[J]. 控制與決策, 2011, 26(5): 773-776.
[26] 李春好,杜元偉. 基于雙平臺協調的兩層群決策方法[J]. 管理科學學報, 2011, 14(7): 8-20.
[27]SmetsP.Analyzingthecombinationofconflictingbelieffunctions[J].InformationFusion, 2007, 8(4): 387-412.
[28] 李春好,蘇航. 基于交叉評價策略的全局協調相對效率排序模型[J]. 中國管理科學, 2013, 21(3): 137-145.
[29] 杜元偉,段萬春,黃慶華,等. 基于頭腦風暴原則的主觀證據融合決策方法[J]. 中國管理科學, 2015, 23(3): 130-140.
Keywords:bigdataenvironment;double-layerdecision;distributeddecision;evidencetheory;informationfusion
Double-layer Distributed Fusion Decision Method in Big Data Environment
DUYuan-wei1,YANGNa2
(1.SchoolofManagement,OceanUniversityofChina,Qingdao266100,China;2.FacultyofManagementandEconomics,KunmingUniversityofScienceandTechnology,Kunming650093,China)
Inordertosolvethedecisioninferenceproblemandtheinformationredundancyproblemindouble-layerdistributeddecisioninbigdataenvironment,ahypothesisthatthereexitscorrelationininferenceinformationismadebasedontheanalysisofthecomplexityoftheparticipatingsubjectsandtheoverlappingofbusinessrelationsinsuchdecision,andaninferenceinformationdescriptionmechanismwiththeadvantageofsoftexpressionissuggestedbyemployingtheBPAfunctioninevidencetheory.Onthegroundofthat,theoremsandinferencesareconstructedforupperandlowerdepartmentstoeliminatetheinfluencesofbothadministratorsandupperdepartmentsandusedtomakeascientificfusionofallthedecisionsubjects’meta-inferenceinformation.Finally,theproceduresofdouble-layerdistributeddecisioninbigdataenvironmentareconstructedaccordingtothe“uppertolower”decisionorder.Theresultofnumericalcomparisonanalysisshowsthepresentmethodisscientificandfeasible.Thepresentmethodisbenefittodevelopthethoughtforsolvingmanagementdecisionproblemsinbigdataenvironmentandexplorethe“big”modefordealingwithincompletenessdataorcorrelationdata.
1003-207(2016)05-0127-12
10.16381/j.cnki.issn1003-207x.2016.05.015
2014-04-30;
2015-05-06
國家自然科學基金資助項目(71462022, 71261011);云南省應用基礎研究計劃資助項目(2013FB030)
簡介:杜元偉(1981-),男(漢族),吉林白山人, 中國海洋大學管理學院教授,博士生導師, 研究方向:管理決策、信息融合,E-mail:duyuanwei@ouc.edu.cn.
C
A