王凈 尚頂洪
摘要:從解析博弈論經(jīng)典模型——“囚徒困境”著手,對博弈論進(jìn)行簡要介紹。利用矩陣圖工具對數(shù)字資源共享的靜態(tài)博弈和動態(tài)博弈過程進(jìn)行分析,并針對動態(tài)博弈中無限次重復(fù)博弈和有限次重復(fù)博弈兩種情況進(jìn)行討論。提出通過在圖書館之間建立信任機制、監(jiān)督機制、保障機制等方法措施,從而有效推動圖書館數(shù)字資源共享合作的持久、穩(wěn)定發(fā)展。
關(guān)鍵詞:博弈論圖書館數(shù)字資源資源共享
中圖分類號:G251 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2016)29-0017-03
隨著大數(shù)據(jù)時代的到來,信息的互聯(lián)互通成為提高信息服務(wù)能力的重要前提,任何一個圖書館都難以同時滿足不同學(xué)科專業(yè)、不同層次用戶的信息需求,也不可能實現(xiàn)對所有資源的收集和管理,數(shù)字信息資源共享就是為了解決個體圖書館信息資源的有限性和信息需求無限性的矛盾而采取的圖書館間合作建設(shè)與發(fā)展的策略?,F(xiàn)階段,我國文獻(xiàn)信息資源共享的理論研究主要集中在文獻(xiàn)資源的布局和配比方面,因此多將信息資源共享效率低下的癥結(jié)歸于管理體制的不完善、技術(shù)手段的落后和宏觀調(diào)控的缺乏。信息資源共享是追求自身效用最大化的過程,是一種分析投入成本和產(chǎn)出收益的博弈過程,通過借鑒博弈論的研究方法,從圖書館個體利益和共享集體利益的關(guān)系出發(fā)進(jìn)行研究,可以進(jìn)一步認(rèn)識阻礙數(shù)字信息資源共享的因素,并找到解決這些問題的方法和措施。
1博弈論概述
1.1博弈論的涵義
博弈論,也稱對策論,英文為Game Theory,是根據(jù)信息分析及能力判斷,研究多個決策主體之間行為的相互影響作用,以取得收益或效用最大化的一種對策理論。其中的“博弈”是指個人、隊伍或組織,在一定的環(huán)境條件及規(guī)則下,同時或先后、一次或多次,根據(jù)環(huán)境和競爭對手的情況變化,從各自允許的行為或策略中進(jìn)行選擇、加以實施,并從中取得相應(yīng)結(jié)果的過程。中國早在幾千年以前就已存在博弈思想,田忌賽馬的故事就是較好的博弈論案例。自20世紀(jì)80年代,博弈論得到了廣泛的應(yīng)用,尤其對信息經(jīng)濟(jì)學(xué)的發(fā)展做出了重要的貢獻(xiàn)。
1.2博弈論“囚徒困境”經(jīng)典模型分析
博弈論經(jīng)典模型囚徒困境建立在一個假設(shè)之上,即甲、乙兩人被懷疑是合伙的偷盜犯,警方雖逮捕了他們但沒有掌握充分證明兩人犯罪行為的證據(jù),警方將其分開單獨審問,雙方不能進(jìn)行信息的交流。警方對這兩個嫌疑犯的量刑原則是:如果一方坦白,另一方不坦白,則坦白者從寬處理,判刑1年;不坦白者從重處理,判刑7年。如果兩人都坦白,則每人判5年刑。如果兩人都不坦白,則警方由Tile據(jù)不足,只能對每個人各判刑2年。表格1中的框圖體現(xiàn)了這個博弈的分析過程,左方是甲的可選擇策略,上方是乙的可選擇,雙方均可做出坦白和不坦白兩種選擇。其中包含數(shù)字的格對應(yīng)甲乙的一個策略組合,每格第一個數(shù)字代表甲的報酬,第二個數(shù)代表乙的報酬。比如第二個數(shù)字格是指當(dāng)甲坦白,乙采取不坦白的策略時,甲的報酬為-1,乙的報酬也是-7。圖中的報酬均為負(fù)數(shù),以表示判刑的年數(shù)。
在警方交待了量刑原則以后,會從自身利益出發(fā)進(jìn)行分析,選擇坦白或不坦白的策略,此時雙方展開了博弈的過程。首先分析甲的思考過程,當(dāng)甲進(jìn)行決策選擇的時候一定會先考慮乙的想法。根據(jù)圖表1的矩陣圖可見,當(dāng)囚犯乙選擇了坦白的策略時,囚犯甲坦白則獲刑5年,不坦白獲刑7年。由此,當(dāng)乙選擇坦白時,甲必然選擇坦白(因為5<7,我們在-5下劃橫線,表示甲的占優(yōu)策略)。當(dāng)乙做出不坦白的決定,那么當(dāng)甲坦白時獲刑1年,不坦白則獲刑2年。那么當(dāng)乙不坦白的時候甲同樣還是會選擇坦白的策略(因為1<2,-1下也劃橫線)。可見不管乙做出坦白和不坦白中怎樣的選擇,甲最終都會選擇坦白。用同樣的方法分析乙的選擇,會得出同樣的結(jié)果。最后,矩陣中唯一的兩個數(shù)字都被劃上橫線的那一格報酬組合是(-5,-5),其對應(yīng)的(坦白,坦白)策略為囚徒困境模型的最終結(jié)論。
如果仔細(xì)分析囚徒困境報酬矩陣,甲乙雙方若都作出不坦白的決定,會得到更好地結(jié)果,即各判刑2年??墒且驗闆]辦法進(jìn)行信息溝通,每一方都會擔(dān)心對方坦白但自己不坦白時會受到重判(即對方坦白獲刑1年,自己不坦白則被判7年)。因此,每個囚犯都會從個人利益出發(fā)考,最終的結(jié)果都會選擇坦白坦白,(坦白,坦白)便是囚徒困境博弈模型必然的均衡結(jié)果。
囚徒困境的結(jié)論折射出的道理發(fā)人深省,從個體的視角思考做出的占優(yōu)策略決定(-5,-5),顯然劣于做出合作策略的選擇(-2,-2)。換句話說,從單個個體的角度出發(fā)得出的占優(yōu)策略,從整體而言得出的卻是最不理想的結(jié)局。囚徒困境最終達(dá)到的策略均衡,體現(xiàn)出了個人理性和集體理性的矛盾沖突。目前,圖書館在數(shù)字信息資源共享問題上也存在著類似的矛盾,我們將“囚徒困境”的博弈分析方法運用到資源共享問題上,也可以解釋合作的不穩(wěn)定性及相關(guān)問題。
2圖書館數(shù)字信息資源共享的博弈分析
2.1數(shù)字信息資源共享的靜態(tài)博弈
數(shù)字信息資源共享一直是圖書情報界關(guān)注的重大課題,每個圖書館都有資源共享的愿望,圖書館信息資源的共享,可以實現(xiàn)整體效用的最大化。假定參與共享合作博弈的圖書館為A、B兩個,分析圖2矩陣可以發(fā)現(xiàn),如果A、B館都選擇合作策略,每個參與者均可獲得收益為10,總報酬最大為20;如果A、B兩者中有一方選擇合作,而另一方選擇不合作,參與者報酬分另4為6、12,總報酬為18;倘若A、B兩館都做出不合作的選擇,那么各館報酬都是8,總報酬16是最小值??梢姡ê献鳎献鳎┎呗允菆F(tuán)體利益最大的策略選擇(20>16)。
事實上,一些圖書館為了自身的利益,往往從個人理性角度出發(fā),最終與團(tuán)體利益沖突,陷入“囚徒困境”。類似于囚徒甲、乙的決策過程,A館會根據(jù)B館的決策選擇策略,當(dāng)B選擇合作策略時,A若選擇合作可得10,A若選擇不合作,既省去了共享資源需付出的成本,又無償享受了B館提供的信息資源,報酬是12。因此,A必然不會合作(顯然12>10)。同理可推得,B做出了不合作的選擇時,A仍然會選擇不合作策略(因為8>6)。顯而易見,無論B做出合作或者不合作的選擇,A都會采取不合作策略。同樣的分析結(jié)果對B館也是適用的,最后的博弈結(jié)果為(不合作,不合作),這時總報酬16,小于最優(yōu)策略的總報酬20。
這一博弈矩陣可以看出,大家最初都希望達(dá)到(合作,合作)總報酬為20的結(jié)果,但是通過報酬矩陣分析可見,即便已經(jīng)簽訂合作協(xié)議,各自館也會抱有“搭便車”的心理,就是如果你合作我不合作,我就可以占到便宜(12>10),于是各自違背共享約定,形成了圖書館資源共享博弈的(不合作,不合作)結(jié)果。
上述兩種博弈均為一次性博弈,參與博弈者都只能進(jìn)行一次選擇決定,另外博弈參加者在做出自己決定的時候并不清楚對方的決定,大家都是同時決定自己的一次性策略選擇。處在這樣的前提之下,參與者都做出了自己的策略選擇時便已完成了一個完整的博弈過程,并得出了最終結(jié)論,這種博弈稱為靜態(tài)博弈。在靜態(tài)博弈中,出于個人理性的策略選擇往往導(dǎo)致了從整體而言的最壞結(jié)果。一方面,在達(dá)成合作協(xié)議以后,參與者都會有投機的心理,并從自身利益出發(fā)暗地選擇了不合作的做法。另一方面,對于一次性的博弈,只要參與者做出了最終決定便完成了博弈過程,對于違反約定的行為沒有補救和懲罰的有效措施,無法通過后續(xù)的博弈進(jìn)行調(diào)整和制約。
2.2數(shù)字信息資源共享的動態(tài)博弈
實際上,博弈通常為一系列重復(fù)進(jìn)行的運動,即相對靜態(tài)博弈而言的動態(tài)博弈,在連續(xù)進(jìn)行的動態(tài)博弈中,上面結(jié)果會有所不同。
2.2.1數(shù)字信息資源共享的無限次重復(fù)博弈
無限次重復(fù)博弈是指相同結(jié)構(gòu)的博弈可以無限次地重復(fù)進(jìn)行下去。如果設(shè)定在數(shù)字資源共享的無限次重復(fù)博弈中,不管哪一方圖書館在其中的一輪合作博弈中采取了不合作的行動,在以后的博弈中便會遭到其他館“不合作”的報復(fù)策略,而且這一不合作策略會在未來的所有博弈中重復(fù)下去,長此以往,首先違約的一方便永遠(yuǎn)失去了與另一方合作的機會。因為在無限次重復(fù)博弈中,存在著對欺騙和違約行為報復(fù)的機會,因此參與合作的各方會擔(dān)心采取不合作策略給自己帶來的長期損失,不會主動選擇不合作的策略,使得數(shù)字信息資源共享合作得以維持。
繼續(xù)用圖2加以說明,對于圖書館A,各館如果一直處于合作的狀態(tài),便可以長期獲得報酬10,累積起來為10+10+10+…,但如果抱有機會主義的想法,打破約定選擇了不合作的策略,他的確獲得了一次性的利益,得到報酬為12,但在以后的無限次重復(fù)博弈中,均會受到對方不合作的報復(fù)行動,收益只能為8。為了一次性的好處,使得日后的收益從原來合作策略時的10+10+10+…下降為不合作策略時的8+8+8+…。顯然,任何一個圖書館在數(shù)字信息資源的無限重復(fù)博弈中,為防止被報復(fù)而喪失長期的經(jīng)濟(jì)效益,都會遵守協(xié)議,采取合作的策略。
2.2.2數(shù)字信息資源共享的有限次重復(fù)博弈
在有限次重復(fù)博弈中,假設(shè)事先約定只合作5次,用逆推法進(jìn)行分析,各方均知道第5輪博弈是最后一輪博弈,因此這一輪博弈便同靜態(tài)博弈無異。根據(jù)前面的分析,這一輪的違約不可能在以后受到懲罰和損失,那么,每個圖書館出于個人理性出發(fā)選擇的占優(yōu)策略就是不合作的結(jié)果。逆推到第4輪,因為大家都可以推算出第5輪不合作的結(jié)果,因此第4輪博弈也會采取不合作的策略。由此類推直到第1輪,都可以得到同樣的結(jié)果。顯然,在有限次重復(fù)博弈中,圖書館數(shù)字信息資源的共建合作是不穩(wěn)定的,博弈的最終均衡策略為(不合作,不合作)。
3用博弈論的思想解決數(shù)字信息資源共享問題
在現(xiàn)實生活中,參與博弈的各方合伙的機會必然是有期限的,信息組織間的合作共享是否根本無法實現(xiàn)呢?顯然在現(xiàn)實生活中是存在著長期合作的共同體。事實上,無限次重復(fù)博弈的主要界定標(biāo)準(zhǔn)在于參加者均不清楚哪一輪博弈會是最后一輪,合作各方擔(dān)心違約會遭到日后的“報復(fù)”便會把合作策略堅持下去。在有限次的重復(fù)博弈中,如果合作雙方不確定哪一輪是最后一輪,參與者會認(rèn)為日后還要繼續(xù)打交道、博弈狀態(tài)會繼續(xù)維持,這便同無限次重復(fù)博弈無異。所以,在不能確定終止期的有限次重復(fù)博弈的圖書館數(shù)字信息資源共享博弈中,合作解是可以存在的。當(dāng)然,為了維護(hù)合作模型的穩(wěn)定性,更好的實現(xiàn)團(tuán)體利益的最大化,必須配合以必要的措施。
3.1建立信任機制
圖書館信息資源共建共享機制的成功建立,取決于成員間的相互信任和對于聯(lián)盟內(nèi)部規(guī)則的遵守程度,能夠取得收益同時實現(xiàn)持續(xù)的發(fā)展,其中成員館之間的信任是至關(guān)重要的。成員間除了應(yīng)相互理解對方的行為和立場,尊重對方的觀點,還應(yīng)加強組織內(nèi)的交流,達(dá)成對某些問題的認(rèn)識。另外,信任評審機制的建立也十分必要,通過建立完備的綜合性、長期性評估測試標(biāo)準(zhǔn)系統(tǒng),對成員的聯(lián)盟策略及行動影響因素進(jìn)行持續(xù)地跟蹤測評,通過完善細(xì)致公平的執(zhí)行制度,形成穩(wěn)定可靠的運行機制。
3.2建立監(jiān)督機制
對于合作中的各館,都希望采取最優(yōu)于自己的策略,以期得到最好的結(jié)果,因此為了達(dá)到合作團(tuán)體利益的最大化,應(yīng)該對各成員進(jìn)行有效監(jiān)督,維護(hù)合作協(xié)議的順利執(zhí)行。要在建立領(lǐng)導(dǎo)協(xié)調(diào)組織和健全監(jiān)督機制上下工夫,在明確各成員權(quán)利義務(wù)的基礎(chǔ)上,監(jiān)督各成員的行為。對于損人利己的傾向和行為,及時采取措施,必要時對違反合作協(xié)議的成員進(jìn)行制裁,甚至終止合作。
3.3建立保障機制
因為各圖書館之間的規(guī)模與發(fā)展水平不均等,建設(shè)規(guī)模大、信息豐富的圖書館往往很難與信息量相對較少的圖書館實現(xiàn)資源共建共享,另外數(shù)字信息資源共建共享經(jīng)常發(fā)生“搭便車”的問題,這些都需要通過建立保障機制加以制約。在內(nèi)部評估制度規(guī)范的基礎(chǔ)上,對貢獻(xiàn)大的圖書館要采用獎勵的辦法進(jìn)行收益補償,同時針對慵懶的圖書館,通過采取懲罰的方式實現(xiàn)督促作用。
在具體的實施上,以懲罰措施為例,在成員館簽訂共享協(xié)議時,規(guī)定不合作的一方會受到經(jīng)濟(jì)制裁,報酬減3,在矩陣圖2的基礎(chǔ)上可以得到新的報酬矩陣(見圖3)。按“囚徒困境”的分析思路,如果A館選擇共享,B館選擇了不共享,B得報酬為9而不是原來的12,因為B館不共享受到了事后的經(jīng)濟(jì)制裁(12-3=9),小于(共享,共享)中的報酬10,可見,B怕受到懲罰得不償失必然選擇共享。對于A的分析也是如此,最后的博弈均衡狀態(tài)一定是(共享,共享),克服了欺騙或違約行為,達(dá)到了信息資源共享的目的。
在保障機制的建立原則上,采取的經(jīng)濟(jì)措施目的是為了實現(xiàn)個體利益與團(tuán)體利益的一致,如果個人利益違背了團(tuán)體利益,通過對個體的報酬加以調(diào)控,改變個體的決策選擇,保障團(tuán)體利益的最大化,同時也保障了遵守承諾的個體的利益。
通過博弈分析,并用博弈論的方法調(diào)控數(shù)字信息資源共享行為,可以有效地解決資源的閑置和不適當(dāng)利用問題。在一些利益矛盾中,改善管理機制和提高技術(shù)手段的同時,要善于發(fā)揮經(jīng)濟(jì)杠桿的作用,避免效率損失,優(yōu)化資源配置,達(dá)到組織間“雙贏”乃至“多贏”的結(jié)果,使得信息資源共享合作更穩(wěn)固更持久。