劉 麗
(中原工學(xué)院圖書館 河南 鄭州 451191)
數(shù)字資源生命周期管理,就是依據(jù)不同的數(shù)字資源在不同階段的價值實施不同的管理策略,使其產(chǎn)出與投入之比最大化。它是針對數(shù)字資源價值的變化,在其整個生命周期中以盡可能低的成本實現(xiàn)一種與其價值級別相應(yīng)的自動優(yōu)化管理。因此,數(shù)字資源生命周期管理的核心問題就是數(shù)字資源的價值變化,數(shù)字資源從產(chǎn)生到生命周期的終結(jié),其生命周期受到自身和外界等多種因素的影響和制約,這就給我們測度其生命周期帶來了很大的困難。
數(shù)字資源價值測度就是對不斷生成的和處于不同生命階段的數(shù)字資源的價值測度。數(shù)字資源的價值測度是實現(xiàn)自動化生命周期管理的基礎(chǔ),貫穿生命周期管理全過程,是生命周期管理的重要組成部分。
隨著網(wǎng)絡(luò)時代的深入發(fā)展,數(shù)字資源在社會經(jīng)濟(jì)發(fā)展中起著越來越重要的作用,數(shù)字資源價值測度逐漸成為信息經(jīng)濟(jì)學(xué)與情報學(xué)研究的主要課題。由于數(shù)字資源自身的特殊性及其在實際應(yīng)用中的價值特殊性,很難從根本上對數(shù)字資源的價值進(jìn)行測度。通過對國內(nèi)外的相關(guān)研究文獻(xiàn)進(jìn)行分析,還鮮見有專門針對數(shù)字資源價值的測度方法,只有針對普遍意義上的信息的分析和測度,研究人員還是從各自不同的角度去分析研究信息的價值屬性,難以達(dá)成統(tǒng)一的方法和標(biāo)準(zhǔn)。
設(shè)有隨機(jī)事件 ε=(ε1,ε2,…,εn)中狀態(tài) εi發(fā)生的概率為 pi(i=1,2,3,…,n),xi為狀態(tài)εi出現(xiàn)時,決策者單位投入獲得的收益。
假設(shè)效用函數(shù) u(y)具有對數(shù)表示式,即 u(y)=log(y)。 可以證明,在無信息時,決策者的最大期望效用為[1]:
當(dāng)設(shè)立了一個信息容量H=-pilogxi的信道時,決策者的最大期望效用改變?yōu)椋?/p>
擁有一定資產(chǎn)的決策者在有信息與無信息不同情況下取得的最大期望效用是不同的,其差值
即為信息商品在決策過程中的價值或價值效用。
從統(tǒng)計決策的角度來測度信息的價值,實質(zhì)上是在對由于信息的利用而引起的預(yù)期收益的期望變化進(jìn)行計算。它通過計算獲取信息前后的期望收益的變化量作為信息應(yīng)用所帶來的價值作用,收益變化量越大,則信息提供的價值越多,把信息的價值和作用看成了一種期望值。
這種測度方法把數(shù)字資源看作是信息商品,認(rèn)為信息商品的價值是凝結(jié)在信息商品中的無差別的一般人類勞動,是信息商品的社會屬性,體現(xiàn)信息商品生產(chǎn)者與需求者之間的聯(lián)系,亦即它們之間交換勞動的關(guān)系。與物質(zhì)商品一樣,信息商品的價值也是凝結(jié)在商品內(nèi)的抽象的、無差別的一般人類勞動。
商品的價值由以下幾個部分構(gòu)成[2]:
W=C+V+M
其中:W為商品的價值;C為不變資本,即價值轉(zhuǎn)移;V為可變資本,即必要勞動;M為剩余價值。信息商品價值的數(shù)學(xué)表述:W=C1+C2+V1+V2+M
在這個數(shù)學(xué)表達(dá)式中,不變資本C分為兩個部分:C1指生產(chǎn)信息商品時投入的物質(zhì)材料的價值,這與物質(zhì)商品相同;C2指生產(chǎn)信息商品時投入的信息材料的價值,C2的投入創(chuàng)造了生產(chǎn)信息產(chǎn)品的客觀條件。必要勞動V也分為兩個部分:V1等同于同類性質(zhì)的體力勞動者的體力勞動支出;V2是勞動者具有創(chuàng)造性的腦力勞動支出。一般來說,在生產(chǎn)信息商品時,V2部分的價值量要遠(yuǎn)遠(yuǎn)大于V1。M是剩余價值,為體力勞動與腦力勞動共同創(chuàng)造的剩余價值。
很多學(xué)者希望通過研究和分析影響信息價值大小和體現(xiàn)的屬性,進(jìn)而確定信息的價值作用。當(dāng)然,這些相關(guān)的因素包括信息的內(nèi)容、新穎性、信息量的大小、用戶的接受程度等其他很多屬性。正是由于這些因素的影響作用才會使得各種信息體現(xiàn)出不同的價值和作用。因此,這些相關(guān)的屬性出發(fā)研究信息的價值不失為一種可行的方法。
對于給用戶提供的信息來說,其價值可用以下半定量經(jīng)驗公式作粗略計算[3]:
W=e-λtM·R·H
式中:W為信息的使用價值;R為用戶接受信息的程度,可根據(jù)用戶對該信息商品的需求性及消化力確定;M為信息質(zhì),可根據(jù)信息商品的價值確定;H為信息量,可根據(jù)信息商品的類型計算;t為時間;λ為常數(shù),λ可由信息商品的壽命性質(zhì)決定;e為自然對數(shù)的底;e-λt為信息的衰老系數(shù)。但是,式中各變量的單位差別很大,很難統(tǒng)一。而且很多要素都應(yīng)是定性考慮分析,具體定量十分困難。
顧客滿意(Customer Satisfaction,簡稱CS)一詞在20世紀(jì)50年代中期就受到世人的認(rèn)識和關(guān)注。信息領(lǐng)域的顧客就是信息用戶,信息用戶滿意,就是信息用戶在接受信息服務(wù)前對該信息效用的預(yù)期與信息用戶在接受信息服務(wù)后對該信息真正效用的實際感受的比較。信息用戶滿意度是指信息用戶對信息服務(wù)的滿意程度,它是信息用戶在接受信息服務(wù)前對該信息效用的期望與信息用戶在接受信息服務(wù)后所感受到的信息效用的函數(shù)[4]。即:
信息用戶滿意度=f(信息用戶期望,感受到的信息效用)
于是,信息價值可以用以下函數(shù)表示:
信息價值=F(信息的客官效用,信息用戶期望,感受到的信息效用)
其中,信息用戶期望可以分為理想中的信息效用、期望的信息效用和公平的信息效用。理想的信息效用是指信息用戶理想中希望的最佳信息效用,它反映的內(nèi)涵是“信息最好是什么”;期望的信息效用是指在將各種信息阻礙因素后,最終可能獲得的信息,它反映的內(nèi)涵是“信息可能是什么”;公平的信息效用是指在給定投入的情況下,信息用戶“應(yīng)該得到的信息是什么”。根據(jù)不同層次上的期望水平和實際信息效用之間的差別比較,即信息效用證實,可以判斷出滿意度的高低。
著名的諾貝爾獎獲得者赫伯特·西蒙在對當(dāng)今經(jīng)濟(jì)發(fā)展趨勢進(jìn)行預(yù)測時指出:“隨著信息的發(fā)展,有價值的不是信息,而是注意力”。一個人要想獲得注意力,就必須付出信息,同樣一條信息如果要有價值,就必須獲得注意力。注意力則是人的一種能力,它可以間接測度信息的價值[5]。在信息社會中,每一條信息都是有潛在價值的,可以利用注意力來測度信息價值。一條信息獲得的注意力越多也就表明它更具有價值。注意力作為人自身的一種能力,具有其使用價值,所以客觀上也具有價值尺度的功能,而且注意力更加貼近信息本身。我們交換信息的過程,就伴隨著注意力的交換,兩者是成正比關(guān)系的。特別是在網(wǎng)絡(luò)環(huán)境下,注意力相對容易測量,已經(jīng)具有了測量的可行性。注意力的自身測度是困難的,但我們可以通過間接的方法來測量它,比如在一段時間內(nèi)交互的次數(shù)等等。網(wǎng)絡(luò)條件下,我們很容易得到有多少人、在多長時間內(nèi)、在多大的區(qū)域內(nèi)訪問了多少內(nèi)容,這些為注意力的定量化提供了基本的數(shù)據(jù)。另外,注意力兼有傳統(tǒng)物質(zhì)產(chǎn)品的稀缺性和信息產(chǎn)品的邊際效用遞增性,使用它可使人們更加信服地接受信息的價值?,F(xiàn)在常用AHP(層次分析法)評價注意力信息價值。
IBM Almaden研究中心存儲系統(tǒng)部用了3個月的時間追蹤哈佛大學(xué)的三個不同的網(wǎng)絡(luò)文件系統(tǒng)(NFS)文件服務(wù)器,旨在研究信息的價值是會根據(jù)使用程度的變化而隨著時間變化的(usage over time),從而根據(jù)價值變化確定信息的生命周期。該方案試圖建立一個理想化的信息價值測度模型進(jìn)行自動化的價值測度,以驗證:(1)該模型是否能夠測度文件隨時間變化或者不同文件之間的不同價值;(2)價值測度的結(jié)果是否是文件價值的真實反映;(3)模型對于不同價值參數(shù)變化的靈敏度和健全度。
這套方案基于兩個假設(shè):信息的價值可以通過使用來體現(xiàn)出來;信息的價值是隨著時間變化的,不能脫離了特定的時間來談信息的價值。
進(jìn)行信息價值測度的最終目的是為了使數(shù)字資源生命周期的自動化實施更加便利。為了達(dá)到最終目標(biāo),價值評價模型必須滿足以下幾個條件:很少需要或不需要人工干預(yù);可靠的、契合實際應(yīng)用的算法;易于使用;能夠掌握信息價值變化的趨勢;適應(yīng)變化發(fā)展的環(huán)境。
該模型由兩個重要指標(biāo)構(gòu)成:使用和時間。系統(tǒng)在極少的人工干預(yù)下自動完成使用統(tǒng)計,可以同時獲取隨著時間變化的信息價值和不同信息的不同價值。
總體價值測度模型定義如下[6]:
在這里Vt(d)是一條信息d在時間t時的價值;vp為評價周期,它是持續(xù)時間為[t- (Nt×s),t];s為每個生命階段的長度;Nt是生命階段的數(shù)量;∫(Ui(d))為經(jīng)過規(guī)范化處理的,d在其生命階段i的使用程度;W(i)是生命階段i的新穎度權(quán)重,權(quán)重最大值為1,權(quán)重按照使用進(jìn)行分配;i為多個生命階段。權(quán)重的主要功能就是為了保證最近的生命階段有著最高的權(quán)重。特別的,對于同一個Nt,x越大,函數(shù)曲線越陡;同樣對于同一個x,Nt越大,函數(shù)曲線也更陡。
最終的實驗結(jié)果表明,該模型可以通過反映信息價值變化和文件價值的不同,來有效的捕獲重要數(shù)據(jù)變化的趨勢。
上文針對有關(guān)數(shù)字資源價值測度分析的現(xiàn)狀和研究理論成果做了簡要的描述,可以說這些理論方法對于我們認(rèn)清信息價值的含義和分析測度信息價值有一定的借鑒意義。價值本來就是一種比較抽象的東西,不同的人對于價值的范圍和程度都會有不同的觀點,再加上各自的研究目的和分析問題角度的差別,因此會產(chǎn)生關(guān)于信息價值測算的不同方法。但是,如果對其進(jìn)行深入的分析研究就會發(fā)現(xiàn)其中還存在許多的問題。上文提到的這些關(guān)于信息價值測度的方法,都是根據(jù)不同的研究方向和目的進(jìn)行的,測度出的結(jié)果也只是信息價值在某一方面的作用體現(xiàn)。
對于數(shù)字資源的價值測度來說,IBM的測度模型還是較為實用。首先,它針對的是數(shù)字化的信息;其次,它撇開了信息自身的價值,而是以信息的使用價值為依據(jù),使用量高即價值大,簡化了測度的復(fù)雜性;再次,其采用計算機(jī)來獲取數(shù)據(jù)大大增加了數(shù)據(jù)的準(zhǔn)確性和廣泛性。這種依據(jù)使用情況對信息價值進(jìn)行測度的方法,對我們測度數(shù)字資源生命周期和數(shù)字資源的價值有著極其重要的借鑒意義。
[1]陳寧.信息價值度量方法的比較研究[D].大連:大連理工大學(xué),2001:45-48.
[2]李天復(fù).情報的信息測度[J].情報科學(xué),1992,13(2):27-35.
[3]宛天巍,王浣塵,張旭.信息測度方法的綜述[J].系統(tǒng)工程理論方法應(yīng)用,2005,14(6):481-486.
[4]鐘葦思,劉景旭,李弘偉.基于信息效用和信息用戶滿意度的信息價值測度研究[J].情報雜志,2007(1):92-97.
[5]馬欣.注意力經(jīng)濟(jì)下的網(wǎng)絡(luò)信息價值測度分析[J].江西金融職工大學(xué)學(xué)報,2006(11):109-110.
[6]Ying Chen.Information valuation for Information Lifecycle Management[OL].http://www.almaden.ibm.com/storagesystems/projects/compliantstorage/iv.pdf,2012-08-12.