葛 鸝, 柏傳志
(1.淮陰師范學院 綜合檔案室, 江蘇 淮安 223001; 2.淮陰師范學院 數(shù)學科學學院, 江蘇 淮安 223300)
模糊數(shù)學方法在高校檔案分類中的應用
葛 鸝1, 柏傳志2
(1.淮陰師范學院 綜合檔案室, 江蘇 淮安 223001; 2.淮陰師范學院 數(shù)學科學學院, 江蘇 淮安 223300)
根據(jù)模糊數(shù)學中的隸屬度和貼近度,分別運用最大隸屬原則方法及擇近原則, 研究了高校檔案分類中的問題.
模糊數(shù)學; 隸屬函數(shù); 檔案分類
在當今大數(shù)據(jù)時代,信息的種類不斷豐富,信息的數(shù)量巨量增長.高校檔案工作作為信息資源管理的一種,必然會受到影響.一方面,檔案信息的數(shù)量增多;另一方面,檔案信息種類不斷增多,除了各種格式的辦公文檔,還有圖片、視頻、音頻、網(wǎng)頁等.另外,大數(shù)據(jù)時代高校檔案用戶信息的需求在不斷增加,涉及管理、教學、科研、基建、招生就業(yè)、校園文化等各個方面.高校檔案管理所涉及的方面和內(nèi)容也日益復雜,這首先要涉及到高校檔案的分類[1,2].每個大類可再細分很多小類.對于檔案的類和編目問題,有些比較明確,但有些較復雜,因為各類目以及各小類之間有的有交叉和滲透.事實上一份檔案資料究竟應被放入哪一類,這不僅取決于它的內(nèi)容的客觀性,還在很大程度上取決于檔案管理人員對該檔案資料內(nèi)容認識的主觀性.因此有時不易準確地將某份檔案資料歸于那個類目那一小類.在本文中,我們將運用模糊數(shù)學方法研究這個問題.
1965年,美國著名控制論專家Zadel教授將普通集合論里特征函數(shù)的取值范圍{0,1}推廣到閉區(qū)間[0,1],得到了模糊集的定義.
定義1[3]設在論域U上給定了一個映射
A:U→[0,1],
u|→A(u),
則稱A為U上的模糊集(Fuzzy Set),A(u)稱為A的隸屬函數(shù)(或稱為u對A的隸屬度).
記U上的模糊集的全體為I(U).
定義2[4]設A,B,C∈I(U),若映射
N:I(U)×I(U)→[0,1],
滿足條件:
1)N(A,B)=N(B,A);
2)N(A,A)=1,N(U,?)=0;
3) 若A?B?C,則N(A,C)≤N(A,B)∧N(B,C),
則稱N(A,B)為模糊集A與B的貼近度.
由文[3,4],我們有
最大隸屬原則: 假設A1,A2,…,An是n個U上的模糊集,v是論域U上的一個元素,若有i∈{1,2,…,n}使得
Ai(v)=max{A1(v),A2(v),…,An(v)}.
則認為v相對隸屬于Ai.
擇近原則: 設Ai,B∈I(U),i=1,2,…,n,若存在i0,使
N(Ai0,B)=max{N(A1,B),N(A2,B),…,N(An,B)},
則認為B與Ai0是一類.
設有n個檔案類,設為C1,C2,…,Cn類目,每個Ci也有若干小類.對于一個檔案b,如果由于其交叉性,管理人員憑主觀和個人經(jīng)驗無法給出較好的分類.對于這個問題,本節(jié)我們主要運用個模糊數(shù)學的方法來判斷其屬于哪一類,哪一小類.
第一個方法是運用最大隸屬原則.
聘請k位檔案專家,通過他們給出檔案b隸屬于各類目的程度.如果第j位專家給出檔案b的隸屬于Ci的隸屬度為:
若有i0∈{1,2,…,n},使得
根據(jù)最大隸屬原則,則我們認為檔案b隸屬于Ci0類.如果k位專家的結果都是檔案b隸屬于Ci0類,則我們認為檔案b應編入Ci0類目.如果k位專家的結果不盡相同,不妨設有m1(≥1)個專家認為檔案b應編Ci1類目,m2(≥1)個專家認為檔案b應編入Ci2類目,…,mq(≥1)個專家認為檔案b應編入Ciq類目,這里
1≤i1,…,iq≤n互不相同,m1+m2+…+mq=k.
如果存在唯一的h∈{1,2,…,q}使得
mh=max{m1,…,mq},
那么我們認為檔案b應編入Cih類目,如果上述最大值不唯一,不妨有兩個達到最大,設為ms,mt,ms=mt,這時分別計算這ms個專家的認為檔案b應編入Cis類目的隸屬度之和Is,與另外mt個專家的認為檔案b應編入Cit類目的隸屬度之和It,如果Is>It,則我們認為檔案b應編入Cis類目,反之,我們認為檔案b應編入Cit類目.這樣我們就給出了檔案b的大類分類.類似地我們可以進一步地給出檔案b的小類分類.
第二個方法是運用擇近原則.
同樣聘請數(shù)位檔案專家,對上面的n個檔案類C1,C2,…,Cn,每個檔案類Ci找一份專家都認可的檔案,其認可程度是一個模糊集,設為Ai.則模糊集Ai可以表示為模糊向量的形式,即Ai=(a1i,a2i,…,ani).對于檔案b,其認可程度用模糊集B表示,同樣我們寫成模糊向量的形式,即B=(b1,b2,…,bn).類似于代數(shù)學中的內(nèi)積,我們定義模糊集Ai與模糊集B的內(nèi)積為
本文中的貼近度用下列的格貼近度:
N(Ai,B)=(Ai°B)∧(Ac°Bc).
對i=1,2,…,n,分別計算上式的格逼近度,若有i0∈{1,2,…,n}使得N(Ai0,B)最大,根據(jù)擇近原則,我們認為檔案b應編入Ci0類目.同理我們可以進一步地給出檔案b的小類分類.
本文初步探討了在高校檔案管理工作中用模糊數(shù)學的方法對檔案分類的問題.在應用時,可根據(jù)不同的具體問題作一些適當?shù)恼{(diào)整和修正,使之更符合實際.
[1] 鄒步英. 中國檔案分類法使用手冊[M].北京: 中國檔案出版社,1999.
[2] 熊友菊. 高等學校檔案實體分類法的實踐與思考[J].蘭臺世界, 2015, 26: 75-77.
[3] 汪培莊. 模糊集合論及其應用[M].上海:上??茖W技術出版社, 1983.
[4] 楊倫標,高英儀. 模糊數(shù)學原理及應用[M].2版.廣州:華南理工大學出版社, 1998.
[責任編輯:李春紅]
Applications of Fuzzy Mathematics to the Workof University Archives Classification
GE Li1, BAI Chuan-zhi2
(1.Comprehensive Archives Library, Huaiyin Normal University, Huaian Jiangsu 223001, China)(2.School of Mathematical Science, Huaiyin Normal University, Huaian Jiangsu 223300, China)
In this paper, according to the membership degree and closeness degree of fuzzy mathematics, we study the problems in the classification of archives in colleges and universities by using the principle of maximal membership and the principle of choosing near value respectively.
fuzzy mathematics; membership function; classification
2015-08-30
江蘇省自然科學基金資助項目(BK2011407)
柏傳志(1964-),男,江蘇金湖人,教授,博士,研究方向為非線性分析、模糊數(shù)學等. E-mail: czbai@hytc.edu.cn
O159; O272.5
A
1671-6876(2015)04-0307-02