孫前進
摘 要:由于進行電子信息資源整合的過程中,沒有進行資源轉(zhuǎn)換降維處理,導(dǎo)致資源整合效率低,為此提出基于模糊聚類的電子信息資源整合方法。通過模糊ORM技術(shù)抽取電子信息資源,采用等效轉(zhuǎn)換降維的方法對抽取的電子信息資源進行轉(zhuǎn)換降維處理,根據(jù)處理結(jié)果,結(jié)合模糊聚類分析,構(gòu)建EAD電子信息資源整合模型,采用模糊聚類分析的方式,將所屬的信息資源依據(jù)特征或者屬性劃分為不同額定整合區(qū)域,計算整合隸屬度,布設(shè)信息資源的整合層級。最終的測試結(jié)果表明:與傳統(tǒng)的LAM信息資源整合測試組及傳統(tǒng)改進ORM信息資源整合測試組相對比,所設(shè)計的模糊聚類信息資源整合測試組最終得出的響應(yīng)時間相對較短,電子信息資源整合效率較高,所提方法具有實際的應(yīng)用價值。
關(guān)鍵詞:模糊聚類;電子信息;信息匯總;資源整合;數(shù)據(jù)控制;
電子信息資源是以數(shù)字化形式( 即二進制代碼0,1)把文字、圖象、聲音、動畫等多種形式的信息存儲在光、磁等非印刷型介質(zhì)上,并以光信號、電信號的形式傳輸,通過響應(yīng)的計算機和其他外部設(shè)備再現(xiàn)出來的信息資源。電子信息資源整合主要是針對于龐大的數(shù)據(jù)信息群,構(gòu)建的一種特殊的數(shù)據(jù)匯總方法[1]。近年來,隨著計算機以及網(wǎng)絡(luò)技術(shù)的成熟普及,數(shù)據(jù)資源急劇增長,逐漸成為資源處理的主流。通常情況下,數(shù)字資源自身具有復(fù)雜性、異構(gòu)性、海量性以及多元性等特征,這在一定程度上也增加了信息資源整合的速度以及效率,增加元數(shù)據(jù)的可靠性,給未來信息發(fā)展奠定更為堅實的基礎(chǔ)[2]。
模糊聚類,實際上指的是一種按模糊界限以及基本要求對事物進行分類的數(shù)學(xué)方法[3]。本質(zhì)上是客觀的劃分,并采用數(shù)理統(tǒng)計的方式,獲取最終處理結(jié)果。模糊聚類為信息整合處理提供了極大的便利條件,進一步確保數(shù)據(jù)計算的精準(zhǔn)度,同時,關(guān)聯(lián)系統(tǒng)聚類法和逐步聚類法等方法,形成一個可無限延伸與擴展的資源整合體系,優(yōu)化需要整合的信息資源,避免出現(xiàn)信息孤島這一類問題,推動信息整合相關(guān)企業(yè)邁入一個新的發(fā)展階段。
因此,本文提出一種基于模糊聚類的電子信息資源整合方法??紤]到最終測試結(jié)果的精準(zhǔn)性與可靠性,本文會在較為真實的背景下進行實驗測試,并驗證本文方法能夠安全、高效的進行信息資源整合。
1 模糊聚類下電子信息資源整合方法
1.1 基于模糊ORM技術(shù)的電子信息資源抽取
在對模糊聚類下電子信息資源整合方法設(shè)計之前,需要先采用模糊ORM 技術(shù)對電子信息資源抽取。通常情況下,針對于不同的整合范圍,所導(dǎo)出的資源以及定向整合目標(biāo)也是不同的,這也使得內(nèi)部執(zhí)行程序存在差異[4-6]??梢圆捎秒p向處理模式,在平臺中構(gòu)建多層級的模糊ORM 資源整合程序,與數(shù)據(jù)庫相關(guān)聯(lián)的同時,獲取數(shù)據(jù)集,在聚類中心,對信息劃歸分類,計算出聚類質(zhì)心數(shù),具體如式(1)所示。
1.2 電子信息資源轉(zhuǎn)換降維處理
在通過模糊ORM 技術(shù)對信息資源進行抽取后,對電子信息資源進行轉(zhuǎn)換降維處理。所謂轉(zhuǎn)換降維處理,主要指的是在對信息資源抽取的過程中,信息資源通常處于集合的狀態(tài),資源維數(shù)也存在較大的差異,而維數(shù)的存在并不利于數(shù)據(jù)的整合、匯總,嚴(yán)重的甚至?xí)斐蓴?shù)據(jù)誤差等,因此,需將高維信息資源轉(zhuǎn)換為低維信息資源??梢圆捎玫刃мD(zhuǎn)換降維的方法,按照統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)或者降維格式進行周期性轉(zhuǎn)換,計算出轉(zhuǎn)換降維比率,具體如式(3)所示。
式(4)中: U 表示信息資源處理單元速度; x 表示縱向整合距離; q 表示傳輸路徑; t 表示動態(tài)平均值。通過上述計算,最終可以得出實際的信息資源處理單元速度。在中心元數(shù)據(jù)庫中,依據(jù)降維映射規(guī)則將統(tǒng)一元數(shù)據(jù)標(biāo)準(zhǔn)分化為幾個轉(zhuǎn)換降維層級。不同降維層級的轉(zhuǎn)換格式也是不同的,可以根據(jù)所設(shè)定的整合目標(biāo),作出更改調(diào)整,舉例來說:可以賦予定義XML、RDF 等輸出格式,一定程度上擴大整體的信息整合降維范圍,以此來適應(yīng)用戶的不同需求。
1.3 EAD模糊聚類整合模型構(gòu)建
在完成電子信息資源轉(zhuǎn)換降維處理后,構(gòu)建EAD模糊聚類整合模型。將上述轉(zhuǎn)換降維處理后的電子信息資源輸入到模型之中,將模型調(diào)整為可共享的形式化概念模型,關(guān)聯(lián)局域網(wǎng)以及聚類數(shù)據(jù)中心,調(diào)整數(shù)據(jù)組織形式為單向。將不同元數(shù)據(jù)指令應(yīng)用到本體集成框架中,設(shè)定具體的集成速度和資源整合映射比,具體如表1 所示。
根據(jù)表1,可以完成對集成速度、資源整合映射比的測定。隨后,遵循標(biāo)定的整合目標(biāo),結(jié)合模糊聚類分析,構(gòu)建EAD 信息資源整合結(jié)構(gòu),具體如圖1 所示。
根據(jù)圖1,可以完成對EAD 信息資源整合模型結(jié)構(gòu)的建立。此時以本體為中心的,調(diào)整定向映射標(biāo)準(zhǔn),使用多層級的映射描述框架,綜合EAD 模型執(zhí)行基準(zhǔn),完成對EAD 模糊聚類整合模型的構(gòu)建,細(xì)化信息資源的整合效果。
1.4 分布式自適應(yīng)處理實現(xiàn)信息資源整合
在完成對EAD 模糊聚類整合模型的構(gòu)建之后,接下來,需要采用分布式自適應(yīng)處理,實現(xiàn)信息資源整合。
首先,采用模糊聚類分析的方式,將所屬的信息資源依據(jù)特征或者屬性劃分為不同額定整合區(qū)域,設(shè)定整合目標(biāo)為動態(tài),依據(jù)虛擬整合的范圍,對定向目標(biāo)作出更改和調(diào)整,計算出信息資源整合的隸屬度,具體如式(5)所示。
K = 3.5T +(7 y ?1) (5)
式(5)中: K 表示隸屬度; T 表示質(zhì)心聚類系數(shù); y表示歐氏距離。通過上述計算,最終可以得出實際的隸屬度。與此同時,利用所得的隸屬度,布設(shè)自適應(yīng)模糊整合區(qū)域,細(xì)化引導(dǎo)的指令,采用EAD 模糊聚類整合模型測定出此時電子信息的自適應(yīng)程度,具體如式(6)所示。
F = 5W ?1.5 + 6G (6)
式(6)中: F 表示自適應(yīng)程度; W表示定向資源分析速度; G 表示特征向量。通過上述計算,最終可以得出實際的自適應(yīng)程度,依據(jù)得出的自適應(yīng)程度,布設(shè)信息資源的整合層級,采用分布式的整合方式,對信息資源定向分類,結(jié)合模糊聚類法實現(xiàn)最終的整合分析。構(gòu)建對應(yīng)的信息資源整合環(huán)節(jié),具體如圖2 所示。
2 方法測試
為了驗證本文提出的基于模糊聚類的電子信息資源整合方法在實際應(yīng)用中的效果,選取A 數(shù)據(jù)庫作為測試的主要目標(biāo),通過在Matlab 軟件進行測試分析。分別設(shè)定傳統(tǒng)LAM 信息資源整合測試組、傳統(tǒng)改進ORM信息資源整合測試組以及本文所設(shè)計的模糊聚類信息資源整合測試組。采用對比的方式,確保3 種方法在相同的環(huán)境之下同時測試,最終得出的結(jié)果以對比的方式展開分析,接下來,進行測試環(huán)境的搭建。
2.1 測試準(zhǔn)備
在對模糊聚類下電子信息資源整合方法的實際應(yīng)用效果進行分析與研究,需要先搭建相關(guān)的測試環(huán)境。根據(jù)測定的實際需求以及執(zhí)行標(biāo)準(zhǔn),先對測試基礎(chǔ)指標(biāo)參數(shù)進行預(yù)設(shè),具體如下表2 所示。
根據(jù)表2,可以完成對基礎(chǔ)指標(biāo)參數(shù)的預(yù)設(shè)。實驗數(shù)據(jù)主要針對RBI、AWS、UCI、KDD Cup、MovieLens相關(guān)數(shù)據(jù)。
隨后,利用測定的設(shè)備,營造相應(yīng)的信息整合環(huán)境。為進一步確保信息資源整合的穩(wěn)定性,采用無線局域網(wǎng)的通信模式,結(jié)合模糊聚類框架,對數(shù)據(jù)資源的基礎(chǔ)整合情況作出分析,具體如圖3 所示。
根據(jù)圖3,可以完成對信息資源整合程度的對比分析。調(diào)整信息資源的單元處理速度,調(diào)整整合處理標(biāo)準(zhǔn),完成對測試環(huán)境的搭建。核定測試的設(shè)備與網(wǎng)絡(luò)是否處于穩(wěn)定的運行狀態(tài),同時確保不存在影響最終測試結(jié)果的外部因素,核定無誤后,開始具體的測定分析。
2.2 測試過程及結(jié)果分析
在完成對上述測試環(huán)境的搭建之后,接下來,需要進行具體的測試。首先,為了提升信息資源整合的速度,本文選擇使用指令引導(dǎo)的方式,關(guān)聯(lián)對應(yīng)的局域網(wǎng)和數(shù)據(jù)庫,在網(wǎng)絡(luò)中尋找所需要的信息資源,并采用特殊的格式,按照指令的歸納順序,分批次導(dǎo)入數(shù)據(jù)庫的對應(yīng)位置中,結(jié)合數(shù)據(jù)的種類,劃定對應(yīng)的處理階層,獲取基礎(chǔ)指標(biāo)數(shù)值。計算信息資源的整合定向范圍,具體如式(7)所示。
式7 中: Y 表示整合定向范圍; V 表示單向引導(dǎo)距離。
通過上述計算,最終可以得出實際的整合定向范圍。在標(biāo)定的范圍之內(nèi),結(jié)合模糊聚類方式,將所屬的信息資源整合,劃歸至對應(yīng)的整合層級之中。在模糊聚類分析背景下,構(gòu)建批量信息資源的整合環(huán)節(jié),具體如圖4所示。
根據(jù)圖4,可以完成對信息資源模糊聚類整合環(huán)節(jié)的設(shè)計。與此同時,關(guān)聯(lián)無線局域網(wǎng)絡(luò),構(gòu)建定向的信息整合程序,賦予每一個層級對應(yīng)的聚類指令,營造穩(wěn)定的信息處理整合環(huán)境。隨后,將測試數(shù)據(jù)庫與XML數(shù)據(jù)中心相關(guān)聯(lián),可以更好地完成局部數(shù)據(jù)模式向全局?jǐn)?shù)據(jù)模式的定向轉(zhuǎn)化,實現(xiàn)信息資源的適配處理之后,對數(shù)據(jù)庫中的元數(shù)據(jù)定義,將所選擇的數(shù)據(jù)劃定為4 個小組,每一個小組的數(shù)據(jù)量均不同,利用模糊聚類分析法,對電子信息資源整合的響應(yīng)時間計算,具體如式(8)所示。
式8 中:M表示響應(yīng)時間; b 表示定向測定距離; g 表示虛擬迭代次數(shù)。通過上述計算,最終可以得出實際的響應(yīng)時間。對得出的結(jié)果對比分析,如表3 所示。
根據(jù)表3,可以完成對測試結(jié)果的對比分析:與傳統(tǒng)的LAM 信息資源整合測試組及傳統(tǒng)改進ORM 信息資源整合測試組相對比,本文所設(shè)計的模糊聚類信息資源整合測試組最終得出的響應(yīng)時間相對較為迅速,表明在對電子信息資源整合的處理上,效率較高,誤差較小,整合環(huán)節(jié)得到了更好地處理,具有實際的應(yīng)用價值。
3 結(jié)束語
綜上所述,便是對基于模糊聚類的電子信息資源整合方法的分析和研究。對比于傳統(tǒng)的信息資源整合方法,本文在模糊聚類分析的輔助之下,構(gòu)建更為靈活、多變的信息整合模式,在復(fù)雜的背景環(huán)境之下,可以更為迅速、清晰地完成目標(biāo)任務(wù)的處理,最大程度降低信息整合誤差的發(fā)生概率,與網(wǎng)絡(luò)相關(guān)聯(lián),形成動態(tài)的信息處理程序,通過指令引導(dǎo),營造一個穩(wěn)定、安全的處理環(huán)境,更加符合現(xiàn)代化發(fā)展的需求,促使信息資源整合配置更為高效,通信效率大幅提升,發(fā)展前景廣闊。