李火苗
(商洛學(xué)院圖書館,陜西商洛 726000)
隨著我國經(jīng)濟(jì)發(fā)展的不斷進(jìn)步,我國高校教育教學(xué)事業(yè)的發(fā)展越來越好。為了向高校的教學(xué)事業(yè)提供正確的指導(dǎo),應(yīng)利用信息挖掘技術(shù)針對個(gè)性化交互服務(wù)行為信息進(jìn)行二次處理,以此實(shí)現(xiàn)教學(xué)資源的共享。但傳統(tǒng)信息挖掘系統(tǒng)存在響應(yīng)速度慢的缺陷,該文針對數(shù)字圖書館進(jìn)行個(gè)性化服務(wù)行為信息挖掘系統(tǒng)的設(shè)計(jì)。
針對個(gè)性化服務(wù)行為信息挖掘系統(tǒng)中的云服務(wù)平臺框架進(jìn)行設(shè)計(jì)時(shí),應(yīng)充分結(jié)合圖書館的實(shí)際情況,將圖書館內(nèi)部資源進(jìn)行整合,并將圖書館內(nèi)部資源進(jìn)行合理利用。通過該方式可為系統(tǒng)提供大量數(shù)據(jù),有利于個(gè)性化服務(wù)行為信息挖掘系統(tǒng)的穩(wěn)定運(yùn)行。針對云服務(wù)平臺的框架進(jìn)行設(shè)計(jì)的過程中,應(yīng)將基礎(chǔ)功能設(shè)計(jì)作為基礎(chǔ),將圖書館內(nèi)部資源作為系統(tǒng)設(shè)計(jì)的主要內(nèi)容,并將解決讀者需求作為系統(tǒng)云服務(wù)平臺基本框架設(shè)計(jì)的根本目標(biāo),以此設(shè)計(jì)出將成本低、擴(kuò)展性高、適應(yīng)能力強(qiáng)等特點(diǎn)融為一體的云服務(wù)平臺基本框架[1-2]。
針對個(gè)性化服務(wù)行為信息挖掘系統(tǒng)的總體架構(gòu)進(jìn)行設(shè)計(jì)時(shí),主要采用SSH 框架作為個(gè)性化服務(wù)行為信息挖掘系統(tǒng)的核心架構(gòu)。通過對SSH 框架進(jìn)行研究發(fā)現(xiàn),該框架具有結(jié)構(gòu)簡單、開發(fā)周期較短、維護(hù)方便等特點(diǎn),被廣泛應(yīng)用于多種領(lǐng)域。數(shù)字圖書館個(gè)性化服務(wù)行為信息挖掘系統(tǒng)總體架構(gòu)如圖1所示[3]。
1.2.1 信息挖掘系統(tǒng)用戶層
對個(gè)性化服務(wù)行為信息挖掘系統(tǒng)架構(gòu)的用戶層進(jìn)行設(shè)計(jì)時(shí),主要應(yīng)用JSP技術(shù),該技術(shù)憑借自身的高效處理優(yōu)勢,在多種領(lǐng)域中被廣泛應(yīng)用,可用于個(gè)性化服務(wù)行為信息挖掘系統(tǒng)和用戶之間的交互邏輯處理。
1.2.2 信息挖掘系統(tǒng)業(yè)務(wù)層
為保證個(gè)性化服務(wù)行為信息挖掘系統(tǒng)的穩(wěn)定運(yùn)行,對個(gè)性化服務(wù)行為信息挖掘系統(tǒng)業(yè)務(wù)層架構(gòu)進(jìn)行設(shè)計(jì)時(shí),采用SSH 框架針對系統(tǒng)業(yè)務(wù)層進(jìn)行開發(fā),利用SSH 架構(gòu)將系統(tǒng)業(yè)務(wù)層進(jìn)行層次細(xì)化,主要包括Web 層、Service 層、DAO 層以及PO 層。通過對個(gè)性化服務(wù)行為信息挖掘系統(tǒng)業(yè)務(wù)層架構(gòu)進(jìn)行細(xì)化,個(gè)性化服務(wù)行為信息挖掘系統(tǒng)的維護(hù)將更加方便,且系統(tǒng)開發(fā)比較簡單,便于操作[4-5]。
1.2.3 信息挖掘系統(tǒng)數(shù)據(jù)挖掘?qū)?/p>
對個(gè)性化服務(wù)行為信息挖掘系統(tǒng)的數(shù)據(jù)挖掘?qū)蛹軜?gòu)進(jìn)行設(shè)計(jì)時(shí),主要利用數(shù)據(jù)挖掘工具Weka 對數(shù)據(jù)進(jìn)行處理,將數(shù)據(jù)挖掘工具Weka 作為個(gè)性化服務(wù)行為信息挖掘系統(tǒng)數(shù)據(jù)挖掘?qū)蛹軜?gòu)的核心,結(jié)合決策樹分類、神經(jīng)網(wǎng)絡(luò)、聚類等算法對個(gè)性化服務(wù)行為信息挖掘系統(tǒng)的數(shù)據(jù)進(jìn)行規(guī)劃處理,提高個(gè)性化服務(wù)行為信息挖掘系統(tǒng)的穩(wěn)定性[6]。
1.2.4 信息挖掘系統(tǒng)數(shù)據(jù)層
信息挖掘系統(tǒng)數(shù)據(jù)層主要包括讀者個(gè)人信息、圖書信息、借閱信息以及讀者瀏覽信息,該層具有一定的數(shù)據(jù)存儲能力。因此,應(yīng)針對圖書館內(nèi)部數(shù)據(jù)進(jìn)行資源整合,并利用該關(guān)系型數(shù)據(jù)庫將數(shù)據(jù)信息進(jìn)行存儲。
個(gè)性化服務(wù)行為信息挖掘系統(tǒng)包含大量圖書館內(nèi)部圖書信息,由于個(gè)性化服務(wù)行為信息挖掘系統(tǒng)所容納的數(shù)據(jù)過多,造成個(gè)性化服務(wù)行為信息挖掘系統(tǒng)出現(xiàn)響應(yīng)速度慢等問題。需要在個(gè)性化服務(wù)行為信息挖掘系統(tǒng)的硬件端口處增加控制器,芯片部分主要采用意法半導(dǎo)體的超高密度芯片TQMA93RE7,而半導(dǎo)體部分主要采用控制器體系架構(gòu)Grema-T1 內(nèi)核,該部分可作為個(gè)性化服務(wù)行為信息挖掘系統(tǒng)控制器的中央處理單元[7-8]。
通過對個(gè)性化服務(wù)行為信息挖掘系統(tǒng)控制器原始半導(dǎo)體指令集進(jìn)行研究發(fā)現(xiàn),該指令集只包括兩種狀態(tài),分別是32 位半導(dǎo)體供應(yīng)狀態(tài)以及16 位代碼寬度的Thumb 狀態(tài),而該研究中的半導(dǎo)體Grema-T1內(nèi)核主要采用Thumb-1 指令集,通過Thumb-1 指令集的選擇,可使個(gè)性化服務(wù)行為信息挖掘系統(tǒng)硬件部分具有高效的數(shù)據(jù)處理能力以及操作簡便的優(yōu)勢。
2.2.1 數(shù)據(jù)庫概念模型設(shè)計(jì)
個(gè)性化服務(wù)行為信息挖掘系統(tǒng)內(nèi)部存在大量數(shù)據(jù)信息,可造成系統(tǒng)因數(shù)據(jù)過多而出現(xiàn)響應(yīng)速度慢等問題。應(yīng)在系統(tǒng)內(nèi)部建立數(shù)據(jù)庫,對于系統(tǒng)的穩(wěn)定運(yùn)行具有重要意義。主要采用Hadoop 技術(shù)架構(gòu),并且數(shù)據(jù)庫設(shè)計(jì)過程中,應(yīng)充分結(jié)合用戶的實(shí)際需求,其中用戶的需求主要體現(xiàn)在信息的提供、保存、更新以及查詢等方面,所以應(yīng)重視數(shù)據(jù)的輸入和輸出,并在此基礎(chǔ)上進(jìn)行E-R 圖的設(shè)計(jì),為系統(tǒng)的后續(xù)發(fā)展做鋪墊[9-10]。
2.2.2 數(shù)據(jù)庫邏輯結(jié)構(gòu)設(shè)計(jì)
首先應(yīng)確定數(shù)據(jù)庫的物理數(shù)據(jù)結(jié)構(gòu),以此對系統(tǒng)數(shù)據(jù)庫內(nèi)部管理系統(tǒng)形成結(jié)構(gòu)約束。通過研究發(fā)現(xiàn),在數(shù)據(jù)庫的設(shè)計(jì)過程中易出現(xiàn)數(shù)據(jù)冗余,而通常情況下針對數(shù)據(jù)冗余的程度進(jìn)行消除時(shí),主要采用“范式”定義的方式進(jìn)行處理。該研究主要選用最合適的第三范式,但是第三范式在一定程度上可降低系統(tǒng)的數(shù)據(jù)處理速度,對于系統(tǒng)的開發(fā)質(zhì)量具有一定影響,為此,應(yīng)充分考慮范式規(guī)則和用戶的使用體驗(yàn),結(jié)合E-R 模型系統(tǒng)進(jìn)行數(shù)據(jù)庫邏輯結(jié)構(gòu)設(shè)計(jì),讀者檔案表結(jié)構(gòu)如表1 所示,庫存信息表結(jié)構(gòu)如表2 所示,借出信息表結(jié)構(gòu)如表3 所示[11]。
表1 讀者檔案表結(jié)構(gòu)
表2 庫存信息表結(jié)構(gòu)
表3 借出信息表結(jié)構(gòu)
2.2.3 數(shù)據(jù)庫E-R圖設(shè)計(jì)
數(shù)據(jù)庫設(shè)計(jì)對于個(gè)性化服務(wù)行為信息挖掘系統(tǒng)的穩(wěn)定運(yùn)行具有重要意義。因此,應(yīng)結(jié)合系統(tǒng)數(shù)據(jù)庫的基本結(jié)構(gòu),為個(gè)性化服務(wù)行為信息挖掘系統(tǒng)提供高性能的結(jié)構(gòu)設(shè)計(jì),個(gè)性化服務(wù)行為信息挖掘系統(tǒng)數(shù)據(jù)庫E-R 結(jié)構(gòu)如圖2 所示[12-13]。
為實(shí)現(xiàn)個(gè)性化服務(wù)行為信息挖掘系統(tǒng)的信息存儲功能,應(yīng)針對系統(tǒng)內(nèi)部數(shù)據(jù)的存儲流程進(jìn)行設(shè)計(jì)。該設(shè)計(jì)主要建立在模塊化程序的基礎(chǔ)上,針對信息存儲流程進(jìn)行一次設(shè)計(jì),該設(shè)計(jì)可在系統(tǒng)數(shù)據(jù)庫中調(diào)用多次,而針對系統(tǒng)信息存儲部分的修改功能具有一定獨(dú)立性,該功能主要通過系統(tǒng)應(yīng)用程序的源代碼來實(shí)現(xiàn),個(gè)性化服務(wù)行為信息挖掘系統(tǒng)信息存儲流程如圖3 所示。
為保證個(gè)性化服務(wù)行為信息挖掘系統(tǒng)針對信息進(jìn)行挖掘時(shí),產(chǎn)生的數(shù)據(jù)皆為有價(jià)值信息,應(yīng)根據(jù)類標(biāo)號進(jìn)行分類。該文針對決策樹算法進(jìn)行構(gòu)建,該算法中存在的每個(gè)節(jié)點(diǎn)皆代表一個(gè)屬性,而分支則代表測試結(jié)果的輸出情況[14-15]。R表示節(jié)點(diǎn)、C表示信息分組,可采用信息增益率的最高屬性來對節(jié)點(diǎn)R進(jìn)行分裂,數(shù)據(jù)元組分類期待值為:
若此時(shí)的信息屬性A存在多個(gè)信息分組的值,則期待值為:
通過將數(shù)據(jù)信息存放至系統(tǒng)數(shù)據(jù)庫中進(jìn)行信息存儲過程設(shè)計(jì),并充分結(jié)合決策樹算法,即可完成個(gè)性化服務(wù)行為信息挖掘的全過程,實(shí)現(xiàn)個(gè)性化服務(wù)行為信息挖掘系統(tǒng)的軟件設(shè)計(jì)。
個(gè)性化服務(wù)行為信息挖掘系統(tǒng)運(yùn)行環(huán)境如表4所示。
表4 個(gè)性化服務(wù)行為信息挖掘系統(tǒng)運(yùn)行環(huán)境
對該系統(tǒng)進(jìn)行測試時(shí),應(yīng)充分了解系統(tǒng)內(nèi)部協(xié)調(diào)能力以及數(shù)據(jù)的流向情況,并結(jié)合上述運(yùn)行環(huán)境針對系統(tǒng)進(jìn)行測試,為保證測試結(jié)果的準(zhǔn)確性,將測試次數(shù)設(shè)置為50 次,系統(tǒng)頁面響應(yīng)時(shí)間對比如表5所示。
表5 系統(tǒng)頁面響應(yīng)時(shí)間對比表
通過對測試結(jié)果進(jìn)行分析可知,個(gè)性化服務(wù)行為信息挖掘系統(tǒng)在不同界面的響應(yīng)時(shí)間具有明顯的差異性,其中傳統(tǒng)信息挖掘系統(tǒng)平均響應(yīng)時(shí)間為3.23 s,而該文信息挖掘系統(tǒng)平均響應(yīng)時(shí)間為0.8 s,由此可證明,該研究具有一定可行性[16]。
綜上所述,由于圖書館內(nèi)部信息過多,可造成個(gè)性化服務(wù)行為信息挖掘系統(tǒng)針對信息進(jìn)行挖掘時(shí),出現(xiàn)響應(yīng)速度慢等問題。為解決該問題,該文針對個(gè)性化服務(wù)行為信息挖掘系統(tǒng)進(jìn)行設(shè)計(jì),并針對該系統(tǒng)進(jìn)行測試,測試結(jié)果表明,該文信息挖掘系統(tǒng)平均響應(yīng)時(shí)間更快,相對于傳統(tǒng)信息挖掘系統(tǒng)平均響應(yīng)時(shí)間而言,該研究更具優(yōu)勢。