胡少霞
(泰山護(hù)理職業(yè)學(xué)院,山東 泰安 271000)
為了最大限度地提高圖書的有效利用率,高校圖書館實(shí)施科學(xué)的管理措施是十分必要的。從圖書利用率的角度分析,借閱逾期是主要的影響因素之一[1]。出現(xiàn)借閱逾期的原因如下:一方面是學(xué)生借閱時(shí)間的設(shè)置低于實(shí)際閱讀需求時(shí)間,導(dǎo)致難以按時(shí)還書;另一方面是時(shí)間較長(zhǎng),學(xué)生或教師忘記了圖書的具體借閱日期以及規(guī)定的還書日期[2]。針對(duì)上述2 種情況,結(jié)合實(shí)際的圖書館管理需求,在圖書借閱逾期前實(shí)施及時(shí)有效的針對(duì)性預(yù)警是十分必要的。針對(duì)該問題,文獻(xiàn)[3]提出了一種以GSM 為基礎(chǔ)的圖書館借閱逾期自動(dòng)系統(tǒng),該系統(tǒng)具有良好的實(shí)際應(yīng)用效果,但是其應(yīng)用的前提是借閱時(shí)間統(tǒng)一,這在一定程度上降低了圖書館的借閱服務(wù)質(zhì)量;文獻(xiàn)[4]提出以人數(shù)為基礎(chǔ)的預(yù)警平臺(tái)設(shè)計(jì)研究,具有良好的預(yù)警效果,但是其預(yù)警的全面性仍存在進(jìn)一步提升的空間。對(duì)上述圖書館借閱逾期預(yù)警系統(tǒng)進(jìn)行分析后可以發(fā)現(xiàn),進(jìn)一步加深相關(guān)研究仍然具有十分重要的現(xiàn)實(shí)價(jià)值。
以此為基礎(chǔ),該文充分利用決策樹算法的優(yōu)勢(shì),提出了一種基于決策樹算法的高校圖書館借閱逾期預(yù)警系統(tǒng)設(shè)計(jì)研究,并通過對(duì)比測(cè)試分析了該設(shè)計(jì)系統(tǒng)的預(yù)警效果。
決策樹又稱判樹。它是一種與流程圖相似的樹結(jié)構(gòu)。在這一樹結(jié)構(gòu)中,每一個(gè)內(nèi)部結(jié)點(diǎn)代表一個(gè)屬性上的測(cè)試,每一個(gè)分支代表一個(gè)測(cè)試輸出,而每一個(gè)葉子結(jié)點(diǎn)代表一個(gè)類或類分布。對(duì)未知的樣本數(shù)據(jù)進(jìn)行分類,應(yīng)先從樹根入手,對(duì)這個(gè)對(duì)象的特征進(jìn)行逐個(gè)檢測(cè),然后沿著這個(gè)分支一直往下進(jìn)行,直到抵達(dá)某個(gè)葉子結(jié)點(diǎn),這個(gè)結(jié)點(diǎn)所表示的類就是這個(gè)對(duì)象所屬的類。
在數(shù)據(jù)倉庫建立后,首先應(yīng)依據(jù)決策樹構(gòu)建的目標(biāo)提取修正如表1 所示的多維數(shù)據(jù)集。從表1 中選擇年份、姓名、圖書借閱率以及文理科屬性作為類別標(biāo)識(shí)屬性,從候選屬性中選擇“圖書借閱率、文理科”作為決策樹的決策屬性集。由表1 可知,初始時(shí)刻屬于u1圖書借閱率類和u2文理科類的實(shí)例個(gè)數(shù)分別為57 個(gè)和43 個(gè),因此可得到公式(1)。
表1 訓(xùn)練樣本
式中:u1為圖書借閱率;u2為文理科類的實(shí)例個(gè)數(shù);P為類別屬性出現(xiàn)預(yù)警的概率。
給定樣本的信息嫡如公式(2)所示。
圖書借閱率=“0”,正例為18,反例為6,其信息嫡如公式(3)所示。
圖書借閱率=“1”,正例為29,反例為9,其信息嫡如公式(4)所示。
圖書借閱率=“2”,正例為9,反例為18,其信息嫡如公式(5)所示。
同上述其他公式一樣列出過程
圖書借閱率=“3”,正例為1,反例為10,其信息嫡如公式(6)所示。
如果選取圖書借閱率作為分類屬性,那么條件嫡如公式(7)所示。
基于高校圖書館借閱數(shù)據(jù)規(guī)模和數(shù)據(jù)流量較大的特點(diǎn),高校須對(duì)相關(guān)借閱數(shù)據(jù)進(jìn)行完整、有效地儲(chǔ)存,才能夠切實(shí)保證借閱逾期預(yù)警系統(tǒng)實(shí)現(xiàn)對(duì)全體成員的全覆蓋[5]。針對(duì)此問題,該文將具有標(biāo)準(zhǔn)6U 5HP VPX 架構(gòu)的FKG-VPXV7-M8 作為系統(tǒng)的存儲(chǔ)裝置。表2 為FKG-VPXV7-M8 的基本運(yùn)行參數(shù)設(shè)置情況。
表2 FKG-VPXV7-M8 的基本運(yùn)行參數(shù)設(shè)置情況
結(jié)合表2 中的參數(shù)信息可以看出,F(xiàn)KG-VPXV7-M8 具有帶寬高、容量大的特點(diǎn),其提供的標(biāo)準(zhǔn)exFAT 文件系統(tǒng)可以對(duì)高校圖書館借閱數(shù)據(jù)進(jìn)行采集、記錄、存儲(chǔ)以及管理。借助上述配置,F(xiàn)KG-VPXV7-M8 還具有實(shí)時(shí)記錄功能、數(shù)據(jù)回放功能、數(shù)據(jù)訪問功能、文件在線管理功能、自檢及故障檢測(cè)功能和異常容錯(cuò)保護(hù)機(jī)制等功能。
為了實(shí)現(xiàn)對(duì)高校圖書館借閱逾期情況的及時(shí)預(yù)警,須結(jié)合借閱信息對(duì)相關(guān)數(shù)據(jù)進(jìn)行適應(yīng)性分析,因此需要功能強(qiáng)大的開發(fā)板作出系統(tǒng)的核心。該文選擇Xilinx Zynq-7010 的MYC-Y7Z010-V2 作為系統(tǒng)的開發(fā)板,其搭載了ARM+FPGA全可編程處理器,且完美支持4.14.0 內(nèi)核的Linux OS 系統(tǒng),采用94PIN(FPGA)郵票孔連接,具有較高的抗沖擊性能。除此之外,MYC-Y7Z010-V2 的ARM 與FPGA 通信方式采用了AXI 高速片上總線通信機(jī)制,在吉比特級(jí)帶寬的支持下,避免了傳統(tǒng)ARM+FPGA 架構(gòu)的通信限制。圖1 為MYC-Y7Z010-V2的FPGA 接口設(shè)置情況。
圖1 MYC-Y7Z010-V2 的FPGA 接口設(shè)置
MYC-Y7Z010-V2 的FPGA 外設(shè)接口包括串口、以太網(wǎng)口以及視頻接口,可有效滿足應(yīng)用階段預(yù)警系統(tǒng)的拓展性需求。
為了實(shí)現(xiàn)對(duì)高校圖書館借閱逾期情況的全面預(yù)警,首先需要準(zhǔn)確提取相關(guān)借閱數(shù)據(jù)[6]。該文分別從圖書的角度和用戶的角度開展該項(xiàng)工作,對(duì)不同角度提取的結(jié)果進(jìn)行匹配,以確保提取結(jié)果的完整性。首先以圖書為核心進(jìn)行借閱數(shù)據(jù)提取,具體的提取方式如公式(8)所示。
式中:f(x)為以圖書為核心的借閱數(shù)據(jù)提取結(jié)果;xi為i類圖書的現(xiàn)有館藏?cái)?shù)量;x0為i類圖書的實(shí)際館藏?cái)?shù)量;k為損耗系數(shù);e為允許誤差參數(shù)[7-8]。
其次,以用戶為核心進(jìn)行借閱數(shù)據(jù)提取,具體的提取方式如公式(9)所示。
式中:g(x)為以用戶為核心的借閱數(shù)據(jù)提取結(jié)果;n為參與圖書借閱的用戶總量;∑xi為單一用戶的圖書借閱總量[9]。
以上述不同角度高校圖書館借閱數(shù)據(jù)提取結(jié)果為基礎(chǔ),對(duì)提取結(jié)果的完整性進(jìn)行分析,當(dāng)f(x)=g(x)時(shí),表示提取的數(shù)據(jù)結(jié)果可靠,可以執(zhí)行后續(xù)的預(yù)警分析;當(dāng)f(x)和g(x)存在差異時(shí),要對(duì)具體的差異數(shù)據(jù)進(jìn)行核對(duì),具體的核對(duì)方法是在圖書館借閱系統(tǒng)中查閱相應(yīng)的信息,從而有效提取高校圖書館借閱數(shù)據(jù),為后續(xù)的預(yù)警效果提供保障。
結(jié)合第2.1 節(jié)提取的數(shù)據(jù)信息,該文在開展借閱逾期預(yù)警的過程中引入了決策樹算法對(duì)具體借閱狀態(tài)進(jìn)行分析。圖2 為該文構(gòu)建的決策樹算法執(zhí)行流程。
圖2 基于決策樹的借閱逾期預(yù)警流程
基于決策樹的借閱逾期預(yù)警流程,先對(duì)數(shù)據(jù)進(jìn)行清洗,按照目標(biāo)借閱時(shí)間對(duì)提取的借閱數(shù)據(jù)進(jìn)行預(yù)處理,具體的處理方式可以表示為公式(10)。
式中:p(x)為處理后的借閱數(shù)據(jù)信息;sim()為一致性函數(shù);t為目標(biāo)借閱時(shí)間設(shè)置情況;x為目標(biāo)節(jié)約類別。
當(dāng)借閱時(shí)間一致時(shí),結(jié)合圖書館的管理需求,設(shè)置具體的預(yù)警標(biāo)準(zhǔn),決策階段主要是根據(jù)借閱時(shí)間與當(dāng)前時(shí)間差進(jìn)行的,如公式(11)所示。
式中:Δt為借閱時(shí)間與當(dāng)前時(shí)間差;t'為當(dāng)前時(shí)間;t0為借閱時(shí)間。
以此可以對(duì)借閱逾期數(shù)據(jù)進(jìn)行分析。
計(jì)算結(jié)果與預(yù)警標(biāo)準(zhǔn)之間的關(guān)系,確定預(yù)警動(dòng)作,如公式(12)所示。
κ=Δt-T(12)式中:κ為預(yù)警動(dòng)作執(zhí)行判斷參數(shù);T為設(shè)置的預(yù)警標(biāo)準(zhǔn)。
預(yù)警動(dòng)作的具體執(zhí)行標(biāo)準(zhǔn)見表3。
表3 預(yù)警動(dòng)作執(zhí)行標(biāo)準(zhǔn)
根據(jù)表3 可以對(duì)高校圖書館借閱逾期情況進(jìn)行有效預(yù)警。
該文以某高校的實(shí)際圖書館管理系統(tǒng)數(shù)據(jù)為基礎(chǔ)測(cè)試數(shù)據(jù),對(duì)應(yīng)的數(shù)據(jù)信息中涵蓋用戶整體借閱數(shù)據(jù)、用戶信息數(shù)據(jù)以及具體的圖書信息數(shù)據(jù)。在測(cè)試過程中,考慮到原始數(shù)據(jù)的規(guī)模較大,直接利用其進(jìn)行測(cè)試對(duì)應(yīng)的時(shí)間開銷較大,因此,該文隨機(jī)選取了其中9 個(gè)月的借閱數(shù)據(jù)作為最終測(cè)試數(shù)據(jù)。對(duì)于測(cè)試數(shù)據(jù)中存在的殘缺記錄及不完整信息,應(yīng)結(jié)合相關(guān)資源進(jìn)行修補(bǔ),并通過校園卡號(hào)對(duì)其進(jìn)行標(biāo)志處理。最后進(jìn)行測(cè)試的18 425 條有效記錄,將其按照目標(biāo)借閱時(shí)間進(jìn)行劃分,主要可分為5 類,對(duì)應(yīng)的時(shí)間分別為15 天、1 個(gè)月、40 天、50 天以及2 個(gè)月。將上述數(shù)據(jù)分組導(dǎo)入SQL Server,可以作為測(cè)試階段差異化測(cè)試環(huán)境構(gòu)建的基礎(chǔ)。在上述數(shù)據(jù)的基礎(chǔ)上,該文以受測(cè)試圖書館的管理要求為基礎(chǔ),對(duì)距離借閱時(shí)間小于7 天的情況進(jìn)行預(yù)警處理,同時(shí)考慮到實(shí)際借閱情況的差異性,設(shè)置了不同的測(cè)試數(shù)據(jù)構(gòu)成,具體見表4。
表4 測(cè)試數(shù)據(jù)構(gòu)成設(shè)置
除此之外,在測(cè)試過程中,該文還設(shè)置了對(duì)照組,對(duì)應(yīng)的預(yù)警方法分別為文獻(xiàn)[3]系統(tǒng)和文獻(xiàn)[4]系統(tǒng)。在此基礎(chǔ)上,對(duì)比3 個(gè)系統(tǒng)的預(yù)警效果,可以對(duì)該文設(shè)計(jì)系統(tǒng)的性能作出客觀評(píng)價(jià)。
該文分別統(tǒng)計(jì)了不同系統(tǒng)的預(yù)警效果。具體的測(cè)試結(jié)果見表5。
表5 不同系統(tǒng)預(yù)警結(jié)果統(tǒng)計(jì)表
由表5 可知,在3 個(gè)不同預(yù)警系統(tǒng)的測(cè)試結(jié)果中,借閱逾期情況的預(yù)警效果隨著數(shù)據(jù)構(gòu)成復(fù)雜程度的不斷提高,均出現(xiàn)了不同程度的下降。其中,當(dāng)測(cè)試數(shù)據(jù)的目標(biāo)借閱時(shí)間構(gòu)成為一種(測(cè)試組1)時(shí),3 個(gè)系統(tǒng)均實(shí)現(xiàn)了對(duì)借閱逾期情況的100.00%預(yù)警,且并未出現(xiàn)錯(cuò)誤預(yù)警的情況。但是隨著測(cè)試數(shù)據(jù)目標(biāo)借閱時(shí)間構(gòu)成的逐漸多元化,文獻(xiàn)[3]系統(tǒng)對(duì)于借閱逾期情況的預(yù)警效果逐漸下降,其中,正確預(yù)警率最小值達(dá)到了94.74%(測(cè)試組5),錯(cuò)誤預(yù)警率最大值達(dá)到了34.74%(測(cè)試組5);文獻(xiàn)[4]系統(tǒng)對(duì)借閱逾期情況的預(yù)警效果雖然比文獻(xiàn)[3]系統(tǒng)高,但是也呈逐漸下降的發(fā)展趨勢(shì),正確預(yù)警率最小值達(dá)到了95.24%(測(cè)試組4),錯(cuò)誤預(yù)警率最大值達(dá)到了21.05%(測(cè)試組5)。相比之下,該文設(shè)計(jì)系統(tǒng)的預(yù)警效果表現(xiàn)出了較高的穩(wěn)定性和可靠性,其中,正確預(yù)警率始終為100.00%,錯(cuò)誤預(yù)警率最大值也僅為3.16%(測(cè)試組5),與文獻(xiàn)[3]系統(tǒng)和文獻(xiàn)[4]系統(tǒng)相比,具有明顯優(yōu)勢(shì)。綜合上述的測(cè)試結(jié)果可知,該文設(shè)計(jì)的基于決策樹算法的高校圖書館借閱逾期預(yù)警系統(tǒng)可以實(shí)現(xiàn)對(duì)不同環(huán)境借閱逾期情況的全面預(yù)警,具有良好的實(shí)際應(yīng)用效果。
該文提出的基于決策樹算法的高校圖書館借閱逾期預(yù)警系統(tǒng)設(shè)計(jì)研究,在設(shè)計(jì)階段充分考慮了圖書館借閱信息規(guī)模以及流量上的屬性特點(diǎn),并以此為基礎(chǔ)對(duì)硬件進(jìn)行了針對(duì)性設(shè)計(jì)。該文還結(jié)合借閱逾期的判定標(biāo)準(zhǔn),在軟件設(shè)計(jì)階段引入決策樹算法,根據(jù)用戶的實(shí)際借閱時(shí)間實(shí)現(xiàn)對(duì)不同逾期情況的全面預(yù)警。借助該文對(duì)高校圖書館借閱逾期預(yù)警系統(tǒng)的設(shè)計(jì),希望能為高校圖書館借閱服務(wù)工作的開展提供有價(jià)值的幫助,最大程度地提高圖書館資源的有效利用率。