国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Web挖掘的圖書館個(gè)性化服務(wù)系統(tǒng)研究

2012-06-05 03:21唐秋鴻曹紅兵唐小新李高虎
關(guān)鍵詞:信譽(yù)度日志數(shù)據(jù)挖掘

唐秋鴻, 曹紅兵, 唐小新, 李高虎, 高 嵩

(1.暨南大學(xué) 管理學(xué)院,廣東 廣州 510632;2.廣西大學(xué) 圖書館,廣西 南寧 530004;3.北京郵電大學(xué) 資產(chǎn)經(jīng)營(yíng)公司,北京 100876)

0 引言

個(gè)性化服務(wù)的實(shí)質(zhì)是一種以用戶需求為中心的服務(wù)[1],它不僅可以有效地解決用戶“信息過(guò)載”與“信息迷航”問(wèn)題,而且可以極大地提高圖書館的服務(wù)質(zhì)量和資源的有效利用,因此成為當(dāng)前圖書館新型服務(wù)模式的主流,而個(gè)性化服務(wù)系統(tǒng)則成為圖書館數(shù)字化、網(wǎng)絡(luò)化服務(wù)的必然選擇。

目前,國(guó)內(nèi)外圖書館個(gè)性化服務(wù)系統(tǒng)正在起步,較具代表性的圖書館個(gè)性化服務(wù)系統(tǒng)有美國(guó)康奈爾大學(xué)圖書館的 Mylibrary@Cornell、北卡羅萊那州立大學(xué)圖書館的Mylibrary@Ncstate、洛杉磯國(guó)際研究實(shí)驗(yàn)室圖書館的Mylibray@LANL、浙江大學(xué)圖書館的MyLibrary、深圳圖書館的ILAS“我的圖書館”、中國(guó)國(guó)家圖書館的“我的圖書館”、中國(guó)人民大學(xué)圖書館的Kingbase DL和華中科技大學(xué)圖書館的Mylibrary@HUST等。這些系統(tǒng)的功能主要包括對(duì)資源的鏈接、定制、檢索、最新資源通告以及文獻(xiàn)傳遞等[2-4]。而基于Web日志挖掘技術(shù)的個(gè)性化服務(wù)系統(tǒng)的研究也開(kāi)始出現(xiàn)。文獻(xiàn)[5]提出應(yīng)用Web日志挖掘技術(shù)可以幫助提高個(gè)性化推薦系統(tǒng)的可伸縮性、精確性和靈活性。文獻(xiàn)[6]提出了一個(gè)兩步Apriori改進(jìn)算法,可對(duì)用戶的 Web訪問(wèn)進(jìn)行貼身指導(dǎo)。文獻(xiàn)[7]提出了一個(gè)智能算法,能從Web訪問(wèn)日志中自動(dòng)挖掘用戶的訪問(wèn)軌跡。文獻(xiàn)[8]提出了一個(gè)基于用戶訪問(wèn)時(shí)間和訪問(wèn)密度的用戶偏好算法,可以更精確地發(fā)現(xiàn)用戶偏好。文獻(xiàn)[9]采用OLAP技術(shù)和數(shù)據(jù)挖掘技術(shù)對(duì)用戶的訪問(wèn)模式和趨勢(shì)進(jìn)行了挖掘,從而提高了Web系統(tǒng)的性能。文獻(xiàn)[10]給出了一種基于項(xiàng)目與客戶聚類的協(xié)同過(guò)濾推薦方法,增強(qiáng)了推薦算法的實(shí)時(shí)性,提高了推薦服務(wù)的質(zhì)量。

但是,現(xiàn)有的圖書館個(gè)性化服務(wù)系統(tǒng)功能明顯不能滿足用戶需求,而當(dāng)前大多數(shù) Web日志挖掘方面的研究缺乏對(duì)圖書館個(gè)性化系統(tǒng)的支持,或者只關(guān)注于算法、性能等技術(shù)層面,對(duì)圖書館用戶個(gè)性化模型的深度挖掘不足,從而導(dǎo)致圖書館個(gè)性化系統(tǒng)的個(gè)性化服務(wù)水平低,個(gè)性化應(yīng)用效果不夠明顯。

本文通過(guò)運(yùn)用Web日志挖掘技術(shù)對(duì)用戶在圖書館OPAC環(huán)境下的信息使用行為、習(xí)慣進(jìn)行深度挖掘,構(gòu)建一種動(dòng)態(tài)的讀者信譽(yù)度評(píng)估機(jī)制,用以科學(xué)地劃分圖書館用戶群體,設(shè)計(jì)能提供滿足其個(gè)性特征和需求的個(gè)性化服務(wù)功能及其組合,以便為進(jìn)一步開(kāi)發(fā)與應(yīng)用圖書館個(gè)性化服務(wù)系統(tǒng)提供技術(shù)基礎(chǔ)。

1 系統(tǒng)結(jié)構(gòu)與評(píng)估模型

1.1 圖書館個(gè)性化服務(wù)系統(tǒng)結(jié)構(gòu)

在分析總結(jié)當(dāng)前常見(jiàn)的圖書館個(gè)性化服務(wù)方式與類型的基礎(chǔ)上,本文提出了一個(gè)兼顧虛擬與物理世界信息服務(wù)的圖書館個(gè)性化服務(wù)系統(tǒng)結(jié)構(gòu)模型,如圖1所示,以期為圖書館用戶提供一個(gè)全方位、多角度、立體化、智能化及人性化的個(gè)性化信息服務(wù)。

圖1 圖書館個(gè)性化服務(wù)系統(tǒng)結(jié)構(gòu)

所構(gòu)建的圖書館個(gè)性化服務(wù)系統(tǒng)由虛擬個(gè)性化服務(wù)和物理個(gè)性化服務(wù)2大部分組成。前者主要指以圖書館和網(wǎng)絡(luò)虛擬資源為基礎(chǔ),利用網(wǎng)絡(luò)為不同的用戶提供基于圖書館虛擬環(huán)境的個(gè)性化服務(wù),它又包括個(gè)性化定制服務(wù)、個(gè)性化推送服務(wù)、個(gè)性化檢索服務(wù)、個(gè)性化收藏服務(wù)、個(gè)性化信息聚合服務(wù)、個(gè)性化知識(shí)管理服務(wù)、個(gè)人歷史信息管理服務(wù)和個(gè)人賬戶管理服務(wù)。后者主要指以圖書館實(shí)體資源為基礎(chǔ),為用戶提供基于圖書館物理環(huán)境的個(gè)性化服務(wù),它又包括6個(gè)組成部分,即一卡通管理服務(wù)、智能識(shí)別服務(wù)、智能定位服務(wù)、智能導(dǎo)讀服務(wù)、自助服務(wù)和電話服務(wù)。虛擬個(gè)性化服務(wù)和物理個(gè)性化服務(wù)兩者相互結(jié)合,互為補(bǔ)充,并通過(guò)RFID電子標(biāo)簽進(jìn)行信息交流,共同為用戶打造一個(gè)全面、立體、融合物理與虛擬世界的個(gè)性化服務(wù)空間[11]。

1.2 圖書館讀者信譽(yù)度評(píng)估模型

圖書館讀者信譽(yù)度是指讀者在使用圖書館資源與服務(wù)的過(guò)程中,對(duì)圖書館資源與服務(wù)的利用情況及其對(duì)圖書館各項(xiàng)規(guī)章制度的遵守程度并因此影響其第2次使用的各種因素的總和。因此,讀者入館情況、讀者對(duì)圖書館文獻(xiàn)資料的借閱、查詢、瀏覽、下載及對(duì)所借文獻(xiàn)資料按時(shí)歸還的情況、對(duì)圖書館文獻(xiàn)資料完整性的保護(hù)程度,以及對(duì)圖書館公共服務(wù)設(shè)施的使用情況等,都應(yīng)當(dāng)納入圖書館讀者信譽(yù)度評(píng)估體系之中,如圖2所示,以形成系統(tǒng)的讀者信譽(yù)監(jiān)督機(jī)制,并用以更好地劃分圖書館用戶群體,從而支持圖書館的個(gè)性化服務(wù),提升圖書館的服務(wù)效率和水平,進(jìn)而提高讀者的滿意度。

圖2 圖書館讀者信譽(yù)度評(píng)估模型

隨著圖書館文獻(xiàn)信息服務(wù)手段的不斷進(jìn)步,日益暴露出圖書館讀者信譽(yù)評(píng)價(jià)研究上的缺失,即決策手段不足、缺乏數(shù)據(jù)支持、服務(wù)方式單一、應(yīng)用領(lǐng)域狹窄等。因此,基于圖書館流通業(yè)務(wù)系統(tǒng)中讀者借閱、罰款等日志記錄,即利用讀者對(duì)圖書館文獻(xiàn)資料的借、還、約和滯還、丟失、損壞、賠償?shù)热罩居涗洠ㄟ^(guò)數(shù)據(jù)挖掘方式,構(gòu)建形成一種動(dòng)態(tài)的讀者信譽(yù)度評(píng)估機(jī)制,并用以科學(xué)劃分讀者群,從而為圖書館個(gè)性化服務(wù)系統(tǒng)的功能設(shè)計(jì)和開(kāi)發(fā)提供依據(jù)和決策支持。

2 圖書館讀者信譽(yù)度的數(shù)據(jù)挖掘

2.1 數(shù)據(jù)挖掘處理邏輯

讀者信譽(yù)度的數(shù)據(jù)挖掘主要是指運(yùn)用Web日志挖掘技術(shù),對(duì)圖書館流通業(yè)務(wù)系統(tǒng)中一定周期內(nèi)讀者的借閱、歸還、罰款等日志記錄進(jìn)行挖掘,并通過(guò)使用聚類分析、異常檢測(cè)分析等方法來(lái)分析處理挖掘結(jié)果,最終形成一種動(dòng)態(tài)的讀者信譽(yù)度評(píng)估機(jī)制的過(guò)程。讀者信譽(yù)度的數(shù)據(jù)挖掘的主要思想和方法是:從大量的流通日志歷史記錄(D)中,匯總所有讀者某一時(shí)間段(T)內(nèi)借、還、約文獻(xiàn)資料的總次數(shù)(F)和因滯還、丟失、損壞文獻(xiàn)資料而被罰款的總金額(P),再利用數(shù)據(jù)挖掘聚類分析方法對(duì)這三者之間的關(guān)系進(jìn)行分析,以形成一個(gè)動(dòng)態(tài)的讀者信譽(yù)度評(píng)估體系,用以科學(xué)地劃分讀者群,從而指導(dǎo)圖書館個(gè)性化服務(wù)系統(tǒng)的功能設(shè)計(jì)和開(kāi)發(fā)。具體挖掘流程如圖3所示。

圖3 讀者信譽(yù)度的數(shù)據(jù)挖掘流程

讀者信譽(yù)度的數(shù)據(jù)挖掘流程主要包括:

(1)對(duì)圖書館流通業(yè)務(wù)系統(tǒng) MELINETSⅡ數(shù)據(jù)庫(kù)中的2個(gè)日志表CIRCULLOG_A和CHARGE_LOG_A進(jìn)行分析。其中,CIRCULLOG_A是記錄讀者借、還、約文獻(xiàn)資料等借閱行為的流通日志表;CHARGE_LOG_A是記錄讀者因滯還、丟失、損壞文獻(xiàn)資料而被罰款等信息的罰款日志表。通過(guò)對(duì)上述2個(gè)日志表中的數(shù)據(jù)進(jìn)行分析,再根據(jù)數(shù)據(jù)字典中各字段表示的含義進(jìn)行數(shù)據(jù)清理和數(shù)據(jù)選擇,為下一步數(shù)據(jù)倉(cāng)庫(kù)的建立準(zhǔn)備所需的數(shù)據(jù)。

(2)在Oracle Database 10g R2數(shù)據(jù)庫(kù)環(huán)境中,建立數(shù)據(jù)倉(cāng)庫(kù)方案 Analysis Data Warehouse,并在該方案下創(chuàng)建數(shù)據(jù)挖掘表CIRCULANALYSIS。

(3)選擇ODM(Oracle Data Mining)數(shù)據(jù)挖掘工具進(jìn)行挖掘,再利用聚類分析(Cluster Analysis)和異常檢測(cè)分析 (Anomaly Detection)方法分析處理挖掘結(jié)果,形成初步的讀者信譽(yù)度評(píng)價(jià)體系。

(4)利用圖書館流通、采訪等業(yè)務(wù)部門抽樣調(diào)查與用戶個(gè)人信息相結(jié)合的方式對(duì)以上所形成的讀者信譽(yù)度評(píng)價(jià)體系進(jìn)行評(píng)估,并將評(píng)估后的讀者信譽(yù)度評(píng)價(jià)體系應(yīng)用于圖書館用戶群體的劃分,從而為開(kāi)發(fā)與利用圖書館個(gè)性化服務(wù)系統(tǒng)奠定技術(shù)基礎(chǔ)。

2.2 挖掘算法的選擇與應(yīng)用

數(shù)據(jù)挖掘算法繁多,僅在聚類分析方面,就有Beefman聚類法、神經(jīng)網(wǎng)絡(luò)聚類法、模糊聚類法、加權(quán)聚 類 法 等[4,12-13]。因 此,在 建 立 用 戶 個(gè)性化服務(wù)模型的過(guò)程中,必須根據(jù)不同的挖掘任務(wù)需求,研究選用適宜的數(shù)據(jù)挖掘算法,以便實(shí)現(xiàn)最佳的數(shù)據(jù)挖掘效果。本文主要通過(guò)使用聚類分析方法,對(duì)從圖書館流通業(yè)務(wù)系統(tǒng)中大量的Web流通日志記錄挖掘得到的結(jié)果進(jìn)行分析,來(lái)形成一種動(dòng)態(tài)的讀者信譽(yù)度評(píng)估機(jī)制。所謂聚類分析方法,是指根據(jù)數(shù)據(jù)對(duì)象間相似性條件的滿足與否進(jìn)行數(shù)據(jù)劃分,并把物理或抽象對(duì)象的集合組成由類似對(duì)象組成的多個(gè)類或簇的一種數(shù)據(jù)分析方法。聚類分析所劃分的類或簇的數(shù)量與類型均是事先未知的、非預(yù)定的。由聚類生成的簇是一組數(shù)據(jù)對(duì)象的集合。同一簇中的對(duì)象盡可能相似[14],使得組間的差別盡可能大,組內(nèi)的差別盡可能小。簇與簇之間可以按照給定的聚類參數(shù)(如距離等)進(jìn)行分解和合并。因此,可以將聚類分析方法應(yīng)用于圖書館讀者群體的聚集和劃分,以及讀者集群特性的分析等。

聚類分析的算法主要有k-中心點(diǎn)算法和k-平均算法(即k-means算法)2種。在k-中心點(diǎn)算法中,每個(gè)簇用接近聚類中心的一個(gè)對(duì)象來(lái)表示;而在k-means算法中,每個(gè)簇用該簇中對(duì)象的平均值來(lái)表示。本文采用k-means算法來(lái)對(duì)讀者信譽(yù)度挖掘結(jié)果進(jìn)行分析。

在k-means聚類分析算法中,假定Ni為第iP聚類ci中的樣本數(shù)目,mi是樣本的均值。若分成k類,則各聚類的均值表示為:

誤差平方和為:

其中,E為觀測(cè)數(shù)據(jù)中所有對(duì)象平方誤差綜合;P為空間中的點(diǎn);mi為聚類ci中的平均值(P和mi是多維的)。對(duì)于不同的分類,k值不同,則E值就不相同,使E達(dá)到最小的分類數(shù)k被認(rèn)為是當(dāng)前的目標(biāo)數(shù)[15-16]。

2.3 挖掘結(jié)果與分析

本文通過(guò)在Oracle Database 10g R2數(shù)據(jù)庫(kù)環(huán)境中創(chuàng)建數(shù)據(jù)倉(cāng)庫(kù),利用ODM數(shù)據(jù)挖掘工具,對(duì)廣西某高校圖書館MELINETSⅡ系統(tǒng)中2010年的173.45×104條流通日志記錄和20.5×104條罰款日志記錄進(jìn)行了挖掘,并采用聚類分析和異常檢測(cè)分析算法,對(duì)讀者行為進(jìn)行了聚類分析,獲得的聚類分析結(jié)果見(jiàn)表1所列。

依據(jù)表1中的挖掘結(jié)果,建立了一種基于MELINETSⅡ平臺(tái)的動(dòng)態(tài)的圖書館讀者信譽(yù)度評(píng)估機(jī)制:全部讀者按照其一定時(shí)間內(nèi)(如以半年或一年為單位統(tǒng)計(jì))借還總次數(shù)和罰款金額數(shù)的情況劃分信譽(yù)等級(jí),一共劃分成5個(gè)等級(jí),以信譽(yù)星級(jí)來(lái)標(biāo)識(shí)。按信譽(yù)度從高到低,依次可分為五星級(jí)、四星級(jí)、三星級(jí)、二星級(jí)和一星級(jí)。

例如,可將1年內(nèi)借還總次數(shù)少于20次,罰款金額低于5.73元(見(jiàn)表1聚類3)的讀者劃分為二星級(jí)讀者;而將1年內(nèi)借還總次數(shù)少于58次,罰款金額高達(dá)57.33元(見(jiàn)表1聚類9)的讀者劃分為一星級(jí)讀者。星級(jí)越低,說(shuō)明讀者在該時(shí)間段內(nèi)的信譽(yù)度越低,且使用圖書館資源與服務(wù)的頻率越低。

表1 讀者行為聚類分析結(jié)果

3 模型應(yīng)用

將讀者按照上述信譽(yù)星級(jí)劃分為不同的用戶群體后,通過(guò)深入分析不同群體的信息使用行為和特點(diǎn),建立相應(yīng)時(shí)間段內(nèi)的動(dòng)態(tài)的用戶需求模型;根據(jù)用戶需求模型,圖書館可以提供能滿足不同信譽(yù)星級(jí)讀者群體需求及特點(diǎn)的個(gè)性化服務(wù)功能或其組合,如圖4所示。

圖4 基于讀者信譽(yù)度評(píng)估模型的圖書館個(gè)性化服務(wù)功能

通過(guò)分析發(fā)現(xiàn),四星或五星級(jí)讀者信譽(yù)度較高,熟悉并遵守圖書館的各項(xiàng)規(guī)章制度,熟悉并經(jīng)常使用圖書館提供的各種資源與服務(wù),是圖書館主要依靠和重點(diǎn)保障的VIP讀者。對(duì)于這部分讀者,圖書館要竭盡全力、充分利用各種現(xiàn)代化信息技術(shù)和手段,為他們提供所需要的資源與服務(wù),以最大限度地滿足其個(gè)性化服務(wù)需求。為此,圖書館可通過(guò)增加這部分讀者的館藏文獻(xiàn)借閱冊(cè)數(shù)和借閱期限,并為其提供更多、更靈活的個(gè)性化定制、推送、收藏、檢索,以及個(gè)人知識(shí)管理和個(gè)人信息管理(如Email定制、手機(jī)短信定制、手機(jī)短信推送、手機(jī)短信查詢、移動(dòng)閱讀、移動(dòng)數(shù)據(jù)庫(kù)檢索、移動(dòng)數(shù)字化多媒體館藏借閱、移動(dòng)音頻導(dǎo)航服務(wù)、自助服務(wù),以及SNS、博客、播客、評(píng)論、標(biāo)簽等Lib2.0功能等)服務(wù)功能,實(shí)現(xiàn)其個(gè)性化服務(wù)目標(biāo)。

而一、二星級(jí)讀者信譽(yù)度較差,不太熟悉圖書館的各項(xiàng)規(guī)章制度和所提供的各種資源與服務(wù),且較少使用圖書館的資源與服務(wù),是圖書館要努力爭(zhēng)取和培養(yǎng)的惰性讀者和潛在VIP讀者。對(duì)于這部分讀者,圖書館要想方設(shè)法促使其更多地利用圖書館的資源與服務(wù),并自覺(jué)遵守圖書館的各項(xiàng)規(guī)章制度。為此,圖書館可采取在一定時(shí)間內(nèi)減少其館藏文獻(xiàn)借閱冊(cè)數(shù)和借閱期限,并加強(qiáng)圖書超期提醒、個(gè)人借閱信息推送和新生培訓(xùn)、“怎樣利用圖書館”和數(shù)據(jù)庫(kù)專題講座等各種培訓(xùn)信息的推送以及多種形式的多媒體培訓(xùn)課件、培訓(xùn)視頻文件、在線實(shí)時(shí)培訓(xùn)等培訓(xùn)服務(wù),以及FAQ、Email咨詢、手機(jī)短信咨詢、在線實(shí)時(shí)咨詢等各種咨詢服務(wù)和新書通報(bào)、好書推薦、專題導(dǎo)航、學(xué)科導(dǎo)航、課程導(dǎo)航等各種資源推薦和導(dǎo)航服務(wù)來(lái)實(shí)現(xiàn)其服務(wù)目標(biāo)。

4 結(jié)束語(yǔ)

讀者信譽(yù)度評(píng)估體系維系著讀者對(duì)圖書館的信譽(yù)度和忠誠(chéng)度,是圖書館服務(wù)和管理工作的重點(diǎn),也是圖書館從被動(dòng)、通用性服務(wù)向主動(dòng)、智能化、個(gè)性化服務(wù)轉(zhuǎn)型要解決的重要問(wèn)題之一。本文提出了一個(gè)兼顧虛擬與物理世界信息服務(wù)的圖書館個(gè)性化服務(wù)系統(tǒng)結(jié)構(gòu)模型及讀者信譽(yù)度評(píng)估模型,采用 Web日志挖掘技術(shù)對(duì)圖書館MELINETS系統(tǒng)中大量的Web流通日志記錄進(jìn)行了挖掘,構(gòu)建了一種能反映不同用戶個(gè)體和群體信息使用行為、習(xí)慣及其變化特征的動(dòng)態(tài)的讀者信譽(yù)度評(píng)估機(jī)制,用以科學(xué)地劃分讀者群,根據(jù)不同信譽(yù)星級(jí)讀者群體的不同特點(diǎn)和需求,設(shè)計(jì)了能提供滿足其個(gè)性特征和需求的個(gè)性化服務(wù)功能及其組合。這些工作為進(jìn)一步開(kāi)發(fā)與應(yīng)用圖書館個(gè)性化服務(wù)系統(tǒng)提供了技術(shù)基礎(chǔ)。

[1]崔 林,宋瀚濤,龔永罡,等.基于 Web使用挖掘的個(gè)性化服務(wù)技術(shù)研究[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2005(3):23-26.

[2]呂艷麗.基于Web使用挖掘的圖書館個(gè)性化系統(tǒng)研究[J].圖書館學(xué)刊,2006(4):135-137.

[3]錢 力.數(shù)字圖書館個(gè)性化信息服務(wù)系統(tǒng)的研究與設(shè)計(jì)[D].北京:首都師范大學(xué),2008.

[4]李雪倩.Web使用記錄挖掘在數(shù)字圖書館個(gè)性化服務(wù)中的應(yīng)用研究[D].哈爾濱:黑龍江大學(xué),2008.

[5]Mobasher B,Cooley R,Srivastava J.Automatic personalization based on Web usage mining[J].Communication of the ACM,2000,43(8):142-151.

[6]Lazcorreta E,Botella F,F(xiàn)ernández-Caballero A.Towards personalized recommendation by two-step modified Apriori data mining algorithm[J].Expert Systems with Applications,2008,35(3):1422-1429.

[7]Tug E,Skiroglu M,Arslan A.Automatic discovery of the sequential accesses from Web log data files via a genetic algorithm [J].Knowledge-Based Systems,2006,9(3):180-186.

[8]Wang Shuqing,She Li,Liu Zhen,et al.Algorithm research on user interests extracting via Web log data[C]//2009International Conference on Web Information Systems and Mining,WISM 2009,2009:93-97.

[9]Zaiane O R,Xin Man,Han Jiawei1.Discovering Web access patterns and trends by applying OLAP and data mining technology on Web logs[C]//Proceedings of the 1998IEEE Forum on Research and Technology Advances in Digital Libraries,ADL,1998:19-29.

[10]張 娜,何建民.基于項(xiàng)目與客戶聚類的協(xié)同過(guò)濾推薦方法[J].合肥工業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2007,30(9):1159-1162.

[11]曹紅兵,唐秋鴻,唐小新,等.物聯(lián)網(wǎng)環(huán)境下的高校圖書館個(gè)性化服務(wù)體系構(gòu)建[J].情報(bào)理論與實(shí)踐,2011,34(3):70-76.

[12]李亞飛,劉業(yè)政.Web挖掘的體系研究[J].合肥工業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2004,27(3):305-309.

[13]李超鋒.Web使用挖掘關(guān)鍵技術(shù)研究[D].武漢:華中科技大學(xué),2007.

[14]羅 可,蔡碧野,吳一帆,等.數(shù)據(jù)挖掘中聚類的研究[J].計(jì)算機(jī)工程與應(yīng)用,2003(20):182-184,218.

[15]高孝梅.基于聚類分析的圖書館讀者閱讀習(xí)慣調(diào)查[J].情報(bào)探索,2010(12):11-12.

[16]張建民,姚 亮,胡學(xué)鋼.一種面向數(shù)據(jù)缺失問(wèn)題的K-means改進(jìn)算法[J].合肥工業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2008,31(9):1455-1457.

猜你喜歡
信譽(yù)度日志數(shù)據(jù)挖掘
一名老黨員的工作日志
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
扶貧日志
主板返修在線查詢管理系統(tǒng)的設(shè)計(jì)
游學(xué)日志
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
服裝品牌營(yíng)銷策略分析
蚌埠市住宿場(chǎng)所衛(wèi)生信譽(yù)度A級(jí)單位各項(xiàng)指標(biāo)得分情況分析
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
網(wǎng)購(gòu)中第三方標(biāo)記選擇及定價(jià)