国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于混合策略的水利門戶信息推薦研究

2021-03-16 13:28王繼民
計算機應用與軟件 2021年3期
關鍵詞:門戶門戶網(wǎng)站類別

王 飛 張 玲 王繼民

(河海大學計算機與信息學院 江蘇 南京 210098)

0 引 言

水利門戶網(wǎng)站是水利部門進行水利信息資源整合、發(fā)布,為公眾提供信息和服務的平臺。如今,水利門戶網(wǎng)站已成為廣大人民群眾感知以及獲取水利門戶信息和公共服務的有效平臺。目前,水利門戶網(wǎng)站主要按照信息時間先后順序以及重要度等展現(xiàn)信息,其存在以下問題:

(1) 發(fā)布形式單一,缺乏靈活性。網(wǎng)站向所有用戶提供相同信息,未考慮用戶偏好,缺乏靈活性。

(2) 用戶查找信息難度大。用戶在瀏覽網(wǎng)站時,通常會根據(jù)需求在網(wǎng)站上查找門戶信息。然而,隨著水利門戶信息的不斷增多,用戶查找目標信息的難度不斷增加。

(3) 用戶易錯過重要的水利門戶信息。水利門戶網(wǎng)站經(jīng)常對洪澇旱災、臺風等災害情況進行介紹和預報等,信息量的增多使得用戶易錯失重大災害的預警預報信息。

個性化推薦是一種能夠幫助用戶快速獲取有價值信息的技術[1],推薦系統(tǒng)通過分析用戶歷史行為建立用戶興趣模型向用戶推薦滿足其興趣的信息[2]。目前,國內(nèi)外對于推薦技術已經(jīng)進行了深入的研究,但推薦技術在水利門戶網(wǎng)站上應用很少。將推薦技術應用到水利門戶網(wǎng)站,能讓人們有針對地及時了解感興趣的水利業(yè)務,提高對自然災害認知和防范能力。

1 研究現(xiàn)狀

推薦技術主要有基于內(nèi)容的推薦[3-4]、協(xié)同過濾推薦[5-6]、基于關聯(lián)規(guī)則的推薦[7-8]、混合推薦[9-10]等?;趦?nèi)容的推薦根據(jù)用戶的歷史行為建立用戶興趣向量,根據(jù)信息特征建立信息特征向量以及信息之間的相似度量,最后將最相似的k個信息推薦給用戶?;谟脩舻膮f(xié)同過濾推薦根據(jù)用戶的興趣偏好尋找相似用戶,將相似用戶喜歡的信息推薦給當前用戶?;陉P聯(lián)規(guī)則的推薦以數(shù)據(jù)挖掘為基礎,從中得出不同物品的關聯(lián)性,利用這些關聯(lián)性對用戶進行物品的推薦。混合推薦是根據(jù)當前系統(tǒng)的性能需求將不同的推薦技術結(jié)合起來的方法。

在以上主要推薦技術的基礎上,不同研究者加入時間以及地理等因素進一步提升推薦的性能。Li等[11]將用戶興趣劃分為長期興趣和短期興趣,提出了基于時間變化的新聞推薦模型。陶永才等[12]提出了基于地理位置的個性化新聞混合推薦方法,使用聚類算法獲取用戶閱讀新聞較多的地理位置及在相應位置閱讀的新聞集合,分析用戶在不同位置的長、短期閱讀興趣。吳運強[13]研究基于用戶興趣和地理位置的個性化推薦,在推薦算法中加入地理位置因子,以調(diào)整推薦結(jié)果。當前,將推薦技術應用于水利門戶網(wǎng)站還存在以下問題:

(1) 項目冷啟動和用戶冷啟動[14]。網(wǎng)站實時更新水利門戶信息,新的信息如果不被大量用戶閱讀將得不到有效推薦,當新用戶瀏覽網(wǎng)站時,因為沒有用戶歷史行為數(shù)據(jù),對新用戶的興趣無法準確表達。

(2) 用戶行為數(shù)據(jù)稀疏[15]。隨著推薦規(guī)模的不斷增大,兩個用戶同時關注同一水利門戶信息的可能性越來越小,無法發(fā)現(xiàn)用戶之間的關聯(lián)性,無法實現(xiàn)推薦。

(3) 重點、熱點信息推送。水利部門根據(jù)時間和地理位置的變化業(yè)務會有所側(cè)重,如長江流域的汛期重點是防洪,而珠江流域還要考慮防范臺風。因此需要提高用戶對本地區(qū)當前可能發(fā)生的與水利相關的重點問題的認知以及對突發(fā)狀況的防范意識。

針對以上問題,本文提出基于混合策略的水利門戶信息推薦方法。建立時空敏感的熱點信息推薦模型,根據(jù)水利部門所在地理位置和所處時間的業(yè)務特點,向所有用戶推薦熱點信息,解決冷啟動和重點、熱點信息推薦的問題。建立基于用戶和信息類別的協(xié)同過濾推薦模型,將用戶對水利門戶信息的興趣轉(zhuǎn)移到對門戶信息類別上,提高協(xié)同推薦中相似用戶的數(shù)量,解決用戶行為數(shù)據(jù)稀疏的問題。建立混合推薦模型,將時空敏感的熱點信息推薦、用戶和信息類別的協(xié)同過濾推薦,以及基于內(nèi)容推薦的三種推薦列表線性加權,生成最終的推薦列表。通過網(wǎng)絡爬蟲和調(diào)查構建實驗數(shù)據(jù)集,驗證了水利門戶信息混合推薦方法的有效性,并設計水利門戶信息推薦系統(tǒng)框架以及主要功能。

2 水利門戶信息推薦建模與實現(xiàn)

2.1 水利門戶信息推薦框架

水利門戶信息推薦的總體框架如圖1所示。

圖1 水利門戶信息推薦總體框架

水利門戶信息推薦的總體流程包括:數(shù)據(jù)收集和預處理,水利門戶信息分類建模,水利門戶信息混合推薦。

2.2 數(shù)據(jù)收集和預處理

(1) 水利門戶信息分類目錄。根據(jù)水利業(yè)務特征以及水利門戶信息自身特性將水利門戶信息劃分為水文信息、水資源信息、水環(huán)境水生態(tài)信息、水利工程信息、農(nóng)村水利信息、水災害(防汛抗旱)信息、水土保持信息、水庫移民信息、政務信息、其他等10類。

(2) 推薦數(shù)據(jù)收集。針對某個水利門戶網(wǎng)站,為了增加可以推薦給用戶的信息,其信息庫中不但包含本網(wǎng)站發(fā)布的數(shù)據(jù),還可以通過網(wǎng)絡爬蟲,從互聯(lián)網(wǎng)(如流域、水文局的門戶網(wǎng)站等)獲取水利業(yè)務相關的信息,構建完整的水利門戶信息庫。

(3) 分類數(shù)據(jù)標注。從水利門戶信息庫中通過人工篩選提取部分信息組成門戶信息分類訓練集,按照事先定義的水利門戶信息類別對文檔類別進行人工標注。采用中文分詞工具對分類文檔中的數(shù)據(jù)進行分詞和去除停用詞等預處理。

(4) 水利門戶信息特征向量提取。對水利門戶信息數(shù)據(jù)分詞、去除停用詞,將其表示成能表征文本語義的詞語序列。對生成的詞語序列進行主題模型訓練以及關鍵詞提取,得到每個水利門戶信息主題特征權重向量和關鍵詞特征權重向量。

2.3 水利門戶文檔分類模型構建

(1) 文檔類別特征提取。預處理后每個類別的特征詞語集詞數(shù)眾多,會造成維度的災害,同時對分類也會有影響,因此需要進行特征提取。本文利用CHI通過計算特征詞與類別之間的關聯(lián)度,提取出關聯(lián)程度高的特征作為文檔的特征[16]。CHI值越高,特征詞與類別之間的相關性越高,反之,則越小。特征詞tk對類ci的CHI計算為:

(1)

式中:N為訓練集文檔總數(shù),N=A+B+C+D;A為包含特征詞tk且屬于類別ci的文檔次數(shù);B為包含特征詞tk但不屬于類別ci的文檔次數(shù);C為不包含特征詞tk但屬于類別ci的文檔次數(shù);D為不包含特征詞tk且不屬于類別ci的文檔次數(shù)。

詞條tk對于整個分類文檔的CHI值計算為:

(2)

式中:p(ci)表示樣本文檔屬于ci類的頻率;c表示類別總數(shù)。剔除低于某閾值的詞條,保留高于該閾值的詞條作為特征項。

(2) 水利門戶信息KNN分類器構造。本文選擇KNN算法實現(xiàn)水利門戶信息分類,KNN算法在訓練集中找出與待測文本最相似的k個文本,然后計算待測文本屬于每個類別的權重并將其分到權重最大的一類。門戶信息d屬于類別ci的權重P(d,ci)計算為:

(3)

式中:Kd為門戶信息d的關鍵詞特征向量;Kj為訓練集文檔j的關鍵詞特征向量;sim(Kd,Kj)為門戶信息d與j之間的余弦相似度;k為訓練集文檔的總數(shù);y(xj,ci)為類別屬性函數(shù),若j屬于類別ci,則置為1,反之,則置為0。選取出概率最高的作為該水利門戶信息的類別。

2.4 水利門戶信息混合推薦模型構建

2.4.1基于用戶和信息類別的協(xié)同過濾推薦

由于水利門戶信息的閱讀量較低,在利用相似用戶進行協(xié)同過濾時,容易出現(xiàn)針對一個用戶無法找到與其閱讀過同樣信息的用戶,造成難以實現(xiàn)推薦。本文將用戶閱讀的水利門戶信息映射到其所屬類別,然后計算出用戶對門戶信息類別的興趣度,通過用戶對共同的門戶信息類別的興趣度來計算用戶之間的相似度。

(4)

式中:Pi為用戶對閱讀過的水利門戶信息文檔i的興趣度,設置為1;Wij為表示水利門戶信息文檔i是否屬于類別j,若屬于則Wij為1,反之則為0;n為用戶閱讀的門戶信息總數(shù)。

(2) 用戶-門戶信息類別興趣更新。隨著時間的推移,用戶對某一事物的興趣如果得不到加強,就會呈現(xiàn)出衰減趨勢[17],本文利用式(5)的興趣衰減函數(shù)來表示用戶興趣衰減過程。

f(t)=e-λ(ttoday-tpre)

(5)

式中:ttoday為當前日期;tpre為興趣值最近一次更新的日期;λ為系統(tǒng)預置參數(shù),決定著用戶興趣衰減的速率。

當前興趣向量Iuc_today計算為:

Iuc_today=f(t)×Iuc_pre+Iuc

(6)

式中:Iuc_pre為上次更新后的用戶類別興趣度向量;Iuc為本次行為產(chǎn)生的類別興趣度向量。

(3) 用戶對門戶信息的興趣度評估。根據(jù)用戶-類別興趣度向量,利用余弦距離計算用戶之間的相似度。選出U個與當前用戶喜好最接近的用戶,提取出這U個用戶閱讀過的所有信息,過濾用戶已經(jīng)觀看過的部分,計算用戶對剩余門戶信息的興趣度。同時,水利門戶信息存在著時效性特點,即隨著水利門戶信息發(fā)布日期與用戶閱讀日期間隔的增大,用戶對該水利門戶信息的興趣度也會不斷減小。因此在進行推薦時,用戶對水利門戶信息的興趣度同樣采用式(5)進行時間上的降權處理,此時tpre表示信息發(fā)布的日期。

最終,用戶u對與其相似的用戶a所關注的門戶信息i的興趣度Iud(u,a,i)為:

Iud(u,a,i)=sim(u,a)×Iud(a,i)×f(t)

(7)

式中:sim(u,a)為用戶u與相似用戶a之間的相似度;Iud(a,i)為用戶a對其所閱讀過的門戶信息i的初始興趣度,設置為1;f(t)為時效性。

模型按興趣度對水利門戶信息排名,將排名前k的水利門戶信息推薦給用戶u。

2.4.2基于信息內(nèi)容的推薦

采用LDA主題模型[18-19]和向量空間模型[20]對用戶行為進行特征表示,抽取出用戶的關鍵詞興趣向量和主題興趣向量,同時考慮用戶興趣衰減特點,實現(xiàn)用戶興趣模型的構建。

(1) 用戶主題興趣表示與更新。利用主題模型挖掘用戶當天閱讀的水利門戶信息主題,并計算得到用戶對主題的興趣度向量Iut:

(8)

式中:Ti為用戶對閱讀過的水利門戶信息i的興趣度,設為1;Iud為用戶閱讀的門戶文檔中主題權值向量;n為用戶閱讀的總的水利門戶信息的篇數(shù)。

用戶主題興趣向量更新原理與2.4.1節(jié)的類別興趣向量的更新原理類似,最終生成用戶主題興趣向量Iut。

(2) 用戶關鍵詞興趣表示與更新。利用向量空間模型挖掘用戶關鍵詞興趣,使用TF-IDF進行關鍵詞權值計算,得到用戶閱讀的水利門戶信息的關鍵詞權值,用戶關鍵詞興趣向量的表示以及更新與用戶主題興趣向量的表示以及更新方式類似,最終生成用戶關鍵詞興趣向量Iuk。

(3) 用戶對門戶信息的興趣度評估。分別采用余弦距離計算用戶主題興趣向量Iut與水利門戶信息主題特征向量T相似度以及用戶關鍵詞興趣向量Iuk與水利門戶信息關鍵詞特征向量K相似度。最終用戶對水利門戶信息興趣度為:

Iud(u,d)=α×sim(Iuk,Kd)+β×sim(Iut,Td)

(9)

式中:α和β用于調(diào)整兩種相似度之間的比例,α+β=1。

按照用戶對水利門戶信息文檔的興趣度排序,向用戶推薦前k個信息文檔。

2.4.3基于時空敏感的熱點信息推薦

水利業(yè)務具有很強的季節(jié)和地域特點,為了解決推薦過程中用戶冷啟動問題以及提高用戶對本地區(qū)當前可能發(fā)生災害(如臺風、山洪等)的認識,增強突發(fā)狀況的防范意識,在推薦結(jié)果加入當前熱點水利業(yè)務信息?;跁r空敏感的水利門戶熱點信息推薦具體過程如下:

(1) 水利門戶網(wǎng)站根據(jù)其所處地理位置的不同季節(jié)的業(yè)務特點,事先定義好不同時間的熱點水利門戶信息類別。

(2) 計算用戶對當前熱點信息類別中水利門戶信息的興趣度,從流行度和時效兩個方面考慮用戶對熱點的興趣度。

水利門戶信息的流行度越高,表示大部分用戶對該水利門戶信息的興趣度越高,使用所有用戶對該水利門戶信息的點擊數(shù)來描述其流行度。用戶對水利門戶信息的興趣度會隨著時間衰減,因此在計算用戶對水利門戶信息興趣度時也采用式(5)進行時間上的降權處理。最終得到用戶對熱點信息的興趣度為:

Iud=pi×f(t)

(10)

式中:Iud為用戶u對水利門戶信息d的最終興趣程度;Pi為所有用戶對當前的熱點水利門戶信息i的點擊數(shù);f(t)為時效性。

按照用戶對水利門戶信息文檔的興趣度排序,向用戶推薦前k個信息文檔。

2.4.4基于線性組合的混合推薦

本文采用混合方式為用戶推薦水利門戶信息,其過程如圖2所示。

圖2 混合推薦流程

(1) 針對新用戶,采用基于時空敏感的熱點信息推薦。針對老用戶,將三種推薦的結(jié)果進行線性加權組合,系數(shù)α、β、γ表示三種推薦方式的權重,初始權重為1 ∶1 ∶1。

(2) 線性組合權重更新。當用戶對推薦信息產(chǎn)生點擊行為,根據(jù)用戶對三種推薦方式推薦的信息實際點擊個數(shù)與總點擊個數(shù)比值對權值進行調(diào)整,新的比例設置為countuser∶countcontent∶counthot,并對比例進行標準化。countuser為用戶對基于用戶和信息類別協(xié)同過濾推薦結(jié)果的點擊次數(shù),countcontent為用戶對基于內(nèi)容的推薦結(jié)果的點擊次數(shù),counthot為用戶對基于熱點信息推薦結(jié)果的點擊次數(shù)。

3 實 驗

3.1 實驗方法

利用網(wǎng)絡爬蟲從一些重要的水利門戶網(wǎng)站爬取信息,作為水利門戶信息分類和信息推薦的實驗數(shù)據(jù),并對用于分類的門戶信息進行手工標注。通過調(diào)查記錄普通用戶和水利行業(yè)專業(yè)人員在2018年7月不定期訪問指定網(wǎng)站的行為數(shù)據(jù),由于7月份的水災害相關信息關注度比較高,因此設置水利門戶的熱點信息類別為水災害,混合推薦中三種方法結(jié)果的初始比例為1 ∶1 ∶1。采用準確率、召回率、F1-score值[21]指標,將單獨的基于用戶和信息類別的推薦、基于內(nèi)容的推薦、基于時間和地理位置的熱點信息推薦,以及混合推薦的結(jié)果進行比較。

3.2 實驗數(shù)據(jù)收集和預處理

(1) 水利門戶信息數(shù)據(jù)收集和預處理。通過網(wǎng)絡爬蟲從中華人民共和國水利部、珠江水利委員會、長江水利委員會、黃河水利委員會的官方網(wǎng)站,以及城市水資源環(huán)境網(wǎng)等門戶上獲取各種水利門戶信息,總共5 407條,手工篩選分類信息文檔,并按照10個信息類別對數(shù)據(jù)進行手工標記,每類300條信息,總共3 000個文檔組成分類訓練集。

(2) 用戶行為數(shù)據(jù)收集和預處理。采用調(diào)查的方式記錄用戶的行為過程,選取100名普通用戶和水利專業(yè)人員,讓其2018年7月份不定期瀏覽中華人民共和國水利部、珠江水利委員會、長江水利委員會、黃河水利委員會的官方網(wǎng)站,最終得到100名用戶一個月的瀏覽記錄。將一個月總瀏覽行為少于30篇的用戶去除,最終整理得到86個用戶對于698條水利門戶信息的4 234條行為數(shù)據(jù),將每個用戶的時間最新的15篇瀏覽記錄提取出作為測試集,剩下的作為訓練集。

3.3 實驗評價指標

本文利用準確率、召回率、F1-score值來評價實驗結(jié)果,其中:R(u)指通過推薦算法生成的推薦列表;T(u)指用戶實際點擊的所有水利門戶信息。

準確率(Precision):指推薦的所有信息中用戶感興趣的比率,即生成的推薦列表中用戶點擊并閱讀的水利門戶信息數(shù)量與總的推薦的信息數(shù)量的比率。

(11)

召回率(Recall):推薦的信息中用戶感興趣的信息占用戶感興趣的所有的信息的比率,即生成的推薦列表中用戶點擊并閱讀的水利門戶信息數(shù)量與用戶實際點擊的所有信息的比率。

(12)

F1-score值:準確率和召回率的調(diào)和平均值,能綜合地反映整體指標。

(13)

3.4 實驗結(jié)果及分析

(1) 門戶信息KNN分類模型參數(shù)。利用手工標注的水利門戶信息建立KNN分類模型需要確定信息的特征維數(shù),實驗中,選擇Python版本的jieba分詞工具進行文本分詞,使用哈工大停用詞表、四川大學機器學習智能實驗停用詞庫、百度停用詞庫去除停用詞,使用CHI進行特征詞提取,最后使用KNN算法作為文本分類算法,結(jié)果如圖3所示。

圖3 F1-score隨特征維數(shù)變化規(guī)律

圖3顯示了k=10時,在特征維數(shù)m=200、400、600、800、1 000、1 500、2 000時F1-score的變化??梢钥闯?,在特征維數(shù)m=400時,分類效果趨于穩(wěn)定,且在m=600時,分類效果最佳,分類的F1-score最高可達到0.825。

(2) 基于信息內(nèi)容的推薦中主題T的數(shù)量。在基于信息內(nèi)容的推薦實驗中,進行主題模型和TF-IDF權值計算,設置時效性衰減參數(shù)為0.2,興趣衰減函數(shù)參數(shù)為0.05。LDA模型訓練中,先驗參數(shù)α=50/Tnum,β=0.01。關鍵字權重和主題權重按照1 ∶1設置。分析了在不同的推薦數(shù)量下,主題數(shù)量對F1-score值的影響。

圖4展示了推薦篇數(shù)在N=12,24,主題數(shù)目Tnum=10,20,30,40,50的情況下推薦的F1-score。可以看出,隨著主題數(shù)目的不斷增多,推薦性能先增后減,且兩種情況下都是主題值設為Tnum=40時,推薦性能最好。

圖4 主題數(shù)量對F1-score的影響

(3) 基于用戶和信息類別的協(xié)同過濾中相似用戶數(shù)?;谟脩艉托畔㈩悇e的協(xié)同過濾推薦中,首先要確定最佳的相似用戶數(shù),相似用戶過多會導致實驗效果下降,相似用戶數(shù)過少會導致實驗結(jié)果過于個人化。設置用戶的興趣衰減函數(shù)參數(shù)為0.05,水利門戶信息時效性衰減參數(shù)為0.2。表1顯示了推薦篇數(shù)N= 12,24,相似用戶數(shù)U= 5,10,15,20情況下的F1-score值??梢钥闯?,兩種情況下隨著相似用戶數(shù)的增多,推薦性能先增后減,在U= 10的情況下推薦效果最好。

表1 F1-score值隨相似用戶的增長變化情況

(4) 混合推薦模式有效性驗證。將水利門戶信息混合推薦模型(HRA)、基于用戶和信息類別的協(xié)同過濾推薦模型(UCCF)、基于信息內(nèi)容的推薦模型(CB)、基于時空敏感的熱點信息推薦模型(TSB)進行實驗對比,針對不同模型從準確率(Precision)、召回率(Recall)和F1-score進行分析。

圖5、圖6、圖7是推薦篇數(shù)分別為N=6,12,18,24,30,36的情況下的五種推薦方法的準確率、召回率和F1-score。可以看出,隨著推薦篇數(shù)的增多,五種方法的準確率不斷下降,召回率不斷上升,F(xiàn)1-score先上升后下降,在推薦篇數(shù)為24的情況下,整體推薦性能最好。HRA的F1-score最高達到了26.5%,相對于單一模式下的UCCF提升了3.9個百分點,TSB提升了2.7個百分點,CB提升了2.1個百分點。

圖5 五種推薦算法準確率對比圖

圖6 五種推薦算法召回率對比圖

圖7 五種推薦算法F1-score對比圖

4 水利門戶信息推薦系統(tǒng)設計

4.1 系統(tǒng)框架

水利門戶信息推薦系統(tǒng)主要是為水利門戶網(wǎng)站提供推薦服務,推薦系統(tǒng)可以直接訪問水利門戶網(wǎng)站中的用戶行為數(shù)據(jù)以及水利門戶信息,同時從各大水利門戶網(wǎng)站爬取其他水利門戶信息,與服務網(wǎng)站的水利門戶信息共同組成推薦信息。將用戶行為數(shù)據(jù)、推薦信息、系統(tǒng)預設參數(shù)輸入推薦模型生成推薦列表,系統(tǒng)接收服務水利門戶網(wǎng)站傳遞的用戶id,將推薦結(jié)果通過Web Service接口返回該用戶。系統(tǒng)框架如圖8所示。

圖8 水利門戶信息推薦系統(tǒng)框架

4.2 系統(tǒng)功能模塊

水利門戶信息推薦系統(tǒng)分為如圖9所示的五大功能模塊:信息采集模塊、門戶信息管理模塊、用戶管理模塊、模型管理模塊、推薦服務模塊。

圖9 水利門戶信息推薦系統(tǒng)功能模塊

(1) 信息采集模塊:通過網(wǎng)絡爬蟲實現(xiàn)對其他水利門戶網(wǎng)站數(shù)據(jù)的采集,將采集的水利門戶信息存入系統(tǒng)數(shù)據(jù)庫中,增加推薦的信息庫。系統(tǒng)管理員可以根據(jù)自身需求修改采集頻率、采集網(wǎng)站,同時可以刪除采集的信息,對采集信息的類別進行修改以及按照時間或者類別查看信息。

(2) 門戶信息管理模塊:系統(tǒng)與其服務的水利門戶網(wǎng)站共享水利門戶信息,系統(tǒng)管理員可以按時間或者類別查看該信息。

(3) 用戶管理模塊:系統(tǒng)與其服務的水利門戶網(wǎng)站共享用戶行為數(shù)據(jù),管理員可以查看用戶行為數(shù)據(jù)以及查看根據(jù)該數(shù)據(jù)生成的用戶推薦列表。

(4) 模型管理模塊:當系統(tǒng)中有新的水利門戶信息之后,就自動調(diào)用訓練好的分類Python腳本文件進行水利門戶信息分類。系統(tǒng)按每天一次定時調(diào)用推薦腳本文件,為用戶推薦信息。管理員可根據(jù)自身需求調(diào)用不同的推薦模型實現(xiàn)推薦方式的修改。

(5) 推薦服務模塊:水利門戶信息推薦系統(tǒng)通過Web Sservice接口,向水利門戶網(wǎng)站提供推薦服務,根據(jù)服務門戶網(wǎng)站提供的用戶id將本系統(tǒng)生成的推薦列表返回給水利門戶網(wǎng)站。接口設計如下:

public String GetRecommendationList(String user_id)

user_id表示傳遞的用戶編號,根據(jù)用戶編號,以.xml格式返回為每個用戶生成的推薦列表,包括水利門戶信息標題、url,接口返回格式具體描述如下:

根結(jié)點表示包含的是推薦內(nèi)容。結(jié)點表示推薦操作返回的狀態(tài),VALUE屬性的值表示操作結(jié)果,若為200,則表示推薦成功,否則失敗,比如,系統(tǒng)運行錯誤等。表示包含推薦記錄集信息,其中每個結(jié)點表示一條推薦信息;結(jié)點的TITLE屬性表示推薦信息的標題,表示推薦信息的原始地址。

5 結(jié) 語

水利門戶網(wǎng)站是水利部門進行水利信息資源整合、發(fā)布,為公眾提供信息和服務的平臺。目前,水利門戶網(wǎng)站按照信息發(fā)布時間的先后將信息展示到網(wǎng)站上。然而,在這種模式下,隨著門戶信息數(shù)量的不斷增多,用戶查找信息的難度不斷增加,同時容易錯過重要的門戶信息。水利門戶信息混合推薦模型能有效解決推薦技術應用到水利門戶網(wǎng)站上的冷啟動問題、數(shù)據(jù)稀疏性問題,同時,在推薦過程中,有針對性地提高用戶對本地區(qū)當前可能發(fā)生的與水利相關的重點問題的認知、突發(fā)狀況的防范意識。

猜你喜歡
門戶門戶網(wǎng)站類別
關隘:要道門戶
一起去圖書館吧
門戶經(jīng)濟構造開放高地——“三個經(jīng)濟”特別報道之三
簡析基于概率預測的網(wǎng)絡數(shù)學模型建構
YouTube
中小型高校圖書館門戶的設計與實現(xiàn)——以吉林師范大學圖書館門戶為例
中國省級教育門戶網(wǎng)站排行榜等
選相紙 打照片
3G門戶宣布YY搜索策略
中國省級教育門戶網(wǎng)站排行榜等
平江县| 金阳县| 交城县| 连云港市| 太和县| 准格尔旗| 深泽县| 惠来县| 邳州市| 金堂县| 承德县| 武宁县| 石嘴山市| 团风县| 保山市| 永年县| 平山县| 乌海市| 马关县| 舟曲县| 盐源县| 衡阳县| 安福县| 调兵山市| 晋州市| 阳山县| 马鞍山市| 柳林县| 麟游县| 彭泽县| 墨脱县| 新昌县| 宾阳县| 南投市| 虞城县| 宜良县| 旅游| 尚义县| 东乌珠穆沁旗| 宜章县| 灌云县|