国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多級圖的推薦系統(tǒng)框架研究

2017-11-20 09:41:45畢建軍
移動信息 2017年7期
關(guān)鍵詞:框架聚類樣本

董 暢 關(guān) 勝 畢建軍

大連東軟信息學(xué)院,遼寧 大連 116000

基于多級圖的推薦系統(tǒng)框架研究

董 暢 關(guān) 勝 畢建軍

大連東軟信息學(xué)院,遼寧 大連 116000

通過研究基于多級圖的多級模糊聚類算法,運(yùn)用模糊聚類的結(jié)果構(gòu)建多級圖個體集,以傳統(tǒng)搜索引擎的推薦系統(tǒng)為基礎(chǔ),融合、優(yōu)化多種推薦算法,建立一個更加智慧、高效并且具備自主學(xué)習(xí)能力的推薦系統(tǒng)的框架。將復(fù)雜網(wǎng)絡(luò)圖的描述理論和基于模糊聚類的多級圖劃分理論相結(jié)合,來解決問題的匹配和有價值信息的存儲、整理、分析上的相關(guān)問題。通過與知識庫中已有答案進(jìn)行匹配,為用戶提供準(zhǔn)確答案,并將所有應(yīng)答記錄作為知識進(jìn)行管理。通過不斷更新知識庫,使該推薦系統(tǒng)具備自主學(xué)習(xí)和自適應(yīng)能力,使推薦體系更為完整和精確。

推薦系統(tǒng);多級圖;模糊聚類

引言

隨著信息技術(shù)和互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,簡單的信息分類已經(jīng)不能夠滿足人們從諸多信息中準(zhǔn)確、快速找到有用信息的愿景。人們于是提出“信息找人”的思想,搜索平臺由此誕生。傳統(tǒng)的搜索引擎技術(shù)沒有考慮到用戶的特征,將所有的用戶等同處理,對不同用戶的搜索信息返回同樣的資源序列,且反饋信息量十分巨大,不能從根本上幫助用戶從諸多信息中找到自己需要的信息。為解決信息超載問題,推薦系統(tǒng)應(yīng)運(yùn)而生。

推薦系統(tǒng)利用用戶的一些行為和興趣特征,通過一些數(shù)學(xué)算法,推測出用戶可能喜歡的東西或從互聯(lián)網(wǎng)海量的信息中挖掘用戶可能感興趣的資源,從而為用戶做出推薦。從本質(zhì)上來講,推薦系統(tǒng)是自動聯(lián)系用戶和信息的一種工具,它能夠在信息過載的環(huán)境中幫助用戶發(fā)現(xiàn)令他們感興趣的信息,也能將信息推送給感興趣的用戶。然而,現(xiàn)有的推薦方法都存在一定問題與局限性。為改善這種現(xiàn)狀,本研究希望建立一個更加智慧、簡明和高效的推薦系統(tǒng)。因此,本文融合多種推薦算法,在基于多級模糊聚類的推薦系統(tǒng)的框架研究上首創(chuàng)地加入了多級圖的思想,使推薦體系更為完整和精確[1]。

1 研究方法

一般來說,一個推薦體系的優(yōu)劣,即其準(zhǔn)確度與高效性等性能指標(biāo)與該推薦系統(tǒng)所使用的算法和基礎(chǔ)數(shù)據(jù)量之間的聯(lián)系十分緊密。一個科學(xué)、靈活的算法或算法組合可以對數(shù)據(jù)進(jìn)行有效整合,將整個系統(tǒng)化繁為簡,使系統(tǒng)變得更加高效和智能。智能推薦就是建立在海量數(shù)據(jù)挖掘基礎(chǔ)上的一種高級智能平臺,大量且有效的基礎(chǔ)數(shù)據(jù)可以保證推薦體系的合理性與科學(xué)性,確保算法的精確程度[2]。推薦系統(tǒng)依托龐大數(shù)據(jù)量擴(kuò)大信息覆蓋面積,來減少系統(tǒng)的知識盲點。同時,推薦體系可以通過自主學(xué)習(xí)不斷提高自身的精確度,保證推薦系統(tǒng)的工作效果。

1.1 多級圖在推薦系統(tǒng)框架研究中的應(yīng)用

多級圖劃分算法可以將推薦系統(tǒng)劃分為多個層級,使其體系更加層次分明。在每個層級中再分別進(jìn)行調(diào)整和逐層優(yōu)化以獲得更優(yōu)的結(jié)果。傳統(tǒng)的圖劃分算法針對的是靜態(tài)的圖,因此,傳統(tǒng)的圖劃分算法并不能適用于復(fù)雜的動態(tài)網(wǎng)絡(luò)。為突破傳統(tǒng)圖劃分算法的局限性,本研究將基于數(shù)據(jù)庫的推薦算法和多級圖劃分算法相結(jié)合,提出一種通用的推薦系統(tǒng)框架,并按照用戶層、數(shù)據(jù)層和應(yīng)用層三個層級介紹了該框架的主要模塊。三個層級之間互相聯(lián)系且結(jié)構(gòu)獨(dú)立,可以根據(jù)算法靈活調(diào)整。同時,針對每一層級中的圖進(jìn)行圖的初始劃分,以減少數(shù)據(jù)的復(fù)雜性,構(gòu)建圖的多級層次。對原始數(shù)據(jù)進(jìn)行聚類成圖處理,即根據(jù)選定的閾值把數(shù)據(jù)逐層進(jìn)行迭代的過程,并選取閾值附近的點進(jìn)行調(diào)整和優(yōu)化[3]。

1.2 模糊聚類在推薦系統(tǒng)框架研究中的應(yīng)用

用模糊數(shù)學(xué)的方法確定樣本之間的模糊關(guān)系定量,從而客觀且準(zhǔn)確地進(jìn)行聚類。聚類就是將數(shù)據(jù)集分成多個類或簇,使各個類之間的數(shù)據(jù)差別盡可能大,類內(nèi)之間的數(shù)據(jù)差別盡可能小,即為“最小化類間相似性,最大化類內(nèi)相似性”原則。根據(jù)層次聚類使用的是自底向上的原則還是自上向下的原則,我們可以把層次聚類分為凝聚的層次聚類和分裂的層次聚類。借鑒于凝聚型層次聚類,本文所提的算法一開始把每一個對象都看成一個單獨(dú)的類,然后迭代中進(jìn)行類的合并,把簇間距離小于距離閾值的類進(jìn)行合并,直到滿足評估函數(shù)局部最小的條件為止,這種方法能夠快速地并對發(fā)現(xiàn)高度聚集的數(shù)據(jù)區(qū)域,并對高密度區(qū)域進(jìn)一步進(jìn)行分析與合并,通過評估函數(shù)的評估實現(xiàn)對傳統(tǒng)的模糊聚類算法的改進(jìn)[4]。

研究步驟如下:

(1)計算樣本或變量間的相似系數(shù),建立模糊相似矩陣。

(2)利用模糊運(yùn)算對相似矩陣進(jìn)行一系列的合成改造,生成模糊等價矩陣。

(3)最后根據(jù)不同的截取水平λ對模糊等價矩陣進(jìn)行截取分類。

1.3 基于多級圖的推薦系統(tǒng)框架研究

本研究將復(fù)雜網(wǎng)絡(luò)圖的描述理論和基于模糊聚類的多級圖劃分理論相結(jié)合,提出了自下向上的多級劃分算法框架,并利用自下向上的策略降低儲存開銷,合理縮并以減小多級圖劃分問題的規(guī)模,則可以構(gòu)建一個較為高效和智慧的推薦系統(tǒng)[5]。

基于多級圖的推薦系統(tǒng)框架主要分為用戶層、數(shù)據(jù)層和應(yīng)用層三個模塊。

用戶層是面對用戶的開放性模塊,用戶通過用戶層模塊輸入查詢的關(guān)鍵信息,推薦系統(tǒng)通過此模塊獲取查詢信息并將推薦信息返回給用戶[6]。因此,用戶層是連接用戶和推薦系統(tǒng)的接口。

數(shù)據(jù)層包含著系統(tǒng)初始化階段管理員添加的所有“問題—答案對”的集合,以及曾經(jīng)使用過該系統(tǒng)的用戶瀏覽過的“問題—答案對”,同時也保留著每個用戶的基礎(chǔ)信息和瀏覽歷史生成用戶的行為日志。數(shù)據(jù)層由初始劃分和優(yōu)化劃分兩個階段組合而成。分別對應(yīng)問題集和答案集、問題關(guān)鍵信息集和答案關(guān)鍵信息集兩個層次。初始劃分對原始數(shù)據(jù)進(jìn)行問題集和答案集的劃分主要是為了更加快速、準(zhǔn)確地定位到用戶需要的信息并將其推薦給用戶[7]。

應(yīng)用層經(jīng)過數(shù)據(jù)統(tǒng)計與數(shù)據(jù)挖掘,進(jìn)行面向用戶的疑問特征分析、面向問題的問題分布分析,以及基于時間的問題變化趨勢分析,用來獲取對于客戶有價值的信息?;诙嗉増D的推薦系統(tǒng)框架如圖1所示。

研究步驟如下:

(1)選取適量的樣本數(shù)據(jù),找出其中的相似性或無關(guān)性,形成相應(yīng)的層次。層次類別根據(jù)層次的增多相應(yīng)減少,但具有包含關(guān)系。

圖1 基于多級圖的推薦系統(tǒng)框架

(2)用模糊數(shù)學(xué)的方法確定樣本之間的模糊關(guān)系定量,從而客觀且準(zhǔn)確地進(jìn)行聚類。

(3)計算樣本或變量間的相似系數(shù),建立模糊相似矩陣。

(4)確定所要選取的信息,找出其中的關(guān)鍵詞,選取其所在的類別對應(yīng)的矩陣,減少無關(guān)樣本的干擾,提取核心,進(jìn)行篩選。

(5)在此矩陣中進(jìn)一步選取所要找的關(guān)鍵核心,進(jìn)一步進(jìn)行篩選。

(6)在所有的樣本中運(yùn)用此種方法,進(jìn)行一層一層篩選,找到自己所要的內(nèi)容。

2 研究結(jié)果與討論

基于多級圖的模糊聚類算法是根據(jù)模糊聚類算法而得來的,能夠?qū)颖緮?shù)據(jù)進(jìn)行更加準(zhǔn)確的聚類分析,打破傳統(tǒng)聚類非此即彼的性質(zhì),運(yùn)用層次分析的方法,讓每個層次進(jìn)行聚類,因此每一層甚至每一類的內(nèi)容都可能具有相互包含的關(guān)系。選取每一類的相似系數(shù),建立模糊相似矩陣,從而提取樣本的核心。分析每一層,進(jìn)一步提取樣本,減少相應(yīng)的干擾,直至最終確定所選取的內(nèi)容[8]。

基于多級圖的模糊聚類算法相較于其他算法的優(yōu)點在于其多級結(jié)構(gòu)的實用性與高效性。其結(jié)構(gòu)可以更加方便、快捷地存儲信息,降低了系統(tǒng)每次檢索知識庫的時間復(fù)雜度?;诙嗉増D的模糊聚類可以運(yùn)用到生活中應(yīng)用的各個地方,進(jìn)行相似的基礎(chǔ)聚類,相應(yīng)地提取樣本,然后分為對應(yīng)層次,使結(jié)果更加清晰,繼而提高使用價值。

3 結(jié)語

為克服傳統(tǒng)推薦算法的局限性,提出了基于多級圖劃分的模糊聚類推薦算法。該算法在對系統(tǒng)中存在的產(chǎn)品使用多級圖劃分算法進(jìn)行聚類的基礎(chǔ)上應(yīng)用協(xié)同過濾推薦算法對用戶進(jìn)行推薦。實驗結(jié)果證明:該算法可以在對推薦準(zhǔn)確率影響較小的同時,有效地提高推薦系統(tǒng)的效率。

[1]商楊.基于MapReduce的可擴(kuò)展協(xié)同過濾算法的研究[D].大連:大連海事大學(xué),2015.

[2]梁潔.基于混合模式的個性化推薦系統(tǒng)的研究與應(yīng)用[D].武漢:武漢理工大學(xué),2011.

[3]孔維梁.協(xié)同過濾推薦系統(tǒng)關(guān)鍵問題研究[D].武漢:華中師范大學(xué),2013.

[4]劉劍波.基于協(xié)同過濾和行為分析的微博推薦系統(tǒng)[D].南京:南京理工大學(xué),2014.

[5]李祉瑩.基于語義的個性化推薦模型研究[D].北京:北京郵電大學(xué),2015.

[6]李翠平,藍(lán)夢微,鄒本友,王紹卿,趙衎衎. 大數(shù)據(jù)與推薦系統(tǒng)[J]. 大數(shù)據(jù),2015(3):23-35.

[7]鄧鈺亮.基于多元統(tǒng)計的電子商務(wù)性能分析算法框架研究[D].上海:復(fù)旦大學(xué),2008.

[8]董文遠(yuǎn).基于混合過濾的推薦系統(tǒng)開發(fā)研究[D].長春:吉林大學(xué),2011.

Research on Recommender System Framework Based on Multi-Level Graph

Dong Chang Guan Sheng Bi Jianjun
Dalian Neusoft Information Institute, Liaoning Dalian 116000

Through the study of fuzzy clustering algorithm based on multi-level graph, constructing multi-level graph individual set by fuzzy clustering results, the recommendation system of traditional search engine based on the integration and optimization of multiple recommendation algorithm, establish a more efficient and have the wisdom,ability of autonomous learning recommendation system framework. This paper combines the description theory of complex network graph with the multi-level graph partitioning theory based on fuzzy clustering to solve the problem of matching and the storage, collation and analysis of valuable information. By matching the existing answers in the knowledge base, we can provide accurate answers for users, and manage all response records as knowledge. By constantly updating the knowledge base, the recommendation system has the ability of autonomous learning and self-adaptation, so that the recommendation system is more complete and accurate.

recommender system; multi-level graph; fuzzy clustering

TP391.4;TP393.0

A

1009-6434(2017)7-0084-03

猜你喜歡
框架聚類樣本
框架
用樣本估計總體復(fù)習(xí)點撥
廣義框架的不相交性
推動醫(yī)改的“直銷樣本”
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
WTO框架下
法大研究生(2017年1期)2017-04-10 08:55:06
隨機(jī)微分方程的樣本Lyapunov二次型估計
村企共贏的樣本
基于改進(jìn)的遺傳算法的模糊聚類算法
一種基于OpenStack的云應(yīng)用開發(fā)框架
舞钢市| 苏尼特左旗| 方正县| 仙游县| 巢湖市| 延边| 噶尔县| 湘潭县| 吴忠市| 桓台县| 景宁| 芮城县| 胶南市| 龙州县| 壶关县| 武川县| 榆树市| 襄汾县| 顺义区| 新巴尔虎左旗| 鄂州市| 南昌市| 乌什县| 越西县| 邻水| 鄂托克旗| 石景山区| 砚山县| 辽源市| 百色市| 离岛区| 普定县| 恭城| 和林格尔县| 唐海县| 吉安市| 乌恰县| 克什克腾旗| 政和县| 通州市| 古交市|