国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Apriori改進算法及行為分析的旅游景區(qū)推薦系統(tǒng)

2022-09-02 01:41侯寶鎖
長春大學學報 2022年4期
關鍵詞:權(quán)值關聯(lián)景區(qū)

侯寶鎖

(浙江旅游職業(yè)學院 后勤服務處,杭州 311231)

隨著社會經(jīng)濟的發(fā)展,旅游產(chǎn)品不斷豐富,且在互聯(lián)網(wǎng)這一時代背景下,將線下旅游產(chǎn)品發(fā)展為線上和線下相結(jié)合的旅游產(chǎn)品,相較之前單純的線下旅游產(chǎn)品,具有產(chǎn)品豐富、服務廣泛、溝通高效等優(yōu)點[1]。然而,豐富的旅游產(chǎn)品和活動,卻也讓用戶無從選擇,為此,研究旅游景區(qū)推薦系統(tǒng)可以為用戶提供更加人性化的旅游服務[2]。

目前,旅游市場研究出了途牛旅游網(wǎng)、基于情境感知的推薦系統(tǒng)、Web和移動端、混合推薦算法等旅游推薦技術(shù),為用戶制定個性化旅游產(chǎn)品并推薦[3]。文獻[4]通過爬蟲軟件和Jieba分詞獲取用戶在線評論信息,并對其感情強度進行評價賦權(quán),使用Topsis排序為用戶推薦旅游景點。文獻[5]將分段用戶群與時間相結(jié)合,建立旅游景點推薦模型,為用戶個性化推薦旅游景點。文獻[6]采用Spark框架設計加權(quán)矩陣分解算法,實現(xiàn)個性化景點推薦系統(tǒng)設計。文獻[7]用混合推薦算法,緩解系統(tǒng)處理用戶數(shù)據(jù)稀疏問題,提高系統(tǒng)推薦質(zhì)量。文獻[8]將融合項目和用戶隱式反饋相結(jié)合,實現(xiàn)個性化推薦系統(tǒng)設計。

上述旅游推薦算法生成景區(qū)推薦列表速度慢且推薦景區(qū)范圍小,難以滿足用戶個性化需求,本研究利用關聯(lián)規(guī)則改進Apriori算法,在分析用戶行為的基礎上設計旅游景區(qū)推薦系統(tǒng)。

1 基于Apriori改進算法及行為分析的旅游景區(qū)推薦系統(tǒng)設計

1.1 系統(tǒng)總體架構(gòu)設計

在目前設計的景區(qū)推薦系統(tǒng)硬件基礎上,采用典型的B/S架構(gòu)將景區(qū)推薦系統(tǒng)架構(gòu)分為應用、業(yè)務邏輯和數(shù)據(jù)3層,所設計的系統(tǒng)架構(gòu)如圖1所示。

圖1 系統(tǒng)架構(gòu)

系統(tǒng)架構(gòu)在系統(tǒng)的業(yè)務邏輯層采用Web服務器接收用戶的推薦請求,并完成相應的推薦邏輯處理,然后以HTML的形式,將處理后的數(shù)據(jù)返回到用戶界面,以供用戶瀏覽景區(qū)推薦數(shù)據(jù),完成用戶推薦請求;數(shù)據(jù)層將兩個數(shù)據(jù)庫服務器相結(jié)合,并與Mysql數(shù)據(jù)存儲板塊相連接,以增加數(shù)據(jù)的處理和存儲能力。業(yè)務邏輯層軟件方面,將其分為數(shù)據(jù)計算和景區(qū)推薦兩部分,采用Apriori改進算法分析用戶行為,得到用戶行為分析結(jié)果,根據(jù)分析結(jié)果,計算旅游景區(qū)詞頻,通過推薦模型為用戶推薦旅游景區(qū)。此外,在Web服務器和用戶網(wǎng)絡之間增加了一個防火墻,用于過濾惡意IP地址請求[9]。

此次設計系統(tǒng)設計的數(shù)據(jù)層,將數(shù)據(jù)庫處理器分為3部分,一個數(shù)據(jù)庫用于處理、提取存儲數(shù)據(jù);另一個數(shù)據(jù)庫用于用戶緩存提取的數(shù)據(jù)庫數(shù)據(jù),以此降低Web服務器訪問數(shù)據(jù)存儲層頻率,提高系統(tǒng)推薦景區(qū)速度。在已有的數(shù)據(jù)庫中選擇Myaql軟件作為此次設計系統(tǒng)的數(shù)據(jù)庫,其中存儲了百科、景點文本和poi等數(shù)據(jù),以此支持系統(tǒng)詞頻計算。

應用層主要為系統(tǒng)提供訪問接口,用戶可以采用電腦、PC、手機、ipad等智能終端訪問系統(tǒng),選擇系統(tǒng)應用層不同模塊瀏覽系統(tǒng)內(nèi)容,獲取自身需求的景區(qū)推薦信息[10]。

系統(tǒng)管理終端中包含系統(tǒng)維護、管理、檢修等系統(tǒng)控制功能,如系統(tǒng)推薦、查詢等規(guī)則更新、調(diào)整、用戶信息增添、刪除等功能。

1.2 構(gòu)建用戶行為特征文件

由于旅游景區(qū)的環(huán)境、天氣、開放程度等都存在諸多不確定性,且用戶在選擇旅游景區(qū)時,會受到天氣、時間、同伴等因素影響而發(fā)生變化。因此,系統(tǒng)需要根據(jù)用戶對相關旅游數(shù)據(jù)的瀏覽時長、關鍵詞篩選、標簽等數(shù)據(jù)定義用戶行為。但是,在定義過程中會受數(shù)據(jù)時間界限影響,一旦定義的用戶行為超過規(guī)定時間,其原本定義的用戶行為將不能作為推薦旅游景區(qū)行為標識。

基于此,從系統(tǒng)應用層中抽取的注冊信息和表現(xiàn)、情境和虛擬行為、交易記錄等用戶行為進行分組,整理用戶行為標簽,根據(jù)標簽的多少、頁面瀏覽時長、標簽時間生成等分組排序。其具體過程如下:

步驟1:將分組后的用戶行為文件記為文本文件e,其標準配置文件類型為fconf;

步驟2:根據(jù)fconf初始化文本文件e;

步驟3:按照文件大小排列,存儲一個用戶行為關聯(lián)操作組q;

步驟4:循環(huán)步驟3,當?shù)竭_“!”時即結(jié)束文件存儲循環(huán),其中,“!”表示文本文件e循環(huán)結(jié)束符;

步驟5:讀取文件e中的一行信息,判斷信息中標識符u的定義。若u表示用戶標識符,按照先后順序?qū)中的元素存儲到r中,同時清空q中的元素;若標識符u表示景區(qū)項目,按照先后順序?qū)中的元素存儲到r中;若標識符u表示用戶行為,重置用戶“篩選條件”,清空q中的元素;

步驟6:循環(huán)步驟5,對比標識符u中的元素與關聯(lián)操作組q中的元素;

步驟7:判斷關聯(lián)操作組q中的元素是否包含標識符u中的元素,若包含標識符u中的元素,標注關聯(lián)操作組q中的行為類型;若不包含標識符u中的元素,將該元素添加在關聯(lián)操作組q的列隊末尾;

步驟8:輸出用戶行為序列。

根據(jù)上述8個步驟生成的用戶行為序列,以用戶為單位建立用戶行為模板g,記錄用戶行為序列和旅游景區(qū)之間的關聯(lián),形成用戶行為特征文件。為此,將用戶行為作為原始數(shù)據(jù)序列根據(jù)用戶行為種類V,構(gòu)建V維用戶行為特征文件O,則有:

O={(h1,s1),…,(hv,sv),…,(hV,sV)}

(1)

式(1)中,hi表示用戶行為模板g中第v個用戶行為;sv表示行為模板中出現(xiàn)hi的次數(shù)[11]。依據(jù)式(1)所示的用戶行為特征文件,采用關聯(lián)規(guī)則方法改進Apriori算法為用戶行為賦權(quán),建立用戶行為分析模型,生成推薦旅游景區(qū)集合,為用戶推薦心儀的旅游景區(qū)。

1.3 基于Apriori改進算法建立景區(qū)推薦模型

1.3.1 用戶行為賦權(quán)

根據(jù)式(1)所示的用戶行為特征文件,賦予用戶行為重要程度權(quán)重,將定性問題轉(zhuǎn)化為定量問題?;诖?,將用戶行為劃分為水平、垂直和復合3個層次,利用關聯(lián)規(guī)則算法計算用戶行為關聯(lián)加權(quán)。

將系統(tǒng)中存儲的用戶注冊信息和表現(xiàn)記為用戶行為關聯(lián)水平加權(quán),假設旅游服務產(chǎn)品項目特征集合為B={b1,…,bi,…,bk},其中,k表示旅游服務產(chǎn)品項目數(shù)量,bi表示第i個旅游服務產(chǎn)品項目。為bi賦權(quán),將其權(quán)值記為wi,則wi具有0≤wi≤1,i=1,2,…,k性質(zhì),則有:

w1=ω(B)z1(B)=max{w1,…,wi,…,wk}z1(B) ,

(2)

式(2)中,w1表示用戶行為關聯(lián)水平加權(quán)支持度;ω(B)表示B的加權(quán)值;z1(B)表示B的支持度;{w1,…,wi,…,wk}表示B中每一項的權(quán)值[12]。

將用戶的情境、虛擬行為等記為用戶行為多源關聯(lián)垂直加權(quán),假設用戶相關事物記錄集合為A={a1,…,aj,…,al},其中,aj表示第j條用戶相關事物記錄,l表示用戶相關事物記錄數(shù)量,為aj賦權(quán),將其權(quán)值記為wj,其具有0≤wj≤1,j=1,2,…,l性質(zhì),則有:

(3)

式(3)中,w2表示用戶行為多元關聯(lián)垂直加權(quán)支持度;∑wj(a′)表示用戶相關事物記錄中與a′行為相關的權(quán)值和,其中,a′代表情境、虛擬個體和虛擬行為關聯(lián)等行為中的任意一種;∑wj(A)表示用戶相關事物記錄的加權(quán)值[13]。

將B和A相結(jié)合產(chǎn)生的用戶交易記錄行為記為復合關聯(lián)加權(quán),即在水平權(quán)值wi的基礎上,還具有垂直權(quán)值wj,且同時具有兩個權(quán)值的性質(zhì),則有:

(4)

式(4)中,z(A,B)表示A,B的支持度;z1(wi)表示wi的支持度;z1(wj)表示wj的支持度[14]。綜合上述3個公式為用戶行為關聯(lián)賦予的權(quán)值,建立用戶行為分析模型。

1.3.2 建立用戶行為分析模型

假設系統(tǒng)應用層存在n個界面訪問事務和m個指標,用戶在瀏覽系統(tǒng)應用層時,可以生成初始行為矩陣ψn*m。與此同時,將上述3個公式計算得到的用戶行為權(quán)值按照降序順序排列,若B中的第i項bi出現(xiàn)在A中的第j項aj中,則ψn*m=1,反之,ψn*m=0。

采用改進后的Apriori算法,計算用戶行為項目最低支持數(shù)zmin(A,B):

(5)

邏輯運算A和B,即A^B=ψ2,其中,^表示邏輯運算符號,ψ2表示^運算生成的新矩陣。比較ψ1的最低支持數(shù)和ψ2的最低支持數(shù),生成加權(quán)頻繁2推薦景區(qū)項集。連續(xù)運算A^B,得到候選l推薦景區(qū)項集的支持數(shù),并將其與zmin(A,B)對比,得到加權(quán)頻繁l項集。此時,生成的加權(quán)頻繁l項集,即根據(jù)用戶行為向用戶推薦的旅游景區(qū)集合。

2 系統(tǒng)測試

選擇基于Spark的推薦系統(tǒng)[6]和基于深度學習的推薦系統(tǒng)[7]作為此次實驗對比系統(tǒng),采用8核2.40 GHz的CPU、128 GB的內(nèi)存、12 TB的硬盤、千兆網(wǎng)卡、Centos6.0版本的操作系統(tǒng)等硬件搭建3個配置一樣的推薦系統(tǒng),通過RMSE、準確率、召回率、覆蓋率4個指標,以及系統(tǒng)推薦離線計算和在線計算耗時測試,驗證此次設計基于Apriori改進算法及行為分析的旅游景區(qū)推薦系統(tǒng)的運行性能。

2.1 實驗設計

此次實驗將系統(tǒng)性能測試分為計算速度和指標評測兩部分,在此次實驗準備的系統(tǒng)推薦測試數(shù)據(jù)集中,對比測試3組系統(tǒng)運行性能。此次實驗準備的系統(tǒng)推薦測試數(shù)據(jù)集中,包含了用戶、旅游景區(qū)、用戶評分3類信息,其數(shù)量分別為10 000、3 000和2 000 000。所選擇的數(shù)據(jù)集中,每位用戶都至少瀏覽過10個旅游景區(qū)。

2.1.1 速度計算設計

推薦系統(tǒng)計算速度快慢體現(xiàn)在用戶在某個具體頁面停留時長,直接影響用戶體驗效果,其停留時間越長用戶體驗效果越差?;诖?,根據(jù)系統(tǒng)推薦引擎,將系統(tǒng)推薦引擎運行前后時間差作為系統(tǒng)推薦速度測試指標,其計算公式如式(6)所示:

Δt=t2-t1

(6)

式(6)中,Δt表示系統(tǒng)推薦引擎運行前后時間差;t2表示系統(tǒng)引擎計算前系統(tǒng)運行時間;t1表示系統(tǒng)引擎計算后運行時間。如式(6)所示的系統(tǒng)推薦速度計算公式,Δt值越小,用戶體驗效果越優(yōu),系統(tǒng)推薦性能越好。

2.1.2 指標評測設計

將此次實驗選擇的數(shù)據(jù)集中2 000 000的用戶評分信息按照6∶4的比例,分為訓練數(shù)據(jù)集和測試數(shù)據(jù)集兩部分。在測試系統(tǒng)推薦性能時,需要對系統(tǒng)性能進行全方面評測,為此,選擇RMSE、準確率、召回率、覆蓋率4個指標判斷系統(tǒng)推薦性能,其計算公式如下:

(7)

如式(7)所示,準確率、召回率和覆蓋率指標值越高,系統(tǒng)推薦的旅游景區(qū)范圍越廣,越符合用戶需求。RMSE評價指標用于度量系統(tǒng)對用戶行為賦權(quán)結(jié)果,其值越小,用戶行為誤差越小。上述4個指標計算數(shù)據(jù),其用戶信息和產(chǎn)品信息均從此次實驗選擇的數(shù)據(jù)集中獲取。

2.2 系統(tǒng)推薦測評結(jié)果

2.2.1 系統(tǒng)推薦速度計算結(jié)果

根據(jù)式(7)所示的計算公式,計算3組系統(tǒng)推薦旅游景區(qū)在線和離線計算時間,其計算結(jié)果如圖2所示。從圖2可以看出,系統(tǒng)離線計算速度明顯較在線計算速度快。其中,設計系統(tǒng)較基于Spark的推薦系統(tǒng)和基于深度學習的推薦系統(tǒng)離線計算速度分別快0.42 s、1.8 s,3組系統(tǒng)離線計算速度相差較小;在線計算速度分別快46.9 s、114.16 s,3組系統(tǒng)在線計算速度相差極大。由此可見,此設計系統(tǒng)具有較快的推薦速度,用戶所需等待時間短。

圖2 系統(tǒng)推薦旅游景區(qū)在線和離線計算時間

2.2.2 系統(tǒng)評測指標測試結(jié)果

根據(jù)式(7)所示的計算公式,計算3組系統(tǒng)推薦旅游景區(qū)評測指標,其計算結(jié)果如圖3所示。

圖3 系統(tǒng)推薦旅游景區(qū)評測指標計算結(jié)果

從圖3中可以看出,此次設計系統(tǒng)的RMSE指標相較基于Spark的推薦系統(tǒng)和基于深度學習的推薦系統(tǒng)分別小0.07和0.1,準確率、召回率和覆蓋率分別高0.133 8和0.216 2、0.099 2和0.138 5、0.457 7和0.323 5。由此可見,此次設計系統(tǒng)4個指標值均處于最優(yōu)值。

綜合上述兩組實驗結(jié)果可知,本設計系統(tǒng)生成旅游景區(qū)推薦列表速度快,且推薦范圍相對較廣,更加符合用戶需求。

3 結(jié)語

系統(tǒng)采用Apriori改進算法賦予用戶行為特征權(quán)重,以此確定用戶對旅游景區(qū)的需求,從而生成滿足用戶需求的旅游景區(qū)推薦列表;經(jīng)驗證,系統(tǒng)提高了旅游景區(qū)推薦速度、范圍和正確率。但是系統(tǒng)并未考慮推薦資源調(diào)配方法,處理用戶行為數(shù)據(jù)方面稍顯不足。因此,在今后的研究中,還需深入研究推薦資源調(diào)配方法,進一步提高系統(tǒng)對用戶行為數(shù)據(jù)處理能力。

猜你喜歡
權(quán)值關聯(lián)景區(qū)
云南發(fā)布一批公示 10家景區(qū)擬確定為國家4A級旅游景區(qū)
『摘牌』
“摘牌”
“一帶一路”遞進,關聯(lián)民生更緊
某景區(qū)留念
奇趣搭配
智趣
財務風險跟蹤評價方法初探
基于洪泛查詢的最短路徑算法在智能交通系統(tǒng)中的應用
試論棋例裁決難點——無關聯(lián)①
东明县| 苗栗县| 泊头市| 黄梅县| 连江县| 永靖县| 竹溪县| 任丘市| 神农架林区| 山阴县| 苍山县| 天全县| 华坪县| 藁城市| 东乌珠穆沁旗| 道孚县| 崇州市| 来宾市| 湄潭县| 淮滨县| 温州市| 浙江省| 象州县| 邹城市| 长葛市| 沛县| 岳普湖县| 科尔| 平度市| 罗城| 绵阳市| 沈阳市| 砚山县| 枣强县| 保靖县| 和田市| 丹东市| 宜黄县| 师宗县| 中宁县| 牟定县|