国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于卷積神經(jīng)網(wǎng)絡(luò)的協(xié)同過濾算法在影片推薦中的應(yīng)用研究

2022-08-31 22:53:51張海飛崔軍納葛金鼎
電腦知識(shí)與技術(shù) 2022年17期
關(guān)鍵詞:協(xié)同過濾卷積神經(jīng)網(wǎng)絡(luò)

張海飛 崔軍納 葛金鼎

摘要:文章運(yùn)用深度學(xué)習(xí)算法中的卷積神經(jīng)網(wǎng)絡(luò),利用MovieLens數(shù)據(jù)集,實(shí)現(xiàn)了基于協(xié)同過濾的影片推薦系統(tǒng)。系統(tǒng)運(yùn)行表明,該方法實(shí)現(xiàn)的推薦系統(tǒng)可以有效緩解“冷啟動(dòng)”問題。

關(guān)鍵詞:影片推薦;協(xié)同過濾;卷積神經(jīng)網(wǎng)絡(luò)

中圖分類號:TP18? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A

文章編號:1009-3044(2022)17-0073-05

1簡介

推薦系統(tǒng)[1]已經(jīng)成功應(yīng)用到商品推薦中,并逐步滲透到了文化領(lǐng)域,豐富了人們的文化生活。在推薦系統(tǒng)還未萌發(fā)的時(shí)候,用戶使用傳統(tǒng)的搜索引擎,在獲取數(shù)據(jù)時(shí),如果需求很明確,比如需要找一個(gè)電影,但是用戶只知道這個(gè)電影的名稱或?qū)а莸刃畔?,搜索出的信息很片面。傳統(tǒng)的搜索引擎的弊端暴露了:當(dāng)用戶自己也不清楚自己需要尋找的信息的具體內(nèi)容,搜索得到的結(jié)果可能和用戶想要的結(jié)果相差很大,用戶獲得的體驗(yàn)較差[2]。在推薦系統(tǒng)誕生之后,系統(tǒng)開發(fā)人員對獲取的數(shù)據(jù)進(jìn)行研究,這些數(shù)據(jù)的共同點(diǎn)指向特定的一類群體,數(shù)據(jù)的不同點(diǎn)指向每一個(gè)用戶,通過合適的推薦算法,生成相應(yīng)的推薦列表,會(huì)更加契合用戶的需求。本文運(yùn)用卷積神經(jīng)網(wǎng)絡(luò),基于MovieLens數(shù)據(jù)集,設(shè)計(jì)并實(shí)現(xiàn)了基于協(xié)同過濾的影片推薦系統(tǒng),以滿足人民日益增長的文化娛樂需求。

2相關(guān)工作

協(xié)同過濾(Collaborative Filtering,CF)[3]和推薦系統(tǒng)的概念最早在20世紀(jì)90年代被提出,國內(nèi)外的推薦系統(tǒng)迅速發(fā)張,但是這時(shí)候的系統(tǒng)并不具備為用戶生成推薦列表的能力,必須通過復(fù)雜的數(shù)據(jù)庫查詢語句構(gòu)造推薦列表推送給用戶。不久,第一個(gè)能夠完成自主推薦的新聞系統(tǒng)GroupLens[4]誕生了。1997年,推薦系統(tǒng)(Recommender System,RS)一詞被Resnick等人提及。自此,推薦系統(tǒng)逐漸走入正軌,被世人廣泛應(yīng)用,也逐步成為較為熱門的研究領(lǐng)域,各式各樣的推薦算法,不同分類的模型,陸續(xù)來到了人們的視野中。經(jīng)常沉淀,目前主流的算法涉及以下各個(gè)方面:

基于內(nèi)容的推薦算法[5]的本質(zhì)是提取用戶的歷史記錄,依據(jù)用戶頻繁瀏覽過并且喜歡的內(nèi)容,生成推薦列表,向用戶推薦與商品信息較為相似的內(nèi)容[6]。

協(xié)同過濾算法的基本方式就是對于數(shù)據(jù)的挖掘、對歷史數(shù)據(jù)的分析和用戶的偏好的分析得出的結(jié)論,找尋到用戶的存在和相同興趣的用戶群,然后根據(jù)預(yù)測用戶可能存在的喜歡的電影序列進(jìn)行推送,以和用戶同類型的受眾群里喜歡的電影推薦列表為基礎(chǔ)進(jìn)行的推薦模式,因而這個(gè)算法存在的冷啟動(dòng)[7-8]問題,不能夠?yàn)樾碌挠脩籼峁┯行У耐扑]信息。而基于項(xiàng)目的協(xié)同過濾算法是在設(shè)計(jì)和用戶的喜好推薦上進(jìn)行類似商品的推薦模式,根據(jù)其計(jì)算的本質(zhì)進(jìn)行相關(guān)相似度的推薦方法,生成相似度較高的矩陣方式,來為廣大的用戶群體推薦電影。鄧明通等[9]通過對用戶偏好多樣性的計(jì)算來實(shí)現(xiàn)推薦,有效地緩解了冷啟動(dòng)問題,提高了推薦信息的多樣性。

3相關(guān)算法和模型

3.1協(xié)同過濾算法

協(xié)同過濾算法是推薦系統(tǒng)常用的算法。自提出以來引起了各大學(xué)術(shù)領(lǐng)域包括行為科學(xué)、管理科學(xué)和計(jì)算數(shù)學(xué)等領(lǐng)域的廣泛關(guān)注,越來越多的專家學(xué)者參與到算法的研究[10]中,同時(shí)大型的互聯(lián)網(wǎng)網(wǎng)站如:YouTube、Facebook 等公司都使用深度學(xué)習(xí)[11]對協(xié)同過濾算法進(jìn)行相關(guān)的設(shè)計(jì)研究,進(jìn)行成功的引用,豐富自己的信息網(wǎng)站。傳統(tǒng)的協(xié)同過濾算法可以細(xì)分為以下兩個(gè)方面:

1)基于用戶的協(xié)同過濾算法

這個(gè)算法的原理是先確定所有的用戶群體,再根據(jù)目標(biāo)群體,從所有的用戶群體中尋找與之相似的用戶群體,根據(jù)用戶群體里的喜好項(xiàng)目逐一遍歷展示給目標(biāo)用戶。要實(shí)現(xiàn)推薦主要通過這個(gè)算法的以下三個(gè)步驟:

①通過收集的用戶信息的分析,生成一個(gè)評分矩陣,其中包括用戶ID、項(xiàng)目ID、評分這三個(gè)部門。

②利用評分矩陣,計(jì)算用戶的相似性矩陣。

③為目標(biāo)用戶推薦項(xiàng)目,主要是依據(jù)與目標(biāo)用戶最相近的用戶群所喜歡的項(xiàng)目。

比如在一個(gè)電影推薦系統(tǒng)當(dāng)中,通過對用戶的歷史記錄來分析數(shù)據(jù)樣本進(jìn)行推薦,用戶a對ABC電影給予了高分平均,用戶b對CDE給予了高分評價(jià),用戶c對ACF給予了高分評價(jià),電影推薦系統(tǒng)能根據(jù)用戶對于數(shù)據(jù)的相似性來判斷分析,得出了用戶a與用戶c的性格喜愛方式類型,最終給用戶a推薦電影F。

2)基于項(xiàng)目的協(xié)同過濾算法

這個(gè)算法的原理在用戶群體中尋找目標(biāo)用戶消費(fèi)過的產(chǎn)品,將這些產(chǎn)品遍歷給用戶群體?;陧?xiàng)目的協(xié)同過濾算法分以下三步進(jìn)行推薦:

①根據(jù)整理的信息,生成包含用戶ID、項(xiàng)目ID和評分三部分的特征矩陣。

②根據(jù)包含這三部分信息的特征矩陣,結(jié)合算法生成相似性矩陣。

③逐一遍歷相似性矩陣,根據(jù)需求,適當(dāng)?shù)倪x擇推薦給用戶的內(nèi)容數(shù)量。

再比如,在電影推薦系統(tǒng)當(dāng)中,通過對數(shù)據(jù)樣本的歷史記錄的分析得知a、b、c三個(gè)用戶都對A電影打出來高評價(jià),用戶a、b同時(shí)對B電影打出來高評價(jià),用戶a對C電影打出了高評價(jià),用戶b對D電影有高評價(jià),因此電影AB的相似度就很高,用戶c喜歡A電影,因此根據(jù)系統(tǒng)的判斷把B電影推薦給用戶c。

上述的假設(shè)過程就是常見的協(xié)同過濾算法的級別推薦方式,通過這一方式能夠較快地向用戶推薦相關(guān)電影信息,但是協(xié)同過濾算法存在兩個(gè)缺點(diǎn),對這個(gè)算法的改進(jìn)目前仍然處于探索階段。

1)存在擴(kuò)展性問題,隨著電影數(shù)量和用戶數(shù)量的增加,一定會(huì)影響推薦算法的效率,對于實(shí)時(shí)性效率比較高的商務(wù)網(wǎng)站,基于協(xié)同過濾的推薦系統(tǒng)存在嚴(yán)重的擴(kuò)展性問題。

2)存在冷啟動(dòng)問題,如果有新用戶注冊,沒有相應(yīng)的歷史數(shù)據(jù)對其進(jìn)行分析,導(dǎo)致模型無法找到相似的用戶或商品,也就不能推薦適合的內(nèi)容,其中冷啟動(dòng)問題表示的是在沒有大量數(shù)據(jù)的情況下,如何進(jìn)行有效的推薦。

3.2卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)(CNN)[12]是一種包含了卷積計(jì)算的方法,是深度學(xué)習(xí)算法技術(shù)的代表之一,卷積神經(jīng)網(wǎng)絡(luò)的運(yùn)用方式,可以進(jìn)行監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)進(jìn)行構(gòu)建結(jié)構(gòu),其核心的五層結(jié)構(gòu)為數(shù)據(jù)輸入層、卷積計(jì)算層、激勵(lì)層、池化層和全連接層。

數(shù)據(jù)輸入層主要是對原始數(shù)據(jù)進(jìn)行處理操作,對無用的信息進(jìn)行過濾,有效的信息進(jìn)行有序的排布,對數(shù)據(jù)進(jìn)行去均值、歸一化和PAC降維等處理,通過對數(shù)據(jù)的處理,可以更好地劃分層次結(jié)構(gòu)。

卷積計(jì)算層是卷積神經(jīng)網(wǎng)絡(luò)最為重要的部分,是對前面獲取到的數(shù)據(jù)進(jìn)行計(jì)算處理,拆解的過程,其中較為關(guān)鍵的操作,是對局部關(guān)聯(lián)和窗口滑動(dòng),對其中的深度、步長和填充值進(jìn)行相應(yīng)的獲取,通過對矩陣的映射計(jì)算,得出相應(yīng)的數(shù)值,同時(shí)卷積計(jì)算層還有很高的共享性,能夠把計(jì)算出的相關(guān)數(shù)值,同傳分析,分享到各層當(dāng)中,同時(shí)計(jì)算用戶和電影的信息數(shù)據(jù),計(jì)算矩陣向量可以用來之后的推薦。

激勵(lì)層主要的功能是把卷積計(jì)算層計(jì)算出的相關(guān)數(shù)據(jù),進(jìn)行結(jié)構(gòu)的非線性映射,其主要的特點(diǎn)是能快速地對相關(guān)數(shù)據(jù)進(jìn)行展現(xiàn),梯度求值較為簡單,但其本身數(shù)據(jù)較為脆弱易被更改,不利于長期保存。

池化層就是相對于輸入層存在的層次關(guān)系,因?yàn)檩斎雽虞斎氲臄?shù)據(jù)較為龐大,存儲(chǔ)較為復(fù)雜且占用大量的空間,因此設(shè)計(jì)的池化層就是用來解決這一問題,池化層主要的功能就是進(jìn)行數(shù)據(jù)圖片的壓縮,壓縮相關(guān)數(shù)據(jù)便于存儲(chǔ)。

全連接層其主要功能是在層次間的連接當(dāng)中,通過全連接層進(jìn)行數(shù)據(jù)的快速傳輸,方便進(jìn)行數(shù)據(jù)的傳遞,位于卷積神經(jīng)網(wǎng)絡(luò)隱含層的最后部分,并只向其他全連接層傳遞信號。

通過輸入層進(jìn)行數(shù)據(jù)的讀取,把獲取的數(shù)據(jù)通過輸入層錄入,再通過卷積計(jì)算層進(jìn)行數(shù)據(jù)的計(jì)算,計(jì)算出相應(yīng)的矩陣值,通過激勵(lì)層實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)的非線性映射實(shí)現(xiàn)圖層,再通過池化層把龐大的數(shù)據(jù)進(jìn)行壓縮,實(shí)現(xiàn)數(shù)據(jù)的推薦,上述的層次結(jié)構(gòu)都是通過全連接層實(shí)現(xiàn)的,這便是完整的卷積神經(jīng)網(wǎng)絡(luò)的基本實(shí)現(xiàn)方式。

4 基于卷積神經(jīng)網(wǎng)絡(luò)協(xié)同過濾的影片推薦

4.1數(shù)據(jù)處理

本項(xiàng)目使用MoviesLens數(shù)據(jù)集[13],該數(shù)據(jù)集存儲(chǔ)了電影評分,包含了來自6000名用戶對4000部電影的100萬條評分?jǐn)?shù)據(jù)。

用戶數(shù)據(jù)由五部分組成,主要是用戶ID、性別、年齡、職業(yè)ID和郵編。從圖1可以看出,郵編是地區(qū)的郵政編碼,不是用戶特征字段,不需要使用。用戶數(shù)據(jù)user.dat文件中以“::”連接每個(gè)數(shù)據(jù)。收集的數(shù)據(jù)包含各個(gè)年齡段中各行各業(yè)的人們,年齡段主要分為年齡在18歲以下、年齡在18~24歲之間、年齡在25~34歲之間、年齡在35~44歲之間、年齡在45~49歲之間、年齡在50~55歲之間、年齡在56歲以上,涉及的行業(yè)包含學(xué)術(shù)/教育工作者、藝術(shù)家、文員/行政等二十個(gè)方面的。用戶數(shù)據(jù)預(yù)處理前的數(shù)據(jù)格式如圖1所示。

影片數(shù)據(jù)集中收集到的電影可以分為十六個(gè)類別,由動(dòng)作片、冒險(xiǎn)片、動(dòng)畫片、兒童片等組成,由電影ID、電影名稱和電影風(fēng)格三個(gè)字段組成,數(shù)據(jù)之間的連接方式依然通過“::”連接,影片數(shù)據(jù)預(yù)處理前數(shù)據(jù)如圖2所示。

評分?jǐn)?shù)據(jù)由用戶ID、電影ID、評分、時(shí)間戳四部分組成,評分?jǐn)?shù)據(jù)中數(shù)據(jù)的排序以用戶ID為主,電影ID為輔進(jìn)行排序。評分?jǐn)?shù)據(jù)預(yù)處理后的數(shù)據(jù)如圖3所示。

因?yàn)閿?shù)據(jù)存在差異性,要根據(jù)數(shù)據(jù)的特點(diǎn)進(jìn)行不同的處理:用戶ID、職業(yè)ID和電影ID是不用改變的;性別字段:需要數(shù)據(jù)庫中的F和M字符轉(zhuǎn)換成數(shù)值0和1;年齡字段可以將年齡分為七大類,將七大類分別轉(zhuǎn)成7個(gè)連續(xù)0—6的數(shù)值;電影分類字段,需要轉(zhuǎn)換成數(shù)字,首先組成一個(gè)由電影分類和唯一標(biāo)識(shí)這個(gè)電影分類的數(shù)字的字典,將每部電影的分類字段轉(zhuǎn)換成相應(yīng)的列表,因?yàn)槊坎侩娪翱赡懿恢挂粋€(gè)類別。電影的名稱字段與電影類別做相似處理。電影名稱和電影類別的長度需要統(tǒng)一,為了方便處理,長度不足的部分用‘對應(yīng)的數(shù)字進(jìn)行填充。預(yù)處理完成之后的用戶數(shù)據(jù)、電影數(shù)據(jù)、評分?jǐn)?shù)據(jù)如圖4所示。

3.2 實(shí)驗(yàn)準(zhǔn)備

實(shí)驗(yàn)的目的是通過計(jì)算訓(xùn)練出用戶特征值和電影特征值,進(jìn)行推薦處理分析使用,分析數(shù)據(jù)集中的相關(guān)字典,發(fā)現(xiàn)其中一些字段信息較為特殊,對這些不同于其他字段,且不方便存儲(chǔ)的信息通過one hot編碼方式進(jìn)行轉(zhuǎn)化存儲(chǔ),如用戶ID、電影ID等字段,這種編碼表示的是由0和1組成的數(shù)據(jù)集合。在存儲(chǔ)數(shù)據(jù)時(shí),時(shí)常遇到稀疏性問題,輸入的時(shí)間較長,維度也急劇膨脹,這是急需解決的問題,因此通過相關(guān)數(shù)據(jù)的預(yù)處理方式,將這些字段轉(zhuǎn)化成數(shù)字,用這些數(shù)字當(dāng)作嵌入矩陣的索引,網(wǎng)絡(luò)的第一層使用了嵌入層,維度是(N,32)和(N,16)。

電影類型的處理要多一步,有時(shí)一部電影有多部電影類型,這樣從嵌入矩陣索引出來是一個(gè)(n,32)的矩陣,將這個(gè)矩陣求和,變成(1,32)的向量。從嵌入層索引特征以后,將每個(gè)特征值通過全連接層傳入,再將輸出傳入到全連接層,最終得到(1,200)的用戶特征和電影特征兩個(gè)特征向量。對于電影名稱的處理比較特殊,從嵌入矩陣中得到電影名對應(yīng)的各個(gè)單詞的嵌入向量,名稱長度有一定限制,這里過濾器大小使用時(shí),就選擇2、3、4、5長度。然后對文本嵌入層使用滑動(dòng)2、3、4、5個(gè)單詞尺寸的卷積核做卷積和最大池化。最后進(jìn)行Dropout 操作,全連接層輸出。

3.3 實(shí)驗(yàn)環(huán)境

1)硬件設(shè)備

處理器:Intel(R) Core(TM)i7 -8750H CPU @ 2.20GHz 2.21 GHz。

內(nèi)存:8GB。

2)軟件環(huán)境

操作系統(tǒng):Microsoft Windows10 操作系統(tǒng)(64位)。

開發(fā)語言:Python 3.7。

編碼工具:JetBrainsPyCharm 2018.1.3。

軟件工具:Pandas、Numpy、Tensorflow、Collections、Os、Pickle、Re、Zipfile、Hashlib、Matplotlib、Time、Datetime,其中安裝Numpy版本過高的話會(huì)報(bào)錯(cuò),所以需要安裝1.16.0版本的numpy。

實(shí)驗(yàn)采用了協(xié)同過濾算法進(jìn)行的相關(guān)設(shè)計(jì),從不同方面進(jìn)行相關(guān)數(shù)據(jù)的讀取、呈現(xiàn)和分析,能夠做到的就是一個(gè)根據(jù)不同設(shè)計(jì)模式進(jìn)行的算法驗(yàn)證操作。

3.4訓(xùn)練參數(shù)設(shè)置

為了保證算法的精確性,采用了大量的訓(xùn)練數(shù)據(jù)進(jìn)行長時(shí)間的計(jì)算,以折現(xiàn)圖的方式進(jìn)行展現(xiàn)。在每個(gè)圖中,Train_loss表示訓(xùn)練誤差,即訓(xùn)練集在模型中預(yù)測結(jié)果與真實(shí)結(jié)果的差值,Test_loss 表示驗(yàn)證集上的損失。從折線圖變化的趨勢可以看出,Train_loss折線圖和Test_loss折線圖都呈下降趨勢,表明設(shè)計(jì)的網(wǎng)絡(luò)信息還在不斷學(xué)習(xí),即網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)得當(dāng),訓(xùn)練超參數(shù)設(shè)置得當(dāng)。

對于卷積神經(jīng)網(wǎng)絡(luò)的推薦結(jié)果影響最大的三個(gè)參數(shù)為Batch_size、學(xué)習(xí)率和迭代次數(shù)。Batch_size就是每批處理的樣本的個(gè)數(shù),即一次訓(xùn)練所選取的樣本數(shù)。學(xué)習(xí)率就是機(jī)器學(xué)習(xí)的速率,開始時(shí)需要較高的學(xué)習(xí)率進(jìn)行快速學(xué)習(xí),運(yùn)行一段數(shù)據(jù)學(xué)習(xí)率不斷衰減,達(dá)到穩(wěn)定。 迭代次數(shù),每一次迭代都會(huì)更新一次網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù)。Dropout是為了應(yīng)對神經(jīng)網(wǎng)絡(luò)很容易過擬合的問題。本次設(shè)置了三種不同的參數(shù),學(xué)習(xí)率和Dropout的值始終為0.0001和0.5,而Batch_size和迭代次數(shù)設(shè)置為三組不同的數(shù)值,根據(jù)“一個(gè)參數(shù)不變,改變另一個(gè)參數(shù)”的原則,選擇了256和5、64和5、64和20三組,并且對于Test_loss和Train_loss的值進(jìn)行統(tǒng)計(jì),結(jié)果如圖5、圖6、圖7所示。

圖5是在迭代次數(shù)為5的情況下,將Batch_size設(shè)置為256時(shí),從訓(xùn)練缺損和測試缺損的統(tǒng)計(jì)分布來看,訓(xùn)練缺損的值在0.966和12.162之間,測試缺損的值在 0.722和1.418之間,可以看出來波動(dòng)比較大,不是很穩(wěn)定。

圖6與圖5相比,樣本數(shù)量不變,但是樣本的迭代次數(shù)增加到20次,此時(shí)訓(xùn)練缺損值的范圍在0.899~7.984之間,測試缺損值在0.546~1.589之間,相比圖5,相對而言波動(dòng)收斂些,這就說明,在batch_size的數(shù)值相同時(shí),增加迭代次數(shù),可以使訓(xùn)練和測試結(jié)果更加穩(wěn)定。

圖7與圖5的迭代次數(shù)一致,都為5,將Batch_size設(shè)置為64時(shí),對比圖5,訓(xùn)練缺損值范圍在0.823至13.101之間,測試缺損值范圍在0.232至1.712之間,忽略網(wǎng)絡(luò)開始學(xué)習(xí)不穩(wěn)定的情況,說明在一定范圍內(nèi),適當(dāng)降低Batch_size值,可以降低訓(xùn)練缺損。

圖8結(jié)合圖6和圖7的規(guī)律,將batch_size的值設(shè)置為64,迭代次數(shù)設(shè)置為20,訓(xùn)練缺損值范圍在0.506至14.021之間,測試缺損值范圍在0.192至1.708之間,可以看出訓(xùn)練缺損和測試缺損的趨勢更為穩(wěn)定,因此本文認(rèn)為,當(dāng)batch_size 為確定值時(shí),增加迭代次數(shù)可以使訓(xùn)練和測試結(jié)果更加穩(wěn)定。

4 實(shí)驗(yàn)結(jié)果分析

推薦同類型的電影根據(jù)在數(shù)據(jù)集中隨機(jī)選區(qū)的電影,計(jì)算電影特征向量與電影特征矩陣的余弦值進(jìn)行相似度的比較,計(jì)算較大的五個(gè)值,如圖9所示。

根據(jù)喜歡的電影推薦,隨機(jī)生成用戶特征,通過卷積神經(jīng)網(wǎng)絡(luò)結(jié)合電影特征矩陣計(jì)算電影評分,進(jìn)行推薦評分最高的部分,這個(gè)數(shù)量是可以進(jìn)行修改的,在本項(xiàng)目中推薦的數(shù)量設(shè)置為5,如圖10所示。

根據(jù)看過此電影的人還喜歡哪些電影,在數(shù)據(jù)集中選取出的一個(gè)電影,然后根據(jù)排名選出有同樣喜好的用戶,提取這些用戶的特征向量,進(jìn)行算法的設(shè)計(jì)得出相應(yīng)的推薦,將每個(gè)人評分最高的電影選出,并分別進(jìn)行推薦,如圖11所示。

通過對IMDB數(shù)據(jù)集的獲取,對存在的相關(guān)用戶個(gè)性特征值和電影特征值進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)CNN的計(jì)算,通過上述的設(shè)計(jì)方法,進(jìn)行數(shù)據(jù)值的處理比對,根據(jù)生產(chǎn)用戶的特征值矩陣和電影特征值矩陣進(jìn)行處理分析得出loss的數(shù)值,計(jì)算當(dāng)前看的電影特征向量與整個(gè)電影特征矩陣的余弦相似度,添加其中隨機(jī)生成的字段不同,使用用戶特征向量與電影特征矩陣計(jì)算所有電影的評分,獲取得出數(shù)較高的電影信息,進(jìn)行推薦,充分地結(jié)合CNN的設(shè)計(jì)思路,并通過協(xié)同過濾算法來解決用戶的冷啟動(dòng)問題,計(jì)算新用戶的矩陣特征值,對數(shù)據(jù)集中的用戶數(shù)據(jù)進(jìn)行比對,有相似用戶特征值信息的用戶,喜歡的電影類型,進(jìn)行相同類型的推薦,這樣可以稍微緩解用戶的冷啟動(dòng)問題。

5結(jié)束語

本文利用卷積神經(jīng)網(wǎng)絡(luò)和協(xié)同過濾算法對電影數(shù)據(jù)分析,經(jīng)過大量的訓(xùn)練實(shí)驗(yàn)得出較優(yōu)的卷積參數(shù),通過協(xié)同過濾算法計(jì)算與其他用戶的相似度,實(shí)現(xiàn)了電影推薦系統(tǒng),設(shè)計(jì)的電影推薦系統(tǒng)結(jié)合算法維度進(jìn)行推薦,并實(shí)現(xiàn)較高的準(zhǔn)確度,緩解了推薦系統(tǒng)的“冷啟動(dòng)”問題。

參考文獻(xiàn):

[1] Chen Y L,Cheng L C,Chuang C N.A group recommendation system with consideration of interactions among group members[J].Expert Systems With Applications,2008,34(3):2082-2090.

[2] 許海玲,吳瀟,李曉東,等.互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J].軟件學(xué)報(bào),2009,20(2):350-362.

[3] 馬宏偉,張光衛(wèi),李鵬.協(xié)同過濾推薦算法綜述[J].小型微型計(jì)算機(jī)系統(tǒng),2009,30(7):1282-1288.

[4] Resnick P,Iacovou N,Suchak M,et al.GroupLens:an open architecture for collaborative filtering of netnews[C]//ACM Conference on Computer Supported Cooperative Work.ACM,1994:175-186.

[5] Tuzhilin A.Towards the next generation of recommendersystems[C]//Proceedings of the 2010 International Conference on E-Business Intelligence.Paris,F(xiàn)rance:Atlantis Press,2010.

[6] 陳思亦,何利力,鄭軍紅.結(jié)合商圈位置區(qū)域模型的商品推薦算法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2019,28(8):136-141.

[7] 孫冬婷,何濤,張福海.推薦系統(tǒng)中的冷啟動(dòng)問題研究綜述[J].計(jì)算機(jī)與現(xiàn)代化,2012(5):59-63.

[8] Schein A I,Popescul A,Ungar L H,et al.Methods and metrics for cold-start recommendations[C]//SIGIR'02:Proceedings of the 25th annual international ACM SIGIR conference on Research and development in information retrieval,2002:253-260.

[9] 鄧明通,劉學(xué)軍,李斌.基于用戶偏好和動(dòng)態(tài)興趣的多樣性推薦方法[J].小型微型計(jì)算機(jī)系統(tǒng),2018,39(9):2029-2034.

[10] 劉建國,周濤,汪秉宏.個(gè)性化推薦系統(tǒng)的研究進(jìn)展[J].自然科學(xué)進(jìn)展,2009,19(1):1-15.

[11] 孫志軍,薛磊,許陽明,等.深度學(xué)習(xí)研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2012,29(8):2806-2810.

[12] Lecun Y,Bottou L,Bengio Y,et al.Gradient-based learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.

[13]Harper F M,KonstanJ A.The MovieLens Datasets:Historyand Context[J].ACM Transactions on Interactive Intelligent Systems (TiiS) 5,4,Article 19 (December 2015),19 pages.DOI=http://dx .doi.org/10.1145/2827872.

收稿日期:2022-03-16

作者簡介:張海飛(1980—),男,江蘇如東人,副教授,博士,研究方向?yàn)闄C(jī)器學(xué)習(xí)、深度強(qiáng)化學(xué)習(xí)、地理信息系統(tǒng);崔軍納(1979—),男,河南許昌人,工程師,碩士,研究方向?yàn)楣I(yè)互聯(lián)網(wǎng)技術(shù)、物聯(lián)網(wǎng)技術(shù)、自動(dòng)控制技術(shù);葛金鼎(1984—),男,江蘇通州人,碩士,研究方向?yàn)榇肮こ獭C(jī)械工程、自動(dòng)控制技術(shù)。

猜你喜歡
協(xié)同過濾卷積神經(jīng)網(wǎng)絡(luò)
基于卷積神經(jīng)網(wǎng)絡(luò)溫室智能大棚監(jiān)控系統(tǒng)的研究
圖書推薦算法綜述
基于深度卷積神經(jīng)網(wǎng)絡(luò)的物體識(shí)別算法
改進(jìn)的協(xié)同過濾推薦算法
基于鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu)的協(xié)同過濾推薦算法設(shè)計(jì)與實(shí)現(xiàn)
基于相似傳播和情景聚類的網(wǎng)絡(luò)協(xié)同過濾推薦算法研究
基于協(xié)同過濾算法的個(gè)性化圖書推薦系統(tǒng)研究
混合推薦算法在電影推薦中的研究與評述
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實(shí)現(xiàn)
軟件工程(2016年8期)2016-10-25 15:47:34
山西省| 台山市| 刚察县| 青冈县| 故城县| 灵武市| 宿州市| 北海市| 布尔津县| 自治县| 佳木斯市| 衡东县| 隆德县| 司法| 乌海市| 乐清市| 日照市| 黑水县| 溆浦县| 桃江县| 横峰县| 嵩明县| 米脂县| 芦溪县| 锦州市| 甘孜| 从江县| 内黄县| 海原县| 偃师市| 托克逊县| 博白县| 彭泽县| 新营市| 福州市| 万州区| 彭阳县| 平顺县| 平乡县| 青龙| 昭苏县|