国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于協(xié)同過濾和標(biāo)簽的混合音樂推薦算法研究

2021-04-18 23:45:40黃川林魯艷霞
軟件工程 2021年4期
關(guān)鍵詞:協(xié)同過濾推薦系統(tǒng)標(biāo)簽

黃川林 魯艷霞

摘? 要:結(jié)合音樂這一特定的推薦對象,針對傳統(tǒng)單一的推薦算法不能有效解決音樂推薦中的準(zhǔn)確度問題,提出一種協(xié)同過濾技術(shù)和標(biāo)簽相結(jié)合的音樂推薦算法。該算法先通過協(xié)同過濾技術(shù)確定相似用戶,再通過相似用戶對某一歌手的標(biāo)簽評分預(yù)測另一用戶對該歌手的偏好程度,從而選擇更符合用戶喜好的音樂進(jìn)行推薦,以此提升個性化推薦效率,為優(yōu)化音樂推薦系統(tǒng)提供參考方法。

關(guān)鍵詞:協(xié)同過濾;標(biāo)簽;音樂推薦;推薦系統(tǒng)

中圖分類號:TP312? ? ?文獻(xiàn)標(biāo)識碼:A

文章編號:2096-1472(2021)-04-10-04

Abstract: Traditional single recommendation algorithm cannot effectively solve the accuracy problem in music recommendation. In view of music, a specific recommendation object, this paper proposes a music recommendation algorithm combining collaborative filtering technology and tags. First, collaborative filtering technology is used to identify similar users. Then, another users preference for a singer is predicted through similar users' tag ratings for the singer. Thus, recommended music is more in line with the users preference, which enhances personalized recommendation efficiency and provides a reference method for optimizing music recommendation system.

Keywords: collaborative filtering; tags; music recommendation; recommendation system

1? ?引言(Introduction)

隨著移動互聯(lián)網(wǎng)、云計算、智能終端、物聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,文本、音頻、視頻、圖像、社交網(wǎng)絡(luò)等各種各樣的信息在網(wǎng)絡(luò)上正以爆炸式的形勢增長,豐富了人們的日常生活和學(xué)習(xí)工作內(nèi)容[1-2]。信息技術(shù)和互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展產(chǎn)生了海量信息,這些信息雖然極大地豐富了我們的個人需求,但也帶來了信息過載的問題。為了更好地滿足用戶個性化需求,以及解決信息過載問題,推薦系統(tǒng)應(yīng)運(yùn)而生。在這個信息過載的時代,互聯(lián)網(wǎng)已經(jīng)成為人們生活中最重要的組成部分,然而,如何從海量的互聯(lián)網(wǎng)信息中篩選出我們感興趣的內(nèi)容就成為一個難題。推薦系統(tǒng)根據(jù)用戶興趣愛好等特征,個性化推薦滿足用戶需求的對象,目前已經(jīng)在電子商務(wù)、信息門戶、社交網(wǎng)絡(luò)、移動位置服務(wù)、多媒體娛樂等領(lǐng)域得到了廣泛應(yīng)用[3]。

硬件成本的降低和技術(shù)的進(jìn)步導(dǎo)致了數(shù)字音樂的快速發(fā)展,無論是在線音樂還是移動音樂都深受人們的喜愛。Spotify、Pandora、豆瓣音樂等各類各樣的音樂網(wǎng)站和音樂電臺在飛速發(fā)展中為用戶提供了成千上萬首歌曲[1]。然而,大量可用的音樂使得用戶更難以找到他們喜歡的音樂,這就是所謂的選擇悖論[4]。由于音樂具有種類豐富、數(shù)量龐大、收聽時間短以及連貫性和次序性等特點,傳統(tǒng)單一的推薦算法并不能有針對性地解決音樂推薦的準(zhǔn)確度問題。如Last.fm是通過協(xié)同過濾進(jìn)行推薦的,Pandora是通過內(nèi)容相似性進(jìn)行推薦的[5]。本文根據(jù)用戶偏好、歌曲標(biāo)簽進(jìn)行深度數(shù)據(jù)挖掘,運(yùn)用協(xié)同過濾和基于標(biāo)簽的AHP混合推薦算法為用戶推薦適合的音樂,以此提升個性化推薦效率,為優(yōu)化音樂推薦系統(tǒng)提供參考方法[6]。

2? ?推薦算法(Recommendation algorithm)

推薦算法是推薦系統(tǒng)的核心和關(guān)鍵部分,也是該領(lǐng)域研究最活躍的方向之一[7],推薦算法的好壞決定了推薦系統(tǒng)的性能和推薦結(jié)果的準(zhǔn)確性[8]。協(xié)同過濾、基于內(nèi)容、基于規(guī)則等推薦算法各有優(yōu)缺點,為了取長補(bǔ)短,混合算法將各種推薦算法混合進(jìn)行使用。

2.1? ?協(xié)同過濾算法

在音樂推薦系統(tǒng)中應(yīng)用最多的一種算法是協(xié)同過濾算法,這種算法根據(jù)目標(biāo)用戶的習(xí)慣愛好、個人興趣等歷史信息而對事物進(jìn)行評價[9],然后推薦相關(guān)物品給用戶。這些歷史信息可能是用戶的瀏覽或購買記錄,也可能是問卷調(diào)查等用戶填寫的相關(guān)信息?;趨f(xié)同過濾的推薦算法具有很強(qiáng)的個性化,可以自動地發(fā)現(xiàn)用戶潛在的興趣,從而逐漸提高系統(tǒng)推薦性能[10]。這種方法適合很多推薦對象,包括處理電影、音樂、圖書和酒店等非結(jié)構(gòu)化的對象[11]。協(xié)同過濾算法的工作原理如圖1所示。

2.2? ?層次分析法

層次分析法(Analytic Hierarchy Process, AHP)是1980年美國著名運(yùn)籌學(xué)家T. L. Saaty在其論文中首次提出的簡單而又靈活的多準(zhǔn)則決策算法[12]。這種算法將決策專家的主觀判斷轉(zhuǎn)換為定量的客觀表述,本質(zhì)是一種決策思維方式,把復(fù)雜系統(tǒng)分解為各個組成因素,進(jìn)而按支配關(guān)系把這些決策問題的核心影響因素分組,構(gòu)建層次結(jié)構(gòu),用層次化模型處理要解決的問題,設(shè)置優(yōu)先級,然后利用兩兩比較的方式,計算每個因素對最終決策的影響程度,最后還要進(jìn)行一致性檢驗[13]。AHP算法通過如下五個步驟來確定屬性權(quán)重,并得出推薦的綜合評分。

第一,定義其評估屬性,把要解決的問題層次化處理,如圖2所示。

第二,構(gòu)造比較矩陣。

第三,檢驗比較矩陣一致性。

第四,計算矩陣權(quán)向量。

第五,得出推薦的綜合評分。

本文核心算法綜合使用了基于用戶的協(xié)同過濾推薦算法和基于標(biāo)簽的AHP層次分析法。首先,分析計算用戶的聽歌記錄,根據(jù)用戶選擇歌手的播放次數(shù),建立了用戶與歌手矩陣模型,模型中的每行表示一個用戶,每列表示一個歌手,每個行向量表示用戶對每個歌手的喜好程度,再使用余弦相似度算法尋找目標(biāo)用戶的相似用戶。然后,基于歌手標(biāo)簽使用AHP層次分析法生成個性化推薦列表,以此推薦給經(jīng)過協(xié)同過濾算法產(chǎn)生的目標(biāo)用戶。

3? 個性化的音樂推薦系統(tǒng)(Personalized music recommendation system)

本文的實驗數(shù)據(jù)來源于世界上最大的社交音樂平臺Last.fm

在網(wǎng)上公布的數(shù)據(jù),在這個音樂庫里,有上億首歌曲曲目和來自全球250個國家超過一千萬的歌手[14]。用戶可以在Last.fm音樂網(wǎng)站獲取免費(fèi)在線聽歌或者下載音樂等多種音樂服務(wù),這使得Last.fm有上千萬的用戶每個月都在線聽歌,產(chǎn)生了海量的用戶數(shù)據(jù)。這些數(shù)據(jù)包括用戶編號、聽歌記錄、歌曲名、專輯、標(biāo)簽(歌手、流派、年代、心情等描述性信息)、好友關(guān)系等豐富的信息。

3.1? ?基于用戶的協(xié)同過濾算法尋找相似用戶

在個性化的音樂推薦系統(tǒng)中,采用基于用戶的協(xié)同過濾算法,一般是通過計算用戶對音樂的偏好相似度,從而得到最近鄰用戶。例如,若用戶1需要進(jìn)行個性化推薦,需要先找到同用戶1有相同偏好的其他用戶,然后將這些用戶喜歡的、感興趣的并且用戶1沒接觸過的歌曲推薦給用戶1。

余弦相似度是最常用的相似度算法之一,它被廣泛地應(yīng)用于圖像處理、文檔檢索等領(lǐng)域之中。在協(xié)同過濾推薦算法中,評分矩陣中的一行向量代表一個用戶。設(shè)向量分別為A、B,元素值是用戶對產(chǎn)品的評分值,0值代表用戶對該產(chǎn)品沒有評分。兩個向量A、B之間的夾角余弦值就代表了這兩個用戶之間的相似度。計算公式如下:

本文選取音樂平臺中聽歌行為比較頻繁的用戶,其用戶編號為135、257、397、560、935、1551,以用戶播放次數(shù)為評分依據(jù),得到用戶對歌手的行為矩陣,如表1所示。

根據(jù)矩陣數(shù)據(jù),對用戶進(jìn)行兩兩比較,使用公式(1)計算用戶之間的相似度,計算結(jié)果如表2所示,例如用戶135與用戶257的相似度為0.38。由此可知,與用戶935最相似的用戶為用戶257,相似度為0.73。

用戶257的播放列表中有50位歌手,其中有15首在用戶935的播放列表中。即如果把用戶257的播放列表中的50位歌手都變成推薦列表推薦給用戶935,則準(zhǔn)確率為15/50×100%=30%。如果可以對用戶257的播放列表中的50位歌手按照用戶935的收聽喜好再進(jìn)行一次篩選推薦,則可以有效地提高推薦的準(zhǔn)確率。

3.2? ?基于標(biāo)簽的AHP層次分析法推薦音樂

標(biāo)簽是信息系統(tǒng)中用來代表一段信息的無層次的關(guān)鍵詞或術(shù)語,通過這種用來描述物品的關(guān)鍵詞,可以輔助系統(tǒng)對物品的檢索。不同系統(tǒng)打標(biāo)簽的方式不盡相同,有作者或?qū)<掖虻臉?biāo)簽,也有普通用戶打的標(biāo)簽。用戶可以以個人非正式化的語言來編輯標(biāo)簽,表達(dá)對物品的看法。利用這些標(biāo)簽數(shù)據(jù)能夠反映用戶的興趣偏好,將其引入推薦系統(tǒng)中,可以輔助建立偏好模型,提高推薦系統(tǒng)的性能。通過數(shù)學(xué)的方法,使用AHP量化決策因素獲得相對于目標(biāo)層決策問題重要程度的比較值。整個過程需要經(jīng)過以下四個步驟:

(1)建立問題模型

AHP層次分析法建立了目標(biāo)層、準(zhǔn)則層、方案層三層模型,來定量分析那些抽象而主觀的決策問題。本文擬推薦的目標(biāo)用戶為用戶935,影響用戶對歌手喜愛度的因素有很多。在聽歌過程中,用戶935最感興趣的標(biāo)簽包括電子音樂(electronic)、電子體音樂(ebm)、工業(yè)音樂(industrial)、德國音樂(german)、合成音樂(synthpop)、暗黑電音(dark electro),這些標(biāo)簽的使用次數(shù)如表3所示,以此構(gòu)建的推薦層次分析模型如圖3所示。

由表3可以看出,用戶935在選擇歌手時最看重的是“電子音樂”,而“暗黑電音”的重要性是最低的。

(2)構(gòu)建比較矩陣

采用1—9量化指標(biāo)構(gòu)建比較矩陣,來量化因素之間的重要程度。通過評價因素兩兩之間的相對重要程度,來得到某一決策問題的影響因素相對于解決該問題的權(quán)重。通過對全局的統(tǒng)籌把握,決策人對比兩兩因素之間的重要性,以此劃分為同等重要、稍微重要、明顯重要、強(qiáng)烈重要和極其重要共五個等級,并且每個等級都用1—9的數(shù)字進(jìn)行標(biāo)注[13],如表4所示。

影響用戶對歌手喜好的因素有很多,且不同的用戶有不同的權(quán)重考量,通常用戶意識中對于這些因素重要性的考慮都是不清晰的。采用九級標(biāo)度法構(gòu)造這些因素間重要程度比較矩陣,通過求解比較矩陣的特征向量,得到各因素相對重要性程度的權(quán)重向量,從而將各因素的重要性進(jìn)行量化[15]。以目標(biāo)用戶935所做的比較矩陣為例進(jìn)行說明,如表5所示,例如:“電子音樂”相對于“工業(yè)音樂”的重要程度是4,而“工業(yè)音樂”相對于“電子音樂”的重要程度是1/4。

(3)檢驗矩陣的一致性

使用AHP方法,無論在何種階段、由何人分析,最終得到的決策結(jié)果都不能過分偏離理想決策方案,即需要保持思維的一致性。對于比較矩陣是否具有完全一致性,AHP決策分析法提出了數(shù)學(xué)化的指標(biāo):一致性指標(biāo)CI(Consistency? Index)。利用CI反映比較矩陣偏離一致性的程度,CI值越大,表示該矩陣偏移一致性程度越大,反之越小,其計算如公式(2)所示:

其中,為比較矩陣A的最大特征根,n為比較矩陣的階數(shù)。通過計算可得,用戶935所做的比較矩陣中最大特征值=6.3684,根據(jù)公式(2),CI=(6.3684-6)/5=0.0737。

AHP通過引入平均隨機(jī)一致性指標(biāo)RI(Random Index),對比較矩陣進(jìn)行一致性檢驗,避免比較矩陣出現(xiàn)邏輯性錯誤[16]。RI與n值的對應(yīng)關(guān)系如表6所示。

通過隨機(jī)一致性比率CR(Consistency Ratio)的大小檢驗比較矩陣的一致性,如公式(3)所示:

當(dāng)CR<0.10時,說明比較矩陣構(gòu)建合理,通過一致性檢驗;反之,當(dāng)CR≥0.10時,說明該比較矩陣包含邏輯判斷錯誤,就需要修正比較矩陣。用戶935所做的比較矩陣A為六階矩陣,所對應(yīng)的RI值為1.24。根據(jù)公式(3),CR=0.0737/1.24=0.0594,經(jīng)計算CR<0.10,通過一致性檢驗。

(4)計算矩陣權(quán)向量

一致性檢驗通過合格后,構(gòu)建的比較矩陣就可以用來計算每個因素的權(quán)重值。計算得到的權(quán)向量為:

U=(0.8243,0.4700,0.2636,0.1454,0.0819,0.0480)

權(quán)向量U的各分量即為歌手在用戶935心中的重要性量化數(shù)值,可以看出,電子音樂、電子體音樂、工業(yè)音樂、德國音樂、合成音樂、暗黑電音在用戶935中的重要性依次為0.8243、0.4700、0.2636、0.1454、0.0819、0.0480。

(5)歌手的綜合評分

本文在Last.fm音樂網(wǎng)站中抽取了目標(biāo)用戶935的相似用戶257對六位歌手關(guān)于評價因素的播放次數(shù),如表7所示。

這里把播放次數(shù)作為標(biāo)簽評分,用戶257對某位歌手的“電子音樂”標(biāo)簽評分為h1,而“電子音樂”在用戶935心中的重要性為0.8243,那么可以認(rèn)為該歌手的“電子音樂”在用戶935心中的加權(quán)評分為0.8243h1。同樣,計算電子體音樂、工業(yè)音樂、德國音樂、合成音樂、暗黑電音在用戶935心中的加權(quán)評分,分別計為0.4700h2、0.2636h3、0.1454h4、0.0819h5、0.0480h6。將各個因素的評分相加即為該歌手在用戶935心中的綜合評分H:

H=0.8243h1+0.4700h2+0.2636h3+0.1454h4+0.0819h5+0.0480h6

按照以上步驟分別計算歌手1、歌手2、歌手3、歌手4、歌手5、歌手6的綜合評分:

H1=0.8243×2+0.4700×5+0.2636×8+0.1454×4+0.0819×9+0.0480×1=7.4741

H2=0.8243×6+0.4700×4+0.2636×5+0.1454×2+0.0819×7+0.0480×3=9.1519

H3=0.8243×9+0.4700×7+0.2636×2+0.1454×4+0.0819×5+0.0480×6=12.5150

H4=0.8243×7+0.4700×8+0.2636×3+0.1454×3+0.0819×2+0.0480×5=11.1609

H5=0.8243×8+0.4700×9+0.2636×4+0.1454×5+0.0819×6+0.0480×3=13.2412

H6=0.8243×6+0.4700×2+0.2636×3+0.1454×4+0.0819×7+0.0480×9=8.2635

最后將綜合評分較高的歌手3、歌手4、歌手5推薦給用戶935。

按照上述AHP推薦方法,對用戶257的播放列表中的50位歌手全部進(jìn)行綜合評分,篩選出評分較高的25位歌手進(jìn)行推薦,實驗表明,推薦列表中有13首歌曲都是目標(biāo)用戶935測試集中的歌曲,準(zhǔn)確率為13/25×100%=52%。

4? ?結(jié)論(Conclusion)

隨著音樂業(yè)務(wù)的迅猛發(fā)展,音樂庫越來越豐富,用戶喜好的差異化也越來越大。現(xiàn)在音樂業(yè)務(wù)推廣的一個難點就是如何便捷、快速地從龐大的音樂庫中對用戶進(jìn)行精準(zhǔn)的個性化推薦。本文通過對音樂網(wǎng)站中保存的海量用戶行為記錄進(jìn)行分析,通過協(xié)同過濾算法確定相似用戶,再基于用戶的興趣標(biāo)簽,為用戶做出個性化音樂推薦,給音樂領(lǐng)域的推薦算法提供了一種新的思路和參考。

參考文獻(xiàn)(References)

[1] 金蕾.個性化音樂推薦算法的研究與實現(xiàn)[D].濟(jì)南:山東大學(xué),2017.

[2] 盧麗靜,朱杰,楊志芳.基于大數(shù)據(jù)的個性化音樂推薦系統(tǒng)[J].廣西通信技術(shù),2015 (1):24-27.

[3] 劉治宇.基于混合推薦算法的情境感知音樂推薦系統(tǒng)研究與實現(xiàn)[D].成都:電子科技大學(xué),2015.

[4] HYUNG Z, LEE K. Music recommendation using text analysis on song requests to radio stations[J]. Expert Systems with Applications, 2014, 41(5):2608-2618.

[5] CAI R, ZHANG C, WANG C, et al. MusicSense: Contextual music recommendation using emotional allocation modeling[C]. The 15th ACM International Conference on Multimedia, 2007.

[6] 胡昌平,查夢娟,石宇.融合個體興趣與群體認(rèn)知的音樂個性化推薦模型[J].信息資源管理學(xué)報,2018,29(2):97-103.

[7] 李新衛(wèi).基于Hadoop的音樂推薦系統(tǒng)的研究與實現(xiàn)[D].西安:西安工業(yè)大學(xué),2018.

[8] 李卓遠(yuǎn),曾丹,張之江.基于協(xié)同過濾和音樂情緒的音樂推薦系統(tǒng)研究[J].工業(yè)控制計算機(jī),2018,31(7):130-131;134.

[9] 林麗姍.基于協(xié)同過濾算法的社區(qū)音樂推薦系統(tǒng)的設(shè)計與實現(xiàn)[D].長沙:湖南大學(xué),2016.

[10] 蔡英文.基于多屬性評分的電子商務(wù)個性化推薦算法研究[D].南昌:江西財經(jīng)大學(xué),2016.

[11] 董曉梅.圖書借閱系統(tǒng)中的協(xié)同過濾推薦技術(shù)研究[D].大連:大連理工大學(xué),2015.

[12] 李亮.評價中權(quán)系數(shù)理論與方法比較[D].上海:上海交通大學(xué),2009.

[13] 王璐.基于本體的個性化推薦系統(tǒng)[D].成都:電子科技大學(xué),2013.

[14] 蔡瑞瑜.基于社會上下文約束和物品上下文約束的協(xié)同推薦[D].杭州:浙江大學(xué),2012.

[15] 郭宇紅,楊金然.一種基于AHP的智能電影推薦方法[J].南京郵電大學(xué)學(xué)報(自然科學(xué)版),2015(35):105.

[16] 單毓馥,李丙洋.電子商務(wù)推薦系統(tǒng)中服裝推薦問題研究[J].毛紡科技,2016,335(5):70-73.

作者簡介:

黃川林(1979-),女,碩士,副教授.研究領(lǐng)域:電子商務(wù)數(shù)據(jù)分析,個性化推薦.

魯艷霞(1977-),女,碩士,教授.研究領(lǐng)域:輿情分析,應(yīng)急管理.

猜你喜歡
協(xié)同過濾推薦系統(tǒng)標(biāo)簽
無懼標(biāo)簽 Alfa Romeo Giulia 200HP
車迷(2018年11期)2018-08-30 03:20:32
不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
海峽姐妹(2018年3期)2018-05-09 08:21:02
基于用戶偏好的信任網(wǎng)絡(luò)隨機(jī)游走推薦模型
基于鏈?zhǔn)酱鎯Y(jié)構(gòu)的協(xié)同過濾推薦算法設(shè)計與實現(xiàn)
基于相似傳播和情景聚類的網(wǎng)絡(luò)協(xié)同過濾推薦算法研究
基于個性化的協(xié)同過濾圖書推薦算法研究
個性化推薦系統(tǒng)關(guān)鍵算法探討
基于協(xié)同過濾算法的個性化圖書推薦系統(tǒng)研究
混合推薦算法在電影推薦中的研究與評述
淺談Mahout在個性化推薦系統(tǒng)中的應(yīng)用
黑河市| 漳州市| 山丹县| 大渡口区| 罗定市| 岳西县| 博兴县| 永年县| 东明县| 余江县| 甘泉县| 蒙城县| 尉犁县| 安吉县| 铜梁县| 息烽县| 明水县| 友谊县| 宁远县| 和政县| 历史| 叶城县| 克山县| 札达县| 武山县| 尖扎县| 赤水市| 沈丘县| 内黄县| 临沭县| 抚松县| 临泽县| 南宫市| 闽侯县| 师宗县| 池州市| 凌云县| 区。| 东港市| 秭归县| 武冈市|