顧軍華 李新晨 張婭娟 河北工業(yè)大學(xué)
協(xié)同過濾CF預(yù)測未知評分以全局高精度,成為最流行的基于低維因子模型算法。近幾年在推薦系統(tǒng)中,提出了許多基于DL的模型。幾年來,可分為兩組:深度學(xué)習(xí)先驗估計模型(DLP)和單渠道推薦模型(SCR)。在DLP中,采用先對潛在因子進行先驗估計,然后根據(jù)觀察到的評分推斷用戶和項目的潛在因素。對于SCR,它從用戶的歷史行為中學(xué)習(xí)關(guān)鍵模型,然后使用這些關(guān)鍵模式預(yù)測未知的評分。SCR可概括為幾個主要模型:受限玻爾茲曼機(RBM)、自動編碼器(ae)等。
受特殊結(jié)構(gòu)的限制,它是合并用戶和項目的側(cè)邊信息的挑戰(zhàn)構(gòu)建高效的推薦框架,方便地將各種輔助信息合并到推薦框架中,提出了深矩陣分解(DMF)模型,DMF構(gòu)造了兩個特征變換從所有輸入信息中產(chǎn)生潛在因素的功能直接訪問用戶和項目。DMF通過特征變換產(chǎn)生潛在因素直接從用戶和項目信息起作用根據(jù)觀測數(shù)據(jù)進行估算。此外,DMF采用雙通道結(jié)構(gòu),可合并側(cè)來自用戶和項目的信息。利用實際數(shù)據(jù)進行了實證研究。
在基于CF的推薦系統(tǒng)中,歷史評級行為的用戶通常表示為用戶項目分級矩陣。給定一個用戶集U和一個項目集I,用戶項目評級矩陣Z是一個矩陣,其中每個元素rij是與用戶i對j項的偏好成比例;和 表示用戶集和項目集的編號?;贑F的問題RS正在構(gòu)造一個估計量以最小化預(yù)R中的錯誤,并生成每個未觀察到的預(yù)測Z元素。
深層矩陣分解可以歸結(jié)為兩個過程,即數(shù)據(jù)準(zhǔn)備過程和DMF模型(圖1)。DMF模型能很好地滿足用戶的精度要求和項目信息,由數(shù)據(jù)準(zhǔn)備提供過程。在第一個過程(數(shù)據(jù)準(zhǔn)備過程)中,反饋由IFE編碼,側(cè)邊信息編碼通過一個熱編碼。結(jié)合這兩種信息,用戶可以生成項目信息池。在DMF模型中,預(yù)測評級可以通過三步走。首先,提取目標(biāo)用戶和項目信息來自用戶和項目信息池。第二,潛在因素由用戶和項目特征轉(zhuǎn)換生成功能。第三,預(yù)測的評級可以通過潛在的因素。
由圖2可知,Iui、Ivj作為DMF的輸入,F(xiàn)u為用戶的特征轉(zhuǎn)換函數(shù),為Fu的參數(shù),Gui表示用戶u對物品i的評分是否存在(如圖1),存在則為1我們可以優(yōu)化DMF中的目標(biāo)函數(shù):平方誤差函數(shù),通過小批量梯度下降(MBGD)算法對所有參數(shù)、Gui的更新規(guī)則。
實驗對所涉及的模型進行了movielens數(shù)據(jù)集上的驗證。對于PMF,我們在所有數(shù)據(jù)集中設(shè)置為=0.5,K=50,對于 PMF 的各項參數(shù),AutoRec中參數(shù)=1。Pmf的 rmse為 0.853,AutoRec的 rmse為 0.840,DMF 的 rmse為 0.833。
經(jīng)過對比試驗得知,DMF的表現(xiàn)優(yōu)于其他的深度推薦算法,無論是在推薦算法預(yù)測精度和效率上。