国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學習的搜索廣告排序應用

2020-06-11 09:26鐘小勇
電子技術(shù)與軟件工程 2020年1期
關鍵詞:點擊率神經(jīng)元卷積

文/鐘小勇

(攜程計算機技術(shù)(上海)有限公司 上海市 200335)

眾所周知,廣告預期收益很大程度上取決于搜索廣告排序準則,具體地講,表現(xiàn)在廣告質(zhì)量度和廣告競價上。業(yè)界量化廣告質(zhì)量度最常用的辦法是通過廣告點擊率。點擊率(CTR,Click Through Rate)代表著人們點擊廣告的概率,CTR 預估是按照已有的廣告信息以及對應的上下文來預估人們?yōu)g覽該廣告的可能性。因此,廣告排序最主要的工序是預估點擊率,因為它關系著搜索引擎業(yè)務收入以及是否可以給出更符合用戶心理的信息,更進一步講,CTR 還能夠作為廣告進一步投放的參考標準,總之廣告投放效果很大程度上取決于CTR,是實時競價算法(Real Time Bidding,RTB)的重要因素之一。

廣告點擊率預測模型經(jīng)歷了傳統(tǒng)的機器學習模型與深度學習模型的演變。傳統(tǒng)的機器學習方法主要分為單一模型預測與模型組合預測兩部分。在單一模型中,邏輯回歸、決策樹等是較為常見的單一模型。相關文獻使用廣告特征、關鍵字與用戶特征,并結(jié)合邏輯回歸模型來預測廣告點擊率,并研究了不同關鍵字對廣告點擊狀況的影響。有關文獻基于充分的歷史廣告點擊數(shù)據(jù)使用決策樹等模型實現(xiàn)廣告點擊率預測。另外,還有其它一些機器學習模型比如:支持向量機模型等運用于廣告點擊率預測,而且效果較好。然而這些傳統(tǒng)的機器學習模型更依賴人工對特征的處理,在模型使用前期需要大量的人工特征工程。

近期,伴隨深度學習的熱潮,越來越多的人們將深度學習應用于廣告點擊率預測中。百度公司研究人員將因子分解機與深度神經(jīng)網(wǎng)絡相結(jié)合用于預估廣告點擊率的FNN 模型。谷歌公司研究人員推出Wide&Deep 模型以處理點擊率預估問題,在Wide&Deep 的Embedding 層后加入特征交叉功能形成的PNN 網(wǎng)絡效果不錯。

本文使用卷積神經(jīng)網(wǎng)絡提取廣告數(shù)據(jù)中高影響力的特征,長短期記憶(LSTM,Long Short Term Memory)模型則用于分類,基于此提出了一種基于卷積-LSTM 結(jié)合的廣告點擊率預測模型與算法。

1 相關工作介紹

1.1 廣告點擊率預測流程

(1)第一步:特征提取,運用特征處理手段從原始數(shù)據(jù)中獲取影響力高的特征,并劃分為訓練數(shù)據(jù)與測試數(shù)據(jù)兩大部分。

(2)第二步:創(chuàng)建模型并輸入訓練集,使用優(yōu)化方法訓練模型。

(3)第三步:將測試數(shù)據(jù)輸入訓練完成的模型進行預測,平臺按照預測得到的點擊率來排序,從而得出廣告展示區(qū)域。廣告點擊率預測流程如圖1 所示。

1.2 邏輯回歸

邏輯回歸作為一種典型的分類模型,非常適合處理分類問題,比如二分類甚至多分類,內(nèi)部可能帶有線性或非線性決策函數(shù)。線性邏輯回歸為:

通過擴展x 將x2 包含進來,可以得到邏輯回歸的非線性決策邊界:

圖1:點擊率預測流程

圖2:LSTM 單元模塊內(nèi)部結(jié)構(gòu)

圖3:卷積-LSTM 組合神經(jīng)網(wǎng)絡層組織

圖4:參數(shù)對比實驗結(jié)果

其中,w 表示權(quán)值向量;x 表示輸入;b 表示偏置。

1.3 卷積神經(jīng)網(wǎng)絡

卷積神經(jīng)網(wǎng)絡(CNN,Convolutional Neural Networks)被認為是一個經(jīng)典的前饋神經(jīng)網(wǎng)絡。除了輸入層、輸出層之間,大部分情況下卷積層可能作為它的隱藏層,甚至包括池化層與全連接層。一般情況下,會有多個卷積層和池化層,并且交替存在。在卷積神經(jīng)網(wǎng)絡中,特征圖(feature map)由多個神經(jīng)元構(gòu)成,卷積核連接上一層神經(jīng)元的輸出,從而衍生下一個神經(jīng)元。卷積核是一個由使用者自由定義大小的權(quán)重矩陣,通常作用于同一個圖像差異區(qū)域的小范圍感知域上,提取出每個小區(qū)域感知域的特征,以此構(gòu)造出下一層神經(jīng)元的輸入。卷積層將輸入特征進行卷積。池化層按照指定的池化規(guī)則對輸入特征進行再次提取。

1.4 長短期記憶神經(jīng)網(wǎng)絡

長短期記憶網(wǎng)絡作為一個時間遞歸神經(jīng)網(wǎng)絡。輸入門、輸出門和自由狀態(tài)等構(gòu)成了LSTM 神經(jīng)元,如圖2 所示。

2 卷積-LSTM混合神經(jīng)網(wǎng)絡模型

2.1 設計思想

卷積-LSTM 混合神經(jīng)網(wǎng)絡一共有三層。輸入層:將原始特征排重、數(shù)據(jù)清理后開始獨立向量編碼(One-Hot Encoder),讓其映射到t 維空間中,t 表示編碼后的向量維度,然后獲取索引值生成新的特征。輸出層的作用是將卷積網(wǎng)絡的結(jié)果輸入給LSTM,從而可以進行分類和得到預測值,如圖3 所示。

然而,老百姓起初并不理解。甚至,“封禁令”一度引起不小的地震??谱蠛笃煲晃环帕艘惠呑友虻难蛸?,聽到封禁消息時,氣得把煙斗一扔,從炕上跳了起來,指著干部就罵:“你們這些當官的,全是吃飽了撐的??茽柷卟菰怨啪褪欠叛虻牡貎?,不是圈羊的地兒。我爺爺那輩放羊,我爹爹那輩放羊,輪到我這輩怎么就成了不能放羊了呢?”

2.2 算法描述

本文提出了一種模型訓練算法,如表1 所示。

3 實驗結(jié)果分析

3.1 數(shù)據(jù)預處理

本文采用了Kaggle 比賽中Avazu 公司在2014年公開的開源數(shù)據(jù)集。從中選出了1 百萬條數(shù)據(jù)作為訓練集。每條數(shù)據(jù)都有20 個維度,包含10 個連續(xù)性特征,其中有9 個是已經(jīng)脫敏處理的)和9 個類別特征。樣本標簽的離散值是0 或1,分別代表負向樣本與正向樣本。原始訓練數(shù)據(jù)中,正樣本比例與抽取數(shù)據(jù)中正樣本比例較為接近,這樣做的目的是不影響實驗結(jié)果。

3.2 算法指標

本文采用了兩種算法指標來檢驗分析模型。

(1)AUC(Area Under Curve)。AUC 的大小與ROC(Receiver Operating Characteristics)曲線下的覆蓋面大小有關,ROC 曲線的橫軸表示假正率(False Positive Rate),縱軸表示真正率(True Positive Rate),按閾值的取值差異可得到不同的ROC 曲線。AUC 的取值在0 到1 之間,AUC 的值越大,分類效果越佳。

(2)對數(shù)損失(Logarithmic Loss)。對數(shù)損失的值與分類器效果成反比,對數(shù)損失值越小,分類器效果越好。

3.3 算法初始參數(shù)

通常來說,特征空間的大小取決于神經(jīng)網(wǎng)絡的層數(shù)和計算圖中神經(jīng)元的多少,越多的層和越多的神經(jīng)元,能夠表達的特征空間也就越大,學習過程也就越復雜,但運行時間和內(nèi)存消耗也會越大,而且有可能會出現(xiàn)過擬合的問題,因此最優(yōu)結(jié)果很大程度上取決于參數(shù)選擇是否合理。為了最優(yōu)化模型結(jié)果,本文做了相當多的參數(shù)調(diào)節(jié)。結(jié)果發(fā)現(xiàn),CNN 輸出向量的維度大小、LSTM 層數(shù)、模型學習率的設置、選取的優(yōu)化方法是否合適等是主要影響因素。輸入不同的參數(shù),反復迭代優(yōu)化,最終計算得出最優(yōu)的AUC 值,如圖4 所示。

通過上述實驗比對,卷積-LSTM 組合神經(jīng)網(wǎng)絡模型的核心參數(shù)如表2 所示。

表1:卷積-LSTM 組合算法

表2:卷積-LSTM 組合神經(jīng)網(wǎng)絡模型初始參數(shù)

表3:單一結(jié)構(gòu)的CNN 模型與LSTM 模型參數(shù)設置

表4:實驗環(huán)境配置

表5:實驗運行結(jié)果

3.4 結(jié)果比較與分析

本文的機器配置如表4 所示。

在相同的特征處理環(huán)境下,將訓練集和測試集按8:1 的比例切割,模型每從訓練集中學習完一次,便將測試集輸入做預測和分類,反復迭代30 次后取最優(yōu)AUC 值和log loss 值,并統(tǒng)計迭代過程使用的總時間。

本文一共使用了6 種模型進行點擊率預測,分別有深層和淺層模型。運行結(jié)果如表5 所示。其中邏輯回歸模型用LR 表示;FM模型是以矩陣分解為核心的機器學習算法,它的特點是能夠高效地學習特征之間的聯(lián)系,擅長分析高維度稀疏數(shù)據(jù);NN 是一種常規(guī)的神經(jīng)網(wǎng)絡模型;CNN 代表一種卷積神經(jīng)網(wǎng)絡;CNN+LSTM 代表本文提出的卷積-LSTM 組合的深度學習網(wǎng)絡模型。

本文從幾個方面分析了上述實驗結(jié)果,分別如下:

(1)從模型層數(shù)來看,深層模型在預測方面的效果高于以往的淺層模型。淺層模型在第9 次迭代之后,AUC 值和log loss 值趨于收斂,F(xiàn)M 模型的預測準確度高于LR 模型;與普通NN 模型相比,CNN 與LSTM 的預測效果顯然更好。

(2)比較AUC 值與log loss 值,卷積-LSTM 組合神經(jīng)網(wǎng)絡模型在這兩方面的指標表現(xiàn)都比單一結(jié)構(gòu)的CNN 模型與LSTM 模型要好。與CNN 模型對比,其AUC 值提高了1.38%,log loss 值降低了0.29%;與LSTM 模型對比,其AUC 值提高了2.61%,log loss 值降低了1.38%。

(3)從時間上看,由于卷積-LSTM 組合神經(jīng)網(wǎng)絡模型的層數(shù)相對多一點,復雜度比較高,其訓練總共的時長相比單一層次結(jié)構(gòu)的神經(jīng)網(wǎng)絡模型,會更多一些。

4 結(jié)束語

本文通過充分研究和比較現(xiàn)有的線上搜索廣告集合,分析得出了互異特征之間相關性強,人工提取特征費時費力等不足,最后分析了若干種淺層預測模型與深層預測模型的優(yōu)缺點,研究出了一種新的深度學習模型卷積-LSTM 混合神經(jīng)網(wǎng)絡模型。實驗表明:與傳統(tǒng)的廣告點擊率預測模型相比,卷積-LSTM 組合神經(jīng)網(wǎng)絡模型效果更明顯。通過卷積核移動提取關鍵性特征,降低了人力開銷,又較好地提升了模型效率;使用LSTM 神經(jīng)網(wǎng)絡預測廣告點擊率,提升了分類精度。接下來,本文將繼續(xù)圍繞特征、模型,從工程化方向做迭代,以期達到更好的提升。

猜你喜歡
點擊率神經(jīng)元卷積
《從光子到神經(jīng)元》書評
基于3D-Winograd的快速卷積算法設計及FPGA實現(xiàn)
從濾波器理解卷積
躍動的神經(jīng)元——波蘭Brain Embassy聯(lián)合辦公
基于特征工程的視頻點擊率預測算法
基于傅里葉域卷積表示的目標跟蹤算法
基于二次型單神經(jīng)元PID的MPPT控制
毫米波導引頭預定回路改進單神經(jīng)元控制
喜報!萌寶大賽參賽者660名,投票321657人次,點擊率超60萬!
一種基于卷積神經(jīng)網(wǎng)絡的性別識別方法