朱格苗 徐 慧 王計斌 閆興秀 余 健
南京華蘇科技有限公司
近年來,隨著通信網(wǎng)絡(luò)的不斷發(fā)展,其復(fù)雜性也越來越高,網(wǎng)絡(luò)優(yōu)化成為運營商面臨的主要問題之一,而準確的工參尤其是方位角是網(wǎng)絡(luò)優(yōu)化的基石,如何獲取正確的方位角是目前研究的重點問題之一。
目前,小區(qū)方位角核查主要采用人工定期巡檢的方法,分批逐步核查全網(wǎng)所有小區(qū)的方位角,該方式不僅耗時、耗人、耗力,而且運維成本較高。另一種自動核查天線方位角的方法是分析小區(qū)覆蓋范圍,目前通常是對路測數(shù)據(jù)進行分析。
目前很多學(xué)者的研究都是從某一方面對天線方位角進行計算,而沒有全面考慮到數(shù)據(jù)的差異。本文利用OTT數(shù)據(jù)、MDT數(shù)據(jù)、MR數(shù)據(jù)和工參數(shù)據(jù),從各個方面考慮數(shù)據(jù)的差異性,相應(yīng)地提出五個算法,分別對用戶數(shù)據(jù)進行分析,從而預(yù)測天線的方位角,并將五種算法通過賦予不同的權(quán)重形成一種聯(lián)合算法。本文方法的主要創(chuàng)新點是將五種預(yù)測算法聯(lián)合在一起,規(guī)避了單獨算法的一些缺點,以達到更高的精度和更好的穩(wěn)定性。
我們的方法收集了三種不同的數(shù)據(jù):用戶數(shù)據(jù)(OTT、MDT)、小區(qū)工參信息表、小區(qū)真實勘站數(shù)據(jù)。
用戶數(shù)據(jù)收集的是特定時間及空間上用戶手機上報的實時信息。最終保留的指標有:小區(qū)唯一標識(ECI)、用戶經(jīng)度、用戶緯度、參考信號接收功率(Reference Signal Received Power,RSRP)(以下簡稱RSRP)。
小區(qū)工參信息表收集的是一定區(qū)域內(nèi)大量小區(qū)的基本信息,每行代表一個ECI。最終保留下列指標:小區(qū)唯一標識(ECI)、小區(qū)經(jīng)度、小區(qū)緯度、工參方位角、小區(qū)覆蓋類型。
小區(qū)真實勘站數(shù)據(jù)收集的是小區(qū)真實的信息,包括小區(qū)唯一標識(ECI)、勘站方位角。
對用戶數(shù)據(jù)進行分析,利用我們的聯(lián)合算法對小區(qū)方位角進行預(yù)測,并且將預(yù)測的方位角和真實勘站的數(shù)據(jù)進行對比,得出算法預(yù)測的準確性。當(dāng)算法的準確性較高時,該算法則投入生產(chǎn)應(yīng)用,這樣則可以節(jié)省大量的人力、物力,不需要對每個小區(qū)進行實際勘站就能獲得準確的工參。
在實際生活中,當(dāng)收集到的樣本數(shù)據(jù)量較小時,預(yù)測值與真實值之間常常會有較大的誤差,為了避免誤差過大,本文將五種基本預(yù)測算法和權(quán)重算法結(jié)合,形成聯(lián)合算法,從而對用戶數(shù)據(jù)進行預(yù)測,這樣可以在一定程度上保證預(yù)測結(jié)果的準確性?;谟脩魯?shù)據(jù)實現(xiàn)天線方位角糾偏的方法主要分為以下5個步驟:
步驟1:收集數(shù)據(jù)。收集用戶數(shù)據(jù)和工參數(shù)據(jù)樣本以及勘站數(shù)據(jù)。
步驟2:數(shù)據(jù)處理。首先將工參表中小區(qū)經(jīng)度和緯度為空的小區(qū)刪除,只選取小區(qū)覆蓋類型為室外的小區(qū),在柵格級多天時間粒度上對用戶數(shù)據(jù)和工參數(shù)據(jù)通過小區(qū)唯一標識碼進行匹配,然后對匹配后的數(shù)據(jù)組進行去重處理,統(tǒng)計每個小區(qū)下的用戶數(shù)據(jù)數(shù)量,僅保留用戶數(shù)據(jù)數(shù)量大于閾值區(qū),根據(jù)小區(qū)經(jīng)緯度和用戶數(shù)據(jù)經(jīng)緯度,計算用戶數(shù)據(jù)到小區(qū)的距離,并且進行異常值檢測,刪除距離較遠的用戶數(shù)據(jù),再通過小區(qū)經(jīng)緯度和用戶經(jīng)緯度計算用戶相對小區(qū)的角度,以正北方位為0度。
步驟3:分別采用基于采樣點強度預(yù)測算法、基于采樣點密度分扇區(qū)預(yù)測算法、基于采樣點強度和密度結(jié)合的預(yù)測算法、基于采樣點強度的分層統(tǒng)計預(yù)測算法、基于采樣點強度分扇區(qū)的預(yù)測算法,計算每個小區(qū)的預(yù)測方位角。
步驟4:使用用戶數(shù)據(jù)和實測的勘站數(shù)據(jù)作為訓(xùn)練集,用步驟3的五種預(yù)測方法對訓(xùn)練集進行預(yù)測,再根據(jù)預(yù)測結(jié)果使用蒙特卡羅方法訓(xùn)練出五種預(yù)測方法的權(quán)重。
步驟5:根據(jù)步驟4的權(quán)重在訓(xùn)練集上得到的預(yù)測效果,選出最優(yōu)權(quán)重,確定最優(yōu)權(quán)重的預(yù)測模型,根據(jù)最優(yōu)權(quán)重的預(yù)測模型對用戶數(shù)據(jù)進行預(yù)測,得出小區(qū)的預(yù)測方位角。
圖1 基于五種預(yù)測模型算法的天線方位角工參清洗的說明示意圖
該算法從采樣點的強度出發(fā),將信號強度作為主要指標進行考慮。主要是計算每個小區(qū)唯一標識碼下RSRP值最大的前n個采樣點角度的均值作為方位角預(yù)測值,n為自然數(shù)。
該算法從采樣點密度分扇區(qū)進行考慮,將采樣點有規(guī)律地劃分為多個區(qū)域。每個小區(qū)唯一標識碼下,以基站經(jīng)緯度為圓心,以基站的正北方向為0度,順時針方向角度增加,每N度劃分一個扇區(qū),將基站的區(qū)域劃分為360/N(取整數(shù))個扇區(qū)。根據(jù)采樣點的經(jīng)緯度和基站的經(jīng)緯度,計算得到采樣點與基站之間相對正北方向的夾角,根據(jù)該角度將采樣點按照到小區(qū)的角度,每N度劃分一個扇區(qū),分成360/N份,將每個采樣點都劃分到其所屬扇區(qū),統(tǒng)計每個扇區(qū)中點的個數(shù),取點的個數(shù)最多的扇區(qū)角度作為方位角預(yù)測值。
該算法將采樣點的密度和強度結(jié)合考慮,首先同2.2中的扇區(qū)的劃分方法一致,進行扇區(qū)劃分,同樣是將采樣點有規(guī)律地劃分成多個區(qū)域。每個小區(qū)唯一標識碼下,將采樣點按照到小區(qū)的角度每N度劃分一個扇區(qū),分成360/N份,N∈[1,360],360/N取整數(shù);然后統(tǒng)計每個小區(qū)唯一標識碼下的采樣點總數(shù)扇區(qū)中采樣點數(shù)占比,取出360/N個扇形區(qū)域中采樣點個數(shù)大于總采樣點d%的扇區(qū),d∈[1,99],計算這些扇區(qū)中RSRP值最大的前n個采樣點RSRP均值,n為自然數(shù),取出RSRP均值最大的扇形區(qū)域t個,t的范圍為[1,360/N]之間的整數(shù),計算這t個扇區(qū)角度的均值作為方位角預(yù)測值。
該算法是在第一個基于采樣點強度的預(yù)測算法的基礎(chǔ)上進行的改進,這個算法考慮距離變量的作用。每個小區(qū)唯一標識碼下,先將距離去重,再計算n-1個不同的百分位數(shù),按照從小到大排列,根據(jù)用戶數(shù)據(jù)到小區(qū)的距離劃分m環(huán),m≥3。第一環(huán):距離≦第一個百分位數(shù);第二環(huán):第一個百分位數(shù)<距離≦第二個百分位數(shù);第三環(huán):第二個百分位數(shù)<距離≦第三個百分位數(shù);第四環(huán):第三個百分位數(shù)<距離≦第四個百分位數(shù);第n環(huán):第n-1個百分位數(shù)<距離,刪除最小環(huán)和最大環(huán)的數(shù)據(jù),保留中間環(huán)數(shù)據(jù);確定位于中間環(huán)中每環(huán)RSRP值最大的前n個采樣點角度均值,最后求前n個采樣點角度均值的均值作為方位角預(yù)測值,n為自然數(shù)。
該算法是在第一個基于采樣點強度的預(yù)測算法的基礎(chǔ)上進行的改進。它將采樣點有規(guī)律地劃分為多個區(qū)域,然后基于采樣點強度進行計算。每個小區(qū)唯一標識碼下,將采樣點按照到小區(qū)的角度每N度劃分一個扇區(qū)分成360/N份,求每個扇區(qū)下RSRP值最大的前n個采樣點的RSRP均值,最后取RSRP均值最大的扇區(qū)角度為方位角預(yù)測值。
為了將前面的五種算法進行聯(lián)合,通過蒙特卡羅方法隨機從訓(xùn)練集中抽取一部分數(shù)據(jù)作為訓(xùn)練樣本,共隨機選取P次得到P份訓(xùn)練樣本;針對每份訓(xùn)練樣本隨機生成Q個權(quán)重組合,Q為自然數(shù);針對每個權(quán)重組合,統(tǒng)計訓(xùn)練模型輸出的預(yù)測方位角與勘站方位角的偏差在R°以內(nèi)的個數(shù)占比作為該權(quán)重組合的置信度,R的取值范圍為[0,360];針對每份訓(xùn)練樣本,確定置信度最大的權(quán)重組合。
在具體實現(xiàn)時,按照如下公式(1)和(2),針對每份訓(xùn)練樣本確定置信度最大的權(quán)重組合。
其中,公式(1)中的Z為實際預(yù)測誤差,angelpredict為預(yù)測方位角,angeltrue為勘站方位角;公式(2)中cost表示權(quán)重組合對應(yīng)的誤差系數(shù),M為訓(xùn)練樣本中總勘站小區(qū)數(shù)量,K為設(shè)定的角度誤差閾值。
從上面的公式可知,權(quán)重組合的置信度為1-cost,例如,cost為20%,則權(quán)重組合的置信度就為1-20%,即為80%。
對于上述的聯(lián)合算法模型,我們通過最終損失函數(shù)值來衡量改進,損失函數(shù)越小則越好,通過訓(xùn)練出的最好模型可以對新的用戶數(shù)據(jù)進行預(yù)測方位角,并根據(jù)最終輸出的結(jié)果更新小區(qū)工參信息。最終選取一部分小區(qū)進行勘站,將預(yù)測結(jié)果和勘站數(shù)據(jù)進行對比,判斷算法的準確性。
本文收集了國內(nèi)某省30天691個小區(qū)的OTT(Over The Top)數(shù)據(jù),并且對這691個小區(qū)進行勘站,獲取小區(qū)真實信息數(shù)據(jù),從而計算聯(lián)合算法預(yù)測結(jié)果的準確性、穩(wěn)定性。
為了確保數(shù)據(jù)的完整性,需要對數(shù)據(jù)進行異常值處理,對缺少小區(qū)唯一標識碼和經(jīng)緯度信息的數(shù)據(jù)予以剔除,刪除采樣點中距離異常的數(shù)據(jù)和重復(fù)的采樣點數(shù)據(jù)。首先將訓(xùn)練數(shù)據(jù)放到模型中訓(xùn)練、預(yù)測,將每個算法得到的預(yù)測數(shù)據(jù)和誤差數(shù)據(jù)保存,接著將訓(xùn)練數(shù)據(jù)放到聯(lián)合算法中訓(xùn)練、預(yù)測,將得到的預(yù)測數(shù)據(jù)和誤差數(shù)據(jù)保存,最后是對比聯(lián)合算法和五種算法的預(yù)測效果,分別計算聯(lián)合算法和五種算法在訓(xùn)練集、驗證集上的誤差,計算誤差小于20度(包含20度)的個數(shù)占比。
在實驗中發(fā)現(xiàn),聯(lián)合算法的預(yù)測準確性更高,使用聯(lián)合算法進行預(yù)測,得到如下所示的一些相關(guān)圖。
圖2是實驗例中某個小區(qū)10米柵格級OTT采樣點RSRP熱力圖,從圖中可以看出該小區(qū)的識別碼、名稱、30天的采樣點數(shù)以及工參方位角和預(yù)測方位角,以及每個柵格中平均RSRP值的強弱。
圖2 10米柵格級OTT采樣點rsrp熱力圖
圖3是實驗例中某市預(yù)測方位角與勘站結(jié)果對比分析圖,分別計算了預(yù)測誤差小于等于20度、35度、45度的小區(qū)個數(shù)占比,從圖中可以看出預(yù)測偏差小于45度的小區(qū)占比達到96.88%,預(yù)測偏差小于35度的小區(qū)占比達到87.53%,預(yù)測偏差小于20度的小區(qū)占比達到80.39%,占比都較大,說明預(yù)測模型有較好的準確性。
圖3 預(yù)測方位角與勘站結(jié)果對比分析圖
圖4、5、6分別是居民小區(qū)、道路小區(qū)、城中村小區(qū)預(yù)測工參與勘站結(jié)果對比分析圖,分別計算了預(yù)測誤差小于等于20度、35度、45度的小區(qū)個數(shù)占比,從圖中可以看出預(yù)測偏差小于45度的小區(qū)占比分別達到95.96%、95.96%、93.96%,預(yù)測偏差小于35度的小區(qū)占比分別達到81.25%、86.25%、87.25%,預(yù)測偏差小于20度的小區(qū)占比分別達到75.36%、82.35%、79.36%,占比都較大且表現(xiàn)一致,可以說明預(yù)測模型在道路、城中村等場景中都有較好的準確性。
圖4 居民區(qū)小區(qū)預(yù)測方位角與勘站結(jié)果對比分析圖
圖5 道路小區(qū)預(yù)測方位角與勘站結(jié)果對比分析圖
圖6 城中村小區(qū)預(yù)測方位角與勘站結(jié)果對比分析
圖7是實施例中方位角錯誤實際效果圖,該小區(qū)中根據(jù)OTT采樣點預(yù)測的方位角為75度,而實際勘測的方位角為60度,但是工參表中的方位角為20度,預(yù)測的方位角與實際勘測的方位角誤差較小,經(jīng)驗證發(fā)現(xiàn),該小區(qū)工參方位角為人為錄入錯誤,此算法為平臺軟件快速甄別小區(qū)方位角異常提供了理論及技術(shù)支撐。
圖7 小區(qū)方位角錯誤實際效果圖
圖8是實施例中接反小區(qū)實際效果圖,圖8中(a)和(b)的藍色加粗線條標注的扇形區(qū)域和紅色加粗線條標注的扇形區(qū)域表示兩個相鄰小區(qū),小區(qū)周邊的各小圓圈表示采樣點。參見圖8中的(a)圖可知,利用本方法提供的上述預(yù)測模型,基于采樣點的數(shù)據(jù),預(yù)測出第一個小區(qū)(紅色加粗線條標注的扇形區(qū)域)的方位角預(yù)測值為300度,而實際勘測第一個小區(qū)的方位角為187度;參見圖8中的(b)圖可知,基于采樣點的數(shù)據(jù),預(yù)測出第二個小區(qū)(紅色加粗線條標注的扇形區(qū)域)的預(yù)測方位角為120度,而實際勘測第二個小區(qū)的方位角為293度,可見,這兩個相鄰小區(qū)的預(yù)測誤差很大,這提供給維護人員作為參考數(shù)據(jù),維護人員現(xiàn)場核查發(fā)現(xiàn)這兩個小區(qū)的天線被人為接反,此算法為平臺軟件快速甄別接反小區(qū)提供了理論及技術(shù)支撐。
圖8 接反小區(qū)實際效果圖
本文提出了一種基于用戶數(shù)據(jù)實現(xiàn)天線方位角糾偏的方法,將五種預(yù)測算法聯(lián)合在一起,規(guī)避了單獨算法的一些缺點,提高了方法的準確性和穩(wěn)定性。經(jīng)實際勘站證明模型的準確性如下:預(yù)測偏差小于45度的小區(qū)占比達到96.88%,預(yù)測偏差小于35度的小區(qū)占比達到87.53%,預(yù)測偏差小于20度的小區(qū)占比達到80.39%,并且在各個場景表現(xiàn)一致。本文通過對分析的數(shù)據(jù)畫柵格級用戶數(shù)據(jù)RSRP熱力圖,獲得小區(qū)周圍的采樣點信息以及預(yù)測的方位角,通過更深層次的分析,可以找出工參中方位角錯誤、接反小區(qū)等問題,以對運營商的工參數(shù)據(jù)進行修正,對其網(wǎng)絡(luò)優(yōu)化工作具有指導(dǎo)意義。