吳修權(quán) 鐘其柱
【摘? 要】通過Python Scrapy的方法獲取終端數(shù)據(jù),結(jié)合PCA降維和監(jiān)督學(xué)習(xí)的方式研究了多個終端指標對用戶感知的影響,挖掘不同終端以及指標對VoLTE視頻通話感知的影響。結(jié)合移動終端領(lǐng)域、計算機軟件領(lǐng)域和機器學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)優(yōu)化模型,建立了一個手機設(shè)備端硬件指標對VoLTE視頻通話重要參數(shù)的影響指標體系模型。通過AUC等模型檢驗指標體系模型,評估模型AUC值達到0.7,驗證了該方法的有效性。
【關(guān)鍵詞】VoLTE視頻通話;機器學(xué)習(xí);終端設(shè)備;AUC
doi:10.3969/j.issn.1006-1010.2019.08.008? ? ? 中圖分類號:TN929.5
文獻標志碼:A? ? ? 文章編號:1006-1010(2019)08-0045-06
引用格式:吳修權(quán),鐘其柱. 基于監(jiān)督學(xué)習(xí)的VoLTE視頻通話感知評估方法[J]. 移動通信, 2019,43(8): 45-50.
[Abstract]?Through obtaining terminal data with Python's Scrapy method, the combination of PCA dimension reduction and supervised learning is then adopted to study the impact of multiple terminal indicators on user perception and explore the impact of different terminals and terminal indicators on VoLTE video call perception. Combining the neural network optimization models in the fields of mobile terminal, computer software and machine learning, an indicator system model is established to investigate the impact of mobile device hardware indicators on the important parameters of VoLTE video call. Finally, using AUC models to test the indicator system, the AUC value of the evaluation model reaches 0.7, which verifies its effectiveness.
[Key words]?VoLTE video call; machine learning; terminal equipment; AUC
1? ?引言
隨著通信網(wǎng)絡(luò)的發(fā)展,最初的語音方案逐步顯露出問題。為了提高用戶通話質(zhì)量,運營商加快了VoLTE視頻語音方案的部署。但VoLTE視頻通話也出現(xiàn)花屏、卡頓、色彩等方面不同程度的問題,用戶體驗較差。因此,提升VoLTE視頻通話用戶體驗成為運營商面臨的新挑戰(zhàn)[1]。
目前業(yè)界對視頻用戶體驗的研究大部分都只是停留在用戶體驗、視頻質(zhì)量評估方面的理論研究。對于終端硬件的分析還沒有可實際應(yīng)用的產(chǎn)品和模型。文獻[2]和文獻[3]基于線性回歸的方法研究了視頻序列質(zhì)量評估算法,但是其算法主要針對視頻的質(zhì)量差異進行評估,未真實反映用戶的體驗質(zhì)量。文獻[4]以視頻流媒體為背景,建立了隨機模型評價指標,根據(jù)QoE(Quality of Experience,體驗質(zhì)量)值對評價體系進行評分,得到視頻業(yè)務(wù)的QoE評價模型。但該模型局限于QoE對指標權(quán)重的主觀判斷,并未考慮不同終端指標的區(qū)別,不具備普遍性。文獻[5]通過對比各類視頻的評估方法,利用PEVQ(Perceptual Evaluation of Video Quality,視頻質(zhì)量感知評估)算法,研究TD(Time Division,時分)視頻通話質(zhì)量評估系統(tǒng)。該方案主要對TD網(wǎng)絡(luò)進行優(yōu)化并開展視頻通話質(zhì)量評估系統(tǒng)的設(shè)計,沒有考慮終端硬件指標的綜合影響,忽略了多因素疊加對效果的影響。
針對上述研究中存在的問題,本文提出了一種基于監(jiān)督學(xué)習(xí)的VoLTE視頻終端硬件指標的感知方法,該方法研究終端因素對VoLTE視頻通話質(zhì)量的影響。利用其處理器、屏幕、攝像頭、音頻輸出、視頻輸出等關(guān)鍵參數(shù),得出用戶實際使用評分,結(jié)合機器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)監(jiān)督機制方法,建立VoLTE視頻通話質(zhì)量評估模型,分析出用戶最真實的感知。
2? ?因素分類
對于VoLTE視頻通話的影響因素,除了網(wǎng)絡(luò)原因造成的質(zhì)量問題外,其終端因素也會產(chǎn)生影響。終端硬件的優(yōu)劣是直接影響用戶VoLTE視頻感知的重要因素,其因素主要包括處理器、圖形處理器、主頻、屏幕像素、攝像頭像素等[6],其像素因素與視頻質(zhì)量的關(guān)系如表1所示。
由表1可以看出,終端的像素及分辨率越高,視頻的感知效果越好。本文根據(jù)終端的各個參數(shù)的特征,總結(jié)歸納三個特征參數(shù)來評估終端對VoLTE視頻通話的影響,完成參數(shù)與視頻通話質(zhì)量的映射。
(1)終端處理能力
要使視頻的感知效果越好,對終端處理芯片的計算能力要求也就越高。因此終端視頻處理能力的提升,是實現(xiàn)高效壓縮算法的硬件保障[5]。
(2)攝像頭能力
該功能決定了視頻像素的能力,同時也能夠反映出視頻通話的質(zhì)量,是用戶通話質(zhì)量的直接影響因素。
(3)視頻編解碼器性能
該功能能夠?qū)?shù)字視頻進行壓縮或者解壓縮,是影響視頻質(zhì)量的關(guān)鍵因素。
本方案按照監(jiān)督學(xué)習(xí)的方法分析終端用戶的感知影響,結(jié)合爬蟲技術(shù)(一種按照一定的規(guī)則,自動地抓取萬維網(wǎng)信息的程序或者腳本)和PCA(Principal Components Analysis,主成分分析)對終端參數(shù)進行特征分析,運用降維和特征歸納的方法,精確得出評估結(jié)果。利用機器學(xué)習(xí)在實際使用中的延展性,為VoLTE視頻通話感知評估提供了有效和智能的解決方法。
3? ?原理和方法
為構(gòu)建終端參數(shù)的數(shù)據(jù)集,本方案通過終端瀏覽的相關(guān)網(wǎng)站,采用Python Scrapy框架對瀏覽的手機網(wǎng)站進行爬蟲,獲取手機設(shè)備(均為測試機)的硬件信息。再結(jié)合監(jiān)督機制的機器學(xué)習(xí)對數(shù)據(jù)集自主特征進行選擇學(xué)習(xí),利用神經(jīng)網(wǎng)絡(luò)模型對終端參數(shù)進行特征提取及訓(xùn)練,最后通過AUC(Area Under Curve)、ROC(Price Rate of Change,變動率指標)模型對本方案建立的模型進行驗證,從而完成終端對VoLTE視頻通話質(zhì)量的評估及優(yōu)化,其整體架構(gòu)如圖1所示。
3.1? 數(shù)據(jù)集的構(gòu)建
終端參數(shù)的數(shù)據(jù)集的構(gòu)建是保證數(shù)據(jù)真實性的基礎(chǔ),保證機器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)模型性能的一個關(guān)鍵因素。為此本節(jié)基于網(wǎng)絡(luò)爬蟲,通過Python的Scrapy框架對各大手機設(shè)備網(wǎng)站進行爬蟲,提取終端結(jié)構(gòu)化數(shù)據(jù),其流程如圖2所示:
通過終端瀏覽網(wǎng)頁發(fā)送的HTTP(Hyper Text Transfer Protocol,超文本傳輸協(xié)議)網(wǎng)站信息,Scrapy是通過定義Scrapy Items實現(xiàn)終端信息的抓取,得到網(wǎng)頁中的實體。通過網(wǎng)站爬蟲解析后,將爬蟲的數(shù)據(jù)發(fā)送到機器進行處理并利用特定的次序處理數(shù)據(jù)。然后交給實體管道進一步處理并入庫。
為了增加機器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型的可靠性,將爬蟲得到的終端原始數(shù)據(jù)進行整合、降維、轉(zhuǎn)換并進行特征選擇,獲取終端特征參數(shù),建立可靠的終端數(shù)據(jù)集,以提高模型的準確性。
(1)數(shù)據(jù)整合
爬蟲數(shù)據(jù)和測試數(shù)據(jù)的清洗工作主要內(nèi)容其實是如何將多用戶的評分結(jié)果進行整合,對于同一次VoLTE視頻通話的結(jié)果進行平均,平均后的數(shù)據(jù)作為最后的評分。
(2)數(shù)據(jù)降維與轉(zhuǎn)換
針對上述數(shù)據(jù)用PCA算法進行降維處理。算法如下:
3.2? 機器學(xué)習(xí)模型構(gòu)建
數(shù)據(jù)特征標準化后,需要根據(jù)數(shù)據(jù)的特點選擇不同的數(shù)學(xué)模型。針對用戶進行VoLTE視頻通話遇到的質(zhì)量問題,需要建立一個有監(jiān)督的機器學(xué)習(xí)模型。而神經(jīng)網(wǎng)絡(luò)模型是通過選擇適當(dāng)?shù)碾[含單元和網(wǎng)絡(luò)層次對于一組輸入和輸出數(shù)據(jù)之間的關(guān)系進行建模,具有監(jiān)督機制的機器學(xué)習(xí),符合本方案的要求。并且其擁有強大的擬合能力,能夠描述任何規(guī)模數(shù)據(jù)集之間的關(guān)系。其算法如下:
(1)根據(jù)得到的數(shù)據(jù)集確定此模型輸入層的神經(jīng)元個數(shù)。根據(jù)終端參數(shù)特征,全連接神經(jīng)網(wǎng)絡(luò)包含1個輸入層、1個輸出層和2個隱含層。
(2)初始化神經(jīng)網(wǎng)絡(luò)權(quán)重并設(shè)置學(xué)習(xí)率。運用服從標準正太分布的隨機數(shù)來設(shè)置初始權(quán)重,選擇一個作為基準,確定一個最好的算法方案。
(3)使用Sigmoid函數(shù)作為激活函數(shù),該函數(shù)能夠?qū)?shù)據(jù)進行非線性變化,將輸入值壓縮到0~1,使之有強大的解析數(shù)據(jù)的能力。
Sigmoid函數(shù)公式為:
Sigmoid(x)=1/(1+ex)? ? ? ? ? ? ? (3)
(4)反向傳播。本步驟需要定義損失函數(shù),計算損失函數(shù)關(guān)于神經(jīng)網(wǎng)絡(luò)中各層的權(quán)重的偏導(dǎo)數(shù)(梯度),使用梯度下降的方式優(yōu)化神經(jīng)網(wǎng)絡(luò)參數(shù)。
(5)重復(fù)以上過程,直到模型收斂為止。
隨著訓(xùn)練次數(shù)的增加,模型的損失值震蕩減少。當(dāng)模型損失值不再變化時,表示訓(xùn)練結(jié)束,說明模型已經(jīng)收斂。
3.3? 模型驗證
為了驗證本方案機器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型的算法可行性,本文采用準確率、ROC曲線和AUC面積模型相結(jié)合的方法來衡量模型優(yōu)劣的指標。與準確率和ROC曲線相比較,AUC面積更能保證模型的準確度,如圖3所示。
4? ?效果分析
本方案采用神經(jīng)網(wǎng)絡(luò)的機器學(xué)習(xí)模型對采集的終端信息數(shù)據(jù)進行清洗、預(yù)處理等操作,然后對模型數(shù)據(jù)進行訓(xùn)練,得出評估結(jié)果,具體算法如圖4所示。
為了驗證本方案的機器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型的算法可行性,采用AUC模型對本方案進行準確度驗證,如圖5所示。
可以看出:ROC越往上,分類器效果越好。本方案模型出來的AUC值是0.7,效果比較好。從上述實驗結(jié)果可以看出:基于監(jiān)督學(xué)習(xí)建模的算法和現(xiàn)有的評估模型算法相比[7],其能降低終端特征值的維度并提高標準化的準確率。
為了進一步驗證本方案模型的優(yōu)越性,本文選取市面常見的11款終端,根據(jù)Python的Scrapy架構(gòu)及功能對終端發(fā)送的HTTP信息進行爬蟲,建立數(shù)據(jù)集,然后通過Scrapy中Item Loaders數(shù)據(jù)處理功能,對入庫終端信息進行增加解釋或者清洗,從而獲取手機設(shè)備的硬件信息的原始數(shù)據(jù),包括數(shù)據(jù)類型及參數(shù),如表3所示。
數(shù)據(jù)輸入模型對采集的數(shù)據(jù)進行整合、降維、轉(zhuǎn)換和特征選擇,得到終端的參數(shù)及MOS值,測試評估結(jié)果如表4所示。
將數(shù)據(jù)集輸入機器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型,模擬不同終端對VoLTE視頻指標的影響,具體實驗結(jié)果如表5所示。
對比VoLTE指標排名情況與算法評分結(jié)果,終端的實際指標情況與終端評分結(jié)果吻合,本算法在多終端多維度評估VoLTE視頻通話感知的結(jié)果較準確。