袁曼麗
摘要:雖然目前各運營商已經(jīng)大規(guī)模建設(shè)4G網(wǎng)絡(luò),但大部分用戶語音通信仍承載在GSM網(wǎng)絡(luò)上,如何提升GSM網(wǎng)絡(luò)的通話質(zhì)量,是提升網(wǎng)絡(luò)用戶感知的重要手段之一。文章通過采用目前流行的數(shù)據(jù)挖掘工具SPSS軟件,運用數(shù)據(jù)挖掘的原理,查找影響語音通話質(zhì)量提升的各個因素,為后續(xù)的網(wǎng)絡(luò)優(yōu)化提供明確方向。
關(guān)鍵詞:數(shù)據(jù)挖掘;GSM;語音質(zhì)量;MOS
中圖分類號:TP181 文獻標(biāo)識碼:A 文章編號:1007-9416(2017)10-0041-02
1 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、事先不知道的、但又是潛在有用的信息和知識的過程。跨行業(yè)數(shù)據(jù)挖掘標(biāo)準(zhǔn)過程(CRISP-DM)適用于大型工業(yè)和商業(yè)實踐的一般標(biāo)準(zhǔn),在各種KDD過程模型中占據(jù)領(lǐng)先位置,采用量達到近60%。數(shù)據(jù)挖掘標(biāo)準(zhǔn)過程主要分為商業(yè)理解、數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備、建模、模型評估、結(jié)果發(fā)布等六個階段。
CRISP—DM保證了可以將傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)(包括軟件SPSS)應(yīng)用在網(wǎng)絡(luò)優(yōu)化這個行業(yè)上。
2 基于數(shù)據(jù)挖掘的GSM語音質(zhì)量影響參數(shù)分析
GSM語音質(zhì)量MOS值與RXQual、C/I、編碼方式、信道類型、Band與切換次數(shù)相關(guān),但缺乏實際的數(shù)據(jù)支撐,在本文中,引入數(shù)據(jù)挖掘工具,采用實測數(shù)據(jù),分析各個影響因素的關(guān)系。
2.1 原始數(shù)據(jù)處理
從ATU軟件導(dǎo)出的數(shù)據(jù)中包含大量的缺省值,其中屬性Time、Longitude和latitude是連續(xù)上傳,MOS每隔20秒左右上傳一個值,C/I(dB)、channel Mode等是每隔0.5秒左右上傳一個取值,且各個屬性上傳時間點不統(tǒng)一,數(shù)據(jù)包含噪聲大。
2.2 不同編碼方式轉(zhuǎn)換對語音質(zhì)量影響分析
GSM網(wǎng)絡(luò)中,編碼方式對MOS值影響較大,現(xiàn)網(wǎng)中存在四種編碼方式有四種(EFR、AMR FR、AMR HR、HR)數(shù)據(jù),利用SPSS工具,對測試的數(shù)據(jù)進行統(tǒng)計分析,可以明顯得出各個編碼方式對語音質(zhì)量的影響情況。
不同編碼方式的轉(zhuǎn)換時的MOS均值:如表1所示。
從上述統(tǒng)計數(shù)據(jù)可以得出:控制不同編碼之間轉(zhuǎn)換對MOS值的影響,應(yīng)重點減少從EFR到AMR HR和HR的轉(zhuǎn)換,即盡量減少AMR HR與HR在全網(wǎng)的比重。EFR和AMR FR之間轉(zhuǎn)換對MOS值影響不明顯,為減少編碼方式轉(zhuǎn)換,可選擇盡量增加EFR在全網(wǎng)的比重。
2.3 不同因素對語音質(zhì)量影響權(quán)重分析
為探究GSM語音質(zhì)量MOS值與RXQual、C/I、編碼方式、信道類型、Band與切換次數(shù)之間的關(guān)系,在數(shù)據(jù)分析中,引入數(shù)據(jù)挖掘中的決策樹,并采用C5.0的決策樹模型生產(chǎn)規(guī)則集,根據(jù)不同的字段再次分割由第一次分割定義的每個子樣本,且此過程會重復(fù)下去直到無法繼續(xù)分割子樣本。最后,將重新檢查最底層分割,并刪除或修剪對模型值沒有顯著貢獻的分割。
SPSS軟件中自帶有決策樹分析模型,導(dǎo)入數(shù)據(jù),利用SPSS軟件,得出各種不同因素對語音質(zhì)量影響如圖1所示。
從上圖可以看出,切換次數(shù)對MOS值的影響最大,RXQual次之,因此在MOS優(yōu)化中,要優(yōu)先對影響大的的因子的重點優(yōu)化。
3 結(jié)語
本文針對測試的海量數(shù)據(jù),使用SPSS數(shù)據(jù)挖掘軟件,運用數(shù)據(jù)挖掘基本原理,深入研究網(wǎng)絡(luò)MOS影響因素,并從量化的角度,計算各個因素的影響權(quán)重,為后語音通話質(zhì)量優(yōu)化明確方向。同時數(shù)據(jù)挖掘作為一個通用的數(shù)據(jù)分析方法,也為后續(xù)網(wǎng)絡(luò)質(zhì)量分析提升,提供新的研究方法。
參考文獻
[1]張玉.我國數(shù)據(jù)挖掘研究現(xiàn)狀分析--基于共詞分析視角[J],情報科學(xué),2011,(10).
[2]李繼.GSM語音質(zhì)量提升方案綜述[J].電信工程技術(shù)與標(biāo)準(zhǔn)化,2011,(05).
[3]林建鋒,朱猛.有關(guān)在移動通信中語音質(zhì)量評估體系--MOS值的探討[J],赤峰學(xué)院學(xué)報(自然科學(xué)版),2009,(08).
[4]陸安生,屠浩文.數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則技術(shù)的應(yīng)用[J].商場現(xiàn)代化,2005,(08).endprint