(3)
d.大幅度快變化的電離層相位污染滿足式(4)的兩條準則之一
(4)
針對選取的數(shù)據(jù),電離層相位污染分類方法的具體實現(xiàn)流程為:
a.參照斜向探測掃頻數(shù)據(jù)中的傳播模式信息,提取斜向探測定頻數(shù)據(jù)中相應(yīng)電離層傳播模式(E層、F層)的雙時響應(yīng)C(tc,tp),其中tc表示時間,tp表示群時延,C(tc,tp)是一個復(fù)數(shù)矩陣;
b.通過提取的雙時響應(yīng)獲取相位信息,具體表達式為:
(5)
其中Im(C(tc,tp))和Re(C(tc,tp))分別為雙時響應(yīng)的虛部和實部;
c.將獲取的相位信息拉伸成一條連續(xù)的相位曲線;
d.對拉伸的相位信息使用多項式擬合得到一條斜線來擬合線性相位變化(要求擬合得到的斜線的斜率和初相使相位非線性部分均值為零且均方差最小[12]);
e.用拉伸的相位信息減去以上擬合的線性部分,得到相位的非線性部分,并經(jīng)低通濾波器去除相位曲線上的雜波分量,獲得最終的非線性相位分布[12];
f.預(yù)置A值:根據(jù)原始的相位統(tǒng)計數(shù)據(jù),融合實際應(yīng)用需求,具體確定時域相位擾動幅度范圍尺度門限A,這里設(shè)定A為1弧度;
g.預(yù)置T值:根據(jù)原始的相位統(tǒng)計數(shù)據(jù),融合考慮理論和實際情況,設(shè)定相位擾動周期尺度門限T值范圍為(10±5)秒;
h.預(yù)置D、X值:D和X是頻域的相位擾動尺度門限,根據(jù)選取數(shù)據(jù)相位統(tǒng)計情況,設(shè)定頻域大幅相位擾動尺度門限D(zhuǎn)值范圍為34~37 dB,頻域小幅相位擾動尺度門限X值范圍為27~31 dB;
i.基于步驟(7)~(8)設(shè)定T、D、X值,使用上述式(1)~(4)的電離層相位污染分類準則,通過每組分類結(jié)果的分析和設(shè)定值的調(diào)整,最終確定T、D、X值。
1.3 分類結(jié)果
使用以上電離層相位污染分類方法,對選取數(shù)據(jù)提取相位并分類,最終確定的D、X和T值見圖1和圖2所示。

圖1 相位統(tǒng)計數(shù)據(jù)頻域幅度分布

圖2 相位統(tǒng)計數(shù)據(jù)周期分布
對選取數(shù)據(jù)提取形成共319組數(shù)據(jù),該分類方法有效地將電離層相位污染區(qū)分為小幅度慢變化(55組,見圖3)、大幅度慢變化(121組,見圖4)、小幅度快變化(21組,見圖5)和大幅度快變化(122組,見圖6)四類具有典型特征的電離層相位污染。

圖3 “小幅度慢變化”相位污染

圖4 “大幅度慢變化”相位污染

圖5 “小幅度快變化”相位污染

圖6 “大幅度快變化”相位污染
2 相位污染類型自動識別研究
2.1 基于數(shù)據(jù)挖掘的相位污染類型自動識別方法
采用數(shù)據(jù)挖掘中的聚類分析(k-mean算法)[9-11],從電離層斜向探測定頻頻譜幅度角度,研究電離層相位污染的自動類型識別。電離層相位污染類型識別方法的具體流程為:
a.根據(jù)1.3節(jié)的電離層相位污染分類結(jié)果,將聚類數(shù)設(shè)定為4(相關(guān)距離采用歐幾里得距離);
b.采用最大最小距離算法,從待聚類的樣本中確定4個初始聚類中心;
c.計算每個樣本數(shù)據(jù)到聚類中心的“距離”,將每個樣本聚類到距離其最近的聚類中心的類型中去(相關(guān)距離采用動態(tài)時間彎曲距離,DTW);
d.計算所有聚類的均值作為新的聚類中心(相關(guān)距離采用歐幾里得距離);
e.迭代執(zhí)行(2)~(3),直到滿足迭代終止條件。
上述流程中歐幾里得距離具體表達式為:
(6)
2.2 迭代終止條件
迭代終止條件是在當(dāng)前選擇聚類個數(shù)k和初始中心條件下,使聚類有效性BWP指標(類間類內(nèi)劃分,Between-Within Proportion,BWP)達到最大。因此當(dāng)?shù)M行時,隨著迭代次數(shù)的增加BWP指標值應(yīng)逐漸增大,當(dāng)達到最佳聚類后,BWP值開始下降,因此確定迭代終止的條件為BWP指標值達到最大。
令K={X,R}為聚類空間,其中X={x1,x2,…,xn},假設(shè)n個樣本對象被聚類為c類,BWP指標及相關(guān)概念定義如下:
a.第j類的第i個樣本的最小類間距離b{j,i}為該樣本到其它每個類中樣本平均距離的最小值,具體表達式為:
(7)

b.第j類的第i個樣本的類內(nèi)距離w(j,i)為該樣本到第j類中其它所有樣本的平均距離,具體表達式為:
(8)

c.第j類的第i個樣本的聚類距離baw(j,i)為該樣本的最小類間距離和類內(nèi)距離之和,具體表達式為:
baw(j,i)=b(j,i)+w(j,i)
(9)
d.第j類的第i個樣本的聚類離差距離bsw(j,i)為該樣本的最小類間距離和類內(nèi)距離之差,具體表達式為:
bsw(j,i)=b(j,i)-w(j,i)
(10)
e.第j類的第i個樣本的BWP指標為該樣本的聚類離差距離和聚類距離的比值,具體表達式為:
(11)
2.3 初始中心選擇方法
采用基于最大最小距離算法實現(xiàn)初始中心選擇。最大最小距離算法是模式識別領(lǐng)域中的一種基于試探的算法,其基本思想是取盡可能離得遠的對象作為聚類中心,避免了初值選取時可能出現(xiàn)的初始聚類中心過于鄰近的情況,不僅能夠自動確定初始聚類中心,而且提高了樣本劃分的效率。
具體實現(xiàn)流程為:
a.根據(jù)樣本集的特征,選取距離所有樣本中心(均值)最近的一個樣本作為第一個初始聚類中心C1;
b.當(dāng)搜索的聚類數(shù)為2時,從待分類的樣本中選出距離C1最遠的樣本作為第二個初始聚類中心C2,輸出2個初始聚類中心;
c.當(dāng)搜索的聚類數(shù)為3時,計算未被作為聚類中心的各樣本與已確定類中心C1、C2之間的距離,并求出它們之中的最小值di,根據(jù)Dt=max{di},選擇第t個樣本作為第三個初始聚類中心,輸出3個初始聚類中心;
d.依次確定第k個聚類初始中心,選擇樣本距離已確定中心所有距離中最大的作為第k個初始聚類中心,輸出k個初始聚類中心。
上述實現(xiàn)流程中相關(guān)距離采用動態(tài)時間彎曲距離(DTW)。
2.4 類型自動識別結(jié)果
使用以上相位污染類型自動識別方法,自動識別選取數(shù)據(jù)的相位污染類型。共319組提取相位數(shù)據(jù),通過最大最小距離算法選定4個初始中心,進行K-mean聚類,用BWP標準檢驗是否為最佳分類。

圖7 “大幅度慢變化”類型相位污染自動識別結(jié)果
類型自動識別結(jié)果見圖7~圖10所示,綠色粗實線表示每類的類中心,其它細實線表示樣本數(shù)據(jù),第一類共87組數(shù)據(jù),第二類共31組數(shù)據(jù),第三類共82組數(shù)據(jù),第四類共119組數(shù)據(jù)。將類型自動識別結(jié)果與第1.3節(jié)按照相位分布特性統(tǒng)計分類的結(jié)果對照,第一類為大幅度慢變化,自動識別匹配率為31.4%,第二類為小幅度快變化,自動識別匹配率為14.3%,第三類為小幅度慢變化,自動識別匹配率為36.4%,第四類為大幅度快變化,自動識別匹配率為40.2%。

圖8 “小幅度快變化”類型相位污染自動識別結(jié)果

圖9 “小幅度慢變化” 類型相位污染自動識別結(jié)果

圖10 “大幅度快變化”類型相位污染自動識別結(jié)果
3 不同類型污染抑制算法研究
基于1.3電離層相位污染分類結(jié)果,采用已有典型解污染算法(最大熵譜估計法[3]、相位梯度法[4]、時頻分析法[5]、特征分解法[6]和分段多項式建模法[7-8])分析研究不同類型污染的適用性抑制算法。
3.1 “小幅度慢變化”類型相位污染抑制
按照相位分布特性統(tǒng)計符合“小幅度慢變化”相位污染的斜測數(shù)據(jù)共55組,從中選取18組頻譜展寬較大的數(shù)據(jù),采用已選算法解污染處理后,經(jīng)比較最大熵譜估計法的效果較好。其中,8組數(shù)據(jù)抑制后與抑制前無太大差別;10組數(shù)據(jù)抑制后,展寬變窄,頻譜銳化度明顯提高,如圖11所示。也就是說最大熵譜估計法針對選取數(shù)據(jù)55.6%均有明顯的污染抑制效果。

圖11 最大熵譜估計法解污染結(jié)果(“小幅度慢變化”類型)
3.2 “大幅度慢變化”類型相位污染抑制
按照相位分布特性統(tǒng)計符合“大幅度慢變化”相位污染的斜測數(shù)據(jù)共121組,從中選取35組頻譜展寬較大的數(shù)據(jù),采用已選算法解污染處理后,經(jīng)比較最大熵譜估計法的效果較好。其中,11組數(shù)據(jù)抑制后與抑制前無太大差別;3組數(shù)據(jù)抑制后結(jié)果反而變差;21組數(shù)據(jù)抑制后,展寬變窄,頻譜銳化度明顯提高,如圖12所示。也就是說最大熵譜估計法對選取數(shù)據(jù)60%均有明顯的污染抑制效果。

圖12 最大熵譜估計法解污染結(jié)果(“大幅度慢變化”類型)
3.3 “小幅度快變化”類型相位污染抑制
按照相位分布特性統(tǒng)計符合“小幅度快變化”相位污染的斜測數(shù)據(jù)共21組,從中選取3組頻譜展寬較大的數(shù)據(jù),采用已選算法解污染處理后效果均不太佳,與抑制前均無太大差別。
3.4 “大幅度快變化”類型相位污染抑制
按照相位分布特性統(tǒng)計符合“大幅度快變化”相位污染的斜測數(shù)據(jù)共122組,從中選取62組頻譜展寬較大的數(shù)據(jù),采用已選算法解污染處理后,經(jīng)比較相位梯度法的效果較好。其中,10組數(shù)據(jù)抑制后與抑制前無太大差別;4組數(shù)據(jù)抑制后結(jié)果反而變差;48組數(shù)據(jù)抑制后,展寬變窄,頻譜銳化度明顯提高,如圖13所示。也就是說相位梯度法針對選取數(shù)據(jù)77.4%均有明顯的污染抑制效果。

圖13 相位梯度法解污染結(jié)果
4 結(jié) 語
使用試驗獲取的斜向探測電離層頻譜數(shù)據(jù),結(jié)合電離層電波傳播特性,統(tǒng)計分析了回波數(shù)據(jù)相位變化快慢特性,依據(jù)相位時域、頻域相關(guān)特征參數(shù)建立了電離層相位擾動分類識別準則?;谠摐蕜t,通過參數(shù)區(qū)域搜索的方式能夠?qū)㈦婋x層相位污染有效區(qū)分為“小幅度慢變化”、“大幅度慢變化”、“小幅度快變化”和“大幅度快變化”四類具有典型特征的電離層相位污染,該研究為不同類型電離層相位污染抑制處理算法的建立提供了重要數(shù)據(jù)支撐。
采用數(shù)據(jù)挖掘技術(shù)中的聚類分析算法對電離層相位污染開展了類型自動識別研究,分析了聚類算法中最常用的k-mean算法,并在此基礎(chǔ)上,結(jié)合電離層電波傳播特性,依據(jù)不同相位污染類型引起頻譜展寬程度、譜峰分裂程度等顯著特性,按照相位統(tǒng)計劃分的四種典型電離層相位污染類型,建立了污染類型自動識別算法,使用該算法對試驗獲取的斜向探測電離層頻譜數(shù)據(jù)進行了相位污染類型自動識別處理,結(jié)果顯示“大幅度慢變化”、“小幅度快變化”、“小幅度慢變化”、“大幅度快變化”四種典型污染的自動識別率分別為31.4%、14.3%、36.4%、40.2%,平均識別率達30.6%.證明利用數(shù)據(jù)挖掘中的聚類分析算法對電離層相位污染進行自動類型識別具有一定的可行性。該研究可為OTHR及相關(guān)天波探測系統(tǒng)回波信號電離層污染的實時自適應(yīng)分類提供技術(shù)支撐,對于進一步實時的電離層解污染研究具有重要意義。
基于電離層相位污染分類結(jié)果,采用已有典型解污染算法,開展了不同類型污染的適用性抑制方法研究。結(jié)果最大熵譜估計法對“小幅度慢變化”和“大幅度慢變化”類型污染具有較好的抑制效果,選取數(shù)據(jù)中分別有55.6%和60%的數(shù)據(jù)抑制后展寬變窄,頻譜銳化度明顯提高;相位梯度法對“大幅度快變化”類型污染具有較好的抑制效果,選取數(shù)據(jù)中有77.4%的數(shù)據(jù)抑制后展寬變窄,頻譜銳化度明顯提高。因而可見合理的電離層污染分類為進一步的解污染算法創(chuàng)造了較優(yōu)越的使用條件,能夠有效提高電離層解污染性能,從而提高OTHR及相關(guān)天波探測系統(tǒng)的能力。
進一步應(yīng)深入研究的工作有:一是電離層相位污染分類的完整性,即上述四種分類是否就能夠完全涵蓋所有或絕大多數(shù)的相位污染類型;二是改進算法提高相位污染類型自動識別率;三是分析、驗證已有解污染算法的適應(yīng)條件、適用污染類型,并對其尚存問題進行改進,提高算法的解污染性能;四是對目前尚無解決方法的相位污染類型,從電離層電波傳播和信號處理兩方面,研究具體的解污染思路。
[1] 周文瑜,焦培南.超視距雷達技術(shù)[M].北京:電子工業(yè)出版社,2008.
[2] 凡俊梅,焦培南,肖景明.海洋雜波對高頻雷達檢測海面上低速目標的影響[J].電波科學(xué)學(xué)報,1997,12(2):205-210.
[3]BOURSILLONA,GAUTHIERF,PARENTJ.Useofmaximumentropyspectralanalysistoimproveshipdetectionbyover-the-horizonradar[J].RadioScienc-e,1987,22(2):313-320.
[4]PARENTJ,BOURDILLONA.“AmethodtocorrectHFskywavebackscatteredsignalsforionosphericfrequencymodulation”,IEEETrans.onAntennasandPropagation[J], 1988,Vol.36,No.1,pp.127-135.
[5]HOWLANDPE,COOPERDC.UseoftheWigner-Villedistributiontocompensateforionosphericlayermovementinhighfrequencyskywaveradarsystems[J].IEEEProceedings-F,1993,140(1):29-36.
[6]ANDERSONSJ,ABRAMOVICHYI.Aunifiedapproachtodetection,classificationandcorrectionofionosphericdistortioninHFskywaveradarsystems[J],RadioSci.1998, 33(4):1055-1067.
[7]LUKun,WANGJiong,LIUXingzhao.Apiecewiseparametricmethodbasedonpolynomialphasemodeltocompensateionosphericphasecontamination[C]//ProofICASSP.HongKong,2003:405-409.
[8] 李雪,鄧維波,焦培南,等.多項式建模解電離層相位污染階數(shù)選擇新方法[J].電波科學(xué)學(xué)報,2009,24(6):1094-1098.
[9] 姜園,張朝陽,仇佩亮,等.用于數(shù)據(jù)挖掘的聚類算法[J].電子與信息學(xué)報,2005,27(4):655-662.
[10]田森平,吳文亮.自動獲取k-means聚類參數(shù)k值的算法[J].計算機工程與設(shè)計,2011,32(1):274-276.
[11]周世兵.聚類分析中的最佳聚類數(shù)確定方法研究及應(yīng)用[D].江南大學(xué),博士學(xué)位論文,2011.
[12]陳罡,趙正予,王烽.應(yīng)用武漢電離層斜向返回探測系統(tǒng)測量回波相位[J].電波科學(xué)學(xué)報,2007,22(2):271-275.[13]張賢達.現(xiàn)代信號處理[M].北京:清華大學(xué)出版社,2002年第2版.

魯轉(zhuǎn)俠 (1978—),女,陜西人,高級工程師,主要研究方向為電離層模式識別、傳播特性分析及回波信號處理;
E-mail:zhuanxialu@163.com
李吉寧 (1982—),男,山東人,工程師,主要研究方向為電離層電波傳播、高頻雷達和信號處理;
李 雪 (1981—),男,黑龍江人,高級工程師;主要研究方向為電離層回波信號處理、雷達信號處理;
郭曉彤 (1989—),女,河北人,主要研究方向為電離層電波傳播、雷達信號處理;
白 樺 (1981—),男,內(nèi)蒙古人,工程師,主要研究方向為復(fù)雜電磁環(huán)境。
Research on Classification and Recognition Method of Ionospheric Phase Contamination
LU Zhuan-xia1, LI Ji-ning1, LI Xue1, GUO Xiao-tong2
(1.China Research Institute of Radiowave Propagation, Qingdao Shandong 266107, China; 2.Group 63898,henan jiyuan 454650)
The non-stationary characteristic of the ionosphere makes the phase disturbance of the radar echo signal of the ionosphere, long time coherent accumulation leads to the spread of clutter spectrum,this affects the ship and other target signal detection.By phase analysis of the ionospheric echo signal,the classification criterion of the ionospheric phase contamination are established.Based on this criterion, the ionospheric contamination can be divided into four types.An automatic recognition algorithm for ionospheric phase contamination is proposed based on the clustering analysis algorithm in data mining,this algorithm can automatically recognize the contamination type.The matching rate of the automatic recognition result and the phase statistical classification result is 30.6% on average.On the basis of the classification of ionospheric phase contamination, the correction algotithms has been studied by using the existing typical algorithms for different types of ionospheric contamination.the results are that success rates of the maximum entropy method are 55.6% and 60% respectively for the two kinds of small-amplitude-slow-hange contamination and large-amplitude slow-change contamination, the success rate of phase gradient method is 77.4% for large-amplitude-fast-change contamination.Therefore, it is proved that the reasonable real-time type recognition of ionospheric phase contamination can be used to create more favorable conditions for contamination correction, so as to effectively improve the performance of contamination correction, this has important significance for improving the performance of OTHR ship target detection.
ionosphere; data mining; oblique sounding; backscattering
??理論
10.3969/j.issn.1673-5692.2016.05.009
2016-01-10
2016-09-06
國家自然科學(xué)基金項目(61302006);國家自然科學(xué)基金項目(61331012)
:A
1673-5692(2016)05-503-07