李會(huì)超,劉 鵬,劉志紅,儀垂杰
(青島理工大學(xué) 機(jī)械工程學(xué)院,山東 青島 266033)
目前的各種壓縮方法在處理現(xiàn)實(shí)問題時(shí)會(huì)出現(xiàn)不足和缺陷,壓縮感知理論應(yīng)運(yùn)而生。由于壓縮感知理論在數(shù)據(jù)處理領(lǐng)域具有突出優(yōu)勢,所以一經(jīng)問世就引起了相關(guān)領(lǐng)域的廣泛關(guān)注,該理論指出了將模擬信號(hào)直接采樣壓縮為數(shù)字形式的有效途徑,可以實(shí)現(xiàn)信息的直接采樣。從理論上講,冗余在所有的信號(hào)中都會(huì)存在,因此任何信號(hào)都具有可壓縮性,只要能找到合適的稀疏基,就能夠?qū)π盘?hào)進(jìn)行有效地壓縮采樣,然后通過優(yōu)化計(jì)算重建出原始信號(hào)。壓縮感知理論突破了傳統(tǒng)方法對(duì)信號(hào)壓縮采樣的限制,利用信號(hào)的稀疏性將算法的復(fù)雜性問題徹底解決,為信號(hào)后期的處理奠定了基礎(chǔ)。在運(yùn)動(dòng)聲源的識(shí)別過程中,從圖像、語音信號(hào)的數(shù)據(jù)獲取到傳遞,再到數(shù)據(jù)處理,每個(gè)過程都涉及到大量的數(shù)據(jù)。針對(duì)研究中大量數(shù)據(jù)存在導(dǎo)致處理過程復(fù)雜的問題,提出了在聲源識(shí)別的數(shù)據(jù)處理過程中運(yùn)用壓縮感知理論,并通過實(shí)驗(yàn)證明了通過壓縮感知處理后的數(shù)據(jù)可以更清晰的實(shí)現(xiàn)聲源識(shí)別。壓縮感知流程圖,如圖1所示。
圖1 信號(hào)壓縮感知流程圖Fig.1 Signal Compressed Sensing Flow Chart
由壓縮感知理論描述可知,如果信號(hào)在某個(gè)變換域上是可壓縮的,那么原來的信號(hào)就可以通過一個(gè)觀測矩陣實(shí)現(xiàn)從高維信號(hào)到低維空間的轉(zhuǎn)換。然后在求解優(yōu)化問題的基礎(chǔ)上,將原始信號(hào)從少量的稀疏表示中重構(gòu)出來。信號(hào)稀疏定義是:信號(hào)x∈Rn×1,對(duì)于正交基(Ψi:i=1,2,3…n,Ψi∈Ψ),信號(hào)在基上的投影(即變化因子)為 Si=<x,Ψi>,若存在某個(gè)正實(shí)數(shù) 0<p<2,以及正實(shí)數(shù) E>0,使≤E,則稱信號(hào)在變換域Ψ上是稀疏的;從廣義上講,如果信號(hào)s中存在K個(gè)非零元素,則稱信號(hào)x為K的稀疏信號(hào)。
信號(hào)x(t)的稀疏性或可壓縮性是應(yīng)用壓縮感知理論的重要前提,因此,首先要知道信號(hào)的稀疏表示。傅里葉變換可以有效地稀疏表示時(shí)變信號(hào),離散傅里葉變換(DFT)是傅里葉變換在時(shí)域和頻率都呈離散的形式,將信號(hào)的時(shí)域采樣變換為其DFT頻率采樣。對(duì)于 N 點(diǎn)序列{x[n]}0≤n≤N的離散傅里葉變換為:
此,DFT矩陣具有正交性,能稀疏完整地表示時(shí)變信號(hào)。
壓縮感知過程的本質(zhì)是將一個(gè)信號(hào)在測量矩陣的基礎(chǔ)上進(jìn)行處理,實(shí)現(xiàn)由高維空間到低維空間的映射轉(zhuǎn)換。因?yàn)橛行┣闆r下信號(hào)的恢復(fù)程度受限制,為了盡可能精確的從測量值中恢復(fù)原始信號(hào),E.Candès和T.Tao提出壓縮感知矩陣必須滿足約束等距性條件(RIP),并給出了相關(guān)定義。對(duì)于稀疏度為K的稀疏信號(hào)α,RIP定義如下:
式中:矩陣Θ=ΦΨ為感知矩陣,δK—K階約束等距常數(shù),如果δK∈[0,1),那么可以判斷出這個(gè)感知矩陣可以滿足約束等距性條件。
若一個(gè)感知矩陣是已經(jīng)確定好的,要想運(yùn)用公式或者數(shù)學(xué)方法來驗(yàn)證這個(gè)矩陣能不能滿足約束等距性的條件非常困難,為了解決這一問題,Baraniuk在之后提出了約束等距特性的等價(jià)條件,也就是壓縮測量矩陣Φ與稀疏表示矩陣Ψ不相關(guān),同樣可以滿足重構(gòu)的要求。相關(guān)的系數(shù)定義為:
Φ與Ψ的列向量之間的相關(guān)性由相關(guān)系數(shù)進(jìn)行了定義,Φ與Ψ之間的相關(guān)系數(shù)取值范圍為兩者之間的相關(guān)系數(shù)與原始信號(hào)被壓縮測量值所攜帶的信息量有密切關(guān)系,相關(guān)系數(shù)越小則攜帶的信息量就越大,準(zhǔn)確重構(gòu)原始信號(hào)的可能性也就越大。
要驗(yàn)證一個(gè)矩陣是不是能作為壓縮測量矩陣可以用約束等距性條件和相關(guān)特性檢驗(yàn),但是不能由這兩個(gè)約束性來指導(dǎo)壓縮測量矩陣的構(gòu)造。
在傳感矩陣中的大多數(shù)的元素來自獨(dú)立同分布的隨機(jī)變量。而正因?yàn)檫@些元素服從一些預(yù)定的分布,所以其產(chǎn)生的隨機(jī)矩陣滿足約束等距性的概率也會(huì)比較高,所需的測量次數(shù)也隨之減少。隨機(jī)高斯、伯努利或部分傅里葉矩陣等已經(jīng)通過實(shí)驗(yàn)證明,均能滿足約束等距性,且所用的測量次數(shù)與稀疏度成線性關(guān)系。
現(xiàn)將一幀512點(diǎn)語音信號(hào)作為實(shí)驗(yàn)樣品,通過相同數(shù)據(jù)恢復(fù)算法,在觀測矩陣和壓縮比不同的情況下比較數(shù)據(jù),得到結(jié)果,如圖2所示。其中,USE、RSE、RST分別表示隨機(jī)高斯觀測矩陣、隨機(jī)貝努利觀測矩陣、部分傅里葉矩陣,并作為觀測矩陣,再經(jīng)過BP(基追蹤算法)進(jìn)行信號(hào)重構(gòu),并得到重構(gòu)以后的重構(gòu)語音信噪比曲線圖,如圖2所示。
圖2 基于不同觀測矩陣重構(gòu)語音信信噪比曲線Fig.2 Reconstructed Speech Signal to Noise Ratio Curve Based on Different Observation Matrix
從圖2的曲線比較中可得:當(dāng)觀測矩陣選擇USE、RSE、RST時(shí),在壓縮比M/N增大的同時(shí),語音的重構(gòu)信噪比也不斷提高;相比而言,選用RST作為觀測矩陣時(shí)重構(gòu)語音性能較差。考慮到隨機(jī)高斯矩陣的優(yōu)越性,而且是目前最常用并能同時(shí)滿足RIP約束性的觀測矩陣,所以在后期的實(shí)驗(yàn)數(shù)據(jù)處理階段將以隨機(jī)高斯矩陣(USE)作為觀測矩陣。
下面以四種算法分別在采樣率為(0.1~0.8)時(shí)的峰值信噪比(PSNR)、相對(duì)誤差(Relative-error)、匹配度(Mat-rat)以及運(yùn)行時(shí)間(Time)的曲線圖進(jìn)行直觀比較分析,如圖3、圖4所示。
圖3 峰值信噪比曲線圖Fig.3 Peak Signal to Noise Ratio
圖4 相對(duì)誤差曲線圖Fig.4 Relative Error Curve
由圖3可以看出,當(dāng)采樣率較低時(shí)四種算法的峰值信噪比都比較低。隨著采樣率的增大,各種算法的峰值性噪比也逐漸增大,其中以ROMP算法增大的速率最快。采樣率較高時(shí),ROMP算法的PSNR值和其它三種算法相比明顯較高,因此在采樣率較高的情況下選用ROMP算法進(jìn)行信號(hào)重構(gòu)最為合適。峰值信噪比較低時(shí),這幾種算法都適用。由圖4中曲線可以得出,當(dāng)采樣率較低時(shí),相對(duì)誤差都很接近。而且可以看出以上四種算法的相對(duì)誤差在采樣率不斷提高的同時(shí)逐漸減小。由此可以得出算法的誤差性能可以通過采樣數(shù)目的增加得到改善。從圖中可以明顯看出當(dāng)采樣率較高時(shí),ROMP算法的相對(duì)誤差下降速度最快。匹配度與運(yùn)行時(shí)間曲線圖,如圖5、圖6所示。
圖5 匹配度曲線圖Fig.5 Matching Degree Curve
圖6 運(yùn)行時(shí)間曲線Fig.6 Running Time Curve
從圖5中曲線可以看出,四種算法的匹配度都比較高,但是ROMP算法的匹配度隨著采樣率的上升趨勢更明顯,由此看出同等情況下ROMP算法優(yōu)于其它三種算法。
從圖6可以看出,SP算法的運(yùn)行時(shí)間太長,而MP、OMP、ROMP三種算法的運(yùn)行時(shí)間變化較小,且三種算法的時(shí)間差距不大。
統(tǒng)籌考慮以上所有分析結(jié)果,ROMP算法無論在重構(gòu)質(zhì)量還是在重構(gòu)的速度方面都是實(shí)現(xiàn)信號(hào)重構(gòu)應(yīng)該首先考慮的選擇。
分別以500Hz、1kHz、3kHz的聲源進(jìn)行測試,每個(gè)頻率做三組實(shí)驗(yàn),最后對(duì)同頻率的實(shí)驗(yàn)結(jié)果以偏移距離、區(qū)域面積作為參考因素進(jìn)行比較、分析。
實(shí)驗(yàn)1通過聲像儀進(jìn)行聲源識(shí)別,針對(duì)三個(gè)頻率,得到的聲場圖,如圖7所示。
圖7 聲相儀識(shí)別下的不同頻率聲場圖Fig.7 The Different Frequency of Sound Field Sound Identification Under Phase Diagram
實(shí)驗(yàn)2讓聲源以相同的速度運(yùn)動(dòng),通過LMS系統(tǒng)獲取實(shí)驗(yàn)數(shù)據(jù)實(shí)現(xiàn)聲源識(shí)別,最終得到的識(shí)別效果,如圖8所示。
圖8 LMS測試系統(tǒng)識(shí)別下的不同頻率聲場圖Fig.8 The Different Frequency of Sound Field Map Recognition Based on LMS Test System
實(shí)驗(yàn)3首先通過LMS系統(tǒng)獲取實(shí)驗(yàn)數(shù)據(jù),利用離散余弦變換以采樣率0.2對(duì)收集到的原始圖像和語音信號(hào)進(jìn)行稀疏化處理,再以高斯隨機(jī)矩陣作為測量矩陣得到原始信號(hào)的測量值,然后通過ROMP重構(gòu)算法得到處理后的信號(hào)。最后通過模擬軟件對(duì)壓縮重構(gòu)的信號(hào)進(jìn)行分析,實(shí)現(xiàn)到聲源識(shí)別,經(jīng)過處理后得到的效果圖,如圖9所示。
以上數(shù)據(jù)是不同頻率的聲源在運(yùn)動(dòng)過程中隨機(jī)選取的一點(diǎn),并用三種不同的方式對(duì)聲源識(shí)別研究得到的結(jié)果。下面分別以偏移距離、區(qū)域面積以及測量聲壓級(jí)范圍來判斷聲源識(shí)別效果的優(yōu)劣,其中偏移距離表示的是識(shí)別的聲源所在位置與麥克風(fēng)陣列中心點(diǎn)位置的偏移量,數(shù)值越小說明聲源點(diǎn)越接近理想的中心位置。區(qū)域面積是對(duì)聲源識(shí)別性能的判斷,首先可以判斷是否存在虛假聲源,因?yàn)楸緦?shí)驗(yàn)在消聲室進(jìn)行,可以不考慮虛假聲源。其次在偏移距離一定的情況下,區(qū)域面積越大說明對(duì)聲場的描述越詳細(xì)即識(shí)別的效果越好。下面分別對(duì)500Hz、1kHz以及3kHz聲源的整個(gè)運(yùn)動(dòng)過程選取具有一定代表性的點(diǎn)做分析,結(jié)果,如圖10、圖11所示。
圖10 不同頻率下的偏移距離圖Fig.10 The Offset Distance Map Under Different Frequency
圖11 不同頻率下的區(qū)域面積圖Fig.11 Regional Area Map at Different Frequencies
從以上數(shù)據(jù)分析得出:基于壓縮感知理論實(shí)現(xiàn)的聲源識(shí)別相對(duì)于其他兩種實(shí)驗(yàn)方法而言,產(chǎn)生的偏移量較大,但是隨著時(shí)間的變化,信號(hào)的收集趨于穩(wěn)定,在第8s以后,偏移距離幾乎不再變化,且從數(shù)據(jù)來看和其它兩種方法幾乎可以達(dá)到相同的偏移量。從區(qū)域面積的角度分析,面積也是隨著時(shí)間在變化,并逐步趨于穩(wěn)定。
通過對(duì)常見的幾種稀疏字典,測量矩陣以及重構(gòu)算法的分析研究,得出了適用于運(yùn)動(dòng)運(yùn)動(dòng)聲場的壓縮和重建的最佳理論基礎(chǔ),即用離散傅里葉變換作為稀疏基矩陣,用高斯隨機(jī)矩陣作為測量矩陣,用ROMP算法作為重構(gòu)算法。通過三種不同的實(shí)驗(yàn)方法針對(duì)相同條件下的運(yùn)動(dòng)聲源進(jìn)行識(shí)別,實(shí)驗(yàn)結(jié)果表明經(jīng)過稀疏重構(gòu)以后的數(shù)據(jù)可以更加清晰的實(shí)現(xiàn)運(yùn)動(dòng)聲源的識(shí)別,尤其是高頻聲源。為將來的高速、變速、多點(diǎn)聲源的識(shí)別研究提供指導(dǎo)意義。
[1]Lustig Metal.Compressed sensing MRI[J].IEEE Signal Processing Magazine,2008,25(2):722-732.
[2]E.Candes.Compressive sampling Proceedings of the International Congress of Mathematicians[J].Madrid,Spain,2006,3(2):1434-1452.
[3]David L Donoho.Compressed Sensing[J].IEEE Transactions on Information Theory,2006,52(4):289-306.
[4]D.L.Donoho,Y.Tsaig,I.Drori,J-L.Starck.Sparse solution of under determined linear equations by stage-wise Orthogonal Matching Pursuit[J].IEEE Trans.Inf.Theory,2012,58(2):1094-1121.
[5]E.J.Candes,Y.Eldar,D.Needell,P.Randall.Compressed sensing with coherent andredundant dictionaries[J].Applied and Computational Harmonic Analysis,2011,31(1):59-73.
[6]F.Krahmer,R.Ward.New and improved Johnson-Linden embed-dings via the Restricted Isometrics Property[J].SIAMJ.Math.Anal.,2011,43(3):1269-1281.
[7]石光明,劉丹華,高大化.壓縮感知理論及其研究進(jìn)展[J].電子學(xué)報(bào),2009,37(5):1070-1081.(Shi Guang-ming,Liu Dan-hua,Gao Da-hua.Compressive sensing theory and its research progress[J].Electronic Journal,2009,37(5):1070-1081.)
[8]李樹濤,魏丹.壓縮傳感綜述[J].自動(dòng)化學(xué)報(bào),2009,35(11):1369-1377.(Li Shu-tao,Wei-Dan.Summary of compressive sensing[J].Journal of Automation,2009,35(11):1369-1377.)
[9]劉志紅,儀垂杰.旋轉(zhuǎn)運(yùn)動(dòng)聲輻射的解析方法[J].機(jī)械設(shè)計(jì)與制造,2015,(12):65-68.(Liu Zhi-hong,Yi Chui-Jie.The analytical method of mechanical design and manufacture of[J].Machinery Design&Manufacture,2015(12):65-68.)