郭佳琪
(運城廣播電視大學,山西 運城 044099)
隨著計算機數(shù)據(jù)處理技術與存儲技術的不斷發(fā)展,現(xiàn)代檔案信息的管理模式已逐步由紙質檔案向數(shù)字化檔案過渡。在這個轉換過程中,大量的紙質檔案信息將通過無線傳感、電子掃描、攝像等方式進行信息的采集與存儲[1]。特別是在互聯(lián)網(wǎng)、云存儲、大數(shù)據(jù)等概念被廣泛應用到各行各業(yè)中的今天,數(shù)字化信息呈井噴式爆發(fā),海量的數(shù)據(jù)充斥在網(wǎng)絡存儲空間中,這些都對數(shù)字化檔案信息服務系統(tǒng)的存儲性能提出了非常高的要求。壓縮感知理論將數(shù)字信息的采集與壓縮有效的結合在一起,將其應用到數(shù)字檔案信息的管理策略當中,不僅可以提高數(shù)字信息的采集質量,還可以提升與優(yōu)化檔案系統(tǒng)存儲空間的有效利用率[2]。
數(shù)字化檔案信息的采集是指利用計算機的數(shù)字處理技術對檔案信息進行收集[3],可以用視頻、圖像、聲音、文字等多種形式表示信息,并以數(shù)字編碼的形式進行存儲與管理。例如通過掃描技術將文本類信息轉換為數(shù)字檔案,通過攝像技術獲取視頻信息與圖像信息等?;跀?shù)字檔案信息采集的多樣性,在更加直觀和完整的反映信息內容的同時,也會引起一系列新的問題。例如信息采集過程中信號的傳輸問題、信息轉換時的圖像失真問題、視頻和圖像類信息的存儲開銷過大等問題,都會對數(shù)字檔案管理系統(tǒng)的工作效能產(chǎn)生很大的影響。
數(shù)字檔案中信息的構成有很大一部分都屬于圖像類信息,這些信息的采集常常會受到外部環(huán)境的限制和影響。例如紙質檔案的數(shù)字掃描,由于紙質檔案大都會存放很久,長時間的放置使得檔案的紙質老化,字跡、圖像等信息變得模糊不清,如果直接進行掃描轉換,很多信息是很難準確識別的。再比如視頻類信息的采集與采集設備的性能、光線環(huán)境等都有很大關系,如果光線不夠或采集設備分辨率較低的話,圖像就會出現(xiàn)很多噪聲。因此,數(shù)字檔案信息的采集還需要經(jīng)過校正、降噪、濾波、細節(jié)強化等多個處理細節(jié),才能得到一個較好的結果,同時這類信息的傳輸、存儲開銷較大也是常見問題,還需進行文件的壓縮存儲以提高存儲空間與網(wǎng)絡帶寬資源的利用率。針對上述問題,數(shù)字檔案信息存儲策略的構建主要涉及到兩個方面:一是信息質量的優(yōu)化處理,包括掃描檔案后的成像處理、圖像的噪點處理等;二是信息長度的壓縮,包括信號的采樣、壓縮、數(shù)字編碼的簡化等。但這兩個方面的功能實現(xiàn)是相悖的,要提高檔案信息的圖像質量,就會增加文件的信息量,壓縮文件又是以犧牲部分的圖像細節(jié)信息為代價的。如何能夠兼顧兩者,以達到最大限度的資源利用,這是數(shù)字檔案信息存儲策略研究的難點之一,為了能夠有效地解決這一難點問題,借助圖像處理技術當中壓縮感知理論的存儲優(yōu)化算法,對檔案信息進行采集、重構和壓縮,在保證圖像質量的基礎上最大限度地減少其在存儲與傳輸時的資源開銷。
傳統(tǒng)的數(shù)字信息采集都是先進行圖像信息的完整采集,再進行壓縮。在采集時要求采樣頻率至少可以達到模擬信號最高頻率的兩倍以上,才能獲取到質量較好的圖像信息。在采集完成之后,再通過去除冗余信號,減少圖像細節(jié)處理的方式進行長度壓縮,且這種壓縮是不可逆的,圖像損失的細節(jié)部分將無法再進行還原。
相比傳統(tǒng)的數(shù)字信息處理方式,壓縮感知理論提出了一種全新的信息采集和壓縮的優(yōu)化方式,就是在信息采集的同時對信號進行壓縮。該理論驗證了信號處在稀疏域時,可以采用不相關矩陣的表示方式將高緯度信號投影在低維度空間進行壓縮傳輸,并且還可通過低緯度空間存儲的少量關鍵信息對圖像原信號進行重構和還原[4]。這一理論的實現(xiàn)主要包含三個步驟:圖像的信號的稀疏度判斷、稀疏信號的不相關觀測矩陣建立和圖像完整信號的重構。
圖像信號的稀疏表示主要是通過稀疏域字典的建立來實現(xiàn)[5]。首先要確定最佳的稀疏域,采用小波分析法將圖像信號數(shù)字化,并將具有相關性的一系列信號組合為基函數(shù)并記錄在字典當中。每組基函數(shù)作為一個原子項進行冗余信號的壓縮處理,然后在原子項之間進行多種線性組合的比較,選擇出與原信號最為匹配的原子項組合投影在不相關觀測矩陣當中。圖像信號的稀疏表示過程如圖1所示。
圖1 圖像信號的稀疏表示過程
假設圖像R中有一原始信號Y∈Fm,稀疏字典X中存在N個原子項,稀疏系數(shù)為b,對圖像R進行稀疏表示,可表示為:
b*=argmi‖b‖0s.t.R=Xb
(1)
其中稀疏字典的設計是否完備,決定了圖像的稀疏表示程度是否合理,稀疏字典中獲取的原子項與圖像原信號匹配度越高,對壓縮后圖像的還原度就越高,壓縮效率也就越高。采用單一的幾何分析方式無法對復雜結構的自然圖像建立完備的字典表示信息,例如小波單節(jié)點變換字典雖然能夠很好的匹配圖像的紋理信息,卻不能有效匹配輪廓邊緣信息;雙正交疊式變換字典可以較好地匹配圖像邊緣輪廓信息,卻不能很好地表示震蕩紋理樣式。因此,稀疏字典的性能設計要充分考慮到圖像的各向同性與各向異性結構的性能匹配。
由稀疏表示獲取到的最為匹配的原子項組合經(jīng)過壓縮和降維處理就可以得到相應的測量值[6],該值會被存儲在投影矩陣當中,用于實現(xiàn)對圖像原信號的重建。因此,測量矩陣的建立對之后圖像重建的質量會有非常直接的影響。
投影矩陣是圖像完整信息經(jīng)過采樣與壓縮后再投影到低緯度空間當中的測量值所構成的。測量值保存了圖像中的關鍵信息,在對圖像進行重構時,測量值所表示的關鍵信息可以用于還原圖像的完整信息。由于壓縮后的測量值大小要小于圖像原信號的大小,用測量值來還原圖像的完整信號。針對圖像信號特性,需符合一定的約束條件,才能夠實現(xiàn)圖像的重構。這些約束條件包括零空間約束、等距性約束、最小線性相關列數(shù)約束等條件。其中零空間約束與最小線性相關列數(shù)約束條件在不考慮噪聲的前提下所構造的觀測矩陣可以較好地滿足圖像重構所需的關鍵信息提取。在含有噪聲的情況下,等距性約束條件下所構建的觀測矩陣可以較好地實現(xiàn)圖像信號重建。
圖像重構是指通過投影在低緯度空間的觀測值所構成的觀測矩陣對圖像的完整信號進行近似還原的過程。稀疏表示為圖像信號的還原提供了必要的先驗條件,重構信號的計算模型較為復雜,并以此為代價以達到高度還原圖像信號的目的。圖像信號的重構以求解欠定方程式為算法的核心思路,構建了貪婪算法模型。假設觀測矩陣所提供的某一測量值為A,通過對A的稀疏逼近和反復迭代獲取到最為匹配的原子K,可用公式2表示:
argminK0s.t.A=ΦK
s.t.
(2)
其中ε為信號的還原誤差值。式中以窮舉法列出所有的非零原子項,對所有的非零原子項近似求解、逼近匹配。經(jīng)過多次迭代收斂,獲取到最為近似的原子項。
采用該算法模型,可以得到較好的圖像還原效果,與原圖像信號的近似度可達90%以上,但多次的迭代運算會造成較大的時間開銷。為了減少運算的迭代次數(shù),有效降低運算開銷,在圖像信號的追蹤匹配過程中進一步引入了回退篩選思路。在迭代篩選前先建立預選集合,經(jīng)過簡單的預篩選后再進行迭代,如此便可縮小追蹤匹配的運算范圍,從而減少迭代次數(shù),同時預篩選的算法設計應兼顧到復雜度與有效性兩個方面的訴求,才能達到算法更加優(yōu)化的目的。
壓縮感知理論目前已在多個領域得到了良好的應用與拓展,尤其是在醫(yī)療成像和無線傳感的數(shù)模轉換領域中的應用都可以很好地借鑒到數(shù)字檔案的圖像信息處理技術當中?;谏鲜鲅芯?對于壓縮感知理論在數(shù)字檔案信息的優(yōu)化存儲策略中的應用,可以從數(shù)字信息的成像、重構和壓縮三個方面進行研究與實現(xiàn)。
數(shù)字檔案信息的成像采用壓縮感知技術進行存儲優(yōu)化,主要有串行與并行兩種方式。串行方式是采用單孔徑成像方式獲取圖像信息,并對圖像進行分塊壓縮。完整圖像的稀釋表示與觀測矩陣的構建是一個非常復雜的計算過程,一個高分辨率的圖像其原子項數(shù)量甚至可以達到106,這大大增加了檔案管理系統(tǒng)的存儲負擔。為了簡化這個計算過程,將圖像按照一定的分塊原則進行劃分,將劃分后的圖像塊作為獨立的數(shù)據(jù)塊串行完成信號的零空間壓縮與傳輸,這可以有效減輕系統(tǒng)的存儲負擔,以及后期圖像重構過程的運算負擔。
假設圖像R的分辨率為B×B,劃分為j個等大小的圖像塊X,每個圖像塊的大小均為K×K。那么圖像塊的觀測矩陣可以表示
ΦK=M×K2
(3)
第Xj塊圖像的觀測值為:
Aj=ΦKXj
(4)
在對圖像進行相似還原時,只需按圖像塊進行重構,并按照原圖的分塊順序進行排序即可。
并行方式采用多孔徑成像方式,在焦平面上陣列多個相同的原圖像,原圖像帶有多通道模式下,一次即可對多個相同原圖像實現(xiàn)分塊壓縮與傳輸。兩種方式中,前者適用于靜態(tài)圖像,后者適用于的動態(tài)圖像,例如視頻類圖像信息。但不論哪種方式,對圖像進行分塊時都可能產(chǎn)生分塊重疊效應如圖2所示。
圖2 檔案照原圖與塊重疊效應圖像對比
為避免圖像的分塊重疊效應,先在圖像塊與相鄰圖像塊之間劃分出一個可能重疊的區(qū)域,并隔離這段區(qū)域,對各個圖像塊完成壓縮感知處理后,再對公共重疊區(qū)域采用均值分配的方式進行處理。
鑒于檔案信息的特殊性,數(shù)字檔案中的信息內容顯示要足夠清晰和準確,以確保檔案信息的有效性。由于大量圖像類檔案信息在存儲過程中都會經(jīng)過壓縮處理,為了不影響后期對檔案信息的準確查詢,圖像信息的高度還原也是檔案管理系統(tǒng)中非常重要的一個處理環(huán)節(jié),也就是圖像的重構。
圖像重構的過程是通過觀測值與感知矩陣反向求解稀釋值的過程,這種信號的恢復不是100%的完全還原,而是盡可能近似的還原。重構模型的設計思路如圖3所示。
圖3 基于逆向觀測矩陣的圖像重構實現(xiàn)過程
從圖中可以看出,相比傳統(tǒng)的圖像重建過程,壓縮感知圖像的重建過程包括一個逆向觀測的過程,在這一過程中通過已知的觀測值、感知矩陣、稀釋度等條件求解與原子索引集合中相近的原子值,最終獲取到重構信號并輸出。這一觀測過程將經(jīng)過反復迭代,直到對原子索引集合當中所有的原子項匹配完成。
采用壓縮感知技術實現(xiàn)圖像重構,通過較少的稀疏表示即可獲得較好的視覺呈現(xiàn)效果,但是對于輪廓邊緣的過渡處理效果較差,如何能夠在迭代次數(shù)沒有明顯增加的情況下進一步改善圖像信息的邊緣去模糊效果還有待進一步的研究和實踐。
數(shù)字檔案信息在存儲時會涉及到大量的圖像類信息,這類信息往往會占用更多的存儲資源,為系統(tǒng)管理造成較大的負擔,特別是高緯度空間圖像從采樣到傳輸和存儲,都需要占用極高的帶寬資源與存儲空間,因此通常會采用壓縮的方式對這類信息進行存儲優(yōu)化。同時在高光譜圖像信號壓縮中,壓縮感知技術對于噪聲和圖像信號部分缺失的信息壓縮具有非常高的效率,能夠有效避免采樣資源的浪費,因此更加適用于高維度空間的圖像信息壓縮。
傳統(tǒng)的圖像壓縮技術主要包括三種經(jīng)典的壓縮變換模式:小波變換、DCT變換和LBT變換。這三種變換模式對于圖像塊的重疊效應處理效果較好,但不能充分利用原信號的采樣資源,壓縮效率較低。
基于壓縮感知理論的優(yōu)化存儲策略,以二階錐優(yōu)化算法為數(shù)學基礎構建了一種針對高維空間圖像壓縮的高維線框壓縮模型。通過二階錐優(yōu)化算法對稀釋字典中的原子進行均衡優(yōu)化組合,所構成的原子項可具有明顯的稀釋特性。在此基礎上通過隨機矩陣對三維線框中用于表示圖形邊界與外部輪廓的深度軸投影在低緯度空間中,并對其二維結構完成抽樣壓縮。該種方式對高緯度圖像的壓縮處理效率高、速度快,缺點是會造成一定程度的圖像失真,為避免過渡的失真,對于圖像邊緣輪廓的觀測矩陣設計還有待進一步的優(yōu)化研究。
隨著數(shù)字化檔案信息系統(tǒng)的廣泛應用,很多檔案信息都需要通過數(shù)字采集的方式進行存儲和管理,這對數(shù)字檔案信息管理系統(tǒng)的海量數(shù)據(jù)處理帶來了極大的存儲負擔。針對數(shù)字檔案信息服務發(fā)展的這一現(xiàn)狀,本文對最新的圖像處理技術——壓縮感知進行了深入的研究與分析,包括壓縮感知理論的基本實現(xiàn)原理、數(shù)學模型的構成、核心算法的運算思路等,探討了壓縮感知理論在數(shù)字化檔案信息優(yōu)化存儲策略中應用的可行性,并在數(shù)字檔案信息的成像、重構、壓縮三個方面的優(yōu)化存儲策略中依次提出了基于壓縮感知理論的圖像分塊、重構圖像的逆向觀測、二階錐優(yōu)化高維線框壓縮等優(yōu)化設計思路,為大型數(shù)字檔案系統(tǒng)的設計與升級提供了有益的理論參考。