白阿拉坦高娃
摘 要:線性代數(shù)課程作為數(shù)學(xué)類課程中最基本而用途廣泛的課程,需要老師們深層次挖掘各部分內(nèi)容的實際意義。在線性代數(shù)的教學(xué)過程中,發(fā)現(xiàn)學(xué)生對部分概念的理解與實際應(yīng)用并不清楚,尤其矩陣的應(yīng)用有些模糊。該文線性代數(shù)的重要內(nèi)容矩陣的相關(guān)理論的應(yīng)用領(lǐng)域及其應(yīng)用意義,這將很大程度上增強(qiáng)了線性代數(shù)課程的吸引力。
關(guān)鍵詞:線性代數(shù) 矩陣 圖像處理
中圖分類號:G642 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-098X(2017)01(a)-0211-02
線性代數(shù)基本概念眾多、應(yīng)用領(lǐng)域廣泛,其中線性代數(shù)在圖片處理過程中的應(yīng)用較廣。當(dāng)下,圖像的處理都基本是靠計算機(jī)來完成的。在計算機(jī)中,圖像是有許多看似連續(xù)的像素構(gòu)成的。由于像素間的距離非常近以至于眼睛都不能分辨出來。在數(shù)學(xué)上圖像的每個像素就是線性代數(shù)中矩陣的每個元素,因此圖像是可以用矩陣來表示的。只是圖像的種類不同,矩陣的維數(shù)會有變化:灰度格式的圖像(我們平常成為黑白圖片)可用一個元素值介于0~255之間的二維矩陣來表示,元素值得大小對應(yīng)著像素點的亮度(0對應(yīng)黑色,255對應(yīng)白色);彩色圖像(即RGB圖像)可用一個三維矩陣表示,我們平常所說的紅(R),綠(G),藍(lán)(B)分量分別用一個矩陣表示,3個矩陣組合起來構(gòu)成的這個三維矩陣??梢哉f,圖像就等于矩陣,所以將線性代數(shù)中有關(guān)矩陣?yán)碚摰某晒麘?yīng)用于圖像處理是非??尚械腫1]。
1 線性代數(shù)教學(xué)中遇到的問題
數(shù)學(xué)類課程對眾多學(xué)生而言都是枯燥乏味的。那么是什么原因?qū)е铝诉@種情況的發(fā)生呢?不可否認(rèn)教師及學(xué)生們都有一定的責(zé)任。從教師角度而言,受生活壓力及周圍環(huán)境的影響,不投入大量的時間對所教學(xué)內(nèi)容進(jìn)行深入的思考與聯(lián)想。從而無法給出生動而貼近實際的例子,只是單方面?zhèn)魇诨靖拍?、性質(zhì)、理論及簡單教學(xué)案例。這將大大縮減課程的吸引力。另一方面從學(xué)生角度而言,隨著手機(jī)時代的來臨,很多同學(xué)都將過多的時間投入到了諸如聊天、打游戲、參加活動等而大大縮小了認(rèn)真思考、連續(xù)思考的時間,這也必然會導(dǎo)致學(xué)生們對課程內(nèi)容理解程度及深度的迅速下降。其典型表現(xiàn)包括缺乏領(lǐng)軍人才、就業(yè)后無法短時間內(nèi)能夠為企業(yè)帶來經(jīng)濟(jì)社會效益、就業(yè)方向與大學(xué)專業(yè)不一致、“只聽其課而不知其意,只見其形而不知其原”等事件經(jīng)常出現(xiàn)。
2 線性代數(shù)常見內(nèi)容及其圖片處理中的應(yīng)用
2.1 圖像的變暗或變亮——矩陣的數(shù)乘
當(dāng)用戶利用相機(jī)或者手機(jī)拍下不太理想的照片時會利用很多手段來修復(fù)照片,這些修復(fù)的手段都暗藏了矩陣的知識。例如,在背光的條件下拍攝照片由于曝光不足可能會得到拍攝主體模糊不清的效果。這時,只要我們按照一定的比例進(jìn)行原始照片的數(shù)乘運算就能把照片的亮度調(diào)大并使拍攝主體顯現(xiàn)出來。當(dāng)然,亮度調(diào)大后的圖像有些細(xì)節(jié)會有損失。因此,每個像素所乘的比例需要用到相應(yīng)的算法來尋找,這樣才能保證亮度調(diào)大后的照片不失真[2]。
2.2 圖像旋轉(zhuǎn)——矩陣的轉(zhuǎn)置、矩陣的線性變換
在圖像處理過程中,圖像的旋轉(zhuǎn)是一種常用圖像處理技術(shù),并且其應(yīng)用領(lǐng)域十分廣泛,例如,軍事、航空醫(yī)學(xué)等方面。在傾斜校正、多幅圖像比較、模式識別以及進(jìn)行圖像的剪裁和拼接時,都需要對圖像進(jìn)行旋轉(zhuǎn)處理。圖像旋轉(zhuǎn)簡單來說就是圖像在平面內(nèi)繞一個頂點旋轉(zhuǎn)某個角度。這個過程可以理解為圖像矩陣的轉(zhuǎn)置或者線性變換,同時也需要一定的處理方式來保證旋轉(zhuǎn)后的邊界效果[3]。
2.3 圖像復(fù)原——矩陣的逆
數(shù)字圖像的復(fù)原是圖像處理的重要組成部分,它是根據(jù)圖像退化模糊的原因來還原圖像的本來面目。在復(fù)原的過程中,首先需要分析圖像退化模糊的原因,然后建立模型逆向估計原始圖像[4]。這個過程與我們在線性代數(shù)里所學(xué)的求矩陣的逆是非常相似的:矩陣是當(dāng)前的圖像矩陣,而單位矩陣是圖像矩陣退化模糊的原因,我們得到當(dāng)前圖像矩陣的逆矩陣就是退化模糊前的矩陣。
2.4 圖像的分割——矩陣子塊的提取
數(shù)字圖像的分割是指根據(jù)灰度、彩色、空間紋理、幾何形狀等特征把圖像劃分成若干個互不相交的區(qū)域,使得這些特征在同一區(qū)域內(nèi),表現(xiàn)出一致性或相似性,而在不同區(qū)域間表現(xiàn)出明顯的不同[5]。其實,圖像分割可以簡單理解為原始的圖像矩陣求子矩陣的過程,只不過圖像分割在劃分子矩陣的過程中需要考慮不同的特征因素。
2.5 圖像壓縮——矩陣的分塊
數(shù)字圖像的壓縮也稱為圖像編碼,是在有限的存儲介質(zhì)和傳輸介質(zhì)的條件下通過映射變換、量化、編碼3個環(huán)節(jié)來表示已有的圖像矩陣[6]。這個過程可以簡化為對原有圖像矩陣進(jìn)行變化,雖然會改變矩陣的數(shù)據(jù)特性,但是這樣可能更加利于存儲和傳輸。
2.6 圖像對比——線性相關(guān)性的判斷
數(shù)字圖像的對比簡單來說就是尋找圖像之間異同點的過程,并且能夠通過分析圖像之間的異同點來分析出其中的線性相關(guān)性(即圖像矩陣間的線性相關(guān)性)。
2.7 圖像視角的改變——特征向量
數(shù)字圖像視角的改變是指根據(jù)已有的圖像矩陣得到不同視角的圖像。這個過程就像是對已知的圖像矩陣乘以一個矩陣來得到新的矩陣。
一個向量關(guān)于橫軸做鏡像對稱變換,即保持一個向量的橫坐標(biāo)不變,但縱坐標(biāo)取相反數(shù),把這個變換表示為矩陣就是[1 0;0 -1],其中分號表示換行,顯然[1 0;0 -1]*[a b]'=[a -b]',其中上標(biāo)'表示取轉(zhuǎn)置,這正是我們想要的效果,那么現(xiàn)在可以猜一下了,這個矩陣的特征向量是什么?想想什么向量在這個變換下保持方向不變,顯然,橫軸上的向量在這個變換下保持方向不變,所以可以直接猜測其特征向量是 [a 0]'(a不為0),還有其他的嗎?有,那就是縱軸上的向量,這時經(jīng)過變換后,其方向反向,但仍在同一條軸上,所以也被認(rèn)為是方向沒有變化,所以[0 b]'(b不為0)也是其特征向量,去求求矩陣[1 0;0 -1]的特征向量就知道對不對了。
3 結(jié)語
通過引進(jìn)線性代數(shù)基本概念在圖像處理中的應(yīng)用,不僅豐富了線性代數(shù)教學(xué)內(nèi)容,同時也為圖像處理技術(shù)的深層次研究打下了堅實的基礎(chǔ)。今后,教師們應(yīng)該全面開拓不同課程的實際應(yīng)用價值,快速提高學(xué)生們的學(xué)習(xí)愛好及創(chuàng)新精神,以實現(xiàn)我國由基本理論學(xué)習(xí)大國轉(zhuǎn)向應(yīng)用技術(shù)產(chǎn)出大國的目的。
參考文獻(xiàn)
[1] 王小俠,趙鳳群,戴芳,等.正交變換在圖像壓縮中的應(yīng)用[J].大學(xué)數(shù)學(xué),2013,29(3):64-68.
[2] 徐小東.圖像亮度的自動調(diào)整[D].浙江:浙江大學(xué),2007.
[3] 楊素娣.圖像區(qū)域個數(shù)統(tǒng)計,圖像重現(xiàn)和圖像旋轉(zhuǎn)算法的研究[D].上海:華東師范大學(xué),2007.
[4] 沈峘,李舜酩,毛建國,等.數(shù)字圖像復(fù)原技術(shù)綜述[J].中國圖象圖形學(xué)報,2009,14(9):1764-1775.
[5] 何俊,葛紅,王玉峰.圖像分割算法研究綜述[J].計算機(jī)工程與科學(xué),2009,31(12):58-61.
[6] 儲昭輝.圖像壓縮編碼方法綜述[J].電腦知識與技術(shù), 2009,5(18):4785-4788.