丁一
摘 ?要:隨著新型冠狀病毒的蔓延,各大高校都普遍嘗試和采用了線上教學(xué)的方式進(jìn)行授課和評(píng)價(jià)。目前各高校普遍實(shí)行的過(guò)程化考核作為課程分?jǐn)?shù)的評(píng)價(jià)標(biāo)準(zhǔn)之一。傳統(tǒng)的查重工具著重于文字的重復(fù)率,忽視了圖片這一關(guān)鍵的信息載體,因此急需以圖像識(shí)別匹配技術(shù)作為基礎(chǔ)的圖像查重算法。文章將SURF算法應(yīng)用于學(xué)生作業(yè)及實(shí)驗(yàn)報(bào)告等文本評(píng)價(jià)載體中的圖片相似度匹配上,結(jié)合平時(shí)的實(shí)踐經(jīng)驗(yàn),用RANSAC算法去掉錯(cuò)誤的匹配結(jié)果,匹配算法對(duì)于SURF特征點(diǎn)進(jìn)行優(yōu)化,從而實(shí)現(xiàn)了對(duì)SIFT算法匹配速度以及精確度的改善,最終實(shí)現(xiàn)了完善的實(shí)驗(yàn)報(bào)告圖像匹配算法,并且對(duì)實(shí)驗(yàn)中出現(xiàn)的問(wèn)題進(jìn)行討論和總結(jié),對(duì)系統(tǒng)實(shí)施的改進(jìn)和未來(lái)的拓展性也進(jìn)行了充分的論述。
關(guān)鍵詞:SURF算法;圖像查重;圖片匹配度
中圖分類號(hào):TP391.4 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2020)32-0025-04
Abstract: With the popularity of novel coronavirus, colleges and universities have generally tried and adopted online teaching and evaluation. At present, the process assessment, which is widely implemented in colleges and universities, is one of the evaluation criteria of curriculum scores. The traditional duplicate checking tools focus on the repetition rate of the text, ignoring the picture as a key information carrier, so there is an urgent need for an image repetition checking algorithm based on image recognition and matching technology. In this paper, the SURF algorithm is applied to the image similarity matching in the text evaluation carriers such as students' homework and experimental reports, combined with the usual practical experience, the wrong matching results are removed by the RANSAC algorithm, and the matching algorithm is optimized for the SURF feature points, thus the matching speed and accuracy of the SIFT algorithm are improved, and finally a perfect experimental report image matching algorithm is realized. And the problems in the experiment are discussed and summarized, and the improvement of the implementation of the system and the expansion in the future are also fully discussed.
Keywords: SURF algorithm; image duplicate checking; picture matching degree
前言
隨著線上教學(xué)的發(fā)展和各大遠(yuǎn)程教學(xué)平臺(tái)的建立,在線教育的模式和形式已經(jīng)非常完善,目前可以達(dá)到根據(jù)人們的需要選擇直播、錄播、不同時(shí)間、不同地點(diǎn)、不同設(shè)備進(jìn)行教學(xué)的可能。隨著2020年初新型冠狀肺炎病毒疫情的蔓延,各大高校也將傳統(tǒng)的線下課程逐步過(guò)渡到線上課程的教育上。利用互聯(lián)網(wǎng)為載體進(jìn)行線上教學(xué),不僅將方便快捷帶到了校園和課堂,同時(shí)也出現(xiàn)了剽竊、偽造、篡改等學(xué)術(shù)不端的這類不和諧現(xiàn)象。這種現(xiàn)象不僅造成了教學(xué)考核方面的不公平,同時(shí)也給學(xué)生未來(lái)學(xué)習(xí)和個(gè)人發(fā)展軌跡方面造成了一定的影響。傳統(tǒng)的查重方式往往更加專注于文字的查重。無(wú)論是人工方式核對(duì)還是線上的查重平臺(tái),對(duì)于圖片查重和匹配這方面涉獵較少且不是十分完善。如果仍然進(jìn)行人工核對(duì),這不僅考驗(yàn)的是教師的學(xué)術(shù)水平,這種重復(fù)性的勞動(dòng)對(duì)于教師的精神壓力也是成倍增加的。隨著人工智能技術(shù)的成熟普及和完善,人們往往將大量傳統(tǒng)重復(fù)而又無(wú)意義的勞動(dòng)以人工智能的方式替代,特別是將人工智能思想和技術(shù)應(yīng)用于圖像處理之后,很多算法和應(yīng)用也得到了充分的發(fā)展和完善,如神經(jīng)網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)等。在這些領(lǐng)域中圖像匹配算法往往是人們比較常關(guān)注的基礎(chǔ)算法,他對(duì)于人工智能算法學(xué)習(xí)數(shù)據(jù)的篩選和提取也有著非常重要的意義。基于以上的觀點(diǎn),本文提出了一個(gè)以人工智能技術(shù)替代傳統(tǒng)核對(duì),基于SURF的學(xué)生實(shí)驗(yàn)報(bào)告圖像匹配度算法。希望通過(guò)此算法能夠因此改善甚至最終會(huì)替代傳統(tǒng)對(duì)實(shí)驗(yàn)報(bào)告手工校驗(yàn)的方式。
SIFT算法是一種關(guān)鍵點(diǎn)檢測(cè)和描述算法,但這種算法在批量的執(zhí)行速度方面會(huì)落后很多,在大批量的圖像匹配應(yīng)用中,速度往往是十分重要的因素。Bay,H.,Tuytelaars,T. 和 Van Gool,L 在2006年發(fā)表了 SURF(加速穩(wěn)健特征)算法[1]。這個(gè)算法從某種意義上說(shuō)可以被看作是一個(gè)加速版的SIFT算法。SIFT將構(gòu)建尺度空間時(shí)使用Difference of Gaussian對(duì)Laplacian of Gaussian進(jìn)行近似。SURF使用box filter對(duì)Laplacian of Gaussian進(jìn)行近似,使用積分圖像進(jìn)行卷積計(jì)算,積分圖像可以在不同的尺度空間計(jì)算圖像中像素和的計(jì)算量的大小與其本身大小無(wú)關(guān)。SIFT算法通過(guò)圖片的特征提取來(lái)實(shí)現(xiàn)圖片的匹配度實(shí)現(xiàn),穩(wěn)定可擴(kuò)展性強(qiáng),該算法首先計(jì)算出128維度特征的向量歐幾里得的距離,這個(gè)計(jì)算需要算算術(shù)平方根相對(duì)SURF來(lái)說(shuō)有些耗費(fèi)時(shí)間。SURF 算法計(jì)算關(guān)鍵點(diǎn)通過(guò)Determinant of Hessian 也就是使用每個(gè)像素Hessian矩陣的行列式的近似值構(gòu)成,即其尺度和位置通過(guò)Hessian矩陣行列式獲取。
1 SURF算法應(yīng)用案例及優(yōu)勢(shì)分析
SURF在圖像匹配的過(guò)程中仍然著重關(guān)注在圖像的特征點(diǎn)而對(duì)于圖像的大小角度等幾何方面的信息并不關(guān)注。往往在學(xué)生實(shí)驗(yàn)報(bào)告圖片這種大量圖像數(shù)據(jù)集當(dāng)中,獲取數(shù)據(jù)的速度不僅依賴于硬件設(shè)定的條件,同時(shí)也依賴于算法的穩(wěn)定性和速度上。而SURF對(duì)于特征值的計(jì)算都是簡(jiǎn)單的加減法單單相對(duì)于算數(shù)平方根的計(jì)算來(lái)說(shuō)就更顯得有優(yōu)勢(shì)。夏磊等[2]在基于改進(jìn)SURF算法的紅外圖像拼接一文中,提出基于雙向匹配策略的自適應(yīng)閾值配準(zhǔn)算法,將特征點(diǎn)通過(guò)相似性度量準(zhǔn)則匹配圖像對(duì)應(yīng)的像素點(diǎn),并將過(guò)程中匹配的最小和次小歐幾里得距離最小比值作為參數(shù),從而在特定紅外圖像拼接的條件下保證精確性的基礎(chǔ)上提高了算法的速度。王陽(yáng)萍等[3]在結(jié)合加速魯棒特征的遙感影像半全局立體匹配一文中,提出了利用改進(jìn)加權(quán)聯(lián)合雙邊濾波算法進(jìn)行視差的優(yōu)化以便去除圖像的噪點(diǎn)等不需要的信息,將弱紋理以及視差不連續(xù)區(qū)域產(chǎn)生噪點(diǎn)的問(wèn)題有效解決。黃春鳳等[4]在改進(jìn)的SURF算法在圖像匹配的應(yīng)用中,通過(guò)臨近搜索算法結(jié)合雙向唯一性匹配方法在視差約束下對(duì)初始特征值預(yù)處理,并通過(guò)二次優(yōu)化和降噪之后將匹配成功度提高。
在本文中提出了SURF算法為基礎(chǔ),實(shí)現(xiàn)了學(xué)生實(shí)驗(yàn)報(bào)告及作業(yè)等圖像的匹配查重,利用大量學(xué)生平時(shí)的實(shí)驗(yàn)報(bào)告和作業(yè)的圖像作為數(shù)據(jù)整理成實(shí)驗(yàn)數(shù)據(jù)集。利用SURF和RANSAC算法各自的優(yōu)勢(shì),將兩者優(yōu)勢(shì)相結(jié)合進(jìn)行實(shí)驗(yàn)報(bào)告圖像匹配的算法。利用SURF算法提取特征點(diǎn),并利用SURF算法進(jìn)行預(yù)匹配。然后用RANSAC算法去掉錯(cuò)誤的匹配結(jié)果。從而實(shí)現(xiàn)了針對(duì)SURF算法上的優(yōu)化。在實(shí)驗(yàn)中,充分考慮了現(xiàn)實(shí)中可能出現(xiàn)的特征作為實(shí)驗(yàn)基準(zhǔn)數(shù)據(jù),根據(jù)閾值以及參數(shù)的設(shè)定和選擇優(yōu)化并實(shí)現(xiàn)實(shí)驗(yàn)報(bào)告和作業(yè)圖像的匹配查重算法。
2 SURF算法及匹配算法比較
SURF算法[1]在本文的實(shí)踐當(dāng)中可以分解為如下幾個(gè)步驟:
(1)構(gòu)造高斯金字塔尺度空間
同一個(gè)Hessian矩陣和同一個(gè)像素點(diǎn)存在一一對(duì)應(yīng)關(guān)系。
(2)利用非極大值抑制初步確定特征點(diǎn)
將經(jīng)過(guò)上一步矩陣處理過(guò)的像素點(diǎn)與它的三維中26個(gè)點(diǎn)大小進(jìn)行比較。
(3)精確定位極值點(diǎn)
采用三維線性插值取得像素級(jí)的點(diǎn),對(duì)于設(shè)定的閾值,也去除小于它的點(diǎn)。
(4)選取特征點(diǎn)的主方向
統(tǒng)計(jì)特征點(diǎn)領(lǐng)域內(nèi)的harr小波特征。
(5)構(gòu)造surf特征點(diǎn)描述算子
每個(gè)特征點(diǎn)就是16*4=64維的向量。
SIFT算法對(duì)于提取圖像的局部特征點(diǎn),對(duì)于幾何特性諸如平移、旋轉(zhuǎn)、尺度縮放以及光學(xué)特性諸如亮度變化、甚至遮擋和噪聲等具有不變性的特點(diǎn),對(duì)視點(diǎn)改變也具有穩(wěn)定性。SURF從SIFT基礎(chǔ)上發(fā)展而來(lái)是針對(duì)SIFT的改進(jìn),在算法速度和魯棒性方面普遍占優(yōu)。而FAST算法提取了大量的特征點(diǎn)算法速度卻十分快速,但在幾何方面不變性的適應(yīng)方面不及SIFT和SURF算法。ORB算法是基于FAST算法并減少了特征點(diǎn)數(shù)目并提高了質(zhì)量在幾何特征方面具有一定的穩(wěn)定性。特別是對(duì)于SIFT算法,SURF算法在針對(duì)一些繁瑣的工作進(jìn)行了精簡(jiǎn),對(duì)于SIFT的描述特征子SURF算法特別做了降維處理,SIFT計(jì)算描述特征子采樣16*16并分為4*4的區(qū)域,從而計(jì)算各區(qū)域的幅值和向量方向,也就是SIFT的描述特征子是4*4*8=128維。而SURF算法在生成特征描述子時(shí)將20s*20s(s=1.2*L/9為特征點(diǎn)的尺度)的正方形分割成4*4的區(qū)域,在小區(qū)域中提取25個(gè)特征點(diǎn)計(jì)算小波HAAR響應(yīng),即SURF的描述特征子是4*4*4=64維。將計(jì)算特征點(diǎn)作為整個(gè)算法的核心。總之,在計(jì)算速度、旋轉(zhuǎn)魯棒性、模糊魯棒性、尺度變換魯棒性等方面相對(duì)以上算法,SURF算法十分占優(yōu)勢(shì)。
3 SURF算法在本文中的應(yīng)用及優(yōu)化方法
對(duì)于SURF算法特征點(diǎn)匹配結(jié)果的篩選方面,在大概率發(fā)生匹配錯(cuò)誤的前提下就需要分析錯(cuò)誤的可能性。一種是選取的特征點(diǎn)發(fā)生錯(cuò)誤,另一種是匹配的特征點(diǎn)對(duì)之間不符合。實(shí)際匹配結(jié)果的分析和篩選過(guò)程中往往以反向查找特征點(diǎn)算法以便于能夠正確的找到對(duì)應(yīng)的特征點(diǎn),一般分為Brute Force匹配和FLANN匹配,前者總是嘗試所有的可能性以便于查找到最佳的匹配方法,而后者是一種近似法,采用最臨近近似匹配。本文的例子中是需要找到一個(gè)較好的,但是不需要找到最佳的匹配,當(dāng)然,也可以調(diào)整參數(shù)來(lái)提高匹配的精度或者提高算法的速度。但相對(duì)來(lái)說(shuō),提高速度的結(jié)果往往就意味著精度的降低。本文采用RANSAC算法消除匹配圖像過(guò)程中的誤匹配結(jié)果,因?yàn)殄e(cuò)誤的匹配可能性有噪聲極值、錯(cuò)誤的量度以及錯(cuò)誤的假設(shè)。該算法采用擬合直線的方法觀測(cè)數(shù)據(jù)中的局內(nèi)局外點(diǎn),往往簡(jiǎn)單的最小二乘法不能找到適應(yīng)的局內(nèi)點(diǎn)直線,但該算法能從包含大量局外點(diǎn)數(shù)據(jù)集中估算出高精度的參數(shù)。學(xué)生作品特征點(diǎn)示例如圖1,圖1左圖為目標(biāo)同學(xué)1的某項(xiàng)實(shí)驗(yàn)報(bào)告的答案圖片之一,圖1右圖為目標(biāo)同學(xué)2的某項(xiàng)實(shí)驗(yàn)報(bào)告的答案圖片。采用算法匹配的結(jié)果如圖2,如圖可見(jiàn),將錯(cuò)誤的特征點(diǎn)篩選過(guò)濾之后不同同學(xué)針對(duì)同一題目的結(jié)果圖片盡管有相似的地方,但仍然有大量的特征點(diǎn)沒(méi)有匹配到。而對(duì)于圖3在目標(biāo)同學(xué)3借鑒了目標(biāo)同學(xué)1的圖片結(jié)果之后,發(fā)現(xiàn)匹配了大量的特征點(diǎn)。SURF算法具有幾何特性方面的不變性在論文圖片匹配度對(duì)比查重中即便將同一副圖放大縮小或者更改縱橫比,也可以得到極佳的匹配效果,如圖4在圖片修改了縱橫比之后仍然可以匹配到大量特征點(diǎn)。由此可見(jiàn)實(shí)驗(yàn)的結(jié)果驗(yàn)證了經(jīng)過(guò)改進(jìn)后的SURF的實(shí)驗(yàn)報(bào)告圖像匹配算法的可行性。
4 結(jié)論
本文將SURF算法優(yōu)化改進(jìn)后應(yīng)用于學(xué)生實(shí)驗(yàn)報(bào)告及作業(yè)等作品中圖片的查重匹配,補(bǔ)充了傳統(tǒng)查重系統(tǒng)只關(guān)注文字的單一性,將功能擴(kuò)展為可以通過(guò)人工智能的方法進(jìn)行圖片查重和匹配。圖片的查重可以針對(duì)學(xué)生學(xué)習(xí)中的抄襲現(xiàn)象有所遏制,同時(shí)針對(duì)課程實(shí)驗(yàn)報(bào)告及作業(yè)的人工智能方法審核可以減輕教師的大量精力。本文在SURF算法的基礎(chǔ)上通過(guò)FLANN匹配和采用RANSAC算法消除匹配圖像過(guò)程中的誤匹配結(jié)果,采用平時(shí)中真實(shí)學(xué)生實(shí)驗(yàn)作品圖像作為實(shí)驗(yàn)數(shù)據(jù)集,實(shí)驗(yàn)結(jié)果顯示優(yōu)化方法是高效率而且具有較高的精度。在今后的研究中會(huì)進(jìn)一步探討多種算法結(jié)合的情況下優(yōu)化圖像匹配結(jié)果的可能。
參考文獻(xiàn):
[1]SURF: Speeded up robust features. Bay H, Tuytelaars T,van Gool L. Lecture Notes in Computer Science,2006.
[2]夏磊,胡欣宇,岳亞偉,等.基于改進(jìn)SURF算法的紅外圖像拼接[J].物聯(lián)網(wǎng)技術(shù),2020,10(06):48-51.
[3]王陽(yáng)萍,秦安娜,郝旗,等.結(jié)合加速魯棒特征的遙感影像半全局立體匹配[J/OL].光學(xué)學(xué)報(bào),2020(16):163-171.
[4]黃春鳳,劉守山,別治峰,等.改進(jìn)的SURF算法在圖像匹配中的應(yīng)用[J].現(xiàn)代電子技術(shù),2020,43(10):111-115.