王希暢,呂學(xué)強(qiáng),何 健,董志安
(1.北京信息科技大學(xué) 網(wǎng)絡(luò)文化與數(shù)字傳播北京市重點(diǎn)實(shí)驗(yàn)室,北京 100101;2.北京洛奇智慧醫(yī)療科技有限公司,北京 100015;3.清華大學(xué)互聯(lián)網(wǎng)產(chǎn)業(yè)研究院,北京 100084)
隨著信息化時(shí)代的到來,醫(yī)療化驗(yàn)單識(shí)別已成為醫(yī)療領(lǐng)域重要的研究話題。醫(yī)療OCR[1-2](optical character recognition,光學(xué)字符識(shí)別)生成的電子化驗(yàn)單可以解決紙質(zhì)化驗(yàn)單數(shù)量過大,不便于保存,且患者無法正確理解各項(xiàng)指標(biāo)含義的困擾[3]。而區(qū)域檢測(cè)是指需檢測(cè)到化驗(yàn)單的檢驗(yàn)項(xiàng)區(qū)域,為化驗(yàn)單識(shí)別做預(yù)處理,對(duì)提取化驗(yàn)單的有效信息進(jìn)而進(jìn)行后續(xù)的自動(dòng)處理具有重要的作用。因此如何檢測(cè)檢驗(yàn)項(xiàng)區(qū)域成為一項(xiàng)必不可少的研究。利用合適的檢測(cè)方法,可以得到較準(zhǔn)確的檢驗(yàn)項(xiàng)區(qū)域,對(duì)之后的識(shí)別[4-5]起到了重要的作用。
與其他區(qū)域檢測(cè)不同,醫(yī)療化驗(yàn)單具有規(guī)定版型的特征,可以根據(jù)化驗(yàn)單中的直線特點(diǎn)進(jìn)行檢測(cè)。因此文中基于直線檢測(cè)進(jìn)行化驗(yàn)單檢驗(yàn)項(xiàng)的區(qū)域檢測(cè)。在直線檢測(cè)領(lǐng)域內(nèi),霍夫變換占據(jù)著核心地位,分為標(biāo)準(zhǔn)霍夫變換與累積概率霍夫變換。同時(shí),結(jié)合檢驗(yàn)項(xiàng)區(qū)域特征,提出了基于二值化的單側(cè)區(qū)域檢測(cè)與雙側(cè)區(qū)域檢測(cè)方法,適用于不同傾斜程度的化驗(yàn)單。
綜上所述,以某醫(yī)院真實(shí)化驗(yàn)單為實(shí)驗(yàn)數(shù)據(jù)進(jìn)行區(qū)域檢測(cè)并切割,通過應(yīng)用不同的區(qū)域檢測(cè)方法,對(duì)比區(qū)域切割的效果,對(duì)每種方法所適合的場(chǎng)景進(jìn)行分析。
為尋找合適的區(qū)域檢測(cè)方法進(jìn)行化驗(yàn)單檢測(cè),下面將著重介紹三種基于直線檢測(cè)的方法:基于霍夫直線檢測(cè)、單側(cè)區(qū)域檢測(cè)、雙側(cè)區(qū)域檢測(cè)。不同方法的區(qū)域檢測(cè)效果不同,利用合適的區(qū)域檢測(cè)方法可以得到較好的區(qū)域檢測(cè)效果。
1.1.1 霍夫直線檢測(cè)原理
霍夫直線檢測(cè)[6]在計(jì)算機(jī)視覺領(lǐng)域中有著重要的研究意義,其基本原理在于利用圖像空間中的邊緣像素點(diǎn)映射參數(shù)空間中參考點(diǎn)的可能軌跡。即圖像空間與參數(shù)空間中的點(diǎn)線是一一對(duì)應(yīng)的,圖像空間中的某個(gè)點(diǎn)對(duì)應(yīng)著參數(shù)空間中的某條線,反之同理。由此可知,參數(shù)空間中多條線映射著圖像空間中多個(gè)不同的點(diǎn),而多條線的交點(diǎn)即為圖像空間中的某條直線[7],通過計(jì)算累計(jì)結(jié)果的局部最大值得到直線集合。
依照上述原理進(jìn)行圖像中的直線檢測(cè),利用公式ρ=xcosθ+ysinθ求解兩空間的對(duì)應(yīng)關(guān)系[8]。首先遍歷圖像中的像素點(diǎn),將像素點(diǎn)的坐標(biāo)值與規(guī)定范圍內(nèi)θ角度值代入公式計(jì)算距離ρ值,以ρ值與θ角度值為橫縱坐標(biāo)存入計(jì)數(shù)器矩陣中,計(jì)算兩值相同的像素點(diǎn)的數(shù)量。每個(gè)像素點(diǎn)的角度變換極值為180。,均遍歷后得到計(jì)數(shù)器矩陣。在規(guī)定閾值的前提下,矩陣中元素值超過閾值的橫縱坐標(biāo)(θ,ρ)為直線在參數(shù)空間中的映射表示,代入公式求解x值與y值即得到基于霍夫變換[9]檢測(cè)到的直線坐標(biāo)集合。
1.1.2 邊緣檢測(cè)
為使醫(yī)療化驗(yàn)單區(qū)域檢測(cè)的效果更佳,在霍夫直線檢測(cè)之前對(duì)圖像進(jìn)行邊緣檢測(cè)[10]。所謂邊緣是指圖像信息周圍灰度值急劇變化的像素集合,是不同屬性區(qū)域的交界處,通常代表著內(nèi)容的變化[11-12],它是圖像分割所依賴的最重要的依據(jù)。
Canny邊緣檢測(cè)包含四個(gè)步驟:(1)利用高斯濾波器進(jìn)行濾波操作,降低噪聲點(diǎn)的干擾;(2)使用Sobel算子,計(jì)算各個(gè)點(diǎn)的梯度幅值與梯度方向;(3)利用非極大值抑制,消除邊緣檢測(cè)的雜散效應(yīng);(4)通過設(shè)置雙閾值,確定邊緣。
本節(jié)針對(duì)邊緣檢測(cè)使用python環(huán)境的cv2.Canny()函數(shù)[13],該函數(shù)對(duì)上述功能進(jìn)行封裝,可直接調(diào)用。在調(diào)用時(shí)需設(shè)置閾值1與閾值2,一般來說閾值2大于閾值1,利用閾值2可檢測(cè)出大部分明顯的邊緣,確定真實(shí)邊緣,但仍有紕漏。需要設(shè)置[14]較小的閾值1連接斷斷續(xù)續(xù)的直線,確定潛在邊緣。
設(shè)置合適的閾值可以較為完整地顯示圖像中的輪廓信息,雙閾值設(shè)置過大或過小時(shí)均會(huì)造成圖像信息的不準(zhǔn)確。雙閾值均過小時(shí)除描述輪廓外會(huì)產(chǎn)生較多雜質(zhì),即篩選條件過低,將不屬于輪廓的噪聲也一并顯示,容易對(duì)區(qū)域檢測(cè)造成干擾。而雙閾值過大代表著篩選條件過高,原本圖像中的輪廓易被當(dāng)作雜質(zhì)忽略,會(huì)篩除真實(shí)邊緣,無法完整表示圖像輪廓信息,造成圖像信息缺失。
如上所述,閾值過大或過小均會(huì)造成圖像輪廓信息無法正確顯示。因此,找到合適的雙閾值可以有效地對(duì)圖像進(jìn)行邊緣檢測(cè)。經(jīng)過對(duì)比,實(shí)驗(yàn)設(shè)置的雙閾值為(50,150),可較為完整地顯示圖像輪廓,無其余雜質(zhì),效果較佳。
1.1.3 基于霍夫直線檢測(cè)具體流程
利用霍夫直線檢測(cè)進(jìn)行醫(yī)療化驗(yàn)單的區(qū)域檢測(cè)具體流程如圖1所示。
圖1 區(qū)域檢測(cè)具體流程
首先,對(duì)化驗(yàn)單灰度圖進(jìn)行邊緣檢測(cè)生成二值圖。再利用概率霍夫變換函數(shù)cv2.HoughLinesP()生成檢測(cè)到的所有線段頭尾坐標(biāo)集合。由于集合中有部分線段不符合后續(xù)區(qū)域檢測(cè)的要求,因此需要對(duì)線段集合進(jìn)行篩選。篩選條件設(shè)置為兩個(gè):(1)刪除豎直線段,即起點(diǎn)與終點(diǎn)橫坐標(biāo)相差距離較小的線段;(2)刪除平行距離過近的線段,由于化驗(yàn)單中的黑線不只由一行像素點(diǎn)表示,因此需刪去相鄰的線段,保留靠近下邊緣的線段。
將篩選后的線段縱坐標(biāo)放入新的集合,需在該集合中自動(dòng)檢測(cè)出檢驗(yàn)項(xiàng)區(qū)域的上下邊界,篩除不符合條件的線段。該醫(yī)院化驗(yàn)單的特點(diǎn)為檢驗(yàn)項(xiàng)呈現(xiàn)在表格之中。因此,可基于該特點(diǎn)確定區(qū)域上邊界max_up與下邊界max_down。通過比較相鄰兩直線的距離進(jìn)行判斷,直線相差距離較大的下方直線為下邊界,上邊界為距離較小的上方直線,依據(jù)最終上下邊界進(jìn)行切割即得到化驗(yàn)單檢驗(yàn)項(xiàng)區(qū)域。
該方法的難點(diǎn)在于調(diào)試合適的參數(shù),使檢驗(yàn)項(xiàng)區(qū)域檢測(cè)效果達(dá)到最佳。邊緣檢測(cè),霍夫直線檢測(cè)均需要針對(duì)不同的醫(yī)療化驗(yàn)單進(jìn)行閾值調(diào)試,往往不同化驗(yàn)單所需閾值不同,且調(diào)試閾值較花費(fèi)時(shí)間,故該方法無法對(duì)大量醫(yī)療化驗(yàn)單進(jìn)行區(qū)域檢測(cè)。
由于醫(yī)療化驗(yàn)單具有固定的版型,因此本節(jié)通過二值圖的黑色像素點(diǎn)是否連續(xù)來判斷直線坐標(biāo),根據(jù)圖像單側(cè)檢測(cè)到的直線坐標(biāo)進(jìn)行區(qū)域檢測(cè)。利用該方法檢測(cè)化驗(yàn)單的檢驗(yàn)項(xiàng)區(qū)域可較準(zhǔn)確地提取出所需部分。
1.2.1 圖像二值化
為使醫(yī)療化驗(yàn)單中區(qū)域區(qū)分更加明顯,預(yù)先利用python環(huán)境的cv2.cvtColor()函數(shù)將原始RGB圖像轉(zhuǎn)換為灰度圖[15],將色彩三通道變?yōu)閱瓮ǖ溃源藴p少運(yùn)算量;再對(duì)灰度圖二值化達(dá)到突出前景的目的。二值化是指通過設(shè)置閾值,把圖像的每個(gè)像素值按照閾值大小設(shè)定為0或255,使圖像呈黑白效果,有效地突出圖像輪廓,可明顯區(qū)分圖像前景與背景,方便提取圖像中的信息,降低維度。
二值化處理中最重要的是閾值選取,需要根據(jù)閾值的大小判斷像素點(diǎn)的值,不同閾值的選取會(huì)呈現(xiàn)不同的圖像效果,合適的閾值選取會(huì)提高單側(cè)區(qū)域檢測(cè)方法的檢測(cè)準(zhǔn)確性。閾值選取分為全局閾值與局部閾值。全局閾值是指圖像像素均按照一個(gè)閾值來劃分:大于該值的像素群和小于該值的像素群,該閾值選取方法較單一,無法根據(jù)圖像亮度等因素進(jìn)行閾值設(shè)定,對(duì)光照不均勻的圖像容易出現(xiàn)錯(cuò)誤的二值分割;局部閾值是指按照?qǐng)D像中不同部分的不同亮度來計(jì)算每一個(gè)區(qū)域的閾值[16-17],該方法按照區(qū)域特點(diǎn)[18]設(shè)定不同閾值。為準(zhǔn)確地突出每一部分的輪廓,避免光照不均勻等誤差,實(shí)驗(yàn)將使用局部自適應(yīng)閾值法進(jìn)行圖像預(yù)處理。
局部自適應(yīng)閾值法[19]是根據(jù)像素的鄰域塊的像素值分布來確定該像素位置上的二值化閾值。通過調(diào)用函數(shù)cv2.adaptiveThreshold()對(duì)灰度圖實(shí)現(xiàn)二值化,針對(duì)每一個(gè)像素點(diǎn)設(shè)置相應(yīng)的閾值,即對(duì)該像素點(diǎn)周圍的像素值加權(quán)平均,并減去一設(shè)定常數(shù),從而得到該像素點(diǎn)的閾值。該方法打破了全局閾值的束縛,減少了相對(duì)誤差。
1.2.2 單側(cè)區(qū)域檢測(cè)具體流程
單側(cè)區(qū)域檢測(cè)是基于醫(yī)療化驗(yàn)單二值圖實(shí)現(xiàn)的,按照判定范圍分為左側(cè)區(qū)域檢測(cè)與右側(cè)區(qū)域檢測(cè),即從不同側(cè)對(duì)化驗(yàn)單進(jìn)行檢驗(yàn)項(xiàng)區(qū)域檢測(cè)。二者針對(duì)不同傾斜方向的圖像有著不同的效果。單側(cè)區(qū)域檢測(cè)具體流程如圖2所示。
圖2 單側(cè)區(qū)域檢測(cè)具體流程
首先,對(duì)醫(yī)療化驗(yàn)單灰度圖進(jìn)行自適應(yīng)閾值化生成二值圖,大于閾值的像素值設(shè)為255,反之則設(shè)為0。再根據(jù)待測(cè)圖像的特征輸入判定范圍,可選擇左側(cè)或右側(cè)進(jìn)行區(qū)域檢測(cè),本節(jié)設(shè)判定長度為40。從圖像縱軸起點(diǎn)開始判定,若該行像素點(diǎn)均為黑色,則將該行橫坐標(biāo)計(jì)入直線集合中;若存在白色像素點(diǎn),則跳到下一行,以此循環(huán)。將范圍內(nèi)的像素點(diǎn)均遍歷過后,即得到初檢測(cè)的直線集合。
上述所得到的直線集合是范圍內(nèi)未經(jīng)篩選的全部直線,為找出檢驗(yàn)項(xiàng)區(qū)域的上下邊界,需對(duì)該集合進(jìn)行篩選[20],篩選條件與基于霍夫檢測(cè)方法相同,篩選后即得到檢驗(yàn)項(xiàng)區(qū)域上下邊界,依據(jù)檢測(cè)到的上下邊界進(jìn)行區(qū)域切割。
單側(cè)區(qū)域檢測(cè)的特點(diǎn)是以單側(cè)檢測(cè)的坐標(biāo)為基準(zhǔn)進(jìn)行切割,對(duì)于傾斜角度較小的化驗(yàn)單具有良好的檢測(cè)效果,不同側(cè)的區(qū)域檢測(cè)方法適用于不同傾斜方向的化驗(yàn)單。同時(shí),該方法無需耗費(fèi)過多時(shí)間進(jìn)行參數(shù)調(diào)試,即可實(shí)現(xiàn)大量化驗(yàn)單的檢驗(yàn)項(xiàng)區(qū)域檢測(cè)。
雙側(cè)區(qū)域檢測(cè)是在單側(cè)區(qū)域檢測(cè)的基礎(chǔ)上完成的,具體流程相似。二者均預(yù)先對(duì)醫(yī)療化驗(yàn)單灰度圖進(jìn)行二值化處理,生成像素值為0或255的二值圖;再利用判定直線算法產(chǎn)生初直線集合;最后基于篩選條件生成檢驗(yàn)項(xiàng)區(qū)域的上下邊界,以此完成檢驗(yàn)項(xiàng)區(qū)域檢測(cè)。但不同于單側(cè)的左側(cè)遍歷或右側(cè)遍歷,雙側(cè)區(qū)域檢測(cè)的特點(diǎn)是相繼輸入左側(cè)與右側(cè)的判定范圍,分別實(shí)現(xiàn)上述過程后返回兩組輸出值,對(duì)比兩組輸出值生成檢驗(yàn)項(xiàng)區(qū)域的上下邊界,以此進(jìn)行區(qū)域切割。
直線判定范圍是決定區(qū)域檢測(cè)效果的重要因素,合適的判定范圍可優(yōu)化檢驗(yàn)項(xiàng)區(qū)域的檢測(cè)效果,雙側(cè)區(qū)域檢測(cè)需設(shè)定不同側(cè)的直線判定范圍。設(shè)醫(yī)療化驗(yàn)單寬度為w,寬度系數(shù)為100。實(shí)驗(yàn)分別對(duì)比了橫軸起點(diǎn)為左側(cè)w/25,左側(cè)w/6,右側(cè)w/6的圖像信息。結(jié)果表明圖像在不同的范圍內(nèi)呈現(xiàn)不同的信息。故選定左側(cè)w/6與右側(cè)w/6作為雙側(cè)區(qū)域檢測(cè)范圍。
左側(cè)與右側(cè)分別輸出檢驗(yàn)項(xiàng)區(qū)域上下邊界的目的是防止左右傾斜相差過大,為均衡左右邊界坐標(biāo),減少雜質(zhì)切割,即對(duì)左右兩側(cè)的輸出值進(jìn)行對(duì)比得到最終的上下邊界(max_up,max_down),并進(jìn)行檢驗(yàn)項(xiàng)區(qū)域切割。
通過對(duì)比左右側(cè)返回的坐標(biāo),判斷該化驗(yàn)單是否處于傾斜狀態(tài)。若傾斜角度過大,可依據(jù)四點(diǎn)坐標(biāo)進(jìn)行傾斜圖像的矯正。
上文介紹了三種不同的區(qū)域檢測(cè)方法:基于霍夫直線檢測(cè)、單側(cè)區(qū)域檢測(cè)與雙側(cè)區(qū)域檢測(cè)方法,下面將針對(duì)三種方法的檢測(cè)效果進(jìn)行分析總結(jié)。實(shí)驗(yàn)數(shù)據(jù)為某醫(yī)院30張真實(shí)醫(yī)療化驗(yàn)單:16張手機(jī)拍攝+14張高拍儀拍攝。針對(duì)以下問題展開具體分析:(1)針對(duì)不同設(shè)備拍攝的化驗(yàn)單,三種區(qū)域檢測(cè)方法效果是否相同;(2)是否對(duì)所有類型的化驗(yàn)單圖像均可準(zhǔn)確檢測(cè),如在不同傾斜角度下拍攝的化驗(yàn)單。
據(jù)高拍儀拍攝的14張圖像顯示,由于高拍儀設(shè)備具有自動(dòng)裁剪與亮度均勻的特點(diǎn),可精準(zhǔn)裁剪化驗(yàn)單的整體輪廓。故拍攝的圖像均為水平放置,且無背景噪聲。
由此可見,醫(yī)療化驗(yàn)單經(jīng)高拍儀拍攝后,均顯示為規(guī)整模式的圖像,無區(qū)域檢測(cè)難度。分別利用三種區(qū)域檢測(cè)方法對(duì)14張高拍儀拍攝的化驗(yàn)單進(jìn)行檢測(cè),發(fā)現(xiàn)由于化驗(yàn)單的類型相同,任意一種方法均能準(zhǔn)確地檢測(cè)出14張圖像的檢驗(yàn)項(xiàng)區(qū)域,檢測(cè)效果良好且相同。因此,若對(duì)高拍儀拍攝的醫(yī)療化驗(yàn)單進(jìn)行區(qū)域檢測(cè),采用任意一種檢測(cè)方法均可。
針對(duì)16張手機(jī)拍攝的醫(yī)療化驗(yàn)單進(jìn)行區(qū)域檢測(cè)時(shí)發(fā)現(xiàn),不同于高拍儀拍攝的化驗(yàn)單,由于手機(jī)拍攝缺乏專業(yè)性,會(huì)出現(xiàn)化驗(yàn)單傾斜、背景噪聲等問題,對(duì)區(qū)域檢測(cè)造成干擾。因此對(duì)每種方法所適合的檢測(cè)場(chǎng)景展開研究。
(1)由于霍夫直線檢測(cè)有設(shè)置閾值的限制,利用基于霍夫直線檢測(cè)方法進(jìn)行區(qū)域檢測(cè)時(shí),需設(shè)置最小線長度閾值(minLineLength)與最大線差值(maxLineGap),因此研究不同閾值與化驗(yàn)單的關(guān)系是區(qū)域檢測(cè)的基礎(chǔ)。為確定不同閾值對(duì)同一張醫(yī)療化驗(yàn)單區(qū)域檢測(cè)效果的影響,設(shè)置不同閾值進(jìn)行對(duì)比實(shí)驗(yàn)。選定任意一張手機(jī)拍攝的醫(yī)療化驗(yàn)單,在該化驗(yàn)單的基礎(chǔ)上設(shè)置不同的最小線長度閾值(minLineLength),并對(duì)檢測(cè)效果進(jìn)行對(duì)比。首先對(duì)化驗(yàn)單a選定兩個(gè)不同的最小線長度閾值,分別為147與180。可以看出,對(duì)化驗(yàn)單a進(jìn)行閾值調(diào)試時(shí),閾值為147的檢測(cè)效果較好,可較準(zhǔn)確的檢測(cè)出檢驗(yàn)項(xiàng)區(qū)域。
由此可得,對(duì)于同一張手機(jī)拍攝的醫(yī)療化驗(yàn)單,設(shè)置不同的閾值檢測(cè)效果有明顯差異。因此,對(duì)醫(yī)療化驗(yàn)單進(jìn)行區(qū)域檢測(cè)時(shí),需針對(duì)不同化驗(yàn)單進(jìn)行閾值的調(diào)試,閾值可直接影響檢測(cè)效果。將閾值設(shè)為最佳數(shù)值時(shí)能準(zhǔn)確地檢測(cè)出醫(yī)療化驗(yàn)單的檢驗(yàn)項(xiàng)區(qū)域,檢測(cè)效果較好。
為更清晰地分析基于霍夫直線檢測(cè)的區(qū)域檢測(cè)方法適合的場(chǎng)景,需以同一閾值對(duì)不同的醫(yī)療化驗(yàn)單進(jìn)行區(qū)域檢測(cè)。在化驗(yàn)單a中最小線長度閾值為147時(shí)檢測(cè)效果較佳,故利用該閾值對(duì)化驗(yàn)單b進(jìn)行區(qū)域檢測(cè)。通過對(duì)比同一閾值下不同化驗(yàn)單的檢測(cè)效果判斷該方法能否進(jìn)行批量化驗(yàn)單的區(qū)域檢測(cè)。實(shí)驗(yàn)結(jié)果如圖3所示,圖3(a)為當(dāng)minLineLength=147時(shí)對(duì)化驗(yàn)單a進(jìn)行檢測(cè)的效果,圖3(b)為當(dāng)minLineLength=147時(shí),對(duì)另一張手機(jī)拍攝的化驗(yàn)單b進(jìn)行區(qū)域檢測(cè)的效果,可明顯看出,效果不佳。
(a)當(dāng)minLineLength=147時(shí)化驗(yàn)單a的檢測(cè)效果
(b)當(dāng)minLineLength=147時(shí)化驗(yàn)單b的檢測(cè)效果
如上文所述,基于霍夫直線檢測(cè)的區(qū)域檢測(cè)方法應(yīng)用在手機(jī)拍攝的化驗(yàn)單上有一定的局限性。當(dāng)對(duì)某張化驗(yàn)單進(jìn)行不同閾值測(cè)試時(shí),可根據(jù)檢測(cè)效果得到適合該化驗(yàn)單的最佳閾值;利用該閾值對(duì)其他化驗(yàn)單進(jìn)行檢測(cè)時(shí)發(fā)現(xiàn)效果較差,是由于手機(jī)拍攝的圖像類型不盡相同,例如傾斜程度的不同會(huì)產(chǎn)生不同的干擾。因此對(duì)于手機(jī)拍攝的單張化驗(yàn)單,需調(diào)到適合該化驗(yàn)單的檢測(cè)閾值進(jìn)行檢測(cè)。不同圖像的檢測(cè)閾值往往不同,且調(diào)試到合適的閾值較花費(fèi)時(shí)間,故無法應(yīng)用此方法對(duì)大批量化驗(yàn)單進(jìn)行檢驗(yàn)項(xiàng)區(qū)域檢測(cè)。
(2)單側(cè)區(qū)域檢測(cè)方法沒有霍夫閾值的限制,因此無需對(duì)不同化驗(yàn)單進(jìn)行閾值調(diào)試,檢測(cè)花費(fèi)時(shí)間較少。該方法分為左側(cè)區(qū)域檢測(cè)與右側(cè)區(qū)域檢測(cè),即按照左側(cè)或右側(cè)檢測(cè)的坐標(biāo)進(jìn)行檢驗(yàn)項(xiàng)區(qū)域切割。二者適用于不同傾斜方向的圖像,對(duì)順時(shí)針傾斜或逆時(shí)針傾斜的化驗(yàn)單有不同的檢測(cè)效果。若利用左側(cè)檢測(cè)方法對(duì)順時(shí)針傾斜的化驗(yàn)單進(jìn)行區(qū)域檢測(cè),可較準(zhǔn)確地檢測(cè)出檢驗(yàn)項(xiàng)區(qū)域,減少背景雜質(zhì)的出現(xiàn)。通過對(duì)比不同方法對(duì)同一傾斜圖像的檢測(cè)效果,找到適合該類型圖像的檢測(cè)方法。如圖4(a)為對(duì)順時(shí)針傾斜的化驗(yàn)單進(jìn)行左側(cè)檢測(cè)的效果,圖4(b)為對(duì)相同圖像進(jìn)行右側(cè)檢測(cè)的效果。
經(jīng)對(duì)比可知,左側(cè)區(qū)域檢測(cè)方法適用于順時(shí)針傾斜的化驗(yàn)單圖像,依照左側(cè)檢測(cè)的坐標(biāo)對(duì)該類型圖像進(jìn)行切割可減少背景噪聲,防止切割到其余雜質(zhì)。同理,針對(duì)逆時(shí)針傾斜的化驗(yàn)單圖像,利用右側(cè)區(qū)域檢測(cè)方法較為合適,以右側(cè)檢測(cè)到的邊界線對(duì)逆時(shí)針傾斜的圖像進(jìn)行區(qū)域切割,可得到較準(zhǔn)確的檢驗(yàn)項(xiàng)區(qū)域。
(a)對(duì)順時(shí)針傾斜的化驗(yàn)單左側(cè)檢測(cè)的效果
(b)對(duì)順時(shí)針傾斜的化驗(yàn)單右側(cè)檢測(cè)的效果
綜上所述,單側(cè)區(qū)域檢測(cè)方法適用于不同傾斜方向的化驗(yàn)單。根據(jù)化驗(yàn)單的狀態(tài)選擇左側(cè)檢測(cè)或右側(cè)檢測(cè),可得到較優(yōu)效果。即對(duì)不同傾斜方向的醫(yī)療化驗(yàn)單進(jìn)行區(qū)域檢測(cè),需選擇適合該檢測(cè)場(chǎng)景的區(qū)域檢測(cè)方法。
(3)對(duì)手機(jī)拍攝的16張醫(yī)療化驗(yàn)單進(jìn)行區(qū)域檢測(cè)時(shí)發(fā)現(xiàn),雙側(cè)區(qū)域檢測(cè)的特點(diǎn)是會(huì)返回左右兩側(cè)檢測(cè)到的縱軸坐標(biāo)值,該值為檢驗(yàn)項(xiàng)區(qū)域的上下邊界坐標(biāo)。當(dāng)圖像趨于傾斜時(shí)返回的坐標(biāo)會(huì)有明顯差異,左右兩側(cè)坐標(biāo)未處于同一水平線,可以此判斷圖像是否處于傾斜狀態(tài)。通過對(duì)比左右兩側(cè)坐標(biāo)值,將傾斜圖像校正并切割檢驗(yàn)項(xiàng)區(qū)域。
醫(yī)療領(lǐng)域的發(fā)展已成為社會(huì)熱點(diǎn),醫(yī)療化驗(yàn)單識(shí)別在醫(yī)療領(lǐng)域中占據(jù)著重要的研究地位。檢驗(yàn)項(xiàng)區(qū)域檢測(cè)是化驗(yàn)單識(shí)別必不可少的預(yù)處理,前者的檢測(cè)效果對(duì)識(shí)別的準(zhǔn)確率有著重要的影響。因此找到區(qū)域檢測(cè)方法所適合的檢測(cè)場(chǎng)景有著重要的研究意義。
該文提出了三種區(qū)域檢測(cè)方法,分別描述每種方法的原理與流程,為后續(xù)對(duì)比實(shí)驗(yàn)奠定基礎(chǔ)。同時(shí),以某醫(yī)院真實(shí)化驗(yàn)單為實(shí)驗(yàn)數(shù)據(jù),利用不同設(shè)備對(duì)醫(yī)療化驗(yàn)單進(jìn)行拍攝,通過對(duì)比化驗(yàn)單的區(qū)域檢測(cè)效果對(duì)每種方法適合的拍攝情景進(jìn)行說明。
不同的區(qū)域檢測(cè)方法適合不同類型的化驗(yàn)單。根據(jù)化驗(yàn)單特點(diǎn)找到適合的區(qū)域檢測(cè)方法,可得到較好的檢測(cè)效果,為后續(xù)的識(shí)別做鋪墊,效果顯著。