薛峰 朱強
摘要:伴隨越來越多的人利用手機等移動設(shè)備處理日常工作以及生活中的各種事宜。本文基于Android系統(tǒng)技術(shù)平臺對圖文同步識別系統(tǒng)進行分析和研究,針對圖形和文字不太規(guī)范,圖文識別系統(tǒng)不明顯等缺陷提出了相應(yīng)的改進方案,盡可能對圖文進行同步預(yù)覽以及識別,結(jié)合系統(tǒng)實際運行過程中存在的問題,提出消噪、亮度均衡、閾值分割等質(zhì)量提升處理措施,保證圖文信息的識別率得到提升。
關(guān)鍵詞:Android應(yīng)用系統(tǒng) 圖文同步 識別系統(tǒng)
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9416(2016)09-0058-02
如何利用Android系統(tǒng)對軟件進行研究和開發(fā),逐漸成為目前相關(guān)領(lǐng)域工作人員需要研究和思考的問題,系統(tǒng)架構(gòu)和開發(fā)模式將會對系統(tǒng)最終的運用成果產(chǎn)生直接的影響,智能手機系統(tǒng)中研究和開發(fā)所得的尚書七號、ABBYY FineReader都運用在手機掃描設(shè)備中。但是,其便捷性相對較低,而且圖文信息處理較為繁瑣,無法滿足對文字進行識別和記錄的需求,通過對終端設(shè)備圖文信息進行識別能解決大型設(shè)備移動難度大、使用步驟繁雜等劣勢,讓辦公和移動學(xué)習(xí)更加順利進行。
1 系統(tǒng)知識理論
當前使用Android手機平臺能夠在一定程度上達到OCR等功能要求,通過這種移動系統(tǒng)使用和開發(fā)能夠方便對各種不同接口函數(shù)進行使用,對各種不同的硬件設(shè)備進行調(diào)用,并實施編程開發(fā),在對系統(tǒng)進行開發(fā)是要能夠加大對相關(guān)開發(fā)工具的使用,包括Android SDK、Java JDK和Eclipse等。
1.1 JAVA技術(shù)支持
Java屬于一種面向?qū)ο蟮木幊陶Z言。當前使用的主要目的就是讓程序開發(fā)者能夠一次完成編寫,從而順利運行,這就標志著從一個平臺轉(zhuǎn)移到另外平臺,不需要對代碼進行重新編譯,Java應(yīng)用程序一般會翻譯成字節(jié)碼,因此,無論哪種計算機體結(jié)構(gòu)在所有的Java虛擬機上使用。Java語法來自于C++,但是,存在的差異的是配合語法結(jié)構(gòu)化,一般面對對象編程,Java是作為一種面向?qū)ο蟮臉?gòu)成因素,一切的代碼都屬于類范圍、對象除了浮點、整形、字符、布爾型,Java也改變了C++中會出錯的指針、goto語句以及全局變量等。
1.2 Android編程技術(shù)
現(xiàn)階段Android系統(tǒng)所具有的內(nèi)核控制包括儲存器、安全、進程、驅(qū)動程序模型和網(wǎng)絡(luò)堆疊等幾種。Android構(gòu)件包括Linux Knrnel、Libraries、Applications等。針對移動設(shè)備應(yīng)用程序來分析,界面設(shè)計給用戶留下的首個印象關(guān)鍵點界面設(shè)計效果將會對用戶的選擇造成直接影響,Android工具開發(fā)期間提供了直接簡單的設(shè)計方法和界面布局,開發(fā)者使用設(shè)計UI界面、XNL文件開發(fā)、利用簡單有效的操作能夠?qū)换グ粹o進行增加,對布局位置進行設(shè)計,對圖片和文字格式進行調(diào)整,這種邏輯控制分開、界面設(shè)計從根本上提升了編程效率,程序員可以利用邏輯實現(xiàn)進行考慮。
2 程序設(shè)計
2.1 OCR功能模塊
(1)預(yù)處理。預(yù)處理也是保證ORC功能模塊實現(xiàn)的首要步驟,也是后期對圖文信息進行操作的條件,因為圖文信息受到自然環(huán)境因素的影響,包括空氣中下雨、灰塵、光照缺乏、收集設(shè)備硬件的影響,從而讓圖文信息中的圖文達到更加清晰。[3]所以,在對文本圖像進行相應(yīng)的識別和處理之前,首先要能夠?qū)ζ鋱D文實施預(yù)處理,盡可能排除各種不良干擾因素可能會對識別結(jié)果造成的影響。(2)字符處理。在進行字符處理也是該程序相對重要的一個步驟,正確科學(xué)的字符處理也是保證相關(guān)功能、用戶體驗效果得到提升的主要途徑,一般基本類型的核心所在就是OCR算法,該種算法能夠出現(xiàn)相應(yīng)的候選字符分級列表,包括特征提取和矩陣匹配兩種。[4]Tesseract和Cuneiform兩種不同的軟件的使用可以通過相應(yīng)的方法來完成字符識別,其中第二種方法也稱之為自適應(yīng)識別,并且利用能夠更好地對第二次剩余的字母可信度形狀進行認可。
2.2 系統(tǒng)設(shè)計
系統(tǒng)選擇層次式的設(shè)計結(jié)構(gòu),如下圖1所示,頂層屬于用戶操作的UI交互界面,主要是負責和用戶的觸屏點擊等操作、識別結(jié)果進行顯示。下面層次則是系統(tǒng)功能模塊層,負責對業(yè)務(wù)邏輯進行處理,包括同步、批量以及聯(lián)網(wǎng)識別等。同步識別模式包括對預(yù)覽圖文進行同步連續(xù)識別,用戶在對拍攝圖文進行預(yù)覽的過程中能夠看到相應(yīng)的識別效果;批量識別模塊能夠?qū)ε繄D文進行一次性識別,利用一鍵來獲得電子書的效果;聯(lián)網(wǎng)識別則能夠?qū)Ψ?wù)器端口進行識別接口,讓性能較低的移動終端獲得相應(yīng)的支持;最后的圖文處理層則主要是結(jié)合手機或者其他移動終端拍攝圖文顯示出的特點,結(jié)合圖文的實際狀況來提升引擎文字所具有的識別率,讓圖文能夠更容易被識別。針對處理之后的圖文文字實施文字識別,并且識別所得的結(jié)果返回到UI交互界面。
對軟件圖標進行點擊之后就轉(zhuǎn)入到功能選擇系統(tǒng),更好地完成實時、批量識別工作,全面系統(tǒng)地閱讀文檔資料。觸摸面上面設(shè)置的圖標一旦遭到觸發(fā)就會讓功能事件發(fā)生,并開始操作實時識別,通過單張圖片、連續(xù)圖片拍攝識別技術(shù)產(chǎn)生相應(yīng)的功效,配合實際識別、手機聯(lián)網(wǎng)等問題選擇是否能夠利用網(wǎng)絡(luò)進行識別,并將獲得的結(jié)果轉(zhuǎn)變?yōu)槲臋n信息資料。[6]通過系統(tǒng)本身所具有的批量識別技術(shù)挑選出需要調(diào)整的圖文資料,配合圖文的信息、質(zhì)量來選擇是否進行聯(lián)網(wǎng)識別操作,結(jié)合儲存位置選擇文檔,并將其打開閱讀,完成相關(guān)操作之后則認為操作結(jié)束,返回到選取功能的界面,實際操作如圖2所示。
3 系統(tǒng)實現(xiàn)
首先為預(yù)覽圖文同步識別,因為手機硬件之間存在差異,對圖片的實際識別和處理速度、連續(xù)拍照時間間隔都存在較大的差異,因此,在對圖文信息進行連續(xù)采集時不可能對固定時間間隔進行設(shè)定,避免出現(xiàn)文字信息識別、圖文顯示不對稱等現(xiàn)象。所以,系統(tǒng)利用Android系統(tǒng)所提供的接口條件,在實際拍攝獲得的預(yù)覽圖文幀信息,保證圖文顯示以及識別結(jié)果能夠達到需求。其次,在對單張拍攝圖文進行識別時,通過對取景框觸碰來達到指定對焦的目的,按下拍照按鈕就能夠得到關(guān)于圖文處理的相關(guān)數(shù)據(jù),還能夠在提升質(zhì)量、識別處理工作之后在文檔編輯框顯示識別結(jié)果。[7]因為拍攝單張圖文識別并非需要對圖文數(shù)據(jù)進行聯(lián)系采取,圖文從獲取到識別都是順序完成,所以,只要選擇單線程就能夠獨立完成。最后,文檔閱讀模塊能夠為用戶提供更多的文檔編輯和查閱操作,包括內(nèi)置和外置閱讀器,利用相應(yīng)的系統(tǒng)選擇需要查閱的文檔,并將其內(nèi)容讀取到編輯框中加以顯示,可進行編輯保存等。
4 結(jié)語
該系統(tǒng)的研究和開發(fā)基本上滿資料查閱、場景記錄等需求,利用OCR手機字符增強識別的方法能夠讓用戶需求得到更好地滿足,人性化體驗的增加具有顯著的市場價值,系統(tǒng)實現(xiàn)圖文字符識別以及圖文處理要求,但是,其存在一定的缺陷,例如技術(shù)不成熟、處理適度較慢,所以,需要對系統(tǒng)功能進行繼續(xù)完善,對代碼質(zhì)量進行優(yōu)化,這也是后期的研究發(fā)展方向。
參考文獻
[1]楊飛,茅和華,溫一軍.基于Android的隨身客戶信息管理系統(tǒng)的設(shè)計與開發(fā)[J].沙洲職業(yè)工學(xué)院學(xué)報,2012(04):11-16.
[2]任偉嘉,何志毅,陳名松.Android平板電腦無線控制的計算機演示系統(tǒng)[J].計算機工程與設(shè)計,2015(02):556-561.
[3]王國裕,李玄華,張紅升. Android應(yīng)用框架層usb驅(qū)動設(shè)計及在DAB接收機上的應(yīng)用[J].電子質(zhì)量,2015(03):26-29.
[4]孔令來,王倩,季紅.基于Android系統(tǒng)平臺設(shè)計和實現(xiàn)電子書的閱讀應(yīng)用[J].電子制作,2013(24):50-55.
[5]鮑曉.基于Android平臺的新聞資訊閱讀軟件的設(shè)計與實現(xiàn)[J].計算機應(yīng)用,2013(S2):279-282+289.
[6]朱應(yīng)麗,崔彥軍,解建軍.基于Android平臺的信息采集傳輸系統(tǒng)設(shè)計[J].電腦與信息技術(shù),2014(02):4-7.
[7]陳望挺,林滿足,陳健,章躍,傅奇佳,竺樂慶.基于JSP和Android的C/S結(jié)構(gòu)問卷系統(tǒng)[J].計算機應(yīng)用,2013(03):886-889.