有視覺障礙的人群無法直接閱讀普通書報,只能靠觸摸盲文書來進(jìn)行閱讀。但是,學(xué)習(xí)和使用盲文不是一件容易的事情。而且,盲文出版物體積大、成本高、信息量和發(fā)行量少,大大阻礙了視障人士獲取知識和信息。近幾年,不斷發(fā)展的信息技術(shù),特別是圖像處理、文字識別、語音合成技術(shù),為視力障礙者接觸文字知識提供了重要的手段和方法。智能閱讀器綜合運(yùn)用這幾種信息技術(shù),將紙質(zhì)讀物上的文字轉(zhuǎn)換為有聲讀物,以幫助視障人士快捷方便地獲取普通書報、文檔等的文字信息,提高視障人士的生活質(zhì)量。
智能閱讀器的開發(fā)需要OCR技術(shù)。圖像的攝取是智能閱讀器的第一步,首先需要通過掃描儀對文檔進(jìn)行掃描,形成文檔圖像,然后運(yùn)用OCR技術(shù)從圖像中識別出文本。目前,對OCR技術(shù)的研究比較多,效果各異,但是各廠家封鎖技術(shù),并且都已做成產(chǎn)品,不利于二次開發(fā)。微軟提供的office OCR組件,支持多種語言,使用方法簡單,識別效果好。智能閱讀器軟件運(yùn)行于Windows系統(tǒng),使用Visual C++進(jìn)行開發(fā),可以方便地導(dǎo)入office OCR組件。
該智能閱讀器實(shí)現(xiàn)了紙質(zhì)讀物上的文字到有聲讀物的轉(zhuǎn)換,幫助視障人士快捷方便地獲取普通書報、文檔等的文字信息,并且具有結(jié)構(gòu)簡單、體積小、識別準(zhǔn)確率高、成本低等優(yōu)點(diǎn)。提出的基于office OCR組件的文檔圖像識別的方法可以快速地對文檔圖像進(jìn)行識別,滿足消費(fèi)者對閱讀器的性能要求。該文提供的方法可以用于與文字識別相關(guān)的二次開發(fā)。