李志梅(廣東省自動(dòng)化研究所,廣東廣州510070)
基于手寫板的手寫電子留言板信息管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
李志梅
(廣東省自動(dòng)化研究所,廣東廣州510070)
介紹基于市面上的成熟的手寫板和手寫中文識(shí)別的技術(shù),采用數(shù)據(jù)存儲(chǔ)分類和分析手段,建立起手寫電子留言信息管理系統(tǒng),實(shí)現(xiàn)在方便手寫留言的基礎(chǔ)上,最大限度地提高手寫留言信息的使用效率和使用價(jià)值。
手寫板;電子留言板存儲(chǔ)模式;手寫識(shí)別;分類存儲(chǔ);信息分析
隨著計(jì)算機(jī)技術(shù)和手寫板技術(shù)的飛速發(fā)展,手寫電子留言板在人們的生活中日益受到關(guān)注。無(wú)論作為日常交流平臺(tái),還是作為自動(dòng)化系統(tǒng)的一部分,它都能在游客和管理者之間建立起橋梁關(guān)系,具有良好的互動(dòng)效果。本文主要介紹的是,在采用市面上成熟的手寫板軟硬件技術(shù)以及手寫聯(lián)機(jī)識(shí)別的基礎(chǔ)上,通過(guò)圖片的分類存儲(chǔ),建立起方便游客的查詢回味,更方便管理者信息管理分析的手寫信息管理系統(tǒng)。
如圖1所示,系統(tǒng)簡(jiǎn)單分為前端輸入和后端處理兩部分。前端輸入采用手寫板進(jìn)行手寫的輸入,在書寫的過(guò)程中進(jìn)行手寫聯(lián)機(jī)識(shí)別。本系統(tǒng)采用分布式輸入、集中管理的模式,在園區(qū)不同景點(diǎn)分別設(shè)置手寫板,游客可以按照當(dāng)時(shí)的感受,采用隨想隨記的模式,寫下自己觀感和意見(jiàn)。數(shù)據(jù)保存時(shí),按照聯(lián)機(jī)識(shí)別的結(jié)果,保存至總機(jī)的數(shù)據(jù)庫(kù)。在數(shù)據(jù)記錄的類別即為當(dāng)?shù)貓@區(qū)的名稱。這樣方便以后查詢使用。
圖1 系統(tǒng)的總體架構(gòu)
由于傳統(tǒng)的紙筆的留言方式會(huì)產(chǎn)生大量的紙質(zhì)文件,這些紙張的購(gòu)置需要一定的經(jīng)費(fèi),觀眾留言后的文件需要大量的密集柜存檔,存檔時(shí)又需要博物館社教相關(guān)專業(yè)人員進(jìn)行分類整理,如此耗費(fèi)經(jīng)費(fèi)和人力的問(wèn)題催生了電子留言系統(tǒng)的誕生。
傳統(tǒng)的紙筆的留言方式會(huì)產(chǎn)生大量的紙質(zhì)文件,不僅會(huì)產(chǎn)生紙張購(gòu)置的經(jīng)費(fèi),還會(huì)需要消耗大量的人力物力進(jìn)行存檔以及維護(hù),在后期使用中,例如查詢、信息整理上都有不便之處。如此耗費(fèi)經(jīng)費(fèi)和人力的問(wèn)題催生了電子留言系統(tǒng)的誕生。首先以鍵盤輸入文字,記錄留言的方式,開(kāi)始電子留言系統(tǒng)的雛形,但由于需要具有一定計(jì)算機(jī)技能的人員才能正確使用,也就限制了使用人群。而后語(yǔ)音留言方式的留言系統(tǒng),利用麥克風(fēng),觸摸板等方式進(jìn)行留言,拓寬了留言系統(tǒng)的使用人群。但是鑒于語(yǔ)音信息的多方面原因,使留言信息整理給工作人員帶來(lái)了諸多困難。這就催生了手寫留言方式的留言系統(tǒng)。這種留言系統(tǒng),同樣以觸摸屏為硬件載體[1],以數(shù)據(jù)庫(kù)為后臺(tái)系統(tǒng),不同的是它的交互界面以模仿紙張的樣式出現(xiàn),并且配備了電腦觸控筆,這種筆可以使觀眾在電腦屏幕上寫字,就好像在紙張上寫字一樣。觀眾寫好的文字會(huì)以圖片的形式存儲(chǔ)到數(shù)據(jù)庫(kù)中,同時(shí)這些文字內(nèi)容還會(huì)被用一個(gè)與留言系統(tǒng)相結(jié)合的大型屏幕展示出來(lái),保證使觀眾可以看到其他觀眾的留言。
手寫漢字識(shí)別的基本原理也是將輸入的文字與各個(gè)標(biāo)準(zhǔn)文字進(jìn)行模式的匹配,計(jì)算類似度。將具有最大類似度的標(biāo)準(zhǔn)文字作為識(shí)別結(jié)果。但是手寫體文字的人為因素隨意性大,經(jīng)常會(huì)出現(xiàn)連筆,和背景融合的現(xiàn)象,因而在對(duì)手寫體文字的識(shí)別中一般都會(huì)加入漢字識(shí)別的預(yù)處理階段,該階段主要是完成漢字圖像的正規(guī)化,將手寫輸入的文字尺寸歸一及矯正變形。然后再進(jìn)行漢字識(shí)別階段,在漢字識(shí)別階段,完成漢字的識(shí)別,涉及特征提取和分類器的設(shè)計(jì)。最后進(jìn)行識(shí)別后處理階段,利用漢字的結(jié)構(gòu)知識(shí)、語(yǔ)義、詞義等上下文先驗(yàn)信息進(jìn)行結(jié)果的糾錯(cuò)和最后確定。盡管進(jìn)行了這三個(gè)階段,在對(duì)稍微潦草的文字的識(shí)別中,錯(cuò)誤的比率依然很高。
手寫體漢字按照輸入方式不同,可分為聯(lián)機(jī)和脫機(jī)兩種。聯(lián)機(jī)手寫識(shí)別就是采用和計(jì)算機(jī)相連的書寫板,用戶一邊在書寫板上寫漢字,機(jī)器一邊識(shí)別處理,識(shí)別以筆劃為單位。根據(jù)一個(gè)漢字的筆劃組合、筆劃之間的位置和關(guān)系,最終識(shí)別出漢字。脫機(jī)手寫漢字識(shí)別需用光電轉(zhuǎn)換裝置,如掃描儀或攝像機(jī)將寫在紙張上的文稿變?yōu)殡娦盘?hào),再輸入到計(jì)算機(jī)進(jìn)行識(shí)別,其基本思想和印刷體漢字識(shí)別一致。由于手寫體人為因素隨意性大,所以,手寫體漢字識(shí)別的難度遠(yuǎn)高于印刷體漢字的識(shí)別[1]。
圖片的存儲(chǔ)在數(shù)據(jù)庫(kù)中有兩種方式:(1)圖片直接存儲(chǔ)在數(shù)據(jù)庫(kù)中;(2)圖片數(shù)據(jù)以文件的形式直接存儲(chǔ)在硬盤上,在數(shù)據(jù)庫(kù)中保存該圖片的記錄附加信息(例如:路徑、文件名……)[2]。這兩種方式各有利弊。圖片文件存入數(shù)據(jù)庫(kù)中便于管理與維護(hù),但不便于編輯,而且隨著圖片的大小或者數(shù)量的增加,數(shù)據(jù)庫(kù)就會(huì)越來(lái)越大,也會(huì)加重?cái)?shù)據(jù)庫(kù)的負(fù)擔(dān);圖片存于硬盤,便于圖片編輯修改,不會(huì)引起數(shù)據(jù)庫(kù)讀取時(shí)I/O消耗,也不會(huì)引起數(shù)據(jù)庫(kù)的過(guò)快增長(zhǎng)而導(dǎo)致過(guò)大,但可能會(huì)因?yàn)椴恍⌒膭h除圖片文件,或者修改圖片附件信息,而使得圖片信息與數(shù)據(jù)庫(kù)不一致,造成管理和維護(hù)的不便。本系統(tǒng)在使用過(guò)程中,圖片會(huì)不斷增加,考慮到圖片的數(shù)量和大小以及便于查看編輯等問(wèn)題,系統(tǒng)采用把手寫留言圖片保存至硬盤固定的目錄下,按照景區(qū)和時(shí)間分組存放。就是在景區(qū)的目錄下采用年文件夾和月文件夾的方式存放(如:D:picture溫室2015 集安市| 且末县| 普兰县| 陆丰市| 克什克腾旗| 沛县| 筠连县| 民丰县| 乳山市| 镇雄县| 赤峰市| 济阳县| 石狮市| 友谊县| 通榆县| 太和县| 许昌县| 江都市| 延庆县| 黄平县| 商水县| 祁阳县| 呼玛县| 六安市| 互助| 云梦县| 行唐县| 宝兴县| 呼玛县| 炉霍县| 尚义县| 茶陵县| 中卫市| 建湖县| 罗田县| 色达县| 青铜峡市| 呼伦贝尔市| 炎陵县| 龙口市| 宿松县|