国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

云計算環(huán)境下醫(yī)院檔案信息管理系統(tǒng)研究

2017-05-13 11:16:23趙海靜王永峰張新平
電子設(shè)計工程 2017年9期
關(guān)鍵詞:字符信息管理系統(tǒng)輪廓

趙海靜,王永峰,張 娟,張新平

(河北省人民醫(yī)院 河北 石家莊 050000)

云計算環(huán)境下醫(yī)院檔案信息管理系統(tǒng)研究

趙海靜,王永峰,張 娟,張新平

(河北省人民醫(yī)院 河北 石家莊 050000)

針對醫(yī)院檔案信息數(shù)據(jù)提取復(fù)雜度高的問題,本研究將醫(yī)院的檔案信息分為文字信息和數(shù)字信息,提出了一套基于云計算環(huán)境下的檔案信息管理系統(tǒng),利用線性歸一化和非線性歸一化對文字信息進(jìn)行去噪預(yù)處理,結(jié)合外邊框和質(zhì)心歸一化進(jìn)行文字信息的數(shù)據(jù)提?。会槍ψ址畔⒗命c(diǎn)陣圖和字符輪廓平滑處理,將字符的輪廓獲取和存儲進(jìn)行特征值提取。通過設(shè)計醫(yī)院檔案信息的容器編碼,并結(jié)合分布式關(guān)聯(lián)數(shù)據(jù)庫以供信息的匯總和共享,方便了系統(tǒng)管理員對檔案信息的綜合調(diào)度使用。在對醫(yī)院檔案信息數(shù)據(jù)提取實(shí)驗(yàn)測試,結(jié)果顯示:初步識別提取率與綜合數(shù)據(jù)提取率均分別保持在90%和80%以上,并且云計算數(shù)據(jù)提取效率明顯高于電子標(biāo)簽(RFID)數(shù)據(jù)提取。

云計算;文字提??;字符提??;檔案信息;編碼設(shè)計

隨著計算機(jī)網(wǎng)絡(luò)的迅速發(fā)展,我國的各類檔案信息管理不斷推入云計算系統(tǒng)[1-3]。在系統(tǒng)的運(yùn)行和管理過程中,檔案信息依靠計算機(jī)數(shù)據(jù)挖掘技術(shù)[4],不僅提升了整體的檔案信息管理水平,還促進(jìn)了檔案管理人員的工作效率。檔案信息的數(shù)字化為信息系統(tǒng)管理的自動化和智能化帶來了便利,目前的檔案信息管理系統(tǒng)主要依靠電子標(biāo)簽(RFID)[5]、二維碼[6]和Web Service[7]等技術(shù)。相比已有研究,文中從數(shù)據(jù)挖掘技術(shù)的云計算理念出發(fā),對檔案中的文字信息利用外邊框和質(zhì)心歸一化處理,對字符信息利用點(diǎn)陣圖和字符輪廓平滑處理,將檔案中的信息進(jìn)行有效提取。結(jié)合醫(yī)院的檔案信息管理系統(tǒng)的特點(diǎn),分別設(shè)計了檔案錄入、刪減、編輯權(quán)限,給出了檔案信息編碼準(zhǔn)則,并在分布式數(shù)據(jù)庫結(jié)構(gòu)下建立起醫(yī)院檔案信息管理數(shù)據(jù)庫。該云計算下的檔案信息管理系統(tǒng)提高了醫(yī)院信息檔案管理效率。

1 檔案的云計算數(shù)據(jù)提取

1.1 文字信息提取

通過將檔案中待對序列的文字進(jìn)行輸入之后,最先進(jìn)行的重要環(huán)節(jié)是對檔案信息輸入進(jìn)行預(yù)處理。在預(yù)處理的環(huán)節(jié)中主要任務(wù)是去除獲取信息中的白噪聲,這樣的預(yù)處理步驟主要用于提取關(guān)鍵信息[8]。對信息的關(guān)聯(lián)程度進(jìn)行篩選和加強(qiáng),主要的預(yù)處理的方法是利用線性歸一化和非線性歸一化的方法,通過這樣的變量工具使得處理后的信息和圖像相對的便于識別和穩(wěn)定,增強(qiáng)系統(tǒng)的管理識別能力[9]。對于醫(yī)院檔案中的圖像信息,通過字符圖像的方式進(jìn)行線性規(guī)劃的處理。歸一化相對于不同的問題其含義有所不同,在進(jìn)行醫(yī)院檔案信息處理的過程中,通過將漢字的信息字符構(gòu)成的點(diǎn)陣圖移動到既定的方位和區(qū)域,以此來消除漢字字符在點(diǎn)陣圖上的位置偏差,這樣的過程即完成了整個位置歸一化的處理。一般來說位置歸一化的方法最常用的分為兩種[10]:以文字外邊框?yàn)閰⒖嘉镞M(jìn)行位置的歸一處理;以質(zhì)心為參考物進(jìn)行位置的歸一處理。以文字外邊框?yàn)閰⒖嘉镞M(jìn)行位置的歸一處理方法首先需要計算出文字的外邊框,然后將基于外邊框的文字中心找到,最后的步驟是將基于外邊框的文字中心移動到既定的位置和區(qū)域上;以質(zhì)心為參考物進(jìn)行位置的歸一處理方法首先需要計算出漢字的質(zhì)心,再然后將漢字的質(zhì)心移動到既定的位置和區(qū)域上[11]。在本文中主要采用基于外邊框的文字位置歸一化和線性大小歸一化相結(jié)合的方法進(jìn)行處理,利用這樣的方法進(jìn)行信息的提取和管理之前,需要對等待識別的文字字符和圖像字符進(jìn)行歸一化的處理,首先將其轉(zhuǎn)化為規(guī)格標(biāo)準(zhǔn)的大小,然后才能進(jìn)行系統(tǒng)特征值的提取。其次,對等待識別的文字的位置進(jìn)行歸一化的處理,將等待識別文字的邊框提取出來,再將四周邊框中間的點(diǎn)陣圖獲取儲存。最后的環(huán)節(jié)是對獲取儲存的四周邊框中間的點(diǎn)陣圖進(jìn)行線性大小的歸一化處理,從而得到標(biāo)準(zhǔn)點(diǎn)陣圖。具體表達(dá)式如下:

其中,s是在上一個環(huán)節(jié)獲取的文字邊框內(nèi)的點(diǎn)陣,s*是進(jìn)行線性大小歸一化處理后的點(diǎn)陣,h和w分別是s的高和寬,h*和w*分別是s*的高和寬。

1.2 字符信息提取

在進(jìn)行了文字信息的預(yù)處理后還需要對字符的輪廓進(jìn)行提取,若白點(diǎn)的四周在四個方位鄰接著一個黑點(diǎn),那么這個黑點(diǎn)就是輪廓上的點(diǎn)[12]。通過在字符輪廓上的黑點(diǎn)提取系統(tǒng)的特征向量,實(shí)際上也可以通過從字符的構(gòu)架上提取系統(tǒng)的特征向量,但通常情況下字符中存在一定的污點(diǎn)[13]。因此,采取后者的方法往往會丟失字符污點(diǎn)處的關(guān)鍵信息。有些情況下存在字符損壞嚴(yán)重的情況,這樣的情況下仍然可以對存在的筆畫和輪廓中提取系統(tǒng)的特征[14]。對字符的輪廓獲取和存儲之后則可以進(jìn)行特征值提取[15],通常此時的字符輪廓容易產(chǎn)生毛刺,多是因?yàn)槌上褓|(zhì)量欠佳存在干擾因素等原因,因此在本文中將采用模板法對處理中的特征值提取環(huán)節(jié)之間進(jìn)行平滑處理以消除類似的影響,將輪廓邊緣進(jìn)行平滑性處理。黑點(diǎn)輪廓中需要平滑的點(diǎn)與之相對應(yīng)的經(jīng)過模板法平滑處理后的點(diǎn)的排列情況,如圖1所示。

圖1 消除輪廓中直角邊平滑處理的前后對比

圖1中,黑色的點(diǎn)代表黑的像素,空白的區(qū)域代表白的像素,九方格能夠表示兩種像素,即可以代表黑像素也可以代表白像素。對于字符輪廓中存在的每一個黑點(diǎn)。首先都要將其四周的8個相鄰像素進(jìn)行考察。當(dāng)圖像中的黑點(diǎn)同四周的相鄰像素的排列組合與圖中的任意一個相吻合那么需要將這個黑的像素變?yōu)榘椎南袼亍.?dāng)字符輪廓四周的相鄰像素排列組合與某一個黑像素的排列相同,則抹去此黑像素,利用圖1的排列情況經(jīng)過平滑處理來代替之前的黑像素,字符輪廓中的直角能夠被全部抹除,用于消除字符輪廓中微小的突起。

2 系統(tǒng)設(shè)計

2.1 檔案管理

在醫(yī)院的檔案信息管理系統(tǒng)中,操作管理人員擁有與檔案管理有關(guān)的各種操作權(quán)限,例如檔案錄入、檔案刪減、檔案編輯等權(quán)限,從而提高了醫(yī)院信息檔案管理效率。

1)檔案錄入:醫(yī)院的檔案信息操作管理人員通過信息管理系統(tǒng)平臺對醫(yī)院病人信息等資料進(jìn)行檔案信息數(shù)據(jù)庫的篩選和查找,并對每一份檔案進(jìn)行獨(dú)立編號以確保沒有重復(fù)檔號。接著按照醫(yī)院信息管理系統(tǒng)的編程算法和醫(yī)院的相關(guān)檔案調(diào)檔條例進(jìn)行相應(yīng)的檢測,如若不存在錯誤,則由醫(yī)院的檔案信息操作管理人員將新的檔案信息錄入到檔案信息數(shù)據(jù)庫當(dāng)中并與用戶進(jìn)行關(guān)聯(lián)。

2)檔案刪減:醫(yī)院的檔案信息操作管理人員通過信息管理系統(tǒng)平臺登陸檔案數(shù)據(jù)庫,并對需要刪減的檔案進(jìn)行篩選,如若存在需要刪減的檔案則由檔案信息操作管理人員從數(shù)據(jù)庫中將其刪除。

3)檔案編輯:醫(yī)院的檔案信息操作管理人員通過信息管理系統(tǒng)平臺登陸檔案數(shù)據(jù)庫,并對需要編輯的檔案進(jìn)行篩選,如若存在需要重新編輯和修改的檔案則由檔案信息操作管理人員在數(shù)據(jù)庫進(jìn)行編輯和修改以完成數(shù)據(jù)庫的更新,避免錯誤檔案信息的發(fā)生。檔案管理的具體操作流程如圖2所示。

圖2 檔案添加數(shù)據(jù)流圖

2.2 編碼設(shè)計

為了保證醫(yī)院檔案信息管理系統(tǒng)的良好運(yùn)轉(zhuǎn),一個必要條件就是容器編碼[16]。文中設(shè)計了醫(yī)院檔案信息管理系統(tǒng)的一些常用和主要的編碼,其具體的編碼的準(zhǔn)則定義如下:

以醫(yī)院人力資源部門的的統(tǒng)一編碼為用戶和操作人員進(jìn)行編碼為例,以4位編碼為各個部門進(jìn)行編碼。第1~2位代表單位編號,第3~4位表示職員的班組編號,用大小寫的字母表示。例如:21Aa表示Aa組,21Ab表示Ab組。利用3位編碼來為功能進(jìn)行編碼:第1~2位代表功能模塊編號,第3位表示在此功能模塊下的進(jìn)行操作的編號,利用大寫英文字母表示,A表示檔案錄入權(quán)限,B表示檔案編輯權(quán)限,C表示檔案刪減權(quán)限,D表示檔案查詢權(quán)限。例如:03B表示具有3號功能模塊的檔案刪減權(quán)限,圖紙編碼可直接從系統(tǒng)中截取,也可使用現(xiàn)有的產(chǎn)品編碼規(guī)則。用戶的編碼規(guī)則使用8位數(shù)字型編碼,系統(tǒng)的編碼規(guī)則使用8位數(shù)字型編碼。模塊的編碼規(guī)則使用4位數(shù)字型編碼。角色的編碼規(guī)則使用4位字母型編碼。

2.3 數(shù)據(jù)庫設(shè)計

在計算機(jī)的存儲設(shè)備上通過按照一定的規(guī)則存放在關(guān)聯(lián)的數(shù)據(jù)所構(gòu)成的集合構(gòu)成了帶有鮮明特征的數(shù)據(jù)庫。通過這樣的規(guī)則所構(gòu)成的數(shù)據(jù)庫主要有收集信息、數(shù)據(jù)信息組織、信號存儲、數(shù)據(jù)加工、篩選和傳播信息的主要功能。由于負(fù)責(zé)上述的數(shù)據(jù)庫特有功能,數(shù)據(jù)庫設(shè)計的完善程度將會對信息管理系統(tǒng)產(chǎn)生多方面性能的影響。為了更加方便的實(shí)現(xiàn)對檔案數(shù)據(jù)信息的匯總和傳播共享,因而在分布式的數(shù)據(jù)庫環(huán)境下建立起醫(yī)院檔案信息管理數(shù)據(jù)庫將更加便捷。在醫(yī)院檔案信息管理系統(tǒng)的操作流程中,紙質(zhì)檔案的設(shè)置具體如表1所示。

表1 紙質(zhì)信息數(shù)據(jù)設(shè)置

3 系統(tǒng)測試

針對醫(yī)院檔案信息的數(shù)據(jù)提取測試如下:檔案的分類包括病人的病例信息、醫(yī)院工作人員信息和醫(yī)院物資信息等不同種類,首先通過文字信息和字符信息提取對測試則的不同樣本進(jìn)行初步識別提取,樣本為各類型待識別紙質(zhì)檔案。初步識別提取的效果如表2所示。

由表2可得,在1 070張醫(yī)院檔案紙質(zhì)信息中,成功識別了1 003張,未識別63張。其中,各樣本的初步識別提取率均在90%以上,總樣本提取率為93.69%。在紙質(zhì)檔案信息初步識別提取后,繼續(xù)對提取的樣本進(jìn)行數(shù)據(jù)提取。結(jié)果如表3所示。

由表3可得,在已成功識別的1003張醫(yī)院檔案紙質(zhì)信息中,各樣本的再次數(shù)據(jù)提取率和綜合提取率分別均在90%和83%以上,總樣本提取率和總樣本綜合提取率分別為94.12%和88.17%。通過檔案系統(tǒng)的流程設(shè)計,從檔案管理員的信息錄入到系統(tǒng)管理員的綜合運(yùn)維,對100張醫(yī)院紙質(zhì)檔案信息進(jìn)行數(shù)據(jù)提取,分別利用本研究提出的云計算數(shù)據(jù)提取與電子標(biāo)簽(RFID)數(shù)據(jù)提取性能重復(fù)進(jìn)行10次測試,如圖3所示。

表2 初步提取效果

表3 綜合提取效果

圖3 數(shù)據(jù)提取量性能比較

由圖3可見,對100張醫(yī)院紙質(zhì)檔案信息提取過程中,本研究使用的云計算數(shù)據(jù)提取量明顯高于電子標(biāo)簽(RFID)數(shù)據(jù)提取。對于較少頁數(shù)的紙質(zhì)檔案信息,使用電子標(biāo)簽(RFID)數(shù)據(jù)提取效果高于云計算數(shù)據(jù)提??;而對于類似醫(yī)院檔案信息量巨大的操作業(yè)務(wù)壓力,使用云計算數(shù)據(jù)提取可以有效的提高檔案信息的錄入效率,為醫(yī)院檔案信息管理系統(tǒng)的綜合信息匯總和共享提供了便利。

通過對本研究設(shè)計的醫(yī)院檔案信息管理系統(tǒng)的數(shù)據(jù)提取性能測試表明,各類型檔案信息數(shù)據(jù)提取率較高,對于拒絕識別的紙質(zhì)檔案出現(xiàn)報錯信息,這是由于數(shù)據(jù)量巨大超過了終端計算機(jī)運(yùn)行的速度出現(xiàn)的響應(yīng)不及時。而醫(yī)院的紙質(zhì)檔案信息的識別與分組儲存對于文字信息和字符信息具有較高的數(shù)據(jù)識別提取功能,經(jīng)過初步提取和綜合提取的處理后,最高的提取率可達(dá)到90%以上,這對于醫(yī)院檔案信息包含眾多復(fù)雜數(shù)據(jù)提取具有較好的處理效果。數(shù)據(jù)信息提取測試也說明了,當(dāng)醫(yī)院原有的紙質(zhì)檔案信息出現(xiàn)文字和字符不清晰時,數(shù)據(jù)的識別提取仍然不能很好的進(jìn)行。因此,在醫(yī)院檔案信息錄入與綜合管理過程中,本研究可以提升醫(yī)院信息檔案管理效率,但還需要檔案管理人員的輸入和審核確認(rèn)來確保檔案信息管理系統(tǒng)的準(zhǔn)確性。

4 結(jié) 論

本研究針對傳統(tǒng)醫(yī)院紙質(zhì)檔案數(shù)據(jù)錄入信息管理系統(tǒng)的問題,開發(fā)了一套云計算環(huán)境下的數(shù)據(jù)信息提取錄入設(shè)計。首先,將檔案信息分為文字信息和數(shù)字信息分別進(jìn)行數(shù)據(jù)提取錄入。在對文字信息去噪預(yù)處理后,考慮文字信息外邊框和質(zhì)心之間的關(guān)系,利用點(diǎn)陣圖線性歸一化原理對文字信息的數(shù)據(jù)進(jìn)行提取。在對字符信息提取過程中,從字符的構(gòu)架上提取系統(tǒng)的特征向量并采用模板法對數(shù)據(jù)特征值進(jìn)行平滑處理。其次,根據(jù)醫(yī)院檔案信息管理系統(tǒng)流程操作和紙質(zhì)檔案信息數(shù)據(jù)類型,設(shè)計了一套針對醫(yī)院檔案數(shù)據(jù)信息錄入容器編碼。最后,通過模擬不同類型的醫(yī)院檔案信息錄入性能測試結(jié)果表明,對于醫(yī)院紙質(zhì)檔案數(shù)據(jù)提取率高,數(shù)據(jù)提取量大,為醫(yī)院的數(shù)字化檔案信息管理提供了有價值的參考。

[1]崔海莉,張惠達(dá).云計算環(huán)境下檔案信息管理系統(tǒng)風(fēng)險分析[J].檔案學(xué)研究,2013(1):56-60.

[2]鞠國山,王俊,范吉峰.基于RFID技術(shù)的檔案信息管理自動化系統(tǒng)[J].中國數(shù)字電視,2012(2):89-91.

[3]曹吉超,孫帥.智能檔案館與數(shù)字檔案館辨析[J].辦公自動化,2013(12):17-19.

[4]於立勇.計算機(jī)數(shù)據(jù)挖掘技術(shù)應(yīng)用在檔案信息管理系統(tǒng)中的探討[J].電腦知識與技術(shù),2012,8(1): 260-261.

[5]范浩明.電子標(biāo)簽(RFID)技術(shù)在檔案管理自動化系統(tǒng)中的應(yīng)用[J].電視工程,2012(1):29-30.

[6]李朝洋,袁海瓊.基于二維碼技術(shù)的檔案信息管理系統(tǒng)研究與設(shè)計[J].蘭臺世界,2013(9):23-24.

[7]李仕瓊.數(shù)據(jù)挖掘技術(shù)在檔案信息管理系統(tǒng)中的應(yīng)用分析[J].科技展望,2015(1):53-57.

[8]易劍,彭宇新,肖建國.基于顏色聚類和多幀融合的視頻文字識別方法[J].軟件學(xué)報,2011,22(12): 2919-2933.

[9]劉英杰,楊風(fēng)暴,吉琳娜,等.一種古建墻壁受污題記文字圖像邊緣提取方法[J].圖學(xué)學(xué)報,2015(5):783-788.

[10]賈建忠,孫萍.脫機(jī)維吾爾文組合特征提取及模糊聚類識別[J].新疆大學(xué)學(xué)報(自然科學(xué)版),2013(3):347-353.

[11]徐凌,王江晴,李波.基于骨架平滑與均勻膨脹的女書輪廓字形生成方法[J].科學(xué)技術(shù)與工程,2014,14(34):229-234.

[12]王忠飛,陳元正.基于輪廓特征的車牌英文和數(shù)字識別方法[J].浙江工業(yè)大學(xué)學(xué)報,2015,43(5): 522-526.

[13]何兆成,佘錫偉,余文進(jìn),等.字符多特征提取方法及其在車牌識別中的應(yīng)用[J].計算機(jī)工程與應(yīng)用,2011,47(23):228-231.

[14]高保平,白瑞林,溫振市.基于輪廓層次和小波分析的工業(yè)字符識別 [J].計算機(jī)工程與設(shè)計,2012,33(6):2423-2427

[15]殷羽,鄭宏,王靜,等.一種自適應(yīng)煙標(biāo)字符提取方法[J].計算機(jī)應(yīng)用研究,2015,32(4):1248-1252.

[16]申利峰,戴萌,宋亞峰,等.基于信息自動識別技術(shù)的核燃料倉儲管理標(biāo)準(zhǔn)化[J].核標(biāo)準(zhǔn)計量與質(zhì)量,2014(1):26-32.

Research on management system of file information of hospital with cloud computing environment

ZHAO Hai-jing,WANG Yong-feng,ZHANG Juan,ZHANG Xin-ping
(Veteran Cadres of Hebei Provincial People's Hospital,Shijiazhuang 050000,China)

For the problem of hospital records information data extraction of high complexity,the study will be divided into text files hospital information and digital information,a set of file-based information management system for cloud computing environment,the use of linear and non-linear normalization normalization of text messages denoising pretreatment,combined with external borders and the centroid of the normalized data for text information extraction;smoothing process for the use of bitmap character information and character outline,the outline of the character is captured and stored eigenvalue extract. Hospital records through the container code design information,combined with the distributed relational database for aggregation and sharing of information,facilitate system administrators to archive information integrated scheduling use.In the archives of the hospital information data extraction experimental test results show that:the extraction rate of the initial recognition and integrated data extraction rates were maintained at above 90%and 80%,and cloud computing data extraction efficiencysignificantly higher than the electronic tags(RFID)data extraction.

cloud computing;text extraction;extracting character;file information;coding design

TN914.3

A

1674-6236(2017)09-0014-04

2016-08-07稿件編號:201608052

國家自然科學(xué)基金項(xiàng)目資助(81071710)

趙海靜(1983—),女,河北石家莊人,碩士,檔案管理員。研究方向:檔案管理。

猜你喜歡
字符信息管理系統(tǒng)輪廓
輪廓錯覺
三維可視化信息管理系統(tǒng)在選煤生產(chǎn)中的應(yīng)用
尋找更強(qiáng)的字符映射管理器
信息管理系統(tǒng)在工程項(xiàng)目管理的應(yīng)用
基于實(shí)時輪廓誤差估算的數(shù)控系統(tǒng)輪廓控制
字符代表幾
一種USB接口字符液晶控制器設(shè)計
電子制作(2019年19期)2019-11-23 08:41:50
基于三維TGIS的高速公路綜合信息管理系統(tǒng)
消失的殖民村莊和神秘字符
在線學(xué)習(xí)機(jī)制下的Snake輪廓跟蹤
棋牌| 米泉市| 丰县| 永济市| 建昌县| 阿拉善盟| 栾城县| 沙雅县| 宜黄县| 宜州市| 积石山| 漳州市| 陇川县| 平陆县| 无极县| 汉沽区| 尚志市| 富裕县| 东平县| 汕尾市| 洪雅县| 商洛市| 高尔夫| 高台县| 平顺县| 巴里| 石棉县| 三穗县| 吴江市| 保定市| 平度市| 普定县| 天津市| 铜鼓县| 延长县| 山西省| 鄂尔多斯市| 安吉县| 左权县| 萨嘎县| 伊川县|