国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于百度智能云的權(quán)源信息錄入方法

2022-06-06 12:58:18
地理空間信息 2022年5期
關(guān)鍵詞:內(nèi)業(yè)置信度感興趣

姜 毅

(1. 山東省國土測繪院,山東 濟(jì)南 250013)

建立和實(shí)施不動產(chǎn)統(tǒng)一登記制度,是國務(wù)院機(jī)構(gòu)改革和職能轉(zhuǎn)變的一項(xiàng)重點(diǎn)工作任務(wù),也是完善社會主義市場經(jīng)濟(jì)體制、建設(shè)現(xiàn)代市場體系的必然要求[1],受到黨中央、國務(wù)院的高度重視[2]。不動產(chǎn)權(quán)籍調(diào)查是不動產(chǎn)登記的基礎(chǔ),是條例實(shí)施、簿冊統(tǒng)一和信息平臺建設(shè)的重要數(shù)據(jù)支持。做好農(nóng)村不動產(chǎn)權(quán)籍調(diào)查工作,加快不動產(chǎn)統(tǒng)一登記、發(fā)證,對規(guī)范農(nóng)村宅基地管理,深化農(nóng)村改革,促進(jìn)城鄉(xiāng)統(tǒng)籌發(fā)展,實(shí)現(xiàn)農(nóng)村宅基地“三權(quán)分置”和“三變”改革具有重要意義[3]。近年來,全國各地區(qū)農(nóng)村不動產(chǎn)權(quán)籍調(diào)查工作陸續(xù)開展,時間緊任務(wù)重,權(quán)源信息錄入是其中一項(xiàng)重要的內(nèi)業(yè)工作。權(quán)源信息大多來自戶口簿、身份證等掃描件,數(shù)據(jù)格式為圖像,無法直接復(fù)制應(yīng)用,且縣區(qū)掃描件數(shù)量少則十萬級多則百萬級,傳統(tǒng)內(nèi)業(yè)人員手動錄入的工作方式在精度和效率上均難以滿足生產(chǎn)需求?,F(xiàn)如今科學(xué)技術(shù)不斷發(fā)展,人工智能正加速改變各行各業(yè),研究如何引入智能化方法,使得不動產(chǎn)權(quán)籍調(diào)查能精準(zhǔn)、自動、快捷地獲取和處理多源異構(gòu)數(shù)據(jù)具有重要意義。本文從圖像格式權(quán)源信息的智能化錄入著手,基于百度智能云文字識別算法,設(shè)計(jì)了高效、準(zhǔn)確、自動的權(quán)源信息錄入方法,以提高權(quán)源信息的數(shù)字化、高效性、準(zhǔn)確性和自動化,從而節(jié)約內(nèi)業(yè)生產(chǎn)成本,助力測繪生產(chǎn)智能化發(fā)展,推動不動產(chǎn)統(tǒng)一登記的順利進(jìn)行。

1 開發(fā)平臺與相關(guān)軟件

1.1 開發(fā)平臺

Microsoft Visual Studio[4]簡稱VS,是微軟研發(fā)的可視化開發(fā)工具,包括集成開發(fā)環(huán)境(IDE)、代碼管控工具、統(tǒng)一建模語言工具等完備的開發(fā)工具集?;赩S實(shí)現(xiàn)的目標(biāo)代碼適用于所有微軟支持的平臺,主要包 括 Microsoft Windows、.NET Framework、 Windows Mobile等。

C#[5]是微軟公司發(fā)布的面向?qū)ο蟮木幊陶Z言,由C和C++衍生而來。這意味著它可以調(diào)用由C/C++編寫的本機(jī)原生函數(shù)與COM 直接集成,從而綜合VB 的簡單可視化操作和C++高效的運(yùn)行效率。C#常用于獨(dú)立和嵌入式的系統(tǒng)程序編寫任務(wù),適用范圍從特定小型系統(tǒng)到復(fù)雜大型系統(tǒng),是.NET應(yīng)用程序開發(fā)的首選語言。

1.2 百度智能云

百度智能云[6]是百度公司打造的智能云計(jì)算品牌,融合了云計(jì)算、大數(shù)據(jù)、百度大腦等百度核心技術(shù),具有先進(jìn)的技術(shù)和豐富的解決方案,能全面賦能各行各業(yè)、加速產(chǎn)業(yè)的智能化,將半人工智能輸送到千萬行業(yè)中去。百度智能云在深度學(xué)習(xí)、自然語言處理、語音技術(shù)和視覺技術(shù)等核心AI技術(shù)領(lǐng)域具有明顯優(yōu)勢。百度智能云產(chǎn)品包括人工智能、計(jì)算與網(wǎng)絡(luò)、存儲和CDN、網(wǎng)站服務(wù)、智能視頻、智能大數(shù)據(jù)等方面,其中人工智能產(chǎn)品支持人臉識別FACE、文字識別OCR、全功能AI 開發(fā)平臺BML、智能對話定制以及服務(wù)平臺UNIT等豐富功能。

百度智能云文字識別OCR 依托于深度學(xué)習(xí)技術(shù),提供自然場景下的文字檢測、定位、識別等功能,具有準(zhǔn)確率高、服務(wù)穩(wěn)定、支持多語種識別等特點(diǎn);還能針對圖像模糊、傾斜、翻轉(zhuǎn)等情況進(jìn)行專項(xiàng)優(yōu)化,多項(xiàng)ICDAR 指標(biāo)居世界第一,總體識別準(zhǔn)確率高達(dá)99%,服務(wù)可用性可達(dá)99.99%。百度智能云文字識別官網(wǎng)案例如圖1所示。

圖1 百度智能云文字識別OCR示例

權(quán)源信息錄入操作多基于Windows7或Windows10等桌面操作系統(tǒng),因此本文選用Visual Studio 2010(VS2010)作為桌面應(yīng)用程序的開發(fā)平臺,以C#為開發(fā)語言,以.NET Framework 3.5為目標(biāo)框架,以文字識別OCR為文字識別技術(shù)智能輔助工具,設(shè)計(jì)了基于百度智能云文字識別的權(quán)源信息錄入方法。

2 關(guān)鍵技術(shù)與實(shí)現(xiàn)

2.1 百度智能云API調(diào)用

百度智能云提供多種API 調(diào)用方式,用戶可通過云端服務(wù)、私有化部署、安裝離線SDK等3種方式實(shí)現(xiàn):①云端服務(wù),百度智能云提供各類智能算法的云端接口,用戶可通過HTTP-SDK對圖像中的文字信息進(jìn)行識別,云端識別后反饋結(jié)果至客戶端,部署輕量靈活;②私有化部署,百度智能云提供了一體機(jī)和軟件部署包兩種私有化方案,可將API部署至本地的服務(wù)器,在局域網(wǎng)或內(nèi)網(wǎng)中實(shí)現(xiàn)圖像中文字的識別功能;③安裝離線SDK,百度智能云可將SDK集成到桌面或移動設(shè)備中,能在無網(wǎng)、弱網(wǎng)等環(huán)境條件下實(shí)現(xiàn)圖像文字的識別功能。

由于云端服務(wù)中HTTP-SDK 方法部署輕便靈活,電子協(xié)議中注明用戶數(shù)據(jù)用完即銷毀,能有效保證數(shù)據(jù)私密性,因此本文選用HTTP-SDK 作為API 調(diào)用方法。百度智能云文字識別實(shí)現(xiàn)的詳細(xì)流程如圖2所示。

圖2 百度智能云文字識別實(shí)現(xiàn)流程圖

首先在百度智能云中注冊成為開發(fā)者,并創(chuàng)建應(yīng)用(應(yīng)用是調(diào)用API 服務(wù)的基本操作單元),然后在VS2010 中利用NuGet 安裝最新版本的Baidu.AI,并基于應(yīng)用創(chuàng)建自動分配的API Key、Secret Key 實(shí)例化Baidu.Aip.Ocr.Ocr;再加載圖像并配置相關(guān)參數(shù),調(diào)用文字識別接口;最后解析反饋結(jié)果,實(shí)現(xiàn)圖像文字識別功能。通用文字識別請求參數(shù)與返回參數(shù)如表1、2所示。

表1 通用文字識別請求參數(shù)詳情

2.2 交互方法設(shè)計(jì)與實(shí)現(xiàn)

高效的數(shù)據(jù)互操作方法也是內(nèi)業(yè)人員權(quán)源信息高效錄入的保證,既要滿足批量識別順序錄入的需求,又要能靈活識別單個錄入任意指定感興趣區(qū)域。本文設(shè)計(jì)了圖像索引目錄式錄入方法和基于剪切板工具的單條數(shù)據(jù)錄入方法,從而實(shí)現(xiàn)高效的圖像文字識別數(shù)據(jù)互操作。

表2 通用文字識別返回?cái)?shù)據(jù)參數(shù)詳情

2.2.1 批量順序錄入

由于收錄的權(quán)源信息通常分村按戶存檔,因此本文設(shè)計(jì)的基于文件存儲序列的權(quán)源信息批量順序錄入方法,以村資料目錄為總目錄,遞歸遍歷文件夾下所有戶信息,程序自動按照順序生成資料卡,可實(shí)現(xiàn)便捷的權(quán)源信息順序錄入。批量錄入界面如圖3 所示,左側(cè)為圖像大圖窗口,單擊鼠標(biāo)左鍵可實(shí)現(xiàn)圖像旋轉(zhuǎn);中間為資料卡目錄窗口,以“縮略圖+戶名稱+文件名”作為資料卡,單擊可查看大圖,雙擊可實(shí)現(xiàn)圖像文字信息的自動解譯;右側(cè)為解析結(jié)果窗口,輸出圖像文字識別結(jié)果。權(quán)源信息文字識別完成后,內(nèi)業(yè)人員可通過復(fù)制粘貼完成權(quán)源圖像資料的高效錄入。

圖3 批量順序錄入界面

2.2.2 自由感興趣區(qū)域錄入

權(quán)源信息的靈活識別是高效完成數(shù)據(jù)錄入任務(wù)的關(guān)鍵。本文設(shè)計(jì)并實(shí)現(xiàn)了“Control C+Control V”式的簡易自由圖像文字識別錄入方法,極大地提高了錄入的自動化程度和效率。內(nèi)業(yè)人員指定任意感興趣區(qū)域,程序?qū)⒆詣油瓿蓤D像文字識別,并將識別信息自動加載到剪切板,內(nèi)業(yè)直接通過粘貼快捷鍵完成數(shù)據(jù)的錄入工作。自由感興趣區(qū)域圖像文字識別算法流程如圖4所示。

圖4 自由感興趣區(qū)域圖像文字識別算法流程圖

首先通過微信、QQ 等截圖工具截取需解析的感興趣區(qū)域,系統(tǒng)將復(fù)寫WndProc方法(執(zhí)行截圖等操作會觸發(fā)該函數(shù)),若判斷發(fā)出操作的信息類型為剪切板操作且確認(rèn)剪切板包含圖像,則認(rèn)定當(dāng)前剪切板內(nèi)圖像為待解析圖像;然后將感興趣區(qū)域圖像保存到本地加載中的批量信息錄入窗口,同時作為百度智能云文字識別的輸入圖像,新開線程,解析當(dāng)前輸入圖像文字;最后將解析文本結(jié)果存儲到剪切板內(nèi),內(nèi)業(yè)人員通過粘貼操作即可實(shí)現(xiàn)信息錄入。感興趣區(qū)域圖像識別界面如圖5所示。

圖5 自由感興趣區(qū)域圖像識別界面

本文通過深入了解內(nèi)業(yè)人員需求,將內(nèi)業(yè)圖像格式權(quán)源信息錄入過程簡化為“Control C+Control V”式的圖像文字識別錄入方法,極大地簡化了權(quán)源信息數(shù)字化操作流程,提高了自動化程度。

3 實(shí)例分析

3.1 批量順序錄入識別效率與行置信度分析

本文選取高拍儀采集的身份證與戶口簿掃描件作為測試數(shù)據(jù)源,圖像格式為jpg,分辨率為2 952×1 944、150 dpi,大小約為220 KB。本文調(diào)用AccurateBasic方法,隨機(jī)選取10個身份證正面與戶口簿信息,測試其運(yùn)行時間;采用返回?cái)?shù)據(jù)參數(shù)中的average、vari?ance、min 分別統(tǒng)計(jì)識別結(jié)果中行置信度的平均值、方差、最小值。測試結(jié)果如表3 所示,可以看出,高拍儀身份證掃描件的平均識別時間為1.39 s,行置信度最低為0.92,平均值最高為1.00,行置信度平均可達(dá)0.98,平均方差為0.000 32;高拍儀戶口簿隨機(jī)頁掃描件的平均識別時間2.71 s,行置信度最低為0.87,平均值最高為0.98,行置信度平均可達(dá)0.97,平均方差為0.004 19。高拍儀身份證、戶口簿等權(quán)源信息解譯受圖像大小、清晰度和未知感興趣區(qū)域的影響,識別效率受影響程度為秒級;身份證復(fù)雜程度、數(shù)據(jù)量和模糊度均低于戶口簿,因此擁有更高的識別效率和行置信度??傮w看來,本文基于百度智能云的權(quán)源信息錄入方法擁有較高的效率與行置信度。

表3 識別效率與行置信度統(tǒng)計(jì)表

3.2 自由感興趣區(qū)域錄入識別效率與行置信度分析

證件號碼的高效高質(zhì)錄入是權(quán)源信息高效采集的重要保障,本文采用微信截圖工具截取高拍儀身份證掃描件證件號碼的方式驗(yàn)證自由感興趣區(qū)域錄入方法的精度與效率。測試結(jié)果如表4所示,可以看出,自由感興趣區(qū)域權(quán)源信息錄入的平均時間為0.39 s,行置信度最小值為0.95,平均值最高為1.00,行置信度平均可達(dá)1.00,平均方差為0.000 02,經(jīng)人工判定均識別正確??傮w來看,本文自由感興趣區(qū)域權(quán)源信息錄入方法可實(shí)現(xiàn)實(shí)時準(zhǔn)確的權(quán)源信息感興趣區(qū)域自由采錄。

表4 錄入效率與行置信度統(tǒng)計(jì)表

4 結(jié) 語

本文是將互聯(lián)網(wǎng)人工智能與測繪生產(chǎn)相結(jié)合,推動測繪生產(chǎn)智能化發(fā)展的一次成功嘗試。權(quán)源信息的高效高質(zhì)錄入是完成農(nóng)村不動產(chǎn)權(quán)籍調(diào)查工作的關(guān)鍵,本文基于百度智能云文字識別API,利用VS2010平臺,設(shè)計(jì)并實(shí)現(xiàn)了批量順序錄入和自由感興趣區(qū)域錄入兩種權(quán)源信息錄入方法。實(shí)驗(yàn)結(jié)果表明,本文方法操作簡便,具有較高的效率和置信度,能顯著提高權(quán)源信息數(shù)字化工作的效率、準(zhǔn)確性和自動化水平,節(jié)約內(nèi)業(yè)生產(chǎn)成本,提高生產(chǎn)效率。下一步的研究重點(diǎn)在于特定權(quán)源對象的結(jié)構(gòu)化識別與自動存儲,進(jìn)一步提高權(quán)源信息錄入的智能化水平。傳統(tǒng)測繪生產(chǎn)行業(yè)應(yīng)在牢牢掌控時空位置服務(wù)在基礎(chǔ)設(shè)施、數(shù)據(jù)資源和法律標(biāo)準(zhǔn)等方面的優(yōu)勢的基礎(chǔ)上,樹立創(chuàng)意性思維,積極主動地與互聯(lián)網(wǎng)等人工智能技術(shù)進(jìn)行跨界融合,實(shí)現(xiàn)測繪向智能、綠色、泛在發(fā)展的整體轉(zhuǎn)型[7-8],激流勇進(jìn)逐步實(shí)現(xiàn)智能化測繪。

猜你喜歡
內(nèi)業(yè)置信度感興趣
公路施工項(xiàng)目內(nèi)業(yè)資料管理探討
硼鋁復(fù)合材料硼含量置信度臨界安全分析研究
應(yīng)用地表覆蓋數(shù)據(jù)估算LiDAR內(nèi)業(yè)工作量的方法研究
更 正
含能材料(2021年1期)2021-01-10 08:34:34
高速公路機(jī)電系統(tǒng)內(nèi)業(yè)資料管理思考
正負(fù)關(guān)聯(lián)規(guī)則兩級置信度閾值設(shè)置方法
建筑工程內(nèi)業(yè)資料管理探討
江西建材(2018年4期)2018-04-10 12:37:50
這樣的智能廚房臺面,你會感興趣嗎?
置信度條件下軸承壽命的可靠度分析
軸承(2015年2期)2015-07-25 03:51:04
夢斷交易會
興趣英語(2013年9期)2013-11-28 05:49:22
武鸣县| 黔东| 许昌市| 巴马| 贵定县| 兴隆县| 沙坪坝区| 古丈县| 镇宁| 吉安县| 新竹县| 鱼台县| 清涧县| 镶黄旗| 五莲县| 新余市| 梓潼县| 楚雄市| 青神县| 来凤县| 顺昌县| 沧州市| 西贡区| 栾城县| 琼结县| 休宁县| 台南县| 临湘市| 滦平县| 溆浦县| 阿合奇县| 永善县| 贵溪市| 永寿县| 冷水江市| 汽车| 方城县| 甘德县| 马龙县| 湟中县| 弥勒县|