■錢 爃
人工智能(Artificial Intelligence 簡稱AI)是研究模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用的一門新的科學(xué)技術(shù)。該技術(shù)的研究范圍包括智能機(jī)器人、語言識別、圖像識別、自然語言處理等。隨著人工智能的理論和技術(shù)日趨完善,其應(yīng)用領(lǐng)域也持續(xù)擴(kuò)展。在檔案管理領(lǐng)域,檔案智能機(jī)器人研制已有成功案例,語言識別和自然語言處理也在歷史檔案資源數(shù)據(jù)化方向開展了應(yīng)用研究,但與檔案管理密切相關(guān)的圖像識別亟待進(jìn)一步開發(fā)其高價值的應(yīng)用場景。
圖像識別是在人眼感官的基礎(chǔ)上建立的一套自動識別系統(tǒng),主要有圖像采集設(shè)備(攝像頭、掃描儀)、數(shù)據(jù)傳輸網(wǎng)絡(luò)、圖像處理終端(切分、重構(gòu)、成像)組成。圖像識別過程首先由采集設(shè)備捕獲圖像,由傳輸網(wǎng)絡(luò)輸送至處理終端,終端的邏輯算法通過切分、重構(gòu)以及成像的過程將原始圖像轉(zhuǎn)換為系統(tǒng)可識別的圖像,根據(jù)不同的識別需求獲得圖像的關(guān)鍵信息和可供系統(tǒng)識別的特征點,最后輸出識別結(jié)果。圖像識別是一個固化的,依據(jù)預(yù)設(shè)的邏輯算法進(jìn)行機(jī)械式計算輸出的過程;通過這一技術(shù)能夠減輕部分以往依靠大腦和人眼處理的圖像識別工作。圖像識別需要人工不斷的調(diào)整識別過程和邏輯算法,以便提升識別的效率和準(zhǔn)確率。
人工智能是在圖像識別的基礎(chǔ)上進(jìn)行的升級和優(yōu)化,基于圖像識別技術(shù),額外配備智能化處理軟件和設(shè)備,達(dá)到在無人干預(yù)的狀態(tài)下,系統(tǒng)自動收集處理信息、分析數(shù)據(jù)、深度學(xué)習(xí)以及系統(tǒng)互聯(lián)的目標(biāo)。與傳統(tǒng)圖像識別技術(shù)對比,人工智能圖像識別首先在圖像采集端預(yù)置智能分析算法,在捕獲圖像的同時對圖像進(jìn)行預(yù)處理,提取有助于后續(xù)識別的關(guān)鍵信息完成一次解析,由數(shù)據(jù)傳輸網(wǎng)絡(luò)實時傳遞給圖像處理終端進(jìn)一步生成結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行二次解析,輸出識別結(jié)果。同時結(jié)合識別需求與實際識別結(jié)果的各種差異特征,自主學(xué)習(xí)分析識別過程和邏輯算法的缺陷,進(jìn)行自主優(yōu)化,逐步提升識別效率和準(zhǔn)確率。
在文件歸檔時通常檔案人員會對電子文件進(jìn)行合規(guī)性檢查,主要包括屬性檢查、文件檢查以及屬性與文件內(nèi)容一致性檢查。檢查項主要有文件名稱、編號、分類、狀態(tài)、格式、內(nèi)容是否完整、是否清晰等。傳統(tǒng)檢查方式主要依靠人工,存在檢查效率低、錯誤率高等問題。為了降低上述問題引起的檔案管理質(zhì)量風(fēng)險,引入人工智能圖像識別技術(shù)進(jìn)行電子文檔的合規(guī)性檢查。首先需要設(shè)定識別技術(shù)指標(biāo)和要求,例如識別完整性和效率指數(shù)、識別處理能力指標(biāo)、自動記錄并形成識別報告等。其次需要確定被檢查的文件類型(如設(shè)計文件、管理文件、圖樣目錄、設(shè)計變更單等);對每一種文件類型劃分檢查位置(如目錄區(qū)域、圖簽區(qū)域、內(nèi)容區(qū)域、會簽欄、首頁、續(xù)頁、封面、扉頁、修改記錄頁、目錄頁、正文頁等);對每一種文件類型的每一個檢查位置確定檢查項(如編碼、版本、狀態(tài)、標(biāo)題、簽字、日期等);同時對每一個檢查項確定檢查內(nèi)容、基礎(chǔ)數(shù)據(jù)來源、檢查方法、常見錯誤案例、檢查方式、檢查時間點等,再結(jié)合以上文件類型、檢查位置、檢查項三個維度建立合規(guī)性檢查矩陣。最后通過人工智能圖像識別技術(shù)與檢查矩陣的結(jié)合,將文件中需要文檔規(guī)范性檢查的項進(jìn)行智能識別,針對需要比對的內(nèi)容提取對比基準(zhǔn)值,識別結(jié)果與對比基準(zhǔn)值分別從系統(tǒng)邏輯、單頁邏輯、全文邏輯三個維度進(jìn)行分析比對,輸出待確認(rèn)的問題項。在一次檢查完成后,由人工確認(rèn)檢查結(jié)果,系統(tǒng)依據(jù)確認(rèn)結(jié)果調(diào)整識別過程、檢查邏輯以及算法,完成深度自主學(xué)習(xí),逐步提升檢查效率和正確率。
在傳統(tǒng)的影像檔案管理中,通常通過檔案屬性查找需要的影像,如果影像歸檔時屬性不全或者描述不準(zhǔn)確,就會大大降低影像檔案查詢的準(zhǔn)確率。尤其對于重要人物的圖像查找,隨著時間的推移,人的外貌不可避免會發(fā)生變化,即便通過屬性查詢到相關(guān)影像,也很難立即判斷出多張影像中相似的人是不是同一個人。引入人工智能圖像識別技術(shù)可快速判斷出多張圖像中是否存在同一個人,現(xiàn)有的識別技術(shù)可支持年齡跨度在25 至30 年之間的容貌變化,可以有效避免人物相貌變化而出現(xiàn)的查詢錯誤。人物影像的智能識別主要分為圖像的采集與預(yù)處理、面部特征提取、識別和鑒別三個過程。采集與預(yù)處理需要一張人物的基準(zhǔn)圖像作為輸入,由圖像采集設(shè)備對圖像進(jìn)行捕獲之后使用面部檢測算法進(jìn)行預(yù)處理,輸出面部五官的關(guān)鍵點坐標(biāo),坐標(biāo)由二維平面坐標(biāo)組成,即X 坐標(biāo)和Y 坐標(biāo)。面部特征提取是依據(jù)五官關(guān)鍵點坐標(biāo)和人物基準(zhǔn)圖像,開展面部特征的提取,使用人臉五官關(guān)鍵點坐標(biāo)與系統(tǒng)預(yù)置的標(biāo)準(zhǔn)人臉五官關(guān)鍵點坐標(biāo)相比較,計算特征值,將人物圖像轉(zhuǎn)變?yōu)橐粋€固定長度數(shù)值串,這個固定長度的數(shù)值串被稱為面部特征,該特征展示了人物面部的特點。識別和鑒別是識別出人臉的年齡、表情、姿態(tài)等屬性值后鑒別與其他圖像中人物的一致性。開展識別時依據(jù)人物基準(zhǔn)圖像、五官關(guān)鍵點坐標(biāo)以及面部特征數(shù)值,通過縮放、旋轉(zhuǎn)等操作將人臉圖像調(diào)整到預(yù)定的大小和位置,通過識別算法進(jìn)行分析,基于深度學(xué)習(xí)的人工智能圖像識別技術(shù)能夠通過一個算法同時得到人物的性別、年齡、姿態(tài)等完整的人臉特征屬性值。基于尋找對象完整的人臉特征屬性值,對所有影像檔案進(jìn)行鑒別,尋找匹配人物的影像。依靠云計算、AI 大模型的強(qiáng)大算力,在數(shù)秒內(nèi)可完成影像人臉的比對,依據(jù)兩個人臉的特征屬性值,評估兩張人臉的相似度,一般對特征屬性值相符性設(shè)定一個值,滿足設(shè)定值即可判斷為同一人物影像。采用該技術(shù)可以大幅度提高影像檔案的查找效率和準(zhǔn)確度。
在傳統(tǒng)檔案庫房的安防管理中,攝像頭是最基礎(chǔ)的監(jiān)控防護(hù)設(shè)備,一旦發(fā)生安防事件,在傳統(tǒng)安防工作模式下,檔案管理人員主要采用查看監(jiān)控視頻的方式,這種方式需要通過人工一秒一秒的查看篩查攝像頭捕獲的視頻畫面,整個篩查過程不僅工作量大,同時浪費(fèi)了大量的時間和精力?;谌斯ぶ悄軋D像識別技術(shù)的檔案庫房自動化視頻監(jiān)控系統(tǒng)的建立逐步改變了傳統(tǒng)的庫房安防模式,這一系統(tǒng)主要由前端和終端智能技術(shù)組成,以采集設(shè)備捕獲的視頻、圖像及結(jié)構(gòu)化數(shù)據(jù)為基礎(chǔ),實現(xiàn)以圖像搜索人員并進(jìn)行相似性鑒別,幫助檔案管理人員快速準(zhǔn)確地發(fā)現(xiàn)庫房安防問題。前端主要依靠具有AI 功能的攝像頭,比如人臉識別攝像頭,在捕獲視頻和圖像的同時,依靠攝像頭內(nèi)置的智能算法,將捕獲的目標(biāo)轉(zhuǎn)換為結(jié)構(gòu)化的數(shù)據(jù)后傳到處理終端,可以減少終端分析處理的壓力和網(wǎng)絡(luò)帶寬的壓力。終端主要由具備智能分析功能的網(wǎng)絡(luò)錄像機(jī)、人臉識別和視頻結(jié)構(gòu)化分析模塊組成。智能網(wǎng)絡(luò)錄像機(jī)是在集中存儲圖像的基礎(chǔ)上,通過集成深度學(xué)習(xí)算法對圖像內(nèi)容進(jìn)行信息提取和智能分析。人臉識別和視頻結(jié)構(gòu)化模塊是基于圖像提取分析的結(jié)果,通過深度學(xué)習(xí)算法,對人臉特征進(jìn)行快速提取和準(zhǔn)確識別比對并輸出識別結(jié)果,這一系統(tǒng)能夠在快速捕獲視頻內(nèi)容及相關(guān)信息的同時將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),進(jìn)行人像對比以及軌跡還原分析,能夠有效提升檔案庫房安防管理的效率。隨著檔案智能庫房的發(fā)展,智能需求日益增多,在這個過程中能夠?qū)⒃械臋n案管理者從傳統(tǒng)的庫房管理中解放出來,讓智能技術(shù)和設(shè)備代替人工是大勢所趨。
在檔案管理領(lǐng)域,存在大量基于視頻、圖像工作的場景,人工智能圖像識別技術(shù)具有廣闊的應(yīng)用前景。但相關(guān)技術(shù)和設(shè)備在滿足檔案領(lǐng)域管理需求方面還需有所優(yōu)化提升。首先在圖像前端采集方面,進(jìn)一步加快圖像捕獲設(shè)備的研發(fā)以及升級,基于目前主流的高清圖像、二維圖像的捕獲向三維圖像的捕獲構(gòu)建轉(zhuǎn)變,在前端實現(xiàn)更多維度的數(shù)據(jù)采集;進(jìn)一步結(jié)合生物仿生原理,對光學(xué)系統(tǒng)以及識別系統(tǒng)進(jìn)行升級優(yōu)化,具備智能調(diào)節(jié)功能,從而獲取更加清晰的圖像。在后端算法處理方面,算法是人工智能圖像識別技術(shù)應(yīng)用的核心,但目前的算法的速率和精準(zhǔn)度還未達(dá)到較高的水準(zhǔn),對圖像、人物的識別精準(zhǔn)率較低,如何提升圖像識別算法和準(zhǔn)確率是關(guān)鍵的核心任務(wù)。同時,圖像識別與人工智能是高度依賴網(wǎng)絡(luò)開展的,需要通過網(wǎng)絡(luò)連接硬件設(shè)備、軟件系統(tǒng)以及打通與關(guān)聯(lián)領(lǐng)域的互通,打造立體化、多維度的人工智能圖像識別應(yīng)用體系,支持文件控制、檔案管理、庫房管理、人員管理等,真正實現(xiàn)內(nèi)部業(yè)務(wù)的聯(lián)動,真正讓信息成為推動檔案事業(yè)發(fā)展的重要載體。