国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人工智能技術(shù)在智慧檔案館建設(shè)中的應(yīng)用初探
——以太倉市檔案館為例

2016-09-02 08:29陳亮太倉市檔案局江蘇太倉215400
檔案與建設(shè) 2016年7期
關(guān)鍵詞:防火墻檔案館人工智能

陳亮(太倉市檔案局,江蘇太倉,215400)

人工智能技術(shù)在智慧檔案館建設(shè)中的應(yīng)用初探
——以太倉市檔案館為例

陳亮
(太倉市檔案局,江蘇太倉,215400)

太倉市檔案館

近年來,隨著IBM公司“智慧地球”概念的提出,引發(fā)了全世界智慧城市建設(shè)的熱潮。智慧交通、智慧城管、智慧圖書館等一大批新事物不斷涌現(xiàn),相關(guān)的技術(shù)和管理措施成為新的研究方向。在新技術(shù)發(fā)展浪潮中,我們檔案部門提出了“智慧檔案館”的發(fā)展理念、工作目標(biāo)和實(shí)現(xiàn)路徑,開發(fā)建設(shè)智慧檔案館,為檔案館事業(yè)發(fā)展謀劃新的藍(lán)圖。

一、人工智能技術(shù)的應(yīng)用價(jià)值

1.人工智能的發(fā)展前景

人工智能(Artificial Intelligence)誕生于20世紀(jì)50年代,英文縮寫為AI。人工智能是研究怎樣使計(jì)算機(jī)來模仿人腦所從事的推理、證明、識別、理解、設(shè)計(jì)、學(xué)習(xí)、思考以及問題求解等思維活動(dòng),來解決需要人類專家才能處理的復(fù)雜問題。它的研究范圍包括:智能搜索、邏輯推理、信息感應(yīng)辯證處理、語言學(xué)習(xí)與處理、知識表現(xiàn)和獲取、規(guī)劃決策、軟計(jì)算等,涉及認(rèn)知科學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)、控制論等多種學(xué)科。

近幾年,人工智能技術(shù)突飛猛進(jìn),應(yīng)用范圍日益寬廣。2013年,基于自然語言搜索和云計(jì)算技術(shù)開發(fā)的Warren金融數(shù)據(jù)分析系統(tǒng)投入商用。數(shù)年間,Warren在金融分析上的卓越表現(xiàn)已經(jīng)勝過了專業(yè)的分析師,讓高盛、摩根大通等無數(shù)金融機(jī)構(gòu)趨之若鶩。2016年3月,采用MCTS搜索和DCNN網(wǎng)絡(luò)等人工智能技術(shù)的圍棋程序AlphaGo戰(zhàn)勝了世界冠軍李世石,它的勝利標(biāo)志著人工智能發(fā)展到了一個(gè)新高度。

2.智慧檔案館:數(shù)字檔案館的升級版

當(dāng)前,檔案信息化建設(shè)的核心內(nèi)容是數(shù)字檔案館。它以數(shù)字技術(shù)處理和存儲(chǔ)傳統(tǒng)載體檔案信息、電子檔案及目錄信息,應(yīng)用網(wǎng)絡(luò)技術(shù)實(shí)現(xiàn)檔案信息檢索和利用。數(shù)字檔案館的產(chǎn)生解決了傳統(tǒng)檔案固有的壽命有限和利用范圍有限的問題,使檔案信息得以脫離傳統(tǒng)載體束縛,給檔案工作帶來革命性變革。但是,數(shù)字檔案館只是方便了檔案利用,并不具備幫助檔案管理人員開展業(yè)務(wù)工作及輔助檔案用戶思維的工作。隨著技術(shù)的發(fā)展,在數(shù)字檔案館的基礎(chǔ)上,采用云計(jì)算、物聯(lián)網(wǎng)、人工智能技術(shù),將使檔案信息化建設(shè)推向一個(gè)新階段。

現(xiàn)在,檔案資源愈加多元,包括傳統(tǒng)檔案、原生電子檔案、檔案目錄數(shù)據(jù)庫、檔案全文數(shù)據(jù)庫等。經(jīng)過多年的檔案信息化,電子檔案數(shù)據(jù)規(guī)模呈幾何級數(shù)增長。筆者所在的縣級市檔案館,館藏?cái)?shù)字化檔案存儲(chǔ)已經(jīng)超過30TB,每年新產(chǎn)生的檔案數(shù)據(jù)也在TB量級。如此大量的數(shù)據(jù),一般的存儲(chǔ)和處理技術(shù)是無法勝任的,“智慧檔案館”應(yīng)運(yùn)而生。

智慧檔案館面對的是海量數(shù)據(jù)的運(yùn)算和存儲(chǔ),而要解決海量數(shù)據(jù)帶來的一系列問題,云計(jì)算是不可或缺的途徑。云計(jì)算技術(shù)包括分布式處理、分布式數(shù)據(jù)庫、云存儲(chǔ)、人工智能和虛擬化技術(shù)。構(gòu)建“云”,離不開軟硬件基礎(chǔ)設(shè)施。在軟件層面上,過去的集中式串行計(jì)算程序,已不適應(yīng)分布式環(huán)境的要求,并行計(jì)算、網(wǎng)格計(jì)算、人工智能是“云”上管理大數(shù)據(jù)的關(guān)鍵技術(shù)。智慧檔案館的“智”就體現(xiàn)在人工智能技術(shù)上,它是智慧檔案館開發(fā)建設(shè)的技術(shù)引擎。

二、人工智能在智慧檔案館建設(shè)中的應(yīng)用

下面從幾個(gè)方面探討在智慧檔案館建設(shè)上可以采用的人工智能技術(shù)。

1.檔案資源收集

文本挖掘也稱為文檔挖掘或文本(數(shù)據(jù)庫)的知識發(fā)現(xiàn),是目前人們很關(guān)心的一個(gè)研究熱點(diǎn)。舉個(gè)例子來說,我們在檔案編研過程中,需要檢索大量的資料,而在人類汗牛充棟的歷史文獻(xiàn)中找尋是相當(dāng)費(fèi)時(shí)費(fèi)力的。智能Agent是數(shù)據(jù)挖掘方面的人工智能產(chǎn)品,我們所熟知的Google爬蟲、百度蜘蛛,都是智能Agent。Google或者百度都是通過智能Agent在浩如煙海的網(wǎng)絡(luò)世界中,收集整理近乎所有的人類知識的數(shù)字化成果。有了它們,海量信息變得唾手可得。智能搜索可以為檔案的檢索利用提供方便,提高效率。

2.檔案智能分類

傳統(tǒng)檔案分類是依據(jù)一定的標(biāo)準(zhǔn),按照檔案來源、時(shí)間、內(nèi)容和形式特征的異同點(diǎn),對檔案進(jìn)行有層次的區(qū)分,并形成相應(yīng)的體系。隨著原生電子檔案等一些新類型檔案的出現(xiàn),檔案分類方法需要進(jìn)一步的發(fā)展。對電子檔案進(jìn)行智能分類是檔案管理中的一種新方法。

自然語言理解是研究如何讓計(jì)算機(jī)理解人類自然語言的一個(gè)研究領(lǐng)域,也是人工智能的一項(xiàng)重要研究領(lǐng)域,它主要包括詞法分析、句法分析、語義分析等。分析過程一般采用喬姆斯基語法,結(jié)合各自國家母語語料庫,用有限狀態(tài)自動(dòng)機(jī)掃描待識別文本,經(jīng)過深度學(xué)習(xí)后,生成統(tǒng)一的中間語言,在中間語言的基礎(chǔ)上實(shí)現(xiàn)各種應(yīng)用。

因此,自然語言理解可以在數(shù)字檔案的智能分類上發(fā)揮作用,我們在擁有全文數(shù)據(jù)庫的基礎(chǔ)上,運(yùn)用人工智能機(jī)器,按照專業(yè)的檔案分類法,自動(dòng)生成專題數(shù)據(jù)庫。有了層次合理、結(jié)構(gòu)規(guī)范的檔案專題庫之后,針對不同的查檔人、查檔目的,智能搜索引擎可以快速精準(zhǔn)地推送不同的檢索結(jié)果。從手工翻閱、機(jī)械式檢索到智能檢索,人工智能技術(shù)將給檔案業(yè)務(wù)工作帶來革命性的變化。

3.檔案安全管理

現(xiàn)今,檔案安全主要包括實(shí)體檔案安全和數(shù)字檔案安全。

實(shí)體檔案的安全主要是庫房的安全。帶智能識別功能的門禁系統(tǒng)可廣泛應(yīng)用于各種重點(diǎn)庫房的安保。人工智能有一項(xiàng)研究內(nèi)容是機(jī)器視、聽、觸覺及思維方式的模擬,包括:聲紋識別、指紋識別、人臉識別、視網(wǎng)膜識別、虹膜識別等?,F(xiàn)在,智能識別技術(shù)已經(jīng)成熟,國內(nèi)知名的有Face++(應(yīng)用于支付寶的人臉識別)、格靈深瞳、捷通華聲等。我們采用有識別技術(shù)的安防系統(tǒng)可以在接觸檔案的人員和實(shí)體檔案之間建立起一道安全屏障。

數(shù)字檔案的安全主要包括存儲(chǔ)安全和通訊安全?,F(xiàn)階段,我們的數(shù)字檔案館系統(tǒng)一般采用集中式存儲(chǔ)。隨著數(shù)據(jù)量的爆炸式增長,存儲(chǔ)空間成為一道瓶頸。新一代的檔案云將采用分布式存儲(chǔ),這種存儲(chǔ)方式要求更為安全更為高效的數(shù)據(jù)管理手段,而人工智能是首選。國內(nèi)外許多大型科技公司在資源配置、業(yè)務(wù)調(diào)度、安全防護(hù)等方面已經(jīng)廣泛采用人工智能技術(shù)。人工智能技術(shù)可在檔案云的智能存儲(chǔ)調(diào)度、智能安防方面發(fā)揮舉足輕重的作用。數(shù)字檔案的通訊安全是檔案網(wǎng)絡(luò)建設(shè)的一個(gè)重點(diǎn)。

4.檔案網(wǎng)絡(luò)建設(shè)

相對于普通網(wǎng)絡(luò)而言,檔案網(wǎng)絡(luò)必須專網(wǎng)專用、其保密性要求更高。現(xiàn)代網(wǎng)絡(luò)技術(shù)飛速發(fā)展,一方面網(wǎng)絡(luò)速度突飛猛進(jìn),另一方面網(wǎng)絡(luò)上的系統(tǒng)漏洞層出不窮,給檔案網(wǎng)絡(luò)建設(shè)帶來了機(jī)遇與挑戰(zhàn)。

人工智能在網(wǎng)絡(luò)上的應(yīng)用有智能防火墻、智能路由、智能云等。

智能防火墻是一種更聰明、更智能的防火墻,它克服了傳統(tǒng)防火墻“一管就死,一放就亂”的狀況,把“出口”的概念改變?yōu)椤瓣P(guān)口”的概念,所有經(jīng)過“關(guān)口”的數(shù)據(jù)包都必須接受防火墻的檢查。與傳統(tǒng)防火墻采用的數(shù)據(jù)匹配檢查的技術(shù)不同,新的智能防火墻采用人工智能識別技術(shù)來決定訪問控制,比傳統(tǒng)的防火墻更安全,效率更高。它成功地解決了普遍存在的拒絕服務(wù)攻擊(DDOS)的問題、病毒傳播問題和高級應(yīng)用入侵問題,代表著防火墻的主流發(fā)展方向。

智能路由是在動(dòng)態(tài)路由的基礎(chǔ)上發(fā)展出來的新一代路由技術(shù),它具有簡潔、低耗、低時(shí)延、負(fù)載均衡、健壯穩(wěn)定、快速聚合、高度靈活等特點(diǎn)。在鏈路狀態(tài)算法或距離矢量算法的基礎(chǔ)上加入人工智能計(jì)算單元,動(dòng)態(tài)建立路由表,優(yōu)化數(shù)據(jù)傳輸。在發(fā)生網(wǎng)絡(luò)故障時(shí),它能快速屏蔽故障節(jié)點(diǎn),即時(shí)重建路由,優(yōu)選最短路徑,最大限度保障網(wǎng)絡(luò)暢通,減少用戶因?yàn)榫W(wǎng)絡(luò)故障帶來的損失。

智能云是分布式計(jì)算、并行計(jì)算、效用計(jì)算、網(wǎng)絡(luò)存儲(chǔ)、虛擬化、負(fù)載均衡、熱備份冗余等傳統(tǒng)計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)發(fā)展融合的產(chǎn)物。云計(jì)算需要對分布的、海量的數(shù)據(jù)進(jìn)行處理、分析,必須能夠高效地管理大量的數(shù)據(jù),只有依靠人工智能技術(shù),才能實(shí)現(xiàn)大規(guī)模系統(tǒng)的可靠運(yùn)行。如IBM的Watson、微軟的Azure、谷歌的Compute Engine、亞馬遜的AWS等均集成了強(qiáng)大的人工智能運(yùn)算單元。

因此,在檔案網(wǎng)絡(luò)建設(shè)中采用帶有人工智能技術(shù)的網(wǎng)絡(luò)設(shè)備可以顯著提高檔案網(wǎng)絡(luò)的安全性、穩(wěn)定性,實(shí)現(xiàn)效用最大化。

三、人工智能技術(shù)在智慧檔案館建設(shè)中的實(shí)現(xiàn)

太倉市檔案館很早就開展了數(shù)字檔案館室系統(tǒng)的建設(shè),經(jīng)過多年的應(yīng)用研究和多次的技術(shù)改進(jìn),相關(guān)系統(tǒng)已日臻成熟,這其中就應(yīng)用了一些人工智能技術(shù)。

對前文所述的檔案數(shù)字資源收集和智能分類,我們館藏系統(tǒng)有一項(xiàng)“全文檢索”功能,就是運(yùn)用了智能Agent技術(shù)。以前在我們查找需要的檔案時(shí),一般是按照關(guān)鍵字來檢索目錄數(shù)據(jù)庫,但是這種查找不像我們認(rèn)為的那樣簡單,因?yàn)楝F(xiàn)在的館藏?cái)?shù)字檔案文件數(shù)量都在百萬以上,特別是在我們不知道檔案在館藏中的全宗、門類或位置時(shí),檢索就非常耗時(shí)。因此,我們在系統(tǒng)中加入了智能Agent。在前期的檔案數(shù)字化和OCR的成果基礎(chǔ)上,這個(gè)小“爬蟲”定期地掃描館藏?cái)?shù)字檔案的存儲(chǔ)區(qū)域,把可用的文字信息自動(dòng)地分類后存入指定的全文數(shù)據(jù)庫(CFS文件)中。在我們檢索全文的時(shí)候,系統(tǒng)在保存的全文數(shù)據(jù)庫中搜索,使查詢時(shí)間控制在0.1秒以下。它的使用顯著提高了檢索速度。但是與谷歌和百度的智能Agent相比,這個(gè)小“爬蟲”在功能和效率上要相對落后許多,在智慧檔案館的未來建設(shè)中,它需要做更多的升級優(yōu)化來滿足大數(shù)據(jù)的挑戰(zhàn)。

在檔案安全和檔案網(wǎng)絡(luò)建設(shè)上,我們在新館建設(shè)中采用了集中控制的門禁系統(tǒng)、全方位的立體監(jiān)控系統(tǒng)、可升級固件和策略的防火墻等網(wǎng)絡(luò)設(shè)備。近幾年,在人工智能技術(shù)的帶動(dòng)下,出現(xiàn)了帶人臉識別或者虹膜識別的門禁系統(tǒng)、能識別和定位人與物的監(jiān)控跟蹤系統(tǒng)、可識別代碼行為特征的智能防火墻。作為升級換代,這些新設(shè)施設(shè)備的逐步采用,將給檔案的管理帶來全方位的效率提升。

目前,太倉市數(shù)字檔案系統(tǒng)采用B/S架構(gòu)、集中式存儲(chǔ)。在近10年的使用中,系統(tǒng)高效穩(wěn)定。但形勢不斷變化、新技術(shù)也不斷涌現(xiàn),我們必須改造現(xiàn)有的系統(tǒng)以適應(yīng)新的發(fā)展環(huán)境。網(wǎng)絡(luò)技術(shù)發(fā)展有一條定律叫梅特卡夫定律,其內(nèi)容是:網(wǎng)絡(luò)的價(jià)值與聯(lián)網(wǎng)的用戶數(shù)的平方成正比。因此,隨著檔案事業(yè)的發(fā)展,擁有海量用戶的檔案云是我們新時(shí)期檔案網(wǎng)絡(luò)建設(shè)的目標(biāo)。檔案云連接所有歸檔單位,形成檔案集群,使其中的電子檔案實(shí)現(xiàn)分布式存儲(chǔ)、異地調(diào)取,利用智能Agent來提高檔案業(yè)務(wù)工作的效率,通過智能身份識別來杜絕非法訪問,從而保證檔案的安全。這些智能系統(tǒng)的研發(fā)技術(shù)已漸趨成熟,它們不是虛幻的,它們會(huì)在不久的將來被廣泛應(yīng)用。

人工智能技術(shù)正在全世界迅速地發(fā)展中,中國也不能落后。今年兩會(huì)上,政協(xié)委員李彥宏建議設(shè)立“中國大腦”計(jì)劃,推動(dòng)人工智能跨越發(fā)展,搶占新一輪科技革命制高點(diǎn)。人工智能是21世紀(jì)最為前沿的技術(shù)之一,其發(fā)展將極大地提升和擴(kuò)展人類的能力邊界,對促進(jìn)技術(shù)創(chuàng)新、提升國家競爭優(yōu)勢乃至推動(dòng)人類社會(huì)發(fā)展產(chǎn)生深遠(yuǎn)影響。當(dāng)前,人工智能正迎來新一輪創(chuàng)新發(fā)展期,歐美等發(fā)達(dá)國家紛紛從國家戰(zhàn)略層面加緊布局,以引領(lǐng)新一輪科技創(chuàng)新大潮。我們在“智慧檔案館”的建設(shè)中,可以廣泛采用已經(jīng)取得成果的各項(xiàng)人工智能技術(shù),推動(dòng)新一輪的檔案信息技術(shù)革新。把握住這一時(shí)代的脈搏,可以實(shí)現(xiàn)檔案事業(yè)的跨越式發(fā)展。

[1]楊來青,徐明君,鄒杰.檔案館未來發(fā)展的新前景∶智慧檔案館[J].《中國檔案》,2013(2)∶68-70.

[2]張仰森.人工智能原理與應(yīng)用[M].高等教育出版社.2004.

猜你喜歡
防火墻檔案館人工智能
云南省檔案局辦公室關(guān)于表彰2018年度《云南檔案》優(yōu)秀通聯(lián)組及發(fā)行先進(jìn)單位的通報(bào)
構(gòu)建防控金融風(fēng)險(xiǎn)“防火墻”
2019:人工智能
人工智能與就業(yè)
數(shù)讀人工智能
全省部分檔案館新館掠影
下一幕,人工智能!
在舌尖上筑牢抵御“僵尸肉”的防火墻
when與while檔案館
下一代防火墻要做的十件事