陳秀麗
電子商務檔案是經(jīng)濟主體在各種電子商務活動中,所形成的原始記錄,具有一定的保存價值。為了保證電子商務檔案的科學化、系統(tǒng)化和條理化的管理,保證電子商務檔案的安全性、真實性、有效性和完整性,實施電子商務檔案智能化管理是一種必然的趨勢。電子商務檔案智能化管理的一項重要內(nèi)容,就是檔案檢索,它是指建立檔案檢索系統(tǒng),編制檢索工具,通過對所需檔案信息的查找,提供業(yè)務服務。當前,對于檔案信息,不同的用戶,有著不同的需求。隨著不斷發(fā)展和完善的信息檢索技術,電子商務檔案信息檢索也產(chǎn)生了不同的類型,只有實現(xiàn)電子商務檔案檢索的智能化,才能滿足信息需求下,方便用戶準確、快捷、高效的獲取檔案信息。
一、電子商務檔案的特點
1.虛擬性
相比于其他的檔案存在形式,電子商務檔案的顯著特征是虛擬性。首先,是在虛擬的網(wǎng)絡傳輸空間,發(fā)生電子商務行為的。其次,在各個環(huán)節(jié)中所發(fā)生的電子商務活動的交易信息,具有一定的虛擬性:一是借助于網(wǎng)絡,完成了以實物商品為內(nèi)容的貿(mào)易活動;二是通過網(wǎng)絡,提供商品的信息;三是通過聯(lián)機訂購,查詢聯(lián)機數(shù)據(jù)庫,提供信息資訊服務;四是利用電子銀行和其他金融服務,提供支付手段。
2.復雜性
電子商務檔案是利用存儲介質(zhì)存儲數(shù)字信息,它無法用手工操作和肉眼識別,只能通過計算機系統(tǒng)的解碼才能被識別。而隨著計算機技術的不斷發(fā)展,在各種介質(zhì)中所存儲的電子商務檔案的存儲形式、鏈接方式、傳輸協(xié)議、規(guī)范和信息格式也是不同的,這也因此形成了電子商務檔案的復雜性的特征。
3.集成性
和紙質(zhì)檔案的單一性的特征相比較,集成性是目前電子商務檔案信息的特征。它不僅僅是數(shù)字或文字信息,而且還可在同一份文件上,記錄不同媒體形式的信息。使電子商務活動的各個環(huán)節(jié)都能被真實的、聲像并茂的記錄。所以我們應針對電子商務檔案的特點進行檢索,以提高其智能化的程度,與時代的智能化需求相符合。
二、現(xiàn)階段電子商務檔案檢索的類型
1.按檢索對象劃分
可分為文獻檢索、事實檢索和數(shù)據(jù)檢索。文獻檢索是以文獻為檢索對象,涵蓋了各類特定信息的文獻,對用戶所需的文獻內(nèi)容進行查找;事實檢索是指將事實作為檢索對象,內(nèi)容包括人物、企業(yè)和機構(gòu)的基本情況,對用戶所需的描述性事實進行查找;數(shù)據(jù)檢索是將數(shù)據(jù)作為檢索對象,包括各種個性數(shù)據(jù)、統(tǒng)計數(shù)據(jù)和調(diào)查數(shù)據(jù),對用戶所需要的數(shù)值型數(shù)據(jù)進行查找。
2.按檢索要求劃分
可分為強相關檢索和弱相關檢索。強相關檢索也稱特性檢索,是為用戶提供的一種對口的高度的信息檢索,對檢索的準確性非常強調(diào);弱相關檢索也稱族性檢索,是為用戶提供完善而系統(tǒng)的信息檢索,注重查全,對檢索的全面性非常重視。
3. 按檢索性質(zhì)劃分
包括回溯檢索和定題檢索?;厮輽z索也稱追溯檢索,是對一段時期內(nèi)或者是近期內(nèi)的相關特定主題進行查找;定題檢索是對特定主題的最新信息進行查找。其特點是有較小的時間跨度,同時檢索到的也是最新的信息。這種檢索適合信息跟蹤,一旦檔案信息庫有更新,有新的檔案信息加入時,定題檢索就會自動的運行,便于用戶對相關領域的最新發(fā)展動態(tài)及時的跟蹤和掌握。
4.按檢索的信息形式劃分
可分為多媒體檢索和文本檢索。多媒體檢索是對含有特定信息的多媒體檔案文獻的查找,其結(jié)果是用包括影片、動畫、聲音、圖像在內(nèi)的多媒體形式,對特定的信息進行表現(xiàn);文本檢索是對含有特定信息的文本文獻進行查找,其結(jié)果是對特定的信息內(nèi)容用文本形式進行體現(xiàn)。
三、電子商務檔案信息檢索的智能化趨勢
隨著計算機智能技術的突飛猛進的發(fā)展,尤其是近年來圖情信息智能檢索所取得成就,為電子商務檔案的信息檢索向智能化的發(fā)展,帶來了新的契機。電子商務檔案有著多種多樣的存儲形式,涵蓋了非固定長度和一般固定長度的信息檢索。信息既可以用數(shù)字、文字表達,還可以用聲音、圖像表達;有不加密和加密的信息;有在異地設備或者是云端存儲的信息,也有在本地設備上存儲的信息。因此,對電子商務檔案信息的智能檢索,具有非常重要的意義。而“智能檢索”的概念是指,在檢索詞和文獻的相關度的基礎上,對文獻的重要性指標進行綜合考察,再排序檢索結(jié)果,使檢索效率得到進一步的提高。在排序智能檢索結(jié)果時,要對其重要性和相關性進行考慮。為了保證更加準確的相關性分析,需采用各字段加權(quán)混合索引;重要性是指通過引用關系分析和文獻來源權(quán)威性分析,來評價文獻質(zhì)量,這樣會產(chǎn)生更加準確的排序結(jié)果,在最前面排列與用戶愿望最相關的文獻。使檢索的效率提高。
1.電子商務檔案的全球化特征
在電子商務飛速發(fā)展的今天,電子商務活動有著越來越顯著的全球化特征。甚至在世界上任何一個角落,都有著頻繁的商務活動。因此,電子商務檔案信息具有交易方式多樣性、交易語言復雜性、信息管理系統(tǒng)分布性的特征。新形勢下,傳統(tǒng)檔案信息檢索工具已經(jīng)無法對用戶的需求給予滿足。在信息時代,使用和開發(fā)智能檢索工具,已經(jīng)成為一個必然的發(fā)展趨勢和選擇。同時,日益發(fā)展的人工智能技術和不斷使用的超大型計算機,提供了強大的技術支撐,促進了電子商務檔案信息檢索智能化的發(fā)展。而在未來的發(fā)展過程中,利用人工智能技術的最新成果,電子商務檔案智能化的發(fā)展會日益的人性化。同時,在檔案管理的智能化應用中,滲透人工智能領域計算推理等思維活動。而在人工智能研究成果的基礎上,開展物景分析、模式識別的圖形圖像檢索系統(tǒng),充分利用跨越語言障礙的檔案信息、搜索工具及人工智能關于聯(lián)想記憶模擬,對電子商務國際化的需求、以及用戶對圖形圖像檔案信息檢索的需求給以滿足。
譬如,基于圖像的檢索,可充分利用模式識別,通過對圖形和圖像的選擇,進行電子商務活動。交易雙方進行商務洽談之前,首先是要對交易商品的圖形和圖形,進行選擇和甄別,最后才能達成交易意向。所以,電子商務檔案信息的重要組成部分,就是保存交易商品的圖像和圖形。而實現(xiàn)智能檢索的基礎,是專家系統(tǒng)。只有充分利用人工智能檢索系統(tǒng),才能將交易的產(chǎn)品信息,從海量的商務信息中篩選出來。
2.研究和利用圖形圖像智能檢索工具
分析電子商務檔案的信息,只有在充分利用和研究智能圖形圖像的基礎上,才能對電子商務檔案智能化的需求給予滿足。目前,業(yè)界開始廣泛關注一種基于內(nèi)容的圖像檢索技術,即基于視覺特征的圖像檢索技術。任何圖像都具有物體本身的特征,如空間關系、顏色、形狀、物體本身的紋理等。而利用視覺特征的圖像檢索技術,對色彩、形狀、紋理及對象的空間關系等進行提取,建立圖像的特征矢量庫,而索引關鍵字又是在此特征矢量的基礎上建立的。在對圖像的內(nèi)容進行標注時,和傳統(tǒng)的采用人工標注方法所不同的是,從圖像中自動提取,是視覺特征的提取方式,同時采取視覺特征間的匹配進行檢索。相比較于傳統(tǒng)的檢索方法,它是對圖像理解技術進行了融合,對圖像特征的分析,是在對象的空間關系、色彩、形狀、紋理等維度進行分析,這樣才能提供更加有效的檢索方式。而這一發(fā)展趨勢,是與電子商務智能化的發(fā)展需求相符合的。我們完全可以預計,為了與未來個性化、智能化和網(wǎng)絡化需求相滿足,在電子商務檔案的管理領域中,將充分應用信息融合技術、概念空間、問答系統(tǒng)、跨語言信息檢索、自然語言檢索、全息檢索和異構(gòu)信息整合檢索、知識挖掘、知識的智能檢索、分布式檢索,屆時為用戶提供簡潔、有效、及時、準確和完整的商務信息。
總而言之,在社會人本化和信息網(wǎng)絡化的發(fā)展時代,電子商務檔案的信息檢索,已經(jīng)成為未來的發(fā)展趨勢,它是網(wǎng)絡時代和信息社會的必然產(chǎn)物。為滿足用戶從海量的檔案信息中迅速檢索到所需信息,傳統(tǒng)的人工檢索已經(jīng)無法滿足其要求。而電子商務檔案信息檢索的智能化發(fā)展,得益于人工智能技術的發(fā)展。并充分利用自動語言處理、專家系統(tǒng)、自動程序設計、物景聯(lián)想、模式識別等方式。電子商務檔案信息檢索的智能化,是建立在專家系統(tǒng)的基礎上,而檔案信息檢索人工智能技術的應用,必然會使電子商務檔案信息檢索方法和理論發(fā)生實質(zhì)性的變化,這樣電子商務檔案信息檢索必然進入智能化的新時代。
(作者單位:華能瀾滄江水電有限公司)endprint