付永華 白占俊 張旭陽(yáng)
摘? 要:將工程電子文件有序有據(jù)處理是工程電子文件閱讀設(shè)備提供有效閱讀的基礎(chǔ)。論文通過(guò)現(xiàn)場(chǎng)調(diào)查,充分考慮野外施工現(xiàn)場(chǎng)的工程電子文件的來(lái)源、格式與內(nèi)容,針對(duì)工程電子文件多源異構(gòu)的特點(diǎn),了解國(guó)內(nèi)外主流技術(shù),結(jié)合惡劣施工環(huán)境的實(shí)際情況,設(shè)計(jì)并實(shí)現(xiàn)一種新的工程電子文件獲取模式和處理技術(shù),獲取模式包括批量導(dǎo)入按需讀取、臨時(shí)協(xié)作按需共享和實(shí)時(shí)更新按需收集3種模式,處理技術(shù)包括識(shí)別技術(shù)、兼容技術(shù)、轉(zhuǎn)換技術(shù),從而有效加強(qiáng)工程電子文件的實(shí)用性。
關(guān)鍵詞:工程電子文件;多源異構(gòu);獲取模式;處理技術(shù)
Abstract: The orderly handling of engineering electronic documents is the basis for effective reading of engineering electronic document reading devices. The source, format and content of the field construction project of electronic documents is fully considered through field investigation. A new acquisition mode and processing technology of engineering electronic document is designed and implemented according to the characteristics of engineering electronic documents of multi-source heterogeneous, knowledge of domestic and international mainstream technology together with the actual situation of poor construction environment. The acquisition mode includes? batch acquisition mode introduction according to need read, temporary collaboration on-demand storage and real-time updates of on-demand while processing technology contains identification technology, compatible technology and conversion technology, which can effectively strengthen the practical usage of engineering electronic documents.
Keywords: Engineering Electronic Document; Multi-source Heterogeneous; Acquisition Mode; Processing Technology
工程電子文件閱讀設(shè)備主要面向惡劣的野外施工環(huán)境,比如野外勘探、鐵路公路構(gòu)建、災(zāi)害救援等,其直接解決的問(wèn)題是惡劣環(huán)境下的閱讀問(wèn)題。但是,工程電子文件閱讀設(shè)備的內(nèi)容質(zhì)量,也就是各種工程電子文件的質(zhì)量,也直接影響著閱讀的效果,而且,工程電子文件的來(lái)源比較多[1],內(nèi)容和格式也存在很多差異,因此,如何有效地獲取這些多源異構(gòu)的工程電子文件,并有序有據(jù)地對(duì)其進(jìn)行處理加工,使之適合野外施工環(huán)境需要,容易閱讀,成為提高閱讀質(zhì)量的關(guān)鍵。
在工程電子文件閱讀設(shè)備樣機(jī)設(shè)計(jì)并實(shí)現(xiàn)后,通過(guò)對(duì)中建二局第二建筑工程有限公司負(fù)責(zé)的惠濟(jì)萬(wàn)達(dá)廣場(chǎng)項(xiàng)目、鄭州市農(nóng)業(yè)路快速通道工程京廣高架互通項(xiàng)目實(shí)證調(diào)研,分析研究面向工程電子文件閱讀設(shè)備的工程電子文件的現(xiàn)狀與特點(diǎn)。
1.1工程電子文件多源成因。(1)過(guò)程天然多源:經(jīng)了解,工程電子文件的來(lái)源存在多個(gè)單位,比如,一般的項(xiàng)目工程包括建設(shè)、勘察、設(shè)計(jì)、施工、監(jiān)理、檢測(cè)、檢驗(yàn)等流程,在這些不同的流程中,必然存在著多家單位的工作,導(dǎo)致工程電子文件天然產(chǎn)生著多個(gè)源頭。
(2)同節(jié)協(xié)作多源:即使同一個(gè)工作環(huán)節(jié),或者同一個(gè)工作單位,也會(huì)有多源的現(xiàn)象,比如施工現(xiàn)場(chǎng),因?yàn)槟稠?xiàng)需求,有幾個(gè)協(xié)作部門(mén),對(duì)工程資料如施工圖紙等,進(jìn)行現(xiàn)場(chǎng)調(diào)研、臨時(shí)變更,導(dǎo)致工程文件實(shí)時(shí)產(chǎn)生,難以預(yù)測(cè)。
(3)同文修改多源:在同一份文件上,也有可能是先由設(shè)計(jì)人員完成,然后其他人員因?yàn)樾枰苯釉诠こ藤Y料上進(jìn)行修改,甚至更多的是同樣的設(shè)計(jì)人員自己不斷地修改,導(dǎo)致同文修改多源。
1.2工程電子文件異構(gòu)成因與構(gòu)成。導(dǎo)致工程電子文件異構(gòu)的原因主要是文件的多源,不同的階段采用的工程電子文件描述工具不同;同樣的任務(wù),不同的單位又可能采用不同的軟件;工程電子文件本身的描述需要,比如有的地方需要文字描述,有的可能是圖片,也導(dǎo)致工程電子文件的異構(gòu);工程電子文件描述技術(shù)的飛速發(fā)展,為工程電子文件的描述提供了便利,但是也導(dǎo)致了新的描述格式的出現(xiàn),比如虛擬技術(shù)、3D技術(shù)等。
經(jīng)調(diào)研,工程電子文件的構(gòu)成主要包括各類設(shè)計(jì)圖紙、施工圖紙,各種文件規(guī)定、施工記錄、驗(yàn)收記錄和報(bào)告等,各種原材料、成品、半成品、構(gòu)配件、設(shè)備的描述性文件等,施工過(guò)程中的各種描述等。具體構(gòu)成的格式、來(lái)源等信息如表1所示,其中,獲取難度和處理難度采用五分法描述,獲取難度的1代表可以直接獲取,5代表基本不能獲取,或經(jīng)較為復(fù)雜的技術(shù)方式才能獲取;處理難度的1代表不需要處理,可以直接使用,5代表需要經(jīng)過(guò)論文設(shè)計(jì)的所有處理技術(shù)才能處理完成。
2.1 研究現(xiàn)狀。關(guān)于電子文件格式,向來(lái)不是學(xué)者們研究的重點(diǎn),一般側(cè)重的是存儲(chǔ)或歸檔方式。比如劉家真教授在2000年根據(jù)澳大利亞電子文件管理策略,研究了電子文件的保存、鑒定與存取問(wèn)題[2]。李澤鋒教授則較為全面地研究電子文件整個(gè)生命周期的變化,并在2004年,就較早地關(guān)注了檔案數(shù)字化的電子格式問(wèn)題,他認(rèn)為XML、RTF、TXT等并不完全適用于檔案的數(shù)據(jù)格式,他討論了文件保存格式的選擇原則,并在對(duì)比幾種電子格式的基礎(chǔ)上,提出CEB是一種比較適合數(shù)字化檔案的保存、整理、利用與遷移的格式[3]。
各位學(xué)者也意識(shí)到了,不同的存儲(chǔ)格式對(duì)電子檔案使用的影響,也在考慮如何進(jìn)行融匯和兼容,1998年,劉詩(shī)德和郭黎探討了電子出版系統(tǒng)的文件交流,并從質(zhì)量、靈敏性、效率和支持性等方面,考慮了出版系統(tǒng)不同格式之間的轉(zhuǎn)換和兼容問(wèn)題,最后給出了一種支持2種格式轉(zhuǎn)換的平臺(tái)的設(shè)計(jì)思路[4]。此方面的研究,一直延續(xù)到今天,2017年,梁凱研究了檔案部門(mén)應(yīng)用OFD格式的問(wèn)題,分析了OFD格式的優(yōu)勢(shì)與存在的“短板”,同時(shí)也簡(jiǎn)單講述了OFD格式與PDF格式的競(jìng)爭(zhēng)[5]。
關(guān)于工程電子檔案或工程電子文件的研究,幾近千篇,但縱觀這些研究,主要還是數(shù)字化的技術(shù)、數(shù)字化的過(guò)程方面,或者是以某實(shí)際工程為例的數(shù)字化,也有少部分的研究考慮了安全問(wèn)題和如何更好地使用,比如有的研究設(shè)計(jì)了在線瀏覽的模式等,但是基本沒(méi)有考慮多種格式存在的主要原因和一定時(shí)間內(nèi)無(wú)法改變這種現(xiàn)狀的事實(shí)。
2.2 應(yīng)用現(xiàn)狀。在國(guó)外,美國(guó)電子文件檔案館項(xiàng)目系統(tǒng)工程主管Dyung Le就將工作重點(diǎn)放到多種格式文件的存儲(chǔ)和利用上,使其盡量不受電子文件產(chǎn)生的軟件或硬件的影響。李澤鋒教授也提出了一種注冊(cè)庫(kù)技術(shù),他在理解文件格式與分析格式管理原因的基礎(chǔ)上,對(duì)格式管理的功能進(jìn)行分析,認(rèn)為應(yīng)該構(gòu)建格式注冊(cè)庫(kù),存儲(chǔ)格式的表示信息,進(jìn)一步分析格式注冊(cè)庫(kù)的構(gòu)成,從而便于識(shí)別和兼容不同的格式[6]。
在具體應(yīng)用上,很多公司過(guò)去采用獨(dú)立技術(shù),一方面為了保密,另外也為了彰顯個(gè)性獨(dú)立,但在兼容和共享的發(fā)展方向上,也在慢慢地改變,比如2006年,日本Sony Corporation的數(shù)據(jù)壓縮技術(shù)就與競(jìng)爭(zhēng)對(duì)手的格式兼容,包括Apple Inc.的AAC技術(shù)。
在數(shù)字存檔方面,也有很多技術(shù)在推進(jìn),比如2010年提出的XAM(eXtensible Access Method,可擴(kuò)展訪問(wèn)方法),這一標(biāo)準(zhǔn)將原始數(shù)據(jù)和應(yīng)用分開(kāi),從而實(shí)現(xiàn)應(yīng)用時(shí)按需的操作。雖然此方面的研究在2012年便不再繼續(xù),但也是一種嘗試。也有的技術(shù)考慮到數(shù)字化制作者本身的實(shí)際情況,研究有限兼容支持的自治信息保存格式,在一種允許的框架范圍內(nèi),自由地進(jìn)行檔案數(shù)字化,不用考慮將來(lái)使用者的情況。CDMI(Cloud Data Management Interface,云數(shù)據(jù)管理接口)標(biāo)準(zhǔn)是近些年流行的新技術(shù),提供了訪問(wèn)云存儲(chǔ)和管理云存儲(chǔ)數(shù)據(jù)的方式,能夠讓大多數(shù)舊的非云存儲(chǔ)產(chǎn)品訪問(wèn)方式演進(jìn)成云存儲(chǔ)訪問(wèn)。
在政策和行業(yè)規(guī)定方面,2016年10月14日,“電子文件存儲(chǔ)與交換格式版式文檔”標(biāo)準(zhǔn)發(fā)布,這是我國(guó)自主研發(fā)的版式格式標(biāo)準(zhǔn),是國(guó)家電子文件標(biāo)準(zhǔn)體系的重要組成部分,該標(biāo)準(zhǔn)規(guī)定國(guó)家版式文檔格式規(guī)范,簡(jiǎn)稱OFD(Open Fixed-Layout Document),在多個(gè)行業(yè)進(jìn)行驗(yàn)證,獲得市場(chǎng)和用戶的廣泛認(rèn)可[7]。
縱觀上述研究現(xiàn)狀、應(yīng)用現(xiàn)狀或技術(shù)現(xiàn)狀,首先,工程電子文件的復(fù)雜程度得到了認(rèn)可,但在數(shù)字化過(guò)程中,并沒(méi)有考慮工程電子文件的來(lái)源和構(gòu)成,只是按照普通的數(shù)字化方法去管理,最多考慮了工程圖紙的大幅面、改動(dòng)多的特點(diǎn)。其次,認(rèn)識(shí)到了數(shù)字存儲(chǔ)格式對(duì)閱讀效果的影響,已經(jīng)采用規(guī)范和技術(shù),去盡量地消除格式的不統(tǒng)一帶來(lái)的影響,有的從源頭考慮,有的從使用端考慮,但基本沒(méi)有意識(shí)到,這些規(guī)范或技術(shù),在惡劣的施工環(huán)境下,能否適用,這個(gè)施工環(huán)境還包括硬件和操作者,同時(shí),也沒(méi)有考慮這種改變,是否對(duì)操作者產(chǎn)生了新的影響,增加了原有操作的工作量和復(fù)雜度。
3.1 符合工程的實(shí)際需要。(1)充分考慮施工環(huán)境。工程電子文件和其他的電子文件不同,工程施工現(xiàn)場(chǎng),有可能盛夏酷暑、烈日炎炎,也可能寒風(fēng)凜冽、冰天雪地,也可能風(fēng)雨交加,也可能塵土飛揚(yáng),這不管對(duì)電子檔案還是紙質(zhì)檔案,都存在著很大的使用壓力;有的工程現(xiàn)場(chǎng)可能存在著電磁干擾等,這些對(duì)工程電子文件的獲取和使用都產(chǎn)生了很大的影響[1]。
(2)充分考慮電子文件的實(shí)時(shí)性和綜合性。在施工過(guò)程中,一直需要工程資料的支持,也很有可能因某項(xiàng)新需求,對(duì)工程資料如施工圖紙等,進(jìn)行現(xiàn)場(chǎng)調(diào)研、臨時(shí)變更,工程電子文件實(shí)時(shí)產(chǎn)生,難以預(yù)測(cè)。而且,有時(shí)候需要將整個(gè)工程施工前后相關(guān)的所有資料綜合在一起,進(jìn)行比對(duì),工程電子文件需求量比較大。
3.2 符合電子文件的固有規(guī)律與未來(lái)發(fā)展。(1)在保證使用的情況下,盡量少變化:工程電子文件閱讀設(shè)備固然要以施工的實(shí)際需要為工作核心,但是,在能夠保證文件的讀取速度、清晰度、閱讀效果和使用效果的情況下,盡量不做變動(dòng),少做變動(dòng),尤其盡量做到只改變工程電子文件的存儲(chǔ)格式,而文件的邏輯結(jié)構(gòu)、內(nèi)容關(guān)系保持不變。
(2)便于移植:一般工程都包括建設(shè)、勘察、設(shè)計(jì)、施工、監(jiān)理、檢測(cè)、檢驗(yàn)等幾個(gè)流程,雖然工程電子文件閱讀設(shè)備主要應(yīng)用于施工階段,但其內(nèi)容在施工階段也需要不斷地修改和共享,因此,不管是在不同的單位之間流動(dòng),還是在同單位的不同部門(mén),抑或是同一個(gè)工作點(diǎn)的幾個(gè)終端之間,都要充分考慮其移植性。
(3)便于瀏覽器處理:目前,大多數(shù)工程檔案管理系統(tǒng),都支持局域網(wǎng)結(jié)構(gòu),但是因?yàn)閮?nèi)容原因,支持B/S結(jié)構(gòu)的工程檔案管理系統(tǒng)還不多,即使有,對(duì)在線瀏覽的內(nèi)容和格式也有很大的限制,更多的是對(duì)內(nèi)容的文本提取。但隨著硬件和網(wǎng)絡(luò)技術(shù)的發(fā)展,較為復(fù)雜的工程電子文件支持瀏覽器閱讀必將是一種趨勢(shì),因此,有必要從現(xiàn)在就考慮對(duì)瀏覽器的支持。
(4)便于讀取和識(shí)別:通過(guò)封裝技術(shù)或其他方法,將工程電子文件處理,雖然有利于保密和保證文件的一致性,但卻妨礙了工程電子文件的再處理,而這種再處理,在施工階段是經(jīng)常的,因此,工程電子文件格式應(yīng)該支持?jǐn)?shù)據(jù)較為容易地被讀取和識(shí)別。
3.3 加強(qiáng)協(xié)作間的基礎(chǔ)溝通。工程電子文件是很多個(gè)環(huán)節(jié)、很多個(gè)單位和很多部門(mén)與人員的共同產(chǎn)物,也就是文章第一節(jié)里提到的多源,不管是出于工作習(xí)慣也好,還是保密也好,都應(yīng)該在項(xiàng)目開(kāi)始之前,盡量地規(guī)范在同一個(gè)工程中的電子文件的格式,探討不同軟件之間的兼容,在保證完成工作的基礎(chǔ)之上,選擇兼容性較強(qiáng)的電子文件格式;對(duì)相同的軟件平臺(tái),也通過(guò)升級(jí)或其他方式,確保版本一致或盡量接近。
4.1 工程電子文件獲取模式。根據(jù)工程施工的實(shí)際需要,在工程電子文件的獲取方面,設(shè)計(jì)了三種獲取模式:批量導(dǎo)入按需讀取、臨時(shí)協(xié)作按需共享和實(shí)時(shí)更新按需收集,如圖1所示。
(1)批量導(dǎo)入,按需讀?。哼@種模式主要針對(duì)來(lái)源于外單位的工程電子文件,比如工程單位的要求、設(shè)計(jì)單位的圖紙,也包括各種原材料、成品、半成品、構(gòu)配件、設(shè)備的描述性文件等,在具體的某個(gè)施工點(diǎn),不需要上述的全部材料,只需要直接相關(guān)的即可,因此,采用存儲(chǔ)在項(xiàng)目的總服務(wù)的形式,獲取時(shí),一方面,可以預(yù)先導(dǎo)入到工程現(xiàn)場(chǎng)的服務(wù)器或者主機(jī)上,根據(jù)需要,采用無(wú)線技術(shù)讀取,也可以根據(jù)實(shí)際需要,向工程現(xiàn)場(chǎng)服務(wù)器(主機(jī))提出請(qǐng)求,然后由工程現(xiàn)場(chǎng)服務(wù)器(主機(jī))向項(xiàng)目總服務(wù)器轉(zhuǎn)交請(qǐng)求。在處理上,也由項(xiàng)目總服務(wù)器根據(jù)請(qǐng)求,直接處理完成,便于工程電子文件閱讀設(shè)備讀取。
(2)臨時(shí)協(xié)作,按需共享:臨時(shí)協(xié)作模式考慮的是同一個(gè)工程現(xiàn)場(chǎng)不同施工點(diǎn)的工程電子文件閱讀設(shè)備之間的交互,因?yàn)橥粋€(gè)工程現(xiàn)場(chǎng)的不同施工點(diǎn),工作性質(zhì)大致相同,需要的工程電子文件的內(nèi)容也基本相同,區(qū)別可能是具體施工的細(xì)微要求,比如高架橋不同路段高低的區(qū)別,這些工程電子文件,要求銜接更兼容,失誤更少,速度更快,因此,采用臨時(shí)協(xié)作,按需共享模式,這樣工程電子文件同源更新,減少出錯(cuò)。
(3)實(shí)時(shí)更新,按需收集:這種模式是最底端的工作現(xiàn)場(chǎng),也是工程電子文件直接應(yīng)用的終端,同時(shí)也是工程電子文件改動(dòng)較多的地方,為了符合施工習(xí)慣,也可以在工程小幅圖紙上直接修改,然后通過(guò)手機(jī)更改,在不考慮成本的情況下,也可以由工程電子文件閱讀設(shè)備直接拍照收集數(shù)據(jù)。
4.2 工程電子文件處理技術(shù)。論文設(shè)計(jì)的工程電子文件閱讀設(shè)備的處理技術(shù)包括兼容技術(shù)、識(shí)別技術(shù)和類型轉(zhuǎn)換技術(shù)、局部成像技術(shù)、分層對(duì)比技術(shù)、圖紙追溯技術(shù)和增強(qiáng)現(xiàn)實(shí)技術(shù)。本文只考慮工程電子文件的獲取需要,因此只給出前三種技術(shù)的設(shè)計(jì)方案。如圖2所示。整個(gè)核心部件就是內(nèi)容處理模塊,內(nèi)容處理模塊向布局引擎提供獲取工程電子文件內(nèi)容和屬性統(tǒng)一接口,對(duì)具體的每種工程電子文件,只需要注冊(cè)一個(gè)格式的解析器,注冊(cè)標(biāo)準(zhǔn)內(nèi)容獲取接口即可被解析和顯示。這樣既保證操作接口的統(tǒng)一性,又保證對(duì)各種工程電子文件支持的拓展性[8]。
(1)兼容技術(shù):論文設(shè)計(jì)的工程電子文件閱讀設(shè)備,在兼容技術(shù)上,主要通過(guò)分析現(xiàn)有的工程電子文件的格式,將其納入格式兼容庫(kù)中,當(dāng)有文件讀入時(shí),如果是已經(jīng)有的格式,則根據(jù)原有方案直接處理,如果是新的工程電子文件格式,系統(tǒng)則提醒對(duì)新文件進(jìn)行處理,如果新格式處理難度較大,也可以提交服務(wù)器,由服務(wù)器進(jìn)行處理,并更新格式兼容庫(kù)。
(2)識(shí)別技術(shù):識(shí)別技術(shù)主要針對(duì)的是工程電子文件的內(nèi)容,其工作有兩方面,一個(gè)是識(shí)別工程電子文件的各種屬性,比如時(shí)間、大小、授權(quán)單位、保密級(jí)別、是否可修改等,另外一方面是識(shí)別里面的內(nèi)容,比如字符串、圖形,甚至包括內(nèi)容的顏色,字體大小,格式等。在識(shí)別技術(shù)方面,主要采用的是施工特征識(shí)別,面向的主要是工程圖紙的識(shí)別,難度在于工程圖紙的符號(hào)識(shí)別。不少工程圖紙為更好地顯示,采用了彩色顯示,這也增加了識(shí)別的復(fù)雜性,論文采取背景顏色自動(dòng)獲取的同色塊檢測(cè)法、顏色自動(dòng)獲取的游程長(zhǎng)度分析法[9],解決此方面的難題。
(3)轉(zhuǎn)換技術(shù):轉(zhuǎn)換包括同類型轉(zhuǎn)換技術(shù)和異類型轉(zhuǎn)換技術(shù)。同類型轉(zhuǎn)換技術(shù)指的是同類型的文件的轉(zhuǎn)換,比如,有的圖片文檔是JPEG格式,有的是BMP格式,通過(guò)同類型轉(zhuǎn)換技術(shù),轉(zhuǎn)成相同的格式,從而提高閱讀效果,減少因?yàn)轭愋筒町悓?dǎo)致的偏差,也便于比對(duì)。異類型轉(zhuǎn)換更多時(shí)候是為了提高閱讀的效果,比如局部成像技術(shù),將部分圖紙轉(zhuǎn)化成預(yù)測(cè)的圖像,從而辨別圖紙?jiān)O(shè)計(jì)的效果;另外,平面3D技術(shù)可以讓工程電子文件的閱讀效果更好。
隨著“一帶一路”的全球響應(yīng),中國(guó)基礎(chǔ)建設(shè)已經(jīng)開(kāi)始走出國(guó)門(mén),雅萬(wàn)高鐵、中老鐵路以及比雷埃夫斯港等一大批互聯(lián)互通項(xiàng)目開(kāi)始啟動(dòng),這些項(xiàng)目中的工程電子文件的數(shù)量將更大,負(fù)責(zé)程度將更高。認(rèn)真分析工程電子文件的來(lái)源和特點(diǎn),融合成熟的計(jì)算機(jī)技術(shù),研究工程電子文件的獲取模式與處理技術(shù),將促進(jìn)工程電子文件閱讀設(shè)備的實(shí)效,提高施工效率,減少失誤。
[1]付永華.基于電子紙的工程電子文件閱讀設(shè)備研究與設(shè)計(jì)[J].檔案管理,2014(05):33-35.
[2]劉家真.電子文件的保存、鑒定與存取——澳大利亞電子文件管理策略[J].浙江檔案,2000(03):28-29.
[3]李澤鋒.檔案數(shù)字化的電子格式研究[J].檔案學(xué)研究,2004(05):51-55.
[4]劉詩(shī)德,郭黎.電子出版系統(tǒng)的文件交流[J].今日印刷,1998(05):121-123.
[5]梁凱.檔案部門(mén)應(yīng)用OFD格式的若干思考[J].浙江檔案,2017(01):64.
[6]李澤鋒.基于OAIS的數(shù)字信息格式管理[J].河南科技學(xué)院學(xué)報(bào),2011(09):13-16.
[7]電子文件存儲(chǔ)與交換格式版式文檔(GB/T33190-2016)[S],http://www.sac.gov.cn/
[8]付永華,江源,胡星波.一種面向數(shù)字版權(quán)保護(hù)的EPD電子教材的設(shè)計(jì)與實(shí)現(xiàn).[J].江西科學(xué),2013(1):117-122.
[9]李洋,張曉冬,鮑遠(yuǎn)律.基于特征模板匹配識(shí)別地圖中特殊圖標(biāo)的方法[J].電子測(cè)量與儀器學(xué)報(bào),2012(07):605-609.