趙勝男 孟祥鳳 何朝輝 潘守東
(同方知網(wǎng)數(shù)字出版技術(shù)股份有限公司,北京100084)
基于XML的動(dòng)態(tài)重組技術(shù)在絲路文化旅游網(wǎng)中的應(yīng)用*
趙勝男 孟祥鳳 何朝輝 潘守東
(同方知網(wǎng)數(shù)字出版技術(shù)股份有限公司,北京100084)
絲綢之路作為古代東西方政治、經(jīng)濟(jì)、文化交流的重要橋梁,代表著我國古代文明鼎盛時(shí)期的文化,開發(fā)絲路旅游對于促進(jìn)絲綢之路經(jīng)濟(jì)帶建設(shè)具有十分重要的意義。作為國家科技支撐項(xiàng)目,建設(shè)絲路文化旅游網(wǎng)可以有效整合絲路沿線的旅游資源和文化信息,利用“互聯(lián)網(wǎng)+文化旅游”的設(shè)計(jì)理念,通過動(dòng)態(tài)重組技術(shù)實(shí)現(xiàn)不同相關(guān)信息的動(dòng)態(tài)聚合與重組,根據(jù)每個(gè)游客的偏好、預(yù)算、時(shí)間,綜合運(yùn)用多維導(dǎo)航、數(shù)據(jù)挖掘等技術(shù),為游客提供智能化、個(gè)性化的旅游行程規(guī)劃服務(wù)和精準(zhǔn)的旅游信息服務(wù),提高游客的滿意度,加快絲路文化的傳播和發(fā)揚(yáng),促進(jìn)當(dāng)?shù)氐慕?jīng)濟(jì)發(fā)展。
絲綢之路;文化旅游;動(dòng)態(tài)重組技術(shù)
隨著經(jīng)濟(jì)的飛速發(fā)展,人們對生活質(zhì)量的要求也不斷提升,旅游已經(jīng)可以稱為是全民運(yùn)動(dòng)的一種炙手可熱的休閑娛樂方式。在旅游中品味傳統(tǒng)文化,尋求文化享受,已成為當(dāng)前旅游者的一種風(fēng)尚,文化旅游也隨之興起,其中絲路沿線的文化旅游更是炙手可熱。絲綢之路是連接中國腹地的陸上商業(yè)貿(mào)易通道,是一條東方與西方之間經(jīng)濟(jì)、政治、文化進(jìn)行交流的主要道路,代表著我國古代文明鼎盛時(shí)期的秦、漢、唐、宋輝煌燦爛的文化。特別是隨著“一路一帶”戰(zhàn)略的提出,大量的資源將投入到絲綢之路沿線各地,人們對絲綢之路沿線的人文景點(diǎn)、自然風(fēng)光、文化藝術(shù)、歷史傳說表現(xiàn)出越來越濃厚的興趣。
應(yīng)用“互聯(lián)網(wǎng)+文化旅游”的設(shè)計(jì)理念,搭建絲路文化旅游網(wǎng),整合絲路沿線的各種旅游資源和文化信息,為游客提供吃、住、行、游、購、娛一站式的絲路文化旅游服務(wù)。傳統(tǒng)的旅游信息資源獲取方式已經(jīng)不能滿足需求快速更新的時(shí)代要求了,而快速、準(zhǔn)確、個(gè)性化的信息服務(wù)是受眾群體所關(guān)注的,那么就需要從根本——內(nèi)容組織上來入手,將內(nèi)容碎片化再按需定制,從而實(shí)現(xiàn)“內(nèi)容碎了,信息活了”。
本文主要是研究如何給用戶建立一個(gè)自主規(guī)劃旅游線路的服務(wù)平臺,基于XML技術(shù)對旅游產(chǎn)品進(jìn)行碎片化加工,充分利用自動(dòng)分類、數(shù)據(jù)挖掘、多維導(dǎo)航、信息關(guān)聯(lián)、相似性分析等關(guān)鍵技術(shù),用戶可以根據(jù)自己的偏好、人數(shù)、主題、時(shí)長、費(fèi)用等各種情況,實(shí)現(xiàn)旅游產(chǎn)品和旅游線路的動(dòng)態(tài)重組,制定出適合自身需求的絲路文化旅游行程。①
使用動(dòng)態(tài)重組技術(shù)對旅游產(chǎn)品和旅游線路根據(jù)要求進(jìn)行重新組合,首先需要將旅游產(chǎn)品進(jìn)行碎片化加工,將旅游產(chǎn)品的各種關(guān)鍵信息進(jìn)行標(biāo)引,通過XML進(jìn)行描述和存儲,根據(jù)用戶提供的信息,采用合適的策略和算法,自動(dòng)生成滿足用戶需求的旅游線路。
(一)碎片化處理
在絲路文化旅游網(wǎng)中,我們選擇XML進(jìn)行旅游產(chǎn)品的描述和存儲,以XML schema作為可擴(kuò)展標(biāo)記語言架構(gòu)。XML表達(dá)方式簡潔、易懂、使用方式簡單,當(dāng)文檔結(jié)構(gòu)符合XML schema時(shí),即可以輕松添加、編輯、擴(kuò)展、定義語句,同DTD等其他相比可以容易的描述文檔內(nèi)容、驗(yàn)證數(shù)據(jù)的正確性。②
將旅游產(chǎn)品進(jìn)行結(jié)構(gòu)分析,按指定的粒度進(jìn)行拆分、標(biāo)引,輸出基于XML的結(jié)構(gòu)化數(shù)據(jù),作為絲路旅游網(wǎng)行程規(guī)劃動(dòng)態(tài)重組的基礎(chǔ)需求。在絲路文化旅游網(wǎng)中,定義旅游產(chǎn)品為travel.xml,其結(jié)構(gòu)如下:③
(二)動(dòng)態(tài)重組算法與策略
重組是內(nèi)容動(dòng)態(tài)重組中的核心環(huán)節(jié),是用戶體驗(yàn)好壞的關(guān)鍵。在本課題中,動(dòng)態(tài)重組采用的算法包括貝葉斯算法、遺傳算法、決策樹算法和統(tǒng)計(jì)分析方法。
用戶發(fā)出重組請求后,重組驅(qū)動(dòng)將主題、詞表與本體選擇的信息發(fā)給知識提取模塊,該模塊提取出相關(guān)知識集合。接下來,重組驅(qū)動(dòng)利用該知識集合,結(jié)合重組策略,提取出匹配的素材。重組驅(qū)動(dòng)利用重組策略、素材和產(chǎn)品模板,制作出重組產(chǎn)品,將其返回給用戶。
絲路文化旅游網(wǎng)依照游客的需求,通過碎片化處理以及動(dòng)態(tài)重組等技術(shù)為游客制定了兩種路線規(guī)劃模式,一種為經(jīng)典路線規(guī)劃模式,根據(jù)用戶的喜愛程度、景點(diǎn)的知名程度、游客的習(xí)慣程度、以及網(wǎng)絡(luò)信息被瀏覽程度等多方面條件信息,提供若干條經(jīng)典路線供游客選擇。另外一種為自選路線規(guī)劃模式,游客在自助行程規(guī)劃平臺選擇時(shí)間、費(fèi)用、參觀的景點(diǎn)、使用的交通工具等個(gè)性化信息,系統(tǒng)自動(dòng)生成復(fù)合游客需求的行程規(guī)劃。
經(jīng)典路線規(guī)劃絲路文化旅游網(wǎng)收集整理經(jīng)典的絲路旅游路線,根據(jù)旅游的主題、地點(diǎn)、時(shí)長、交通工具、評價(jià)等多個(gè)維度進(jìn)行分類整理,建立經(jīng)典旅游路線知識庫。并引入旅游產(chǎn)品評價(jià)機(jī)制,對于好評的自助線路,也納入到經(jīng)典路線中去。
文化旅游是一個(gè)重點(diǎn),根據(jù)文化主題,提供經(jīng)典的絲綢之路旅游線路。目前確定的文化主題包括絲路精品線路游、絲路佛教圣跡游、絲路古道探險(xiǎn)游、絲路民族風(fēng)情游、絲路自然風(fēng)光游、絲路墓葬文化游、絲路天山廊道故城游等。④
經(jīng)典路線運(yùn)行效果如下:
在自助行程規(guī)劃平臺,游客可以依照自己的喜好自主制定旅游路線。在自主行程規(guī)劃過程中,游客在網(wǎng)站選出自己預(yù)計(jì)到達(dá)的地點(diǎn),網(wǎng)站會自動(dòng)顯示該地點(diǎn)的詳細(xì)介紹、地理位置、景點(diǎn)開銷、風(fēng)俗人情、知名景點(diǎn)、民間傳說、注意事項(xiàng)等相關(guān)信息。同時(shí),會為游客提供衣食住行上的選擇,包含交通、酒店、知名美食及飯店、購物場所、門票等關(guān)聯(lián)信息,供游客選擇,系統(tǒng)自動(dòng)生成復(fù)合游客需求的行程規(guī)劃。
自助路線規(guī)劃的運(yùn)行流程如下:
在自助行程規(guī)劃平臺,游客指定的信息,以動(dòng)態(tài)重組的形式呈現(xiàn)。當(dāng)用戶進(jìn)入選擇過程中,每當(dāng)選擇一項(xiàng)行程時(shí),系統(tǒng)會在指定的數(shù)據(jù)庫中分別查詢該地區(qū)的所有信息,包含了交通、酒店、美食、景點(diǎn)等一系列信息,并且以分類方式重新組合供用戶選擇,用戶不斷選擇,系統(tǒng)則不斷進(jìn)行查詢,再重組。當(dāng)完成選擇后,自助行程規(guī)劃將自動(dòng)生成最復(fù)合游客需求的行程規(guī)劃。⑤
絲路網(wǎng)行程規(guī)劃通過動(dòng)態(tài)重組的方法大幅度降低了自選路線規(guī)劃的復(fù)雜度,游客可以自由選擇景點(diǎn)、交通工具、酒店和特色美食,省去了很多重復(fù)、冗余的操作,極大提高了路線規(guī)劃效率。
自助路線規(guī)劃的運(yùn)行效果如下:
(一)碎片化標(biāo)引
不同類型的資源其采集、加工和處理的流程不同,大多數(shù)資源都是基于XML來表達(dá),每類數(shù)據(jù)都有自己的元數(shù)據(jù)標(biāo)準(zhǔn)schema,所以本功能模塊主要是對各類數(shù)字資源按元數(shù)據(jù)標(biāo)引進(jìn)行編目和標(biāo)引。
碎片化加工是根據(jù)標(biāo)準(zhǔn)的物理結(jié)構(gòu),按章節(jié)目錄或知識點(diǎn)進(jìn)行拆分,將文件進(jìn)行結(jié)構(gòu)分析、拆分、標(biāo)引,處理目錄、章節(jié)、圖片、表格、公式、上下標(biāo)、注解、段落、版心、頁碼、元數(shù)據(jù)、補(bǔ)字等等,然后保存成XML格式。
碎片化加工可以支持自動(dòng)拆分,系統(tǒng)通過版面分析技術(shù)結(jié)合標(biāo)準(zhǔn)本身的目錄結(jié)構(gòu)自動(dòng)拆分。加工人員可以對自動(dòng)拆分的結(jié)果進(jìn)行修改。
(二)多維導(dǎo)航
按資源類型、按專業(yè)分類、按時(shí)間等多種不同的維護(hù)對系統(tǒng)中所有的資源進(jìn)行分類導(dǎo)航,方便用戶按不同分類維度查找想要的資源。在絲路文化旅游網(wǎng)中,支持的導(dǎo)航方式包括:
(三)數(shù)據(jù)挖掘
通用關(guān)聯(lián)規(guī)則分析有效地發(fā)現(xiàn)大量的數(shù)據(jù)間隱匿的關(guān)聯(lián)關(guān)系,深入挖掘知識。使用關(guān)聯(lián)規(guī)則分析可以由系統(tǒng)自動(dòng)推薦主題詞或者分類規(guī)則。在元數(shù)據(jù)標(biāo)引的基礎(chǔ)上,對同構(gòu)和異構(gòu)數(shù)據(jù)進(jìn)行挖掘分析,挖掘各類資源之間存在的關(guān)聯(lián)信息,建立網(wǎng)狀體系,更好地提供相互導(dǎo)航和關(guān)聯(lián)服務(wù)。
(四)智能檢索
采用智能檢索技術(shù),對旅游產(chǎn)品進(jìn)行多種索引,實(shí)現(xiàn)多維度的檢索,支持的檢索功能包括一站式的統(tǒng)一檢索、支持與或非多關(guān)鍵詞的組合檢索、針對全文的全文檢索和對關(guān)鍵詞的智能提示。
本文結(jié)合碎片化標(biāo)引、信息關(guān)聯(lián)等方法,提出了一種面向絲綢之路旅游行程規(guī)劃問題的動(dòng)態(tài)重組的方法。通過動(dòng)態(tài)重組的方法可以將路程規(guī)劃信息按用戶提出的需求以動(dòng)態(tài)的形式將所有相關(guān)信息分門別類的呈現(xiàn)在游客面前,給予游客方便快捷、更人性化的展示方式,在絲路文化旅游網(wǎng)上自動(dòng)根據(jù)用戶需求生成旅游行程,有效解決了文化旅游行程規(guī)劃中無法滿足個(gè)性化需求的問題,具有非常高的使用價(jià)值。與此同時(shí),通過開展絲綢之路行程規(guī)劃的研究,為用戶營造了賞心悅目的網(wǎng)絡(luò)文化空間,積極有效地促進(jìn)了絲綢之路文化旅游建設(shè)。
通過對文化旅游產(chǎn)品的研究,實(shí)現(xiàn)了絲路文化旅游網(wǎng)為旅客提供一站式、全流程、立體化服務(wù)的目標(biāo)??梢詽M足游客對絲路文化旅游產(chǎn)品的需求,大幅度提高了絲綢之路路線的客流量,增加了絲路文化旅游網(wǎng)游客的閱覽次數(shù),加速提高了周邊城市建設(shè)和經(jīng)濟(jì)發(fā)展。通過基于動(dòng)態(tài)重組技術(shù)在絲路文化網(wǎng)中向用戶提供路線規(guī)劃行程服務(wù),為用戶提供時(shí)間、空間、文化于一體的智能化旅游服務(wù)。
[注釋]
①謝瑤:《戈壁綠洲上的瑰寶——敦煌壁畫》,《當(dāng)代藝術(shù)》,2012年第3期。
②程麗玲、譚軍:《百色市紅色旅游景點(diǎn)信息的XML描述實(shí)現(xiàn)》,《價(jià)值工程》,2012年第34期。
③吳鳳娟:《基于XML網(wǎng)上學(xué)習(xí)系統(tǒng)的研究及實(shí)現(xiàn)》,《湖州師范學(xué)院學(xué)報(bào)》,2007年第2期。
④樊錦詩:《橫亙在文明交融中的莫高窟》,《光明日報(bào)》,2010年2月5日。
⑤林?。?《智能旅游行程規(guī)劃系統(tǒng)研究》,北京郵電大學(xué)碩士論文,2010年。
G122
A
1005-3115(2015)20-0060-03
*本文為國家科技支撐計(jì)劃課題“基于文化遺產(chǎn)資源的文化旅游互聯(lián)網(wǎng)綜合服務(wù)支撐系統(tǒng)”(2012BAH43F04)階段性成果。