王 建
(中國經(jīng)濟出版社有限公司,北京 100011)
隨著人們生活水平的提升,旅游熱開始出現(xiàn),致使旅游行業(yè)積累了大量有價值的數(shù)據(jù),如果能加以挖掘和梳理,應(yīng)該可以從中發(fā)現(xiàn)行業(yè)發(fā)展的規(guī)律,指導(dǎo)該行業(yè)更好地發(fā)展??上У氖?,市場上大數(shù)據(jù)主題的圖書很多,但與旅游業(yè)有關(guān)的較少。因為旅游大數(shù)據(jù)的研究需要具備旅游和計算機兩個領(lǐng)域的知識,而這樣的作者比較難找。
黎巎副教授是中國科學(xué)院軟件研究所的博士,大數(shù)據(jù)就是其專業(yè)領(lǐng)域。而目前黎副教授供職于北京聯(lián)合大學(xué)旅游學(xué)院,對旅游行業(yè)研究較深,她的研究領(lǐng)域為旅游客流仿真建模、旅游大數(shù)據(jù)分析與挖掘、信息技術(shù)的旅游應(yīng)用。
除此之外,黎副教授還擔(dān)任國家智慧旅游重點實驗室副主任,以及國內(nèi)外著名旅游學(xué)術(shù)期刊的審稿專家。所以,由黎副教授來撰寫一本與旅游有關(guān)的大數(shù)據(jù)專著,再合適不過。
作為國內(nèi)市場中比較少見的涉及旅游大數(shù)據(jù)的專著,《旅游大數(shù)據(jù)研究》一書多少具有一些奠基性和開創(chuàng)性。因為本書為后續(xù)研究者提供了一個旅游大數(shù)據(jù)研究的體系架構(gòu),便于后來者以此為基礎(chǔ)繼續(xù)深入研究。
在這本專著中,黎副教授首先對旅游大數(shù)據(jù)的概念進(jìn)行了界定;在此基礎(chǔ)上,從旅游文本大數(shù)據(jù)、游客移動大數(shù)據(jù)、游客搜索大數(shù)據(jù)、旅游大數(shù)據(jù)標(biāo)準(zhǔn)四個方面進(jìn)行了深入研究,并介紹了所用的研究框架、方法和案例等,所選內(nèi)容和案例比較切合實際,有一定指導(dǎo)意義。對于后來者來說,本書比較全面地介紹了旅游大數(shù)據(jù)研究的主流工具及其使用方法,以及作者自己整理的兩個規(guī)范性文件——《文化旅游資源興趣點(POI)及道路采集規(guī)范》《文化旅游資源數(shù)據(jù)描述規(guī)范》。結(jié)合上述內(nèi)容,本書可以說將旅游大數(shù)據(jù)的研究帶入了體系化、規(guī)范化、工具化的軌道中。
書稿的總體質(zhì)量不錯,內(nèi)容比較全面,結(jié)構(gòu)較為完整。但細(xì)節(jié)性的小問題較多,有些段落行文不太流暢,意思表達(dá)不夠清楚,這些問題需要作者根據(jù)編輯的提示加以處理。有些細(xì)節(jié)問題由編輯在正文中直接修改,比如兩項的乘積數(shù)值錯誤,公式中字母的大小寫和正斜體誤用,英文單詞首字母大寫不統(tǒng)一,國家部委的名稱未更新等。有些細(xì)節(jié)問題的修改需要與作者溝通,以防編輯曲解作者原意。
有些問題,編輯認(rèn)為在自己的能力范圍之內(nèi),直接加以修改,當(dāng)然也需要作者最終加以審核。
1.層級不清。某些阿拉伯?dāng)?shù)字后面,有時是標(biāo)題,有時是句子。為此,特地重新設(shè)置全稿的層級為5個:第一層級是章名,作為標(biāo)題放入目錄;第二層級是節(jié)名,作為標(biāo)題放入目錄;第三層級,使用漢字?jǐn)?shù)字“一”,作為標(biāo)題,但不放入目錄;第四層級,使用漢字?jǐn)?shù)字“(一)”,作為標(biāo)題但不放入目錄;第五層級,使用阿拉伯?dāng)?shù)字“1”,作為標(biāo)題但不放入目錄。
2.英文單詞拼寫不規(guī)范,或者縮寫詞與原詞不符。正文中出現(xiàn)的英文單詞,首字母有時大寫,有時小寫,需要統(tǒng)一成首字母大寫的形式。比如:“Computing community consortium”應(yīng)該為“Computing Community Consortium”??s寫詞與原詞不符,比如“用戶創(chuàng)造內(nèi)容(User-Created Content,UCG)”,應(yīng)該為“用戶創(chuàng)造內(nèi)容(User-Created Content ,UCC)”。
3.使用某些已經(jīng)不存在的國家部委的名稱。對于2018年國務(wù)院機構(gòu)改革中不再保留的部委的名稱,使用時需要加上“原”字。比如“環(huán)保部、國土資源部、國家林業(yè)局、農(nóng)業(yè)部”,應(yīng)該改為“原環(huán)保部、原國土資源部、原國家林業(yè)局、原農(nóng)業(yè)部”。
4.有些著名組織的英文名字拼寫有誤。比如“世界經(jīng)濟合作與發(fā)展組織(The Organisation for Economic Co-operation and Development,OECD)”,應(yīng)該為“世界經(jīng)濟合作與發(fā)展組織(Organization for Economic Co-operation and Development,OECD)”。
5.出現(xiàn)錯別字。比如“從而按照區(qū)域曬選”中的“曬選”,應(yīng)該為“篩選”;比如“本書選取正負(fù)情感預(yù)料各2000篇”中的“預(yù)料”,應(yīng)該為“語料”。
6.兩項數(shù)字的乘積有誤。比如“語料至527頁,每頁20條短評,共計11323條評論”,527與20的乘積應(yīng)該為10540,而不是11323。
7.公式中的字母拼寫形式有誤。在一個公式中,同一個字母同時出現(xiàn)了大小寫和正斜體形式。比如下面的公式:
式中,p(Cj)中的Cj,大寫和小寫兩種形式同時出現(xiàn),且其正體和斜體也是兩種形式同時出現(xiàn),需要統(tǒng)一為大寫和斜體。改后的公式應(yīng)該為:
8.表序重復(fù)出現(xiàn)。比如“表2-1”重復(fù)出現(xiàn),經(jīng)排查,把第二個改為“表2-2”。
9.圖形中的文字出現(xiàn)壓線問題。原圖如下:
修改后的圖形如下:
10.圖中曲線多于1條時,沒有標(biāo)明各條曲線的名稱。比如如下的原圖:
經(jīng)修改后,變?yōu)椋?/p>
11.段落中句子的層次不清楚。比如:“首先能夠?qū)B續(xù)詞序列進(jìn)行合理切分;接著能夠?qū)⒚總€分詞結(jié)果標(biāo)注為相應(yīng)的詞性;可以分析出句子中包含的語法結(jié)構(gòu)并進(jìn)行相應(yīng)標(biāo)注的同時能夠識別并判讀詞語在所包含句子中承擔(dān)的語義角色即施事者還是受事者等?!卑凑赵摼渥拥木湟夂蜆?biāo)點符號(出現(xiàn)分號)推測,出現(xiàn)的問題有:“首先”之后應(yīng)該是“其次”和“最后”;部分句子的主語缺失;最后一句話的句子有些長,該斷句的地方?jīng)]有斷開。修改后的句子變?yōu)椋骸笆紫?,LTP能夠?qū)B續(xù)詞序列進(jìn)行合理切分;其次,它能夠?qū)⒚總€分詞結(jié)果標(biāo)注為相應(yīng)的詞性;最后,它可以分析出句子中包含的語法結(jié)構(gòu)并進(jìn)行相應(yīng)標(biāo)注,同時能夠識別并判讀詞語在所包含句子中承擔(dān)的語義角色,即施事者還是受事者等?!?/p>
由于書稿涉及旅游與大數(shù)據(jù)兩個行業(yè),很多內(nèi)容編輯把握不準(zhǔn)。所以,編輯常常通過微信和電子郵件與黎副教授溝通,向其請教。有時為了一個問題,黎副教授會花費較長時間重新查閱資料。
1.書名號是否該加。比如“中國游客滿意度調(diào)查展示了國內(nèi)游客滿意度……”,該句話明顯表述有問題,通過與黎副教授溝通,得知“中國游客滿意度調(diào)查”是一個調(diào)查報告,故本句話最終改為“《中國游客滿意度調(diào)查》展示了國內(nèi)游客滿意度……”。
2.有些表述無從下手修改。比如“互聯(lián)網(wǎng)行、點擊、查詢等行為數(shù)據(jù)”,該句話明顯句意不通,遂在批示中指出這一點,最后黎副教授修改為“互聯(lián)網(wǎng)瀏覽、點擊、查詢等行為數(shù)據(jù)”。
3.對于變量的探討。比如下面的公式中的“idf(t)”,對于中間的“d”是變量還是微分符號很難看直觀分辨清楚;并且,如果“d”是微分符號的話,還需要把它改為正體。與黎副教授溝通后得知,“idf”是一個不可分割的整體,還是個變量名,需要寫成斜體形式。
4.數(shù)字類表格中出現(xiàn)短橫線。數(shù)字類表格中出現(xiàn)短橫線“-”,這是不規(guī)范的用法。因為在規(guī)范的圖表中,只會出現(xiàn)空白或一字線“—”。其中,“空白”表示無此項;“—”表示未發(fā)現(xiàn)。在與黎副教授講明規(guī)則后,由其選擇規(guī)范的用法。
在修改正文過程中,編輯難免會曲解句意。比如“通過數(shù)據(jù)預(yù)處理,基于LDA的主題分類,最終給出三大網(wǎng)站的故宮游客評論的主題類別”這句話,編輯在“通過數(shù)據(jù)預(yù)處理”后面加上了“方式”兩字,變成了“通過數(shù)據(jù)預(yù)處理方式”;但黎副教授指出預(yù)處理是一個步驟,不是一個方式,需要把誤加上的“方式”兩字刪除。
對于“(一)編輯直接修改的細(xì)節(jié)性問題”中的內(nèi)容,編輯雖然感覺修改正確,但難免有失誤之處,需要復(fù)審、終審進(jìn)行把關(guān),尤其是涉及公式和計算機程序方面的內(nèi)容,還需要復(fù)審仔細(xì)審核。