国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

珠江三角洲堤圍專題文獻(xiàn)識別方法研究*

2016-04-06 03:05:40劉水養(yǎng)
圖書館論壇 2016年3期
關(guān)鍵詞:珠江三角洲特征詞專屬

劉水養(yǎng)

?

珠江三角洲堤圍專題文獻(xiàn)識別方法研究*

劉水養(yǎng)

摘要探討根據(jù)珠江三角洲堤圍文獻(xiàn)的特征,使用文獻(xiàn)特征詞識別的方法并舉隅,通過文獻(xiàn)特征詞的特征,以計算機(jī)及輔助人工識別的方法,識別、整理和組建珠江三角洲堤圍專題文獻(xiàn)資料信息集。關(guān)鍵詞珠江三角洲堤圍文獻(xiàn)特征詞識別方法

引用本文格式劉水養(yǎng).珠江三角洲堤圍專題文獻(xiàn)識別方法研究[J].圖書館論壇,2016(3):83- 89.

*本文系2014年度佛山市哲學(xué)社會科學(xué)規(guī)劃項目“桑園圍文獻(xiàn)收集與整理”(項目編號:2014-wj20)研究成果之一

A Study of the Recognition Methods for Special Literature on Pearl River Delta Embankment

LIU Shui- yang

Abstract In this paper,word recognition is employed to identify special literature on Pearl River Delta embankment. Using computer aided with manual recognition,an analysis is done on the feature words of the literature,thus,one can identify,organize and set up the database concerning Pearl River Delta embankment.

Keywords Pearl River Delta;embankment literature;feature words;identification method

0引言

珠江三角洲堤圍文獻(xiàn)是指記錄珠江三角洲堤圍相關(guān)情況或直接以珠江三角洲堤圍為研究對象的相關(guān)文獻(xiàn)。珠江三角洲地區(qū)河道縱橫交錯,堤圍眾多。自古以來,珠江三角洲人民就在這塊肥沃的土地上耕作、生息,利用堤或圍的形式與江海爭田、和水作斗。洪水是威脅人類生存和發(fā)展的自然災(zāi)害之一,珠江流域的洪患一直是流域內(nèi)人民的心腹大患。千百年來,建堤筑壩是人們防洪御災(zāi)的重要手段,有的是沿著河流兩岸修筑單向的較大堤防;有的是圈筑閉口的小圍。在珠江三角洲北部和中部地區(qū),在一些已經(jīng)開墾的沖積平原上,以修成堤的形式較多;而汊河和濱海附近地區(qū),包括一些未墾的荒坦,或浮露的水下沙坦,大都是筑成圍的形式[1]。

例如,“桑園圍”是珠江三角洲著名的大型堤圍,位于廣東省南海和順德境內(nèi)珠江干流之一——西江的下游,是西、北江干流主要堤圍,分東、西圍,抵御西、北江洪水。據(jù)《南海縣志》記載,桑園圍在宋代徽宗年間(公元1101—1125 年)始筑東、西堤,4年后再筑吉贊橫基,分別為沙頭中塘圍、龍江河澎圍、桑園圍、甘竹雞分圍。至明、清年間陸續(xù)筑保安圍等14條小圍。順德縣龍江段至民國初期才加高并聯(lián)成圍。1924年增建歌、龍江、獅頷口三座水閘后,成為一條較完整的園圍。桑園圍全長68.85公里,圍內(nèi)面積133.75平方公里。據(jù)1817年《桑園圍志》記載:“南??h屬桑園圍基延袤萬二千余丈,捍護(hù)良田千五百頃,為廣屬中基圍最大者。在清代桑園圍被稱為‘粵東糧命最大之區(qū)。’”[2]隨著傳統(tǒng)農(nóng)業(yè)的日益遠(yuǎn)去,堤圍擔(dān)負(fù)起新的使命,保護(hù)的對象由農(nóng)田變?yōu)楝F(xiàn)代化的城市。堤圍的建設(shè)與城市規(guī)劃融為一體,堤圍發(fā)展既是經(jīng)濟(jì)發(fā)展的保障,又是經(jīng)濟(jì)發(fā)展的標(biāo)志。

珠江三角洲堤圍文獻(xiàn)載錄著歷代豐富的水利堤圍的相關(guān)資料,有著極高的文獻(xiàn)研究與開發(fā)利用價值。但目前的分布、收藏及利用現(xiàn)狀是散亂無序、不成體系且識別困難,不方便查找、開發(fā)研究與利用。若能通過一定的識別方法對其進(jìn)行科學(xué)的歸類、正確的標(biāo)引和組織,形成專題文獻(xiàn),方便查找與檢索,將極大地提高該類文獻(xiàn)的利用價值,而且有利于珠江三角洲堤圍文獻(xiàn)的深度組織和整理,對目前乃至將來珠江三角洲地區(qū)在防汛抗洪、水利建設(shè)、農(nóng)業(yè)生產(chǎn)、經(jīng)濟(jì)發(fā)展、生態(tài)調(diào)節(jié)、社會調(diào)研、文史研究等方面提供更便捷、更精確的專題文獻(xiàn)服務(wù)。目前,珠江三角洲堤圍文獻(xiàn)尚未得到有效的組織和整理,而且也欠缺一套科學(xué)的、系統(tǒng)的專題文獻(xiàn)組織方法。因此,亟需探索一套科學(xué)的專題文獻(xiàn)識別方法,對其進(jìn)行專題識別并形成專題文獻(xiàn)信息集,以便編制專題目錄、索引或提要,以及構(gòu)建專題文獻(xiàn)體系等,使該類型文獻(xiàn)專題化、系統(tǒng)化。

1珠江三角洲堤圍文獻(xiàn)概況

1.1珠江三角洲堤圍文獻(xiàn)的定義及范疇

目前,珠江三角洲堤圍文獻(xiàn)主要分藏于各水利系統(tǒng)及其學(xué)科相關(guān)研究領(lǐng)域,或從屬于廣東水利文獻(xiàn)范疇,或從屬于珠江水利文獻(xiàn)范疇,或從屬于珠江三角洲水利文獻(xiàn)范疇。這類文獻(xiàn)還與農(nóng)業(yè)、經(jīng)濟(jì)、文化、歷史、地理、環(huán)境科學(xué)等學(xué)科領(lǐng)域存在著交叉關(guān)系。這類分布在多個學(xué)科領(lǐng)域、記錄著珠江三角洲堤圍相關(guān)情況的文獻(xiàn)資料都屬于珠江三角洲堤圍文獻(xiàn)。

珠江三角洲堤圍文獻(xiàn)的具體范疇可從三方面來界定:一是文獻(xiàn)的時間范圍。珠江三角洲堤圍文獻(xiàn)不作時間區(qū)間的限定,歷史文獻(xiàn)、現(xiàn)當(dāng)代文獻(xiàn)皆包括在內(nèi)。二是文獻(xiàn)的地域范圍。珠江三角洲堤圍文獻(xiàn)的著述范圍只限于珠江三角洲地區(qū)。三是文獻(xiàn)的內(nèi)容范圍。珠江三角洲堤圍文獻(xiàn)不作內(nèi)容方面的限制,凡文獻(xiàn)主題涉及堤圍的歷史、修筑、治理、勘測、計量、經(jīng)費(fèi)、安全、應(yīng)用技術(shù)、規(guī)劃設(shè)計、工程施工、效益評價以及沙田圍墾、?;~塘等方面的均屬珠江三角洲堤圍文獻(xiàn)的范疇。

1.2珠江三角洲堤圍文獻(xiàn)的類型及收藏現(xiàn)狀

珠江三角洲堤圍文獻(xiàn)類型多樣,有專著、論文、新聞報道、報告、檔案;有水利工程類文獻(xiàn)、農(nóng)業(yè)科學(xué)類文獻(xiàn)、經(jīng)濟(jì)類文獻(xiàn)、文史類文獻(xiàn)、環(huán)境科學(xué)類文獻(xiàn);有資料類文獻(xiàn)、研究類文獻(xiàn);有印刷型文獻(xiàn)、電子型文獻(xiàn)、聲像型文獻(xiàn)、實(shí)物型文獻(xiàn);有歷史文獻(xiàn)、現(xiàn)當(dāng)代文獻(xiàn);有一次文獻(xiàn)、二次文獻(xiàn)和三次文獻(xiàn);有堤圍歷史文化主題文獻(xiàn)、堤圍修筑主題文獻(xiàn)、堤圍治理主題文獻(xiàn)、堤圍測量主題文獻(xiàn)、堤圍規(guī)劃設(shè)計主題文獻(xiàn)等。

目前珠江三角洲堤圍文獻(xiàn)的收藏現(xiàn)狀主要有三:一是分散。散藏于各水利系統(tǒng)的資料檔案室、水利相關(guān)專業(yè)研究室、公共圖書館、大專院校圖書館、博物館、檔案館、文史資料室、數(shù)字資源庫等。二是無序。大都欠缺科學(xué)的分類、標(biāo)引與整理。三是不易識別。一些珠江三角洲堤圍文獻(xiàn)的專業(yè)特征不明顯,需要閱讀相關(guān)文獻(xiàn)的詳細(xì)內(nèi)容才能進(jìn)行揭示和識別。

2珠江三角洲堤圍文獻(xiàn)的特征詞識別法及其流程

2.1識別方法

為了能夠更全面、系統(tǒng)、準(zhǔn)確地收集、整理和揭示珠江三角洲堤圍文獻(xiàn),筆者嘗試通過特定的文獻(xiàn)特征詞識別法,組織珠江三角洲堤圍專題文獻(xiàn)信息集,使其構(gòu)成一個專題,以提高珠江三角洲堤圍文獻(xiàn)的利用價值。

文獻(xiàn)的識別實(shí)質(zhì)上是對文獻(xiàn)特征的識別。通過對珠江三角洲堤圍文獻(xiàn)所具有的文獻(xiàn)特征的識別,搜集、歸納和整理相關(guān)的珠江三角洲堤圍文獻(xiàn)。珠江三角洲堤圍文獻(xiàn)普遍具有專題性和地方性的特征。專題性指的是圍繞珠江三角洲堤圍這個專題;地方性指的是珠江三角洲地域的專有性。專題性特征衍生文獻(xiàn)識別的專指特征詞和專屬特征詞;地方性特征衍生文獻(xiàn)識別的地方特征詞。

對珠江三角洲堤圍文獻(xiàn)進(jìn)行識別可以采取兩種方法:一是計算機(jī)識別,即運(yùn)用計算機(jī)及網(wǎng)絡(luò),以文獻(xiàn)特征詞為檢索詞,從各文獻(xiàn)資源庫檢索珠江三角洲堤圍相關(guān)文獻(xiàn)資料。二是人工識別,即對計算機(jī)識別出來的文獻(xiàn)資料進(jìn)行人工去重、去雜的識別工作。

2.2識別流程

珠江三角洲堤圍文獻(xiàn)特征詞包括專指特征詞、專屬特征詞和地方特征詞。專指特征詞為堤圍的具體名稱,如“北江大堤”“桑園圍”“景福圍”;專屬特征詞為“堤”“圍”及其與堤圍相關(guān)的組詞,如“堤圍”“堤防”“圍墾”;地方特征詞為珠江三角洲地區(qū)的一些行政區(qū)劃名稱和專指地理名稱,如“番禺”“順德”“三水”。

2.2.1計算機(jī)識別的流程

(1)特征詞組配。將專屬特征詞與地方特征詞分別進(jìn)行配對,組配成一組組的特征詞組作為文獻(xiàn)識別的檢索詞,用于文獻(xiàn)識別檢索。需要注意的是:珠江三角洲專指特征詞由于是珠江三角洲地區(qū)專有的原因,不需要地方特征詞進(jìn)行輔助識別,可以省略與地方特征詞進(jìn)行組配的環(huán)節(jié)。

(2)文獻(xiàn)檢索。將專指特征詞或組配好的特征詞組分別在各網(wǎng)絡(luò)文獻(xiàn)資源庫中進(jìn)行單一特征詞檢索或組合式高級檢索,得出文獻(xiàn)檢索結(jié)果。

(3)檢索結(jié)果輯錄。將上述文獻(xiàn)檢索結(jié)果按題名、作者、刊名(出版社)、刊期(出版日期)的信息項進(jìn)行粗略輯錄,組建成計算機(jī)識別文獻(xiàn)資料信息集。

2.2.2人工識別的流程

(1)文獻(xiàn)去重。有些檢索結(jié)果的條目因?qū)V柑卣髟~或?qū)偬卣髟~近似度較高的原因,可能在A檢索的檢索結(jié)果中出現(xiàn),也在B檢索的檢索結(jié)果中出現(xiàn),因此必須將重復(fù)的檢索結(jié)果條目進(jìn)行去重,保留一個相同條目即可。文獻(xiàn)去重的工作也可以視具體情況與上述計算機(jī)識別結(jié)果輯錄的操作同時進(jìn)行。

(2)題名識別。對一些專屬特征詞很明顯通過題名即可確認(rèn)識別的檢索結(jié)果,可在計算機(jī)識別文獻(xiàn)資料信息集中進(jìn)行標(biāo)記保留,以簡化余下操作的文獻(xiàn)數(shù)量。

(3)異類剔除。有些文獻(xiàn)資料明顯不屬于珠江三角洲堤圍專題的范疇,卻又因?yàn)橐恍┨貏e的原因出現(xiàn)在某些檢索結(jié)果當(dāng)中,應(yīng)及時進(jìn)行處理并甄別剔除。

(4)深入識別。通過題名無法直接識別的檢索結(jié)果,必須查看原文,全面深入了解相關(guān)文獻(xiàn)資料的詳細(xì)內(nèi)容進(jìn)行識別。深入了解和識別的部分包括摘要、關(guān)鍵詞、目錄、正文等。

經(jīng)過計算機(jī)識別和人工識別的操作,珠江三角洲堤圍文獻(xiàn)識別的過程就宣告完成,最后一步的工作就是將識別出來的專題文獻(xiàn)進(jìn)行多信息項分類輯錄,所輯錄的文獻(xiàn)信息項應(yīng)包含題名、作者、刊名等更詳盡的信息,最后匯集、整理成為珠江三角洲堤圍專題文獻(xiàn)信息集。

3珠江三角洲堤圍文獻(xiàn)特征詞識別舉隅

3.1特征詞組織

3.1.1專指特征詞組織

珠江三角洲堤圍專指特征詞取自于珠江三角洲堤圍的具體名稱。據(jù)統(tǒng)計,自宋代至民國,珠江三角洲先后修筑大小堤圍500余條(段)[3],因而堤圍的名稱也相應(yīng)的有500余個,但由于年代久遠(yuǎn)和資料缺失的原因,這些古代堤圍在文獻(xiàn)調(diào)研中缺少研究的價值,現(xiàn)存的僅有羅格圍、東江堤和桑園圍適合作為珠江三角洲堤圍專題文獻(xiàn)識別的專指特征詞。這3個古代堤圍名稱與目前廣東省十大堤圍中的北江大堤、佛山大堤、樵桑聯(lián)圍等[4]合計9個堤圍名稱,共同構(gòu)成了珠江三角洲堤圍專題文獻(xiàn)識別的專指特征詞合集(見表1)。除此之外,其它堤圍的零星文獻(xiàn),可通過下文中專屬特征詞“堤”和“圍”進(jìn)行撿漏及識別。

3.1.2專屬特征詞組織

經(jīng)查漢語辭典,以“堤”組詞,與堤圍相關(guān)的詞匯共有17個;以“圍”組詞,與堤圍相關(guān)的詞匯共有1個[5]。因而“堤”、“圍”本身及其堤圍相關(guān)組詞合計約有20個詞匯,構(gòu)成珠江三角洲堤圍專題文獻(xiàn)識別專屬特征詞,為專屬特征詞的基本類型。

圍墾工程和基塘工程曾經(jīng)是清代珠江三角洲三種類型農(nóng)業(yè)工程中的兩種[6],造就了遍布于珠江三角洲平原的大大小小的基圍,因而與沙田圍墾、基塘系統(tǒng)相關(guān)的圍墾、基塘等詞匯同樣應(yīng)列為珠江三角洲堤圍專題文獻(xiàn)識別的專屬特征詞,為專屬特征詞的擴(kuò)展類型。

經(jīng)歸納統(tǒng)計,珠江三角洲堤圍專題文獻(xiàn)專屬特征詞中,基本類型有20個、擴(kuò)展類型有6個,合計26個詞匯,共同構(gòu)成了珠江三角洲堤圍文獻(xiàn)識別的專屬特征詞合集(見表1)。

3.1.3地方特征詞組織

地方特征詞取自于珠江三角洲堤圍文獻(xiàn)的地方性特征,用于區(qū)別文獻(xiàn)的珠江三角洲與非珠江三角洲范圍。本文討論的珠江三角洲地區(qū),是以《珠江三角洲堤圍水利與農(nóng)業(yè)發(fā)展史》中“狹義珠江三角洲”所圈定的15個市縣為依據(jù)[7],原高鶴縣分拆為現(xiàn)高明市和鶴山市;寶安縣為現(xiàn)深圳市轄寶安區(qū)(地處珠江口門)。按此劃分依據(jù),目前珠江三角洲地區(qū)實(shí)際合計應(yīng)有16個市及市轄行政區(qū)。16個市及市轄行政區(qū)名稱加上珠江三角洲、珠三角、珠江、東江、北江、西江等6個專指地理名稱,合計22個詞匯,共同構(gòu)成了珠江三角洲堤圍文獻(xiàn)識別的地方特征詞合集(參見表1)。

3.2計算機(jī)識別

3.2.1專指特征詞文獻(xiàn)識別

(1)文獻(xiàn)檢索。以表1中的9個專指特征詞為檢索詞,分別在中國知網(wǎng)、維普期刊、萬方數(shù)據(jù)、超星、各大圖書館搜索引擎、百度搜索、谷歌搜索等網(wǎng)絡(luò)文獻(xiàn)資源庫中進(jìn)行主題檢索、題名檢索、關(guān)鍵詞檢索、摘要檢索、全文檢索。以特征詞“桑園圍”檢索為例,在中國知網(wǎng)進(jìn)行主題檢索共有13個檢索結(jié)果條目、題名檢索12個、關(guān)鍵詞檢索6個、摘要檢索9個、全文檢索128個;在廣東省立中山圖書館進(jìn)行檢索,檢索結(jié)果有13個條目;在百度進(jìn)行學(xué)術(shù)檢索,檢索結(jié)果有1010個條目(檢索時間:2015年1月30日)。

表1珠江三角洲堤圍文獻(xiàn)特征詞合集表

(2)檢索結(jié)果輯錄。對9個專指特征詞在全部網(wǎng)絡(luò)文獻(xiàn)資源庫的檢索結(jié)果進(jìn)行題名、作者、刊名(出版社)、刊期(出版日期)的輯錄,整理成珠江三角洲堤圍文獻(xiàn)“專指特征詞計算機(jī)識別信息集”,供人工識別之用。

例條目一:題名(磨刀門鶴洲北堤圍施工和新設(shè)想)-作者(簡明新)-刊名(人民珠江)-刊期(1988年05期)[8]

3.2.2“專屬特征詞+地方特征詞”文獻(xiàn)識別

(1)特征詞組配。專屬特征詞必須配以地方特征詞進(jìn)行檢索才能識別是否屬于珠江三角洲的堤圍文獻(xiàn)。特征詞組配的格式為“專屬特征詞+地方特征詞”,例如“堤圍+珠江三角洲”。每個專屬特征詞分別與每一個地方特征詞組配一次,有多少個地方特征詞,該專屬特征詞就有多少個組合檢索式。表1中的地方特征詞有22個,那么專屬特征詞“堤圍”與地方特征詞的組合檢索式就有1x22=22個,分別為“堤圍+番禺”、“堤圍+順德”……“堤圍+西江”等(參看表1地方特征詞排列順序)。

以此類推,表1中專屬特征詞有26個,地方特征詞有22個,則“專屬特征詞+地方特征詞”的組合檢索式總共有26x22=572個,因篇幅關(guān)系不一一羅列。

(2)文獻(xiàn)檢索。將組配好的“專屬特征詞+地方特征詞”組分別在各網(wǎng)絡(luò)文獻(xiàn)資源庫中進(jìn)行主題、題名、關(guān)鍵詞、摘要、全文等高級檢索。以檢索式“堤圍+珠江三角洲”檢索為例,在中國知網(wǎng)進(jìn)行檢索,共得到檢索結(jié)果條目:主題檢索56個、題名檢索10個、關(guān)鍵詞檢索4個、摘要檢索52個、全文檢索2078個;在廣東省立中山圖書館進(jìn)行高級檢索,檢索結(jié)果條目有2個;在百度進(jìn)行學(xué)術(shù)檢索,檢索結(jié)果條目有199個(檢索時間:2015年1月30日)。

(3)檢索結(jié)果輯錄。將“專屬特征詞+地方特征詞”組合識別的檢索結(jié)果進(jìn)行輯錄,其操作方式與專指特征詞檢索結(jié)果輯錄相同,整理成珠江三角洲堤圍文獻(xiàn)“‘專屬特征詞+地方特征詞’計算機(jī)識別信息集”,同樣供人工識別之用。

3.3人工識別

計算機(jī)識別所整理形成的“專指特征詞計算機(jī)識別信息集”和“‘專屬特征詞+地方特征詞’計算機(jī)識別信息集”,并非最終的文獻(xiàn)識別結(jié)果,原因是計算機(jī)識別結(jié)果中會存在較多相同的條目,同時還夾雜著一些與珠江三角洲堤圍專題無關(guān)的文獻(xiàn)資料,因此必須對計算機(jī)的識別結(jié)果進(jìn)行人工識別去重、除雜的工作。

3.3.1文獻(xiàn)去重

在以不同的檢索詞或按不同的檢索條件進(jìn)行檢索識別時,得出的檢索結(jié)果可能會存在條目重復(fù)的情況,需要對計算機(jī)識別中輯錄到的文獻(xiàn)信息集進(jìn)行去重的工作。仍以上述專指特征詞“桑園圍”在中國知網(wǎng)檢索為例,主題檢索結(jié)果條目有13個,題名檢索結(jié)果條目有12個,通過比較,發(fā)現(xiàn)其中12個條目是共同的檢索結(jié)果。因而,對于這兩組檢索結(jié)果,相同的部分只輯錄一次即可。

3.3.2題名識別

有些檢索結(jié)果的條目,文獻(xiàn)的專屬特征比較明顯,僅從題名就能夠很輕易地識別出是否屬于珠江三角洲的堤圍文獻(xiàn),對于這種類型的文獻(xiàn)資料就以專指特征詞識別的檢索結(jié)果條目為主,以及以“專屬特征詞+地方特征詞”識別的一些檢索結(jié)果條目,如《樵桑聯(lián)圍》[9]《番禺地區(qū)堤圍加固設(shè)計》[10]等,經(jīng)過題名識別后將其標(biāo)記保留。

3.3.3異類剔除

繼續(xù)以專指特征詞“桑園圍”在中國知網(wǎng)檢索為例,當(dāng)進(jìn)行全文檢索時,檢索結(jié)果中有一個《桑園養(yǎng)雞》的條目,從題名看更像是一篇討論如何養(yǎng)雞的文章,但查看原文,卻發(fā)現(xiàn)是因?yàn)槲闹杏小捌浞椒ㄊ怯描F絲網(wǎng)把桑園圍起來,將飼養(yǎng)在雞舍里的雞放進(jìn)去”[11]的表述而出現(xiàn)在了“桑園圍”的全文檢索結(jié)果中。很顯然,這個檢索結(jié)果條目不屬于珠江三角洲堤圍的專題類型,應(yīng)予以剔除。

3.3.4深入識別

(1)摘要識別。即通過閱讀摘要進(jìn)行識別,如檢索結(jié)果條目《施工平面控制網(wǎng)的技術(shù)設(shè)計與平差》[12],此文究竟屬不屬于珠江三角洲堤圍文獻(xiàn)?通過瀏覽其摘要,發(fā)現(xiàn)有“以樵桑聯(lián)圍順德達(dá)標(biāo)加固工程第二標(biāo)段(東線勒流段)工程為例闡述了施工控制網(wǎng)的布設(shè)方案”的表述,了解該文是一篇關(guān)于樵桑聯(lián)圍順德段堤圍施工的技術(shù)探討文章,因此,這是一篇能夠通過摘要進(jìn)行識別的珠江三角洲堤圍文獻(xiàn)。

(2)關(guān)鍵詞識別。經(jīng)摘要識別后仍無法確定的文獻(xiàn)資料,可以將識別部位轉(zhuǎn)向關(guān)鍵詞繼續(xù)進(jìn)行識別。如檢索結(jié)果條目《不同地域環(huán)境下的生態(tài)農(nóng)業(yè)模式探討》[13],發(fā)現(xiàn)關(guān)鍵詞中有“珠江三角洲”和“基塘系統(tǒng)”,表明文中必定會涉及珠江三角洲基塘農(nóng)業(yè)模式方面的內(nèi)容,從而確定這是一篇能夠通過關(guān)鍵詞進(jìn)行識別的珠江三角洲堤圍文獻(xiàn)。

(3)目錄識別。目錄識別的對象主要是一些圖書類的文獻(xiàn)資料。如檢索結(jié)果條目《皇帝與祖宗·華南的國家與宗族》[14],從題名看這是一部有關(guān)華南民族文化研究方面的著作,無法判斷是否與珠江三角洲堤圍有關(guān)系,但通過瀏覽該書目錄,發(fā)現(xiàn)第五章的標(biāo)題有“土地”和“堤壩與沙田”的款目,初步斷定與珠江三角洲的堤圍有著密切的關(guān)系。而第十八章標(biāo)題為“桑園圍”,用了整章的篇幅記錄了桑園圍的詳盡情況,從而可以斷定這是一部珠江三角洲堤圍文獻(xiàn)圖書著作。同樣的情況還有如《廣府文化》[15]《廣東文化地理》[16]《在國家與社會之間·明清廣東省里甲賦役制度研究》[17]等。

(4)正文識別。有些文獻(xiàn)資料需要通過閱讀正文內(nèi)容才能識別,這種類型的文獻(xiàn)分為兩種情況:第一種是文獻(xiàn)本身不設(shè)摘要和關(guān)鍵詞;第二種是通過題名、摘要、關(guān)鍵詞尚無法識別,而在正文中能找到相關(guān)珠江三角洲堤圍資料。

第一種情況主要是針對較早期發(fā)表的一些文章,由于各刊物發(fā)文格式的標(biāo)準(zhǔn)要求不一,欠缺摘要、關(guān)鍵詞的標(biāo)識,在無法識別題名的前提下,只能通過閱讀正文的方式進(jìn)行識別,如《珠江三角洲歷代水患與治理概述》[18]。第二種情況則是通過文獻(xiàn)的題名、摘要、關(guān)鍵詞部分仍無法識別,而在正文中又能找到相關(guān)資料的,如《清代兩司行政研究》[19]在第三章第一節(jié)有“布政使的基本掌職——民政——興修事務(wù)的估價和勘查”的表述文字。

(5)多部位組合識別。還有一些文獻(xiàn)資料,通過閱讀其文獻(xiàn)內(nèi)容的單個部位無法確認(rèn)和識別,而需要進(jìn)行文獻(xiàn)內(nèi)容的多部位組合識別,組合的方式有“題名+摘要”“題名+關(guān)鍵詞”“題名+目錄”“題名+正文”“摘要+關(guān)鍵詞”“摘要+正文”“關(guān)鍵詞+正文”等。

如下以“題名+摘要”組合識別為例進(jìn)行說明。如檢索結(jié)果條目為《桑基魚塘,生態(tài)農(nóng)業(yè)的典范》[20],題名中有專屬特征詞“?;~塘”,但因欠缺地方特征詞,無法確定文中所述是否屬于珠江三角洲的桑基魚塘。因?yàn)橐浴吧;~塘”聞名的農(nóng)業(yè)耕作模式雖然主要盛行于珠江三角洲地區(qū),但在長江三角洲中下游地區(qū)也有一些類似的基塘農(nóng)業(yè)模式,同樣也被稱作“?;~塘”[21- 22]。經(jīng)查看原文,瀏覽摘要及部分內(nèi)容,發(fā)現(xiàn)有“本文論述了珠江三角洲?;~塘的歷史演變過程……”的表述,結(jié)合題名,可以斷定這是一篇有關(guān)珠江三角洲堤圍的文獻(xiàn)資料。

3.4珠江三角洲堤圍專題文獻(xiàn)信息集的組織

經(jīng)過計算機(jī)識別和人工識別的操作,檢索結(jié)果中的非珠江三角洲堤圍文獻(xiàn)已基本排除,經(jīng)識別保留的文獻(xiàn)資料具有較高的專題性,可以作為珠江三角洲堤圍專題文獻(xiàn)的最終成果,將這些成果進(jìn)行整理、歸類,組織成為珠江三角洲堤圍專題文獻(xiàn)信息集,每一條文獻(xiàn)所要采集的信息項包括:題名、作者、摘要、關(guān)鍵詞、刊名(出版社)、刊期(出版日期)、作者機(jī)構(gòu)、文獻(xiàn)類型、中圖分類、文獻(xiàn)來源等,盡可能詳盡,以便后續(xù)的文獻(xiàn)計量分析、目錄、索引、提要編制、文獻(xiàn)體系構(gòu)建等文獻(xiàn)的整理及研究工作。

以檢索結(jié)果條目《廣州府“桑園圍”歷史文化價值淺論》[23]為例展示文獻(xiàn)組織的信息項采集流程。

項目一:題名(廣州府“桑園圍”歷史文化價值淺論)

項目二:作者(劉嶺峰)

項目三:摘要(明代中葉,珠江三角洲桑園圍漸漸興起……)

項目四:關(guān)鍵詞(廣州府;桑園圍;歷史文化)

項目五:刊名或出版社(佛山科學(xué)技術(shù)學(xué)院學(xué)報(社會科學(xué)版))

項目六:刊期或出版日期(2011年05期)

項目七:作者機(jī)構(gòu)(佛山科學(xué)技術(shù)學(xué)院)

項目八:文獻(xiàn)類型(論文文獻(xiàn);文史類文獻(xiàn);研究類文獻(xiàn);印刷型、電子型文獻(xiàn);當(dāng)代文獻(xiàn);一次文獻(xiàn);堤圍歷史文化主題文獻(xiàn))

項目十:文獻(xiàn)來源(期刊)……

4 結(jié)語

基于文獻(xiàn)特征的珠江三角洲堤圍專題文獻(xiàn)特征詞的識別方法,其優(yōu)點(diǎn)與不足并存。優(yōu)點(diǎn)是:通過文獻(xiàn)特征詞的計算機(jī)識別和人工識別的操作,基本上可以識別出大部分的珠江三角洲堤圍文獻(xiàn),使同類專題的文獻(xiàn)資料能夠聚類整合,整理形成專題文獻(xiàn)信息集。不足之處是:這種特征詞識別的方法是一種非精確的識別,文獻(xiàn)識別的過程和結(jié)果受人工干預(yù)和影響因素較多,如文獻(xiàn)特征詞的組織更多的是依賴于對“堤”“圍”及其組詞的理解,難免片面和遺漏;人工識別的操作主要依靠手工進(jìn)行,既有可能造成專題文獻(xiàn)的遺漏,也有可能造成無關(guān)文獻(xiàn)出現(xiàn)在識別結(jié)果當(dāng)中,較難達(dá)到精確識別的程度。以文獻(xiàn)特征為依據(jù)的識別法作為專題文獻(xiàn)識別的一種方法,盡管目前還存在一些瑕疵,但仍具有一定的可操作性,在發(fā)現(xiàn)更有效的方法之前,不失為一種嘗試或探索,期待經(jīng)過不斷的實(shí)踐與操作,該識別方法日后不斷得到改進(jìn)和完善,更好地解決類似專題文獻(xiàn)識別的問題。

參考文獻(xiàn)

[1]鄧芬.桑園圍——珠江三角洲最大的堤圍工程[J].農(nóng)業(yè)考古,2006(1):150- 155.

[2]潘斯濂.清設(shè)法籌還提用桑園圍歲修本息銀片[M]//重輯桑園志卷1奏議.

[3][7]趙紹祺,楊智維.珠江三角洲堤圍水利與農(nóng)業(yè)發(fā)展史[M].廣州:廣東人民出版社,2011:94- 138,4.

[4]廣東三防信息網(wǎng).廣東省十大堤圍[EB/OL]. [2015-01- 20].http://www.gd3f.gov.cn/.

[5]倪文杰,張衛(wèi)國,冀小軍.現(xiàn)代漢語辭海[M].北京:中國人民出版社,1994:196,1138.

[6]吳建新,張文方.清代珠江三角洲三種類型的農(nóng)業(yè)工程[J].古今農(nóng)業(yè),2004(2):36- 44.

[8]簡明新.磨刀門鶴洲北堤圍施工和新設(shè)想[J].人民珠江,1988(5):30- 33.

[9]葉林宜.樵桑聯(lián)圍[J].人民珠江,1992(2):18- 19.

[10]蘭金啟.番禺地區(qū)堤圍加固設(shè)計[J].珠江現(xiàn)代建設(shè),2003(4):18- 19.

[11]劉紅.桑園養(yǎng)雞[J].蠶桑通報,1983(3):54- 55,45.

[12]劉思達(dá),黃強(qiáng).施工平面控制網(wǎng)的技術(shù)設(shè)計與平差[J].水利科技與經(jīng)濟(jì),2012(11):29- 30.

[13]何煜.不同地域環(huán)境下的生態(tài)農(nóng)業(yè)模式探討[J].學(xué)術(shù)論壇,2000(5):42- 46.

[14]科大衛(wèi).皇帝與祖宗·華南的國家與宗族[M].卜永堅,譯.南京:江蘇人民出版社,2009:51,253.

[15]陳澤泓.廣府文化[M].廣州:廣東人民出版社,2004:141.

[16]司徒尚紀(jì).廣東文化地理[M].廣州:廣東人民出版社,2001:111.

[17]劉志偉.在國家與社會之間·明清廣東里甲賦役制度研究[M].北京:中國人民大學(xué)出版社,2010:15.

[18]譚漢林.珠江三角洲歷代水患與治理概述[J].人民珠江,1980(1):65- 67.

[19]苗月寧.清代兩司行政研究[D].天津:南開大學(xué),2009.

[20]葉顯恩,周兆晴.?;~塘,生態(tài)農(nóng)業(yè)的典范[J].珠江經(jīng)濟(jì),2008(7):91- 96.

[21]鐘功甫,蔡國雄.我國基(田)塘系統(tǒng)生態(tài)經(jīng)濟(jì)模式:以珠江三角洲和長江三角洲為例[J].生態(tài)經(jīng)濟(jì),1987 (3):15- 20.

[22]徐紅玳.淺析生態(tài)農(nóng)業(yè)——?;~塘[J].蠶桑茶葉通訊,1988(4):12,7.

[23]劉嶺峰.廣州府“桑園圍”歷史文化價值淺論[J].佛山科學(xué)技術(shù)學(xué)院學(xué)報(社會科學(xué)版),2011(5):6- 13.

收稿日期2015- 04- 02

作者簡介劉水養(yǎng),男,碩士,佛山科學(xué)技術(shù)學(xué)院圖書館館員。

中圖分類號項目九:(K878.4:歷史、地理-中國文物考古-遺址-交通、水利遺址)

猜你喜歡
珠江三角洲特征詞專屬
明清珠江三角洲基塘區(qū)的田場與經(jīng)營者
廣州文博(2023年0期)2023-12-21 07:24:30
改革開放后珠江三角洲外來人口政策迭代研究
母女三人的專屬空間
基于改進(jìn)TFIDF算法的郵件分類技術(shù)
解放J7專屬服務(wù)介紹
珠江三角洲口袋公園設(shè)計探究
產(chǎn)品評論文本中特征詞提取及其關(guān)聯(lián)模型構(gòu)建與應(yīng)用
專屬“水晶鞋”
Coco薇(2016年10期)2016-11-29 17:01:36
《珠江三角洲》一課教學(xué)的粗淺嘗試
專屬90后的青春色彩
Coco薇(2015年10期)2015-10-19 12:54:32
张家川| 西盟| 黄骅市| 大石桥市| 体育| 商水县| 奇台县| 宣城市| 石渠县| 营口市| 平舆县| 元谋县| 大同县| 商丘市| 息烽县| 静宁县| 灵寿县| 明光市| 永吉县| 航空| 山东| 泸西县| 高密市| 南和县| 山丹县| 潮安县| 太仆寺旗| 汉沽区| 平果县| 天祝| 上蔡县| 巩留县| 陈巴尔虎旗| 大港区| 普陀区| 忻城县| 北京市| 同江市| 滕州市| 洛宁县| 柳江县|