朱海燕
(安徽大學管理學院,安徽 合肥 230601)
朱海燕 女,1988年生,2010級圖書館學研究生。
隨著計算機技術的迅猛發(fā)展,網上信息急劇增長。面對海量無序、內容繁雜的網絡信息,如何對其有效地進行組織,成為網絡信息使用者關注的重點。在目前網絡環(huán)境下,采用分類法進行信息組織主要有兩種方式:一是人工標引方式的傳統(tǒng)文獻分類法,二是以人工標引或自動標引方式采用自編的網絡信息分類法[1],如搜狐網。筆者以搜狐網和《中圖法》為例,對網絡信息資源分類法與傳統(tǒng)文獻分類法進行比較,并分析其特點,指出其不足及完善之方法。
網絡信息分類法是按主題為中心或按主題與科學相結合為立類原則,從方便用戶使用的角度出發(fā),采用自然語言來命名類目。通過層層劃分,逐級展開類目。例如,搜狐網根據網站的主題,首先把網站分為18大類,再按細分主題層層分下去,從而形成一個“樹技狀”分類結構,再根據不同用戶的使用習慣,以及不同的分類方式,把不同類目下“相關”的類目“鏈接”起來,從而形成搜狐的“網狀”分類體系。其中以主題分類為主設立了娛樂休閑、新聞媒體、工商經濟、公司企業(yè)、電腦網絡、教育培訓、文學、藝術、體育健身、衛(wèi)生健康、科學技術、生活服務、旅游交通、社會文化、政法軍事、社會科學、個人主頁17個大類[2],另外結合分面組配的方法設立國家與地區(qū),把其他17個大類下的所有網站又按所屬地域進行分類。
傳統(tǒng)文獻分類法是等級列舉式結構的分類體系,以學科和邏輯劃分為標準展開嚴密而深細的類目劃分,并以高度規(guī)范化的代碼和語詞為標識來揭示和組織信息,用等級體系以及參照、注釋、互見、交替等方法來直接顯示類目之間的知識關聯,比較全面客觀地反映了知識全貌及其內在的邏輯關系[3]。如《中圖法》以自然科學、社會科學、哲學作為人類知識領域的基本構成建立基本序列,并將作為社會主義分類法編制指導思想的“馬克思主義、列寧主義、毛澤東思想、鄧小平理論”和結合文獻特殊性設置的“綜合性圖書”作為部類,形成5個部類的基本序列,22個基本大類。其中按學科立類的有17個,按主題立類的只有5個:A馬克思主義、列寧主義、毛澤東思想、鄧小平理論;T工業(yè)技術;U交通運輸;V航空、航天;Z綜合性圖書。
網絡信息分類系統(tǒng)分類標準較傳統(tǒng)分類法更加多元化。它采用以主題為中心或者主題與學科相結合的兩種方式立類,類目之間邏輯關系不夠嚴密,不需要以標記符號來表示類目之間的關系,主觀上不存在分類標準的使用數量問題,客觀上每一等級的劃分都使用了多重分類標準,劃分后子類之間的內涵是相互交叉的。例如在搜狐網的新聞大類中,將其劃分為國內、國際、社會、軍事、財經、IT、體育、娛樂、教育、文化、旅游、健康等這些二級類目。其中,國內、國際是根據新聞發(fā)生的地點進行的劃分;軍事、體育是按照學科進行的劃分;娛樂、財經等是根據主題進行的劃分。而在國際和國內新聞中也包括有軍事、財經、娛樂等多種類型的新聞,財經、娛樂等也囊括有國內和國際的新聞。因此,其各子類之間的內涵是相互交叉的。
傳統(tǒng)文獻分類法是將知識的學科范疇屬性層層劃分,以代碼為標識對信息分門別類地予以揭示和組織成系統(tǒng)。在分類標準的使用數量上,一般要求一次劃分采用一個分類標準,必要時再采用兩個或兩個以上標準。如《中圖法》主要是從科學分類和知識分類的角度來解釋文獻內容的區(qū)別與聯系,按學科和專業(yè)集中文獻,提供從學科和專業(yè)角度檢索文獻的途徑,如I24小說,就是按照小說的題材,將其劃分為革命斗爭小說、軍事小說、史傳小說、經濟政治小說、科學科幻小說、驚險推理小說、社會言情小說等。
網絡信息分類法采用的類目名稱比較隨意,多采用自然語言命名類目,旨在便于用戶理解和使用。不少類目名稱不夠科學,沒有準確地表達類目的內涵和外延,多是網民常見的俗稱、簡稱、習慣用語。
傳統(tǒng)文獻分類法所使用的類目名稱能夠確切表達類目的實際內容范圍,內涵、外延清楚,通常采用科學、規(guī)范、通用、穩(wěn)定性高的術語或譯名。如《中圖法》一級類目中的“政治法律”、“軍事”、“經濟”、“文學”、“藝術”等,讓用戶能夠清楚明了地知道各大類的主要內容。
網絡分類法類目展開主要是結合超文本技術的應用,采取多維結構,從多個角度設置類目、展開類目體系。如搜狐網提供了從地區(qū)和資源類型角度的檢索入口,是一種不同于傳統(tǒng)線性序列的網狀結構,從不同角度對主題關系進行揭示。如檢索娛樂方面的信息,可以從國內、國外地區(qū)開始檢索,同時也可以從電影、電視、音樂、戲劇等多個角度進行精確全面的檢索。搜狐網中,對于子類目同屬于幾個大類的類目,使用鏈接方式,將其在相應類下重復反映,使其同時成為有關類目的有機組成部分。如搜狐網中新聞、體育等大類中都包含國內、國外二級類目,都在其大類下列出。
傳統(tǒng)文獻分類法類目展開基本上采用線性序列。如《中圖法》分類體系中采用的是從屬關系、并列關系、交替關系和相關關系4種關系類型。從屬關系、并列關系是類目體系展開的主要線索,反映了類目的縱向聯系;交替類、類目參照則是對類目體系主要關系的補充,揭示被類目體系分散了的橫向聯系。通過二者的結合,文獻分類法按照類目之間的關系建立起了縱橫交叉、嚴密而又實用的分類體系。
類目交叉關系的處理是指涉及多個學科或主題的類目在不同學科或主題下的揭示和反映。網絡信息分類系統(tǒng)對類目交叉關系的處理采用類目重復反映的方法,也就是涉及多個學科的主題在多個類目下重復設置。如搜狐網中“體育”、“財經”等既作為一級類目,同時又是“新聞”中的二級類目。
傳統(tǒng)文獻分類法對類目交叉關系的處理有3種手段:一種是設置交替類目。對于與兩個學科有關、可以隸屬于兩個科學部門的學科或類目,根據需要將一個類目設為正式類目,將另一個類目設為供選擇使用的交替類目。其次是作注釋說明。對于一類事物的總論和分論,一般在總論的類目下說明“總論入此,專論入有關各類”,或注明總論與分論的關系。第三是設參見項。對具有交叉關系的兩個類目,互設參見?!吨袌D法》運用組配技術主要有3個方面:一是編制各種類型的復分表,作為全表或某個局部組配復分的依據;二是采用部分類目仿照已列出的類目進行細分;三是主類號之間使用冒號直接組配,合成新主題。
網絡信息分類方法是直接面向用戶的,沒有注釋,類目間的橫向聯系采用交叉列類,類目的內容注釋則以有選擇的列舉下位類方式為主,便于鏈接[4]。在搜狐網中可以在主頁中看到各大類,然后直接選擇各大類進入新頁面,進行下一步選擇。
傳統(tǒng)分類法的類目注釋是標引人員的重要參考,也是讀者使用分類目錄的參考。除了說明類目含義的注釋外,還有大量的歸類方法注釋、組號方法注釋、參照注釋等。
網絡分類搜索引擎能提供多個檢索入口,適應各種類型終端用戶的需要。它不同于傳統(tǒng)分類法的線性結構,網絡信息分類法從多角度利用文本技術和鏈接技術進行全方位的分類揭示,為其大類體系提供了多維檢索入口。如搜狐網除從信息資源的主題角度設類外,一般還同時從地區(qū)、資源類型、機構等角度設類。如設立“國家與地區(qū)”大類提供了地區(qū)檢索的入口,設立“視頻”、“博客”、“圖庫”等提供了資源類型的檢索入口,設立“公司企業(yè)”提供了機構檢索的入口。
網絡信息用戶主要是通過類名來識別和選擇檢索途徑。網絡信息分類法采用自然語言標引,簡單易懂。用戶可以根據類目直接進行檢索。如用戶登錄搜狐網后,在主頁上可以直接選擇“娛樂”、“體育”、“健康”等類目,進行信息瀏覽。
網絡分類法采取以主題為中心或按主題與學科相結合的類目設置方式,增強了類目的包容性。從便于用戶使用的角度出發(fā),根據用戶使用需要列類,突出了與用戶生活息息相關的如教育、娛樂、旅行、生活等普通用戶感興趣的類目,弱化科學技術、學術性類目的設置,便于用戶檢索。如搜狐網將“娛樂休閑”、“旅游交通”、“衛(wèi)生健康”等用戶需求量高的類目單獨設為大類,置于首頁之上,極大地方便了用戶查找。
由于網絡信息具有高度的動態(tài)性,各種信息處于不斷更新的狀態(tài)中,它所鏈接的網站、網頁也處于變化之中[5]。所以要求網絡信息分類體系具有跟蹤動態(tài)發(fā)展的能力。網絡分類引擎利用超文本技術,根據需要動態(tài)調整類間關系,這種類間關系一旦不需要,可以隨時取消,出現新的類目關系也能夠及時添加。
一個完整的綜合性分類體系在劃分基本大類時應將所涉及到的知識領域全部涵蓋進去,而目前的搜索引擎往往只從商業(yè)角度出發(fā)設置類目,因此體系的系統(tǒng)性和完整性受到很大影響。從類目設置情況來看,搜狐網有18個基本大類,涵蓋的知識不夠全面,也沒有形成較為完整的科學體系,有些信息難以歸類。如教育大類中,有高等教育,無中等和初等教育;有國內院校,無國外院校。
網絡信息分類采用自然語言設置類名,雖然直觀易懂,但是大量口頭語言、網絡語言的使用使得類目名稱不規(guī)范,有時給用戶查找?guī)砝щy,難以查到真正需要的東西。如搜狐網一級類目中的“女人”、“原創(chuàng)”等,不熟悉的話不能準確地查找出所需信息。
目前許多網絡信息分類法未能嚴格地按照概念的內涵和外延科學歸類,以用戶感興趣的內容設置類目,對于用戶使用較少的信息沒有設置類目。因而,這種分類法不是科學的分類法,并未從知識領域、知識體系的角度分類。如《中圖法》中“工業(yè)技術”、“語言文字”等一級類目并沒有出現在搜狐網的類目中。搜狐網的大類設置使用了主題對象、學科、地區(qū)、文獻類型等多個標準但其類目之間邏輯性不強,類目歸屬存在不合理的現象。這種分類使得類目層次不一,破壞了分類的等級結構和系統(tǒng)性,影響了類目體系的清晰度,在一定程度上干擾了用戶的檢索,降低了查準率。
網絡信息分類法普遍存在著分類體系不統(tǒng)一的問題。在類目的劃分、排列上都存在很大差別。類目采用多重列類使得同一個子類目出現在不同大類下,類目劃分層次也參差不齊,有的類目劃分為兩三層,有的類目則多達十幾層。用戶從分類途徑查找某個類名,往往要鏈接10多個頁面,既費時又費力。最常見的是邏輯關系比較混亂,常出現隸屬關系不清的現象。例如搜狐網中,從“文化”大類入口查找小說,需再選擇“讀書”大類,在“讀書”大類中可以看到“小說”子類目,可是該“小說”子類目屬于“聽書”上位類,檢索出來的小說不是文本格式的,而是音頻格式的,這樣用戶花費時間找到的并不是自己所需要的信息,而文本格式或在線閱讀的小說應該從“文化”大類下的“原創(chuàng)”子類入口查找。
分類法中基本大類的設置應將穩(wěn)定的、較為概括的學科或知識領域作為一級類目。網絡信息分類法的基本大類除了要考慮網站的商業(yè)性,還必須考慮知識的完整性與穩(wěn)定性。因此,設計基本大類時,應盡量采用按學科進行分類,一級類目數量控制在15~20個為宜。如將哲學、社會科學、自然科學等學科分明、較為穩(wěn)定的類目設為一級類目;二級類目的設置可采取按主題分類,如娛樂休閑、生活服務等,類目劃分一般控制在四~六級左右,不宜過多。二級以下類目可采用“多重列類”等方法合理立類。類目內容應科學完整,既有學術信息、新聞信息,又有專業(yè)信息、個人信息等。
網絡信息類名的設置既要符合大多數用戶的使用習慣,同時要科學、準確、規(guī)范,涵蓋的知識領域要全面并且應采用規(guī)范語詞,不使用復雜的標記制度,以便各種各樣的信息都有類可入??梢酝ㄟ^對類目進行科學注釋的手段來幫助用戶了解類目的含義,提高網絡信息的查全率及查準率。可以采用以下兩種注釋方式:一是通過精煉的文字,指明該類包含的內容范圍;二是用列舉下位類的方式揭示本類的內容范圍。
網絡信息分類法應建立在科學的知識分類的基礎上,按照各學科之間的內在聯系和相互關系并結合網絡信息資源的特點,形成一個科學的檢索系統(tǒng)。類目的設置與排序必須遵守基本的學科劃分和邏輯劃分原則[6]。由于類目的排列次序對用戶使用和檢索速度會產生一定的影響,所以確定合理的排列次序是分類體系建立的一個基本內容。首先,應按照知識的邏輯次序和重要程度排列,共性區(qū)分的問題集中排列,采用相同標準區(qū)分的類目使用相同的次序排列。其次,對無明顯邏輯聯系的類目,可按照字順或網站信息點擊率排列。
網絡信息分類法的體系要統(tǒng)一,類目層次不宜過多,要突出重點類目。在編列類目時,要符合網絡信息的實際情況,以足夠的信息內容作為保障。信息內容多,類目就分得細;信息內容少,類目就分得粗。對于一些類目在其上位類或其他類目中能明確反映出來的同時又不影響整個體系編制的情況下可以不單獨列出。如在網頁中可將熱點問題單獨列出。
網絡信息分類與傳統(tǒng)文獻分類法各有所長。隨著網絡技術的不斷發(fā)展及人們越來越多地利用互聯網,網絡分類法勢必要不斷完善。充分吸收傳統(tǒng)文獻分類法的優(yōu)勢來彌補其不足,是網絡信息分類體系趨于完善的必由之路。
[1] 鐘永萍.傳統(tǒng)文獻分類法與網絡信息分類法的比較研究[D].福建師范大學,2008.
[2] 搜狐網.搜狐首次對外展示搜索引擎網站分類法[EB/OL].[2011-11-27].http://it.sohu.com/77/81/article16718177.shtml.
[3]郭曉蘭.網絡信息分類方法與傳統(tǒng)分類法的比較研究[J].圖書館建設,2003(3):48-50.
[4] 宋蓓玲.淺析構建網絡信息分類體系[J].情報雜志,2004(8):110-111,114.
[5] 王麗瑜,李梅娟.網絡信息分類法與傳統(tǒng)文獻分類法的比較分析——以Yahoo!和《中圖法》為例[J].中國成人教育,2007(2):56-57.
[6]邰峻.從搜狐分類引擎分析網絡信息資源的分類組織[J].新世紀圖書館,2006(1):52-53.
[7] 王巍.搜狐分類體系初探[J].圖書館建設,2001(1):72-74.