姚振軍 鄭旭紅
(河南大學(xué),開封,475001/東北財經(jīng)大學(xué),大連,116025;大連外國語學(xué)院,大連,116025)
在哲學(xué)領(lǐng)域,本體論(ontology)屬于“形而上學(xué)”最基礎(chǔ)或是核心的部分,有時兩者混用,號稱“第一哲學(xué)”?!氨倔w論”哲學(xué)概念內(nèi)涵和外延自身不斷發(fā)展,學(xué)界的研究也不斷延展。在計算機(jī)領(lǐng)域的ontology的中文譯名很不一致,有“本體論”、“本體”、“本體科學(xué)”、“知識本體”、“概念集”、“本體模型”等,在技術(shù)文獻(xiàn)中直接使用ontology的情況則更為常見。全國科技名詞委將人工智能領(lǐng)域的ontology定名為“本體論”,通常定義為構(gòu)成相關(guān)領(lǐng)域詞匯的基本術(shù)語和關(guān)系,以及由這些術(shù)語和關(guān)系構(gòu)成的解釋這些詞匯外延的規(guī)則(鄧志鴻、唐世渭2002;陳小賓2009;姚振軍2010)。
本文將知識工程中的“本體論”作為科學(xué)研究的工具,發(fā)揮其在將對象知識的概念和相互間的關(guān)系進(jìn)行較為精確的定義的特點(diǎn)(Guarino 1997),以中文社會科學(xué)引文索引(CSSCI)2010-2011年來源期刊所確定的18種外語類來源期刊在2000-2009的10年間所刊載文章的關(guān)鍵信息為數(shù)據(jù)來源,利用斯坦福大學(xué)開發(fā)的protégé開源本體構(gòu)造工具,以graph-Viz和Jamalaya為可視化工具,進(jìn)行中國外語學(xué)科領(lǐng)域本體的建模,從而對中國外語學(xué)科的研究前沿進(jìn)行顯性的描述,旨在通過知識工程本體技術(shù)的運(yùn)用,科學(xué)地勾勒出外語學(xué)科“本體論”研究的輪廓與框架。
本文中的“本體論”具有雙關(guān)性和多層次性,我們的基本思路是運(yùn)用源自古老的哲學(xué)“本體論”的新興知識工程“本體論”,來勾勒中國外語學(xué)科的“本體論”理論輪廓。
本文運(yùn)用知識工程“本體論”技術(shù),發(fā)揮其對概念明晰化的作用,科學(xué)地闡釋中國外語學(xué)科的“本體”,從而勾勒出中國外語學(xué)科“本體論”的理論輪廓和框架,以明確中國外語學(xué)科研究的基本面貌,還原學(xué)科研究之“本”,解釋后現(xiàn)代哲學(xué)視角下以“末”為主的時代性研究特點(diǎn)。同時,文章還嘗試揭示學(xué)科研究之“體”,明確學(xué)科研究的“主體”和“客體”;建構(gòu)學(xué)科研究之“論”,論述學(xué)科的“本”與“末”、“源”與“流”,以及“體”與“用”的關(guān)系。
知識工程“本體論”技術(shù)可以為知識庫的構(gòu)建提供一個基本的結(jié)構(gòu),以描述對象的類型而言,有簡單事實及抽象概念,這些可以描述成一個本體的靜態(tài)實體部分,它們主要描述的是事物或概念的各個組成部分以及這些組成部分之間的靜態(tài)聯(lián)系,也可以描述事物或概念的運(yùn)動和變化(尹亮2005)。知識工程本體建模的首要任務(wù)是明確概念的定義和概念之間的語義關(guān)系。對中國外語學(xué)科研究而言,在本體模型中的最頂層的概念就是學(xué)科概念本身的界定。
在本研究中,我們分別參照《中華人民共和國國家標(biāo)準(zhǔn)學(xué)科分類與代碼表(GB/T13745-92)》(國家技術(shù)監(jiān)督局1992-11-01批準(zhǔn),1993-07-01 實施)和《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》為建立動態(tài)調(diào)整機(jī)制、優(yōu)化學(xué)科結(jié)構(gòu)而最新修訂的學(xué)科目錄,對中國外語學(xué)科研究的范疇進(jìn)行界定,最終以CSSCI(2010-2011年)所確定的18種外語類來源期刊在21世紀(jì)第一個10年間(2000-2009)所刊載文章的關(guān)鍵信息為切入點(diǎn)展開研究。
在眾多標(biāo)準(zhǔn)和參照系中,本文選取具有一定學(xué)科代表性的CSSCI所確定的外語類來源期刊為參照點(diǎn),進(jìn)行學(xué)科研究之“本”的研究。CSSCI收錄期刊是經(jīng)多所重點(diǎn)高校專家和社科管理專家組成的咨詢委員會、全國1000余位學(xué)科專家和南京大學(xué)中國社會科學(xué)評價中心共同評選后確定的。來源期刊確定標(biāo)準(zhǔn)包括期刊的影響因子、被引總次數(shù)等數(shù)量指標(biāo)與學(xué)科專家意見等,最終確定的來源期刊(2010-2011)共527種、擴(kuò)展版來源期刊(2010-2011年)174種。其中,12種外語類(包括翻譯)期刊入選語言學(xué)類來源期刊,6種外國文學(xué)類入選外國文學(xué)類來源期刊。本文以這18種期刊進(jìn)行本體類的創(chuàng)建,如圖1所示。
在本研究中,知識工程“本體論”的最大作用在于借助技術(shù)手段來明確本學(xué)科研究對象的層次與關(guān)系。如圖1所示,在protégé本體編輯工具中,它通過“Class”可對概念進(jìn)行“父類”和“子類”的逐層分解,從而明確概念的上下義和包含關(guān)系;而“Object Properties”和“Data Properties”則分別可以明確概念間的動作概念屬性和時空等數(shù)值屬性,如“出版與被出版”的動作關(guān)系、出版日期和所屬機(jī)構(gòu)。“individuals”是概念的具體實例或?qū)嶓w,在本研究即指本學(xué)科研究的具體的人和事,如期刊的具體作者和論文的關(guān)鍵詞。編輯工具中自帶的工具和插件可以提供查詢和可視化展示。圖2為基于作者的查詢界面和關(guān)系視圖、圖3為關(guān)鍵詞查詢界面和關(guān)系視圖。
中國古代“本體”一詞是由“本”和“體”兩個字合成的,這兩個字大概屬于中國最原始的造字之列,它們代表了中國人對世界和人生的最樸素的看法。“本”字據(jù)許慎《說文解字》:“木下曰本,從木,一在其下”;與之相對的有“末”:“木上曰末,從木,一在其上。”顯然,“木”是植物,是農(nóng)耕民族賴以為生的“根本”,而木的根本則是在木之下的“本”,末死本存,本在末榮?!墩撜Z·學(xué)而》云:“君子務(wù)本,本立而道生”;《易·系辭》云:“其初難知,其上易知,本末也”??梢娫谥袊说乃枷胫?,“本末之辯”是一對極為重要的范疇。在知識爆炸和學(xué)科不斷融合與分化的新世紀(jì),在后現(xiàn)代哲學(xué)的視野下,中國外語學(xué)科研究也不斷向縱深發(fā)展,明確中國外語學(xué)科研究的基本面貌,還原學(xué)科研究之“本”的任務(wù)也必然極其復(fù)雜。本文借助新興的知識工程技術(shù),以數(shù)據(jù)為依據(jù),以為透析中國外語學(xué)科研究“本”與“末”之間的辯證關(guān)系提供一個相對科學(xué)的視角。
統(tǒng)計顯示,18種期刊10年間所載的文章中析出的關(guān)鍵詞總數(shù)96,647個,不重復(fù)關(guān)鍵詞36,977個,只出現(xiàn)1次的關(guān)鍵詞共26,017個,占總關(guān)鍵詞27.1%,占不重復(fù)關(guān)鍵詞70.4%,重復(fù)出現(xiàn)2次的關(guān)鍵詞為4,638個,重復(fù)出現(xiàn)3次的關(guān)鍵詞為1867個。在處理時,對從各刊所載的會訊和通知中析出的機(jī)標(biāo)關(guān)鍵詞進(jìn)行降噪處理后予以去除,同時,通過與漢語停用詞表和通用詞表進(jìn)行比較后,進(jìn)一步去除了“20世紀(jì)”、“中國”和“英國”等信息指向性較低的關(guān)鍵詞。我們對其余高頻關(guān)鍵詞在本文所構(gòu)建的外語類核心期刊本體模型中進(jìn)行了歸類,將關(guān)鍵詞通過期刊文章“Has Key Word Of”和“Belong To”等屬性特征與《中華人民共和國國家標(biāo)準(zhǔn)學(xué)科分類與代碼表(GB/T13745-92)》所對應(yīng)本體類和子類進(jìn)行關(guān)聯(lián)和添加,結(jié)果見圖4。
圖1 本體編輯界面與graphViz視圖
圖2 作者查詢在Jamalaya中的視圖
圖3 關(guān)鍵詞查詢在Jamalaya中的視圖
圖4 關(guān)鍵詞在本體建模中的歸類處理
通過本體建模與歸類分析,出現(xiàn)頻率前100位的高頻關(guān)鍵詞中,信息指向性較強(qiáng)的有效關(guān)鍵詞共70個,其中語言學(xué)關(guān)鍵詞為40個,文學(xué)30個。因篇幅所限,本文重點(diǎn)分析語言學(xué)的具體數(shù)據(jù)。在語言學(xué)關(guān)鍵詞中,一級學(xué)科關(guān)鍵詞3個(語言180次,語言學(xué)99次,語言學(xué)研究72次),二級學(xué)科關(guān)鍵詞1個(應(yīng)用語言學(xué)88次),三級學(xué)科關(guān)鍵詞3個(翻譯學(xué)120次、語用學(xué)109次、外國語言321次),三級以下33個。其中應(yīng)用語言學(xué)領(lǐng)域:翻譯學(xué)及其分支9個(翻譯431次、翻譯研究342次、文學(xué)翻譯193次、翻譯理論147次、翻譯教學(xué)141次、譯文102次、翻譯家99次、譯者84次、翻譯策略70次),計算語言學(xué)1個(語料庫155次),應(yīng)用語言學(xué)其他學(xué)科中語言教學(xué)12個(語言教學(xué)90次、外語教學(xué)295次、大學(xué)英語186次、英語教學(xué)135次、自主學(xué)習(xí)86次、教學(xué)模式82次、英語專業(yè)78次、寫作76次、外語教學(xué)與研究75次、英語寫作74次、外語教育69次、大學(xué)英語教學(xué)95次);應(yīng)用語言學(xué)其他學(xué)科中的二語習(xí)得1個(二語習(xí)得93次);普通語言學(xué)的語用學(xué)領(lǐng)域5個(語境133次、語篇102次、關(guān)聯(lián)理論74次、話語70次、對話66次);外國語言領(lǐng)域2個(英語119次、俄語61次);語言學(xué)其他學(xué)科中的認(rèn)知語言學(xué)3個(認(rèn)知語言學(xué)236次、認(rèn)知166次、隱喻165次)。
我們認(rèn)為,上述40個語言學(xué)高頻關(guān)鍵詞基本體現(xiàn)了2000-2009年間的現(xiàn)實研究狀況,在很大程度上可以代表中國外語學(xué)科研究之“本”的語言學(xué)側(cè)面。我們所析出的30個文學(xué)關(guān)鍵詞①則代表著其文學(xué)側(cè)面,語言學(xué)和文學(xué)研究的70個關(guān)鍵詞構(gòu)成了中國外語學(xué)科的研究之“本”,而26,017個只出現(xiàn)1次的瞬間關(guān)鍵詞則是中國外語學(xué)科的研究之“末”的體現(xiàn)。本文這一觀點(diǎn)僅出于描述性研究的目的,我們對“本”“末”的定義的觀點(diǎn)是辯證的,在歷時研究中,二者一定是一種動態(tài)的對立轉(zhuǎn)換關(guān)系,而且這種“本”與“末”體現(xiàn)的是一種科學(xué)客觀的角度,并不帶有主觀評價色彩。
本文所指的中國外語學(xué)科研究之“體”的第一層含義是指對中國外語學(xué)科研究“主體”和“客體”的劃分。在本文所構(gòu)建的基于外語類核心期刊本體模型中,中國外語學(xué)科研究“主體”指的是期刊作者,即從事外語研究的人;而“客體”指的是這些作者所寫的文章和研究的關(guān)鍵詞。上文已經(jīng)就關(guān)鍵詞進(jìn)行論述,本節(jié)重點(diǎn)關(guān)注“主體”。表1為2000-2009年間在18種外語類來源期刊(非外語類期刊發(fā)文不計)發(fā)文排名前100位的作者和發(fā)文量的統(tǒng)計結(jié)果。
表1 發(fā)文前100位的作者
(續(xù)表)
如果我們以某個學(xué)者,如“王寅”,為檢索詞,在所得到圖形的本體中可清晰地體現(xiàn)王寅教授作為研究“主體”與“客體”中的研究文章和文章中的關(guān)鍵詞以及關(guān)鍵詞所屬的學(xué)科分類。在未來研究中,我們試圖對于中國外語學(xué)科之“主體”和“客體”進(jìn)行深入研究。
中國外語學(xué)科研究之“論”主要是對“本”與“末”、“主體”和“客體”以及“體”與“用”關(guān)系的論述,本文重點(diǎn)對“體”與“用”的關(guān)系進(jìn)行初步的分析。
“體”與“用”是中國古代哲學(xué)的基本范疇?!绑w”,指本體或?qū)嶓w;“用”,指作用、功用或用處。這是它們的本來涵義。在中國哲學(xué)的長期發(fā)展過程中,逐漸形成一種有體有用、體用一如的思維模式,體用范疇也被賦予了復(fù)雜多樣的涵義。本文主要借用中國近代張之洞等人提出“中學(xué)為體,西學(xué)為用”(謂體用原指主要與次要、根本的與從屬的兩者的區(qū)別)說法來審視中國外語學(xué)科研究的理論與實踐,中國本土理論與西方引進(jìn)理論的關(guān)系。隨著本文所構(gòu)建的本體模型數(shù)據(jù)的豐富,未來我們將展開關(guān)于中國外語學(xué)科之“論”的理論深入探索。
正如Poli(2011)指出,經(jīng)歷了漫長的衰落過程后,本體論再次回歸到了哲學(xué)和科學(xué)技術(shù)的前沿。如今本體論的回歸至少體現(xiàn)在兩個方面:傳統(tǒng)的哲學(xué)意義下的本體論與嶄新的以計算機(jī)應(yīng)用技術(shù)為基礎(chǔ)的知識工程本體的并駕齊驅(qū)。他還明確指出,長期以來學(xué)者們對這兩個領(lǐng)域中的本體論的誤解:知識工程和哲學(xué)的本體論學(xué)者在爭辯著這兩個學(xué)科中的本體論是完全不同的,一方認(rèn)為,計算機(jī)知識工程本體論與領(lǐng)域建模的具體問題的分析密切相關(guān);而另一方堅稱,哲學(xué)本體論是與現(xiàn)實世界中最深奧的、經(jīng)常是極度抽象的各種思考和眾多的純粹的概念的范疇化問題緊密相連的,因此,從事知識工程本體論的科學(xué)家不應(yīng)該關(guān)心研究本體論的哲學(xué)家的研究,反之亦然。
在本文里,“本體論”既是“實指”也是“喻指”:“實指”是知識工程本體論技術(shù)的實際運(yùn)用,“喻指”是中國外語學(xué)科本體論理論的建構(gòu)。知識工程本體論源自哲學(xué)本體論,“本”與“末”、“體”與“用”是中國傳統(tǒng)“本體論”的研究內(nèi)容;從西方哲學(xué)角度,我們試圖回答傳統(tǒng)“本體論”的基本命題:“是之為是”,即“中國外語學(xué)科”何其為“中國外語學(xué)科”,哪些人做了哪些事。在下一步工作中,我們將以自動抽取的方式進(jìn)一步擴(kuò)大本體的規(guī)模,以便于更加深入地對中國外語學(xué)科“本體論”展開研究和思索。
附注:
①限于篇幅,本文不提供這一具體數(shù)據(jù)表格,需要的讀者可以向作者索取。