吳鋒文
(信陽師范學院文學院,河南信陽464000)
復句層次關(guān)系識別,是計算語言學句法分析的重要議題,也是中文信息處理領(lǐng)域一項富有挑戰(zhàn)性的課題。[1-2]關(guān)系詞作為復句句法和語義屬性的形式標記,在復句層次關(guān)系識別中具有重要作用,因而在用計算機來實現(xiàn)漢語復句的關(guān)系層次自動分析過程中,關(guān)系詞語的提取和標引是首要的任務(wù)。[3]但對計算機而言,如何準確地識別并提取出句中的復句關(guān)系詞語卻并不是一件容易的事情。例如:
(1)(只要)你不再逃課上網(wǎng),就給你買你想要的山地車。
(2)(只/要)一斤,多的不要。
(3)我們(所以)以民主投票方式選舉新一屆領(lǐng)導班子,是因為民主投票方式產(chǎn)生的成員才能得到大家的認可。
(4)我們(所/以)民主投票方式選舉了新一屆領(lǐng)導班子,成員任命將在下午舉行。
“只要”“所以”在例(1)(3)充當復句關(guān)系標記,而在例(2)(4)則不是關(guān)系標記,是偽關(guān)系詞①復句中偽關(guān)系詞主要有與復句關(guān)系標記同形的異類詞、異構(gòu)詞、詞間連詞和篇章關(guān)系標記。。因此,計算機在漢語復句關(guān)系層次自動分析中,不論是統(tǒng)一將“只要”“所以”視為整體字段識別標注,還是視為組合字段進行切分標注都會存在問題,使復句關(guān)系詞判定錯誤。
以關(guān)系標記為突破口來識別復句層次關(guān)系,面臨的難題主要有兩:其一,標記超量,如何區(qū)分復句關(guān)系詞語與偽關(guān)系詞;其二,標記少量,如何解決關(guān)系標記缺失的問題。為提高復句關(guān)系標記識別準確度與利用率,本文擬對復句關(guān)系標記識別存在的困難進行系統(tǒng)研究,以期為復句層次關(guān)系識別打下堅實基礎(chǔ)。
所謂同形異類,是指“同一個形式在語法上分屬不同的類”[4]26。復句關(guān)系詞是根據(jù)“聯(lián)結(jié)分句、標明結(jié)構(gòu)關(guān)系、形成復句格式”的共同特點組合攏來的一些詞語,它們沒有固定的詞類,所以當某個關(guān)系詞由其他詞類虛化而來時,在語言共時平面,就會出現(xiàn)一些關(guān)系標記兼屬其他詞類的現(xiàn)象,從而對復句關(guān)系詞的識別造成困擾。[5]289-297
以“由于”為例,現(xiàn)代漢語里“由于”既可用作連詞,也可用作介詞,屬于介連兼類。[6]652-654作連詞時,表示因果關(guān)系,用在表原因的小句中;作介詞時,表示原因或理由,一般只用在名詞性詞語前面,其句法位置可居于句首,也可居于句中,還可以用于“是”后面。例如:
(1)這幾年來,由于我們沒有搞好民主集中制,以致上下不通氣,這是一個帶普遍性的嚴重現(xiàn)象。(《鄧小平文選第一卷》)
(2)<由于>這對眼睛,她整個面龐散射著一種迷人的光輝。(張賢亮《綠化樹》)
例(1)是“由于”作因果標記的用法;例(2)是“由于”作介詞的用法。這種介、連兼類的用法,加大了復句關(guān)系詞識別的難度。再看一個例子:
(3)①由于工作的需要,②我雖然讀過一些語言學方面的書籍,③但自知在語言學家跟前仍是一個門外漢,④所以不敢妄評。(引自李晉霞、劉云2003)
以目前分詞系統(tǒng)做的最為成熟的中科院的ictclas分詞軟件為分詞工具,對例(3)進行分詞處理,標注結(jié)果如下:
(3’)①由于/c工作/v的/u需要/n,/wd②/m我/r雖然/c讀/v過/u一些/m語言學/n方面/n的/ude1書籍/n,/wd③/m 但/c自/r知/v在/p語言學/n家/n跟前/f仍/d是/v一個/m門外漢/n,/wd④/m所以/c不/d敢/v妄/d評/v。/wj
以上標注結(jié)果只有后面三個分句的“雖然”“但”“所以”是復句關(guān)系詞,可分詞軟件卻將第一個語段中介詞“由于”錯誤地標注為關(guān)系詞“由于/c”,正確標注結(jié)果為“由于/p”。
對于與實詞同形的復句關(guān)系詞,目前的分詞軟件在關(guān)系詞標注方面也存在問題。例如:
(4)他想說話,剛一張嘴,就被人們的笑聲頂撞回去。(馮志《敵后武工隊》)
(4’)他/rr想/v說話/vi,/wd剛/d一/m 張/q嘴/n,/w就/d被/p人們/n的/ude1笑聲/n頂撞/v回去/v。/wj
例(4)中,“一/m(數(shù)詞)……就/d(副詞)……”應(yīng)該標注為“一/c(連詞)……就/c(連詞)……”,前后分句中的“一……就……”構(gòu)成條件復句。
(5)那你這是給孩子看的,還是給參觀的人看的呢?(《人民日報》1981-07-26)
(5’)那/c你/rr這/rzv是/vshi給/p孩子/n看/v的/ude1,/wd還/d是/vshi給/p參觀/v的/ude1人/n看/v的/ude1呢/y?/ww
例(5)為選擇復句,復句中“是/vshi(動詞“是”)…… 還/d是/vshi……”應(yīng)該標注為“是/c(連詞)……還是/c(連詞)……”。如果不以小句為視角,則無法正確地對復句關(guān)系詞進行切分標注。[7]
上述分析表明,復句關(guān)系詞語與同形異類詞之間存在糾葛,如果前期的復句關(guān)系詞標注錯誤,無疑會影響到復句層次關(guān)系的自動識別。
通過對復句關(guān)系標記的全面整理,我們發(fā)現(xiàn)與復句關(guān)系詞存在糾葛的詞語主要有17個:只是(d、c)、由于(p、c)、因為(p、c)、因(p、c)、為了(v、p、c)、任憑(p、c、d)、另外(c、r、f)、就是(d、c)、盡管(d、c)、既(d、c)、或者(d、c)、果然(d、c)、那(d、c)、那么(d、c)、一面(一面……一面)(d、c)、一(一……就)(m、c)、是(是……還是)(v、c)。
有些復句關(guān)系詞是由動詞或名詞甚至是動詞短語虛化而來的,它們大都經(jīng)過了一個語法化的過程。而重新分析是誘發(fā)語法化的重要因素之一[8],經(jīng)歷了語法化的關(guān)系標記一般已凝固為一個整體結(jié)構(gòu)出現(xiàn)在語言環(huán)境中,而那些同形的詞匯則是以一個組合結(jié)構(gòu)出現(xiàn)在語言環(huán)境中,這樣就導致了復句關(guān)系標記與同形異構(gòu)形式在語言共時平面同時存在的情形。因此,關(guān)系標記與同形異構(gòu)詞的區(qū)分,是關(guān)系詞自動標注中的一個十分值得重視的問題,它將直接影響到關(guān)系標記標注的準確性。
以“結(jié)果”為例,根據(jù)姚雙云(2006),現(xiàn)代漢語里“結(jié)果”主要有動詞、名詞、連詞三種用法,連詞“結(jié)果”是因果標記,大致經(jīng)歷了一個“結(jié)果(動詞短語)→動詞→名詞→連詞”的虛化途徑。[9]關(guān)系詞“結(jié)果”與名詞“結(jié)果”在形式上是一樣的,計算機在采用基于詞形匹配的關(guān)系詞識別策略時,很容易把一個與復句關(guān)系詞同形的異構(gòu)形式錯誤地標注為復句關(guān)系詞。例如:
(4)為了趕時髦,有些人不切實際地求新求全,結(jié)果把活動引入脫離實際、趕浪頭爭彩頭的歧途。(《人民日報》2002年)
(5)由于我們黨制定了正確的路線、方針和政策,結(jié)果以和平改造的方式,實現(xiàn)了我國歷史上最深刻、最偉大的社會變革,從而為我國社會的一切發(fā)展和進步奠定了基礎(chǔ)。(《人民日報》1991年)
例(4-5)中的“結(jié)果”都是用作關(guān)系標記的。經(jīng)過ictclas分詞軟件分詞標注后,句中“結(jié)果”的標注結(jié)果分別如下:
(4’)為了/p 趕時髦/v,/w 有些/r 人/n
不切實際/v 地/u 求/v新/a 求全/v,/w結(jié)果/n把/p 活動/n 引入/v 脫離/v 實際/n、/w 趕浪頭/v 爭/v 彩頭/n 的/u 歧途/n。/w
(5’)由于/c 我們/r 黨/n 制定/v 了/u正確/a 的/u 路線/n、/w 方針/n 和/c 政策/n,/w結(jié)果/d以/p 和平/n 改造/v 的/u 方式/n,/w 實現(xiàn)/v 了/u 我國/n 歷史/n上/f 最/d 深刻/a、/w 最/d 偉大/a 的/u社會/n 變革/vn,/w 從而/c 為/p 我國/n社會/n 的/u 一切/r 發(fā)展/v 和/c 進步/v奠定/v 了/u 基礎(chǔ)/n。/w
分析例(4-5),作關(guān)系標記的“結(jié)果”均被錯誤地標注為名詞“結(jié)果/n”和副詞“結(jié)果/d”,正確的注結(jié)果應(yīng)該為“結(jié)果/c”。為了解決復句關(guān)系詞與同形異構(gòu)詞的識別難題,胡金柱、沈威(2007)采用基于渡越矩陣方法進行個案研究,對共時平面“結(jié)果”的用法進行標注試驗,實驗結(jié)果表明,計算機基本能自動識別用作因果標記的“結(jié)果”,其封閉測試的正確率達98.32% 。[10]
再如表讓轉(zhuǎn)關(guān)系的“不過”,它既可以是一個固化的詞語,作讓轉(zhuǎn)標記,相當于“只是、可是、但是”等,也可以用作副詞、動詞、形容詞短語等。在“不過”的關(guān)系詞用法與同形異構(gòu)用法之間,經(jīng)常被標注錯誤。例如:
(6)如果斗不過,該怎么辦呢?(李曉明、韓安慶《平原槍聲》)
(7)秘書長人選你最適合不過了,不過現(xiàn)在已成定局,我說話怕不起作用。(周而復《上海的早晨》)
(8)她對有翼固然沒有承擔什么義務(wù),不過歷史上的關(guān)系總還有一些,在感情上也難免有一點負擔。(趙樹理《三里灣》)
只有例(7)后一個“不過”和例(8)“不過”才是表示讓轉(zhuǎn)關(guān)系“不過”。通過分析,關(guān)聯(lián)詞“不過”出現(xiàn)的句法位置為后續(xù)句的句首,也就是說,語表詞形“不過”只有用在句中語段的句首位置才能被標注為連詞“不過/c”。
針對這一特點,可以制定句法規(guī)則來區(qū)分某個復句關(guān)系標記與同形異構(gòu)詞形。在關(guān)系詞語標注實驗中,加入一條關(guān)系標記粗篩選規(guī)則,將出現(xiàn)在主語和動詞之后的與關(guān)系標記同形的詞語排除掉,只保留那些出現(xiàn)在主語和動詞之前的詞語,就能篩除一部分偽關(guān)系詞。[3]
通過對430多個關(guān)系詞的復句語料進行關(guān)系詞標注試驗,總結(jié)出如下28個關(guān)系標記容易被錯誤標注:超詞形式“如果說、與其說、不如說、不要說、怪不得、如果不是、不但不、倘若不是、要不是、再不然、不單單”等;雙音節(jié)的關(guān)系詞有:“只要、要是、只有、要不是、要不、不是、就是、若非、就算、不過、難怪、的話”等;單音節(jié)的有:“要、是、如、更、也”等??傮w而言,目前分詞軟件對復句關(guān)系詞與同形異構(gòu)形式間的識別度較低,復句關(guān)系詞的自動標注水平還有待提高。要成功解決關(guān)系標記與同形異構(gòu)的識別問題,一方面需要分析這些關(guān)系詞出現(xiàn)的句法環(huán)境并制定相應(yīng)規(guī)則,避免一些錯誤標注;另一方面,需要改進關(guān)系詞的標注方法,特別是如何將統(tǒng)計和規(guī)則的方法有效結(jié)合仍需深入探討。
關(guān)系標記可以連接不同層級的語法單位,根據(jù)關(guān)系標記連接對象是否為分句,可以把關(guān)系標記區(qū)分為復句關(guān)系標記和非復句關(guān)系標記①非復句用法,是指一個關(guān)系標記除了在復句中用來聯(lián)結(jié)分句并標明分句間關(guān)系的用法之外的用法,具體包括聯(lián)結(jié)小句內(nèi)詞或短語的句內(nèi)關(guān)系詞用法,以及用來聯(lián)結(jié)句與句之間,標明句群關(guān)系的篇章關(guān)系詞用法。。下面討論非復句關(guān)系標記對復句層次關(guān)系識別的影響。
(一)關(guān)系標記在單句中的用法
雖然關(guān)系標記的常用功能就是用來聯(lián)結(jié)分句,標明分句間的邏輯語義關(guān)系。但是,關(guān)系標記有時也用在單句中,宋玉柱(1986、1990年)、周剛(2000年)均有相關(guān)論述。關(guān)聯(lián)詞語在單句里主要用來聯(lián)結(jié)句法成分,標示句法成分之間的邏輯關(guān)系,同時還具有表達精簡、結(jié)構(gòu)緊湊以及話題化功能。[11]主要用途有三:
第一,出現(xiàn)在單句中,用來聯(lián)結(jié)主語和謂語,突顯主語、謂語之間的邏輯關(guān)系。例如:
(12)只有這種人的態(tài)度,才是正確的態(tài)度。(《劉少奇選集上卷》107頁)
(13)成功的基礎(chǔ)是奮斗,奮斗的收獲是成功,所以,天下唯有不知而艱辛奮斗的人,才能走上成功的高峰。
例(12-13)中“只有……才”“唯有……才”突顯主語所表示的事物對謂語的唯一條件性。
第二,出現(xiàn)在單句中,用來聯(lián)結(jié)狀語和主謂部分,突顯修飾性成分與主干成分之間的邏輯關(guān)系。例如:
(14)盡管在那樣緊張的日子里,但是他毫無懼色。
(15)只有在鏟除愚昧和丑陋的雜草之后,科學之樹才會結(jié)出豐碩的果實。(趙丹雅《藍天,也是屬于你的》,《芙蓉》1983年第4期)
例(14)中“盡管……但是”突顯狀語與主、謂語之間的讓轉(zhuǎn)關(guān)系;例(15)中“只有……才”突顯狀語與主、謂語之間的條件關(guān)系。
第三,出現(xiàn)在單句中,用來連接相同的句法成分,如聯(lián)結(jié)主語、謂語或狀語等,突顯相同句法成分之間的邏輯關(guān)系。例如:
(16)不但所有的干部,而且所有的家屬都參加了這次義務(wù)勞動。
(17)這種雖然比較溫暖,但是十分潮濕的氣候令人不適。
還有一種情況,標記搭配格式在復句的同一分句中共現(xiàn)。這類格式主要有:“只有……才”“只要……就”“因……而”“即使……也”“就算……也”“越……越”“一……就”“愈……愈”“是……還是”“不是……而是”“又……又”“無論……都”“不管……都”“寧可……也不”,這些格式聯(lián)結(jié)的一般是一個緊縮型結(jié)構(gòu),它們在復句中只構(gòu)成關(guān)系而不形成層次結(jié)構(gòu),因而不參與復句層次的劃分。例如:
(18)①只有不管是白貓還是黑貓,②能抓到老鼠的都是好貓,③才能使人才輩出。(《鄧小平文選》)
(19)①明珠小姐無邪的笑容和天真的熱情救了我,②所以我發(fā)誓這一生都要為明珠小姐而活,③就算陪上這條命也心甘情愿。(《還君明珠》)
例(18-19)中都存在結(jié)構(gòu)緊縮型分句:例(18)分句①中的“是……還是”、例(19)分句③中“就算……也”標示各自所在分句是緊縮型分句。
(二)居于句首的關(guān)系標記用作篇章標記
篇章關(guān)系標記一般出現(xiàn)在某個句子的句首位置,但它在語義邏輯上與前面句子或篇章發(fā)生關(guān)系,如上例(11)的“并且”。有關(guān)篇章標記的一些顯著特點如下[12]:義標識功能已經(jīng)跨越了所位居的句子,標示所位居的句子與上文語境句子的邏輯語義關(guān)系。例如:
(20)村官是廣大村民的主心骨、領(lǐng)路人,肩負著重要的使命?!叭r(nóng)”政策,要靠他們傳達貫徹;鄉(xiāng)親們的意見、建議,要靠他們匯報反映;建設(shè)社會主義新農(nóng)村,要靠他們帶路領(lǐng)航;鄰里之間的矛盾糾紛,要靠他們協(xié)調(diào)化解??墒牵捎诖骞偌娂娡獬龃蚬?,這些重要的工作都擱淺了,鄉(xiāng)親們的期待和希望也落了空。(《人民日報》2009-04-20)
其二,句序位置的句首性。篇章關(guān)系標記在標示篇章語義關(guān)系的同時,也起著“承上啟下”的結(jié)構(gòu)聯(lián)絡(luò)作用,一般出現(xiàn)于所位居的句子句首,在句序上表現(xiàn)出強烈的句首性。例如:
(21)作為古巴堅定盟友,委內(nèi)瑞拉總統(tǒng)查韋斯在“玻利瓦爾美洲國家替代計劃”締約國首腦會議上強調(diào),由于古巴被排除,他將否決峰會的所有決議。因此,古巴成了峰會缺席的主角。(《人民日報》2009-04-20)
其三,句法配位的后序性。除原因標“因為”外,篇章關(guān)系標記的句法配位總是居于搭配中的后一個序位,表現(xiàn)出明顯的后續(xù)性。如上例(20)“可是”、例(21)“因此”都是后序配位關(guān)系標記。
其四,句中搭配的孤立性。篇章關(guān)系標記在所位居的句中一般找不到與之組配的搭配對象,在句中表現(xiàn)出搭配的孤立性。例如:
(22)……①<因為>該島雖然比塔布島距離國際日期變更線還遠幾英里,②但是由于它的地理位置更靠南,③所以在那里要比在湯加群島能夠提前1小時13分看到公元2000年1月1日的第一線曙光。(《長江日報》1994年)
例(22)有3個分句、5個關(guān)系標記:因為、雖然、但是、由于、所以,而分句①用尖括號標注的“因為”在復句中缺乏搭配對象,標示該復句對前文語境的補注和解釋。
研究發(fā)現(xiàn),同時兼有復句關(guān)系標記用法和篇章關(guān)系標記用法的關(guān)系標記數(shù)量并不多,主要有15個:因為、所以、因此、因而、于是、同時、另外、另一方面、而且、并且、況且、然而、但是、可是、不過。[9]
由于篇章關(guān)系詞語是與上文句子內(nèi)容發(fā)生邏輯關(guān)系的,復句層次關(guān)系識別必須排除篇章關(guān)系詞語的干擾,如果不能正確的區(qū)別復句關(guān)系詞和篇章關(guān)系詞,計算機對復句層次關(guān)系的句法分析必將作
其一,語義關(guān)系的跨句性。篇章關(guān)系標記的語出錯誤的判定。
復句層次關(guān)系的識別,必須借助復句關(guān)系詞語的形式標記功能,如邢福義(1979、2001年)、石安石(1983年)、肖國政(1983年)、姚亞平(1990年)、王祥(1994年)等都肯定了復句關(guān)系詞語在復句層次分析中的作用。姚亞平(1990年)特別提及:“多重復句的分析方法就是:以多重復句的關(guān)聯(lián)詞模式為工作對象,按照關(guān)聯(lián)詞出現(xiàn)的先后順序決定層次的高度,在每個層次的關(guān)聯(lián)詞語的后件前劃出該復句的層次結(jié)構(gòu)與語法關(guān)系。”[13]他還指出,歸納復句的聯(lián)結(jié)模式對計算機的語言處理具有重要意義。的確,如果復句的每個分句都出現(xiàn)了關(guān)系標記,而且每個關(guān)系標記在復句中都能找到各自的組配對象,那么這種關(guān)系標記隱現(xiàn)模式的復句層次關(guān)系根據(jù)關(guān)系搭配常識,比較容易確定其層次結(jié)構(gòu)和語義關(guān)系了。例如:
(23)①高手相爭無論是低估了對方,②還是高估了自己,③都同樣是不可原諒的錯誤。(古龍《英雄無淚》)
(24)①兩人此刻雖然誰也瞧不見對方,②但只要聽到對方的聲音,便已覺得有一陣溫暖的友情充滿了身心。(古龍《武林外史》)
例(23-24)都是標記充盈態(tài)復句,每個分句都出現(xiàn)了關(guān)系標記,并且還有一個分句出現(xiàn)了關(guān)系標記連用格式“無論是”、“但只要”。對于這類復句,計算機只要在復句關(guān)系詞庫的支持下,將構(gòu)成搭配關(guān)系的關(guān)系標記按照一定的組合順序匹配,就能判定諸如例(23-24)這樣的充盈態(tài)復句的層次關(guān)系了??蓡栴}是,實際語言運用中像例(23-24)這樣“標記齊備,搭配完整”的充盈態(tài)復句并不多見,相反,分句中標記缺失的情況卻很多。一旦標記省略,將會給那些無標分句的層次歸屬和語義判定造成困擾,使得整個復句的層次關(guān)系識別困難重重:一方面,由于有些分句中出現(xiàn)的標記在復句中缺失組配對象,從而使得分句的層次歸屬無法找到充分的形式依據(jù);另一方面,無標分句的出現(xiàn),使得整個復句格式成為潛在歧義格式。[14]以復句格式“就算……,也……,……”為例:
(25)①就算麥克打死全世界的人,②也不會傷害你一個手指頭的,③你有什么好擔心的呢?(央視8套連續(xù)劇《再續(xù)意難忘》)
(26)①就算我陪上自己的性命,②也一定要把玉鳳救回來,③一定不讓爸爸再失望。(央視8套連續(xù)劇《又見阿郎》)
例(25-26)都是復句格式“就算……,也……,……”的實例化,但仔細體察,它們的層次結(jié)構(gòu)并不相同,見圖1、圖2。例(25-26)這類標記非充盈態(tài)復句,其層次關(guān)系不能單純依靠分句里所顯現(xiàn)的關(guān)系標記序列模式來判定,因為在關(guān)系標記序列模式和復句層次關(guān)系之間不存在“一對一”的映射關(guān)系。[15]
圖1 例(25)
圖2 例(6)
表1 三句式有標復句的標記充非盈態(tài)模式序列表
以三句式復句為例,由于分句里關(guān)系詞語的缺失而形成的非充盈態(tài)有標復句,其標記隱現(xiàn)模式如表1所示。分析表1,可以將三句式有標復句的8種非充盈態(tài)模式分為三類:①標記搭配+單標/空標(模式1、2);②單標 +單標(模式3、4);③單標(模式5-8)。通過對標記非充盈態(tài)模式歸類,我們發(fā)現(xiàn),標記非充盈態(tài)模式中幾乎無例外的存在單標,或者說存在標記缺失現(xiàn)象,正是由于關(guān)系標記的缺失,使得單標(無標)分句在層次歸屬上出現(xiàn)歧義,使得分句間的邏輯關(guān)系缺失客觀標志。
據(jù)此可以推測,三個分句以上的有標復句,只要某些分句缺失關(guān)系標記,整個復句中存在的單標越多,層次歸屬出現(xiàn)歧義的分句也將越多,那么該有標復句成為非充盈態(tài)有標復句的可能性越大。因此,三個分句以上的有標復句,單純依靠關(guān)系標記來識別其層次關(guān)系的有效性將受到削弱。
對于非充盈態(tài)有標復句,復句層次識別的難點在于無標分句的層次消歧。一個可行的途徑是,從無標分句與其前后分句間的相互關(guān)聯(lián)上去判斷,如確定分句主語的一致性,分析分句謂語的相關(guān)性等。[16]在目前基于語義的句法分析技術(shù)還很薄弱的情況下,要最終實現(xiàn)復句層次關(guān)系的識別問題,復句中無標分句的層次消歧和關(guān)系標記省略問題是一道“溝坎”。
復句層次關(guān)系識別是中文信息處理領(lǐng)域一項富有挑戰(zhàn)性的課題,它對推動漢語“句處理”進展有著重要意義。與復句關(guān)系詞語同形的異類詞、異構(gòu)詞、詞間連詞、篇章關(guān)系詞等偽關(guān)系詞的出現(xiàn)及關(guān)系標記的缺失,給復句層次關(guān)系識別造成的困擾。文章探討了復句關(guān)系詞語與同形異類詞、異構(gòu)詞等偽關(guān)系詞之間的區(qū)別,歸納了與關(guān)系標記同形的17個異類詞和28個異構(gòu)詞,描寫了與關(guān)系標記同形的詞間連詞、篇章關(guān)系詞的用法特點及關(guān)系標記的隱現(xiàn)形式,區(qū)分關(guān)系標記的充盈態(tài)和非充盈態(tài)形式,指出非充盈態(tài)復句的識別在于無標分句的層次消歧,分析了解決上述困難的可能途徑,為漢語復句信息處理奠定了基礎(chǔ)。
[1]吳鋒文,胡金柱.基于規(guī)則的漢語復句層次關(guān)系自動識別研究[J].華文教學與研究,2010,(1):85-92.
[2]吳鋒文.面向信息處理的“二標三句式”復句層次關(guān)系判定[J].信陽師范學院學報(哲學社會科學版),2012,(1):88 -92.
[3]胡金柱,舒江波.面向中文信息處理的復句關(guān)系詞提取算法研究[J].計算機工程與科學,2009,(10):90 -93.
[4]邢福義.漢語復句研究[M].北京:商務(wù)印書館,2001.
[5]邢福義.漢語語法學[M].長春:東北師范大學出版社,2000.
[6]張斌.現(xiàn)代漢語虛詞詞典[K].北京:商務(wù)印書館,2006.
[7]沈威.“句管控”理論在分詞和標注中的應(yīng)用[J].語言研究,2010,(1):69 -74.
[8]劉堅,曹廣順.誘發(fā)漢語詞匯語法化的若干因素[M]//吳福祥.漢語語法化研究.北京:商務(wù)印書館.2005.
[9]姚雙云.復句關(guān)系標記的搭配研究與相關(guān)解釋[D].武漢:華中師范大學博士學位論文,2006.
[10]胡金柱,沈威.基于渡越矩陣的復句關(guān)系詞自動標注初探[J].微計算機信息,2007,(30):200-202.
[11]周剛.關(guān)聯(lián)成分在單句中的功能再探[J].漢語學習,2000,(6):18 -24.
[12]吳鋒文.面向中文信息處理的三句式有標復句層次關(guān)系自動識別研究[D].武漢:華中師范大學博士學位論文,2010.
[13]姚亞平.多重復句的分析模型——兼談?wù)Z法分析的作用與目的[J].漢語學習,1990,(3):8 -14.
[14]吳鋒文,胡金柱.基于規(guī)則的漢語復句層次關(guān)系自動識別研究[J].華文教學與研究,2010,(1):85 -92.
[15]吳鋒文.基于關(guān)系標記的漢語復句分類研究[J].漢語學報,2011,(3):63 -73.
[16]吳鋒文.基于主謂語知識挖掘的分句語義關(guān)聯(lián)研究[J].語言文字應(yīng)用,2011,(4):132 -142.