馮洪海 李利敏 宋舒晗
摘要:為了緩解人們在生活壓力下出現(xiàn)的心理亞健康,設(shè)計一個通過詞匯替換自動生成幽默的方法。該方法將可以互相替換的詞匯放在一個詞匯集合中,稱為語用群。語用群中的詞匯需滿足以下兩個條件:同一個語用群中每個詞匯的上位概念(superordinate concept)相同;同一個語用群中每個詞匯在語言學(xué)中的用途相同。通過替換方法可以生成4種幽默類型:說反話型、答非所問型、明知故犯型、張冠李戴型。結(jié)果表明,句子中的某一個位置有細(xì)小變動就可能產(chǎn)生幽默效果。
關(guān)鍵詞:計算機(jī)幽默;語用群;上位概念;詞匯替換
DOIDOI:10.11907/rjdk.181180
中圖分類號:TP301
文獻(xiàn)標(biāo)識碼:A 文章編號:1672-7800(2018)010-0041-03
英文摘要Abstract:In order to alleviate the mental sub-health phenomenon that people appear under the pressure of life, this paper designs a method of automatically generating humor through the replacement of vocabulary.In this algorithm,the words that can be replaced by each other are put in a vocabulary collection,which is called pragmatic group.The creation of pragmatic groups needs to satisfy two conditions:the same superordinate concept for each word in the same pragmatic group and each word in the same pragmatic group is used for the same purpose.There are four types of humor that can be generated by the alternative method:talking about the opposite, answering non-question, violate knowingly, confusing each other.To sum up,when there is a small change in the position of a sentence,it is possible to produce a humorous effect.
英文關(guān)鍵詞Key Words:computer humor;pragmatic group;superordinate concept;lexicon replacement
0 引言
隨著幽默的跨學(xué)科研究,計算機(jī)幽默也隨之出現(xiàn)。Morkes等[1]研究了幽默在涉及HCI和計算機(jī)介導(dǎo)溝通(CMC)任務(wù)情況中的效果。Hübler等[2]發(fā)現(xiàn)了精神幽默模式,并將其應(yīng)用到大學(xué)寫作中心郵件列表的修飾中。Taylor[3]提出一個確定短文本是否為笑話的計算機(jī)幽默探測器。Friedman等[4]探討了面向計算機(jī)的幽默(COHUM),然后提供了一個框架和一個全面的分類,并將COHUM放置在更廣泛的幽默研究中。Nijholt等[5]對人機(jī)交互中的幽默進(jìn)行簡短調(diào)查,發(fā)現(xiàn)計算機(jī)幽默在人機(jī)交互中還是一個被忽略的研究領(lǐng)域。Ritchie[6]強(qiáng)調(diào)基于“不一致”模型實(shí)現(xiàn)涉及有限形式的雙關(guān)語。Binsted等[7]利用計算機(jī)設(shè)計并實(shí)現(xiàn)了一個基于簡單雙關(guān)語謎語的正式語義和語法規(guī)則模型。Ritchie等[8]為具有復(fù)雜交流需求(CCN)的兒童開發(fā)了一個謎語生成器。Valitutti等[9]利用詞匯替換實(shí)現(xiàn)了成人幽默的自動生成,但用于替換的詞匯主要涉及兩性、禁忌、侮辱性等語境詞匯。國內(nèi)雖然在情感表達(dá)和識別方面有研究,但在計算機(jī)幽默創(chuàng)作方面還很少有涉足。嚴(yán)扣鳳[10]提出可以通過語言的模糊性創(chuàng)造幽默效果,例如語音、詞匯、語義的模糊。
語用群是幽默的典型成分[11]。受語料庫啟發(fā),本文根據(jù)詞匯的用法建立了語用群,提出一種新的基于語用群中詞匯替換的幽默生成算法,同一個語用群中的詞匯不限定于特定語境,只需要滿足詞匯上位概念相同或在語言學(xué)中詞語用途相同即可。通過該方法替換后的文本放到原語境中通常可以產(chǎn)生幽默效果。
1 語用群創(chuàng)建
1.1 術(shù)語定義
原句:忠實(shí)于上下文語義的句子,沒有幽默效果,但通過詞匯替換后可能產(chǎn)生幽默效果。
替換語句:原句經(jīng)過詞匯替換后具有幽默效果的句子。
原詞匯:原句中可以被替換的詞匯。
替換詞匯:替換原句中詞匯的詞匯。替換詞匯要求與原詞匯上位概念相同、在人類語言學(xué)中的用途相同。
語用群:根據(jù)上位概念相同、用途相同的原則,為其建立替換每個詞匯的集合。
1.2 詞匯上位概念相同限制
“上位概念”表達(dá)抽象事物的特點(diǎn),反映一組具體形象的共性[12]。詞匯上位概念限制要求原詞匯與它在語用群中替換詞匯的上位概念相同。
為了保證語用群中詞匯的上位概念相同,先確定原詞匯的上位概念,再根據(jù)上位概念找下位概念。所謂“下位概念”,表達(dá)具體事物的特點(diǎn),反映個別對象的個性。例如,“汽車”為“大眾”、“奔馳”、“奧迪”的共性,反過來“大眾”、“奔馳”、“奧迪”則是“汽車”的個性,所以“大眾”、“奔馳”、“奧迪”是“汽車”的下位概念。本文采用兩個方式收集上位概念的下位概念:①利用網(wǎng)絡(luò)資源,在網(wǎng)上收集每個上位概念的下位概念;②利用知網(wǎng)實(shí)現(xiàn)詞匯的初步篩選,在數(shù)據(jù)庫中根據(jù)每個詞條的DEF字段對詞條進(jìn)行篩選。其中知網(wǎng)是一個以漢語和英語詞語代表概念為描述對象,以揭示概念與概念之間以及概念屬性之間的關(guān)系為基本內(nèi)容的常識知識庫[13]。通過以上兩種方式獲取結(jié)果并匯總組成語用群。
1.3 詞匯用途相同限制
詞匯用途相同限制要求語用群中所有詞匯在日常用語中的用途相同。通過以下步驟收集:①對原句進(jìn)行分析確定可以進(jìn)行替換操作的原詞;②確定原詞在人類語言學(xué)中的用途,并從網(wǎng)絡(luò)中收集其它具有同樣用途的詞匯作為替換詞匯組成語用群;③對收集到的替換詞匯進(jìn)行人工篩選,篩選出比較常用且便于理解的詞匯作為語用群。
本文通過以上兩種限制條件共創(chuàng)建了25個語用群,在通過計算機(jī)實(shí)現(xiàn)詞匯替換時,該25個語用群將會成為產(chǎn)生幽默效果的關(guān)鍵因素。
2 上下文限制
在替換詞匯與替換語句中,該詞前后詞匯相連構(gòu)成短語,只有符合人們的使用習(xí)慣才會被認(rèn)可,所以需在替換過程中編寫一個軟件用來限制上下文。搜狗知識是一個知識問答網(wǎng)站,其中詞語搭配符合人們的語言習(xí)慣,所以本文選擇該網(wǎng)站作為替換結(jié)果的矯正標(biāo)準(zhǔn)。當(dāng)文本中某一詞匯被替換以后,將替換詞匯與替換語句中該詞前后詞匯組成一個詞組,然后將該詞組作為關(guān)鍵字放到搜狗知識中進(jìn)行搜索。如果搜索結(jié)果至少有一條數(shù)據(jù)存在于該詞組,則該詞組符合人們的語言習(xí)慣,可將該替換詞匯加入到語用群中。
3 算法流程
為了確定原詞,本文使用中科院開發(fā)的分詞精度和速度較好的分詞軟件ICTCLAS對原句進(jìn)行分詞[14]。利用計算機(jī)實(shí)現(xiàn)詞匯替換產(chǎn)生幽默效果,要經(jīng)過以下步驟:
(1)人工創(chuàng)建語用群。
(2)在計算機(jī)中用文件存儲語用群。
(3)在圖形界面輸入一段需要通過替換產(chǎn)生幽默的短文本(原句)。
(4)程序?qū)⒃渥x取到內(nèi)存中。
(5)程序?qū)υ溥M(jìn)行分詞。
(6)程序確定原句中的原詞匯。
(7)在原詞匯對應(yīng)的語用群中隨機(jī)提取一個替換詞匯,若不存在該原詞匯對應(yīng)的語用群則返回第(6)步重新選擇原詞匯。
(8)程序用提取的替換詞匯替換原句中的原詞匯,生成替換語句。
(9)判斷替換詞匯與替換詞匯前后詞匯組成是否符合人們的語言習(xí)慣,若符合則輸出替換語句,否則返回第(7)步重新提取替換詞匯。替換的算法流程見圖1。
4 幽默效果分析
本文詞匯替換方法可以生成4種類型幽默。
(1)說反話型。例如在以下場景中:課堂上老師要求學(xué)生把完成的作品都拿起來展示,當(dāng)大家拿出作品后,正常情況下老師會說:“來,大家相互鼓勵一下?!倍?jīng)過詞匯替換方法處理后句子變?yōu)椋骸皝?,大家相互嘲笑一下。”將“鼓勵”替換成“嘲笑”后,整個句子表達(dá)的意思就完全相反,與人們的正常思維方式產(chǎn)生不同,進(jìn)而引起注意,大家潛意識里會明白這是一個錯誤語句,而這個錯誤會產(chǎn)生幽默的效果。
(2)答非所問型。例如在以下場景中:一個人把母親從鄉(xiāng)村接到城市,后來發(fā)現(xiàn)近段時間水費(fèi)猛漲,另一個人問他水費(fèi)猛漲的原因時,他回答說:“我母親每天按馬桶玩?!苯?jīng)過詞匯替換算法處理后可能變成:“我母親每天按門鈴?fù)?。”將“馬桶”替換成“門鈴”,按多少次門鈴與電費(fèi)有關(guān),并不會使水費(fèi)增加,而此處應(yīng)該回答水費(fèi)增多的原因。處理后的回答與原語境不匹配,出現(xiàn)答非所問現(xiàn)象,也會產(chǎn)生幽默的效果。
(3)明知故犯型。例如在以下場景中:一個人參加節(jié)目介紹說自己是東北人,主持人通過提問確定他真的來自東北,最后總結(jié)時應(yīng)該說:“鑒定完畢,他來自東北”,而經(jīng)過詞匯替換方法處理后的回答為:“鑒定完畢,他來自山東?!鼻懊嬉呀?jīng)明確結(jié)果為東北,而本文算法將“東北”替換成“山東”,東北和山東完全是兩個地區(qū),屬于明知故犯型錯誤,也會產(chǎn)生幽默的效果。
(4)張冠李戴型。例如在以下場景中:一個人參加節(jié)目介紹自己的工作是在山崖上采摘燕窩,主持人對觀眾解釋說:“燕窩懂嗎?燕子睡覺的地方?!苯?jīng)過詞匯替換算法處理后結(jié)果為:“燕窩懂嗎?犀牛睡覺的地方?!北娝苤?,燕窩明明是燕子睡覺的地方,跟犀牛沒有任何關(guān)系,但燕子和犀牛又同屬動物,如果將燕子睡覺的地方套在犀牛身上就會發(fā)生張冠李戴的錯誤,也可以產(chǎn)生幽默的效果。
綜上可知,普通文本經(jīng)過詞匯替換方法處理后,將處理后的文本放在原語境中就會產(chǎn)生幽默的效果。
5 結(jié)語
本文提出語用群的概念,并且提出通過將文本中的詞匯替換成語用群中的其它詞匯而使文本在原語境中產(chǎn)生幽默效果的方法。經(jīng)過詞匯替換方法替換后的文本在原語境中會產(chǎn)生4種幽默類型:說反話型;答非所問型;明知故犯型;張冠李戴型。這些幽默可以在日常生活中活躍氣氛,舒緩人們在快節(jié)奏生活中一直緊繃的神經(jīng)[15]。當(dāng)然,本文研究還有一定局限性:語用群的完整性與精確性有待提高;通過替換方法產(chǎn)生幽默的獨(dú)立性有待提高。隨著應(yīng)用語言學(xué)及大數(shù)據(jù)興起,語用群可以通過大數(shù)據(jù)技術(shù)進(jìn)行完善,但如何提高幽默的獨(dú)立性還是一個巨大挑戰(zhàn)。
參考文獻(xiàn):
[1] MORKES J, KERNAL H K, NASS C. Effects of humor in task-oriented human-computer interaction and computer-mediated communication: a direct test of SRCT theory[J]. Humana Computer Interaction,1999,14(4):395-435.
[2] HüBLER M T, BELL D C. Computer-mediated humor and ethos: exploring threads of constitutive laughter in online communities [J]. Computers & Composition,2003,20(3):277-294.
[3] TAYLOR B. Towards informal computer human communication: detecting humor in a restricted domain[D]. Cincinnati:University of Cincinnati,2008.
[4] FRIEDMAN L W, FRIEDMAN H H. A Framework for the study of computer-orientedu humour (cohum)[J]. Ssrn Electronic Journal, 2006,6(12):65-86.
[5] NIJHOLT A, NICULESCU A, VALITUTTI A, et al. Designing humor in human computer interaction (HUMIC 2017)[C]. Bombay, India: Ifip Tc.13 International Conference on Human-Computer Interaction-INTERACT, 2018.
[6] RITCHIE G. Current directions in computational humour[J]. Artificial Intelligence Review, 2001,16(2):119-135.
[7] BINSTED K,RITCHIE G. Computational rules for generating punning riddles[J]. Humor - International Journal of Humor Research, 2009,10(1):25-76.
[8] RITCHIE G, MANURUNG R, PAIN H, et al. A practical application of computational humour[C]. London: Proceedings of the 4th International Joint Workshop on Computational Creativity, 2007.
[9] VALITUTTI A,TOIVONEN H,DOUCET A,et al. Let everything turn well in your wife: generation of adult humor using lexical constraints[C].Sofia: The Meeting of the Association for Computational Linguistics, 2013.
[10] 嚴(yán)扣鳳.幽默語言的模糊手段及其運(yùn)用分析[J].文教資料,2014(17):35-36.
[11] 錢永紅,陳新仁.語料庫方法在語用學(xué)研究中的運(yùn)用[J].外語教學(xué)理論與實(shí)踐,2014(2):15-22.
[12] 余敏,王震宇,江耀純.淺析創(chuàng)造性判斷中下位概念對上位概念的影響[J].專利代理,2016(4):49-52.
[13] 董振東,董強(qiáng).知網(wǎng)[EB/OL]. http://www.keenage.com/zhiwang/c_zhiwang.html .2003.
[14] 代建英.漢語自動分詞系統(tǒng)的研究與實(shí)現(xiàn)[D].重慶:重慶大學(xué),2005.
[15] 閆芳.幽默以及幽默語言學(xué)研究綜述[J].南北橋,2010(7):40-41.
(責(zé)任編輯:何 麗)