貝小戎
上初中的時(shí)候,自習(xí)課上我會(huì)跟我的同桌玩這樣一個(gè)游戲:輪流讓對(duì)方在地理課本里的地圖中找一個(gè)地名,或者在語文課本的某一篇文章中找一個(gè)詞。我記得有一次他讓我在一篇文章中找“活該”二字,我找了半天也沒找到——完全沒想到這兩個(gè)字在《論雷峰塔的倒掉》的結(jié)尾,獨(dú)立成段。
有了Word文檔和電子書之后,搜索文本中某個(gè)詞的位置就非常容易了。畢業(yè)于哈佛大學(xué)的本·布拉特分析了各種文學(xué)經(jīng)典和暢銷書之后,他說J.K.羅琳最常用的是“魔杖”“巫師”“魔藥”,這顯而易見。比較新鮮的是,簡(jiǎn)·奧斯汀最常用的詞是“禮貌”“幻想”和“輕率”,海明威最常用的詞是“門房”“船尾”“干邑”,譚恩美最常用的是“葫蘆”“花生”“面條”,“007系列”小說中最常出現(xiàn)的是“洗手間”“褲子”和“閃耀”。納博科夫最喜歡用的詞是mauve,其實(shí)他喜歡各種表示顏色的詞,因?yàn)樗且粋€(gè)聯(lián)覺者,他說他聽到聲音的同時(shí)還能看到其顏色:g和r是黑色的,藍(lán)色組有鋼鐵般的x、雷雨云z和藍(lán)莓k,綠色組有榿木葉f、生蘋果p和阿月渾子t……
布拉特大膽斷言,對(duì)作品用詞的統(tǒng)計(jì)能辨別出作者是男性還是女性。有些詞的性別特征很明顯,如“刮胡子”和“購物”,有些不那么明顯,如“確實(shí)”和“有些”。他說,男性角色更有可能咕噥、咧嘴笑、輕聲笑、喊叫和殺人,女性角色注定要顫抖、哭泣、低語、尖叫和嫁人。根據(jù)他的統(tǒng)計(jì)和分析,托爾金的《霍比特人》的男性特質(zhì)占99.9%,《麥田里的守望者》則是經(jīng)典男性小說中女性特質(zhì)最強(qiáng)的。
他還分析了作家使用標(biāo)點(diǎn)符號(hào)的情況。美國(guó)犯罪小說家埃爾默·倫納德在《寫作的10條守則》中說,每10萬字使用的感嘆號(hào)不得超過2到3個(gè),而他自己并沒有遵守這一守則:他寫了40多部小說,總字?jǐn)?shù)有340萬,按照他提出的寫作建議,他在整個(gè)寫作生涯中使用的驚嘆號(hào)應(yīng)該只有102個(gè)。實(shí)際上,他用了1651個(gè),是他建議的數(shù)量的16倍,每10萬字用了49個(gè)。不過,相對(duì)來說,他使用的驚嘆號(hào)確實(shí)是最少的,可能用得最多的是喬伊斯,每10萬字1105個(gè),狄更斯也是一個(gè)很吵的作家(713個(gè)),最安靜的作家除了埃爾默·倫納德,還有海明威(59個(gè))、厄普代克(88個(gè))、福克納(108個(gè))。
讓人感到不可思議的是,文體分析還能用來看病和破案。有人發(fā)現(xiàn),英國(guó)首相哈羅德·威爾遜在他的演講中有明顯的認(rèn)知能力損傷的跡象,后來他主動(dòng)辭職了。近來有人說,艾麗絲·默多克去世后出版的小說中能看出她的心智退化的表現(xiàn),因?yàn)槲淖种杏行┚渥硬粔蜻B貫,用詞也不夠準(zhǔn)確。所以為了證明你自己的心智正常,也要挖空心思地推敲用詞。
(選自2018年03期《讀者·校園版》,本刊有刪改)