貝小戎++謝馭飛
上初中的時候,自習(xí)課上我會跟我的同桌玩這樣一個游戲:輪流讓對方在地理課本里的地圖中找一個地名,或者在語文課本的某一篇文章中找一個詞。我記得有一次他讓我在一篇文章中找“活該”二字,我找了半天也沒找到——完全沒想到這兩個字在《論雷峰塔的倒掉》的結(jié)尾,獨立成段。
有了Word文檔和電子書之后,搜索文本中某個詞的位置就非常容易了。畢業(yè)于哈佛大學(xué)的本·布拉特分析了各種文學(xué)經(jīng)典和暢銷書之后,他說J.K.羅琳最常用的是“魔杖”“巫師”“魔藥”,這顯而易見。比較新鮮的是,簡·奧斯丁最常用的詞是“禮貌”“幻想”和“輕率”,海明威最常用的詞是“門房”“船尾”“干邑”,譚恩美最常用的是“葫蘆”“花生”“面條”,“007系列”小說中最常出現(xiàn)的是“洗手間”“褲子”和“閃耀”。納博科夫最喜歡用的詞是mauve(紫色),其實他喜歡各種表示顏色的詞,因為他是一個聯(lián)覺者,他說他聽到聲音的同時還能看到其顏色:g和r是黑色的,藍(lán)色組有鋼鐵般的x、雷雨云z和藍(lán)莓k,綠色組有榿木葉f、生蘋果p和阿月渾子t……
布拉特大膽斷言,對作品用詞的統(tǒng)計能辨別出作者是男性還是女性。有些詞的性別特征很明顯,如“刮胡子”和“購物”,有些不那么明顯,如“確實”和“有些”。他說,男性角色更有可能咕噥、咧嘴笑、輕聲笑、喊叫和殺人,女性角色注定要顫抖、哭泣、低語、尖叫和嫁人。根據(jù)他的統(tǒng)計和分析,托爾金的《霍比特人》的男性特質(zhì)占99.9%,《麥田里的守望者》則是經(jīng)典男性小說中女性特質(zhì)最強的。
他還分析了作家使用標(biāo)點符號的情況。美國犯罪小說家埃爾莫·倫納德在《寫作的10條守則》中說,每10萬字使用的感嘆號不得超過2到3個,而他自己并沒有遵守這一守則:他寫了40多部小說,總字?jǐn)?shù)有340萬,按照他提出的寫作建議,他在整個寫作生涯中使用的驚嘆號應(yīng)該只有102個。實際上,他用了1651個,是他建議的數(shù)量的16倍,每10萬字用了49個。不過,相對來說,他使用的驚嘆號確實是最少的,用得最多的是喬伊斯,每10萬字1105個,狄更斯也是一個很吵的作家(713個),最安靜的作家除了埃爾莫·倫納德,還有海明威(59個)、厄普代克(88個)、??思{(108個)。
讓人感到不可思議的是,文體分析還能用來看病和破案。有人發(fā)現(xiàn),英國首相哈羅德·威爾遜在他的演講中有明顯的認(rèn)知能力損傷的跡象,后來他主動辭職了。美國聯(lián)邦調(diào)查局雇用了許多電腦高手幫他們做文本分析,但幫助他們找到大學(xué)炸彈客的是莎士比亞專家唐·福斯特。近來有人說,艾麗絲·默多克去世后出版的小說中能看出她的心智退化的表現(xiàn),她的文字中有些句子不夠連貫,用詞也不夠特別。所以為了證明你自己的心智正常,也要挖空心思地推敲用詞。