余一驕
(華中師范大學(xué)語(yǔ)言學(xué)系,湖北武漢,430079)
微信是當(dāng)前國(guó)內(nèi)最具影響力的移動(dòng)網(wǎng)絡(luò)社交平臺(tái),每天都有數(shù)以億計(jì)的中國(guó)人在微信中聊天、互動(dòng)。微信中產(chǎn)生了大量的漢語(yǔ)會(huì)話文本,這些文本既不屬于正式的書(shū)面語(yǔ),又不同于傳統(tǒng)的漢語(yǔ)口語(yǔ)。微信好友大多是生活中的熟人或朋友,因此微信言語(yǔ)交際模式與網(wǎng)絡(luò)論壇、博客、微博的言語(yǔ)交際模式存在顯著差異。微信語(yǔ)言具有哪些特征,將會(huì)對(duì)漢語(yǔ)未來(lái)的使用習(xí)慣產(chǎn)生何種影響,越來(lái)越受到學(xué)術(shù)界的關(guān)注。最近五年已有多篇論文討論過(guò)微信語(yǔ)言的風(fēng)格,已有的研究具有以下特點(diǎn):第一,對(duì)微信新聞標(biāo)題的語(yǔ)言特色研究較多,但對(duì)會(huì)話文本的研究較少[1]。第二,關(guān)注如何提高微信文本的受追捧程度,或如何縮小微信謠言的傳播范圍,而對(duì)語(yǔ)言風(fēng)格的研究較少[2]。第三,對(duì)少量微信文本進(jìn)行主觀考察的居多,卻對(duì)大樣本語(yǔ)料進(jìn)行定量統(tǒng)計(jì)的極少。我們僅查閱到一篇論文使用了LIWC(Linguistic Inquiry and Word Count)軟件對(duì)7116篇新聞文本進(jìn)行了詞頻統(tǒng)計(jì),但該文未對(duì)統(tǒng)計(jì)指標(biāo)和過(guò)程作詳細(xì)說(shuō)明[3]。
關(guān)于微信語(yǔ)言的研究,有必要在以下兩個(gè)方面進(jìn)行改進(jìn):第一,要加強(qiáng)對(duì)微信文本會(huì)話的語(yǔ)言風(fēng)格考察。如今主要的研究對(duì)象是微信新聞,但微信新聞大多是由專業(yè)寫(xiě)手撰寫(xiě),從作者向讀者單向傳播。微信新聞的語(yǔ)言風(fēng)格只能反映新聞寫(xiě)作者的語(yǔ)言風(fēng)格,難以代表數(shù)億微信用戶的漢語(yǔ)使用風(fēng)格。第二,利用專門(mén)的計(jì)算機(jī)軟件對(duì)大規(guī)模的微信語(yǔ)料進(jìn)行統(tǒng)計(jì),根據(jù)定量的統(tǒng)計(jì)結(jié)果來(lái)分析其語(yǔ)言風(fēng)格。語(yǔ)料少雖有利于語(yǔ)言研究者對(duì)其進(jìn)行深度分析,但不利于全面、客觀地描述微信語(yǔ)言的特點(diǎn)。
本文致力于建立大規(guī)模微信文本會(huì)話語(yǔ)料庫(kù),利用中文文本語(yǔ)言風(fēng)格分析軟件來(lái)統(tǒng)計(jì)語(yǔ)料,最終實(shí)現(xiàn)定量地描述微信會(huì)話的語(yǔ)言特征。本文結(jié)構(gòu)安排如下:第二部分介紹語(yǔ)料采集與統(tǒng)計(jì)方法;第三部分分析會(huì)話方式、會(huì)話長(zhǎng)度的統(tǒng)計(jì)結(jié)果;第四部分研究該語(yǔ)料庫(kù)的高頻字及其覆蓋率;第五部分對(duì)高頻詞統(tǒng)計(jì)結(jié)果進(jìn)行分析;第六部分總結(jié)全文。
微信會(huì)話主要分為微信群和微信好友兩種類型。微信群支持多人共享會(huì)話,微信好友則是一對(duì)一會(huì)話,私密性強(qiáng)。有些微信群中的成員具有真實(shí)的社交聯(lián)系,例如親友群、同事群、同學(xué)群、班級(jí)家長(zhǎng)群等;有些群則是因關(guān)注某個(gè)特定的話題而建立的,例如追日劇群、出國(guó)英語(yǔ)考試群等,該類群成員之間的社交聯(lián)系不如前者緊密。微信群中的發(fā)言者需要為自己的不當(dāng)言論承擔(dān)后果,通常多數(shù)微信群會(huì)話者發(fā)言前要考慮自己的表述是否恰當(dāng)。不同微信好友的會(huì)話風(fēng)格與會(huì)話者之間的關(guān)系、個(gè)人的語(yǔ)言習(xí)慣緊密相關(guān)。例如情侶之間的會(huì)話未必以文本方式為主,而是有較多的語(yǔ)音、視頻會(huì)話??紤]到兩類會(huì)話都很普遍,我們既采集微信群會(huì)話文本,也采集微信好友會(huì)話文本。
在2015年11月~2016年5月之間,兩位微信文本會(huì)話采集者先后加入了42個(gè)微信群。這42個(gè)微信群包括同學(xué)群、親友群、同事群、日劇群、出國(guó)英語(yǔ)考試群等。微信群中的成員所處地理位置分布較廣,但以原籍湖北、河南、湖南等省的人為主。群成員受教育水平差異較大,但受過(guò)高等教育的人比例最高。由于微信好友會(huì)話的私密性太強(qiáng),本文研究中僅采集到來(lái)自23對(duì)微信好友的會(huì)話語(yǔ)料。微信好友中的會(huì)話者都受過(guò)高等教育,年齡主要分布在20~30歲之間。
我們采用同步助手軟件,把智能手機(jī)中的原始微信聊天記錄導(dǎo)入到計(jì)算機(jī)中,并將其轉(zhuǎn)換為T(mén)XT格式的文本文件。同步助手軟件轉(zhuǎn)換的聊天記錄包括會(huì)話時(shí)間、發(fā)言者、會(huì)話方式、狀態(tài)(接受/發(fā)送)、會(huì)話內(nèi)容等多項(xiàng)信息。由于本文的研究重點(diǎn)是會(huì)話方式與會(huì)話內(nèi)容,因此我們開(kāi)發(fā)了專門(mén)的Java程序,對(duì)微信會(huì)話記錄進(jìn)行預(yù)處理。預(yù)處理包括以下三方面:第一,刪除非文本方式的會(huì)話記錄,例如圖像方式會(huì)話、視頻方式會(huì)話、語(yǔ)音方式會(huì)話等;第二,刪除發(fā)言時(shí)間、發(fā)言者、狀態(tài)等不必要的信息;第三,刪除不做處理的英文字母串或阿拉伯?dāng)?shù)字串,如手機(jī)號(hào)碼、郵箱地址等。
本文研究中所采集的原始微信會(huì)話語(yǔ)料超過(guò)57.6M個(gè)字節(jié),因數(shù)據(jù)量大,難以用因特網(wǎng)上免費(fèi)提供的字、詞統(tǒng)計(jì)軟件進(jìn)行統(tǒng)計(jì)。我們?cè)谥形奈谋窘y(tǒng)計(jì)方面具有較長(zhǎng)的研究經(jīng)歷和技術(shù)積累,獨(dú)立開(kāi)發(fā)了中文文本統(tǒng)計(jì)與檢索軟件[4],因此本文研究中的微信語(yǔ)料字統(tǒng)計(jì)、分詞、詞統(tǒng)計(jì)、互信息計(jì)算等均使用該軟件來(lái)完成。
中國(guó)、日本、韓國(guó)的網(wǎng)絡(luò)語(yǔ)言“顏文字”雖然均起源于英語(yǔ)中的表情符(emoticon)表達(dá)方式,但很快就有了顯著區(qū)別,其原因是三國(guó)的民眾都將英語(yǔ)表情符的表達(dá)方式和本國(guó)的文字進(jìn)行了靈活的組合[5]。隨著網(wǎng)絡(luò)通信帶寬的增加,網(wǎng)絡(luò)終端設(shè)備的計(jì)算和存儲(chǔ)能力增強(qiáng),網(wǎng)絡(luò)會(huì)話方式變得愈加豐富。近二十年來(lái),中國(guó)網(wǎng)民在網(wǎng)絡(luò)會(huì)話過(guò)程中,從只能輸入純粹的中英文字符,過(guò)渡到可輸入豐富的“火星文”、圖像、動(dòng)畫(huà)等多種類型的信息。微信更是提供了文本、圖像、動(dòng)畫(huà)表情、視頻、網(wǎng)頁(yè)鏈接等十多種網(wǎng)絡(luò)會(huì)話模式。
表1 各種會(huì)話方式所占會(huì)話次數(shù)的比例
本文研究的微信語(yǔ)料共包括475262次不同方式的會(huì)話,表1列出了十二種會(huì)話方式所占會(huì)話次數(shù)比例(本文所有的比例數(shù)據(jù),都對(duì)小數(shù)點(diǎn)后第三位數(shù)據(jù)做了四舍五入處理)。文本會(huì)話一共是394261次,占總次數(shù)的82.96%,是最主要的會(huì)話方式。值得指出的是:微信軟件把純粹由微信所提供的表情符組成的會(huì)話歸為文本方式的會(huì)話。動(dòng)畫(huà)表情、圖片分別是第二、第三高頻使用的會(huì)話方式。使用動(dòng)畫(huà)表情方式,大多是為了夸張、頑皮或戲謔地表達(dá)自己喜歡或厭惡、支持或反對(duì)的態(tài)度。選擇圖片方式進(jìn)行會(huì)話的原因則較為復(fù)雜,例如有些圖片能傳達(dá)文本不能表達(dá)或難以表達(dá)的信息,有些圖片能起到驚悚或吸引其他人注意力的效果。是否選擇語(yǔ)音方式進(jìn)行會(huì)話,既與會(huì)話人之間的親密程度相關(guān),也與發(fā)言者是否便于輸入文字相關(guān)。通常關(guān)系越親密的人,使用語(yǔ)音方式的概率越高;所處環(huán)境不便于打字或手寫(xiě)輸入,則使用語(yǔ)音方式的概率較高。總之,微信強(qiáng)大的信息輸入功能,使得文本會(huì)話不再是唯一選擇,可以預(yù)見(jiàn)未來(lái)文本會(huì)話所占比例會(huì)進(jìn)一步降低。
394261次微信文本發(fā)言共使用了2525301個(gè)漢字,因此,平均每次文本發(fā)言僅包含6.4個(gè)漢字。若是用一次發(fā)言所包含的漢字?jǐn)?shù)量來(lái)簡(jiǎn)單地度量文本會(huì)話的長(zhǎng)度,可知微信會(huì)話大多是很簡(jiǎn)短的。表2列出了在39.4萬(wàn)余次的文本會(huì)話中,不同長(zhǎng)度發(fā)言的次數(shù)、比例分布情況。根據(jù)表2左半部分所列數(shù)據(jù)可知,70.83%的發(fā)言所包括的漢字?jǐn)?shù)不超過(guò)7個(gè)。微信會(huì)話如此簡(jiǎn)短,存在主客觀兩個(gè)方面的原因。首先,網(wǎng)絡(luò)實(shí)時(shí)交流的環(huán)境決定了發(fā)言者必須高頻使用一些簡(jiǎn)短的句子,例如會(huì)話剛開(kāi)始時(shí),用“你好”或者“大家好”來(lái)打招呼;確認(rèn)信息時(shí),用“好的”或“行”來(lái)表明態(tài)度;用“再見(jiàn)”、“拜拜”來(lái)終止會(huì)話。其次,微信用戶似乎不大樂(lè)意寫(xiě)長(zhǎng)句子,而是用多個(gè)短句來(lái)描述一件事情或某種觀點(diǎn)。微信會(huì)話中,大家更趨向于以較快的速度發(fā)出一條訊息,以減少對(duì)方的等待時(shí)間。所以,一旦有個(gè)相對(duì)獨(dú)立的句子,用戶就會(huì)立即發(fā)送出去。出于這種心態(tài),本來(lái)可以用一個(gè)較長(zhǎng)的句子來(lái)完整表達(dá)的會(huì)話,最終被分解成了多條簡(jiǎn)短的訊息。
表2 不同長(zhǎng)度的文本會(huì)話次數(shù)與比例分布
語(yǔ)料中全體會(huì)話者的母語(yǔ)都是漢語(yǔ),表2卻顯示有21715次文本會(huì)話(占文本會(huì)話次數(shù)的5.51%)沒(méi)有使用漢字。細(xì)致考察這21715次會(huì)話,發(fā)現(xiàn)這些非漢語(yǔ)表達(dá)的會(huì)話主要分為四種類型:第一,有8347次會(huì)話是純粹利用微信表情符來(lái)進(jìn)行會(huì)話;第二,用英文單詞、英語(yǔ)句子打招呼或表示肯定或否定,例如OK、Bye、hi、baby、perfect、I love you等;第三,使用英語(yǔ)網(wǎng)絡(luò)詞,如“THX”(表示thanks),或中國(guó)人創(chuàng)造的網(wǎng)絡(luò)語(yǔ)言字母詞、數(shù)字詞等,例如2B、6666666等;第四,對(duì)其它人所提問(wèn)題的有效回答,例如阿拉伯?dāng)?shù)字形式的手機(jī)號(hào)碼、QQ號(hào)碼,英文字母和數(shù)字混合的郵箱地址、網(wǎng)頁(yè)地址等。第四類會(huì)話與用戶的語(yǔ)言使用習(xí)慣無(wú)關(guān)。從積極的角度來(lái)看,如今受過(guò)高等教育的年輕人對(duì)語(yǔ)言使用的態(tài)度越來(lái)越開(kāi)放和包容,能做到漢語(yǔ)、外語(yǔ)、表情符融合使用。但另一方面,中外文、表情符混雜使用,且缺乏明確的語(yǔ)法規(guī)則,這對(duì)漢語(yǔ)的純潔性具有負(fù)面影響。
北京大學(xué)開(kāi)發(fā)的CCL中文語(yǔ)料庫(kù)是有重大影響的書(shū)面語(yǔ)語(yǔ)料庫(kù)。它的語(yǔ)料規(guī)模大(現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)近5.1億個(gè)漢字)、來(lái)源廣泛、代表性強(qiáng),且公布了該語(yǔ)料庫(kù)的漢字頻次數(shù)據(jù)[6]。CCL語(yǔ)料庫(kù)能比較全面、定量地反映現(xiàn)代漢語(yǔ)書(shū)面語(yǔ)的漢字頻次使用特征。以下通過(guò)與北京大學(xué)CCL語(yǔ)料庫(kù)的漢字頻次統(tǒng)計(jì)結(jié)果做對(duì)比,來(lái)分析微信會(huì)話中的漢字頻次特征。
微信文本會(huì)話語(yǔ)料庫(kù)共包括2525301個(gè)漢字,4957種不同的漢字。CCL語(yǔ)料庫(kù)中共出現(xiàn)了10645種不同的漢字。表3列出了微信會(huì)話語(yǔ)料庫(kù)與CCL語(yǔ)料庫(kù)的高頻字集對(duì)比結(jié)果?!暗摹?、“一”、“是”、“了”、“不”、“有”等6種漢字是微信語(yǔ)料庫(kù)和CCL語(yǔ)料庫(kù)共同的最高頻的10種字,因此兩個(gè)語(yǔ)料庫(kù)最高頻10種漢字集的重合率為6/10=60%。從表3中的重合率數(shù)據(jù)可知,兩個(gè)語(yǔ)料庫(kù)的最高頻漢字集有較大區(qū)別。對(duì)比兩組覆蓋率數(shù)據(jù)可知,微信語(yǔ)料庫(kù)最高頻的10種、20種、50種、100種、200種漢字的覆蓋率都顯著高于CCL語(yǔ)料庫(kù)。在微信語(yǔ)料中,有581種漢字(占字種數(shù)的11.72%)僅出現(xiàn)了1次,388種漢字(占字種數(shù)的7.83%)僅出現(xiàn)2次,有1857種漢字(占字種數(shù)的37.46%)的使用頻次低于10次。因此,微信中的漢字使用更集中。
表3 微信語(yǔ)料庫(kù)與CCL語(yǔ)料庫(kù)的高頻字對(duì)比
由表3所列的微信語(yǔ)料高頻獨(dú)有字,可知微信會(huì)話用字具有以下三個(gè)特點(diǎn)。
第一,部分口語(yǔ)交際常用字頻次極高。表3顯示“我”、“你”、“好”、“哈”等字的頻次位于前10名?!肮弊衷谖⑿耪Z(yǔ)料中頻次排序第4,而在CCL中排名第698,二者相差694位?!肮弊衷谖⑿艜?huì)話語(yǔ)言中的使用既高頻又不符合常規(guī)。在CCL語(yǔ)料庫(kù)中,檢索到“哈”字連續(xù)使用的最長(zhǎng)串是8個(gè)“哈”字連用(僅4條語(yǔ)料)。CCL中比例最高的是“哈哈”或“哈”。在被統(tǒng)計(jì)的微信文本會(huì)話語(yǔ)料庫(kù)中,十個(gè)或十個(gè)以上的“哈”字連用的現(xiàn)象出現(xiàn)了數(shù)百次,最長(zhǎng)的竟然達(dá)到了89個(gè)“哈”字連用。數(shù)十個(gè)“哈”字連用的例子,在傳統(tǒng)的語(yǔ)料庫(kù)系統(tǒng)中極為罕見(jiàn)。
第二,涉及日常生活的漢字頻次高,涉及國(guó)家、社會(huì)、經(jīng)濟(jì)、政治等領(lǐng)域的漢字頻次低?!八?、“愛(ài)”、“吃”、“群”、“紅”、“包”屬于微信中最高頻的100種漢字?!肮ぁ薄ⅰ皣?guó)”、“政”、“民”屬于CCL語(yǔ)料庫(kù)中最高頻的100種漢字,而在微信中卻排在第268名之后,“政”字更是位于第1605名。有研究者認(rèn)為中國(guó)政府執(zhí)行的網(wǎng)絡(luò)信息過(guò)濾政策,對(duì)網(wǎng)絡(luò)用戶的語(yǔ)言產(chǎn)生了極大影響[7]。在39.4萬(wàn)余次的文本會(huì)話中,很少涉及國(guó)內(nèi)外政治、經(jīng)濟(jì)問(wèn)題的討論,眾多的討論主題持續(xù)集中在娛樂(lè)、美食、購(gòu)物、學(xué)習(xí)、考試等方面。年輕人更關(guān)注個(gè)人生活,可能才是導(dǎo)致“工”、“國(guó)”、“政”、“民”等字低頻出現(xiàn)的主要原因。
第三,有些代表性的網(wǎng)絡(luò)用語(yǔ)高頻字,在微信語(yǔ)料庫(kù)中的頻次并不高。例如,“囧”字是具有代表性的網(wǎng)絡(luò)用語(yǔ)高頻字,但在微信會(huì)話語(yǔ)料中,它僅出現(xiàn)22次,字頻排序?yàn)榈?603位。我們用多種品牌的智能手機(jī)做過(guò)測(cè)試,無(wú)論是手寫(xiě)收入,還是拼音輸入,都能快速輸入“囧”字。因此,輸入法不是導(dǎo)致“囧”字使用較少的主要原因。微信軟件提供了表示尷尬、困窘、汗顏的表情符,該類表情符被高頻使用。隨著表情符和表情包的流行,微信用戶逐漸用更生動(dòng)、形象的表情符和表情包取代了曾經(jīng)的“顏文字”——“囧”。
由于CCL沒(méi)有公布詞頻統(tǒng)計(jì)結(jié)果,故無(wú)法將微信文本會(huì)話語(yǔ)料的詞頻統(tǒng)計(jì)結(jié)果與之對(duì)比。但在2011年至2013年期間,我們?cè)_(kāi)發(fā)了一個(gè)約4.86億字規(guī)模,包括現(xiàn)當(dāng)代文學(xué)、新聞報(bào)道、政府公文、網(wǎng)絡(luò)小說(shuō)、法律法規(guī)的現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)CICI。我們使用同一個(gè)軟件對(duì)微信語(yǔ)料和CICI語(yǔ)料進(jìn)行了分詞處理和詞頻統(tǒng)計(jì)。
表4列出了微信語(yǔ)料庫(kù)和CICI語(yǔ)料庫(kù)的高頻詞對(duì)比情況。由表4第二列所示的一組重合率數(shù)據(jù)可知,兩個(gè)語(yǔ)料庫(kù)最高頻詞的重合率約為60%,因此二者的高頻詞集合差異明顯。在兩個(gè)語(yǔ)料庫(kù)的最高頻300種詞中,“的”、“了”等單音節(jié)詞重合較多,雙音節(jié)詞重合數(shù)量較少,沒(méi)有重合的三音節(jié)詞?!盀槭裁础痹谖⑿耪Z(yǔ)料中的詞頻排序是第130名,在CICI語(yǔ)料中的排序是第367名,僅有“為什么”這一個(gè)三音節(jié)詞的詞頻排序同時(shí)位于兩個(gè)語(yǔ)料庫(kù)的前1000名?!盀槭裁础薄ⅰ安畈欢唷?、“一會(huì)兒”、“怎么樣”、“沒(méi)什么”、“干什么”6種三音節(jié)詞的詞頻排名都在兩個(gè)語(yǔ)料庫(kù)的前2000名之內(nèi)。
表4 微信語(yǔ)料庫(kù)與CICI語(yǔ)料庫(kù)的高頻詞對(duì)比
新詞新語(yǔ)是網(wǎng)絡(luò)語(yǔ)言研究的核心問(wèn)題。本文既關(guān)心微信會(huì)話中高頻使用的網(wǎng)絡(luò)新詞新語(yǔ),也關(guān)心微信語(yǔ)料中產(chǎn)生了哪些新詞新語(yǔ)。詞頻統(tǒng)計(jì)結(jié)果顯示:部分網(wǎng)絡(luò)詞語(yǔ)在微信中頻繁出現(xiàn),例如“寶寶”、“臥槽”、“約炮”、“尼瑪”、“我擦”等。“寶寶”的頻次為2884;“臥槽”出現(xiàn)853次;“約炮”出現(xiàn)257次;“尼瑪”出現(xiàn)253次;“我擦”出現(xiàn)154次?!皩殞殹痹臼菍?duì)小孩兒的愛(ài)稱。而近年來(lái)網(wǎng)絡(luò)用戶不分男女老少,喜歡自稱“寶寶”或互稱“寶寶”?!皩殞殹钡念l次在微信語(yǔ)料中排名第100,“本寶寶”、“群主寶寶”、“嚇?biāo)缹殞殹钡仁褂妙l繁,而作為本義使用的較少。由此可知,微信會(huì)話中賣(mài)萌化的語(yǔ)言風(fēng)格十分強(qiáng)烈。但值得注意的是:微信語(yǔ)言和微博語(yǔ)言的高頻網(wǎng)絡(luò)熱詞不太一致。例如,“歐巴”、“歐巴?!薄ⅰ疤}莉”、“草泥馬”等典型的微博熱詞在微信會(huì)話語(yǔ)料庫(kù)中的頻次卻并不高。“歐巴”出現(xiàn)22次;“草泥馬”出現(xiàn)18次;“蘿莉”出現(xiàn)15次;“歐巴桑”出現(xiàn)1次。由此可知,把微博語(yǔ)言和微信語(yǔ)言籠統(tǒng)地歸為微語(yǔ)言進(jìn)行研究,不利于描述二者的細(xì)微區(qū)別。
計(jì)算二字串或三字串的互信息大小,是自動(dòng)發(fā)現(xiàn)漢語(yǔ)新詞的有效辦法。本文研究過(guò)程中,根據(jù)N-gram串統(tǒng)計(jì)結(jié)果,計(jì)算了微信語(yǔ)料庫(kù)中全體2字串、3字串的互信息值。結(jié)果顯示:互信息高的新詞大多為人名、地名(例如街道名)、影視劇名、商品名等專屬名詞,基本上沒(méi)有發(fā)現(xiàn)頻次、互信息均很高的非專屬名詞。由此可知,微信用戶樂(lè)意在會(huì)話中使用已經(jīng)流行的網(wǎng)絡(luò)詞語(yǔ),而不是在微信中自造新詞新語(yǔ)。微信會(huì)話的傳播范圍極為有限。用戶在微信會(huì)話中自造的新詞新語(yǔ),既存在被對(duì)方誤解的風(fēng)險(xiǎn),又因讀者太少,難以在網(wǎng)絡(luò)上大范圍傳播。自造新詞對(duì)凸顯發(fā)言者的個(gè)性沒(méi)有顯著效果,使用流行的網(wǎng)絡(luò)新詞新語(yǔ)不失為彰顯個(gè)性的可行途徑??傊哳l地使用已有網(wǎng)絡(luò)新詞新語(yǔ),而不是自創(chuàng)網(wǎng)絡(luò)新詞新語(yǔ),是微信會(huì)話小范圍傳播語(yǔ)言與微博、博客等大范圍傳播語(yǔ)言的一個(gè)重要差異。所以研究微信語(yǔ)言時(shí),更應(yīng)該關(guān)注微信會(huì)話中的高頻網(wǎng)絡(luò)詞語(yǔ)的種類、特點(diǎn)及其成因,而不是微信會(huì)話過(guò)程中創(chuàng)造出的新詞新語(yǔ)。
盡管微信會(huì)話大多是熟人之間的交談,但詞頻統(tǒng)計(jì)結(jié)果卻表明微信會(huì)話仍存在用語(yǔ)過(guò)于粗俗的現(xiàn)象。以包含了“逼”、“屌”等字的詞語(yǔ)的頻次數(shù)據(jù)來(lái)深入分析該現(xiàn)象。“牛逼”出現(xiàn)240次;“傻逼”出現(xiàn)205次;“裝逼”出現(xiàn)130次;“撕逼”出現(xiàn)58次;“懵逼”出現(xiàn)50次;“苦逼”出現(xiàn)33次;“逼格”出現(xiàn)27次;“逗逼”出現(xiàn)19次;“丑逼”出現(xiàn)13次;“蒙逼”出現(xiàn)9次;“媽逼”出現(xiàn)8次;“二逼”、“窮逼”各出現(xiàn)7次;“逼樣”出現(xiàn)6次;“帥逼”、“狗逼”各出現(xiàn)5次;“摳逼”出現(xiàn)4次;“慫逼”出現(xiàn)3次。在微信語(yǔ)料中,“屌絲”出現(xiàn)了83次,“很屌”、“不屌×”等格式比較常見(jiàn)。“屌”字的用法比較復(fù)雜,可以用作形容詞、名詞、動(dòng)詞。與比較熟悉的人用文字進(jìn)行交流都如此不文雅,未來(lái)有必要引導(dǎo)民眾在微信中文明、規(guī)范地使用漢語(yǔ)[8]。2017年1月我們對(duì)部分女大學(xué)生和女研究生展開(kāi)調(diào)查,想了解她們?yōu)楹问褂冒氨啤?、“屌”等字的詞語(yǔ)。不少被調(diào)查者反映:她們看到“逼”、“屌”等字時(shí),只將其作為中性字,通常不會(huì)聯(lián)想到這涉嫌罵人或用語(yǔ)粗俗。由此可見(jiàn),這些過(guò)去被認(rèn)為粗俗的字詞,如今在微信會(huì)話中呈現(xiàn)出了去污名化的新趨勢(shì)。
本文采用統(tǒng)計(jì)大規(guī)模真實(shí)文本會(huì)話語(yǔ)料的方法來(lái)研究微信語(yǔ)言的風(fēng)格。本文的研究具有以下兩個(gè)特色:第一,對(duì)39.4萬(wàn)余次文本會(huì)話、252萬(wàn)余字的真實(shí)微信文本會(huì)話語(yǔ)料進(jìn)行了定量統(tǒng)計(jì)。過(guò)去關(guān)于微信語(yǔ)言風(fēng)格研究的部分結(jié)論在大樣本統(tǒng)計(jì)分析中是不成立的,例如微信創(chuàng)造了大量的網(wǎng)絡(luò)新詞新語(yǔ)。第二,更關(guān)注普通民眾的微信文本會(huì)話的語(yǔ)言風(fēng)格,認(rèn)為文本會(huì)話語(yǔ)言風(fēng)格更深刻地反映當(dāng)前漢語(yǔ)的使用狀況。未來(lái)應(yīng)擴(kuò)大語(yǔ)料來(lái)源,對(duì)活躍的微信群進(jìn)行長(zhǎng)時(shí)間的觀察,更細(xì)致地考察微信會(huì)話風(fēng)格變化的歷時(shí)規(guī)律。另外,對(duì)表情符、表情包的使用模式也要做更深入的研究。
*本文系教育部人文社會(huì)科學(xué)研究項(xiàng)目“基于大規(guī)模微信文本語(yǔ)料庫(kù)的漢語(yǔ)會(huì)話分析”【16YJA740047】的階段性成果。
注釋:
[1]李少丹:《微信文本標(biāo)題修辭特征與修辭過(guò)度顯現(xiàn)探析》,《福建師范大學(xué)學(xué)報(bào)》(哲學(xué)社會(huì)科學(xué)版)2015年第3期,第70-75頁(yè);趙文雯:《新聞標(biāo)題語(yǔ)言的特點(diǎn)及規(guī)范化探究》,《新聞世界》,2016年第6期,第40~44頁(yè)。
[2]劉銳:《微信謠言元文本的召喚結(jié)構(gòu)、受眾期待視野與辟謠策略》,《情報(bào)雜志》2016年第12期,第34~41頁(yè)。
[3]何凌南、胡靈舒、李威、張志安:《“標(biāo)題黨”與“負(fù)能量”——媒體類微信公眾號(hào)的語(yǔ)言風(fēng)格分析》,《新聞戰(zhàn)線》2016年第13期,第42~47頁(yè)。
[4]余一驕、劉芹:《面向超大規(guī)模的中文文本N-gram串統(tǒng)計(jì)》,《計(jì)算機(jī)科學(xué)》2014年第4期,第263~268頁(yè)。
[5]Xiangxi Liu,TheLinguisticAnalysisofChineseEmoticon,University of Massachusetts at Amherst,2015.
[6]CCL:《現(xiàn)代漢語(yǔ)語(yǔ)料》。[2003年] http://ccl.pku.edu.cn:8080/ccl_corpus/xiandai_char_info.pdf.
[7]Audrey M. Wozniak,Reiver-Crabbed Shitizens,Missing Knives,“A Sociolinguistic Analysis of Trends in Chinese Language Use Online as a Result of Censorship”,AppliedPsychologyReview,1,2015,pp.97-120.
[8]呂超男:《論微信語(yǔ)言文字應(yīng)用的規(guī)范化問(wèn)題》,《北華大學(xué)學(xué)報(bào)》(社會(huì)科學(xué)版)2016年第4期,第15~19頁(yè)。