国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

毛澤東話語(yǔ)的詞語(yǔ)特征

2017-01-10 13:13曾祥喜
關(guān)鍵詞:詞頻毛澤東話語(yǔ)

曾祥喜

摘要:毛澤東話語(yǔ)是中國(guó)當(dāng)代最具有影響力的話語(yǔ),其話語(yǔ)特征具有毛澤東式的顯性特征。以《毛澤東文集》(6-8))為分析對(duì)象,通過封閉式的詞語(yǔ)數(shù)據(jù)統(tǒng)計(jì)分析出毛澤東話語(yǔ)的詞語(yǔ)特征為:詞語(yǔ)分布集中;平均詞長(zhǎng)偏短;詞語(yǔ)重復(fù)率高。并在此基礎(chǔ)上總結(jié)出毛澤東話語(yǔ)詞語(yǔ)在頻率分布及詞語(yǔ)選擇上的具有個(gè)性化的特征。

關(guān)鍵詞:毛澤東;話語(yǔ);詞頻;詞語(yǔ)特征

中圖分類號(hào):A41;H13; H15

文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.3963/j.issn.1671-6477.2016.06.0036

毛澤東話語(yǔ)無疑是中國(guó)當(dāng)代最具代表性的權(quán)勢(shì)話語(yǔ),其影響,正如錢理群教授所指出的:“毛澤東是真正影響了生活在‘毛澤東時(shí)代的每一個(gè)中國(guó)國(guó)民的,而其隱性影響還傳到了他們的后代。這就是說,中國(guó)國(guó)民性實(shí)際上已經(jīng)經(jīng)過了毛澤東的改造,時(shí)至今日,人們?cè)谟^察大陸中國(guó)人的思想觀念、思維方式、行為方式,以至言說方式時(shí),都可以發(fā)現(xiàn)或顯或隱的毛澤東思想的烙印”[1] 。

作為當(dāng)代中國(guó)主流話語(yǔ)——毛澤東話語(yǔ)在中國(guó)境內(nèi)受到的關(guān)注并不多,大多數(shù)中國(guó)學(xué)者研究毛澤東的語(yǔ)言主要是著眼于分析他的語(yǔ)言風(fēng)格或語(yǔ)言藝術(shù)。近幾年有少數(shù)學(xué)者開始關(guān)注毛澤東的話語(yǔ)研究,如文貴良[2]分析了毛澤東思想及話語(yǔ)如何成為中國(guó)現(xiàn)當(dāng)代具有影響力的權(quán)威話語(yǔ),該文重在描述“史”發(fā)展過程,并未涉及到毛澤東話語(yǔ)的特征分析。但在其隨后的論著《話語(yǔ)與生存:解讀戰(zhàn)爭(zhēng)年代文學(xué)(1937-1948)》[3]中,對(duì)毛澤東話語(yǔ)的影響作了非常深入而細(xì)致的分析,他認(rèn)為毛澤東終其一生都在致力于話語(yǔ)建設(shè),在政治話語(yǔ)的形成和實(shí)踐中,借話語(yǔ)權(quán)威的符號(hào)化的“毛澤東”而以言行事。王文濤 [4]主要介紹Schwartz①關(guān)于“毛主義話語(yǔ)”論述和分析,亦并未對(duì)毛澤東話語(yǔ)作進(jìn)一步的深入分析和研究。而國(guó)際上,對(duì)毛澤東話語(yǔ)的研究分析一直以來都受到相當(dāng)重視。這些研究者多從權(quán)勢(shì)話語(yǔ)角度并結(jié)合中國(guó)的政治和革命展開分析論述,如D. Apter 結(jié)合中國(guó)社會(huì)革命和歷史分析描述了毛澤東話語(yǔ)[5],如何從延安時(shí)代開始發(fā)展成為一種權(quán)勢(shì)話語(yǔ),而這種話語(yǔ)又如何影響了中國(guó)的革命和社會(huì)??傮w上多是對(duì)毛澤東話語(yǔ)的宏觀分析,而缺乏一定的微觀視野。因此,本文將致力于通過對(duì)毛澤東話語(yǔ)文本詞語(yǔ)運(yùn)用微觀而細(xì)致的統(tǒng)計(jì)分析描寫毛澤東話語(yǔ)的詞語(yǔ)特征。

本文主要分析毛澤東話語(yǔ)的詞語(yǔ)特征。以詞頻分析作為主要內(nèi)容,通過統(tǒng)計(jì)數(shù)據(jù)描寫毛澤東話語(yǔ)的文本詞語(yǔ)頻率特征。本論文選擇高頻詞作為分析的突破點(diǎn)是基于以下想法:其一,高頻詞反映出話語(yǔ)最基本的特征。語(yǔ)言最基本的運(yùn)用單位就是詞。而某些詞之所以能被高頻率地使用,在很大程度上,它們反映出當(dāng)時(shí)社會(huì)的熱門問題或話語(yǔ),而這類詞主要通過實(shí)詞如名詞、動(dòng)詞、形容詞、代詞等表現(xiàn)出來。其二,詞語(yǔ)分析在文本中更易于定量研究。它摒棄了主觀判斷所帶來的不足,可使研究結(jié)果更為客觀、科學(xué),從而得出令人信服的結(jié)論。本論文的語(yǔ)料來源于《毛澤東文集》(6-8卷)(總字?jǐn)?shù)計(jì)485 869)。該文集由人民出版社1996、1999年出版?!睹珴蓶|文集》(6-8)卷是毛澤東建國(guó)后(1949年10月1日)的一些文章,該文集編選的文章是《毛澤東選集》以外的重要文稿,該文稿絕大部分根據(jù)中央檔案館保存的毛澤東手稿、早期文本和記錄稿刊印,保持原貌,只校正文稿中的錯(cuò)字、漏字、衍字以及明顯有誤的標(biāo)點(diǎn),訂正錯(cuò)訛的史實(shí),講話、談話記錄稿只作技術(shù)性的整理。在內(nèi)容上,毛澤東的這些文本涉及政治、經(jīng)濟(jì)、軍事、外交、文學(xué)藝術(shù)等領(lǐng)域以及少量私人通信。可以說,它能真實(shí)地表現(xiàn)毛澤東話語(yǔ)/文本的特征。本文將《毛澤東文集》(6-8卷)建成一個(gè)封閉式語(yǔ)料庫(kù),運(yùn)用的分詞軟件是湖北大學(xué)付正剛先生在湖北大學(xué)教授易洪川研究發(fā)明的“易五碼查字法”(獲國(guó)家專利)技術(shù)基礎(chǔ)上開發(fā)的自動(dòng)分詞軟件,并可對(duì)分詞進(jìn)行人工干預(yù)。有關(guān)“詞”的判斷以中國(guó)社會(huì)科學(xué)研究院語(yǔ)言研究所編纂的《現(xiàn)代漢語(yǔ)詞典》(商務(wù)印書館1997年版)為準(zhǔn),另增添一定數(shù)量的固定短語(yǔ)。

一、毛澤東話語(yǔ)的詞語(yǔ)頻率特征

通過運(yùn)用自動(dòng)分詞軟件的統(tǒng)計(jì)分析,可以看出毛澤東話語(yǔ)的詞語(yǔ)頻率具有以下特征:

其一,詞語(yǔ)分布集中。從詞語(yǔ)使用頻次上來看,毛澤東著作的文本中,高頻詞詞條數(shù)量少,但使用頻次卻非常高,表現(xiàn)出高頻詞集中的特點(diǎn),在詞語(yǔ)分布上也占據(jù)了絕對(duì)優(yōu)勢(shì)。為了進(jìn)行比較,下面先統(tǒng)計(jì)分析使用次數(shù)小于10的低頻詞使用頻率②,具體情況見表1。

從表1中可以看到,使用頻次1~9的詞語(yǔ)在毛澤東文本中共有10 398個(gè)詞條,占總詞條的80.059%,但它們相對(duì)累積頻率卻僅有7.698%。與高頻詞語(yǔ)相反,雖然詞條數(shù)量大,但它們的使用頻率上的比重卻并不高,明顯處于弱勢(shì),平均詞語(yǔ)出現(xiàn)(它們的使用頻次數(shù)/此類詞條數(shù))僅為2.2157次。

與低頻詞形成強(qiáng)烈反差的是,其中高頻詞的使用集中,毛澤東文本中的中、高頻詞(使用頻次10次及以上)的詞條共2590個(gè),在詞條總數(shù)中僅占19.941%,它們使用的頻次是276 345,占總使用頻次的92.23%,也就是說,毛澤東文本中不到20%的高頻詞語(yǔ)使用頻率超過了90%以上(詳情見表2)。如果我們以此為依據(jù)來計(jì)算這類高頻詞的相對(duì)出現(xiàn)率,其平均出現(xiàn)率則高達(dá)106.697次,可見其分布的密集程度。

其二,平均詞長(zhǎng)偏短?!睹珴蓶|文集》(6-8卷)文本共使用詞語(yǔ)299 384條次,使用的詞語(yǔ)共12 988條,平均詞長(zhǎng)為1.6229。據(jù)《現(xiàn)代漢語(yǔ)詞語(yǔ)頻率辭典》的統(tǒng)計(jì)[6],現(xiàn)代漢語(yǔ)詞語(yǔ)“詞條”的平均詞長(zhǎng)為2.0928,即現(xiàn)代漢語(yǔ)詞語(yǔ)大多數(shù)大于雙音節(jié),也就是說,現(xiàn)代漢語(yǔ)詞語(yǔ)的主體是雙音節(jié)詞。毛澤東文本詞語(yǔ)詞長(zhǎng)明顯低于現(xiàn)代漢語(yǔ)一般文本的詞長(zhǎng),其原因主要是單音節(jié)詞語(yǔ)的比例比一般文本高?,F(xiàn)代漢語(yǔ)單音節(jié)詞主要集中在基本詞匯,也就是說毛澤東文本中的基本詞匯使用比例比較高,因而單音節(jié)詞語(yǔ)多,詞長(zhǎng)相對(duì)就偏短。另外,單音節(jié)詞在現(xiàn)代漢語(yǔ)口語(yǔ)中應(yīng)用也非常多。毛澤東文本平均詞長(zhǎng)偏短的原因也由于其話語(yǔ)風(fēng)格口語(yǔ)化程度較高,這與毛澤東自《延安文藝座談會(huì)上的講話》所提倡的文風(fēng)有密切的關(guān)系[7]。由于中國(guó)共產(chǎn)黨宣傳對(duì)象為工人農(nóng)民階級(jí),其文化水平都不高,因此,毛澤東踐行了他提倡的向人民群眾學(xué)習(xí)語(yǔ)言的方針,并一貫保持著這種文風(fēng)。這種俗白的口語(yǔ)風(fēng)格造成了毛澤東文本單音節(jié)詞多、詞長(zhǎng)短的特點(diǎn)。

其三,詞語(yǔ)重復(fù)率高。在《毛澤東文集》(6-8卷)文本中,總字?jǐn)?shù)計(jì)485 869,共使用詞語(yǔ)299 384條次,使用的詞語(yǔ)共12 988條,平均每條詞語(yǔ)出現(xiàn)23.051次,即重復(fù)率超過23次。詞語(yǔ)重復(fù)率高,使用的詞語(yǔ)數(shù)量相對(duì)就少,這可能與毛澤東話語(yǔ)主題具有明顯的傾向性有關(guān),也反映出毛澤東話語(yǔ)的詞語(yǔ)選擇傾向,也佐證了毛澤東話語(yǔ)的俗白口語(yǔ)化風(fēng)格。

如果分析將詞條每條在總文本中的出現(xiàn)率,即詞條數(shù)與文本總字?jǐn)?shù)之比,毛澤東文本的詞語(yǔ)出現(xiàn)率為0.02673。同樣方法,比較其他一些語(yǔ)料庫(kù)數(shù)據(jù)(語(yǔ)料時(shí)段:1919年-1980年代)[8]如:北京航天航空大學(xué)漢語(yǔ)詞庫(kù),語(yǔ)料庫(kù)容量為21236784字,96730個(gè)詞條,詞語(yǔ)出現(xiàn)率為0.00455;北京語(yǔ)言大學(xué)漢語(yǔ)詞庫(kù),語(yǔ)料庫(kù)容量為1800000字,31159個(gè)詞條,詞語(yǔ)出現(xiàn)率為0.01731;北京師范大學(xué)漢語(yǔ)詞庫(kù),語(yǔ)料庫(kù)容量為1068000字,39601個(gè)詞條,詞語(yǔ)出現(xiàn)率為0.03707。

將毛澤東文本有關(guān)數(shù)據(jù)與這三家語(yǔ)料庫(kù)的數(shù)據(jù)進(jìn)行比較分析,可以看到,毛澤東文本的詞語(yǔ)出現(xiàn)率大于前兩家,即大于一般普通文本。北京師范大學(xué)漢語(yǔ)詞庫(kù)的語(yǔ)料性質(zhì)為“中小學(xué)語(yǔ)文課本語(yǔ)料庫(kù)”,即文本對(duì)象主要是未成年的青少年。由于文本性質(zhì)的關(guān)系,其詞語(yǔ)數(shù)量相對(duì)少或貧乏,詞語(yǔ)出現(xiàn)率較高。詞語(yǔ)的出現(xiàn)率也從另一個(gè)側(cè)面反映出詞語(yǔ)是否多樣化,即詞語(yǔ)出現(xiàn)率越高,多樣化程度越低,詞匯相對(duì)就顯得單一。

二、毛澤東話語(yǔ)詞語(yǔ)的詞類特征

(一)名詞與動(dòng)詞是毛澤東話語(yǔ)中的絕對(duì)高頻詞詞類

名詞與動(dòng)詞是其高頻詞類。毛澤東話語(yǔ)的中高頻詞語(yǔ)中,從詞類上來分析,詞類集中,主要多使用兩類詞,最多的名詞,其次是動(dòng)詞。也就是說,名詞和動(dòng)詞數(shù)量多且使用頻率高,重復(fù)使用程度高。其它各類詞語(yǔ)使用比例見表3。

(二)毛澤東話語(yǔ)中的相對(duì)高頻詞詞類

為了與現(xiàn)代漢語(yǔ)其他文本進(jìn)行比較,筆者將中國(guó)國(guó)家語(yǔ)委現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)作為一個(gè)比較參照,將毛澤東文本的高頻詞中前50條逐一查詢,語(yǔ)料庫(kù)中詞語(yǔ)高頻詞順序如下(以毛澤東文本的高頻詞為范圍前50個(gè)):

的/了/在/是/和/一/我/這/他/有/不/中/也/就/地/著/上/為/對(duì)/人/年/與/說/種/都/個(gè)/而/你/要/我們/把/從/來/等/又/到/大/發(fā)展/以/它/多/還/沒有/兩/他們/能/所/很/用/得/

將它與毛澤東文本比較,我們發(fā)現(xiàn),毛澤東特有的高頻詞(前50)是:?jiǎn)栴}/人民/好/可以/你們/中國(guó)/國(guó)家/現(xiàn)在/各/工作/社會(huì)主義/美國(guó)/同/會(huì)/這樣/看/等詞語(yǔ),在一般文本中使用頻率遠(yuǎn)不如毛澤東的使用頻率高,有的甚至使用頻率較低或很低。

將毛澤東文本與語(yǔ)料庫(kù)文本進(jìn)行比較,其使用頻率有一些不同,具體數(shù)據(jù)見表3。

以上50詞在毛澤東文本中的平均出現(xiàn)率是0.47187,一般文本中平均出現(xiàn)率為0.22271,兩者之比為:2.11876:1。同時(shí),通過對(duì)毛澤東文本出現(xiàn)率與一般文本出現(xiàn)率的比率進(jìn)行標(biāo)準(zhǔn)差計(jì)算,標(biāo)準(zhǔn)差為2.815332。也就是說,在毛澤東文本中,這些高頻詞出現(xiàn)率比在一般文本中的出現(xiàn)率高2倍多。

我們假設(shè),毛澤東文本詞語(yǔ)出現(xiàn)率在這個(gè)范圍內(nèi)都屬正常。我們可以把比率為3以內(nèi)的出現(xiàn)率視為近似,即兩者具有一致性。將兩者的一致性程度分為五等,即:一致(出現(xiàn)率之比在2以內(nèi))、基本一致(出現(xiàn)率之比2~3)、基本不一致(出現(xiàn)率之比3~4)、不一致(出現(xiàn)率之比5~6)、完全不一致(出現(xiàn)率之比7以上)。

就目前筆者所分析的此50個(gè)高頻詞來看,在兩類不同文本中高頻詞一致的詞語(yǔ)有:

中/地/我/在/和/的/了/對(duì)/他/上/種/年/說/一/

高頻詞基本一致的有:

都/大/兩/多/到/看/能/這/也/會(huì)/人/要/是/

高頻詞基本不一致的依次是:

他們/中國(guó)/沒有/就/有/這樣/還/很/工作

高頻詞不一致的依次是:

不/個(gè)/各/問題/好/國(guó)家

高頻詞完全不一致的依次是:

你們/可以/人民/美國(guó)/我們/社會(huì)主義/現(xiàn)在/同

從以上的分析看,在兩類文本出現(xiàn)率基本一致主要是以下幾類:助詞“的”、“地”(含簡(jiǎn)縮名詞)、“了”;介詞“在”、“對(duì)”、“到”(含動(dòng)詞);方位名詞“中”(含專名)、“上”;數(shù)詞“一”、“兩”;代詞“我”、“他”、“這”;連詞“和”;形容詞“大”、“多”;量詞“種”(含動(dòng)詞);副詞“都”、“也”、“要”;判斷動(dòng)詞“是”;能愿動(dòng)詞“能”、“會(huì)”(含名詞);動(dòng)詞“說”、“看”和名詞“人”、“年”等。

就筆者調(diào)查的結(jié)果來看,兩類文本的高頻詞有一致的地方,主要是封閉性詞類,主要表現(xiàn)在助詞、介詞、連詞、代詞和副詞和判斷動(dòng)詞等詞類上,助詞“的”、“地”、“了”,介詞“在”、“對(duì)”,連詞“和”,副詞“都”、“也”等。這種一致性反映了漢語(yǔ)詞語(yǔ)運(yùn)用的基本特征,是具有共性的高頻詞。它們使用頻次高,主要原因是與漢語(yǔ)虛詞是一種語(yǔ)法手段有關(guān),是語(yǔ)法結(jié)構(gòu)對(duì)詞語(yǔ)組成句子的要求。

毛澤東話語(yǔ)中相對(duì)高頻詞主要是上述統(tǒng)計(jì)中的不一致和完全不一致的詞語(yǔ),分別是以下幾類:名詞“人民”、“美國(guó)”、“社會(huì)主義”、“現(xiàn)在”、“問題”、“國(guó)家”等;代詞“你們”、“我們”、“各”等;能愿動(dòng)詞“可以”;形容詞“好”;否定副詞“不”;量詞“各”和連詞“同”。相對(duì)高頻詞中,多體現(xiàn)在開放性詞類中,如名詞“社會(huì)主義”、“人民”、“問題”、“國(guó)家”,時(shí)間名詞“現(xiàn)在”,專用名詞“美國(guó)”,形容詞“好”等。也有些封閉性詞類如人稱代詞“你們”、“我們”,量詞“個(gè)”,能愿動(dòng)詞“可以”等。這類相對(duì)高頻詞應(yīng)該說最能體現(xiàn)毛澤東的話語(yǔ)特色,因而值得更多關(guān)注和研究。

三、結(jié) 語(yǔ)

綜上所述,毛澤東話語(yǔ)的詞語(yǔ)特征在使用頻率上與一本文本具有較大的差異性,詞語(yǔ)分布高度集中、重復(fù)率較高,且詞長(zhǎng)較短,這和毛澤東所提倡的口語(yǔ)化話語(yǔ)風(fēng)格一致,體現(xiàn)出毛澤東踐行了他所倡導(dǎo)的“群眾語(yǔ)言”風(fēng)格。在其高頻詞的具體運(yùn)用上,毛澤東話語(yǔ)的高頻詞與一本文本有著共性特征,主要表現(xiàn)在助詞、介詞、連詞、代詞和副詞和判斷動(dòng)詞等封閉性詞類上,助詞“的”、“地”、“了”,介詞“在”、“對(duì)”,連詞“和”,副詞“都”、“也”等,這種一致性反映了漢語(yǔ)句法特征;但在開放性詞類中,毛澤東話語(yǔ)的高頻詞則具有其時(shí)代性和話語(yǔ)話題及話語(yǔ)功能上的具有個(gè)性化的特征。

注釋:

①Schwartz的相關(guān)論述主要見于其1955,1960,1965和1968年發(fā)表的論著中。

②詞語(yǔ)頻率計(jì)算方法參照Woods, Fletcher & Hughes 的《語(yǔ)言研究中的統(tǒng)計(jì)方法》一書(陳小荷、徐娟等譯,北京語(yǔ)言文化大學(xué)出版社2000年版第16-19頁(yè))的方法。

③在這里,兼類詞按類分計(jì),因此詞條數(shù)目總和大于2590。

[參考文獻(xiàn)]

[1]錢理群.科學(xué)總結(jié)20世紀(jì)中國(guó)經(jīng)驗(yàn)[M]∥追尋生存之根:我的退思錄.桂林:廣西師范大學(xué)出版社,2005:26.

[2]文貴良.毛澤東作為話語(yǔ)權(quán)威的成長(zhǎng)[J].書屋,2004(5):43-49.

[3]文貴良.話語(yǔ)與生存:解讀戰(zhàn)爭(zhēng)年代文學(xué)(1937-1948)[M].北京:世界圖書出版社,2007:1.

[4]王文濤.“毛主義”話語(yǔ)的起源、性質(zhì)與內(nèi)涵:簡(jiǎn)評(píng)史華慈的《中國(guó)的共產(chǎn)主義運(yùn)動(dòng)與毛澤東的崛起》[J].湖南科技大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2005(2):23-26.

[5]Apter, David E. & Saich, Tony. Revolutionary Discourse in Maos Republic[M]. Cambridge & London: Harvard University Press, 1994.

[6]北京語(yǔ)言學(xué)院.現(xiàn)代漢語(yǔ)詞語(yǔ)頻率辭典[M].北京:北京語(yǔ)言學(xué)院出版社,1986:1488.

[7]郭 熙.中國(guó)社會(huì)語(yǔ)言學(xué)[M].南京:南京大學(xué)出版社,1999:84-87.

[8]湯志祥.當(dāng)代漢語(yǔ)詞語(yǔ)的共時(shí)狀況及其嬗變[M].上海:復(fù)旦大學(xué)出版社,2001:14-17.

(責(zé)任編輯 文 格)

Abstract:Mao Zedongs discourse is the most influential discourse in contemporary China, and its features is as the dominant characteristic of Maos. This thesis includes the collection of Maos discourse features in the frequency distribution and choice of words with his personalized features through closed type of word statistics to analyze the words characteristics on Mao Zedong Texts (6-8).

Key words:Mao Zedong; discourse; words frequency; words feature

猜你喜歡
詞頻毛澤東話語(yǔ)
基于詞頻分析法的社區(qū)公園歸屬感營(yíng)建要素研究
現(xiàn)代美術(shù)批評(píng)及其話語(yǔ)表達(dá)
抗美援朝,毛澤東立國(guó)之戰(zhàn)
1949,毛澤東點(diǎn)將
詞頻,一部隱秘的歷史
云存儲(chǔ)中支持詞頻和用戶喜好的密文模糊檢索
以關(guān)鍵詞詞頻法透視《大學(xué)圖書館學(xué)報(bào)》學(xué)術(shù)研究特色
“那什么”的話語(yǔ)功能
吳自立“鬧事”與毛澤東復(fù)信
尉氏县| 深泽县| 高密市| 德安县| 余姚市| 定西市| 华池县| 河池市| 长宁区| 越西县| 桐城市| 高平市| 荣昌县| 特克斯县| 南汇区| 三亚市| 东乡族自治县| 庄浪县| 通州市| 昌邑市| 株洲县| 井冈山市| 噶尔县| 成都市| 庐江县| 太原市| 曲松县| 兴文县| 如东县| 长武县| 龙泉市| 开阳县| 唐海县| 漳州市| 武胜县| 洛南县| 万全县| 如皋市| 呼和浩特市| 山东省| 大余县|