蔡愛娟
【摘 要】唐詩宋詞是中國文化的瑰寶,歷來受到人們的廣泛關(guān)注。本文基于數(shù)據(jù)庫分析,對唐詩宋詞的題目、詩人、用字和意象進(jìn)行了統(tǒng)計和對比分析。
【關(guān)鍵詞】全唐詩;全宋詞;數(shù)據(jù)庫;對比分析
歷來對唐詩宋詞的對比研究主要是感性的定性研究,比如分析唐詩宋詞的不同風(fēng)格。20世紀(jì)以來,隨著計算機(jī)科學(xué)的發(fā)展,人們加大了對古代文學(xué)的定量研究。張三夕(1984)通過定量分析,考證全唐詩的詩人實(shí)為三百多人①。朱崇才(1993)統(tǒng)計《全宋詞》高頻字,認(rèn)為《全宋詞》有一定的女性化傾向。劉明華(1999)利用《全唐詩》軟件,發(fā)現(xiàn)《全唐詩》用字的一些特點(diǎn),比如字頻最高的是“不”。 尚永亮(2007)探討數(shù)據(jù)庫、計量分析方法及其對古代文學(xué)研究的現(xiàn)代化進(jìn)程作用。龔嵐(2009)分析唐詩宋詞中高頻字的使用和演變情況。張三夕、張世敏(2013)從方法論的角度提出將計量研究法引入古代文學(xué)研究。
利用數(shù)據(jù)處理工具構(gòu)建唐詩宋詞數(shù)據(jù)庫進(jìn)行定量研究,具有系統(tǒng)性和可驗(yàn)證性。本文基于《全唐詩》、《全宋詞》數(shù)據(jù)庫,利用ACCESS、MySQL和PHP等數(shù)據(jù)處理工具,從統(tǒng)計的角度出發(fā),探討唐詩宋詞的不同特點(diǎn)。
1 對唐詩宋詞題目的分析
1.1 對《全唐詩》高頻題目的分析
《全唐詩》所有詩作共計42657篇,共有2271個題目。此處列舉了重復(fù)頻率最高的前十項題目,如下表所示:
表1顯示,《全唐詩》中題目重復(fù)最多的是《句》,并且它遙遙領(lǐng)先于第二名《古意》,而我們所了解的詩詞中以“句”為名的不多,有些奇怪。再篩選出題目為《句》的詩作,發(fā)現(xiàn)它們并不全是以“句”為題,絕大多數(shù)指詩歌中零落的句子,也許是在流傳過程中散佚,不知其名,因而以“句”為名。所以,《全唐詩》題目頻率使用最高的應(yīng)為《古意》。
此外,高頻的《長門怨》、《塞下曲》、《送別》、《柳》反映了詩歌選材和情感的取向,體現(xiàn)了“送別”、“閨怨”、“邊塞”等幾大主題,符合我們通常的認(rèn)知。
1.2 對《全宋詞》高頻題目的分析
《全宋詞》記錄數(shù)5303,查找題目重復(fù)項,使用頻率最高的前十個題目如下所示:
此處宋詞的題目指“詞牌名”,一般與詞的內(nèi)容無關(guān),只是套用格式。通過數(shù)據(jù)庫查找出來的前十項高頻詞牌名,均為常見詞牌名。
《全宋詞》使用頻率最高的前五項詞牌名覆蓋的詩人數(shù)目如下:
《全宋詞》前五個高頻詞牌名覆蓋的詩人數(shù)目相差不大,并且詩人是相似的,但《浣溪沙》覆蓋的詩作數(shù)目遠(yuǎn)勝于其他詞牌名,即對于特定詩人而言,《浣溪沙》的使用頻率高于其他詞牌名。它音節(jié)明快,句式整齊,易于上口,為婉約、豪放兩派詞人所常用。兩大流派皆鐘情于此,則排名第一不足為奇。
2 唐詩宋詞的詩人與作品的情況分析
2.1 《全唐詩》高產(chǎn)詩人
《全唐詩》共2356位詩人,其中詩作總數(shù)最多的前十名詩人列舉如下:
可見,唐詩詩作最多的并非李白而是白居易,其詩作2641篇,占全唐詩總數(shù)的6.2%。除了白居易,李白、杜甫、劉禹錫、元稹、李商隱、齊己、韋應(yīng)物、陸龜蒙也都是我們耳熟能詳?shù)脑娙?,其詩作不僅流傳千古而且數(shù)量豐富。
前十名中只有“貫休”不太熟悉。貫休是唐末五代著名畫僧。他能詩善畫,在中國繪畫史上有很高的聲譽(yù)。他博學(xué)多才,嫉惡如仇,詩作中往往體現(xiàn)了憂國憂民、高風(fēng)亮節(jié)的特點(diǎn),例如“旅夢遭鴻喚,家山被賊圍”,品格高潔由此可見一斑。
2.2 《全宋詞》高產(chǎn)詩人
《全宋詞》共72位詩人,其中詩作總數(shù)最多的前十名列舉如下:
其中蘇軾作品共348篇,約占全宋詞總數(shù)的6.56%,位列第一。與《全唐詩》相似,前十名中絕大多數(shù)是我們熟悉的詞人,僅“朱敦儒”、“毛滂”和“張元干”相對陌生。
朱敦儒為詞中之俊,詞作風(fēng)格隨個人人生經(jīng)歷的變化而轉(zhuǎn)變。少年時,不識愁滋味,詞風(fēng)濃艷麗巧;中年時,憂時憤世,詞風(fēng)慷慨激昂;晚年時,閑居山水,詞風(fēng)清新自然。他開拓了宋詞的題材,進(jìn)一步發(fā)揮了以詞敘事和以詞言志的功能,使詩詞的功能初步合二為一,在詞壇上具有獨(dú)特的地位。
毛滂其詞瀟灑明潤、情韻特勝,是“非作家之極,亦在附庸之列”的有風(fēng)致、有成就、有影響的作家。
張元干勤奮讀書,愛好詩詞,協(xié)助李綱,抗擊金兵,義憤作詞,抒發(fā)情懷。
對《全唐詩》《全宋詞》詩人、詩作的分析,發(fā)掘出了高產(chǎn)而不為人熟知的詩人。
2.3 《全唐詩》《全宋詞》詩人、詩作對比分析
通過對數(shù)據(jù)的分析,還發(fā)現(xiàn)了一些有趣的事實(shí)。比如,《全唐詩》中李姓詩人的詩歌有5158篇之多,占12.09%;而在《全宋詞》中李姓詩作323篇,占6.09%??梢?,李姓對于唐詩的貢獻(xiàn)遠(yuǎn)勝于宋詞。據(jù)此展開聯(lián)想,也許“李”姓詩作之多與唐朝的特殊性——“李”是國姓有關(guān)。但《全宋詞》中收錄的詩人中,趙姓詩人詩作并不多(2%),因此,是否與“朝代”和“國姓”有關(guān)有待商榷。
另一個對比是,《全唐詩》每位詩人平均有18.1首詩(而白居易一人就占據(jù)詩作總數(shù)的6%),所以,實(shí)際上其他詩人平均詩作數(shù)還不足18首),《全宋詞》平均每位詞人73.6首??梢?,《全宋詞》作品集中于部分詞人。
《全宋詞》僅收錄了72位詞人的作品,還會引發(fā)一些相關(guān)聯(lián)想:是否可以認(rèn)為《全宋詞》收錄的作品是否覆蓋面相對比較狹小,遺漏了一些相對不太有名的作品?或者是否可以認(rèn)為這與唐宋發(fā)展水平和人口數(shù)有關(guān)?抑或,雖然我們常說“唐詩宋詞”,宋詞的地位和唐詩基本對等,但是,撐起泱泱唐詩的是整個唐朝的百姓,而撐起宋詞的只是一部分文人?
3 對唐詩宋詞高頻字分析
唐詩宋詞用字頻率最高的前二十個字中,有七個是重疊的,即數(shù)詞“一”、否定副詞“不”、方位詞“中”、“上”、疑問代詞“何”和名詞“人”“云”。 這些詞有不同的語法功能,它們共同作用,實(shí)現(xiàn)詩歌抒情言志的作用。其中,唐詩用字頻率最高的前二十個字中出現(xiàn)了“花”這個意象,下文會對意象作進(jìn)一步分析。
現(xiàn)在漢字前十高頻字是“的、一、國、在、人、了、有、中、是、年”,其中“一、人、中”仍然保留著高頻地位。 “何”不在高頻之列,“是”進(jìn)入高頻,體現(xiàn)了白話文對漢字使用頻率的影響。
4 唐詩宋詞意象比較分析
基于《全唐詩》、《全宋詞》,對“花”、“西樓”、“落日/夕陽”以及“云”這幾個常用的典型意象進(jìn)行對比分析。
《全唐詩》中四種意象的使用情況如下:
可見,“花”是詩詞永恒的主題,可寫景,可比人,表情達(dá)意,傳神到位。粗略對比發(fā)現(xiàn),唐詩中的“花”似乎更為“積極”,宋詞中的“花”更為傷感,多用來傷春懷人。
“云”也是詩詞中常用的經(jīng)典意象,如“浮云游子意,落日故人情”,“云”有飄落無依之義,有純潔之義,內(nèi)涵豐富,因而為詩人常用。
從這一角度出發(fā),勾選出詩歌常用意象,分析歸納不同意象在語境的不同特點(diǎn),對理解詩歌含義有很大幫助,可應(yīng)用于語文教學(xué)。
5 總結(jié)
本文利用數(shù)據(jù)庫工具對《全唐詩》、《全宋詞》的題目、詩人、用字以及意象等特質(zhì)進(jìn)行初步的對比分析。進(jìn)一步,可以利用中文信息處理,探索不同詩人的用字習(xí)慣、語言風(fēng)格等,形成一套準(zhǔn)確實(shí)用相對科學(xué)的系統(tǒng),在古代文學(xué)研究者個人研究經(jīng)驗(yàn)的基礎(chǔ)上,從信息處理的角度,為詩詞某些特質(zhì)的確定提供依據(jù),成為輔助工具。例如,確定一首無名詩的作者,我們可以在研究該詩歌的基礎(chǔ)上從數(shù)據(jù)庫中尋找與其風(fēng)格相匹配的詩人,根據(jù)風(fēng)格、用字習(xí)慣來推測作者。目前,計算機(jī)通過“學(xué)習(xí)”可以“創(chuàng)作”出讓人難辨真?zhèn)蔚脑娋?,意境、押韻都沒有問題,雖然這種“詩”到底能否算作真正的詩歌有待商榷,但從定量角度,利用數(shù)據(jù)庫建設(shè)、計算機(jī)建模等方式研究詩詞不失為一個全新的探索角度。
【參考文獻(xiàn)】
[1]龔嵐.試論唐詩宋詞中的高頻字[J].江西財經(jīng)大學(xué)學(xué)報,2009(1):104-108.
[2]尚永亮.數(shù)據(jù)庫、計量分析與古代文學(xué)研究的現(xiàn)代化進(jìn)程[J].文學(xué)評論,2007,(6):187-190.
[3]劉明華.唐人最愛說“不”──《全唐詩》軟件字頻檢索如是說[J].中國典籍與文化,1999(4).
[4]朱崇才.從高頻字看宋詞的女性化傾向[J].中國韻文學(xué)刊,1993:70-76.
[5]張三夕.作家作品研究中的數(shù)量分析——唐代詩人總數(shù)考實(shí)[J].江蘇師范大學(xué)學(xué)報:哲學(xué)社會科學(xué)版,1984(2):63-67.
[6]張三夕,張世敏.古代文學(xué)研究中計量分析的應(yīng)用與限度——由唐詩宋詞排行榜引起的思考[J].社會科學(xué),2013(2):172-177.DOI:10.3969/j.issn.0257-5833.2013.02.020.
注釋:
①張三夕先生區(qū)分“詩人”和“寫詩的人”,認(rèn)為詩人至少應(yīng)為“存詩一卷以上者”.
[責(zé)任編輯:曹明明]