国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

當(dāng)唐詩(shī)宋詞遇上大數(shù)據(jù)

2019-11-15 02:35戴玥
大學(xué)生 2019年10期
關(guān)鍵詞:女詩(shī)人詞人意象

戴玥

盛唐詩(shī)人輩出,但女性詩(shī)人居然是晚唐時(shí)期最多;

唐朝女性詩(shī)人作品中的最高頻詞是“相思”,最高頻的字是“風(fēng)”與“人”;

古代女詩(shī)人擁有超乎我們想象的“文人朋友圈”;

如果用折線來直觀展示詞人的一生,

宋朝的詞人中,只有一生布衣“梅妻鶴子”的林逋與女性詞人李清照的線條是一條水平線,引人唏噓;

詞人愛用意象,辛棄疾常用的是“酒”“月”,而晏幾道常用的是“小樓”……

從數(shù)據(jù)的角度解讀唐詩(shī)宋詞,居然能得出超乎想象的結(jié)論。這是我所在的浙江大學(xué)計(jì)算機(jī)學(xué)院CAD&CG(計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué))國(guó)家重點(diǎn)實(shí)驗(yàn)室與新華網(wǎng)合作推出的兩款數(shù)據(jù)新聞作品“我有柔情似水,亦有豪情萬丈——唐代女詩(shī)人群像”和“宋詞繾綣,何處畫人間”所研究的內(nèi)容。

什么是數(shù)據(jù)新聞?數(shù)據(jù)新聞?dòng)址Q數(shù)據(jù)驅(qū)動(dòng)新聞,是指基于數(shù)據(jù)的抓取、挖掘、統(tǒng)計(jì)、分析和可視化呈現(xiàn)的新型新聞報(bào)道方式。如果把未經(jīng)處理的數(shù)據(jù)比作新鮮的食材,那么數(shù)據(jù)新聞就是將一道精心烹飪的菜肴呈現(xiàn)在讀者面前?!耙磺€(gè)讀者心中有一千個(gè)哈姆雷特”,每個(gè)人都能從中品出不同的滋味。

為了更加深入地了解“菜肴”的烹制方法,我在浙江大學(xué)紫金港校區(qū)采訪了兩個(gè)作品的總負(fù)責(zé)人陳為教授與項(xiàng)目的具體負(fù)責(zé)人張瑋老師。與兩位老師的談話,使得看似神秘的“烹制方法”逐漸清晰起來。

科學(xué)而嚴(yán)謹(jǐn)?shù)摹笆伺畧D”:唐代女詩(shī)人群像

唐詩(shī)項(xiàng)目“我有柔情似水,亦有豪情萬丈——唐代女詩(shī)人群像”分析了約5.5萬首唐詩(shī),采用多樣化的圖表對(duì)唐代女詩(shī)人的創(chuàng)作情況進(jìn)行了可視化呈現(xiàn)。

第一幅圖表是關(guān)于唐代詩(shī)人創(chuàng)作數(shù)量的一覽圖,分別對(duì)存世1首、2首、3~5首、5~10首、10~50首及50首以上作品的詩(shī)人數(shù)量以點(diǎn)陣圖的方式進(jìn)行了表述,每一個(gè)點(diǎn)都代表著一位詩(shī)人,鼠標(biāo)懸浮在點(diǎn)上便顯示出詩(shī)人的姓名與作品數(shù),詩(shī)人的性別則用灰色與朱紅色區(qū)分。在不同階段,用畫像著重標(biāo)出了著名的代表詩(shī)人,如在“3~5首”的階段里,存世3首作品的張若虛是其中的代表,而在“50首以上”的階段中,存世3009首的白居易又是其中的翹楚。面對(duì)單純的數(shù)字,我們或許不能敏銳地感知背后的意義,而在點(diǎn)陣圖中,較之于許許多多僅留下孤篇的詩(shī)人,我們便可以感受到有3009首作品傳世的香山居士在當(dāng)時(shí)及后世擁有多么驚人的影響力。三千余篇詩(shī)作歷經(jīng)一千多年時(shí)間長(zhǎng)河的波濤洶涌仍然傳遞到了我們手中,這又是怎樣一份文化與歷史的厚重。

第二幅圖表是“唐代女詩(shī)人全景圖”,將唐朝劃分為初唐、盛唐、中唐、晚唐四個(gè)階段。此處同樣采用了點(diǎn)陣的表現(xiàn)方式,但用朱砂色的花朵代替了“點(diǎn)”,不同形狀的花朵代表著女性詩(shī)人的不同身份,她們有的是宮廷詩(shī)人,如上官婉兒,有的是士大夫妻女,有的則是民間女子或歌妓,而作品存留數(shù)量最多同時(shí)也最著名的幾人,如薛濤、李冶、魚玄機(jī)等人,則以盛開的荷花標(biāo)記。人們常以花朵喻美人,而這些朱紅的花朵也仿佛承繼了這些女子的驚才絕艷,在紙卷上美好而熱烈地盛開。

在我們的印象里,盛唐才是詩(shī)人輩出的時(shí)代,其時(shí)有李杜等冠絕古今的大詩(shī)人出現(xiàn),想必此時(shí)的女性詩(shī)人數(shù)量應(yīng)該最多。但這張全景圖卻給出了不一樣的答案——盛唐時(shí)的女性詩(shī)人僅僅比初唐與中唐稍多,反而是晚唐時(shí)期女性詩(shī)人數(shù)量為最,幾是中唐與盛唐時(shí)期的兩倍。發(fā)現(xiàn)這個(gè)與認(rèn)知大相徑庭的事實(shí)后,我開始嘗試為此找到一種解釋。聯(lián)系此前所學(xué),我想或許是因?yàn)橥硖茣r(shí)社會(huì)狀況江河日下,詩(shī)風(fēng)亦偏于陰柔細(xì)膩,恰與女性的特質(zhì)相符,使得女性詩(shī)人數(shù)量劇增。而我們所認(rèn)為是詩(shī)歌盛世的盛唐時(shí)期,詩(shī)風(fēng)大氣而雄壯,這大概與女性氣質(zhì)不符吧。

第三幅圖表是“詩(shī)人詩(shī)作字頻詞頻圖”,字詞的大小與深淺顯示著它們被使用的頻率。女性詩(shī)人作品中最高頻詞“相思”便可說明女詩(shī)人的一貫風(fēng)格,與我們尋常的認(rèn)知沒有太大出入,女詩(shī)人常常在詩(shī)中抒發(fā)“相思”與“寂寞”之情。同男性詩(shī)人一樣,“風(fēng)”與“人”都是最高頻的字,而較之于男性,女性詩(shī)人又更喜歡運(yùn)用“花”“月”“春”等柔美的意象,而通過這些意象,女性獨(dú)特的內(nèi)心體驗(yàn)可見一斑。

最后是“唐代女詩(shī)人社交圖”,圖中選取了最具代表的幾位女性詩(shī)人,將她們的社交關(guān)系以圓與線的方式表現(xiàn)出來,線的粗細(xì)則代表社交關(guān)系的深淺。通過這張圖可以發(fā)現(xiàn),薛濤與李冶兩位著名的女詩(shī)人都與劉禹錫有過詩(shī)作唱和?;蛟S我們未能知曉同時(shí)位列唐朝四大女詩(shī)人的這兩位才女是否有過交集,但此刻她們卻歷經(jīng)遙遠(yuǎn)的時(shí)空被線聯(lián)系在一起。

之后另有薛濤與李冶單獨(dú)的社交關(guān)系圖。在李冶的社交圖中,詩(shī)人與陸羽、皎然之間形成了一個(gè)三角,可見這也是一個(gè)詩(shī)人之間的“小圈子”,三人都對(duì)茶學(xué)、佛學(xué)等有很大的興趣,并且也曾互有酬和。而“女校書”薛濤的社交圖中類似的圈子更多也更大,最大的有元稹、白居易、劉禹錫、嚴(yán)綬等人,他們大多互相認(rèn)識(shí)或者熟識(shí),仿佛是古代版的“朋友圈共同好友”,隱匿在典籍中的錯(cuò)綜復(fù)雜的關(guān)系網(wǎng)絡(luò)具象為簡(jiǎn)單明了的社交圖,似乎古人被時(shí)間重重遮掩的面貌也在霎時(shí)間清晰起來。

新聞的網(wǎng)頁(yè)背景模擬了泛黃古卷,配上古雅的圖案設(shè)計(jì)與字體設(shè)計(jì),構(gòu)成了一幅交織著理性與嚴(yán)謹(jǐn)?shù)摹笆伺畧D”,雖未有畫像出現(xiàn),但透過數(shù)據(jù)架成的時(shí)光之橋,我們仿佛能透過千年的塵埃而窺見美人含羞的影子。

對(duì)于數(shù)據(jù)新聞作品的外觀設(shè)計(jì),項(xiàng)目的具體負(fù)責(zé)人張偉老師表示,他們對(duì)每一個(gè)圖表都做了兩套以上的方案,經(jīng)過不斷的篩選與考量之后才有我們所見的這一套外觀。網(wǎng)頁(yè)設(shè)計(jì)也如古時(shí)畫工制畫一般,如切如磋,如琢如磨,方能以美的姿態(tài)喚起觀者精神的共鳴。

宋朝詞人的情緒表達(dá)

宋詞項(xiàng)目“宋詞繾綣,何處畫人間”以《全宋詞》為樣本,從近21000首詞作、1330位詞人的龐大數(shù)據(jù)中呈現(xiàn)了豐富的圖表。有別于唐詩(shī)作品的精致與古典氣息,宋詞作品的外觀則帶有朦朧的寫意風(fēng)格,圖表亦多處采用了水墨元素,將精確的數(shù)據(jù)渲染出詩(shī)意之美。

整篇作品分為三個(gè)版塊,“萬水千山走遍”“草木皆有情,詞即人生”“春風(fēng)化雨,歷久彌新”。在第一個(gè)板塊“萬水千山走遍”中,首先映入眼簾的就是一幅宋朝的疆域圖,其中以灰點(diǎn)代表著詞人們?cè)竭_(dá)過的地方,灰點(diǎn)越大代表到達(dá)越多人次。灰點(diǎn)密集地覆蓋了宋朝的大半版圖,除了青藏高原一帶鮮有涉足外,天山南北亦有詞人們的足跡。鼠標(biāo)懸浮其上會(huì)顯示出詞人的行進(jìn)路線,跨度最大的一條由疆域的最北端一直延伸到最南的臨海地區(qū)??鬃又苡瘟袊?guó)的路線其實(shí)僅在河南至山東一帶,但今天高鐵幾個(gè)小時(shí)就能到達(dá)的路途,孔子卻走了十?dāng)?shù)年。這條從南至北貫穿宋朝疆域的路線,很有可能耗費(fèi)了一位詞人一生的時(shí)間。

之后是宋朝詞人的全景圖,這幅全景圖采用了折線圖的方式,橫軸為北宋至南宋的各個(gè)歷史階段,而縱軸為詞人作品數(shù)量。每一段線條代表一位詞人,水平線是詞人的平民時(shí)期,向上的折線則是詞人的仕途時(shí)期,線條的灰色與棕色來區(qū)分婉約派與豪放派。在眾多詞人中,一生布衣“梅妻鶴子”的林逋與女性詞人李清照的線條都是一條水平線,其余詞人的線條都有起有伏,一生的悲歡跌宕都被一條簡(jiǎn)單的線所勾勒,引人唏噓。

在第二個(gè)版塊“草木皆有情,詞即人生”中,首先對(duì)《全宋詞》的詞頻進(jìn)行了統(tǒng)計(jì)。最高頻詞分別為“東風(fēng)”“何處”“人間”,宋朝的積貧積弱以及靖康之變加重了詞人心中的漂泊感,他們仿佛一直在尋覓,無論是“今宵酒醒何處”,還是陸放翁常書于詞中的“歸何處”,都是一聲聲對(duì)心靈的叩問。

第二幅圖表是宋代著名詞人常見意象及其表達(dá)情緒的統(tǒng)計(jì),喜、怒、哀、樂、思五種情緒分別用不同顏色表示,每一種意象都有它所承載情緒表達(dá)次數(shù)的餅狀統(tǒng)計(jì)圖,鼠標(biāo)懸浮在詞人名上可以顯示出他們所使用的意象表達(dá)情緒次數(shù)的比例。王國(guó)維曾言“以我觀物,故物皆著我之色彩”,豪放派代表人物辛棄疾常用“酒”“月”等意象,使人聯(lián)想到邊關(guān)冷月、煮酒悲歌,而晏殊之子晏幾道詞風(fēng)婉約,他少年時(shí)家道中落,此后一生流離,詞中多以落魄王孫的形象出現(xiàn),常在“小樓”中流連時(shí)光,他的名句“舞低楊柳樓心月,歌盡桃花扇底風(fēng)”恰能道出他詞中風(fēng)情。

我好奇如何才能計(jì)算出意象中承載的情緒,陳為教授告知是根據(jù)已有的算法和模型來計(jì)算的,“對(duì)文字當(dāng)中的情感進(jìn)行計(jì)算,是計(jì)算機(jī)學(xué)界研究了二十年的一個(gè)問題,已經(jīng)有了標(biāo)準(zhǔn)方法”,“對(duì)于我們來說,這就是教科書上的東西”。原來文學(xué)與計(jì)算機(jī)的結(jié)合并不只是今年才興起的,早已產(chǎn)生了超越我們想象的進(jìn)步。

最后一個(gè)版塊“春風(fēng)化雨,歷久彌新”中將各個(gè)詞牌代表詞作的平仄以長(zhǎng)短不一的線段標(biāo)出,配以人聲朗誦,詞被還原了它原始的音樂功能,原先掩藏在字詞背后的韻律被直觀地展現(xiàn)出來?;蛟S相隔千年時(shí)光,樂坊的客人也在與我們欣賞著同一首曲子詞,咀嚼同一段繁復(fù)綿長(zhǎng)的情感。

數(shù)據(jù)化與詞學(xué)研究的碰撞引入了“定量”的思維方式

唐詩(shī)宋詞與大數(shù)據(jù)結(jié)合而產(chǎn)生的一大效果,即是效率的提升。一張張制作精美的圖表將關(guān)鍵信息在眼前一字排開,根據(jù)需要可以信手采擷。我不由感嘆,如果我之前作業(yè)所需的資料也能以這樣的方式呈現(xiàn),想必可以省下不少時(shí)間。

陳為教授介紹,在大數(shù)據(jù)普及之前,人文學(xué)者們獲取信息需要依靠查閱實(shí)物典籍,將一本本書從頭翻到尾,科技進(jìn)步后,很多典籍都有了電子掃描版,但還是需要人工檢索,在電腦上將所有的文字讀完。但大數(shù)據(jù)帶來了改變,“假設(shè)我能夠把它核心的、關(guān)鍵的特征和信息提煉,并用計(jì)算機(jī)建模做出來,然后呈現(xiàn)在屏幕上,這些人的關(guān)鍵信息就這些,他跟誰有關(guān)系,他有什么作品,他的生活環(huán)境怎樣,這就極大地提高了效率?!?/p>

就讀人文專業(yè)的我,時(shí)常為了解一位古代詩(shī)人在某一時(shí)間段生活的社會(huì)環(huán)境,對(duì)著許多影印版的史志和詩(shī)人年譜進(jìn)行“肉眼檢索”,繁體豎排小字看久了讓人眼睛發(fā)花。

我想到自己曾做的一份唐宋詞名物意象變遷的作業(yè),我選擇了“釵”的意象。在例舉含有該意象的詞作時(shí),已經(jīng)有現(xiàn)成的唐宋詞數(shù)據(jù)庫(kù),其中收錄了相當(dāng)數(shù)量的唐宋詞,我只需要輸入“釵”“銀釵”“鳳釵”等關(guān)鍵詞,就能輕松獲取與之相關(guān)的一篇篇作品,方便快捷。而在調(diào)查“釵”本身材質(zhì)與形制的變遷時(shí),我所查到的相關(guān)飾物名錄和圖鑒有些甚至沒有目錄和頁(yè)碼,只能面對(duì)繁體豎排字一頁(yè)一頁(yè)地查閱,看到可能有用的信息也只能使用pdf閱讀軟件自帶的標(biāo)記功能。一次查找需要耗費(fèi)很長(zhǎng)的時(shí)間,而獲取的信息卻遠(yuǎn)遠(yuǎn)不能與付出的時(shí)間等價(jià)。有時(shí)候翻完了一本幾百頁(yè)的書,能夠得到的有用信息也只有幾句話。從這一點(diǎn)來說,大數(shù)據(jù)的普及著實(shí)是一種迫切的需要,它也為人文社科的研究者帶來了福音,省去了許多繁復(fù)而低效率的案頭勞作。

大數(shù)據(jù)除了能夠極大提高科研效率,同時(shí)也為研究提供了一種“定量分析”的思維角度。

唐宋詞的數(shù)據(jù)化研究是20世紀(jì)90年代開始興起的一種研究趨勢(shì),與20世紀(jì)90年代的數(shù)據(jù)科技發(fā)展息息相關(guān)。而數(shù)據(jù)化與詞學(xué)研究的碰撞引入了“定量”的思維方式,譬如如何確定一首詞在宋代的受歡迎程度,這在以前的研究中是難以衡量的,即使能夠定性,也是“空口無憑”,沒有相應(yīng)的證據(jù)。但大數(shù)據(jù)卻可以解決這個(gè)難題,統(tǒng)計(jì)宋代詞話中這首詞被收錄的次數(shù),就可以大概得出其受歡迎程度的量化結(jié)果。統(tǒng)計(jì)數(shù)據(jù)本身就使得結(jié)果更精確,也更有說服力。

雖然大數(shù)據(jù)能夠帶來諸多益處,但大數(shù)據(jù)與文學(xué)研究的交匯中也產(chǎn)生了一些需要注意的問題。在一節(jié)專業(yè)課上,老師曾舉過一個(gè)大數(shù)據(jù)研究的例子。在《全金元詞》中,使用頻率最高的詞調(diào)有兩個(gè),最高為《黑漆弩》,其次是《木蘭花慢》?!赌咎m花慢》是我們耳熟能詳?shù)脑~調(diào),而《黑漆弩》對(duì)于并不十分專業(yè)的我來說卻是聞所未聞。《黑漆弩》在宋代也幾乎沒有作品傳世,但它為何會(huì)成為使用頻率最高的詞調(diào)?原來《黑漆弩》到元代時(shí),進(jìn)入元雜劇成為了一種曲調(diào),也就是說,它是一種曲化的詞調(diào),可以稱之為曲調(diào)。由此反映出了問題,在利用大數(shù)據(jù)研究詞的時(shí)候,樣本問題需要得到重視,譬如在研究《全金元詞》中使用頻率最高的詞調(diào)時(shí),像《黑漆弩》這樣曲化的詞調(diào)就不應(yīng)該計(jì)入樣本中。采樣問題成為詞學(xué)研究大數(shù)據(jù)化的“攔路虎”。

除了已知樣本的問題,詞學(xué)研究領(lǐng)域樣本的不斷變動(dòng)同樣也困擾著學(xué)者們。唐宋詞不斷有遺詞被發(fā)現(xiàn),樣本在不斷地補(bǔ)充。而相對(duì)于現(xiàn)存數(shù)量有限的唐宋詞,明清詞的數(shù)量更是多如恒河之沙,幾乎難以窮盡,如此龐大的樣本本身就是一個(gè)令人頭疼的難題。

人文學(xué)科與大數(shù)據(jù)的合作,已經(jīng)有了令人欣喜的發(fā)展,但仍舊任重而道遠(yuǎn)。

作為一個(gè)人文專業(yè)的學(xué)生,我也期待著美好圖景成為現(xiàn)實(shí)的一天。

責(zé)任編輯:徐玲玲

猜你喜歡
女詩(shī)人詞人意象
論詞人擇調(diào)與審美聯(lián)想
中國(guó)優(yōu)秀女詩(shī)人作品選讀
林逋梅妻鶴子
“玉人”意象蠡測(cè)
女詩(shī)人
《活著》的獨(dú)特意象解析
詞人的風(fēng)骨
古蔺县| 盈江县| 荆门市| 雅安市| 新余市| 巍山| 临高县| 洞头县| 石渠县| 安新县| 仙居县| 资兴市| 阳城县| 铜陵市| 吉首市| 新野县| 潜江市| 砀山县| 太谷县| 平乡县| 通道| 化隆| 团风县| 阿拉善盟| 玛多县| 确山县| 根河市| 资阳市| 太原市| 宜春市| 合川市| 深水埗区| 武穴市| 闻喜县| 瑞昌市| 罗甸县| 南开区| 武清区| 阜康市| 益阳市| 新昌县|