杜冰潔,劉鵬遠(yuǎn),田永勝
(北京語言大學(xué) 信息科學(xué)學(xué)院 國家語言資源監(jiān)測與研究平面媒體中心,北京 100083)
人名是不同個(gè)體為區(qū)分彼此而創(chuàng)造出的指稱符號。人名既特殊又普遍,其特殊性表現(xiàn)在,人名屬于詞匯系統(tǒng)中專有名詞的一種,具有指稱的唯一性和確定性;其普遍性表現(xiàn)在人名在社會(huì)生活中出現(xiàn)的頻率極高,在社會(huì)系統(tǒng)的正常運(yùn)作中扮演著十分重要的角色,我們需要“說”名字,也需要“寫”名字。與字母文字不同的是,漢字具有表意的功能。因此中國人名不僅具有讀音上的特殊性,在字形、字義上也具有特殊性,對于人名用字的研究也就顯得十分重要。
本文建立了一個(gè)大規(guī)模中國名人人名數(shù)據(jù)庫,從漢字本體的角度做了跨度長達(dá)百年的人名用字分析,同時(shí)從性別的角度展開,探究人名中漢字的性別差異。本文發(fā)現(xiàn)兩性人名在長度、難易度、豐富度、變化趨勢等方面都存在顯著差異。
本文貢獻(xiàn)在于: ①建立了目前已知最大規(guī)模的真人人名數(shù)據(jù)庫; ②分別從漢字本體及計(jì)量語言學(xué)兩種研究視角進(jìn)行了人名用字研究,這些研究方法應(yīng)用到人名中被證明具有一定價(jià)值; ③得到了百年兩性人名用字特征的差異與演變規(guī)律。
對人名的語言學(xué)研究側(cè)重于語音、語義等,部分文獻(xiàn)對于人名中的漢字有所體提及。蘇培成[1]、吳繼章[2],邱莉芹和鞠泓[3],張書巖[4-5]探討了人名中出現(xiàn)的生僻字、多音字、異體字等問題,提倡入名漢字應(yīng)該規(guī)范化。何曉明[6]、趙越[7]提出中國人取名對合體字、獨(dú)體字等不同字形的講究,遺憾的是作者并沒有針對這一問題進(jìn)行深入闡述。謝玉娥[8]、Jia J和Zhao Q[9]認(rèn)為人名中的部分漢字具有性別偏向,但其討論的主要是漢字意義上的偏向問題,且沒有做詳細(xì)的定量統(tǒng)計(jì)和分析,也未從漢字本體的角度進(jìn)行考察。關(guān)于漢字與性別之間的關(guān)系,韓燕、邱江、張慶林[10]采用事件相關(guān)電位 (ERP) 技術(shù)證明漢語人名具有性別刻板印象。王玉新[11]、潘世松[12]從漢字的偏旁結(jié)構(gòu)和發(fā)展規(guī)律論述了漢字結(jié)構(gòu)本身的性別歧視現(xiàn)象。
以上關(guān)于人名的研究多是基于幾百上千條人名,樣本數(shù)量較小。從研究方法來看,多是共時(shí)研究,或者兩個(gè)時(shí)間段的對比研究。關(guān)于人名的歷時(shí)研究時(shí)間跨度較小,難以宏觀反映人名在一段時(shí)間范圍內(nèi)的變化。人名中的漢字研究較為單一,多是從漢字意象的角度進(jìn)行解釋,漢字本身特征的研究幾乎沒有。而有關(guān)認(rèn)知科學(xué)的實(shí)驗(yàn)又證明人名具有一定刻板印象,因此關(guān)于人名漢字的性別傾向研究可進(jìn)一步探討漢字性別偏見的現(xiàn)象。同時(shí),目前缺乏一個(gè)公開的、可支持人名共時(shí)歷時(shí)研究的中國人名數(shù)據(jù)庫。
本文基于知識圖譜信息建立中國名人人名數(shù)據(jù)庫。選擇名人來建設(shè)人名數(shù)據(jù)庫的原因有二: 第一,可最大程度上保證人名及相關(guān)信息的真實(shí)性;第二,本文假設(shè)是否能成為名人與其姓名不相關(guān),因此該語料庫也可以支持對中國人名的其他研究。人名數(shù)據(jù)庫構(gòu)建過程主要如下:
(1) 抽取從百科人物知識圖譜(1)http://openbase.openkg.cn/抽取了名人相關(guān)信息,這樣可較好地保證人名信息的真實(shí)、準(zhǔn)確性。抽取的條目具體為: 姓,名,性別,出生日期,出生地。
(2) 篩選原百科人物知識圖譜中的名人信息分布混雜,并且有大量國外名人信息。為了最大化地獲得人名數(shù)據(jù)并且保證數(shù)據(jù)包含所需的幾個(gè)維度,在抽取過程中我們主要通過姓名長度、出生地等篩選中國名人姓名。中國人姓名的主流格式(2)本文僅考慮常規(guī)兩個(gè)字和三個(gè)字的姓名。對于傳統(tǒng)的復(fù)姓,因樣本相對較少,故不在研究范圍內(nèi)。近些年出現(xiàn)例如“王張”的雙姓,本文當(dāng)作單姓處理。有: 姓+單名、姓+雙名,因此我們將姓名長度限定為兩個(gè)字和三個(gè)字。在出生地方面,我們將關(guān)鍵詞限定為中國所有省市,并添加了“中國”“村”等不同粒度的關(guān)鍵詞。考慮到有些名人信息不包含出生地信息,我們又添加了“民族”這一判斷規(guī)則。
(3) 信息補(bǔ)充為豐富對中國人名的研究,我們?yōu)槊總€(gè)名人條目補(bǔ)充了拼音、筆畫、偏旁等信息。該信息來源于開源中華新華字典數(shù)據(jù)庫(3)https://github.com/HelloDreamen/chinese-xinhua共收錄了16 142個(gè)漢字的相關(guān)信息。對于部分不在字典數(shù)據(jù)庫的漢字,我們利用人工的方法補(bǔ)充字典信息再進(jìn)行匹配。
最終建成的中國名人人名數(shù)據(jù)庫(4)https://github.com/HelloDreamen/Chinese-Celebrities-Names共有111 564個(gè)條目,每個(gè)條目包含姓、名、性別、出生地以及人名用字的拼音、筆畫、偏旁等信息,其中,有男性人名條目83 706條,女性人名條目27 858條。在這些條目中有54 264條包含出生日期,時(shí)間跨度從古代至今,主要以近現(xiàn)代人名為主。該語料庫可為中國人名多維度研究提供數(shù)據(jù)支持。
從上述人名數(shù)據(jù)庫中抽取1919年至今等性別比例的人名作為研究對象。所選時(shí)間段中的人名中共出現(xiàn)了2 342個(gè)字種,男性人名中的字種有1 800個(gè),女性人名中的字種有1 807個(gè)。之所以選擇這一時(shí)間段是因?yàn)楸疚南M麑F(xiàn)代近百年的人名從漢字的角度做定量分析,而1919年作為近代史開端,自然成為本次研究的時(shí)間起點(diǎn)。本文對數(shù)據(jù)做兩種劃分,詳見表1。
表1 研究對象的歷時(shí)劃分
1) 按照自然年份劃分。本文希望能以時(shí)間均勻的角度觀察人名變化的規(guī)律。每二十年一個(gè)階段劃分,共五個(gè)階段。
2) 按照重要?dú)v史事件為時(shí)間點(diǎn)進(jìn)行劃分。本文假設(shè)重大政治經(jīng)濟(jì)事件對人們起名的影響較大。這個(gè)方式主要用于對自然年份劃分的對比和說明。
基于中國百年人名數(shù)據(jù)庫及表1的劃分,文本希望能揭開百年來中國人名變化趨勢的一角,并試圖回答以下問題:
1) 人名在長度上是否有性別差異?百年來人名長度變化情況及其原因。
2) 在用字難易度上是否有性別差異?百年來人名用字難度變化情況及其原因。
3) 在用字豐富度上是否有性別差異?百年來人名用字豐富度的變化情況及其原因。
4) 具體用字是否在時(shí)間維度上有顯著差異?百年來人名具體用字變化情況及其原因。
文字同語言一樣是一種信息交流的工具,人名中的漢字是記錄人名內(nèi)涵的書寫符號。很多漢字都能獨(dú)立表達(dá)一定含義,人名的內(nèi)涵可以通過每個(gè)漢字的排序、人名漢字的多少(即名字長度)等傳達(dá)。本文將只有一個(gè)字的名字稱為單名(如: 杜甫),兩個(gè)字的名字稱為雙名(如,周樹人)。
我們計(jì)算了兩性人名的平均長度,其中女性人名長度均值2.88,男性人名長度均值2.91。隨后做了皮爾遜卡方檢驗(yàn)(5)本文所有統(tǒng)計(jì)檢驗(yàn)均采用SPSS Statistics 25.0.0軟件計(jì)算得出。,結(jié)果表明: 男女人名中的單名和雙名分布存在統(tǒng)計(jì)學(xué)意義上的差異。具體統(tǒng)計(jì)結(jié)果見表2。
表2 性別與人名長度卡方檢驗(yàn)
為了解各個(gè)階段單雙名的具體分布情況,圖1以自然年份劃分觀察近百年來中國人名長度的變化。
圖1 自然年份中兩性人名單雙名的變化趨勢
由圖1可知: ①女性人名中的單名比例一直高于男性,但是兩性人名中的單雙名差異隨著時(shí)間的發(fā)展不斷縮??; ②總體而言,人名中單雙名的比例呈現(xiàn)一定波動(dòng),但是雙名占據(jù)絕對優(yōu)勢; ③1979-1998年間單名比例是一個(gè)峰值,但是進(jìn)入21世紀(jì),單名比例又有所降低。
雙名是魏晉門閥制度盛行,強(qiáng)調(diào)宗族家譜以后才逐漸占據(jù)主流的。由于族譜的存在,在取名時(shí)中間一個(gè)字需要固定,因此中國人名大多數(shù)是雙名,而家譜和宗法制度有著密切的聯(lián)系,宗法制度強(qiáng)調(diào)與家族中男性長輩的血緣親疏,這就對家族中男性晚輩身份造成約束。所以男性的雙名比例始終高于女性,反之女性單名比例高于男性。即使除去按字輩取名的習(xí)俗,雙名中由兩個(gè)漢字承載的信息量也大于單名,增加名字內(nèi)涵的同時(shí)避免了重名的概率,所以總體上雙名一直占據(jù)主流地位。但是隨著近現(xiàn)代中國各種思想解放運(yùn)動(dòng)展開,一定程度上打破了傳統(tǒng)的宗法制度,按照字輩取名的習(xí)俗也逐漸減少。原本按照字輩取名的雙名,實(shí)際上只添加了名字末尾的一個(gè)新信息,如今中間的字沒有了,依然只需要添加一個(gè)新信息,所以單名的比例就呈現(xiàn)增高的趨勢。在改革開放初期,隨著思想觀念的進(jìn)一步解放,以及追求個(gè)性的心理特征,單名比例不斷增長,在1979-1998年到達(dá)高峰。但是進(jìn)入21世紀(jì),隨著人口的增多,姓名規(guī)范意識的增強(qiáng),單名比例又開始下降,雙名逐漸增多。
本文的難易度僅指書寫難易程度或認(rèn)讀的難易程度。采用漢字常用等級這一指標(biāo)衡量人名漢字的難易度,并以國家語言文字工作委員會(huì)1988年1月發(fā)布的《現(xiàn)代漢語3 500常用字表》作為標(biāo)準(zhǔn)。該字表中的字主要滿足基礎(chǔ)教育和文化普及的基本用字需要,因此人名中的漢字若是來自于該字表,則用字在認(rèn)讀或書寫上相對簡單。該表中的漢字有一級常用字和二級常用字之分,不在字表中的字統(tǒng)稱為非常用字,即用字相對復(fù)雜。
按照性別分組,采用卡方檢驗(yàn)驗(yàn)證用字難度是否存在統(tǒng)計(jì)學(xué)意義上的差異,結(jié)果表明,男女人名用字的難度具有統(tǒng)計(jì)學(xué)意義上的差異。具體統(tǒng)計(jì)結(jié)果如表3所示。
表3 性別與用字難度卡方檢驗(yàn)
由于單名在編碼長度上比雙名短一位,大大增加了重名的可能。取名人為了降低重名的概率,會(huì)在選字入名時(shí)有意選擇一些復(fù)雜的、不常用的字。女性的單名比例高于男性,為排除名字長度的影響,本文將單名和雙名分離,分別研究兩性人名用字的難易程度。圖2是按自然年份劃分的單名用字難易程度的分布。
圖2 自然年份中用字難易程度的性別差異(單名)
由圖2可知: ①單名用字以一級常用字為主,其次是非常用字,最后才是二級常用字。二級常用字比較穩(wěn)定,非常用字最不穩(wěn)定; ②女性單名用字較之男性更復(fù)雜,但是兩性人名的非常用字總體呈現(xiàn)出下降的趨勢。男性用字難易度波幅較大,較女性更加不穩(wěn)定; ③對比圖3后發(fā)現(xiàn),人名的非常用字出現(xiàn)過兩次低谷階段,第一次低谷時(shí)期是1939-1958年附近,第二次則是1999年至今。在1966-1979年附近,非常用字出現(xiàn)過一次激增階段。
圖3 重大歷史事件中用字難易程度的性別差異(單名)
人名的主要功能是區(qū)分彼此并且滿足社會(huì)成員之間的互動(dòng),所以名字要便于辨認(rèn),常用字總體占比會(huì)更多。但同時(shí)人名也是個(gè)人身份的標(biāo)簽,為了體現(xiàn)個(gè)性或者表達(dá)某些特殊含意,也會(huì)出現(xiàn)特殊的字,非常用字也會(huì)占據(jù)一定比例。而正是出于這些特殊的情感表達(dá),會(huì)在某些特定時(shí)間段內(nèi)出現(xiàn)較大變化,于是就會(huì)出現(xiàn)圖2、圖3中所看到的起伏。值得注意的是,男性人名的非常用字波幅大于女性,男性非常用字的激增階段對應(yīng)的是1966-1978年這一時(shí)期,其名字更容易與特定事件和時(shí)段掛鉤。人名非常用字的兩次低谷對應(yīng)的原因可能有所不同。第一次非常用字的低谷伴隨的是一級常用字的增長,而第二次則伴隨的是二級常用字的增長。我們的猜想是第一次低谷相應(yīng)時(shí)期的新生兒父母多經(jīng)歷了多年戰(zhàn)爭,受教育機(jī)會(huì)少,文化程度低,在取名的時(shí)候受到文化程度等因素的限制,用字相對比其他時(shí)期更加簡單。而第二次低谷則更可能是新時(shí)期語言文字工作者和有關(guān)政府對于姓名規(guī)范的呼吁。
圖4是按自然年份劃分的雙名用字難易程度的分布。
圖4 自然年份中用字難易程度的性別差異(雙名)
由圖4可知: ①與單名類似,雙名的一級常用字占據(jù)絕對優(yōu)勢,二級常用字最穩(wěn)定; ②女性雙名的整體用字仍然難于男性,兩性人名用字在1978年后都發(fā)生了顯著變化,一級常用字減少,非常用字呈現(xiàn)上升趨勢; ③改革開放后人名用字與前三個(gè)階段有明顯區(qū)別,而這期間又分為兩個(gè)時(shí)期,21世紀(jì)后的兩性用字的難易程度差異變大,女性非常用字增幅比男性更顯著。
雖然雙名難易度的三個(gè)等級分布與單名類似,但是整體上雙名用字比單名簡單,這印證了本節(jié)開頭的假設(shè)即用字的難易度與名字長度有一定關(guān)聯(lián)。與單名逐漸變得更簡單所不同的是,雙名逐漸變得復(fù)雜,這與二者的基數(shù)有關(guān)。
在計(jì)量語言學(xué)中測量詞匯豐富度常用的指標(biāo)是型例比(TTR,type-token ratio),該指標(biāo)計(jì)算的是文本中不同詞語在所有詞語中所占的比例,TTR值越大,說明文本使用的詞匯越豐富。但是TTR的值受到語料庫大小的影響,因此本文使用“吉羅指數(shù)”[13-14],它是TTR的變體,可減少文本大小對于豐富度的影響,如式(1)所示。
(1)
其中,Types是型符,Tokens是類符。我們將詞匯豐富度這一指標(biāo)應(yīng)用到人名用字中,計(jì)算人名用字的豐富度,計(jì)算得到歷時(shí)百年的人名用字總體豐富度為11.45。以施建剛和邵斌[15]計(jì)算的“蘭卡斯特現(xiàn)代漢語語料庫”傳記和散文子庫中的吉羅指數(shù)參照,該語料庫的吉羅指數(shù)為43.93,遠(yuǎn)高于人名用字的吉羅指數(shù),這說明相對于普通漢語書面語,人名用字的豐富度較低,用字比較集中。
為探究不同年代用字豐富度的變化以及兩性人名用字豐富度的差異,我們分別按照自然年代的劃分計(jì)算男性和女性人名用字的吉羅指數(shù),如表4所示。
表4 兩性人名用字豐富度的吉羅指數(shù)
從表4中可以看到,從1919年至今,人名用字的豐富度總體呈現(xiàn)降低的趨勢,也就是人名用字逐漸單一化,進(jìn)入人名的漢字越來越集中。人名作為專有名詞的一種,其專有性和獨(dú)特性越來越突出。同時(shí)對比兩性人名用字的吉羅指數(shù)發(fā)現(xiàn),1998年以前,男性人名用字比女性人名用字豐富。
對近百年來兩性人名中出現(xiàn)的漢字進(jìn)行統(tǒng)計(jì),取高頻字的前15個(gè)字。兩性人名用字的總體差異見表5。在這些高頻字中只有“華”字是重疊的,其在現(xiàn)代漢語詞典[16]中的解釋主要有“中國、繁華、精英、美麗”等,這些代表了中國人名最常包含的意義。
表5 百年來兩性人名高頻字
在我們感性認(rèn)知中,男女人名在用字上有所不同。但是哪些漢字具有明顯的傾向,這些具有傾向的漢字本身有怎樣的特征呢?本文設(shè)計(jì)了人名用字的性別偏度這一指標(biāo),從定量上對人名與性別的關(guān)聯(lián)進(jìn)行考察,如式(2)所示。
(2)
Cbias為漢字的性別偏度分?jǐn)?shù),其中fmale為該字在男性人名中出現(xiàn)的頻次,ffemale為該字在女性人名中出現(xiàn)的頻次,ftotal為該字在所有人名中出現(xiàn)的頻次。當(dāng)Cbias> 0 ,該字偏向于男性用字;當(dāng)Cbias< 0 ,該字偏向于女性用字;當(dāng)Cbias=0,該字在男女人名中的分布均衡,為中性字;當(dāng)Cbias≈±1 時(shí),該漢字僅出現(xiàn)在一種性別之中,稱之為極男/女字。取總字頻為前1 000 的所有漢字中的性別偏度,最終得出百年人名性別極性字表,如表6所示。
表6 百年高頻人名用字性別極性字表
在高頻字中,極女字較極男字更多,也就是在取名系統(tǒng)中女性人名的專用字較多。我們對表6中比較集中的幾個(gè)意象做了簡要?dú)w納,結(jié)果如表7所示。
表7 兩性用字意象歸納
我們分性別將所有年份的用字進(jìn)行統(tǒng)計(jì),得出不同年份的高頻字表,如表8、表9所示。
表8 自然年份中兩性人名高頻字分布
表9 重大歷史事件中兩性人名高頻字分布
按照總體高頻字表中每個(gè)字對應(yīng)的排序,對歷時(shí)層面的前15個(gè)高頻字進(jìn)行編碼。前人的研究認(rèn)為,人名用字與歷史事件有關(guān)[4],因此在劃分人名階段的時(shí)候采用了重大歷史事件作為節(jié)點(diǎn)。所以我們首先選擇表9的內(nèi)容,采用獨(dú)立樣本Kruskal-Wallis檢驗(yàn)。檢驗(yàn)結(jié)果表明,男性用字的分布不具有統(tǒng)計(jì)學(xué)意義上的差別,而女性用字具有統(tǒng)計(jì)學(xué)意義上的差異。具體統(tǒng)計(jì)檢驗(yàn)結(jié)果如圖5所示。
因?yàn)榕杂米址植即嬖诓町?,我們進(jìn)一步對女性用字做了成對比較,探究不同階段之間的差異。如圖6所示,圖中不同時(shí)段用節(jié)點(diǎn)表示,每個(gè)節(jié)點(diǎn)顯示樣本的平均秩,彼此之前的關(guān)系用實(shí)線連接??梢钥吹?,女性用字差異主要來源于第四個(gè)階段,即改革開放以后,女性用字在改革開放后發(fā)生了顯著變化。
圖5 人名用字的Kruskal-Wallis檢驗(yàn) 檢驗(yàn)總計(jì)量為60。男性人名均值為6.704,雙側(cè)漸近顯著性為0.082,女性人名均值為15.627,雙側(cè)漸近顯著性為0.001。
圖6 女性用字分布與年代的成對比較 每行會(huì)檢驗(yàn)零假設(shè);樣本1和樣本2分布相同。顯示漸近顯著性(雙側(cè)檢驗(yàn))。顯著性水平為0.05。 Bonferroni校正已針對多個(gè)檢驗(yàn)調(diào)整顯著性值。
鑒于差異主要分為兩個(gè)大的階段,即1979年前后(改革開放前后),因此我們對這一時(shí)期前后兩性人名高頻字變化的主要特點(diǎn)做出歸納,結(jié)果如表10所示。
表10 改革開放前后高頻字意象主要變化
從表中可以看到,1979年以前男性人名部分與歷史事件有關(guān)聯(lián),兩性人名對于政治歷史事件的敏感度是不一樣的,相比之下男性人名與政治歷史事件聯(lián)系更加緊密,從不同階段的男性高頻字可以看出時(shí)代特點(diǎn)。在中華人民共和國成立前強(qiáng)調(diào)傳統(tǒng)“修身治國平天下”的理想,男性高頻用字更多反映個(gè)人品德修養(yǎng)。從表8中可以看到,在第一階段“德”“良”等字都在前15個(gè)高頻字中;在第二階段,男性人名反映偉大志向、建設(shè)祖國的心愿,如“建”“志”等;第三階段則反映出革命與建設(shè)的潮流,如“軍”“偉”。男性人名用字分布雖然總體沒有顯著差異,但每個(gè)階段都隨著時(shí)代特征而體現(xiàn)出不同的側(cè)重,高頻字的排序隨之發(fā)生變化。
不過變化是緩慢且滯后的,可以通過兩種時(shí)間劃分方式的重疊部分來推測不同時(shí)間段內(nèi)部的變化,以“德”“建”二字為例,從“德”字在表8、表9中的排序變化可以看出,該字在中華人民共和國成立前使用非常頻繁,中華人民共和國成立后使用頻率并沒有迅速降低,甚至在早期使用依然較多,隨著時(shí)間的發(fā)展逐漸變得不那么常用。類似地,1950-1958年間“建”的使用不如1959-1965年多。與其他歷時(shí)階段比,“建”字在建國初期呈現(xiàn)小高峰。而在這一階段內(nèi)部再比較,該字的使用又呈現(xiàn)出了逐漸上升的趨勢。因此人名的變化雖然受時(shí)代的影響,但其變化具有漸進(jìn)性和滯后性。
為了更清晰地顯示人名高頻用字的變化,我們分性別總結(jié)了各個(gè)階段排名均在前50的字,取前10個(gè),歸為穩(wěn)定且常用;取各階段在前50,并且呈現(xiàn)上升趨勢的前20個(gè)(字)歸為上升快且當(dāng)前常用(Max(Rank1,Rank2,Rank3)-Rank4);取前三個(gè)階段中任意階段曾在前50,但在第四個(gè)階段下降的前20個(gè)字歸為下降快且曾經(jīng)常(Rank4-Min(Rank1,Rank2,Rank3))。最終得到表11。
表11 用字變化趨勢
續(xù)表
本文構(gòu)建了一個(gè)中國名人人名數(shù)據(jù)庫,共11萬余條,每個(gè)條目含有人名、性別、出生地等社會(huì)文化標(biāo)簽,同時(shí)含有拼音、筆畫、偏旁等文字信息標(biāo)簽。該數(shù)據(jù)庫可以支持對人名的地域、歷時(shí)、性別等多個(gè)維度的研究。
在人名數(shù)據(jù)庫的支持下,本文選取1919年至今的人名作為研究對象,從人名長度、用字難易度、豐富度等角度進(jìn)行探究。研究發(fā)現(xiàn)男性人名比女性長,但兩性人名長度的差異隨著時(shí)間而不斷縮小。建國以來單名比例不斷增加,但是進(jìn)入21世紀(jì)后又逐漸減小。單名用字比雙名難,女性人名用字比男性難,男性用字難易程度波動(dòng)較大。人名中的二級常用字最為穩(wěn)定,其次是一級常用字。在用字的豐富度上,隨著時(shí)間的發(fā)展,人名用字越來越體現(xiàn)出其專有性的特征,豐富度逐漸降低。男性人名用字總體上比女性用字豐富。通過計(jì)算人名的性別偏度指標(biāo)后發(fā)現(xiàn)女性人名專用字更多。改革開放對人名用字格局產(chǎn)生了重要影響,女性用字變化顯著。男性人名與歷史階段聯(lián)系更加緊密,用字的變化雖受歷史事件的影響,但其變化具有漸進(jìn)性和滯后性。
這些發(fā)現(xiàn)可以幫助我們進(jìn)一步了解人名的發(fā)展變化規(guī)律,探究漢字中的性別差異。當(dāng)然,本文還存在一些不足,例如,在自然年份中1919年至今這一時(shí)段的人名較少,對數(shù)據(jù)的分析產(chǎn)生一定影響。未來工作中,我們將持續(xù)補(bǔ)充新增名人人名數(shù)據(jù)及相關(guān)信息,并從偏旁、地域等維度進(jìn)行深入研究。