黎子恒 胡垠盈 陳雪
摘 要:本文針對全球語言發(fā)展趨勢進行了分析討論,建立了基于時間序列的三次指數(shù)平滑模型以及基于粒子群優(yōu)化的神經(jīng)網(wǎng)絡(luò)模型,對人口遷移以及語言發(fā)展展開了相關(guān)研究。同時考慮到影響母語使用者數(shù)量的因素,建立了多元線性回歸模型,預(yù)測未來50年語言使用人數(shù)的變化。針對全球人口遷移受經(jīng)濟和交通等因素的影響,提出了基于粒子群優(yōu)化的神經(jīng)網(wǎng)絡(luò)模型,預(yù)測未來50年的全球移民格局。最后得出結(jié)論:同一時期語言隨地理分布發(fā)生變化。
關(guān)鍵詞:時間序列 多元線性回歸 粒子群優(yōu)化 語言發(fā)展
引言
語言是文化最直觀的表達方式,目前地球上大約有6900種語言。其中,中文、英文、西班牙文、俄文、日文、阿拉伯文、葡萄牙文、印度文以及孟加拉文是當(dāng)今世界常用的九大語言,世界上大多數(shù)人都會說除母語外的第二種語言。然而隨著時間的推移,語言的使用受到不同因素的影響,其可能會有所變化。
1 預(yù)測模型
首先設(shè)定時間系列: , 代表加權(quán)系數(shù), 。三次指數(shù)平滑計算如下:
其中 是指數(shù)平滑值, 是第二個指數(shù)平滑值,并且 是第三個指數(shù)平滑值。
而后建立三個指數(shù)平滑預(yù)測模型[1]為:
是預(yù)測的數(shù)量t+m ; t是已知數(shù)據(jù)的年數(shù), ; m是要預(yù)測的年數(shù)。
其次進行多元線性回歸:
使用最小二乘法找出估計值c0 、c1、c2 …c6 ,也就是選擇估計值 ,當(dāng)cj 等于 ,j=0,1,2,…,6 ,平方誤差的總和QW 降到最低。
本文利用多元線性回歸分析建立六因素與三因素之間的關(guān)系 ,然后添加時間 影響力,來預(yù)測未來50年的語言數(shù)量。
2 BP神經(jīng)網(wǎng)絡(luò)模型
由于全球人口變化與時間不成線性關(guān)系,因此需要一種非線性方法來預(yù)測全球人口。 因此,本文建立了一個基于粒子群算法的BP神經(jīng)網(wǎng)絡(luò)模型來預(yù)測全球人口,在優(yōu)化的學(xué)習(xí)算法中,粒子矢量
每個元素的值表示BP網(wǎng)絡(luò)中神經(jīng)元的權(quán)重或閾值,其中 d是BP網(wǎng)絡(luò)中的所有權(quán)值和閾值數(shù)量。
粒子群優(yōu)化粒子適應(yīng)度函數(shù)如下:
;
其中n是樣本的數(shù)量, , 表示顆粒的數(shù)量。Yi,j 是理想的輸出i樣本和yi,j 是的實際輸出ith樣本。
根據(jù)已知全球人口數(shù)據(jù)預(yù)測,應(yīng)用本文模型對未來50年全球人口進行預(yù)測如下圖。
3 人口遷移模型
本文通過使用人口統(tǒng)計數(shù)據(jù),將50年內(nèi)語言變化分為以下三種情況。
①如美國,所使用的語言在各種語言中影響極大,人均國內(nèi)生產(chǎn)總值、國際商業(yè)關(guān)系等指標(biāo)處于良好狀態(tài),這將導(dǎo)致進一步增加世界上使用英語的人數(shù)。
②一些發(fā)展中國家,如印度、巴基斯坦和尼日利亞,由于人口迅速增長,其母語人數(shù)大幅增加。但是,它們的指標(biāo)并不像歐美等發(fā)達國家那么好,在世界范圍內(nèi)增長并正在向世界先進經(jīng)濟體轉(zhuǎn)移。
③波斯尼亞和黑塞哥維那等人口減少,指標(biāo)不像歐美等發(fā)達國家發(fā)達的國家,其使用總?cè)藬?shù)下降,并轉(zhuǎn)移到發(fā)達國家,最終可能滅絕。
首先,收集每種語言中用戶數(shù)量的數(shù)據(jù),利用三種指數(shù)平滑預(yù)測各類語言的趨勢,取權(quán)重系數(shù)值為0.6?0.8;
然后,使用多元線性回歸來表示每個因素對使用該語言的人數(shù)的影響,并合并時間序列以獲得預(yù)測值。由此,預(yù)測未來50年每個語言的母語人數(shù)和使用總數(shù)的變化如下:
結(jié)論
本文針對全球語言發(fā)展趨勢進行了分析討論,建立了基于時間序列的三次指數(shù)平滑模型以及基于粒子群優(yōu)化的神經(jīng)網(wǎng)絡(luò)模型,對人口遷移以及語言發(fā)展展開了相關(guān)研究。本文建立的時間序列模型中可充分利用原始時間序列數(shù)據(jù),計算速度快,模型參數(shù)動態(tài)確定能力強,準確性較好。
參考文獻:
[1]Margaret L. Brandeau, Samuel S. Chiu. An overview of representative problems in location research [J]. Management Science. 1989,35(6):645- 674
[2]Jossef Perl, Mark S. Daskin. A unified warehouse location-routing methodology[J]. Journal of Business Logistics. 1993,5(1):92- 111