馮先成 ,李 寒 ,周 密 ,郭耀飛
1.智能機(jī)器人湖北省重點實驗室(武漢工程大學(xué)),湖北 武漢 430205 2.北京漢通達(dá)科技有限公司,北京 100081
至2012年底,我國60歲及以上老年人口已達(dá)1.94 億,占總?cè)丝诘?14.3%,在 2014 年已突破 2億,并以每年3.2%的速度增加.根據(jù)國際標(biāo)準(zhǔn),我國已經(jīng)進(jìn)入老年型社會.隨著社會老齡化程度的不斷加深,孤單老人數(shù)呈上升趨勢,現(xiàn)如今成為一個不可忽視的社會問題.目前,我國中西部地區(qū)的城鄉(xiāng)空巢家庭超過50%,社會老齡化直接導(dǎo)致社會養(yǎng)老等難題,特別是空巢老人、家庭的健康和安全生活,是智慧城市評價指標(biāo)體系建設(shè)的一個重要指標(biāo),需要整個社會、家庭、社區(qū)、政府及個人的共同努力,因此,建設(shè)智慧城市的體系架構(gòu),有利于社會和諧.
建立空巢老人識別模型,需要包含空巢老人的用戶信息數(shù)據(jù),主要有:
用戶信息:記錄本地區(qū)用戶(通信運(yùn)營網(wǎng)對應(yīng)的手機(jī)個人)基本情況、終端信息、計費(fèi)等數(shù)據(jù);
通話清單:記錄本城市用戶(手機(jī)號碼)在某月每天的通話(主/叫、市/話)情況;
短信清單:記錄了上述用戶在某月每天的短信發(fā)送/接收情況.
根據(jù)空巢老人的用戶信息數(shù)據(jù),建立空巢老人的數(shù)據(jù)模型,識別本地區(qū)的空巢老人手機(jī)號碼、所在區(qū)域、子女手機(jī)號碼等信息[1-2].
對于大量的多特征的數(shù)據(jù)的識別問題,構(gòu)造識別函數(shù),運(yùn)用神經(jīng)網(wǎng)絡(luò)進(jìn)行識別.對于信息充分且正常的用戶,構(gòu)造識別函數(shù)具有識別準(zhǔn)確,原理簡單易行的優(yōu)點.識別模型符號說明如表1所示.
表1 符號說明Table 1 Symbol description
通過分析其區(qū)號差別,年齡差距,通話的類型,通話的時間段等指標(biāo),實現(xiàn)了對空巢老人較為精準(zhǔn)的識別,并通過區(qū)號將其所得空巢老人集合分為與子女同城的空巢老人與非同城的空巢老人兩類.首先進(jìn)行對通話信息的預(yù)處理,篩選出能進(jìn)行識別的數(shù)據(jù),在此基礎(chǔ)上先判別主叫與被叫是否為父母與子女的關(guān)系,接著判別主叫與被叫是否在同一個城市,得出與子女同城的空巢老人與非同城的空巢老人集合.
在對用戶信息進(jìn)行合理分析后,構(gòu)造了一個評判空巢老人用戶的識別函數(shù),該函數(shù)是一個多變量的函數(shù),對各個變量進(jìn)行分開評判,最后以乘積的形式得到結(jié)果[1-2].
選取主叫被叫年齡差距,通話時間,通話時長,通話次數(shù)為函數(shù)自變量,構(gòu)造綜合識別函數(shù)Gi(x),其函數(shù)關(guān)系如下:
其中用戶特征矩陣 X=[Xa1,Xa2,T1,T2,N]
用戶年齡識別函數(shù)
通話時間識別函數(shù)為:
年齡差距識別函數(shù)為:
通話起始時間識別函數(shù)為:
一周內(nèi)的通話次數(shù)識別函數(shù)為:
考慮到對于一個用戶,由于通話對象不同,識別函數(shù)的結(jié)果也不同,對于Gi(x)同時取1和0的用戶,定義函數(shù) G(x):
當(dāng) G(x)=0,表示該用戶不是空巢老人,G(x)=1,表示該用戶是空巢老人.這樣,就識別出空巢老人的集合.部分結(jié)果如表2所示.
表2 空巢老人集合Table 2 Empty-nestelders collection
在所識別出的空巢老人集合中,以與子女是否同城為依據(jù),進(jìn)一步劃分:
空巢老人識別流程如圖1所示.在通話清單中被叫號碼有異網(wǎng)非本運(yùn)營商的用戶,在用戶資料中不能找出其個人信息,因此,在通話信息預(yù)處理過程中去除被叫為y和g開頭的號碼.
圖1 空巢老人識別流程Fig.1 R ecognition process of empty-nestelders
通過合理分析空巢老人識別系統(tǒng)的數(shù)據(jù),在對特征進(jìn)行粗略的篩選后,選出手機(jī)價格,套餐檔次等7個特征,如圖2所示.
為了選擇出對用戶識別最有效的特征,利用識別函數(shù)識別的結(jié)果,將空巢老人集合與非空巢老人集合在不同的特征組合下進(jìn)行線性可分性判斷(其中圓圈表示非空巢老人用戶,正方形表示空巢老人集合).
給出兩類集合樣本各50個,7個特征兩兩組合共有21種組合,幾種特征組合的線性可分性如圖3所示.
圖2 識別系統(tǒng)的數(shù)據(jù)分析Fig.2 Data analysis of identification system
圖3 特征組合的線性可分性Fig.3 Linear separability of feature combination
前饋網(wǎng)絡(luò)主要實現(xiàn)函數(shù)逼近、模式識別、分類、數(shù)據(jù)壓縮.前饋神經(jīng)網(wǎng)絡(luò)模型如圖4所示.本模型中運(yùn)用前饋神經(jīng)網(wǎng)絡(luò)的模式識別功能,搭建2層前饋神經(jīng)網(wǎng)絡(luò),隱層激活函數(shù)為sigmoid函數(shù),softmax 為輸出層函數(shù),訓(xùn)練算法為共軛梯度法[3-5].
圖4 前饋神經(jīng)網(wǎng)絡(luò)模型Fig.4 Networksmodel of feed forward neural
采用前饋神經(jīng)網(wǎng)絡(luò),采集足夠多的典型性好和精度高的樣本數(shù)據(jù),必須將收集到的樣本數(shù)據(jù)隨機(jī)分成訓(xùn)練樣本、檢驗樣本(10%以上)和測試樣本(10%以上)三部分[3-5].因此,在前饋神經(jīng)網(wǎng)絡(luò)模型的輸出結(jié)果樣本中,隨機(jī)選取100個空巢老人與100個非空巢老人樣本,選取其中75%的訓(xùn)練樣本,15%用于檢驗,15%用于測試.
為了選擇出對用戶識別最有效的特征,將這些特征進(jìn)行組合,7種特征總組合數(shù)為個,只選取2個特征的組合與3個特征的組合作為輸入,運(yùn)用MATLAB神經(jīng)網(wǎng)絡(luò)模式識別工具箱對樣本進(jìn)行識別,神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖5所示.
圖5 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.5 Neural network structure
兩個特征的組合:(長途費(fèi),市話費(fèi)),(市話費(fèi),流量費(fèi)),(短信費(fèi),長途費(fèi)),(市話費(fèi),短信費(fèi)),(短信費(fèi),流量費(fèi)),(流量費(fèi),長途費(fèi)),(套餐檔次,消費(fèi)金額).三個特征的組合:(短信費(fèi),市話費(fèi),長途費(fèi)),(市話費(fèi),長途費(fèi),流量費(fèi)),(手機(jī)價格,套餐檔次,消費(fèi)金額).
識別效果圖的各字段含義:
Training confusionmatrix (訓(xùn)練樣本效果圖)
Validation confusionmatrix(檢驗樣本效果圖)
test confusionmatrix (測試樣本效果圖)
all confusionmatrix (總效果圖)
Training ROC (訓(xùn)練樣本ROC曲線)
Validation ROC (檢驗樣本ROC曲線)
Test ROC (測試樣本ROC曲線)
ROC (receiver operator characteristic curve)曲線:接收特性曲線,曲線下面積越大,識別準(zhǔn)確性越高.在每個效果圖中,位于第三行第三列的數(shù)值為網(wǎng)絡(luò)對該樣本的識別準(zhǔn)確率,該項指標(biāo)數(shù)值越接近于1,表示網(wǎng)絡(luò)識別效果越好.幾種組合的識別效果如圖6所示.
圖6 各組合的識別效果Fig.6 Recognition effects of each combination
通過對比,發(fā)現(xiàn)選?。ㄊ謾C(jī)價格,套餐檔次,消費(fèi)金額)這一組特征作為網(wǎng)絡(luò)的輸入時,能得到最好的識別效果,無論從識別的準(zhǔn)確率(訓(xùn)練樣本68.6%,檢驗樣本 73.3%,測試樣本 73.3%),還是從ROC曲線顯示的診斷準(zhǔn)確性來看,以該組特征為判據(jù)識別空巢老人都具有良好的效果.
神經(jīng)網(wǎng)絡(luò)算法以其強(qiáng)大的非線性處理能力,自組織和自適應(yīng)的學(xué)習(xí)性能等特點,廣泛應(yīng)用于模式識別、優(yōu)化組合、機(jī)器人控制、信號處理等領(lǐng)域.神經(jīng)網(wǎng)絡(luò)中使用最為廣泛的就是前饋神經(jīng)網(wǎng)絡(luò)算法[6-7].
上述模型通過對用戶資料信息、通話與短信信息的多級判別,能篩選出比較符合條件的空巢老人,原理簡單,易于實現(xiàn).
但是模型的篩選條件不夠完善,對短信表沒有進(jìn)行充分的利用,對于子女在外地,家庭條件不富裕的用戶來說,發(fā)短信往往比打電話流行.因此,對于經(jīng)常發(fā)短信而打電話較少的用戶,僅僅通過用戶資料表和通話清單難以將其識別出來[8].
通過前饋神經(jīng)網(wǎng)絡(luò)算法建立的數(shù)學(xué)模型,在所給的通話清單數(shù)據(jù)中,識別出空巢老人及其子女的電話號碼,給老年人送去別樣的關(guān)懷.比如,在節(jié)假日給老人發(fā)送祝福的短信,并且通過短信方式提醒他們的子女給老人送去祝福.根據(jù)空巢老人的通話特點,給空巢老人以最低的通信話費(fèi)來與自己的子女聯(lián)系.通信運(yùn)營商也可以在平時向空巢老人發(fā)送有利心理健康、溫暖的短信,讓他們感受到社會對他們的關(guān)愛.
通過上述模型,將所確定的空巢老人名單及信息交給社會福利組織、志愿者組織以及社區(qū)養(yǎng)老機(jī)構(gòu),便于他們舉辦一些例如登門探望等送愛心活動,為老年人提供集體生活照料、醫(yī)療保健、精神慰藉等綜合服務(wù).還可以每年更新空巢老人的數(shù)據(jù),為統(tǒng)計局等統(tǒng)計機(jī)構(gòu)提供了簡單有效的途徑來更新數(shù)據(jù),構(gòu)建和諧社會.
[1]沈斌,漆奮平,江維,等.基于BP網(wǎng)絡(luò)的超濾膜分離中藥成分的分析與實現(xiàn)[J].武漢工程大學(xué)學(xué)報,2009,31(9):55-58.SHEN Bin,QI Fen-ping,JIANG Wei.Analysis and implement of separatte chinese medicine based on BP network[J].Journal of Wuhan Institute of Technology,2009,36 (9):55-58.(in C hinese)
[2]黃登斌,夏學(xué)知.基于用戶分類信息的空巢老人挖掘模型[J].計算機(jī)與數(shù)字工程,2013(3):440-441.HUANG Deng-bin,XIA Xue-zhi.Mining model of empty nester based on the classification of the users information [J].Computer& Digital Engineering, 2013(3):440-441.(in C hinese)
[3]李翔,蘇成,王韶君,等.基于模糊神經(jīng)網(wǎng)絡(luò)的綜合評判方法[J].計算機(jī)工程,2009,35(6):200-203.LI Xiang,SU Cheng,W ANG Shao-jun.Comprehensive evaluation method based on fuzzy neural network [J].ComputerEngineering,2009,35(6):200-203.(in C hinese)
[4]王勇,付志紅,張淮清.基于前饋神經(jīng)網(wǎng)絡(luò)的電網(wǎng)基波高精度檢測[J].電網(wǎng)技術(shù),2011(8):124-128.WANG Yong,F(xiàn)U Zhi-h(huán)ong,ZHANG Huai-qing.High precision detection of fundamental of power grid based on back propagation neural network [J].Power System Technology,2011(8):124-128.(in C hinese)
[5]劉瑞葉,黃磊.基于動態(tài)神經(jīng)網(wǎng)絡(luò)的風(fēng)電場輸出功率預(yù)測[J].電力系統(tǒng)自動化,2012(11):19-22.LIU Rui-ye,HUANG Lei.Wind power forecasting based on dynamic neural networks [J].Automation of electric Power Systems,2012(11):19-22.(in C hinese)
[6]蔡信,李波,汪宏華.基于神經(jīng)網(wǎng)絡(luò)模型的動力電池SOC 估計研究[J].機(jī)電工程,2015(1):128-132.CAIXin,LIBo,WANG Hong-h(huán)ua.Estimation of stateof-charge for electric vehicle power battery with neural network method [J].Journal of Mechanical& Electrical Engineering,2015(01):128-132.(in C hinese)
[7]楊帆,姜勇,楊元君.信息融合技術(shù)在礦井安全監(jiān)測系統(tǒng)中的應(yīng)用[J].武漢工程大學(xué)學(xué)報,2014,36(5):64-67.YANG Fan,JIANG Yong,YANG Yuan-jun.Information fusion technology in application of mine safety monitoring system [J].Journal of Wuhan Institute of Technology,2014,36(5):64-67.(in C hinese)
[8]劉揚(yáng),張振海.小波神經(jīng)網(wǎng)絡(luò)的無刷直流電機(jī)轉(zhuǎn)子位置檢測方法[J].武漢工程大學(xué)學(xué)報,2014(10):66-70.LIU Yang,ZHANG Zhen -h(huán)ai.Rotor position detection method of brushless motor based on wavelet neural Network [J].Journal ofWuhan Institute of Technology,2014(10):66-70.(in C hinese)