国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于手機(jī)時(shí)空數(shù)據(jù)的用戶畫像構(gòu)建方法

2021-10-18 00:31汪洋姚偉娜沈廣才楊明
電腦知識(shí)與技術(shù) 2021年26期
關(guān)鍵詞:行為分析

汪洋 姚偉娜 沈廣才 楊明

摘要:手機(jī)信號(hào)中包含實(shí)時(shí)定位時(shí)空信息,這些移動(dòng)時(shí)空數(shù)據(jù)中包含了豐富的時(shí)空特征和行為信息,通過(guò)對(duì)時(shí)空數(shù)據(jù)進(jìn)行分析和處理,可有效挖掘人類活動(dòng)規(guī)律與行為特征,實(shí)現(xiàn)用戶畫像,為個(gè)性化推薦、突發(fā)事件預(yù)防、城市計(jì)算提供必要基礎(chǔ)。本文提出了基于手機(jī)移動(dòng)時(shí)空信息的用戶畫像框架,著重介紹了對(duì)于關(guān)鍵技術(shù)如停留點(diǎn)與停留區(qū)檢測(cè)、重要位置識(shí)別、位置語(yǔ)義分析、用戶行為分析等的實(shí)現(xiàn)方法,對(duì)系統(tǒng)中的隱私保護(hù)問(wèn)題、數(shù)據(jù)精度與識(shí)別準(zhǔn)確性等問(wèn)題也給出了進(jìn)一步的意見(jiàn)。

關(guān)鍵詞:時(shí)空數(shù)據(jù)處理;停留點(diǎn);停留點(diǎn)聚類;軌跡模式;重要地點(diǎn)識(shí)別;行為分析

中圖分類號(hào):TP18? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1009-3044(2021)26-0098-03

開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):

1 引言

隨著移動(dòng)互聯(lián)網(wǎng)、位置服務(wù)等技術(shù)的高速發(fā)展以及移動(dòng)設(shè)備的普及,產(chǎn)生了海量的時(shí)空數(shù)據(jù)。在用戶時(shí)空數(shù)據(jù)中包含了豐富的時(shí)空特征和行為信息,通過(guò)對(duì)時(shí)空數(shù)據(jù)語(yǔ)義的處理和分析,可以挖掘人類活動(dòng)規(guī)律與行為特征、城市車輛移動(dòng)特征、用戶行為喜好特征等有用信息,對(duì)于提升社會(huì)工作效率、提前預(yù)測(cè)并防范突發(fā)事件有著關(guān)鍵作用?;跁r(shí)空數(shù)據(jù)的用戶畫像已經(jīng)在許多領(lǐng)域得到了應(yīng)用,用戶畫像方法不僅應(yīng)用于電子商務(wù)和內(nèi)容推送領(lǐng)域,在人才評(píng)價(jià)、旅游服務(wù)[3]、在線評(píng)價(jià)[4]、社交[5]甚至于刑偵等多個(gè)領(lǐng)域發(fā)揮著重大作用。

移動(dòng)通信網(wǎng)絡(luò)能夠定期或不定期地主動(dòng)或被動(dòng)地記錄手機(jī)用戶時(shí)間線的基站編號(hào),手機(jī)等移動(dòng)終端收集到的定位數(shù)據(jù)可以來(lái)自移動(dòng)通信網(wǎng)絡(luò)、Wi-Fi接入點(diǎn)位置信息等,記錄了移動(dòng)對(duì)象的位置、時(shí)間、速度和方向等行為特征。移動(dòng)終端通過(guò)對(duì)不同基站下行導(dǎo)頻信號(hào)(電信網(wǎng)內(nèi)為測(cè)量或監(jiān)控的目的而發(fā)送的信號(hào))進(jìn)行測(cè)量,得到不同基站下行導(dǎo)頻的參考信號(hào)強(qiáng)度和到達(dá)時(shí)間。依據(jù)該測(cè)量結(jié)果以及基站的坐標(biāo),便能計(jì)算出移動(dòng)終端所在的位置信息。此外,OTT 定位指基于App軟件獲取用戶的位置信息,依托互聯(lián)網(wǎng)應(yīng)用向海量用戶提供的定位服務(wù)。通過(guò) LTE網(wǎng)絡(luò)S1-U 接口(即基站與分組核心網(wǎng)之間的通訊接口)中的數(shù)據(jù)解析提取出用戶位置服務(wù)的經(jīng)緯度信息,并利用用戶標(biāo)識(shí)以及此時(shí)刻的MR(移動(dòng)通信)數(shù)據(jù)進(jìn)行關(guān)聯(lián),并利用特定算法實(shí)現(xiàn)MR(移動(dòng)通信)數(shù)據(jù)更高精度的定位。

時(shí)空數(shù)據(jù)一般來(lái)都具有時(shí)空序列性、異頻采樣性、數(shù)據(jù)質(zhì)量較差等的特點(diǎn)。汪倩等人對(duì)用戶畫像實(shí)現(xiàn)流程和用戶畫像應(yīng)用進(jìn)行了綜述。用戶畫像實(shí)現(xiàn)除了簡(jiǎn)單通過(guò)統(tǒng)計(jì)數(shù)據(jù)的方法實(shí)現(xiàn)外,還常運(yùn)用基于向量空間模型的方法、基于潛在Dirichlet 主題模型的方法、基于貝葉斯網(wǎng)絡(luò)的方法、基于本體(Ontology)的方法、基于神經(jīng)網(wǎng)絡(luò)的方法等來(lái)建模。高強(qiáng)等人[7]對(duì)于軌跡數(shù)據(jù)預(yù)處理方法以及噪音濾波、軌跡壓縮等方法進(jìn)行了歸納和總結(jié),介紹了目前軌跡數(shù)據(jù)處理中所使用的核心算法。

基于手機(jī)時(shí)空數(shù)據(jù)的用戶畫像構(gòu)建方法是通過(guò)對(duì)用戶所產(chǎn)生的移動(dòng)時(shí)空數(shù)據(jù)進(jìn)行深度挖掘和剖析,通過(guò)檢測(cè)算法實(shí)現(xiàn)停留點(diǎn)的檢測(cè)再對(duì)用戶停留點(diǎn)語(yǔ)義進(jìn)行理解和發(fā)掘并尋找用戶停留點(diǎn)間語(yǔ)義聯(lián)系,從而達(dá)到對(duì)用戶潛在屬性(交通工具、頻繁模式、周期模式等行為分析)和行為模式的發(fā)掘。實(shí)現(xiàn)用戶重要地點(diǎn)識(shí)別(家,單位,其他重要場(chǎng)所),實(shí)現(xiàn)推薦服務(wù)、位置服務(wù)和用戶畫像分析的應(yīng)用。

2 畫像構(gòu)建框架和基本步驟

用戶畫像是通過(guò)借用已經(jīng)分析出的用戶日軌跡、重要停留點(diǎn)、用戶個(gè)性化行為和行為規(guī)律等重要信息的分析,來(lái)實(shí)現(xiàn)對(duì)用戶屬性、偏好、行為和生活規(guī)律的分析,形成對(duì)用戶的基礎(chǔ)認(rèn)識(shí)。要刻畫一個(gè)人物畫像,要了解其的生活規(guī)律,習(xí)慣,愛(ài)好,性格,而這些可以通過(guò)對(duì)用戶停留點(diǎn)語(yǔ)義的分析實(shí)現(xiàn)。

基于時(shí)空數(shù)據(jù)的畫像構(gòu)建思想和框架如圖1,基本步驟包括動(dòng)時(shí)空數(shù)據(jù)預(yù)處理、停留點(diǎn)檢測(cè)、停留區(qū)識(shí)別、重要位置識(shí)別與語(yǔ)義理解、用戶行為分析等。保證數(shù)據(jù)的準(zhǔn)確性、完整性、可信性和可解釋性,是后續(xù)處理的基礎(chǔ)。經(jīng)過(guò)預(yù)處理的時(shí)空信息是按時(shí)間序列組成的位置序列,這些時(shí)空信息包含用戶的運(yùn)動(dòng)和停留軌跡,其中的停留點(diǎn)具有豐富的信息,因此需要將時(shí)空數(shù)據(jù)中的停留點(diǎn)檢測(cè)出來(lái)。用戶的停留點(diǎn)并不局限一個(gè)點(diǎn),有些停留點(diǎn)彼此靠近,形成停留區(qū)域,停留區(qū)不僅可合并停留點(diǎn)數(shù)目,減少處理信息,還能提高位置語(yǔ)義理解精確度。許多停留區(qū)如家、工作單位具有很明顯的時(shí)空特征,很容易借助算法從停留區(qū)中識(shí)別出來(lái)。識(shí)別出的位置信息通常只是具體的地理位置信息,還需要結(jié)合地圖或?qū)Ш竭M(jìn)行具體位置語(yǔ)義解析和翻譯,通過(guò)語(yǔ)義信息分析可以獲取用戶的相關(guān)信息。在用戶行為分析中,還可以借助時(shí)空數(shù)據(jù)中的時(shí)間信息獲得用戶的活動(dòng)軌跡圖,利用日期信息獲得用戶獲得的頻率和周期信息,利用合適的數(shù)據(jù)挖掘方法獲得用戶的行為信息,從而構(gòu)建出用戶畫像。

3 關(guān)鍵步驟的處理與算法實(shí)現(xiàn)

3.1 數(shù)據(jù)預(yù)處理

數(shù)據(jù)預(yù)處理階段主要完成對(duì)數(shù)據(jù)進(jìn)行缺失值填補(bǔ)、噪點(diǎn)消除和分類提取。將缺失值以其他同類型的特定字符進(jìn)行替代。

預(yù)處理后的數(shù)據(jù)主要包括用戶編號(hào)、時(shí)間、經(jīng)度、維度等有價(jià)值信息。并將數(shù)據(jù)按照用戶和日期進(jìn)行劃分和提取,將同一用戶同一天的數(shù)據(jù)單獨(dú)提取和存儲(chǔ),以便于在停留點(diǎn)檢測(cè)時(shí)不會(huì)因?yàn)閿?shù)據(jù)的原因而無(wú)法達(dá)到預(yù)期效果。預(yù)處理后數(shù)據(jù)效果如圖2。

3.2停留點(diǎn)檢測(cè)算法

由于時(shí)空數(shù)據(jù)包含著該數(shù)據(jù)點(diǎn)采集的時(shí)間和數(shù)據(jù)點(diǎn)的經(jīng)緯度信息等,所以我們可以通過(guò)對(duì)數(shù)據(jù)點(diǎn)間的距離和時(shí)間差的限制來(lái)實(shí)現(xiàn)停留點(diǎn)的檢測(cè)和初步篩選?;痉椒ㄊ峭ㄟ^(guò)定義一段時(shí)間內(nèi)移動(dòng)距離不超過(guò)特定值的點(diǎn)即為停留點(diǎn)。

停留點(diǎn)算法思想,參數(shù)含義以及參數(shù)設(shè)置及影響。

輸入:預(yù)處理后的數(shù)據(jù)集,停留點(diǎn)時(shí)間限,停留點(diǎn)距離限

輸出:停留點(diǎn)集合 sp={s}

i=0,pointNumber=len(G),sp_ID = 0

猜你喜歡
行為分析
基于遠(yuǎn)程教育的用戶行為分析研究
基于K?均值與AGNES聚類算法的校園網(wǎng)行為分析系統(tǒng)研究
基于北斗衛(wèi)星導(dǎo)航的罪犯行為分析方法
手機(jī)上網(wǎng)用戶行為分析與研究
金融經(jīng)濟(jì)中的金融套利行為分析及若干研究
公開(kāi)課與常態(tài)課學(xué)生學(xué)習(xí)心理和行為的表現(xiàn)分析
政府俘獲行為過(guò)程分析及對(duì)抗策略
瓦房店市| 钦州市| 个旧市| 喀喇| 旅游| 富民县| 资源县| 抚松县| 易门县| 鹤峰县| 盱眙县| 常山县| 兴宁市| 武山县| 镇赉县| 永修县| 南阳市| 荥阳市| 兴国县| 上虞市| 星座| 红原县| 江北区| 黄冈市| 温州市| 红桥区| 隆安县| 浮梁县| 新巴尔虎左旗| 综艺| 马龙县| 桦南县| 八宿县| 萝北县| 本溪| 新巴尔虎左旗| 荃湾区| 佳木斯市| 黄石市| 松滋市| 郯城县|