国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種基于網(wǎng)絡(luò)表示學(xué)習(xí)的生活模式挖掘方法

2020-12-28 11:53:14蔡鄭賈利娟孫揚(yáng)清
電腦知識(shí)與技術(shù) 2020年31期
關(guān)鍵詞:語(yǔ)義

蔡鄭 賈利娟 孫揚(yáng)清

摘要:近幾年,隨著移動(dòng)終端設(shè)備的普及以及移動(dòng)社交網(wǎng)絡(luò)的發(fā)展,大量的時(shí)空信息數(shù)據(jù)得以被采集并上傳到網(wǎng)絡(luò)云端,使得獲取時(shí)空信息變得相對(duì)簡(jiǎn)單。隨著相關(guān)數(shù)據(jù)的累積,越來(lái)越多的學(xué)者開(kāi)始投入到相關(guān)的研究之中。該文通過(guò)網(wǎng)絡(luò)表示學(xué)習(xí)的方法對(duì)時(shí)空信息進(jìn)行了預(yù)處理,再結(jié)合自然語(yǔ)言處理將用戶一定時(shí)間范圍內(nèi)的活動(dòng)通過(guò)主題向量來(lái)表示,然后通過(guò)聚類和頻繁模式發(fā)掘等方法發(fā)掘出用戶的生活模式。實(shí)驗(yàn)結(jié)果驗(yàn)證了本文方法的有效性。

關(guān)鍵詞: 時(shí)空信息;語(yǔ)義;網(wǎng)絡(luò)表示;主題向量;生活模式

中圖分類號(hào):TP393 ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1009-3044(2020)31-0081-05

Abstract: In recent years, with the popularization of mobile terminal devices and the growth of mobile social networks, a large amount of spatiotemporal information data can be collected and uploaded to the cloud. With the accumulation of relevant data,more and more scholars begin to devote themselves to relevant research. In this paper, the spatiotemporal information is preprocessed by the way of deep wandering, The idea of natural language processing is used to express the activities of users over a period of time as topic vectors, and then the experiment results of users' life patterns are discovered through clustering and frequent pattern mining to verify the effectiveness of the proposed method.

Key words:spatial-temporalinformation; semantic;deepwalk;topic word vector;frequent pattern

隨著互聯(lián)網(wǎng)技術(shù)、移動(dòng)通訊技術(shù)、衛(wèi)星定位技術(shù)的快速發(fā)展以及移動(dòng)終端的大量普及,越來(lái)越多的時(shí)空信息數(shù)據(jù)被采集并上傳到云端保存。比如,人們使用社交App進(jìn)行“打卡”時(shí),會(huì)上傳打卡的時(shí)間和位置;打車App會(huì)實(shí)時(shí)上報(bào)車輛的位置信息;移動(dòng)終端設(shè)備也會(huì)實(shí)時(shí)上報(bào)包含位置信息的信令數(shù)據(jù)[1-4]。我們把對(duì)象(移動(dòng)終端用戶、社交App用戶、打車App用戶)在一段時(shí)間內(nèi)經(jīng)過(guò)的所有位置信息收集起來(lái),就可以得到該對(duì)象在這段時(shí)間內(nèi)活動(dòng)的時(shí)空軌跡。

如何從對(duì)象的時(shí)空軌跡數(shù)據(jù)中挖掘出其生活模式是本文的研究重點(diǎn)。對(duì)象的生活模式通常是隱含在其時(shí)空軌跡中的,例如,對(duì)象會(huì)在每周三和周五的晚上去健身房打卡,在周末會(huì)去商場(chǎng)購(gòu)物等。也就是說(shuō),對(duì)象的生活模式是與時(shí)間密切相關(guān)的,不同的時(shí)間段對(duì)應(yīng)著不同的生活模式。一旦挖掘出對(duì)象的生活模式,就可以將其應(yīng)用到諸如公安破案[5,6]、熱門路徑推薦[7]、社會(huì)關(guān)系推薦[8]、動(dòng)物的遷移模式[9]研究等多個(gè)現(xiàn)實(shí)場(chǎng)景。因此,挖掘出對(duì)象的生活模式不僅極具挑戰(zhàn),也是一項(xiàng)具有重大意義的工作。

傳統(tǒng)的生活模式的挖掘大多是基于時(shí)間序列的頻繁模式[10-11]的挖掘,即使用最長(zhǎng)公共子序列(LCSS),動(dòng)態(tài)時(shí)間規(guī)劃(DTW)等算法從對(duì)象的歷史時(shí)空軌跡中挖掘出其生活模式。這些算法的特征是計(jì)算量大、對(duì)噪音和缺失數(shù)據(jù)敏感、要求序列數(shù)據(jù)之間必須是可比較或者計(jì)算距離的。但是,出于法律和對(duì)研究對(duì)象隱私保護(hù)等方面考慮,一些軌跡中的位置信息都是使用地點(diǎn)編號(hào)、興趣點(diǎn)編號(hào)或者基站號(hào)來(lái)表示,導(dǎo)致傳統(tǒng)算法無(wú)法直接應(yīng)用到這些軌跡數(shù)據(jù)上。另一方面,在計(jì)算軌跡點(diǎn)之間的距離時(shí),由于通達(dá)性的原因,地理位置上的距離有時(shí)候并不能反映真實(shí)的距離,會(huì)導(dǎo)致時(shí)空軌跡之間的相似度計(jì)算并不準(zhǔn)確。

針對(duì)以上問(wèn)題,本文基于網(wǎng)絡(luò)表示學(xué)習(xí)技術(shù)[11]提出了一種新的生活模式挖掘方法:通過(guò)結(jié)合自然語(yǔ)言處理的思想,將時(shí)空軌跡點(diǎn)之間的通達(dá)性看作其上下文語(yǔ)義信息,可以將軌跡點(diǎn)映射為連續(xù)向量空間中的低維稠密嵌入向量,將對(duì)象一段時(shí)間內(nèi)的活動(dòng)軌跡轉(zhuǎn)換為主題向量,最后利用傳統(tǒng)的頻繁模式發(fā)掘算法從海量時(shí)空軌跡中發(fā)掘出對(duì)象隱藏的生活模式。

本文的主要貢獻(xiàn)如下:

1)基于網(wǎng)絡(luò)表示學(xué)習(xí)和自然語(yǔ)言處理的思想,通過(guò)時(shí)空軌跡的上下文語(yǔ)義來(lái)表達(dá)位置信息,將稀疏不連續(xù)的位置編號(hào)映射為低維的嵌入向量來(lái)表示,解決了這些位置信息無(wú)法直接比較和計(jì)算距離的問(wèn)題。

2)將對(duì)象一段時(shí)間內(nèi)的時(shí)空軌跡轉(zhuǎn)換為對(duì)應(yīng)的主題向量后,減少了通過(guò)頻繁模式挖掘生活模式時(shí)的計(jì)算量。

3)在出租車數(shù)據(jù)上進(jìn)行了深入的實(shí)驗(yàn)研究,實(shí)驗(yàn)結(jié)果表明本文提出的方法能夠有效地發(fā)掘出人們的生活模式。

1相關(guān)工作

近些年來(lái),隨著移動(dòng)定位技術(shù)的發(fā)展,各種各樣的軌跡數(shù)據(jù)被采集出來(lái),比如手機(jī)的信令數(shù)據(jù)、出租車的軌跡數(shù)據(jù)、社交網(wǎng)絡(luò)的簽到信息、交通卡口過(guò)車信息等。這些數(shù)據(jù)在出行預(yù)測(cè)、智慧城市、公安破案等領(lǐng)域都得到了廣泛的應(yīng)用。

傳統(tǒng)的生活模式發(fā)掘多采用隱馬爾可夫模型,頻繁模式[14-16]等方法。這些方法通常需要提取時(shí)空軌跡中的停留點(diǎn),再使用停留點(diǎn)來(lái)代表用戶的歷史軌跡模型。停留點(diǎn)[17]指的是對(duì)象在某個(gè)地方停留了一段時(shí)間,比如商場(chǎng)、酒店、休息或者工作的地點(diǎn),通過(guò)停留點(diǎn)可以將用戶的歷史軌跡表達(dá)為一個(gè)停留點(diǎn)序列,如:[s 1?t1s 2?t2s 3?t3…?tn-1s n],其中s表示停留點(diǎn)的中心坐標(biāo),[?t]表示停留的時(shí)長(zhǎng),[?t]的閥值通常需要手動(dòng)指定。有了用戶歷史軌跡的模型,就可以使用FP-growth、Apriori等算法挖掘出其中的頻繁項(xiàng)集,或者通過(guò)對(duì)這些頻繁模式進(jìn)行組合和連接,發(fā)現(xiàn)一些表征了用戶生活、行為規(guī)律的順序模式[18]。但是這種基于停留點(diǎn)的學(xué)習(xí)方式存在以下幾個(gè)方面的問(wèn)題:

1)對(duì)數(shù)據(jù)質(zhì)量要求高,噪聲和缺失數(shù)據(jù)都會(huì)影響停留點(diǎn)的檢測(cè),降低模型的準(zhǔn)確率。例如,出于省電的目的,有些定位設(shè)備在或者電量不足時(shí)會(huì)主動(dòng)降低采樣頻率,導(dǎo)致采樣到的數(shù)據(jù)稀少,無(wú)法判出停留點(diǎn);城市地形由于高樓大廈的遮擋存在定位不準(zhǔn)確以及坐標(biāo)漂移等現(xiàn)象,這些情況都會(huì)極大地影響挖掘結(jié)果的準(zhǔn)確性。

2)計(jì)算量大,對(duì)于使用經(jīng)緯度來(lái)表示位置信息的軌跡數(shù)據(jù)來(lái)說(shuō),通過(guò)使用haversine公式[19]來(lái)計(jì)算停留點(diǎn)之間的距離時(shí)突出問(wèn)題是計(jì)算量大。為了減輕計(jì)算量,目前通用的做法是將經(jīng)緯度映射為geohash[23]編碼,當(dāng)geohash編碼相同時(shí)可以認(rèn)為位置是接近的。但是這種做法又會(huì)引入邊界問(wèn)題,即存在geohash編碼不同但是位置卻接近的情況,如圖1所示。

3)軌跡數(shù)據(jù)是離散的,出于隱私保護(hù)和法律方面的原因,一些時(shí)空軌跡數(shù)據(jù)使用編號(hào)來(lái)表示位置,例如社交網(wǎng)絡(luò)簽到數(shù)據(jù)通常使用興趣點(diǎn)的編號(hào)來(lái)表示坐標(biāo),手機(jī)信令數(shù)據(jù)采用基站號(hào)來(lái)表示位置等。這些離散的軌跡數(shù)據(jù)無(wú)法直接應(yīng)用到傳統(tǒng)的挖掘算法中。

針對(duì)這些問(wèn)題,近些年人們開(kāi)始利用網(wǎng)絡(luò)表示學(xué)習(xí)[12,20-22]的方法將時(shí)空軌跡數(shù)據(jù)中用戶訪問(wèn)過(guò)的頂點(diǎn)映射到致密的嵌入向量中。有人通過(guò)統(tǒng)計(jì)觀察發(fā)現(xiàn),如果對(duì)時(shí)空軌跡中的這些頂點(diǎn)進(jìn)行隨機(jī)游走,頂點(diǎn)出現(xiàn)次數(shù)的冥律分布與自然語(yǔ)言處理中單詞出現(xiàn)次數(shù)的冥律分布一致且遵循zipfs定律[12],這意味著自然語(yǔ)言處理中常用的詞向量模型也可以應(yīng)用在網(wǎng)絡(luò)表示學(xué)習(xí)中。

網(wǎng)絡(luò)表示學(xué)習(xí)首先利用軌跡點(diǎn)之間的通達(dá)性來(lái)進(jìn)行隨機(jī)游走(DeepWalk),生成各個(gè)軌跡點(diǎn)的上下文信息,再利用軌跡點(diǎn)的上下文信息通過(guò)表示學(xué)習(xí)來(lái)獲取軌跡點(diǎn)的低維嵌入向量。一方面,隨機(jī)游走能夠通過(guò)降低異常數(shù)據(jù)點(diǎn)的出現(xiàn)次數(shù)來(lái)降低其影響;另一方面,這些低維的嵌入向量能夠反映原先時(shí)空軌跡數(shù)據(jù)的某些特性,如果兩個(gè)軌跡點(diǎn)可以通達(dá),那么這兩個(gè)點(diǎn)的嵌入向量是類似的,位置更接近的軌跡點(diǎn)之間的向量也是更相似的;嵌入向量使得計(jì)算離散的軌跡點(diǎn)之間的距離變成可能,可以將一些常用的聚類算法應(yīng)用到軌跡點(diǎn)的嵌入向量上。所以本文也采用網(wǎng)絡(luò)表示學(xué)習(xí)的方法,將時(shí)空軌跡數(shù)據(jù)轉(zhuǎn)換為嵌入向量,再基于嵌入向量進(jìn)行生活模式的發(fā)掘。

2基于網(wǎng)絡(luò)表示學(xué)習(xí)的生活模式挖掘方法

2.1定義

模型中用到的相關(guān)符號(hào)以及對(duì)應(yīng)解釋如表1所示。

定義1:時(shí)空軌跡

對(duì)于指定用戶[u]的時(shí)空軌跡[T(u)={vi,ti|0≤i≤n, ?vi∈V}],對(duì)于任意 [i

定義2:連通圖

給定連通圖[G=(V, ?E)],[E]表示軌跡點(diǎn)之間連通性,[V]是軌跡點(diǎn)的集合。[v∈V]代表連通圖的各個(gè)頂點(diǎn),[e∈E]代表連通圖的各條邊。

定義3:軌跡點(diǎn)的嵌入向量

定義4:活動(dòng)主題

用戶[u]在時(shí)間區(qū)間[?t]內(nèi)的時(shí)空軌跡可以表示[v1,t1,x1,v2,t2,x2,vn,tn,xntn=t1+?t , t1

定義5:生活模式

對(duì)于一個(gè)用戶[u],其生活模式是一系列三元組的集合[Lu= t1, ?t1+?t1, ?p1, ?t2, ?t2+?t2, ?p2, ……, tn, ?tn+?tn, ?pn]。其中[t, ?t+?t]分別表示生活模式的開(kāi)始和結(jié)束時(shí)間,[p表示這段時(shí)間內(nèi)的活動(dòng)主題,]例如每晚的18:00-20:00去公園散步,每天的8:00-9:00騎自行車上班等。

2.2生活模式挖掘方法

挖掘方法的結(jié)構(gòu)如圖2所示,由三個(gè)模塊組成:生成圖,網(wǎng)絡(luò)表示學(xué)習(xí)、生活模式發(fā)現(xiàn)。

1)生成圖

生成圖的主要目的為了構(gòu)建連通圖[G],通過(guò)遍歷所有對(duì)象的軌跡的集合[T],將軌跡點(diǎn)作為頂點(diǎn),將軌跡點(diǎn)之間的連通性作為邊添加到連通圖中,其主要步驟如下:

2)網(wǎng)絡(luò)表示學(xué)習(xí)

網(wǎng)絡(luò)表示學(xué)習(xí)以連通圖G作為輸入,通過(guò)深度游走(DeepWalk)[12]和skipgram[17]算法得到各個(gè)軌跡點(diǎn)的嵌入向量。以社交網(wǎng)絡(luò)簽到信息為例,就是將網(wǎng)絡(luò)中的各個(gè)軌跡點(diǎn)用一個(gè)低維的嵌入向量表示,這些向量能反映出原先網(wǎng)絡(luò)的某些特性,如果在原網(wǎng)絡(luò)中兩個(gè)點(diǎn)的結(jié)構(gòu)類似,那么這兩個(gè)點(diǎn)表示成的嵌入向量也應(yīng)該類似,其效果見(jiàn)圖4和圖5。

基于深度游走(DeepWalk)的網(wǎng)絡(luò)表示學(xué)習(xí)的具體步驟如下:

3)生活模式發(fā)現(xiàn)

在得到各個(gè)軌跡點(diǎn)的嵌入向量后,就可以通過(guò)計(jì)算對(duì)象在一段時(shí)間內(nèi)的活動(dòng)軌跡的嵌入向量平均值來(lái)得到對(duì)象的活動(dòng)主題,當(dāng)發(fā)現(xiàn)對(duì)象每天同一時(shí)間段的活動(dòng)主題的相似度超過(guò)支持度時(shí),就可以認(rèn)為對(duì)象存在固定的生活模式,具體的算法如下:

3算法驗(yàn)證

3.1數(shù)據(jù)說(shuō)明

為了方便進(jìn)行驗(yàn)證,使用微軟研發(fā)中心公布的出租車數(shù)據(jù)[29],其包含了8900輛出租車1周的時(shí)空軌跡數(shù)據(jù),每條數(shù)據(jù)包含了用戶編號(hào)、采樣時(shí)間、經(jīng)度和緯度等屬性。其數(shù)據(jù)格式如下表所示:

3.2參數(shù)的設(shè)置和說(shuō)明

本次實(shí)驗(yàn)主要需要設(shè)置兩個(gè)參數(shù):嵌入向量的長(zhǎng)度d和發(fā)現(xiàn)生活模式的支持度[θ]。根據(jù)業(yè)界經(jīng)驗(yàn)[12],將d設(shè)置為300,將[θ]設(shè)置為0.8。d設(shè)置過(guò)大會(huì)導(dǎo)致網(wǎng)絡(luò)表示學(xué)習(xí)耗費(fèi)大量的訓(xùn)練時(shí)間,設(shè)置過(guò)小會(huì)導(dǎo)致實(shí)驗(yàn)精度降低。

3.3實(shí)驗(yàn)結(jié)果與分析

網(wǎng)絡(luò)表示學(xué)習(xí)利用了所有出租車駕駛員的軌跡數(shù)據(jù)。本實(shí)驗(yàn)的第一步,就需要檢驗(yàn)其學(xué)習(xí)效果。隨機(jī)選取幾名駕駛員,將其活動(dòng)軌跡一方面以熱力圖的形式進(jìn)行展示,另一方面使用HDBSCAN算法[30]將所有軌跡點(diǎn)的嵌入向量進(jìn)行聚類,通過(guò)比較聚類結(jié)果與熱力圖中的熱點(diǎn)區(qū)域是否一致來(lái)確認(rèn)其學(xué)習(xí)的準(zhǔn)確性。限于篇幅本文只展示了一位駕駛員的效果。

從左側(cè)的熱力圖可以看出,駕駛員的主要在7個(gè)地區(qū)活動(dòng)(限于篇幅本文只展示了其中的4個(gè))。同時(shí),右圖中駕駛員的所有嵌入向量也被聚類成7類(用不同的顏色標(biāo)示)。對(duì)比左右兩圖可以發(fā)現(xiàn),學(xué)習(xí)的結(jié)果與實(shí)際相符。這說(shuō)明即使用戶的軌跡數(shù)據(jù)中不包含地理位置信息時(shí),也可以利用軌跡點(diǎn)之間的通達(dá)性和網(wǎng)絡(luò)表示學(xué)習(xí)得到軌跡點(diǎn)的嵌入向量,并根據(jù)這些致密連續(xù)的嵌入向量來(lái)進(jìn)行聚類等操作。

得到嵌入向量后,就可以發(fā)掘每個(gè)駕駛員的生活模式,通過(guò)調(diào)整時(shí)間窗口,發(fā)現(xiàn)該駕駛員存在以下明顯的生活模式:

結(jié)合原始數(shù)據(jù)進(jìn)行分析,可以發(fā)現(xiàn)駕駛員每天9:00~14:00以及15:00~24:00在東城區(qū)(地點(diǎn)7)和西城區(qū)(地點(diǎn)6)工作,中午14:00~15:00會(huì)在豐臺(tái)區(qū)(地點(diǎn)5)休息,每天凌晨會(huì)返回房山區(qū)(地點(diǎn)1)休息至次日的9點(diǎn),如圖所示。

可以看到,挖掘結(jié)果(表3)與原始數(shù)據(jù)的分析結(jié)果(圖10和圖11)基本上是相符的,挖掘出來(lái)的生活模式符合常理。

4結(jié)論

基于對(duì)大量軌跡數(shù)據(jù)的觀察和研究,本文提出一種充分利用海量時(shí)空軌跡數(shù)據(jù),利用表示學(xué)習(xí)來(lái)發(fā)掘生活模式的方法。該方法的可以廣泛地應(yīng)用到多個(gè)領(lǐng)域,例如好友推薦,犯罪團(tuán)隊(duì)發(fā)現(xiàn),交通路網(wǎng)優(yōu)化等多個(gè)方面。為了驗(yàn)證本方法的有效性,本文利用出租車數(shù)據(jù)集進(jìn)行了深入的實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明該挖掘方法是有效的。一方面,僅需要使用較少的超參數(shù)就能夠達(dá)到實(shí)驗(yàn)?zāi)康模硪环矫?,還能夠充分利用沒(méi)有地理位置信息的時(shí)空軌跡數(shù)據(jù)。

在未來(lái)的工作中,我們計(jì)劃繼續(xù)優(yōu)化算法,以應(yīng)對(duì)現(xiàn)實(shí)中海量的軌跡數(shù)據(jù)。同時(shí),還需要考慮到軌跡數(shù)據(jù)中時(shí)序問(wèn)題,這是本文所忽略的。通過(guò)本文提出來(lái)的方法,對(duì)象的生活模式可以用定長(zhǎng)的嵌入向量表示,這為人群的聚類提供了幫助,通過(guò)生活模式對(duì)應(yīng)的主題向量進(jìn)行特定用戶群組挖掘,提供更精確的人物畫(huà)像,親密度分析以及好友推薦是下一步的研究方向。

參考文獻(xiàn):

[1] 錢琨.基于蜂窩信令數(shù)據(jù)的移動(dòng)軌跡清洗和預(yù)測(cè)方法研究與實(shí)現(xiàn)[D].成都:西南交通大學(xué),2016.

[2] 陳曉鵬.基于手機(jī)時(shí)空軌跡數(shù)據(jù)的用戶移動(dòng)模式分析與研究[D].長(zhǎng)沙:國(guó)防科學(xué)技術(shù)大學(xué),2016.

[3] 凌峰.基于手機(jī)位置數(shù)據(jù)的用戶移動(dòng)模式挖掘與分析[D].北京:北京郵電大學(xué),2017.

[4] 崔鄧.基于智能手機(jī)軌跡提取停留點(diǎn)的時(shí)空聚類算法研究[D].重慶:西南大學(xué),2016.

[5] 韓勇.基于大數(shù)據(jù)技術(shù)的公安移動(dòng)通信數(shù)據(jù)處理平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)[J].工程技術(shù)(文摘版),2017(24): 318.

[6] 王仲妮,靳濤.時(shí)空軌跡數(shù)據(jù)挖掘在公安經(jīng)濟(jì)群體事件管理中的應(yīng)用[J].現(xiàn)代信息科技,2019(1):78-80.

[7] 栗雨然.基于時(shí)空聚類的興趣點(diǎn)推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].成都:電子科技大學(xué),2019.

[8] 劉樹(shù)棟.基于位置的移動(dòng)社會(huì)化網(wǎng)絡(luò)推薦技術(shù)研究[D].北京:北京郵電大學(xué),2015.

[9] 王玉偉.候鳥(niǎo)遷徙移動(dòng)模式挖掘研究[D].北京:中國(guó)科學(xué)院,2015.

[10] 陳東.規(guī)律性移動(dòng)對(duì)象的時(shí)空軌跡挖掘及應(yīng)用研究[D].濟(jì)南:山東師范大學(xué),2017.

[11] 萬(wàn)項(xiàng)超.基于周期行為的個(gè)人生活模式挖掘研究[D].哈爾濱:哈爾濱工程大學(xué),2012.

[12]PerozziB,Al-RfouR,SkienaS.Deepwalk: Online Learning of Social Representations[C]//Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, New York, 2014:701-710.

[13] 張健欽,仇培元,杜明義.基于時(shí)空軌跡數(shù)據(jù)的出行特征挖掘方法[J].交通運(yùn)輸系統(tǒng)工程與信息,2014,14(6):72-78.

[14] Chen M,LiuY,Yu X H.NLPMM:a next location predictor with Markov modeling[J].Advances in Knowledge Discovery and Data Mining,2014: 186–197.

[15] Chen M,LiuY,Yu X H.Predicting next locations with object clustering and trajectory clustering[J].Advances in Knowledge Discovery and Data Mining,2015: 344–356.

[16] Chen M,Yu X H,LiuY.Mining moving patterns for predicting next location[J].Information Systems,2015,54:156-168.

[17] 李毓瑞,陳紅梅,王麗珍,等.基于密度的停留點(diǎn)識(shí)別方法[J].大數(shù)據(jù),2018,4(5):80-93.

[18] 陳?ài)?,劉洋,王月,?基于時(shí)序特征的移動(dòng)模式挖掘[J].中國(guó)科學(xué):信息科學(xué),2016,46(9):1288-1297.

[19] Hartanto S, Furqan M, Siahaan A P U, et al. Haversine Method in Looking for the Nearest Masjid[J]. International Journal of Engineering Research, 2017,3(8):187-195.

[20] Crivellari A, Beinat E. From Motion Activity to Geo-Embeddings: Generating and Exploring Vector Representations of Locations, Traces and Visitors through Large-Scale Mobility Data[J].International Journal of Geo-Information, 2019,8(3).

[21] Xu Q , Chen H , Zhi H , et al. Algorithm research for user trajectory matching across social media networks based on paragraph2vec[C]. International Conference on Advances in Materials. 2018.

[22] Liu J , Li H , Gao Y , et al. A geohash-based index for spatial data management in distributed memory[C]//2014 22nd International Conference on Geoinformatics. IEEE, 2014.

[23] 陳雪蓮.基于時(shí)空數(shù)據(jù)的用戶移動(dòng)行為模式研究[J].無(wú)線互聯(lián)科技, 2019,16(7):167-168.

[24] Xiucheng Li, Kaiqi Zhao, Gao Cong, et al. Deep Representation Learning for Trajectory Similarity Computation[C]// 2018 IEEE 34th International Conference on Data Engineering (ICDE). IEEE, 2018.

[25] Karli S , YücelSaygin. Mining periodic patterns in spatio-temporal sequences at different time granularities[J]. Intelligent Data Analysis, 2013, 13(2):301-335.

[26] 熊偉,吳釗,李兵,等.一種基于語(yǔ)義的時(shí)空敏感社會(huì)關(guān)系模型[J].小型微型計(jì)算機(jī)系統(tǒng), 2016(6):1207-1211.

[27] Yang J, Eickhoff C. Unsupervised Spatio-Temporal Embeddings for User and Location Modelling[J]. arXiv: Information Retrieval, 2017.

[28] 鄭林江,趙欣,蔣朝輝,等.基于出租車軌跡數(shù)據(jù)的城市熱點(diǎn)出行區(qū)域挖掘[J].計(jì)算機(jī)應(yīng)用與軟件, 2018(1):1-8.

[29] Zheng Y, Yuan J, Xie W, et al. Drive Smartly as a Taxi Driver[C]// Symposia & Workshops on Ubiquitous. IEEE, 2010.

[30] Mcinnes L, Healy J ,Astels S. hdbscan: Hierarchical density based clustering[J].The Journal of Open Source Software, 2017,2(11).

【通聯(lián)編輯:代影】

猜你喜歡
語(yǔ)義
為什么字看久了就不認(rèn)識(shí)了
語(yǔ)言與語(yǔ)義
“社會(huì)”一詞的語(yǔ)義流動(dòng)與新陳代謝
“上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
“吃+NP”的語(yǔ)義生成機(jī)制研究
“V+了+NP1+NP2”中V的語(yǔ)義指向簡(jiǎn)談
認(rèn)知范疇模糊與語(yǔ)義模糊
“V+X+算+X”構(gòu)式的語(yǔ)義功能及語(yǔ)義網(wǎng)絡(luò)——兼及與“V+X+是+X”構(gòu)式的轉(zhuǎn)換
“熊孩子”語(yǔ)義新探
“深+N季”組配的認(rèn)知語(yǔ)義分析
珲春市| 容城县| 永泰县| 巴东县| 包头市| 克拉玛依市| 安徽省| 迁安市| 蓬溪县| 宜阳县| 江华| 信阳市| 龙门县| 东乌| 德令哈市| 桦甸市| 吉林市| 宁晋县| 棋牌| 格尔木市| 车致| 土默特右旗| 修文县| 县级市| 南华县| 湖北省| 突泉县| 黎平县| 南昌县| 凤冈县| 长宁区| 开平市| 溧阳市| 大新县| 扎鲁特旗| 永福县| 崇文区| 尤溪县| 东海县| 微博| 萨嘎县|