安洋 李軍懷 王懷軍
摘? ?要:目前疫情防控依舊處于關(guān)鍵階段,如何有效做好高校復(fù)學(xué)復(fù)課和疫情防控工作成為國家和教育工作者重點(diǎn)關(guān)注的問題。隨著高校校園網(wǎng)絡(luò)基礎(chǔ)設(shè)施的持續(xù)升級(jí)完善,通過無線接入點(diǎn)(Access Point,AP)日志信息進(jìn)行學(xué)生位置及軌跡分析成為可能。文章提出了一種基于無線日志的校園區(qū)域人數(shù)統(tǒng)計(jì)與接觸追蹤方法,該方法通過對(duì)無線AP日志信息的采集與分析,實(shí)現(xiàn)對(duì)學(xué)生位置信息的無感知獲取,動(dòng)態(tài)可視化呈現(xiàn)高校日常教育教學(xué)中學(xué)生的位置分布、樓宇等區(qū)域的人流密度、學(xué)生在校的行為軌跡等,為高校復(fù)學(xué)后的疫情防控提供有效支持。
關(guān)鍵詞:疫情防控;無線日志;無感知定位;接觸追蹤
中圖分類號(hào):G434 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-8454(2021)01-0075-04
一、引言
隨著移動(dòng)網(wǎng)絡(luò)的迅速普及,以智能手機(jī)為代表的移動(dòng)設(shè)備在日常生活中隨處可見。通過對(duì)移動(dòng)智能設(shè)備相關(guān)的用戶行為數(shù)據(jù)進(jìn)行無感知采集和分析,能夠?yàn)橐咔榉揽刂袇^(qū)域人數(shù)統(tǒng)計(jì)與人員接觸追蹤提供幫助。隨著高校信息化水平的不斷提高,以及基礎(chǔ)網(wǎng)絡(luò)設(shè)施的持續(xù)升級(jí)和完善,校園無線網(wǎng)絡(luò)幾乎達(dá)到了教學(xué)區(qū)與生活區(qū)的全覆蓋,校園網(wǎng)絡(luò)逐漸成為高校學(xué)生生活中不可或缺的重要組成部分,與學(xué)生的學(xué)習(xí)、工作和生活緊密相連。鑒于校園網(wǎng)絡(luò)連接的便攜性、靈活性、無感知認(rèn)證等特性,加之網(wǎng)絡(luò)日志信息的快速增長,通過對(duì)如此海量的日志信息進(jìn)行挖掘、關(guān)聯(lián)分析,能夠發(fā)現(xiàn)大量有價(jià)值的用戶行為信息,為學(xué)生提供更多智能化的服務(wù)。
對(duì)于校園無線網(wǎng)絡(luò)而言,無處不在的WiFi設(shè)備,大量密集的AP設(shè)備部署于其中,移動(dòng)設(shè)備的每一次AP接入、上線、下線均會(huì)在網(wǎng)絡(luò)設(shè)備上有所記錄[1]。無線AP具有區(qū)域有效的特性,對(duì)于分布于該區(qū)域內(nèi)的移動(dòng)設(shè)備無線上網(wǎng)提供服務(wù),當(dāng)用戶從當(dāng)前區(qū)域移動(dòng)到另外一個(gè)區(qū)域時(shí),會(huì)發(fā)生AP切換,因而根據(jù)AP日志記錄結(jié)合AP位置分布可以實(shí)現(xiàn)用戶位置信息的獲取及移動(dòng)軌跡的查詢。同時(shí),兩個(gè)用戶在距離相近的區(qū)域持續(xù)一段時(shí)間,該區(qū)域的無線AP中會(huì)記錄該區(qū)域范圍內(nèi)的用戶設(shè)備MAC地址。
基于無線網(wǎng)絡(luò)接入的上述特點(diǎn),在疫情防控背景下,通過對(duì)校園無線上網(wǎng)日志進(jìn)行分析和挖掘,可以實(shí)現(xiàn)學(xué)生分布熱力圖、人流密度分析與預(yù)警、軌跡追蹤、特殊人群行為預(yù)警、建筑物樓層人數(shù)分析、校園區(qū)域?qū)崟r(shí)人數(shù)統(tǒng)計(jì)等應(yīng)用功能,為疫情防控背景下高校復(fù)學(xué)復(fù)課后,校園環(huán)境中的區(qū)域人數(shù)統(tǒng)計(jì)和特殊情況下的接觸追蹤提供服務(wù)。
二、相關(guān)研究
目前,針對(duì)人數(shù)統(tǒng)計(jì)的方法大致分為三種:基于計(jì)算機(jī)視覺的人數(shù)統(tǒng)計(jì)方法、基于可穿戴設(shè)備的人數(shù)統(tǒng)計(jì)方法和基于WiFi的人數(shù)統(tǒng)計(jì)方法?;谟?jì)算機(jī)視覺的人數(shù)統(tǒng)計(jì)方法采用攝像設(shè)備收集場(chǎng)景中的圖像或圖像序列,然后使用圖像或視頻處理相關(guān)技術(shù)實(shí)現(xiàn)目標(biāo)的人體檢測(cè)和人數(shù)識(shí)別。該方法由于在設(shè)備、方法、用戶隱私、光線條件等方面的局限性使得其難以在人數(shù)統(tǒng)計(jì)系統(tǒng)中廣泛應(yīng)用?;诳纱┐髟O(shè)備的人數(shù)統(tǒng)計(jì)方法通過監(jiān)測(cè)者佩戴內(nèi)置有傳感器的設(shè)備進(jìn)行人數(shù)識(shí)別與統(tǒng)計(jì),該方法需要被監(jiān)測(cè)對(duì)象必須佩戴特定設(shè)備才行,在舒適性與便攜性等方面存在一定的局限。與前兩種方法不同,基于WiFi的人數(shù)統(tǒng)計(jì)方法更能實(shí)現(xiàn)無感知的被動(dòng)識(shí)別,不受特定場(chǎng)景和時(shí)間的限制,低成本,實(shí)現(xiàn)簡(jiǎn)單,更適合推廣應(yīng)用。
在無感知人數(shù)統(tǒng)計(jì)方法的研究中,郭玉彬等人[2]針對(duì)某高校無線網(wǎng)絡(luò)日志數(shù)據(jù)進(jìn)行分析挖掘,首先對(duì)校園內(nèi)各建筑物的無線網(wǎng)絡(luò)連接人次進(jìn)行統(tǒng)計(jì),其次采用R-樹索引,結(jié)合密度聚類算法得到校園區(qū)域劃分,最后實(shí)現(xiàn)人群聚集點(diǎn)分布和區(qū)域之間人群移動(dòng)規(guī)律的獲取。該方法有效地解決了中心經(jīng)緯坐標(biāo)動(dòng)態(tài)變化的問題,可長期、持續(xù)對(duì)校園網(wǎng)日志數(shù)據(jù)進(jìn)行處理而不受校園網(wǎng)擴(kuò)建和AP不穩(wěn)定的影響,但識(shí)別粒度僅限于校園區(qū)域或樓宇,并未細(xì)分到具體樓層和教室,在室內(nèi)識(shí)別方面涉及較少。丁亞三等人[3]提出了一種基于WiFi-CSI的室內(nèi)人數(shù)識(shí)別方法WiCount,該方案通過信道狀態(tài)信息的幅值波動(dòng)來描述室內(nèi)人數(shù)的變化,并結(jié)合機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)對(duì)人的計(jì)數(shù)。該方法雖然在一定程度上提高了室內(nèi)人數(shù)識(shí)別方法的性能,但其識(shí)別人數(shù)僅能保持在4人以下,無法適用于較大規(guī)模的室內(nèi)人數(shù)識(shí)別,且需要經(jīng)歷線下的模型訓(xùn)練過程,無法保障識(shí)別的實(shí)時(shí)性。Manpreet等人[4]提出了一種基于WiFi日志信息的用戶購物意圖識(shí)別和位置預(yù)測(cè)方法,該方法將物理空間通過銷售物品類別進(jìn)行語義化標(biāo)識(shí),然后進(jìn)一步分析用戶行為和位置預(yù)測(cè)在網(wǎng)絡(luò)搜索內(nèi)容與物理空間上下文之間的相似度,以更好地發(fā)現(xiàn)有消費(fèi)意向的用戶。Traunmueller等人[5]通過WiFi探測(cè)器和位置數(shù)據(jù)對(duì)城市居民的移動(dòng)軌跡進(jìn)行分析。Ciftler等人[6]通過WiFi探測(cè)器接收到的連接請(qǐng)求對(duì)樓宇內(nèi)的居住率進(jìn)行統(tǒng)計(jì)。
與之前的研究相比,本文通過對(duì)校園廣泛部署的無線接入點(diǎn)日志信息進(jìn)行分析,能夠無感知實(shí)現(xiàn)校園區(qū)域室內(nèi)和室外的用戶定位與人數(shù)統(tǒng)計(jì),且統(tǒng)計(jì)粒度更為精細(xì),可具體到樓宇內(nèi)的樓層、辦公室、教室或宿舍,從而更易被廣泛應(yīng)用于校園的安全、管理、疫情防控等工作中。
三、基于無線日志的區(qū)域人數(shù)統(tǒng)計(jì)與接觸追蹤方法
基于無線日志的區(qū)域人數(shù)統(tǒng)計(jì)與接觸追蹤方法整體框架如圖1所示。首先對(duì)無線上網(wǎng)日志、用戶基本信息、用戶設(shè)備MAC地址與學(xué)工號(hào)對(duì)應(yīng)關(guān)系、無線AP與部署位置對(duì)應(yīng)關(guān)系等數(shù)據(jù)通過相關(guān)技術(shù)進(jìn)行采集;其次對(duì)無效數(shù)據(jù)、缺失數(shù)據(jù)、數(shù)據(jù)不一致等問題數(shù)據(jù)進(jìn)行剔除、補(bǔ)全與標(biāo)準(zhǔn)化等預(yù)處理操作;接著根據(jù)關(guān)鍵字信息進(jìn)行日志分類,針對(duì)每種類別的日志數(shù)據(jù)選擇合適的解析規(guī)則進(jìn)行關(guān)鍵信息提取,結(jié)合用戶基本信息等輔助數(shù)據(jù)進(jìn)行信息聚合分析,建立用戶定位模型;基于用戶定位模型,進(jìn)一步實(shí)現(xiàn)位置分布、人數(shù)統(tǒng)計(jì)、軌跡查詢和接觸追蹤等功能;最后結(jié)合可視化建模技術(shù)進(jìn)行應(yīng)用呈現(xiàn),實(shí)現(xiàn)區(qū)域人數(shù)統(tǒng)計(jì)與用戶軌跡查詢,并在特殊情況下快速完成接觸追蹤,為高校復(fù)學(xué)后的疫情防控工作提供技術(shù)支持。
1.基于無線AP的人員定位原理
在校園無線網(wǎng)絡(luò)覆蓋區(qū)域,用戶的移動(dòng)智能設(shè)備會(huì)通過發(fā)送周期性的探測(cè)請(qǐng)求來掃描并收集環(huán)境中可用的無線通信信道。每一個(gè)無線AP都由一個(gè)唯一MAC地址進(jìn)行標(biāo)識(shí),當(dāng)無線AP接收到移動(dòng)設(shè)備的探測(cè)請(qǐng)求后會(huì)予以回應(yīng),無論是否加密,是否已連接,甚至信號(hào)強(qiáng)度不足以顯示在設(shè)備的無線信號(hào)列表中,移動(dòng)設(shè)備都可以獲取到該AP廣播出來的MAC地址。接著,移動(dòng)智能終端選定確定連接的SSID并向其發(fā)送驗(yàn)證信息,無線AP對(duì)驗(yàn)證信息進(jìn)行響應(yīng)認(rèn)證。最后,移動(dòng)智能終端向該無線AP發(fā)送連接請(qǐng)求,無線AP響應(yīng)連接請(qǐng)求并將該設(shè)備接入互聯(lián)網(wǎng)[1]。如圖2所示。
在此過程中,根據(jù)IEEE對(duì)無線WiFi標(biāo)準(zhǔn)(即802.11協(xié)議)的定義可知,當(dāng)移動(dòng)智能設(shè)備在訪問互聯(lián)網(wǎng)時(shí),如果有多個(gè)AP具有相同的SSID,則移動(dòng)設(shè)備會(huì)選擇信號(hào)最強(qiáng)的AP進(jìn)行連接,即距離自己最近的無線AP。基于此,通過用戶上網(wǎng)所連接的無線AP部署位置信息便可以獲知用戶當(dāng)前所在位置,從而進(jìn)行區(qū)域人數(shù)統(tǒng)計(jì)與軌跡查詢。對(duì)無線日志進(jìn)行分析,獲取到用戶設(shè)備與無線AP的連接狀態(tài),結(jié)合無線AP在校園的物理部署位置以及用戶信息與MAC地址對(duì)應(yīng)關(guān)系表,即可實(shí)現(xiàn)用戶定位,最后通過可視化工具進(jìn)行顯示,直觀地描述個(gè)人在校園的行為軌跡。
2.區(qū)域人員定位與人數(shù)統(tǒng)計(jì)方法
基于無線日志信息進(jìn)行區(qū)域人員定位、人數(shù)統(tǒng)計(jì)、軌跡查詢及接觸追蹤等應(yīng)用分析時(shí),需要將無線接入日志與用戶信息、AP位置信息進(jìn)行關(guān)聯(lián),才能獲得有效的用戶及具體位置信息,其中的關(guān)聯(lián)關(guān)系如圖3所示。
為了實(shí)現(xiàn)本文的功能設(shè)計(jì),在此過程中需要三張輔助數(shù)據(jù)表進(jìn)行聯(lián)合分析,分別為用戶基本信息表、用戶設(shè)備MAC地址與學(xué)工號(hào)對(duì)應(yīng)關(guān)系表、無線AP與部署位置對(duì)應(yīng)關(guān)系表。數(shù)據(jù)采集階段主要對(duì)以上內(nèi)容進(jìn)行采集,針對(duì)不同的數(shù)據(jù)源,采集方式各不相同。
本文主要通過Flume技術(shù)、ETL技術(shù)和數(shù)據(jù)導(dǎo)入三種方式進(jìn)行原始數(shù)據(jù)采集。首先,基于Flume技術(shù)實(shí)現(xiàn)實(shí)時(shí)流日志數(shù)據(jù)采集,采用Kafka進(jìn)行實(shí)時(shí)流調(diào)度處理,通過實(shí)時(shí)流數(shù)據(jù)聚合技術(shù),結(jié)合Spark Stream完成實(shí)時(shí)流計(jì)算功能,實(shí)現(xiàn)對(duì)日志數(shù)據(jù)的實(shí)時(shí)計(jì)算與分析處理。通過ETL技術(shù)采集用戶基本信息、用戶設(shè)備MAC地址與學(xué)工號(hào)之間的關(guān)系對(duì)應(yīng)表。采用Excel導(dǎo)入形式獲取最新的無線AP位置分布信息。
將數(shù)據(jù)采集階段獲取的數(shù)據(jù)進(jìn)行清洗轉(zhuǎn)換,刪除無效數(shù)據(jù),制定日志解析規(guī)則。同時(shí),將采集到的數(shù)據(jù)信息規(guī)范化,保持格式統(tǒng)一。在無線AP日志數(shù)據(jù)中,每一行代表一條日志數(shù)據(jù),其中記錄著用戶移動(dòng)設(shè)備的MAC地址、IP地址、上下線時(shí)間、當(dāng)前連接無線AP的名稱和設(shè)備連接狀態(tài)等信息。從AP管理端AC(Access Controller,接入控制器)上獲取的日志數(shù)據(jù)包含AP配置、AP上下線、用戶連接等多種類別日志信息,因此,本文主要對(duì)涉及用戶位置獲取的五類日志進(jìn)行處理,如表1所示。
由于日志所屬的類別不同,因此每條日志數(shù)據(jù)的格式也并不固定。首先需要通過關(guān)鍵字進(jìn)行日志類別篩選,將對(duì)應(yīng)的日志信息劃分到正確的分組隊(duì)列,接著通過每個(gè)類別日志特定的正則表達(dá)式進(jìn)行日志解析,提取核心關(guān)鍵信息。
本文方法將校園劃分為若干個(gè)子區(qū)域,如操場(chǎng)、教學(xué)1號(hào)樓、1號(hào)餐廳等。對(duì)于某一特定子區(qū)域而言,可以通過對(duì)子區(qū)域范圍內(nèi)AP設(shè)備的移動(dòng)終端連接量進(jìn)行分析來實(shí)現(xiàn)人數(shù)統(tǒng)計(jì)。移動(dòng)終端以MAC地址作為唯一標(biāo)識(shí),因此某區(qū)域的人數(shù)計(jì)算如公式1所示:
S=∑f(MAC)(1)
其中,S表示當(dāng)前區(qū)域總?cè)藬?shù),f(MAC)表示區(qū)域內(nèi)移動(dòng)設(shè)備的MAC地址。
由于某一區(qū)域內(nèi)用戶可能會(huì)多次連接區(qū)域內(nèi)不同或相同的AP設(shè)備,因此在人數(shù)統(tǒng)計(jì)時(shí)需要進(jìn)行去重處理,保證統(tǒng)計(jì)過程中一個(gè)MAC地址只被計(jì)算一次。同時(shí),對(duì)于區(qū)域邊界范圍可能會(huì)出現(xiàn)的路過連接現(xiàn)象,即用戶處于該區(qū)域以外,但在某種情況下,短暫連接到該區(qū)域的AP設(shè)備,使得AP日志中會(huì)包含此部分噪音的MAC地址,因此在人數(shù)統(tǒng)計(jì)時(shí),通過設(shè)定連接持續(xù)時(shí)間(如10分鐘),排除此種噪音數(shù)據(jù)??紤]到以上兩點(diǎn),本文在人數(shù)統(tǒng)計(jì)過程中采用公式2進(jìn)行區(qū)域內(nèi)有效MAC地址計(jì)算:
f(MAC)=總MAC地址-重復(fù)MAC地址-噪音MAC地址(2)
學(xué)生在校行為軌跡特征主要由活動(dòng)時(shí)間和活動(dòng)空間兩部分構(gòu)成。本文基于上述日志處理結(jié)果,結(jié)合校園區(qū)域功能劃分,分析學(xué)生行為軌跡的時(shí)空特征。假設(shè)U={u1,u2,…,un}表示用戶集合,L={l1,l2,…,lm}表示校園區(qū)域集合,T={t1,t2,…,tk}表示時(shí)間集合,則某一用戶ui隨著時(shí)間推移的行為軌跡Pi如公式3所示:
Pi={(ui1,li1,ti1),(ui2,li2,ti2),(ui3,li3,ti3),……}(3)
本文采用窗口大小H對(duì)時(shí)間進(jìn)行窗口劃分,如半小時(shí)為一個(gè)時(shí)間窗口,則會(huì)得到固定時(shí)間間隔的用戶位置信息w=(l,t),一系列用戶位置信息組成的序列可以作為用戶軌跡特征來描述用戶行為軌跡移動(dòng),如公式4所示:
Pi={ui,w1,w2,w3,……}(4)
基于上述用戶行為軌跡描述,可以進(jìn)一步實(shí)現(xiàn)用戶軌跡查詢、接觸追蹤等具體應(yīng)用。
四、實(shí)驗(yàn)分析
本文的實(shí)驗(yàn)數(shù)據(jù)來自某高校無線網(wǎng)絡(luò)設(shè)備日志,校園無線AP總數(shù)為1480個(gè),實(shí)驗(yàn)部分采集了2020年4月份無線網(wǎng)絡(luò)日志數(shù)據(jù)作為樣本數(shù)據(jù)。原始樣本數(shù)據(jù)共3GB,經(jīng)過分析與處理后的有效數(shù)據(jù)為238366條。
基于本文提出的方法,設(shè)計(jì)開發(fā)了區(qū)域人數(shù)統(tǒng)計(jì)與接觸追蹤系統(tǒng),如圖4所示。該系統(tǒng)首先展示了校園區(qū)域的人數(shù)信息,通過下鉆可以獲取樓宇等區(qū)域內(nèi)部每層甚至每間教室的人數(shù)及人員列表信息;其次,通過設(shè)置起止時(shí)間,可以查詢某段時(shí)間內(nèi)用戶的校園活動(dòng)軌跡;最后,可以實(shí)現(xiàn)特殊情況下的接觸追蹤查詢,快速準(zhǔn)確地獲取親密接觸人員列表信息,無需再依賴用戶的記憶,以及繁瑣的方式來獲取接觸人員信息,從而有效精準(zhǔn)地記錄用戶的接觸行蹤。
五、結(jié)語
隨著無線傳感技術(shù)的快速發(fā)展,以非接觸式、被動(dòng)感知和便于部署等特點(diǎn)而廣泛受到關(guān)注的WiFi感知技術(shù)成為校園位置預(yù)測(cè)與人數(shù)統(tǒng)計(jì)領(lǐng)域的研究熱點(diǎn)。本文提出利用移動(dòng)智能設(shè)備結(jié)合無線上網(wǎng)日志信息進(jìn)行人員位置及軌跡追蹤,為有效抗擊疫情提供了信息化手段的支持。
參考文獻(xiàn):
[1]賴特.無線WiFi接入點(diǎn)欺騙及其檢測(cè)技術(shù)研究[J].信息與電腦(理論版),2020,32(3):154-156.
[2]郭玉彬,吳宇航,周哲帆等.基于密度聚類算法的校園人群聚集和移動(dòng)規(guī)律分析[J].計(jì)算機(jī)應(yīng)用研究,2020,37(3):688-692.
[3]丁亞三,郭斌,辛通等.WiCount:一種基于WiFi-CSI的人數(shù)識(shí)別方法[J].計(jì)算機(jī)科學(xué),2019,46(11):297-303.
[4]Manpreet Kaur, Flora D. Salim, Yongli Ren, Jeffrey Chan, Martin Tomko, and Mark Sanderson. Shopping intent recognition and location prediction from cyber-physical activities via wi-fi logs[C].Proceedings of the 5th Conference on Systems for Built Environments. New York, USA: Association for Computing Machinery,2018:130-139.
[5]Traunmueller M, Johnson N E, Malik A, et al. Digital footprints: Using WiFi probe and locational data to analyze human mobility trajectories in cities[J].Computers, Environment and Urban Systems,2018:4-12.
[6]Ciftler B S, Dikmese S, Guvenc I, et al. Occupancy Counting With Burst and Intermittent Signals in Smart Buildings[J].IEEE Internet of Things Journal, 2018,5(2):724-735.
(編輯:王曉明)