羅嬌霞 彭文武 陳政 劉杰
摘? 要: 傳統(tǒng)基于方差分析方法的線上消費行為空間特征自動分析系統(tǒng)存在系統(tǒng)吞吐率低的問題,為此設計基于空間特征的線上消費行為空間特征自動分析系統(tǒng)。硬件選擇DSP處理核心和ARM處理核心組合成雙核處理模式,通過不同的接口實現(xiàn)消費者消費行為特征的采集與傳輸;軟件通過驅(qū)動代碼實現(xiàn)硬件與軟件的連接,計算消費者對于空間特征的所屬性和消費行為路徑的相似性,完成對線上消費行為空間特征的自動分析。測試結(jié)果表明,與傳統(tǒng)分析系統(tǒng)相比,設計的基于空間特征的線上消費行為空間特征自動分析系統(tǒng)的吞吐率是傳統(tǒng)分析系統(tǒng)的2倍,說明所設計的系統(tǒng)更適合應用在實際項目中。
關(guān)鍵詞: 空間特征自動分析; 線上消費行為; 系統(tǒng)設計; 雙核處理模式; 行為特征采集; 系統(tǒng)測試
中圖分類號: TN830.1?34; TP391? ? ? ? ? ? ? ? ?文獻標識碼: A? ? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2020)20?0034?03
Spatial feature based automatic analysis system of online consumption
behavior spatial feature
LUO Jiaoxia1, PENG Wenwu2, CHEN Zheng3, LIU Jie2
(1. Central South University of Forestry and Technology, Changsha 410004, China; 2. Hunan Institute of Technology, Hengyang 421002, China;
3. Hunan Institute of Traffic Engineering, Hengyang 421001, China)
Abstract: As the online consumption behavior spatial feature automatic analysis system based on the traditional variance analysis method has low throughput, a spatial feature based automatic analysis system of spatial feature of online consumption behavior is designed. In the hardware, the DSP processing core and ARM processing core are selected to form the dual?core processing mode, and the collection and transmission of consumer consumption behavior features are realized through different interfaces. In the software, the connection between hardware and software is realized by driving code, and the attribute of consumers′spatial feature and the similarity of consumption behavior path are calculated to complete the automatic analysis of the spatial feature of online consumption behavior. The testing results show that the throughput of the spatial feature based designed automatic analysis system of spatial feature of online consumption behavior is twice as high as that of the traditional analysis system, which explains that the designed system is more suitable for practical projects.
Keywords: spatial feature automatic analysis; online consumption behavior; system design; dual?core processing mode; behavior feature collection; system testing
0? 引? 言
隨著移動互聯(lián)技術(shù)的迅速發(fā)展,互聯(lián)網(wǎng)普及率增高,網(wǎng)民數(shù)量呈現(xiàn)逐年增長的趨勢,線上購物已經(jīng)成為人們生活中不可缺失的一部分[1?2]。線上消費具有巨大的潛力。分析線上消費行為,得到居民消費所關(guān)注的具體內(nèi)容。針對不同的消費人群組合成最優(yōu)組合,提高居民對線上消費的滿意度,對于沒有線上消費經(jīng)驗和線上消費較少的消費者具有指導意義[3]。
隨著線上消費者的增加,使用方差分析方法對常規(guī)線上消費行為分析已經(jīng)不能滿足當前需求。由于處理的數(shù)據(jù)量過于龐大,造成系統(tǒng)吞吐率較低[4?5]。為了解決這一問題,設計基于空間特征的線上消費空間特征自動分析系統(tǒng)。通過設計多目標跟蹤模塊,獲得消費者不同消費信息,利用空間特征剖析線上消費空間三元特征,避免冗余數(shù)據(jù)的干擾,解決常規(guī)系統(tǒng)中存在的問題。
1? 自動分析系統(tǒng)設計
1.1? 系統(tǒng)硬件設計
本文系統(tǒng)通過跟蹤技術(shù)獲取線上消費信息以及消費時的環(huán)境信息。為了滿足系統(tǒng)硬件功能,采用ARM處理器和DSP處理的雙核模式。其中ARM作為主控制器,控制硬件中串口通信、數(shù)據(jù)傳輸以及線程調(diào)度等功能。DSP控制器負責獨立處理計算量較大的分析算法,系統(tǒng)硬件框圖如圖1所示。
ARM處理器負責處理獲取的消費者消費行為信息及相關(guān)的數(shù)據(jù)處理,DSP處理器負責計算量比較大的跟蹤算法[6]。其中ARM處理器的任務多數(shù)都是計算量較小的任務,ARM處理器選擇ARM926EJ?S作為核心,工作主頻為297 MHz,滿足實際工作的需求[7]。DSP處理器選擇C64X+作為核心,工作頻率為594 MHz,在DSP核心中設置4個DACs和1個編碼器,減少DSP處理器的任務量[8]。
在核心處理器上設置2個輸出接口,其中ATA硬盤接口與上位機相連,存儲消費者的跟蹤數(shù)據(jù),通過以太網(wǎng)接口滿足上位機對消費者消費行為的跟蹤和相關(guān)數(shù)據(jù)的采集。
1.2? 系統(tǒng)軟件設計
通過void main定義軟件與硬件連接方法,利用NumCode設置不同的串口,不同串口的連接通過connect實現(xiàn),利用for循環(huán)語句循環(huán)串口,最后通過驅(qū)動完成軟件與硬件部分的連接[9?10]。
將獲取的空間數(shù)據(jù)按照內(nèi)在相似性分為若干個類別,使同一類別內(nèi)相似性較大,類別較小[11]。假設消費者線上消費空間到訪記錄為[uv]的矩陣[W],則:
[W=α11α12…α1vα21α22…α2v????αu1αu2…αuv] (1)
式中:[α]的取值為1或0;[αuv]表示消費者[u]是否訪問過單位空間[v]。采用聚類算法,更新空間內(nèi)的聚類中心,使每個空間特征樣本到其最近聚類中心的距離平方和最小[12]。計算閾值,衡量消費者對其自身空間特征的所屬性,即:
[k=xu-yumaxxu,yu] (2)
式中:[k]表示消費者[u]空間特征樣本的閾值;[xu]表示該樣本到統(tǒng)一類別內(nèi)的其他樣本的平均距離;[yu]表示樣本到不同類別樣本平均距離。正常情況下,[k]的取值范圍在[-1,1],值越大表示對自身空間特征類的所屬性越強。在同一空間內(nèi),只有路徑間相似性強,才能成為典型的消費行為空間特征[13]。測試消費者消費路徑相似性的指標計算如下:
[ruv=buv1+quv] (3)
式中:[ruv]表示相似性指標;[buv]表示消費行為路徑間相同節(jié)點數(shù)量占總節(jié)點數(shù)的比例;[quv]為空間特征距離。當消費行為路徑之間完全相同時,[ruv=1];當兩者完全不同時,[ruv=0]。
2? 系統(tǒng)性能測試
2.1? 系統(tǒng)測試環(huán)境及相關(guān)技術(shù)
測試操作系統(tǒng)在Windows 10的計算機中進行,采用Java語言和C++語言實現(xiàn)。軟件開發(fā)平臺為Eclipse。系統(tǒng)軟件調(diào)用的擴展庫主要有JMF,通過Java語言調(diào)用JMF類實現(xiàn)對線上消費行為數(shù)據(jù)的讀取。計算機內(nèi)存為8 GB,硬盤內(nèi)存為500 GB,CPU為i5?8600K。
2.2? 線上消費行為數(shù)據(jù)集準備
線上消費行為空間特征自動分析系統(tǒng)性能測試使用的數(shù)據(jù)集來自淘寶電子商務網(wǎng)站。因淘寶網(wǎng)站的產(chǎn)品數(shù)據(jù)品種較多,零售商較多,其中包含的數(shù)據(jù)量龐大,產(chǎn)品種類豐富,具有較強的代表性。數(shù)據(jù)集中包括消費者的線上消費行為數(shù)據(jù)以及消費產(chǎn)品各項屬性,將數(shù)據(jù)存儲在數(shù)據(jù)庫中,使用MySQL數(shù)據(jù)庫管理數(shù)據(jù),并通過相同的消費產(chǎn)品將用戶關(guān)聯(lián)起來,對數(shù)據(jù)表中的MEAN_ID屬性進行關(guān)聯(lián),并以MEAN_ID1,MEAN_ID2的格式保存在txt文檔中。通過txt2pajek工具,將txt文檔轉(zhuǎn)換為可視化工具Pajek軟件處理NET形式的文檔。數(shù)據(jù)中用戶關(guān)系網(wǎng)如圖2所示。
圖2中的點表示不同用戶的MEAN_ID。從圖中可以看出,線上消費用戶之間形成了一個龐大而復雜的網(wǎng)絡,在系統(tǒng)測試中默認該復雜網(wǎng)絡確實存在。
在此基礎上,將數(shù)據(jù)匯總為流量,設置成10組不同上行和下行流量,多次測試分析系統(tǒng)的性能。線上行為信息數(shù)據(jù)流量具體設置如表1所示。
使用以上準備的測試數(shù)據(jù),測試系統(tǒng)吞吐率,驗證系統(tǒng)的數(shù)據(jù)處理能力強弱。
2.3? 系統(tǒng)吞吐率結(jié)果及分析
在以上測試環(huán)境中,使用準備好的數(shù)據(jù)測試系統(tǒng)吞吐率。系統(tǒng)吞吐率是系統(tǒng)在單位時間內(nèi)滿負載的情況下,每秒處理數(shù)據(jù)流量的能力。
為了驗證設計的基于空間特征的線上消費行為空間特征自動分析系統(tǒng)的性能,通過與傳統(tǒng)方差分析方法的分析系統(tǒng)進行對比,在相同的測試環(huán)境下,針對同一數(shù)據(jù)集測試。為了比對方便,采用統(tǒng)計軟件統(tǒng)計結(jié)果。測試結(jié)果如圖3所示。
分析圖3可以看出,圖3a)中顯示在一定時間內(nèi),該系統(tǒng)下行流量數(shù)據(jù)的吞吐量在30~45 MB之間,上行流量數(shù)據(jù)在5~10 MB之間,經(jīng)過計算可知該系統(tǒng)的吞吐率為25.6 MB/s。圖3b)中系統(tǒng)下行流量數(shù)據(jù)的吞吐量在25~33 MB之間,上行流量數(shù)據(jù)的吞吐量在0~6 MB之間,經(jīng)過計算系統(tǒng)的吞吐率為12.7 MB/s。證明本文所設計系統(tǒng)的數(shù)據(jù)吞吐率更好,性能更優(yōu)越。
3? 結(jié)? 語
線上消費形式在現(xiàn)今社會消費背景下逐漸滲入人們的日常生活中,隨著線上消費的普及,線上消費空間也逐漸成為重要研究對象之一。本文設計基于空間特征的線上消費行為空間特征自動分析系統(tǒng),利用空間特征分析用戶線上消費行為,找尋其中的規(guī)律,制定使消費者更滿意的消費對策。經(jīng)過系統(tǒng)性能測試,證明了該系統(tǒng)各功能正常,并且有效地解決了常規(guī)的分析系統(tǒng)中存在的問題,具有一定的現(xiàn)實意義。
注:本文通訊作者為陳政。
參考文獻
[1] 韓增林,謝永順,劉天寶,等.大連市初中教育消費者的社會空間結(jié)構(gòu)研究[J].地理科學,2018,38(7):1129?1138.
[2] 郎月華,李仁杰,傅學慶.基于GPS軌跡柵格化的旅游行為空間模式分析[J].旅游學刊,2019,34(6):48?57.
[3] 劉金花,李向,鄭新奇.多尺度視角下資源環(huán)境承載力評價及其空間特征分析:以濟南市為例[J].地域研究與開發(fā),2019,38(4):115?121.
[4] 楊曉俊,朱凱凱,陳朋艷,等.城市電影院空間分布特征及演變:以西安市為例[J].經(jīng)濟地理,2018,38(6):85?93.
[5] 夏春萍,雷欣悅,王翠翠.我國農(nóng)村多維貧困的空間分布特征及影響因素分析:基于31省的多維貧困測度[J].中國農(nóng)業(yè)大學學報,2019,24(8):229?238.
[6] 裴廈,劉春蘭,謝高地.贛江上游山洪災害空間分布特征及生態(tài)影響因子分析[J].江西農(nóng)業(yè)大學學報,2018,40(2):413?422.
[7] 吳海霞,杜尚嘉,陳國德,等.鸚哥嶺自然保護區(qū)藥用植物資源種群空間分布特征分析[J].西南農(nóng)業(yè)學報,2019,32(5):981?986.
[8] 曹雪,舒季君,唐根年,等.浙江省創(chuàng)新空間分異特征分析與驅(qū)動機制研究[J].科技管理研究,2019,39(9):106?114.
[9] 廉曉梅,吳金華.東北地區(qū)人口與經(jīng)濟空間格局演變分析[J].人口學刊,2018,40(1):45?55.
[10] 王斌,陳琳,侯翔宇,等.透明計算中用戶訪問行為特征分析與預測[J].計算機工程與應用,2018,54(16):49?54.
[11] 王彥雲(yún),李樹剛,成連華.基于地鐵乘客個體特征的非適應性行為研究[J].火災科學,2019,28(2):79?84.
[12] 李東進,張宇東.量化自我的效應及其對消費者參與行為的影響機制[J].管理科學,2018,31(3):112?124.
[13] 李欠男,李谷成,尹朝靜,等.河北省縣域農(nóng)業(yè)綠色全要素生產(chǎn)率的空間特征[J].生態(tài)與農(nóng)村環(huán)境學報,2019,35(7):845?852.