張四海 李珊珊
[摘要]以南開大學(xué)校園一卡通交易流水?dāng)?shù)據(jù)為研究對象,通過對原始數(shù)據(jù)的清洗、整合與統(tǒng)計分析,實現(xiàn)數(shù)據(jù)可視化,滿足學(xué)校直觀管理的需要。從一卡通原始數(shù)據(jù)庫中提取3 719? 570條歷史交易數(shù)據(jù),數(shù)據(jù)清洗、分類、一致性檢驗和統(tǒng)計分析采用Matlab、SPSS和Origin。首先,對南開大學(xué)一卡通總體消費(fèi)狀況進(jìn)行分析;然后,通過對時間離散化處理,對師生在食堂的就餐規(guī)律進(jìn)行分析。深入研究一卡通流水?dāng)?shù)據(jù),有助于全面掌握師生的行為規(guī)律,為學(xué)校優(yōu)化資源配置和科學(xué)決策提供數(shù)據(jù)依據(jù)。
[關(guān)鍵詞]一卡通;交易流水;數(shù)據(jù)挖掘;消費(fèi)行為分析
[中圖分類號]TP 31113[文獻(xiàn)標(biāo)志碼]A[文章編號]10050310(2019)0100
6405
Consuming Behavior Data Analysis and Research Based on
Campus ECard System
——Taking Nankai University as an Example
Zhang Sihai, Li Shanshan
(Office of Informatization Construction and Management, Nankai University, Tianjin 300071,China)
Abstract: In this paper, the consuming transaction data in Ecard system is studied. Data visualization is realized by cleaning, integration and statistical analysis of the original data. Visualized managerial demand for university is satisfied by this way. 3 719 570 of historical transaction data were extracted from Ecard original database. First, the basic consuming condition for Nankai University Ecard system was analyzed. Then the dining pattern of faculty and students was studied by using the method of time discretization. The deep research for the Ecard transaction data can help us to understand the behavior pattern of faculty and students. And it is also significant to optimize allocation of resources and for the related administrative departments to make scientific decisions.
Keywords: Ecard; Consuming transaction data; Data mining; Consuming behavior analysis
0引言
圖1一卡通交易流水?dāng)?shù)據(jù)分類
Fig.1Classification for Ecard consuming transaction data
作為校園生活數(shù)字化、智慧化的載體,一卡通系統(tǒng)扮演著極其重要的角色[19]。校園一卡通系統(tǒng)是信息技術(shù)與通信技術(shù)的完美結(jié)合,是ICT技術(shù)在校園場景中的成功應(yīng)用。一卡通不僅極大地方便了廣大師生的學(xué)習(xí)和生活,而且也有效提升了學(xué)校的管理水平[1011]。隨著時間的推移,校園一卡通系統(tǒng)累積了大量的消費(fèi)和行為數(shù)據(jù),一卡通數(shù)據(jù)具有數(shù)據(jù)量大、交易流水詳盡、真實可靠的特點(diǎn)。基于數(shù)據(jù)挖掘理論,從大量繁雜、無序的原始數(shù)據(jù)中提取有價值的信息,通過分析和建模來實現(xiàn)知識發(fā)現(xiàn),將有助于學(xué)校全面掌握師生的行為規(guī)律,對學(xué)校優(yōu)化資源配置和科學(xué)決策具有重要意義[1215]。
本文以南開大學(xué)校園一卡通交易流水?dāng)?shù)據(jù)為研究對象,通過對原始數(shù)據(jù)的清洗、整合、分類與統(tǒng)計分析,實現(xiàn)數(shù)據(jù)的可視化,滿足學(xué)校的直觀管理需要。首先,對一卡通原始數(shù)據(jù)進(jìn)行系統(tǒng)地分類;對校園卡兩種不同充值方式的占比、消費(fèi)類型占比,以及不同身份群體在食堂消費(fèi)的占比和金額進(jìn)行了統(tǒng)計分析。其次,對南開大學(xué)校區(qū)搬遷前的食堂歷史消費(fèi)數(shù)據(jù)進(jìn)行詳細(xì)分析,得出交易次數(shù)隨日期變化的就餐規(guī)律曲線。最后,對食堂每天的營業(yè)時間進(jìn)行離散化,得出工作日和節(jié)假日每天不同時段的就餐規(guī)律。根據(jù)上述分析結(jié)果,對學(xué)校膳食中心資源優(yōu)化配置提出建議。
1校園一卡通交易流水?dāng)?shù)據(jù)的分類
南開大學(xué)一卡通系統(tǒng)始建于2007年,是一個基于C/S架構(gòu)的多應(yīng)用集成系統(tǒng)。目前,它能夠為全校師生提供食堂餐飲、超市、洗浴、圖書借閱、門禁、學(xué)籍注冊、自助文印及體測等多種服務(wù)。經(jīng)過10余年的發(fā)展和不斷完善,南開大學(xué)一卡通系統(tǒng)已形成了以專用網(wǎng)絡(luò)為基礎(chǔ),以一卡通平臺為核心,具有較高安全性、健壯性和擴(kuò)展性的應(yīng)用系統(tǒng)。
經(jīng)過多年的建設(shè)和運(yùn)營,一卡通系統(tǒng)中沉淀了大量的交易流水?dāng)?shù)據(jù)。原始數(shù)據(jù)雜亂無章,各種交易流水?dāng)?shù)據(jù)和行為數(shù)據(jù)無規(guī)律地混雜在一起。因此,首先我們需要對原始數(shù)據(jù)進(jìn)行清洗、整合與分類。如圖1所示,一卡通原始數(shù)據(jù)包括交易類數(shù)據(jù)和其他行為類數(shù)據(jù)兩大類,其中交易類數(shù)據(jù)主要包括食堂、超市、洗浴、圖書超期、網(wǎng)費(fèi)、自助文印等消費(fèi)數(shù)據(jù),其他行為數(shù)據(jù)主要包括宿舍、圖書館和學(xué)院的門禁,報到注冊以及體育場館使用等數(shù)據(jù)。經(jīng)過數(shù)據(jù)的清洗與分類,我們可以作進(jìn)一步的深入分析,得出師生的消費(fèi)與行為規(guī)律,對異常行為進(jìn)行預(yù)警,對資源優(yōu)化提出建議,以及對師生行為進(jìn)行預(yù)測,等等。
食堂消費(fèi)是校園一卡通最重要的應(yīng)用,因此本文的研究重點(diǎn)是食堂消費(fèi)的交易流水?dāng)?shù)據(jù)。從一卡通原始數(shù)據(jù)中提取出食堂消費(fèi)數(shù)據(jù),進(jìn)行深入分析,能夠挖掘師生的就餐規(guī)律,從而為學(xué)校相關(guān)部門科學(xué)決策提出合理建議。
2數(shù)據(jù)挖掘結(jié)果及分析
21總體消費(fèi)情況分析
北京聯(lián)合大學(xué)學(xué)報2019年1月
第33卷第1期張四海等:校園一卡通消費(fèi)行為數(shù)據(jù)分析與研究
南開大學(xué)擁有在校師生近4萬人,每天產(chǎn)生的交易流水?dāng)?shù)據(jù)為7萬條左右,每年產(chǎn)生的數(shù)據(jù)量為數(shù)千萬條。我們采用抽樣的方法對一卡通歷史消費(fèi)數(shù)據(jù)進(jìn)行分析,提取了2015年4月和5月的3? 719? 570條交易流水?dāng)?shù)據(jù)。選取這兩個月的數(shù)據(jù),主要有兩個原因:一是從行為規(guī)律一致性的角度來考慮的,3月份剛剛開學(xué),學(xué)生要選課,然后逐步適應(yīng)校園生活;6月份是考試月,學(xué)生要復(fù)習(xí)備考;而4~5月
師生的教學(xué)活動和生活都比較有規(guī)律,因此消費(fèi)行為具有更好的一致性。第二個原因是因為南開大學(xué)從2015年9月開始部分搬遷到新校區(qū),因此我們計劃對搬遷前的總體消費(fèi)狀況進(jìn)行詳細(xì)分析。
由師生操作的交易流水?dāng)?shù)據(jù)主要包括充值和消費(fèi)兩大類,其中充值包括銀行卡轉(zhuǎn)帳和現(xiàn)金兩種方式,消費(fèi)類操作包括食堂和超市的小額消費(fèi)、網(wǎng)絡(luò)繳費(fèi)、洗浴及自助文印等。
圖2給出了不同充值方式所占的比例。銀行卡轉(zhuǎn)帳包括3種方式:圈存機(jī)自助轉(zhuǎn)賬、網(wǎng)上轉(zhuǎn)賬和手機(jī)APP轉(zhuǎn)賬。由圖2可知,銀行卡轉(zhuǎn)帳已經(jīng)成為南開大學(xué)一卡通主流的充值方式,占到總數(shù)的8754%;而現(xiàn)金充值方式比例為1246%,使用這種方式充值的主要是退休教職工以及部分無法正常綁定銀行卡的師生。隨著時間的推移,銀行卡轉(zhuǎn)帳方式所占的比例會越來越高。
圖2一卡通兩種充值方式占比
Fig.2Proportion of two prepaid ways in
Ecard system
圖3給出了各類交易流水?dāng)?shù)據(jù)的占比。如圖所示,食堂消費(fèi)流水?dāng)?shù)據(jù)的比例最高,達(dá)5291%,對這部分?jǐn)?shù)據(jù)將在后面進(jìn)行詳細(xì)分析;其次是洗浴數(shù)據(jù),占3127%,這部分?jǐn)?shù)據(jù)占比大的原因,是因為南開大學(xué)為節(jié)約能源,采用計水量收費(fèi),學(xué)生一次洗澡可能會多次刷卡;超市消費(fèi)數(shù)據(jù)占1454%;占比最少的是網(wǎng)絡(luò)繳費(fèi)數(shù)據(jù),僅占129%,這主要是南開大學(xué)每個月贈送5 GB免費(fèi)流量,且校內(nèi)流量免費(fèi),因此網(wǎng)費(fèi)流水?dāng)?shù)據(jù)占比較少。
圖3一卡通消費(fèi)類型占比
Fig.3Proportion of different Ecard
consumption types
圖4給出了不同身份群體食堂消費(fèi)所占的比例。由圖可知,本科生的食堂消費(fèi)比例最高,達(dá)6655%;碩士和博士研究生消費(fèi)比例接近,分別為1481%和1227%;而教職工的食堂消費(fèi)比例最低,僅為636%。
圖4不同身份群體食堂消費(fèi)占比
Fig.3Proportion of
canteen consumption for
different groups
表1給出了不同身份人群三餐的平均消費(fèi)和標(biāo)準(zhǔn)差。早餐的平均消費(fèi)最低,在160~203元之間。午餐和晚餐的平均消費(fèi)在618~724元之間。教職工一日三餐的消費(fèi)最高。
22食堂就餐規(guī)律分析
為分析師生在食堂的就餐規(guī)律,我們統(tǒng)計了2015年4~5月
,師生每日在食堂的刷卡消費(fèi)次數(shù),從而得出就餐規(guī)律曲線,如圖5所示,就餐規(guī)律曲線波動非常有規(guī)律。在工作日,食堂周一至周四就餐人數(shù)較多,周五人數(shù)有些減少。休息日(周六、日)的就餐人數(shù)明顯減少,約為工作日的一半。就餐曲線的兩個最低點(diǎn)分別出現(xiàn)在清明和“五一”小長假,就餐人數(shù)僅為工作日的1/3。該結(jié)果能夠為學(xué)校膳食中心優(yōu)化資源配置提供一定的參考,依據(jù)用餐消費(fèi)數(shù)據(jù),食堂在工作日、休息日及節(jié)假日可以分別按需準(zhǔn)備適量食材,或增減部分窗口,以提高資源利用率。
為研究師生每天的消費(fèi)習(xí)慣和規(guī)律,我們對時
表1不同身份人群三餐的平均消費(fèi)和標(biāo)準(zhǔn)差
Table 1Average consumption and standard deviation of three meals for different groups
餐
別
本科生
碩士研究生
博士研究生
教職工
平均消費(fèi)
/元標(biāo)準(zhǔn)差平均消費(fèi)
/元標(biāo)準(zhǔn)差平均消費(fèi)
/元標(biāo)準(zhǔn)差平均消費(fèi)
/元標(biāo)準(zhǔn)差
晚餐709528618528690575724596
午餐708490661444672474719674
早餐203169180134160124191195
圖5師生食堂就餐規(guī)律曲線
Fig.5Consuming frequency distribution graph in canteen for faculty and students
間進(jìn)行離散化處理,每半小時為1個時段,一天共
分為48個時段。食堂的營業(yè)時間是從早6:00至晚9:00,因此
僅對這期間的30個時段進(jìn)行分析。為研究方便,我們用字母編號代表每個時段,表2表示將食堂營業(yè)時間離散化后,字母編號和時段的對應(yīng)關(guān)系。
表2食堂營業(yè)時間離散化——字母編號和
各對應(yīng)時段的關(guān)系
Table 2Discretization for canteen open time—the
relationship between letter code and period
編號時段編號時段
A16:00—6:30H213:30—14:00
A26:30—7:00I114:00—14:30
B17:00—7:30I214:30—15:00
B27:30—8:00J115:00—15:30
C18:00—8:30J215:30—16:00
C28:30—9:00K116:00—16:30
D19:00—9:30K216:30—17:00
D29:30—10:00L117:00—17:30
E110:00—10:30L217:30—18:00
E210:30—11:00M118:00—18:30
F111:00—11:30M218:30—19:00
F211:30—12:00N119:00—19:30
G112:00—12:30N219:30—20:00
G212:30—13:00O120:00—20:30
H113:00—13:30O220:30—21:00
統(tǒng)計每個時段刷卡交易次數(shù),就可以對師生每日在食堂的就餐規(guī)律進(jìn)行詳細(xì)分析。由圖5可知,師生在工作日和節(jié)假日的刷卡消費(fèi)次數(shù)有較大差異,因此我們需要對工作日和節(jié)假日的就餐規(guī)律分別進(jìn)行分析。圖6給出了在工作日和節(jié)假日的師生就餐規(guī)律曲線??梢钥闯?,兩條曲線具有相同的趨勢,在早、中、晚都同樣出現(xiàn)了3個用餐高峰,但兩條曲線在每日高峰時段具有較大差異,節(jié)假日的總體就餐人數(shù)遠(yuǎn)少于工作日。節(jié)假日早餐的就餐高峰右移,從7:00—7:30后移至7:30—8:00,這說明師生在節(jié)假日用早餐的時間要晚于平時,因此膳食中心可以考慮在節(jié)假日適當(dāng)延長早餐供應(yīng)時間。
圖6工作日、節(jié)假日的師生就餐規(guī)律曲線
Fig.6Consuming frequency distribution graph in workdays and holidays for faculty and students
工作日早餐高峰時段(7:00—7:30)平均刷卡次數(shù)為2 322次,節(jié)假日早餐高峰時段(7:30—8:00)平均刷卡次數(shù)為755次,僅約為工作日的1/3。工作日午餐刷卡次數(shù)最多的時段為11:00—11:30,平均刷卡次數(shù)為3 415次;節(jié)假日午餐刷卡次數(shù)最多的時段為11:30—12:00,平均刷卡次數(shù)為1 383次,不到工作日的一半。晚上刷卡次數(shù)最多的時段為17:00—17:30,其中工作日平均刷卡次數(shù)為2 135次;節(jié)假日平均刷卡次數(shù)為1 078次,約為工作日的一半。
3結(jié)束語
本文以南開大學(xué)校園一卡通交易流水?dāng)?shù)據(jù)為研究對象,通過數(shù)據(jù)的清洗、整合與統(tǒng)計分析,實現(xiàn)數(shù)據(jù)的可視化。對食堂消費(fèi)數(shù)據(jù)進(jìn)行了詳細(xì)分析,
給出師生的就餐規(guī)律曲線,滿足了學(xué)校直觀管理的需要,并對膳食中心優(yōu)化資源配置提出了建議。
隨著大數(shù)據(jù)時代的到來,對校園歷史沉淀數(shù)據(jù)進(jìn)行挖掘、分析與建模具有極其重要的意義。對校
園卡數(shù)據(jù)進(jìn)行消費(fèi)與行為分析屬于一卡通系統(tǒng)的二次開發(fā),深入分析師生的一卡通數(shù)據(jù),有助于學(xué)校掌握師生的行為規(guī)律,優(yōu)化資源配置,對高校管理部門科學(xué)決策具有重要意義。
[參考文獻(xiàn)]
[1]許鑫.南京大學(xué)數(shù)字化校園建設(shè)架構(gòu)[J].教育信息化,2002(8):44-45.
[2]徐為民,徐兵,朱顯靈,等.校園一卡通和數(shù)字化校園[J].教育信息化,2002(S1):50-51.
[3]蘇文勝,馬千軍.基于數(shù)字化校園的校園一卡通構(gòu)建[J].武漢理工大學(xué)學(xué)報(信息與管理工程版),2005,27(1):99-101.
[4]顧金娣,席琳琳.校園一卡通系統(tǒng)的應(yīng)用與思考[J].上海第二工業(yè)大學(xué)學(xué)報,2005,22(3):71-76.
[5]張升平.數(shù)字化校園之校園一卡通的建設(shè)[J].重慶工商大學(xué)學(xué)報(自然科學(xué)版),2008,25(1):56-59.
[6]孟昆鵬.數(shù)字校園如何向智慧校園轉(zhuǎn)型的探討——以開封技師學(xué)院為例[J].中國培訓(xùn),2016(11):52-54.
[7]樊鐵成,高路,管晶,等.智慧校園一卡通未來發(fā)展研究[J].鄭州大學(xué)學(xué)報(工學(xué)版),2017,38(S1):25-28.
[8]田麗.智慧校園環(huán)境下的校園一卡通建設(shè)[J].華東師范大學(xué)學(xué)報(自然科學(xué)版),2015(S1):530-535.
[9]許鑫,蘇新寧,姚瑤.數(shù)字化校園一卡通平臺研究[J].現(xiàn)代圖書情報技術(shù),2005(7):54-59.
[10]李淑娟,周偉強(qiáng),宓詠.如何實現(xiàn)校園一卡通高效的運(yùn)行管理探索[J].實驗技術(shù)與管理,2011,28(6):7-10.
[11]張九娟.校園“一卡通”在學(xué)校管理中的應(yīng)用研究[J].高校后勤研究,2014(2):63-65.
[12]李珊娜.基于校園一卡通平臺的數(shù)據(jù)挖掘應(yīng)用研究[J].鐵路計算機(jī)應(yīng)用,2010,19(6):55-58.
[13]張兵兵,王建,張建威,等.數(shù)據(jù)挖掘在校園一卡通系統(tǒng)中的應(yīng)用初探[J].數(shù)理醫(yī)藥學(xué)雜志,2009,22(5):572-575.
[14]陳鋒.基于校園一卡通系統(tǒng)的高校用戶就餐消費(fèi)行為分析與數(shù)據(jù)挖掘[J].中國教育信息化,2014(9):47-49.
[15]薛黎明,欒維新,李志淮,等. 數(shù)據(jù)挖掘在校園一卡通消費(fèi)數(shù)據(jù)分析中的應(yīng)用[C]//中國高等教育學(xué)會教育信息化分會.中國高等教育學(xué)會教育信息化分會第十二次學(xué)術(shù)年會論文集.北京:中國高等教育學(xué)會教育信息化分會,2014:8.