黃山
摘? 要:學生畫像技術對提升高校學生事務精細化管理水平已得到廣泛共識,但目前仍缺少對具體平臺搭建的深入研究。本文從高校學生事務需求出發(fā),提出了學生畫像技術的實現方案,并就該實施方案的意義以及應用領域進行了分析和總結?;趯W生畫像技術為實現高校學生事務精細化管理提供了一條行之有效、切實可行的方案,對研究個性化思想政治教育具有一定的參考價值。
關鍵詞:學生畫像;學生事務管理;精細化;高校
高校學生管理工作的愿景是不斷整合學習資源,更好地服務學生在學期間的學習與生活。目前,對于高校來說,涉及學生管理的具體部門較多,協(xié)作效率低。同時,在當今大數據時代,高校各類數據不斷增長(平均每年約翻一倍),數據源種類繁多且信息多樣化,如何利用大數據技術高效整合海量的校園數據,挖掘其背后隱藏的價值,進行學生管理工作創(chuàng)新,成為高校亟待解決的問題。在大數據時代背景下的學生工作需要掌握學生的精準特征,以及為學生提供私人訂制的成長服務,將工作重心放到“輔”和“導”上,得到學生的配合與支持,幫助學生認知自己,進而實現自我管理、快樂成長。
一、學生精準畫像之于高校學生工作的意義
學生精準畫像對于高校學生工作有著重要意義。通過對學生進行精準畫像可以全方位的了解學生,如學生的心理健康狀況預警、精準資助、成績預測、失聯(lián)預警、學生訴求等,圍繞學生在校期間的安全、學習、生活、就業(yè)等方面的具體問題,刻畫學生全維度畫像,幫助學生工作者全面認識學生,精準定位異常學生群體,幫助高校實現對學生的精細化管理和個性化引導。
1.學生事務管理理念由學生集體向學生個體轉變
在傳統(tǒng)的學生事務管理模式下,學校更偏重于管理,追求統(tǒng)一和可控,忽視學生的個體[1]?;趯W生畫像技術的學生事務精細化管理,收集學生個性需求信息,預判每一名學生的情況和特點,為學生繪制專屬的“畫像”,再依據畫像的特征,為其定制特有的教育成長方案。因此,實現了以學生為中心的管理理念的轉變,這也正是新時代高校育人目標的趨勢。
2.實現全方位的學生評價
在傳統(tǒng)學生工作管理模式下,對學生的評價往往通過一些可見的指標,如學習成績,學生干部擔任情況等[2]。這種評價體系單一,信服度較低。但事實上,對一個人的評價取決于他的綜合素質。學生畫像的核心在于了解學生,畫像是真實學生的虛擬表示,是建立在一系列真實的學生行為數據之上的目標用戶模型。而學生畫像的實際工作內容,就是將學生信息標簽化,通過收集學生的社會屬性、行為信息(如離校、晚歸、上網、借書、社交、學習等等)、偏好特征等各個維度的數據,進而對學生特征屬性的刻畫,并對這些特征分析統(tǒng)計,挖掘潛在的價值信息,從而抽象出一個學生的信息全貌,得出學生在各方面的綜合情況,精準全面地評價每一名學生。
3.讓個性化思想政治教育成為可能
個性化思想政治教育是尊重和包容學生個性,激勵和促進學生個性全面自由發(fā)展的內在需要,對學生自身成長和教育方式方法變革都大有裨益[3]。以大數據技術為基礎的學生畫像,通過收集學生的基本信息、日常行為數據等全方位描述學生的綜合情況和個性特征,學生工作者能精準把握學生思想行為特征和問題,以此區(qū)分學生群體,實施差異化教育,從而提高思想政治教育的質量和水平。
二、學生精準畫像的設計
本文基于吉林大學珠海學院的學生工作實際使用需求,對學生畫像系統(tǒng)進行整體設計。該系統(tǒng)從數據獲取、數據存儲、數據挖掘建模與數據可視化這五部分進行設計。其整體結構圖如1所示:
如圖1所示,學生的校園數據存在多源性、多樣性問題,首先需要將多渠道分散的數據匯總,并做歸一化、標準化處理,得到可用的關聯(lián)數據。這些數據包括存儲于高校教務、學工等系統(tǒng)中的基礎屬性數據,如學生基本信息、學業(yè)成績、獎助學金、上網數據(上網時間戳、上網時長、上網流量分布等),一卡通消費數據、門禁打卡數據、圖書借閱數據、社會活動數據、社團數據、競賽數據,以及從網絡、社交媒體爬取的學生社交數據。其次,需要對上述數據進行脫敏與加密處理。數據安全是信息安全的重要環(huán)節(jié),許多敏感數據涉及到學生的隱私,這些數據如果被不法分子竊取后果不堪設想。因此,需要從源頭著手,對原始數據進行脫敏、加密處理才能保證用戶數據的安全。數據脫敏首先需要考慮敏感數據定義問題,敏感信息包括敏感內容、敏感級別、類型、長度、取值范圍等。確認脫敏目標后,需要進行脫敏方法的選擇以及脫敏程度的把控,即脫敏規(guī)則。數據脫敏可分為可逆性脫敏和不可逆脫敏[4],可逆性脫敏是指脫敏后的數據通過一定的規(guī)則和手段可以恢復到未脫敏之前的數據,不可逆脫敏即數據脫敏后不能恢復到未脫敏之前的狀態(tài)。在本文的場景中,采集的數據只需提供給算法模型訓練與運算,只需保留數據的原始特征即可,不需要可恢復特性。學生隱私數據主要包括學生的日常行為(如消費行為、上網行為等)、學生基礎信息(如身份證號、家庭地址、家庭成員等)。脫敏流程如圖2所示,客戶端上傳用戶原始數據,數據管理中心根據脫敏規(guī)則對數據進行抽取、轉換、裁剪、驗證,最終將脫敏后的可用數據存儲下來。
需要開發(fā)的畫像類標簽從大類上可大致劃分為三類,人口屬性標簽、學生行為標簽、風險預警維度標簽,進一步細分還可以分為學生偏好畫像和群體屬性、群體偏好畫像等。屬性類標簽和行為類標簽是開發(fā)的重點,無論是做偏好或者預測類標簽也都是以上面兩類標簽為基礎進行深度挖掘,畫像的相關數據模型需要從高校學生工作的實際使用需求出發(fā)。
人口屬性類指標按照常見屬性標簽可劃分出很多,本課題按照標簽等級進行等級劃分,屬性標簽示例如圖3所示。
學生行為類指標按常見一級、二級標簽劃分可以劃分出很多,這里只給出一些示例,如表1所示。
風險類標簽指標常見分類可劃分出很多,也有很多應用場景,比如根據某個學生連續(xù)缺勤或缺勤次數過多情況、上網時長過長等標簽可以大致預測該學生是否有考試掛科的風險。根據學生的門禁打卡情況統(tǒng)計學生的作息規(guī)律情況,進而判斷該學生是否有安全風險。根據學生在網絡上發(fā)布的內容,通過NLP技術進行情感識別與敏感詞識別,可判別該學生是否有心理健康問題,以便于心理老師及時進行心理輔導。根據學生在校的消費情況判斷學生的經濟狀況,輔助貧困生資助工作等。標簽畫像字典如表2所示。
畫像標簽的開發(fā)是學生畫像工作的重頭,具體工作可從以下幾方面開展:
1.學生畫像表結構設計(存儲標簽以及學生行為);
2.元數據管理(管理標簽元數據);
3.數據同步(同步MySQL、oracle、HBASE等多源數據);
4.標簽準確性校驗(學生標簽質量保障);
5.數據清洗與任務調度設計(高效、穩(wěn)定,保證每日數據的加工)。
建好學生畫像模型后,開發(fā)人員可通過調度任務,按周期定時從各業(yè)務庫和日志庫抽取數據進行加工處理。各類型標簽每天加工的數據有成百上千萬條,數據分析人員不會每天對這些數據的質量進行核查,去發(fā)現每一類標簽的數據是否有異常。例如在根據日志數據中的鏈接參數抽取用戶發(fā)表的社交媒體數據時,當目標頁面的鏈接結構發(fā)生了變化,而對應的畫像的腳本沒有作調整(修改解析鏈接的正則表達式),會導致學生該類行為數據的大量缺失(解析出來的數據為空)。為避免畫像標簽應用過程中由于數據異常導致標簽預測錯誤、分析結論錯誤,需要對學生畫像數據進行質量監(jiān)控管理,如圖4所示。
在數據處理的同時進行兩條并行作業(yè)ETL任務,一條任務統(tǒng)計原始數據,另一條任務進行數據梳理(脫敏、特征處理等),對兩條線的數據進行對比校驗,若校驗成功,則進行下一步操作,將處理好的數據入庫,映射關系入元數據管理系統(tǒng),標簽數據入Hbase,最終由畫像系統(tǒng)作頁面展示,否則進行回調操作,并發(fā)送告警郵件給管理員檢查,直至校驗成功為止。任務監(jiān)控管理視圖如圖5所示。
畫像系統(tǒng)開發(fā)完成后,前端頁面將后臺功能封裝起來,分析人員可利用可視化組合操作進行自定義分析。效果如圖6所示。
三、學生精準畫像于高校學生工作中的應用
1.用于精準評優(yōu)助困
學生評優(yōu)助困是高校學生工作的重要工作之一,傳統(tǒng)的方式是先由各個輔導員推薦名額至學生處,學生處匯總上報給學校,再進行評選或公示。傳統(tǒng)模式工作量大、流程復雜且公平公正性難以保證。利用學生畫像系統(tǒng),可以根據學生日常的生活、學習等相關標簽,對學生進行全面分析。該類標簽可以將學生分為不貧困、一般貧困、特困等類別,可顯著提升工作效率,且評判結果具有客觀性、公正性。
2.用于成績預警
學業(yè)指導的主要工作與工作難點在于幫助學生避免學習生活出現問題和克服學習中的各種困難,成績預警是其中最重要的一環(huán)。利用學生畫像系統(tǒng)的精準畫像功能及時發(fā)現偏離正常發(fā)展軌道的學生,并進行有針對性的學業(yè)指導與干預,有利于提升高校的教育教學水平。成績預警模型將標簽劃分為一般、嚴重、非常嚴重三個等級。模型對學生的歷史成績數據進行挖掘,生成關聯(lián)規(guī)則庫,進而預測學生在后面的學習中潛在的風險。
3.輔助心理健康教育工作
心理健康教育是集教育、服務于一體的工作,是高校學生工作的主要內容之一。大學生心智還不成熟,很容易出現心理問題,利用大數據技術及時掌握、了解學生的心理動態(tài),并對有心理問題的學生及時進行心理輔導具有重要意義。
畫像系統(tǒng)通過爬取用戶的社交媒體、網絡論壇、貼吧上的相關信息以及學生的日常消費情況、上課出勤情況建立心理預警模型,從而為學生打上預測標簽。
4.用于學校危機事件預警
傳統(tǒng)的學生行為管理工作往往依靠經驗,在大數據時代,可幫助高校主動掌握學生校園行為發(fā)生的特點和規(guī)律,并可據此作出判斷和預測,實現“前置式”管理模式創(chuàng)新。
通過對學生網絡行為的監(jiān)控,可對使用校園網絡的學生進行熱點話題分析,針對重點的敏感詞(如輕生、焦慮、失戀、憤恨等)、學生運動軌跡(門禁打卡數據、食堂打卡數據[5]、校門進出打卡數據等)跟蹤觀察在校生的行為軌跡,根據預先規(guī)劃的學校運動區(qū)、學習區(qū)、生活區(qū)、危險區(qū)等區(qū)域進行數據建模。一旦模型檢測到數據出現不穩(wěn)定或者超常規(guī)的跡象時,就要密切關注和跟蹤學生的行為,防患于未然。
四、結語
隨著大數據時代的到來,個性化思想政治教育越來越被人所熟知。其中,高校學生事務管理是思想政治教育的一個重要組成部分,利用大數據技術實現高校學生事務精細化管理是個性化思想政治教育的開端,也是時代賦予的必然結果。
參考文獻:
[1]劉柏巖.精準畫像在高校學生事務精細化管理方面的運用[J].佳木斯職業(yè)學院學報,2017(12):263+265.
[2]蔡紅生,李恩.移動互聯(lián)網背景下高校學生事務管理的創(chuàng)新[J].學校黨建與思想教育,2018(21):82-84.
[3]李懷杰,申小蓉.大數據時代個性化思想政治教育論析[J].思想理論教育,2019(03):105-110.
[4]Privacy-Preserving Updates to Anonymous and Confidential Databases[J].Trombetta,Alberto,Jiang, Wei,Bertino,Elisa,Bossi,Lorenzo.IEEE Transactions on Dependable and Secure Computing,2011(4).
[5]趙國亮,陳曉軍,李思奇,吳傲.基于數據分析高校學生自畫像的初探[J].數字技術與應用,2017(08):233-234+236.
責任編輯? 邱翔翔