黃姿 胡小忠 徐杭 秦圓 陳磊
摘要:針對部分大學(xué)生自身定位不準、參加創(chuàng)新活動難以找到合適伙伴或團隊等問題,該文通過用戶畫像、數(shù)據(jù)挖掘和推薦算法等概念展開了對大學(xué)生創(chuàng)新匹配平臺開發(fā)的探討。利用軟件工程等技術(shù),分析設(shè)計了平臺的系統(tǒng)功能模塊、工作流程、軟件架構(gòu)及頁面設(shè)計等,其內(nèi)容可為我國教育事業(yè)創(chuàng)新性研究提供參考。
關(guān)鍵詞:用戶畫像;大學(xué)生創(chuàng)新平臺;匹配算法;軟件開發(fā)
中圖分類號:TP399? ? ? ? 文獻標識碼:B
文章編號:1009-3044(2019)16-0044-03
開放科學(xué)(資源服務(wù))標識碼(OSID):
1 背景
近年來,隨著時代和網(wǎng)絡(luò)的發(fā)展,類型多樣的活動使得大學(xué)生課余生活變得更加豐富多彩。然而,這些活動在提高學(xué)生綜合素養(yǎng)同時也帶來了一些問題。調(diào)查顯示,由于大多數(shù)活動的組隊賽制、學(xué)生個人定位不準確及交際網(wǎng)過窄等,超過三分之一的人不知如何找到合適的隊友或團隊。
作為日益成熟的數(shù)據(jù)分析工具,用戶畫像能全面細致地抽象出用戶的信息全貌,了解并跟蹤用戶需求變化并分析探求用戶需求變化的根本原因[1],其在生活中得到了廣泛運用。商界內(nèi),以京東、淘寶及亞馬遜等電商平臺為典型。學(xué)界內(nèi),楊帆[2]在研究中以讀者的行為偏好為中心,實現(xiàn)了圖書館的個性化推薦;國外學(xué)者 Iglesias 等[3]對 Web 站點的網(wǎng)絡(luò)日志進行了深度挖掘,通過對用戶行為模式進行聚類來刻畫不同群體的用戶畫像等。
盡管如此,在國內(nèi)卻鮮有人基于用戶畫像等概念對如何促進大學(xué)生創(chuàng)新進行研究。本項目充分考慮大學(xué)生對組隊比賽的需求,旨在通過用戶畫像、數(shù)據(jù)挖掘和推薦算法等技術(shù),開發(fā)一套大學(xué)生創(chuàng)新匹配平臺,以此準確定位學(xué)生個人能力,向其推薦心儀的活動、團隊和伙伴等,使得團隊效益最大化,為我國創(chuàng)新創(chuàng)業(yè)助力。
2 系統(tǒng)總體設(shè)計
按照軟件工程的方法,項目首先進行了需求分析,重點對數(shù)據(jù)需求和功能需求進行了相關(guān)研究,通過分析,總結(jié)出平臺主要解決“推薦活動”和“推薦人員”兩個核心問題,由此衍生出多個為其服務(wù)的功能模塊。如登錄注冊、信息管理、聊天通知及匹配推薦等,其功能模塊如圖1所示。
圖1中,登錄注冊、信息管理與通知及聊天為基礎(chǔ)功能模塊。登錄注冊建立用戶與平臺的聯(lián)系,為后期收集用戶信息、生成用戶畫像及個性化服務(wù)做準備;信息管理高效安全地存儲用戶信息,為精準推薦匹配功能提供數(shù)據(jù)基礎(chǔ);查詢讓用戶快速獲取所需信息;通知及聊天為用戶相互了解提供渠道,使得人與人之間的合作機制更加高效。
自動打標簽與報名及匹配為平臺核心功能模塊,前者可根據(jù)信息管理模塊提供的基礎(chǔ)信息,分析和挖掘數(shù)據(jù)間關(guān)系,為實體標注標簽,同時動態(tài)更新用戶畫像;后者除實現(xiàn)報名外,還可借助前者生成的標簽、權(quán)重與用戶畫像,依據(jù)一定的推薦算法進行活動與人員的推薦。其中,由于人員組成類型的多樣,又可將其分為志趣相投的伙伴、有目標活動的隊伍及隊員三類。
3 核心功能工作流程
圖1給出了系統(tǒng)所包含的主要功能模塊,其中自動打標簽、報名和匹配功能模塊的設(shè)計與優(yōu)化是提升本系統(tǒng)實用性的關(guān)鍵。其中,雖然報名與匹配同屬一個大模塊,但報名功能相對較為獨立,可單獨進行分析。
1)自動打標簽流程
自動打標簽?zāi)K分為2個部分,分別負責(zé)活動和人物的標簽分析。
由圖2可知,自動打標簽?zāi)K由時間周期觸發(fā)運算更新標簽操作,系統(tǒng)內(nèi)置計算規(guī)則決定運算標簽的權(quán)重及內(nèi)容。而用戶畫像主要由標簽組成,一旦實體標注的標簽內(nèi)容準確,畫像的分析則可通過調(diào)用接口實現(xiàn)。
2)報名工作流程
報名工作將意向用戶或活動加入匹配池,為后續(xù)匹配工作提供數(shù)據(jù)源。
由圖3知,報名方式分兩種,若是個人報名,在確定之后將加入目標活動的人員匹配池;若是團隊報名,則在選擇隊伍之后加入目標活動隊伍匹配池。這2個池為匹配推薦功能中的隊員推薦和隊伍推薦提供基礎(chǔ)。
3)匹配推薦工作流程
匹配推薦分為活動、伙伴、隊伍和隊員推薦四個子塊。為了實現(xiàn)精準推薦,每個模塊都將基于實體的標簽表進行運作。
由圖4知,不同匹配子模塊之間的運作流程基本類似,只不過它們所基于的運算數(shù)據(jù)源和算法不一樣,從而劃分成了不同子塊。匹配推薦的流程可以抽象概括為:系統(tǒng)先判斷用戶當前的匹配類型,再根據(jù)匹配類型獲取所需的數(shù)據(jù)與計算規(guī)則進行運算,在得到了相應(yīng)的匹配數(shù)目的集合之后,按照匹配度從高到低的順序從優(yōu)呈現(xiàn)給用戶。其中,推薦隊員和推薦隊伍實質(zhì)上是一個逆向的計算過程,僅在數(shù)據(jù)源、結(jié)果集的處理上有所不同,因此它們共用一個匹配度計算功能子塊。
4 系統(tǒng)開發(fā)環(huán)境
為優(yōu)化系統(tǒng)性能、提高開發(fā)速率及降低功能耦合等,本系統(tǒng)采用微服務(wù)架構(gòu)提供業(yè)務(wù)服務(wù)。以五臺微服務(wù)服務(wù)器提供業(yè)務(wù)服務(wù),一臺數(shù)據(jù)服務(wù)器提供數(shù)據(jù)源,Redis緩存數(shù)據(jù)庫加快訪問速率及Mysql數(shù)據(jù)庫實現(xiàn)數(shù)據(jù)持久化;利用Jenkins可以監(jiān)控軟件開發(fā)流程等;Docker容器中創(chuàng)建和部署各個應(yīng)用,以實現(xiàn)軟件系統(tǒng)服務(wù)隔離等。其具體性能和搭載的服務(wù)組件如表1所示。
在該硬件配置方案下,僅一臺服務(wù)器負責(zé)數(shù)據(jù)存儲工作,這容易造成服務(wù)器性能瓶頸。對此,通過配置及帶寬升級可在一定程度上解決該問題?;谝陨吓渲煤退枷?,可得系統(tǒng)運作基本架構(gòu)如圖5所示。
由圖5可見,微服務(wù)器各負責(zé)不同的業(yè)務(wù)功能,它們之間可以進行通訊服務(wù)。Master DB負責(zé)數(shù)據(jù)的存取,Nginx實現(xiàn)服務(wù)器之間的負載均衡。如此架構(gòu),系統(tǒng)便具有了高擴展、松耦合、易部署和易理解等特點。
5 系統(tǒng)實現(xiàn)主要界面
在總體設(shè)計和詳細設(shè)計的基礎(chǔ)上,進行了編程和測試,下面給出系統(tǒng)開發(fā)的主要功能界面。
1)個人中心
圖6個人中心集中展現(xiàn)了目標用戶的信息,除本人用戶可對其進行修改外,訪客也可通過此了解目標用戶的大致情況。本人用戶可以通過我管理的隊伍、我參加的活動進入匹配功能進行推薦隊友、隊伍等。
2)伙伴推薦
圖7展示了進行伙伴推薦之后的結(jié)果頁面,只要向上拉動伙伴推薦頁面就可以拉取最新推薦內(nèi)容。其中,科技成就值和可靠度正是通過內(nèi)置算法計算得出,其數(shù)值可直觀地為用戶提供選擇隊友或活動的依據(jù)。
3)活動推薦
圖8展示與伙伴推薦類似,只是此處并沒有更細節(jié)的展示匹配度,取而代之的是與活動相關(guān)的細節(jié)信息,有助于用戶篩選符合目標條件活動。
6 結(jié)束語
本項目屬于國家級大學(xué)生創(chuàng)新訓(xùn)練項目,開發(fā)靈感來源于生活,將用戶畫像等概念運用在大學(xué)生創(chuàng)新上,具有較強實用性。目前該系統(tǒng)正處于系統(tǒng)運行與維護階段,雖然實現(xiàn)了預(yù)期的目的,但仍然存在一些不足,如推薦算法效率和精度不高等問題,后續(xù)將會繼續(xù)深入研究。
參考文獻:
[1] 王凌霄, 沈卓, 李艷. 社會化問答社區(qū)用戶畫像構(gòu)建[J]. 情報理論與實踐, 2018, 41(1): 129-134.
[2] 楊帆. 以畫像分析為基礎(chǔ)的圖書館大數(shù)據(jù)——以國家圖書館大數(shù)據(jù)項目為例[J]. 圖書館, 2018(2).
[3] IGLESIAS J A, ANGELOV P, LEDEZMA A, et al. Creating evolving user behavior profiles automatically[J]. IEEE Transactions on Knowledge and Data Engineering, 2012, 24(5): 854-867.
【通聯(lián)編輯:謝媛媛】