姬昊
摘要:隨著互聯(lián)網(wǎng)技術(shù)在教育領(lǐng)域應(yīng)用的不斷深入,遠(yuǎn)程教育作為一種新型教育模式得到了迅速的發(fā)展。然而,在這種便利的教學(xué)模式下如何進(jìn)行高效的學(xué)習(xí)受到了越來(lái)越多的關(guān)注。由于學(xué)習(xí)用戶之間存在著鮮明的個(gè)性特征差異,所以用戶行為分析對(duì)解決如何對(duì)不同行為的學(xué)習(xí)用戶制定相應(yīng)的學(xué)習(xí)策略對(duì)于提高遠(yuǎn)程教育質(zhì)量至關(guān)重要。本研究旨在基于對(duì)遠(yuǎn)程教育用戶的學(xué)習(xí)行為進(jìn)行相關(guān)分析研究,研究實(shí)現(xiàn)核心思想為根據(jù)用戶在遠(yuǎn)程教育系統(tǒng)使用過程中產(chǎn)生的各種數(shù)據(jù)信息,通過相應(yīng)的數(shù)據(jù)采集、數(shù)據(jù)挖掘以及統(tǒng)計(jì)分析等方法來(lái)分析不同用戶行為的差異性。
關(guān)鍵詞:遠(yuǎn)程教育;用戶特征;行為分析;數(shù)據(jù)處理
1 引言
網(wǎng)絡(luò)遠(yuǎn)程教育是隨著現(xiàn)代信息技術(shù)的發(fā)展而產(chǎn)生的一種新型教育方式[1][2]。計(jì)算機(jī)技術(shù)、多媒體技術(shù)、通信技術(shù)的發(fā)展,特別是因特網(wǎng)的迅猛發(fā)展,使網(wǎng)絡(luò)遠(yuǎn)程教育技術(shù)有了質(zhì)的飛躍,成為高新技術(shù)條件下的遠(yuǎn)程教育。遠(yuǎn)程教育以網(wǎng)絡(luò)教育手段為主,兼容面授、函授和自學(xué)等傳統(tǒng)教學(xué)形式,是一種由多種媒體優(yōu)化組合的教育方式。同時(shí),相對(duì)于面授教育而言,遠(yuǎn)程教育是一種師生分離、非面對(duì)面組織的教學(xué)活動(dòng),是一種跨學(xué)校、跨地區(qū)的教育體制和教學(xué)模式,遠(yuǎn)程教育的主要特點(diǎn)包括:學(xué)生與教師分離;采用特定的傳輸系統(tǒng)和傳播媒體進(jìn)行教學(xué);信息的傳輸方式多種多樣;學(xué)習(xí)的場(chǎng)所和形式靈活多變。與面授教育相比,遠(yuǎn)距離教育的優(yōu)勢(shì)在于它既可以突破時(shí)空的限制、提供更多的學(xué)習(xí)機(jī)會(huì),也能夠擴(kuò)大教學(xué)規(guī)模、降低教學(xué)的成本;同時(shí)便利了學(xué)習(xí)過程。
然而在我國(guó)遠(yuǎn)程教育實(shí)踐過程中仍然存在很多問題,嚴(yán)重阻礙了遠(yuǎn)程教育的發(fā)展[3][4][5]。在諸多問題中,遠(yuǎn)程教育的教學(xué)質(zhì)量問題是政府、社會(huì)及辦學(xué)者所關(guān)注的重點(diǎn)。由于其入學(xué)門檻相對(duì)較低,學(xué)生素質(zhì)多樣化,學(xué)生之間存在著鮮明的個(gè)性特征差異,同時(shí)學(xué)習(xí)時(shí)間分散,以業(yè)余時(shí)間為主,導(dǎo)致學(xué)習(xí)過程難以監(jiān)控、學(xué)習(xí)效果不便診斷,此外,目前常見的遠(yuǎn)程教育系統(tǒng)模式單一,師生交互性差,教育資源大都以靜態(tài)的形式存儲(chǔ)共享在系統(tǒng)平臺(tái)上,學(xué)生只能被動(dòng)的接受統(tǒng)一、固定的學(xué)習(xí)內(nèi)容,知識(shí)選擇靈活性差,不能根據(jù)學(xué)生的具體需求個(gè)性化的定制學(xué)習(xí)內(nèi)容,從而影響學(xué)習(xí)效果。
2 用戶行為分析
2.1 特征預(yù)處理
用戶行為[6]是指主體能在網(wǎng)絡(luò)上產(chǎn)生流量的行為,如MSN聊天,迅雷下載,Web站點(diǎn)訪問,在線觀看視頻等。本課題首先對(duì)影響用戶在學(xué)習(xí)過程中各個(gè)方面的主要因素進(jìn)行歸納和研究分析,包括對(duì)用戶潛在的固有特征進(jìn)行統(tǒng)計(jì),例如籍貫、性別、年齡、婚否、血型等;以及通過用戶對(duì)自身相關(guān)能力的描述,例如創(chuàng)造力、環(huán)境適應(yīng)能力、觀察力等因素。然后通過統(tǒng)計(jì)分析、心理學(xué)等相關(guān)專業(yè)學(xué)科知識(shí)對(duì)影響用戶行為的每個(gè)因素進(jìn)行詳細(xì)的預(yù)分析和初步的判斷,為后續(xù)的數(shù)據(jù)信息處理奠定基礎(chǔ)。
2.2 用戶模型構(gòu)建
用戶模型是個(gè)性化服務(wù)的核心部分,反映了用戶與系統(tǒng)交互、績(jī)效行為和學(xué)習(xí)歷史記錄等主觀及客觀的信息。為滿足用戶的個(gè)性化需求。實(shí)現(xiàn)個(gè)性化學(xué)習(xí)服務(wù),系統(tǒng)必須先了解學(xué)生的性格特點(diǎn)、知識(shí)水平、興趣偏好和學(xué)習(xí)風(fēng)格等信息。為了能準(zhǔn)確描述這些用戶信息,需要為每個(gè)用戶建立用戶模型,用戶模型包含如下信息:
圖1 用戶模型
(1)個(gè)人特征信息。
個(gè)人信息記錄用戶的性別、籍貫、年齡、所從事專業(yè)等基本信息。
(2)社交信息。
社交信息描述用戶與其它用戶之間的關(guān)聯(lián)關(guān)系信息,用戶可以建立學(xué)習(xí)小組或加其他用戶為好友并互動(dòng)從而進(jìn)行協(xié)作學(xué)習(xí)。
(3)學(xué)習(xí)風(fēng)格。
學(xué)習(xí)風(fēng)格是指在學(xué)習(xí)過程中,每一個(gè)用戶都會(huì)表現(xiàn)出不同的學(xué)習(xí)傾向,包括學(xué)習(xí)動(dòng)機(jī)、態(tài)度、情緒和認(rèn)知傾向,以及對(duì)某種學(xué)習(xí)策略、學(xué)習(xí)方法的適應(yīng)程度等。
2.3 行為分析
遠(yuǎn)程教育用戶的行為受到外界因素和內(nèi)部因素兩方面影響,在這兩方面影響下用戶產(chǎn)生了資源信息需求,并根據(jù)需求完成信息尋求行為,在用戶進(jìn)行信息行為的過程中,他的這種行為作為外部因素影響了其他的用戶,導(dǎo)致其他用戶產(chǎn)生新的信息需求。由于社會(huì)化網(wǎng)絡(luò)是通過人和人之間的聯(lián)系建立起來(lái)的,具有很強(qiáng)的社會(huì)性,所以在兩類印象因素中,外部因素對(duì)社會(huì)化網(wǎng)絡(luò)用戶的行為變化起了重要的作用。
外界影響因素是指?jìng)€(gè)人以外的外界環(huán)境對(duì)行為所產(chǎn)生的影響,包括:群體行為影響、他人推薦、輿論導(dǎo)向;內(nèi)部因素是指用戶的個(gè)人特征對(duì)行為所產(chǎn)生的影響,包括:文化程度、社會(huì)角色、人格特性、遺傳因素。產(chǎn)生的行為表現(xiàn)按照對(duì)信息的需求程度分為三類:積極檢索、被動(dòng)檢索、信息瀏覽。
圖2 行為模型
3 數(shù)據(jù)處理
3.1 數(shù)據(jù)采集
對(duì)用戶行為進(jìn)行分析,離不開用戶在遠(yuǎn)程教育學(xué)習(xí)過程中的一些原始數(shù)據(jù)的支持。采集的數(shù)據(jù)信息包括對(duì)用戶固有特征信息、遠(yuǎn)程教育辦學(xué)機(jī)構(gòu)以及課程資源信息以及用戶在學(xué)習(xí)過程中產(chǎn)生的行為數(shù)據(jù)信息。
在收集用戶固有特征信息過程中,對(duì)于用戶的基本信息,可以通過從用戶基本注冊(cè)信息數(shù)據(jù)庫(kù)表進(jìn)行獲??;遠(yuǎn)程教育辦學(xué)機(jī)構(gòu)學(xué)??诒?、教學(xué)管理以及資源品質(zhì)等信息可以通過社會(huì)評(píng)價(jià)以及學(xué)生往期選課標(biāo)準(zhǔn)進(jìn)行獲?。欢脩魧W(xué)習(xí)行為信息需要通過特定的數(shù)據(jù)記錄結(jié)構(gòu)來(lái)進(jìn)行捕獲,捕獲對(duì)象例如用戶學(xué)習(xí)過程中的搜索關(guān)鍵字、訪問URL、學(xué)習(xí)時(shí)長(zhǎng)等信息;若需要更為詳細(xì)的特征信息可以通過調(diào)查問卷等采樣方式進(jìn)行獲取。
(1)用戶屬性數(shù)據(jù)庫(kù)中存儲(chǔ)了用戶的屬性信息,是用戶注冊(cè)賬號(hào)時(shí)填寫的個(gè)人信息,數(shù)據(jù)表的具體設(shè)置如表1所示。
(2)根據(jù)上一節(jié)建立的用戶行為模型,提取用戶相關(guān)行為數(shù)據(jù)。行為數(shù)據(jù)庫(kù)存儲(chǔ)用戶的相關(guān)行為信息,包括用戶的瀏覽行為、選課行為、操作行為等。數(shù)據(jù)表信息如表2和 表3所示。
3.2 數(shù)據(jù)分析
要得到可信的數(shù)據(jù)分析結(jié)果,往往需要采集的數(shù)據(jù)信息規(guī)模需要很大而且多樣化,因此需要對(duì)已采集信息進(jìn)行處理。處理過程中,可以首先清除掉數(shù)據(jù)信息集中的“無(wú)效數(shù)據(jù)”,例如屬于嚴(yán)重背離常理的數(shù)據(jù),或者是敷衍調(diào)查的無(wú)用數(shù)據(jù);其次對(duì)過濾好的數(shù)據(jù)信息通過數(shù)據(jù)挖掘、數(shù)理統(tǒng)計(jì)以及相關(guān)性分析等方法進(jìn)行處理,來(lái)計(jì)算用戶行為因素出現(xiàn)頻率、概率以及因素之間的相關(guān)性。
對(duì)于用戶輸入的查詢語(yǔ)句,為實(shí)現(xiàn)語(yǔ)義查詢,必須進(jìn)行一定的處理,進(jìn)行中文處理的關(guān)鍵是詞法分析。本文采用了中科院分詞系統(tǒng)ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System),對(duì)用戶輸入的信息進(jìn)行分詞處理,以盡可能返回用戶最滿意的搜索結(jié)果集。
計(jì)算用戶屬性與影響因素之間的相關(guān)系數(shù),選擇相關(guān)系數(shù)值較大的影響因素作為回歸預(yù)測(cè)模型的自變量,相關(guān)系數(shù)計(jì)算公式為:
(1)
對(duì)影響因素的關(guān)聯(lián)度進(jìn)行分析,找出關(guān)聯(lián)度較大的因素作為分析模型的自變量,其計(jì)算步驟為:
(1)求關(guān)聯(lián)度兩極差,
記為 ,再根據(jù) 求兩極最大差和最小差,分別記為 , ,再計(jì)算關(guān)聯(lián)系數(shù):
(2)
(2)計(jì)算關(guān)聯(lián)度:
(3)
4 結(jié)束語(yǔ)
本文提出了一種通過對(duì)遠(yuǎn)程教育用戶的行為進(jìn)行的用戶行為分析研究。根據(jù)用戶在遠(yuǎn)程教育系統(tǒng)使用過程中產(chǎn)生的各種數(shù)據(jù)信息,通過進(jìn)一步的數(shù)據(jù)采集、數(shù)據(jù)分析以及統(tǒng)計(jì)分析等方法來(lái)分析不同用戶行為的差異性,該研究可有效的幫助遠(yuǎn)程教育工作者一定程度上提高用戶學(xué)習(xí)效率,提升遠(yuǎn)程教育用戶學(xué)習(xí)質(zhì)量。
參考文獻(xiàn):
[1]張堯?qū)W.高?,F(xiàn)代遠(yuǎn)程教育調(diào)查與思考[J].中國(guó)遠(yuǎn)程教育,2004(08X):18-22.
[2]韋進(jìn).現(xiàn)代遠(yuǎn)程教育條件下學(xué)習(xí)支持服務(wù)系統(tǒng)建設(shè)的實(shí)踐和探索[J].現(xiàn)代遠(yuǎn)距離教育,2002,2:31-33.
[3]章東飛.試析我國(guó)遠(yuǎn)程教育發(fā)展現(xiàn)狀與存在問題[J].成人教育,2010(012):50-51.
[4]蔣立兵,于凌云.遠(yuǎn)程教育發(fā)展現(xiàn)狀與存在的問題分析[J].教育技術(shù)導(dǎo)刊,2006(1):41-42.
[5]施志毅.從教育服務(wù)的市場(chǎng)機(jī)制選擇談現(xiàn)代教育服務(wù)業(yè)發(fā)展中的幾個(gè)問題[J].中國(guó)遠(yuǎn)程教育,2007(11S):22-24.
[6]Han-Ching Wu,Shou-Hsuan,Stephen Huang.User Behavior Analysis in Masquerade Detection Using Principal Conponent Analysis.8th Internationl Comference on Intelligent Systems Design and Applications.2009.