国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于情境感知的學習資源關(guān)聯(lián)分析與推薦模型研究

2017-03-28 09:24吳笛李保強
中國遠程教育 2017年2期
關(guān)鍵詞:關(guān)聯(lián)分析數(shù)據(jù)挖掘

吳笛+李保強

【摘 要】

向?qū)W習者推薦情境敏感的學習資源與學習路徑,能夠有效降低學習者在互聯(lián)網(wǎng)遠程教育中的時間成本,并且?guī)椭涮岣邔W習效率、增強學習興趣、優(yōu)化學習效果。然而學習資源的組織結(jié)構(gòu)比較復雜,資源關(guān)系存在孤立化的問題。如何基于當前學習情境采用合適的感知技術(shù)和關(guān)聯(lián)分析方法,推薦恰當?shù)膫€性化學習內(nèi)容是一個非常關(guān)鍵的問題。本研究提出結(jié)合情境感知技術(shù)和多層次、多關(guān)系的關(guān)聯(lián)算法來實現(xiàn)學習資源的個性化推薦,探索基于情境感知的行為特征分析和提取流程,詳細闡述了基于情境描述和關(guān)聯(lián)推薦的機制,以期提高個性化學習內(nèi)容推薦的服務質(zhì)量和效果。

【關(guān)鍵詞】 情境感知;關(guān)聯(lián)分析;數(shù)據(jù)挖掘;資源推薦

【中圖分類號】 G434 【文獻標識碼】 A 【文章編號】 1009-458x(2017)02-0059-07

一、引言

隨著移動通信技術(shù)的迅猛發(fā)展和移動設備感知化、智能化、小型化程度的提高,人們逐漸適應了通過隨身攜帶的各類移動終端獲取信息。同時,越來越快的生活節(jié)奏決定了學習者的學習時間呈現(xiàn)碎片化的趨勢,更傾向于利用空閑時間觀看和學習各類微小課程來獲取知識(陳媛嫄, 2012)。在移動智能終端成為學習載體的同時,傳感器網(wǎng)絡、物聯(lián)網(wǎng)以及云計算和大數(shù)據(jù)等最新的信息技術(shù)相互融合,使得學習系統(tǒng)獲取學習者的時間、位置、行為活動更加容易。根據(jù)數(shù)據(jù)利用模型計算事物發(fā)展趨勢的方法和技術(shù)已經(jīng)得到全面發(fā)展,需要遠程學習系統(tǒng)能夠強化情境敏感化的學習資源推送能力。作為智慧學習環(huán)境構(gòu)建的基本策略,情境感知指的是系統(tǒng)主動感知情境變化,根據(jù)用戶的學習需求提供恰當?shù)膶W習資源和服務。在遠程教育領(lǐng)域,網(wǎng)絡教育資源出現(xiàn)了前所未有的爆發(fā)式增長,給學習者提供了海量的資源,資源增長速度過快,造成了學習者的選擇困難,也弱化了不同情境下學習者的學習體驗。智能化的學習資源推送應該具備學習對象排序、學習路徑推薦和學習風格識別等能力,通過數(shù)據(jù)挖掘等大數(shù)據(jù)領(lǐng)域的新技術(shù),提升情境感知改善在線學習體驗的效果。

二、推薦模式

基于情境感知的學習資源智能推薦的推理邏輯基礎(chǔ)是學習者的用戶模型與知識模型之間的關(guān)聯(lián)。用戶模型需要體現(xiàn)學習者的學習風格和認知水平,并且能夠關(guān)聯(lián)具有適應學習者能力的動態(tài)課程內(nèi)容,智能地向用戶推薦最佳學習活動序列和學習資源(Schilit, Adams, & Want, 1994)。這種動態(tài)的學習活動序列生成能夠根據(jù)具體的學習目標、依據(jù)學習者的個性差異修正出一套切實可行的學習方案,實時觀測和分析系統(tǒng)中用戶的學習風格和資源媒體格式的選擇傾向,整合用戶的學習目標、學習任務、操作步驟、交互形式和評價機制等,形成一個有機的、動態(tài)化的學習過程(Wang, Dong, & Chin, 2004)。

情境感知推動學習資源精確推薦的核心是基于規(guī)則分析的資源搜索引擎。引擎的規(guī)則來源需要通過智能裝備感知到學習者所處的情境,然后通過情境特征明確其學習需求。情境感知特征根據(jù)不同的感知軟硬件模塊可以分為不同的種類,最基本的包括各種豐富的物理傳感器信息,通過綜合分析這些特征,生成用戶情境化的信息需求并進行語義化表示,盡可能真實地還原用戶的行為模式和實時場景,并對信息資源的適用情境進行語義化標注,判斷和預測學習者的行為目標,實現(xiàn)精準的信息推薦(Rani & Vyas, 2015)。情境建模的重點是情境上下文的構(gòu)建,首先需要確定的是需要獲取哪些情境要素,基本的學習情境要素可以包括人物屬性、軟硬件數(shù)據(jù)上下文、學習習慣和偏好、當前的學習目的及任務等,然后再根據(jù)要素進行推理,理解學習者的行為模式和當前的意圖,提升面向移動用戶的推薦系統(tǒng)(錢增瑾, 孫東平, 2013)。

隨著學習者在遠程移動學習活動中參與度的增強,用戶情境與學習需求的關(guān)聯(lián)準確度直接決定著學習資源推薦質(zhì)量的高低。而移動用戶自身位置敏感性等特點又要求學習系統(tǒng)的反饋能夠更加及時,相關(guān)的資源推薦能反應學習者的短期興趣及情境變化等。這需要增強自適應學習中有關(guān)情境要素與學習者行為之間關(guān)聯(lián)信息的數(shù)據(jù)挖掘技術(shù),揭示不同用戶不同情境特征與學習資源之間最直接的關(guān)系,探索學習者在自適應學習中的行為規(guī)律,輔助提高學習者的學習效率(如圖1所示)。

三、情境要素的收集與處理

情境要素是表征任何情境實體狀態(tài)的相關(guān)信息元素,包括相關(guān)的人、事物或抽象模型。情境要素的屬性值是具有限定范圍的,屬性之間相互關(guān)聯(lián),并且與具體的環(huán)境或場景緊密聯(lián)系(何軍, 劉紅巖, 杜小勇, 2007)。情境模型的構(gòu)建首先必須確定情境要素的類型與范圍,構(gòu)建的流程并沒有統(tǒng)一的定義,在學習資源推薦系統(tǒng)中對情境要素的界定需要考慮學習者使用的設備和所處的學習環(huán)境,比商業(yè)服務中只對位置和用戶偏好敏感的情境感知更加復雜。學習環(huán)境中情境要素可以從不同的角度進行大致的劃分,從時間維度上可以分為歷史情境和實時情境,還有些情境要素是通過物理傳感設備實時獲取的,更多的要素則是通過數(shù)據(jù)的收集整理歸納得到,所以也可以分為直接情境和間接情境。

情境要素的分類可以參考表1。實時情境基本上來源于物理傳感信息和應用軟件的實時數(shù)據(jù)和使用參數(shù),例如用戶所處的時間、位置、網(wǎng)絡狀況和運動參數(shù),以及正在使用軟件應用的具體行為,包括瀏覽網(wǎng)址,正在學習的課程和網(wǎng)絡社交行為等(徐光祐, 史元春, 謝偉凱, 2003)。歷史情境是非常重要的情境判斷背景因素,例如學習者的身份信息、學習背景和學習偏好可以視為用戶的學習歷史情境,其中一部分身份信息相關(guān)數(shù)據(jù)可以事先錄入到系統(tǒng)中,其他信息則是經(jīng)過長期的歷史數(shù)據(jù)和情境日志分析進行信息過濾和合成而組成的新的情境要素。實時情境的各項數(shù)據(jù)基本上都可以通過歸納整理形成對應的歷史情境,如用戶具有規(guī)律性的位置變化形成用戶的運動路徑情境,運動參數(shù)的變化可以構(gòu)成行為或行動分析的數(shù)據(jù)基礎(chǔ),學習課程的歷史數(shù)據(jù)可以提煉出用戶的學習習慣與興趣偏好等。

隨著數(shù)據(jù)挖掘等新技術(shù)對情境感知智能化的提升,系統(tǒng)對情境數(shù)據(jù)的深入分析能力進一步增強,間接情境逐漸具有重要的地位。如圖2所示,普通的情境要素收集和獲取更多的是直接從原始數(shù)據(jù)進行歸納和推理,而直接獲取的情境要素可以作為數(shù)據(jù)來源構(gòu)成間接情境要素的分析和分類依據(jù)。間接情境的獲取不需要用戶介入,主要通過統(tǒng)計分析、推理規(guī)則或數(shù)據(jù)挖掘的方法從軟硬件環(huán)境中直接獲取的數(shù)據(jù)推理得到用戶的間接情境要素(莫同, 李偉平, 吳中海, 褚偉杰, 2010)。這部分要素是自適應學習資源推送的基礎(chǔ)與支撐,因為它是不會隨著時間改變或者改變很慢的信息,能夠大致圈定用戶所屬的學習風格和學習資源的推薦范圍;而直接情境要素對于精確定位用戶的實時需求起著關(guān)鍵作用,兩者共同構(gòu)成自適應學習資源推薦中情境模型建立的基礎(chǔ)。

四、情境描述與推理

1. 推理過程

為實現(xiàn)情境感知的信息服務自適應個性化,首先必須識別獲取用戶當前的實時情境信息,再根據(jù)歷史情境進行推理判斷,獲取用戶的學習目標和最佳的學習方式,這不是通過簡單直接的方式就能確定的,需要對學習者的行為進行動態(tài)采集、分析和評價三個階段(童恩棟, 2011)。首先跟蹤和分析自適應學習資源推薦系統(tǒng)中學習者學習的過程,建立學習者行為模型,然后根據(jù)收集的學習行為歷史數(shù)據(jù),采用關(guān)聯(lián)分析和數(shù)據(jù)挖掘的方法尋求情境數(shù)據(jù)與學習資源知識庫之間的聯(lián)系,構(gòu)建動態(tài)關(guān)聯(lián)模型。其中動態(tài)關(guān)聯(lián)是指在不同的情境空間和時間維度上,不同的情境要素具有不同的權(quán)重和相關(guān)系數(shù),需要根據(jù)學習者的實時反饋和學習效果形成評估結(jié)果,對個性化的學習資源進行檢索和動態(tài)的推薦。

過去的情境描述與推理模型大部分是在本體構(gòu)建和語義檢索的基礎(chǔ)上建立的,這種情境推理的個性化學習服務方法一般至少需要構(gòu)建兩個情境本體:用戶情境本體和知識本體,同時還需要建立用戶情境到知識推薦之間的推理規(guī)則,由推理規(guī)則生成適應不同情境的具體推理規(guī)則實例,最后形成通過用戶具體的情境狀態(tài)推理出滿足其情境期望的服務集合的資源推薦過程(Premlatha & Geetha, 2015)。這種方法能夠清晰地描述情境元素以及精確地定位知識本體數(shù)據(jù)資源,因為事先已經(jīng)通過本體相關(guān)的推理工具完成了知識庫的構(gòu)建。但這種推理過程必須建立在前期大量的數(shù)據(jù)分析和準備工作之上,包括本體元素的描述約束和知識庫的本體化構(gòu)建等,雖然有將模糊的情境信息精確化的優(yōu)點,但是數(shù)據(jù)的預處理非常繁雜,難以滿足大規(guī)模學習資源數(shù)據(jù)集搜索的需要。為了避免大量的本體描述和標注工作,目前更傾向于采用大數(shù)據(jù)技術(shù)的相關(guān)數(shù)據(jù)挖掘處理方法來構(gòu)建關(guān)聯(lián)模型,使用過濾、分類、聚類、關(guān)聯(lián)、序列分析等方法實現(xiàn)情境數(shù)據(jù)到知識推送的邏輯推理過程(趙宏, 陳麗, 趙玉婷, 2015)。

2. 情境特征提取

首先需要關(guān)注的是用戶情境特征的表示,給定情境數(shù)據(jù)時間序列,其中表示一個情境片段,每個片段包含了該時間點采集的所有情境要素數(shù)值,相鄰的情境片段具有相似的情境要素(陳毅波, 2012)。由于不同學習者在學習的不同階段會有不同的情境切換模式,因此我們需要利用情境數(shù)據(jù)的內(nèi)在統(tǒng)計相關(guān)特性,對情境數(shù)據(jù)進行分類,提取情境會話的關(guān)鍵特征。

由于情境數(shù)據(jù)的維度是相對固定的,情境特征的多維數(shù)據(jù)正好構(gòu)成向量表達,而多維向量可以放置到多維空間中,通過計算多維空間的余弦距離或歐氏距離形成情境之間的關(guān)系,然后通過聚類算法提取和描述用戶的關(guān)鍵特征。目前,主流的聚類算法有很多,包括基于劃分的聚類算法、基于密度的聚類算法和基于流的聚類算法(吳鵬飛, 余勝泉, 2015)。因為不同用戶學習情境的差別可能會很大,所以需要根據(jù)不同的場景選擇合適的聚類規(guī)模參數(shù)。以常用的K-means聚類算法為例,提取情境特征時向量之間的差異值計算公式可以為:

式(1)中為情境要素類型,表示情境會話向量和在情境要素上的差異值,表示向量和在上的指示項,表示在情境要素的取值,的計算如下:

通過K-means對情境會話聚類的細節(jié)描述如下:首先根據(jù)情境要素的取值頻率和大致范圍確定情境會話的初始數(shù)量K,即期望的情境種類的個數(shù)。在數(shù)據(jù)稀疏或者缺少歷史數(shù)據(jù)的情況下,可以先大致確定一個初始數(shù)值,再根據(jù)初步的聚類結(jié)果迭代改進K的取值范圍。接下來隨機選取K個中心節(jié)點,計算其他情境會話最近的中心節(jié)點,獲得相同的簇標識,最終得到新的每個聚類的質(zhì)心。該過程需要不停地迭代,直到聚類結(jié)果穩(wěn)定或者達到迭代閾值次數(shù)(魏欣楠, 郝忠孝, 2009)。每一個情境會話聚類共同反映了一類學習情境,可以將該聚類作為數(shù)據(jù)源來提取用戶情境的描述。

五、關(guān)聯(lián)分析與推薦

情境與行為的關(guān)聯(lián)分析最主要的目的是根據(jù)學習者目前所處的情境在學習資源庫中搜索并返回最適合的資源提供給他們使用。關(guān)聯(lián)分析的數(shù)據(jù)檢索過程是動態(tài)的,它會根據(jù)每一次推薦結(jié)果的使用狀況對自身的關(guān)聯(lián)數(shù)據(jù)進行反饋和修正,同時它也會根據(jù)使用者的學習背景和偏好自動適應。與推薦相關(guān)的數(shù)據(jù)挖掘算法有很多,包括協(xié)同過濾算法和關(guān)聯(lián)分析算法等。

1. 關(guān)聯(lián)規(guī)則分析

學習資源的關(guān)聯(lián)規(guī)則發(fā)現(xiàn)是將學習者使用的學習資源具體類型和順序構(gòu)成一個學習會話,通過關(guān)聯(lián)規(guī)則挖掘情境會話與學習會話之間的關(guān)系,并按照一定的支持度和置信度提取和保留有用的規(guī)則進行學習推薦應用。關(guān)聯(lián)規(guī)則挖掘一般被用來描述數(shù)據(jù)項之間關(guān)系的規(guī)則,即某些項可能會同時出現(xiàn)在一個事務中(楊現(xiàn)民, 余勝泉, 張芳, 2013)。關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘一般分為兩步:第一步是從數(shù)據(jù)集合中找出所有的頻繁項集(Frequent ItemSets),第二步是根據(jù)頻繁項集分析得到關(guān)聯(lián)規(guī)則(Association Rules)。

關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘有兩種,最基本的是針對單層關(guān)系的數(shù)據(jù)集分析。其流程為:假設為一個或一個以上的項目組成的集合,稱為項目集,事務(Transaction)是的非空子集,即,關(guān)聯(lián)形式表現(xiàn)為的蘊涵式。其中且,和分別稱為關(guān)聯(lián)規(guī)則的先導和后繼,關(guān)聯(lián)規(guī)則在D中的支持度(support)為D中事務包含的百分比,置信度(confidence)是包含X的事務中同時包含Y的百分比。如果數(shù)據(jù)結(jié)果的支持度和置信度均超過閾值,則認為該關(guān)聯(lián)規(guī)則有效(白云龍, 2014)。

以表2為例,學習資源的項集。對于關(guān)聯(lián)規(guī)則:,支持度support,置信度confidence。若給定最小支持度和最小置信度均為0.5,即可以認為與之間存在關(guān)聯(lián)。

關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘算法有很多,其中最基本的無監(jiān)督學習算法為Apriori算法,該算法屬于單維、單層的關(guān)聯(lián)規(guī)則挖掘算法,主要利用了頻繁項集的非空子集也是頻繁的先驗性質(zhì)。算法的主要過程為:首先掃描數(shù)據(jù)庫,確定各“1項集”的支持度,篩選滿足最小支持度的集合L1,L1用于找頻繁“2項集”的集合L2,以此類推,直到因為無法滿足最小支持度要求而不能產(chǎn)生頻繁項集為止。

Apriori算法的改進有很多,例如增加抽樣(Sampling)技術(shù)、分區(qū)(PARTITION)算法和DHP(Direct-Hush and Prune)算法等,提高了算法的計算效率,以及泛化關(guān)聯(lián)規(guī)則和周期性關(guān)聯(lián)規(guī)則等。

2. 多層關(guān)聯(lián)規(guī)則分析

針對單層的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘只能發(fā)現(xiàn)學習資源庫內(nèi)部的各項關(guān)聯(lián),如果要考察情境向量實體與學習資源之間的關(guān)聯(lián),還要涉及多層關(guān)聯(lián)規(guī)則。采用多層關(guān)聯(lián)規(guī)則可以有效地發(fā)現(xiàn)情境因素與學習者學習偏好之間的隱藏關(guān)系,協(xié)助系統(tǒng)自動生成知識學習序列,提高資源推薦的精度。多層關(guān)聯(lián)規(guī)則挖掘的研究一般針對基于星型數(shù)據(jù)模式(multi-dimensional data model)的數(shù)據(jù)庫,處于核心的稱之為事實表(fact table),并且有多個維表(dimensional table)與事實表通過外鍵關(guān)聯(lián),與事實表形成一對多的聯(lián)系(王衛(wèi)軍, 2015)。事實表一般只包含外鍵關(guān)系,如果還有其他屬性,可以分離出來形成單獨的維度表(如圖3所示)。

從圖3所示的數(shù)據(jù)表中可以得出支持度和置信度為:

Support(Address=University→Prefer=Logistics)=4/7

Confidence(Address=University→Prefer=Logistics)=4/5

假設最小支持度和最小置信度都超過閾值1/2,可以得到符合要求的關(guān)聯(lián)規(guī)則:

Address=University → Prefer=Logistics

3. 基于ILP的多關(guān)系關(guān)聯(lián)規(guī)則分析

歸納邏輯程序設計(ILP)是機器學習與邏輯程序設計的交叉研究領(lǐng)域。歸納邏輯程序設計使用了一階邏輯框架,將傳統(tǒng)的單表關(guān)聯(lián)規(guī)則挖掘算法更好地擴展到了多表情況。ILP在多關(guān)系環(huán)境下使用一階謂詞邏輯語言表示機制,通常利用Prolog語言,在其形式化系統(tǒng)中允許在一個模式中使用多個變量與關(guān)系,為機器學習提供了更深入的理論和方法,從而克服了描述能力和背景知識利用的限制(寶騰飛, 2012)。在ILP中,所有的表達式由常量、變量、謂詞符號和函數(shù)符號組成,這些符號可以組成項、句節(jié)和子句等表達式。關(guān)聯(lián)規(guī)則是一組具有類似X←Y的形式的語句,其中X、Y均由一組謂詞組成。如果元組給每一變量賦值后使謂詞取值為真的就是支持本謂詞的元組,而同時滿足關(guān)聯(lián)規(guī)則箭頭兩端的謂詞的元組就是關(guān)聯(lián)規(guī)則的支持元組。

以如圖4所示的數(shù)據(jù)庫為例,這是一個由表student、prefer、where、study組成的多維關(guān)系型數(shù)據(jù)庫,每個表所代表的關(guān)系用謂詞的形式可以表示為:student(name)、prefer (name, subject)、 where (name, address, time)、study (name,subject)。對于該數(shù)據(jù)庫,某個position與subject的關(guān)聯(lián)規(guī)則以Prolog查詢形式可以表現(xiàn)為:

Student(name), prefer(name, Y), where(name,X, time) →study(name, X, Y)

當且僅當該查詢返回非空解時,稱這個查詢符合數(shù)據(jù)庫D。對于一個特定的數(shù)據(jù)庫,每一個謂詞的支持度計算公式為:

支持度= 符合這個謂詞的元組數(shù)/所有的元組數(shù)

一個關(guān)聯(lián)規(guī)則的支持度為:

支持度=同時符合條件謂詞和結(jié)果謂詞的元組數(shù)/符合條件謂詞的元組數(shù)。

實體表中的某一個屬性值是否為真,或者關(guān)系表中某一種關(guān)系是否成立均可以轉(zhuǎn)換為一種謂詞,然后根據(jù)所關(guān)注的謂詞和相應的形式,過濾出那些支持度小于最小支持度閾值的謂詞組合,得到符合要求的關(guān)聯(lián)規(guī)則。

基于ILP 的技術(shù)挖掘多表關(guān)聯(lián)規(guī)則的典型算法有WARMR 和 FARMER。這類算法使用邏輯原子的方式取代Apriori算法中的項集,使用基于邏輯的DATALOG數(shù)據(jù)查詢語言實現(xiàn)對數(shù)據(jù)的演繹推理,通過分層迭代的方法找到大于閾值的候選集合關(guān)聯(lián)規(guī)則。以WARMR算法為例,該算法采用寬度優(yōu)先的分層方法查找頻繁Prolog 查詢,首先使用具體化算子和剪枝操作層層迭代產(chǎn)生候選項集,然后通過計算候選查詢的支持度確定頻繁項集,整個迭代過程持續(xù)到?jīng)]有新頻繁查詢出現(xiàn)時終止。基于ILP的多關(guān)系關(guān)聯(lián)規(guī)則分析算法具有更強的知識表達能力與更大的搜索空間,但在查詢速度優(yōu)化和海量數(shù)據(jù)處理能力上還有不足,近幾年來已經(jīng)有一些性能更高、伸縮性更強的方法被相繼提出。

4. 推薦的產(chǎn)生

通過不同層次的關(guān)聯(lián)規(guī)則挖掘之后,即可以根據(jù)情境會話的狀態(tài)對學習者產(chǎn)生推薦。推薦的產(chǎn)生是以“支持—置信”為基礎(chǔ)的,首先根據(jù)不同推薦內(nèi)容的需要進行數(shù)據(jù)清理,過濾掉一些相對稀疏的數(shù)據(jù)和冷門的學習資源,然后根據(jù)關(guān)聯(lián)規(guī)則的支持度和置信度等參數(shù)和相應的閾值進行剪枝,把低于最小值的規(guī)則扔掉,最后按照置信度降序排序,Top-N即為當前情境最合適的學習資源?;谇榫掣兄年P(guān)聯(lián)規(guī)則的挖掘最重要的是數(shù)據(jù)粒度的合適程度,并非數(shù)據(jù)粒度和分辨率越高效果越好,因為情境會話或者學習資源的分類如果過于細致,容易造成數(shù)據(jù)過于稀疏,數(shù)據(jù)干擾較大,在數(shù)據(jù)挖掘時無法形成有效的數(shù)據(jù)關(guān)聯(lián)。

六、模型的局限性和適用范圍

在數(shù)據(jù)挖掘的各類關(guān)聯(lián)分析方法中,多關(guān)系關(guān)聯(lián)規(guī)則的提取是比較重要的一種無監(jiān)督學習方法,關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)也是整個算法流程中最為關(guān)鍵且最耗時的步驟,因此,使用該模型形成個性化推薦有一些前提條件以保證數(shù)據(jù)的可靠性和準確性。

1. 在處理數(shù)據(jù)前,需要保證對業(yè)務邏輯和數(shù)據(jù)關(guān)系的充分理解以及明確目標規(guī)則提取的范圍,設定合理的支持度等查詢參數(shù)大小。由于關(guān)聯(lián)規(guī)則的提取是無監(jiān)督的,使用DATALOG數(shù)據(jù)查詢語言對數(shù)據(jù)的演繹推理能夠發(fā)現(xiàn)滿足條件的關(guān)聯(lián)規(guī)則,但它不能判定關(guān)聯(lián)規(guī)則的實際意義。在系統(tǒng)分析提取的關(guān)聯(lián)規(guī)則當中,可能出現(xiàn)主觀上認為沒有多大關(guān)系的數(shù)據(jù),它們之間的關(guān)聯(lián)規(guī)則支持度和可信度卻很高,這需要數(shù)據(jù)分析人員具有足夠豐富的業(yè)務經(jīng)驗對數(shù)據(jù)有深入的理解,從各個角度判斷不同關(guān)聯(lián)規(guī)則內(nèi)在的合理性;反之,可能有主觀上認為關(guān)系密切的物品,結(jié)果卻顯示它們之間相關(guān)性不強。只有很好地理解業(yè)務邏輯和關(guān)聯(lián)規(guī)則的意義,才能合理地調(diào)整支持度和可信度等相關(guān)參數(shù),提高關(guān)聯(lián)規(guī)則數(shù)據(jù)分析的準確性。

2. 在處理大數(shù)據(jù)時,DATALOG數(shù)據(jù)查詢算法的效率仍有待提高。與傳統(tǒng)數(shù)據(jù)挖掘比較,多關(guān)系數(shù)據(jù)挖掘要搜索的假設空間變得更大,模式語言強大的表達能力使它相對于數(shù)據(jù)庫查詢語句需要花費更高昂的計算代價。目前,雖然也有一些分布式的并行計算方法,但由于數(shù)據(jù)的分區(qū)通常是不對稱的,如何克服分布式計算間的數(shù)據(jù)傳輸效率是一個亟待解決的問題。本文采用了聚類方法盡可能地提高模型處理大規(guī)模數(shù)據(jù)和高維數(shù)據(jù)的能力,但是現(xiàn)實數(shù)據(jù)通常是很復雜的,會有數(shù)據(jù)噪聲的產(chǎn)生,即在一組數(shù)據(jù)中無法解釋的數(shù)據(jù)變動和一些不和其他數(shù)據(jù)相一致的數(shù)據(jù)。因此,如何有效地消除噪聲的影響,提高處理現(xiàn)實數(shù)據(jù)的能力,還有待進一步提高。

3. 關(guān)聯(lián)規(guī)則與其他推薦算法的融合及比較。數(shù)據(jù)分類、關(guān)聯(lián)規(guī)則挖掘和推薦算法之間有一些基本的差別,關(guān)聯(lián)規(guī)則不涉及預測,也不用提供防止低于或超過給定支持度的機制。然而,如何將關(guān)聯(lián)規(guī)則與其他推薦算法進行融合,揚長避短,解決傳統(tǒng)算法無法解決的實踐問題,也是有待研究與探討的。

七、結(jié)語

本文探討了個性化學習資源推薦中的情境作用機制,明確了情境感知特征要素的類型和特征,梳理了直接情境和間接情境的轉(zhuǎn)換過程。在情境感知的分析理論基礎(chǔ)之上,提出了一個情境敏感的學習資源關(guān)聯(lián)分析與推薦參考模型,并對其中的情境要素的數(shù)據(jù)處理、特征提取和規(guī)則分析等關(guān)鍵環(huán)節(jié)進行了深入的分析,探討了如何將情境元素融入到各類資源推薦算法中。在以后的研究中,將圍繞自適應個性化服務的用戶模型和知識模型展開更深入的研究,探析動態(tài)環(huán)境下情境推理的方法等,并對具體的算法流程作進一步的實證研究和比較分析。

[參考文獻]

白云龍. 2014. 基于Hadoop的數(shù)據(jù)挖掘算法研究與實現(xiàn)[D]. 北京:北京郵電大學.

寶騰飛. 2012. 面向移動用戶數(shù)據(jù)的情境識別與挖掘[D]. 合肥:中國科學技術(shù)大學.

陳毅波. 2012. 基于關(guān)聯(lián)數(shù)據(jù)和用戶本體的個性化知識服務關(guān)鍵技術(shù)研究[D]. 武漢:武漢大學.

陳媛嫄. 2012. 基于活動的情境感知模型與情境感知交互設計[D]. 大連:大連海事大學.

何軍,劉紅巖,杜小勇. 2007. 挖掘多關(guān)系關(guān)聯(lián)規(guī)則[J]. 軟件學報(11): 2752-2765.

莫同,李偉平,吳中海,褚偉杰. 2010. 一種情境感知服務系統(tǒng)框架[J]. 計算機學報(11):2084-2092.

錢增瑾,孫東平. 2013. 數(shù)據(jù)挖掘在研究生教育管理信息系統(tǒng)中的應用[J]. 學位與研究生教育(5):46-49.

童恩棟. 2011. 物聯(lián)網(wǎng)情景感知技術(shù)研究[J]. 計算機科學(4):9-16.

王衛(wèi)軍. 2015. 高校圖書館情景敏感服務及其情景模型構(gòu)建[J]. 情報理論與實踐(2):88-92.

魏欣楠,郝忠孝. 2009. 多關(guān)系數(shù)據(jù)庫中的關(guān)聯(lián)規(guī)則挖掘[J]. 自動化技術(shù)與應用(3):41-43.

吳鵬飛,余勝泉. 2015. 語義網(wǎng)教育應用研究新進展:關(guān)聯(lián)數(shù)據(jù)視角[J]. 電化教育研究(7):66-72.

徐光祐,史元春,謝偉凱. 2003. 普適計算[J]. 計算機學報(9):1042-1050.

楊現(xiàn)民,余勝泉,張芳. 2013. 學習資源動態(tài)語義關(guān)聯(lián)的設計與實現(xiàn)[J]. 中國電化教育(1):70-75.

趙宏,陳麗,趙玉婷. 2015. 基于學習風格的個性化學習策略指導系統(tǒng)設計[J]. 中國電化教育(5):67-72.

Premlatha, K. R., & Geetha, T. V. 2015. Learning content design and learner adaptation for adaptive e-learning environment. Artificial Intelligence Review: 1-23.

Rani, M., & Vyas, O. P. 2015. An ontology-based adaptive personalized e-learning system, assisted by software agents on cloud storage. Knowledge-Based Systems, (10): 33-48.

Schilit, B., Adams, N., & Want, R. 1994. Context-aware computing applications. IEEE workshop on Mobile Computing Systems and Applications: 85-90.

Wang Xiaohang, Dong Jinsong, & Chin, C. Y. 2004. Semantic Space: An Infrastructure for Smart Spaces. IEEE Pervasive Computing, 3(3): 32-39.

猜你喜歡
關(guān)聯(lián)分析數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
玉米骨干親本及其衍生系中基因的序列變異及與株高等性狀的關(guān)聯(lián)分析
玉米骨干親本及其衍生系中基因的序列變異及與株高等性狀的關(guān)聯(lián)分析
基于隨機函數(shù)Petri網(wǎng)的系統(tǒng)動力學關(guān)聯(lián)分析模型
關(guān)聯(lián)分析技術(shù)在學生成績分析中的應用
基于關(guān)聯(lián)分析的學生活動參與度與高校社團管理實證研究
不同的數(shù)據(jù)挖掘方法分類對比研究
一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
數(shù)據(jù)挖掘的分析與探索
正定县| 沭阳县| 元阳县| 青河县| 崇文区| 盐津县| 孝感市| 白城市| 丁青县| 石门县| 乌鲁木齐县| 延边| 繁昌县| 华坪县| 泰来县| 仁化县| 灵武市| 井冈山市| 赤水市| 色达县| 黄骅市| 原平市| 买车| 前郭尔| 伊吾县| 油尖旺区| 犍为县| 阿拉善右旗| 阿拉善左旗| 鄂尔多斯市| 达拉特旗| 尼木县| 东源县| 昌乐县| 舟曲县| 小金县| 宁乡县| 靖远县| 搜索| 芷江| 桃园县|