摘要:針對高校計算機課程體系復雜性和多樣性的特點,文章提出了一種基于知識圖譜的構建與可視化方法。文章闡述了知識圖譜構建的關鍵環(huán)節(jié),包括數(shù)據(jù)來源與處理、模式層構建以及數(shù)據(jù)層構建,并介紹了基于Neo4j圖數(shù)據(jù)庫的知識圖譜可視化技術。最后,通過實例展示了高校計算機課程體系的可視化效果,為課程體系的分析和優(yōu)化提供了有力工具。
關鍵詞:計算機課程體系;知識圖譜;可視化;Neo4j
中圖分類號:TP311 文獻標識碼:A
文章編號:1009-3044(2024)23-0089-03
開放科學(資源服務)標識碼(OSID)
0 引言
在信息時代背景下,高校計算機課程體系作為培養(yǎng)計算機專業(yè)人才的重要基石,其復雜性和多樣性日益凸顯。隨著計算機技術的快速發(fā)展和教育理念的更新,傳統(tǒng)的課程體系構建方法在某些方面已難以滿足當前教育需求。具體而言,傳統(tǒng)的課程體系往往缺乏系統(tǒng)性、動態(tài)性和可視化表達,難以全面、直觀地展示課程之間的邏輯關系、前后關系以及整體架構,在一定程度上限制了學生和教師對課程知識的理解和掌握。近年來,知識圖譜在教育領域展現(xiàn)出巨大的潛力,其本質(zhì)是通過圖的數(shù)據(jù)結(jié)構來展示信息,節(jié)點代表實體,邊代表實體之間的關系,使得知識圖譜能夠直觀、全面地展示復雜的知識體系,具有結(jié)構化、可擴展性和可查詢性等特點,使得其在教育領域具有廣泛的應用價值。通過構建課程體系知識圖譜,可以清晰地展示課程之間的邏輯關系、前后關系以及整體架構,為教師和學生提供更好的教學和學習支持。因此,本研究聚焦于高校計算機課程體系知識圖譜的構建及可視化展示,力求構建一個全面、準確的高校計算機課程體系知識圖譜,以期為高校計算機課程體系的優(yōu)化和發(fā)展提供參考。
1 知識圖譜概述
知識圖譜作為一種新興的數(shù)據(jù)組織和表示方式,其本質(zhì)是一個語義網(wǎng)絡,旨在描述客觀世界中的概念、實體、事件及其之間的關系,并對這些信息進行語義建模。知識圖譜通過圖的數(shù)據(jù)結(jié)構來展示信息,節(jié)點代表實體,邊則代表實體之間的關系,使得知識圖譜能夠直觀、全面地展示復雜的知識體系[1]。知識圖譜的構建是一個多步驟的過程,主要包括數(shù)據(jù)收集、實體識別、關系抽取、知識融合與去重等環(huán)節(jié)。
知識圖譜的特點在于其結(jié)構化、可擴展性和可查詢性。結(jié)構化使得知識圖譜能夠清晰地展示實體之間的關系,便于理解和利用;可擴展性則允許研究者根據(jù)需求不斷擴展知識圖譜的內(nèi)容;可查詢性則使得用戶能夠方便地查詢和獲取所需的信息。在教育領域,知識圖譜的應用尤為廣泛,通過構建課程體系知識圖譜,可以直觀地展示課程之間的邏輯關系、前后關系以及整體架構。
2 高校計算機課程體系知識圖譜的構建
2.1 數(shù)據(jù)層構建
在構建高校計算機課程體系知識圖譜的過程中,保證數(shù)據(jù)來源可靠與準確是為了全面反映高校計算機課程體系,所以要從多個渠道收集相關數(shù)據(jù),主要包括國內(nèi)外代表性高校的官方網(wǎng)站、課程管理系統(tǒng)、教學大綱和培養(yǎng)方案等。
2.1.1 確定數(shù)據(jù)來源
國內(nèi)外具有代表性的高校作為數(shù)據(jù)源,這些高校在計算機科學領域具有較高的學術聲譽和豐富的教學資源,其課程體系能夠代表國內(nèi)外先進水平。通過訪問各高校的官方網(wǎng)站和課程管理系統(tǒng),獲取最新的課程大綱、教學計劃、授課教師信息等數(shù)據(jù)。
2.1.2 數(shù)據(jù)預處理
由于收集到的數(shù)據(jù)格式各異、內(nèi)容繁雜,因此在進行知識圖譜構建之前,需要對原始數(shù)據(jù)進行預處理[2]。數(shù)據(jù)預處理主要包括以下幾個步驟:①數(shù)據(jù)清洗。去除重復、錯誤或無關的數(shù)據(jù)項,確保數(shù)據(jù)的唯一性和準確性。例如,在處理課程名稱時,需要統(tǒng)一命名規(guī)則,避免同一門課程因命名不同而被識別為多個實體。②數(shù)據(jù)格式化。將不同來源的數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的格式,便于后續(xù)處理和存儲。例如,將文本格式的教學大綱轉(zhuǎn)換為結(jié)構化的XML或JSON格式,以便于提取實體和關系。③數(shù)據(jù)規(guī)范化。對數(shù)據(jù)進行標準化處理,確保不同來源的數(shù)據(jù)在語義上保持一致。例如,對于授課教師的姓名,需要統(tǒng)一規(guī)范為“姓+名”的格式,避免出現(xiàn)因姓名書寫不一致而導致的實體識別錯誤。
2.2 模式層構建
針對高校計算機課程體系知識圖譜的構建,需要設計合理的模式層結(jié)構來描述課程體系中的各個要素及其之間的關系。
2.2.1 定義實體類型與關鍵屬性
在高校計算機課程體系中,實體主要包括高校、課程、教師等,為了全面描述這些實體,需要定義它們的關鍵屬性。高校實體的關鍵屬性包括高校名稱、所在地區(qū)、辦學層次等,用于標識不同高校及其在知識圖譜中的位置;課程實體的關鍵屬性包括課程名稱、課程編號、課程類型(必修/選修)、學時、學分、授課教師等,用于詳細描述每門課程的基本信息及其在課程體系中的地位和作用;教師實體的關鍵屬性包括教師姓名、職稱、研究方向等,用于標識授課教師的身份和特長,以便學生了解教師的背景和教學特點[3]。
2.2.2 定義關系類型
在高校計算機課程體系中,實體之間的關系主要包括高校與課程的關系、課程與課程之間的關系以及課程與教師之間的關系等。為了準確描述這些關系,需要定義相應的關系類型(如表1所示)。其中高校與課程的關系為“開設”關系,表示某所高校開設了某門課程,用于連接高校實體和課程實體,反映高校在課程體系中的主體地位;課程與課程的關系為“先修”關系、“并行”關系和“后續(xù)”關系等,用于描述課程之間的學習順序和邏輯依賴關系。例如,“數(shù)據(jù)結(jié)構”是“算法設計與分析”的先修課程,表示學生在學習“算法設計與分析”之前需要先掌握“數(shù)據(jù)結(jié)構”的相關知識;課程與教師的關系是“授課”關系,表示某門課程由某位教師負責授課,用于連接課程實體和教師實體,反映教師在課程體系中的教學角色。
2.2.3 使用RDF三元組形式表示實體、屬性和關系
RDF是一種用于描述網(wǎng)絡資源及其關系的標準數(shù)據(jù)模型,由節(jié)點(表示實體或概念)和邊(表示關系)組成。在定義了實體類型、關鍵屬性和關系類型之后,可以使用資源描述框架(RDF) 三元組的形式來表示這些實體、屬性和關系[4]。在高校計算機課程體系知識圖譜中,每個實體和關系都可以表示為一個RDF三元組(如圖1所示)。通過這種方式,可以將高校計算機課程體系中的各個要素及其之間的關系以結(jié)構化的形式表示出來,為后續(xù)的知識圖譜構建和可視化展示奠定基礎。
2.3 數(shù)據(jù)層構建
數(shù)據(jù)層是知識圖譜的實際存儲層,包含圖譜中所有的實體、關系及屬性值等信息。在高校計算機課程體系知識圖譜的構建過程中,數(shù)據(jù)層的構建主要包括數(shù)據(jù)導入與存儲、實體與關系抽取以及知識融合與去重等步驟。
2.3.1 數(shù)據(jù)導入與存儲
將經(jīng)過預處理的數(shù)據(jù)導入到知識圖譜的存儲系統(tǒng)中,以便后續(xù)的處理和查詢。選擇Neo4j圖數(shù)據(jù)庫作為存儲工具,能夠高效地存儲和查詢圖結(jié)構數(shù)據(jù),并支持復雜的數(shù)據(jù)關系表示和查詢操作。在數(shù)據(jù)導入過程中,需要將預處理后的數(shù)據(jù)集轉(zhuǎn)換為Neo4j能夠識別的格式(如CSV文件),并利用Neo4j提供的導入工具將數(shù)據(jù)批量導入到數(shù)據(jù)庫中,導入完成后就可以在Neo4j中看到高校計算機課程體系的初步知識圖譜結(jié)構[5]。
2.3.2 實體與關系抽取
實體與關系抽取涉及從原始數(shù)據(jù)中識別出實體和關系,并將其以結(jié)構化的形式表示出來。在高校計算機課程體系知識圖譜的構建過程中,可采用多種技術手段來實現(xiàn)實體與關系的抽取。其一,基于規(guī)則的方法。根據(jù)數(shù)據(jù)的特點制定相應的抽取規(guī)則,如通過正則表達式匹配課程名稱、通過關鍵詞匹配授課教師姓名等,該方法簡單直接,但依賴于人工制定的規(guī)則,無法覆蓋所有數(shù)據(jù)情況[6]。其二,基于機器學習的方法。訓練命名實體識別(NER) 和關系抽?。≧E) 模型來自動識別文本中的實體和關系,可以利用深度學習算法,自動學習文本中的特征表示和模式識別能力,從而提高實體與關系抽取的準確性和泛化能力。然而,這種方法需要大量的標注數(shù)據(jù)來訓練模型,并且模型的性能會受到標注數(shù)據(jù)質(zhì)量和數(shù)量的影響。其三,混合方法。為了兼顧準確性和效率,采用混合方法來實現(xiàn)實體與關系的抽取,即首先利用基于規(guī)則的方法進行初步抽取,然后再利用基于機器學習的方法對結(jié)果進行修正和優(yōu)化,可以在保證準確性的同時提高抽取效率。
2.3.3 知識融合與去重
由于數(shù)據(jù)來源多樣且可能存在重復和沖突的情況,因此在構建知識圖譜之前,需要進行知識融合與去重處理。在高校計算機課程體系知識圖譜的構建過程中,可采用以下幾種方法進行知識融合與去重處理:①實體對齊。針對不同數(shù)據(jù)源中出現(xiàn)的相同或相似實體(如課程名稱相同但編號不同的課程實體),運用實體對齊技術將它們鏈接到同一個實體節(jié)點上,避免在知識圖譜中出現(xiàn)重復的實體節(jié)點并減少冗余信息。②屬性整合。針對同一個實體在不同數(shù)據(jù)源中出現(xiàn)的不同屬性值(如授課教師姓名書寫不一致的情況),運用屬性整合技術將它們合并為一個統(tǒng)一的屬性值表示形式,確保實體屬性的準確性和一致性,方便后續(xù)的數(shù)據(jù)查詢和分析操作。③沖突解決。針對不同數(shù)據(jù)源中出現(xiàn)的沖突信息(如課程學時在不同數(shù)據(jù)源中表示不一致的情況),可制定相應的沖突解決規(guī)則,選擇其中一個可靠的數(shù)據(jù)源作為權威數(shù)據(jù)源,并優(yōu)先使用其提供的信息來構建知識圖譜,從而減少因數(shù)據(jù)沖突而導致的不確定性和錯誤。
3 高校計算機課程體系知識圖譜的可視化展示
3.1 可視化技術選擇與實現(xiàn)
在高校計算機課程體系知識圖譜的構建中,可選擇Neo4j圖數(shù)據(jù)庫來實現(xiàn)知識圖譜的可視化展示。Neo4j作為NoSQL圖數(shù)據(jù)庫,專為處理具有復雜關系的數(shù)據(jù)而設計,主要基于圖形結(jié)構來存儲數(shù)據(jù),能夠高效地存儲和查詢實體之間的關系,非常適合用于構建和展示知識圖譜。Neo4j提供了豐富的圖形查詢語言Cypher,使得數(shù)據(jù)查詢和可視化變得直觀和便捷。同時,Neo4j圖數(shù)據(jù)庫內(nèi)置了強大的可視化工具如(Neo4j Browser) ,用戶能夠直接通過Web界面查看和交互圖形數(shù)據(jù)[7]。隨著數(shù)據(jù)量的增長和需求的變化,可視化系統(tǒng)需要具備良好的可擴展性和靈活性,Neo4j圖數(shù)據(jù)庫支持分布式部署和水平擴展,能夠應對大規(guī)模數(shù)據(jù)的可視化需求,同時Neo4j的圖形查詢語言Cypher提供了靈活的查詢能力,使得用戶可以根據(jù)不同的需求定制可視化展示方案。
3.2 可視化展示實例與分析
為了更直觀地展示高校計算機課程體系知識圖譜的結(jié)構和特點,可利用Neo4j Browser呈現(xiàn)整個計算機課程體系的架構圖。在這個架構圖中(如圖2所示),課程以節(jié)點的形式表示,課程之間的關系(如先修關系、支撐關系等)以邊的形式表示,不同的節(jié)點和邊通過顏色、大小、形狀等屬性進行區(qū)分,以便于用戶快速識別和理解。例如,基礎課程可以用較大的節(jié)點表示,專業(yè)課程則可以用較小的節(jié)點表示;先修關系可以用實線表示,支撐關系則可以用虛線表示[8]。如此一來,用戶可以清晰地看到不同課程在整個體系中的位置和作用。
在可視化架構圖中,核心課程通常具有較多的連接和較高的中心性,是整個課程體系的基礎和支撐,對于培養(yǎng)學生的核心能力和素質(zhì)具有重要作用。借助Neo4j的圖形查詢語言Cypher,可以輕松地找出這些核心課程并進行高亮顯示,還可以分析課程之間的關鍵路徑,即學生完成學業(yè)所必須經(jīng)歷的一系列課程。在可視化展示中,關鍵路徑可以用粗線或不同顏色表示,以便于用戶識別和跟蹤。除了展示課程體系的結(jié)構外,可視化工具還可以通過比較不同課程的教學單元和知識點之間的相似性,發(fā)現(xiàn)潛在的教學內(nèi)容重復問題。在Neo4j中,可以利用圖形查詢和聚類分析等方法來識別這些重復內(nèi)容,并在可視化展示中進行標注和提示。例如,對于重復出現(xiàn)的教學單元或知識點,可以用相同的顏色或標記進行區(qū)分,并在旁邊附上詳細的重復說明和建議。
4 結(jié)束語
綜上所述,本文通過構建高校計算機課程體系知識圖譜,實現(xiàn)了課程體系的直觀展示和深入分析。研究結(jié)果顯示,知識圖譜技術能夠有效地組織和表示復雜的課程體系,幫助教師和學生更好地理解和掌握課程知識,進而提升教學效果和學習效率。這一研究成果不僅豐富了知識圖譜在教育領域的應用案例,還為高校課程體系的優(yōu)化和改革提供了新的理論和方法支持。展望未來,隨著教育數(shù)據(jù)的不斷積累和知識圖譜技術的持續(xù)發(fā)展,高校計算機課程體系知識圖譜的應用前景將更加廣闊。一方面,可以進一步挖掘知識圖譜在課程體系建設中的潛力,如利用知識圖譜進行課程內(nèi)容的智能關聯(lián)和推薦,幫助教師優(yōu)化課程設計和教學內(nèi)容。另一方面,可以探索將知識圖譜應用于個性化學習路徑推薦等領域,根據(jù)學生的學習需求和背景,為其量身定制合適的學習路徑和資源,從而進一步提升學習效果和滿意度。
參考文獻:
[1] 魏晗,陳剛,郭志剛.課程體系知識圖譜的構建與應用實踐[J].教育教學論壇,2023(20):10-13.
[2] 祝園園,葉茫,彭敏.高校計算機課程體系知識圖譜構建及可視化[J].信息與電腦(理論版),2023,35(4):254-256.
[3] 朱嘉賢,宋向瑛.基于知識圖譜驅(qū)動的程序類課程教育技術研究[J].現(xiàn)代計算機,2021(20):108-112.
[4] 劉佳瑞.基于學科專業(yè)課程知識圖譜的智慧學習資源推薦研究[D].石家莊:河北經(jīng)貿(mào)大學,2023.
[5] 宮兆坤.基于知識圖譜的中職Python教學案例設計與應用[D].濟南:山東師范大學,2023.
[6] 萬聰,王聰,徐長明.工程教育認證背景下以動態(tài)知識圖譜為核心的高校教學模式探究[J].軟件導刊,2023,22(7):158-163.
[7] 丁國富,王淑營,馬術文,等.基于知識圖譜的產(chǎn)教融合課程體系建設模式探索[J].高等工程教育研究,2024(2):79-83,90.
[8] 封小霞.高職課程體系知識圖譜構建及可視化研究[J].電腦知識與技術,2024,20(9):39-42.
【通聯(lián)編輯:光文玲】