謝 麗
(廣州城市理工學(xué)院,廣東 廣州510800)
知識(shí)圖譜的誕生是為了讓機(jī)器具備認(rèn)知的能力,其以圖的形式描述客觀世界中的實(shí)體及其間的關(guān)系,在智能搜索、智能問答、大數(shù)據(jù)分析、自然語言理解等領(lǐng)域展現(xiàn)出巨大的應(yīng)用價(jià)值[1]。知識(shí)圖譜作為人工智能的一個(gè)分支,其具體方法大都來自計(jì)算機(jī)或人工智能的其他領(lǐng)域,涉及知識(shí)工程、自然語言處理、圖數(shù)據(jù)庫、機(jī)器學(xué)習(xí)等技術(shù)。
綜上所述,知識(shí)圖譜已經(jīng)成為一門獨(dú)立學(xué)科,設(shè)置在我國新增的人工智能學(xué)科目錄下。在人工智能專業(yè)中開設(shè)知識(shí)圖譜課程,讓學(xué)生能夠從整體、全局和系統(tǒng)的視角看待和應(yīng)用知識(shí)圖譜技術(shù),并了解知識(shí)圖譜相關(guān)領(lǐng)域的最新進(jìn)展,具有非常重要的作用和意義。本文從教學(xué)現(xiàn)狀的分析、教學(xué)目標(biāo)的定位、教學(xué)內(nèi)容的選擇、教學(xué)方法及考核方式的探究等方面闡述對知識(shí)圖譜課程的教學(xué)探索與實(shí)踐。
知識(shí)圖譜作為人工智能專業(yè)的一門重要基礎(chǔ)課,目前在高校開設(shè)本課程將面臨以下問題。
“知識(shí)圖譜”一詞誕生于2012年,谷歌將其應(yīng)用于搜索引擎,以提高用戶的搜索質(zhì)量。隨著人工智能技術(shù)的發(fā)展和應(yīng)用,知識(shí)圖譜才逐漸成為關(guān)鍵技術(shù)之一。因此,目前還極少有適合用于本科教學(xué)的知識(shí)圖譜教材,也沒有統(tǒng)一的開發(fā)語言以及軟件平臺(tái)來輔助課程的教學(xué)。除此之外,人工智能專業(yè)是2017年教育部提出新工科建設(shè)之后高校才逐漸增設(shè)的,因而開設(shè)該課程的學(xué)校還相對較少,對該課程的教學(xué)經(jīng)驗(yàn)相對缺乏。
由于課程內(nèi)容具有學(xué)科交叉性,學(xué)科覆蓋內(nèi)容的知識(shí)較廣,且內(nèi)容本身具有一定的理論深度,學(xué)生的學(xué)習(xí)難度加大,容易產(chǎn)生畏懼心理。此外,很多同學(xué)單純地“為學(xué)而學(xué)”,不知道怎樣將學(xué)到的知識(shí)加以應(yīng)用,容易產(chǎn)生厭學(xué)心理。因此,怎樣在有限的學(xué)時(shí)中既有效地講授課程核心理論知識(shí),又能夠聯(lián)系實(shí)際并實(shí)踐成為知識(shí)圖譜課程開展好壞的關(guān)鍵。
知識(shí)圖譜是結(jié)構(gòu)化的語義知識(shí)庫,用于描述客觀世界中的實(shí)體及實(shí)體間的關(guān)系,其基本構(gòu)成是“實(shí)體-關(guān)系-實(shí)體”三元組。實(shí)體指現(xiàn)實(shí)世界中具體或抽象的事物,如人、地方、組織機(jī)構(gòu)、概念等;關(guān)系描述實(shí)體之間客觀存在的關(guān)聯(lián),如人與人、人與物之間的關(guān)聯(lián),概念與某個(gè)物體之間的關(guān)聯(lián)等。因此,以知識(shí)圖譜為核心建立一個(gè)具有語義處理能力與開放互聯(lián)的知識(shí)庫,可以在智能問答、自然語言理解、大數(shù)據(jù)分析、個(gè)性化推薦等領(lǐng)域產(chǎn)生重大應(yīng)用價(jià)值。
學(xué)生通過該課程的學(xué)習(xí),了解該領(lǐng)域的技術(shù)發(fā)展前沿、掌握知識(shí)圖譜的相關(guān)技術(shù),并初步具備構(gòu)建小型知識(shí)圖譜的能力,以及基于知識(shí)圖譜進(jìn)行數(shù)據(jù)分析、文本分析的能力。
課程教學(xué)堅(jiān)持以學(xué)生為本,教學(xué)相長的指導(dǎo)思想。針對知識(shí)圖譜課程的教學(xué)現(xiàn)狀、教學(xué)目標(biāo)和學(xué)生已有的知識(shí)能力,明確相應(yīng)的教學(xué)內(nèi)容、教學(xué)方法及考核方式,減少學(xué)生因課程內(nèi)容復(fù)雜而產(chǎn)生的畏懼心理、厭學(xué)心理,幫助學(xué)生切實(shí)地理解和掌握知識(shí)圖譜相關(guān)技術(shù)。
知識(shí)圖譜生命周期一般經(jīng)歷:知識(shí)建模、知識(shí)獲取、知識(shí)融合、知識(shí)存儲(chǔ)和檢索、知識(shí)推理以及知識(shí)應(yīng)用等階段[3]。因此,該課程的教學(xué)內(nèi)容可以按照知識(shí)圖譜的生命周期進(jìn)行講授,由簡到難,循序漸進(jìn)地梳理知識(shí)圖譜的相關(guān)理論知識(shí)和基本方法[2]。具體的教學(xué)內(nèi)容如下:
(1)知識(shí)圖譜概述,介紹知識(shí)圖譜的相關(guān)概念、發(fā)展歷程、典型的知識(shí)圖譜項(xiàng)目、應(yīng)用價(jià)值以及學(xué)習(xí)知識(shí)圖譜所必需的基礎(chǔ)知識(shí)等。
(2)知識(shí)建模,介紹典型的知識(shí)表示方法,并以Protégé工具為例講解知識(shí)體系構(gòu)建的具體實(shí)現(xiàn)過程。
(3)知識(shí)獲取,講授如何從不同的數(shù)據(jù)源(結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù))中采用不同的方法獲取知識(shí)。
(4)知識(shí)融合,講授如何將獲取到的知識(shí)進(jìn)行融合并構(gòu)建數(shù)據(jù)之間的關(guān)聯(lián)。
(5)知識(shí)存儲(chǔ)與檢索,介紹知識(shí)圖譜存儲(chǔ)的主要特點(diǎn)和難點(diǎn)、當(dāng)前常用的幾種圖數(shù)據(jù)庫技術(shù),并以Neo4j為例講授如何有效地存儲(chǔ)和檢索知識(shí)圖譜。
(6)知識(shí)推理,介紹如何從已有的知識(shí)庫中經(jīng)過推理,挖掘出隱含的知識(shí)并建立實(shí)體間的新關(guān)聯(lián)。
(7)知識(shí)應(yīng)用,基于知識(shí)圖譜的應(yīng)用技術(shù)展開介紹,包括智能搜索、自動(dòng)問答、圖譜可視化等。
知識(shí)圖譜是人工智能專業(yè)的核心課程之一,其內(nèi)容是建立在自然語言理解、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、Python語言等基礎(chǔ)課程上,是具有更高層次的專業(yè)知識(shí)。因此,課程可安排在本科高年級(jí)階段的第6或者第7學(xué)期,分配32學(xué)時(shí)(2學(xué)分),其中理論教學(xué)占24學(xué)時(shí),實(shí)驗(yàn)教學(xué)占8學(xué)時(shí)。在教學(xué)過程中,可以試行講課與課堂討論、項(xiàng)目實(shí)踐、自學(xué)結(jié)合的教學(xué)方式[3]。具體如下:
(1)教師應(yīng)仔細(xì)遴選教材,選取學(xué)生易于理解且易于實(shí)踐的書籍作為入門參考書。授課時(shí)從應(yīng)用實(shí)例展開,通過問題引導(dǎo)、啟發(fā)、課堂討論等方式,激發(fā)學(xué)生的學(xué)習(xí)興趣并讓其積極參與到課堂中來,提高學(xué)生學(xué)習(xí)的積極主動(dòng)性。
(2)選取典型章節(jié),增加項(xiàng)目教學(xué)的環(huán)節(jié),將本章的知識(shí)點(diǎn)都融入項(xiàng)目中。目前國內(nèi)外很多研究機(jī)構(gòu)都推出了面向大眾、開放的知識(shí)圖譜,如國外Freebase、Wikidata、國內(nèi)OpenKG等,以及一些開源工具,適合初學(xué)者學(xué)習(xí)知識(shí)圖譜。因此,教師可從中選取難度適中的項(xiàng)目,也可由學(xué)生自己選擇和定制項(xiàng)目課題,再引導(dǎo)學(xué)生有步驟地完成,培養(yǎng)學(xué)生的動(dòng)手能力和實(shí)踐精神。
(3)教師每年依據(jù)知識(shí)圖譜技術(shù)的發(fā)展,定期刪減陳舊的理論知識(shí),增加新的理論和研究成果。制作和完善多媒體課件、教學(xué)項(xiàng)目內(nèi)容、課外學(xué)習(xí)資料等,建設(shè)資源共享網(wǎng)站,讓學(xué)生可以利用網(wǎng)站共享資源完成自主學(xué)習(xí),進(jìn)一步增強(qiáng)學(xué)生學(xué)習(xí)的積極主動(dòng)性,提高教學(xué)質(zhì)量和學(xué)習(xí)效果。
考核屬于教學(xué)活動(dòng)的一部分,在以期末考試成績和平時(shí)成績?yōu)橹鞯目己朔绞缴希黾咏虒W(xué)項(xiàng)目的考核內(nèi)容。由于該課程的應(yīng)用性較強(qiáng),卷面考試成績只占50%,考查學(xué)生對基本內(nèi)容的理解和掌握;平時(shí)成績占15%,包括作業(yè)、上課考勤等;教學(xué)項(xiàng)目考核占35%,從資料搜集與學(xué)習(xí)、項(xiàng)目的完成度、項(xiàng)目答辯和課程報(bào)告四個(gè)方面進(jìn)行考核,貫穿課程教學(xué)的各個(gè)階段。這種考核方式有效地將理論與實(shí)踐結(jié)合,要求學(xué)生既要學(xué)好課程內(nèi)容又需做好自己的教學(xué)項(xiàng)目,有助于提高學(xué)生的學(xué)習(xí)效果和培養(yǎng)學(xué)生的綜合素質(zhì)能力。
知識(shí)圖譜是人工智能應(yīng)用不可或缺的資源,其在問答系統(tǒng)、智能金融、智慧醫(yī)療等領(lǐng)域具有廣闊的應(yīng)用場景,未來會(huì)有更多高校的人工智能專業(yè)開設(shè)知識(shí)圖譜課程。通過本課程的開展,讓學(xué)生對知識(shí)圖譜有一個(gè)較全面的認(rèn)識(shí)并具備基本實(shí)踐能力,讓更多的學(xué)生可以在知識(shí)圖譜細(xì)分研究方向上更加深入地學(xué)習(xí),是具有較大挑戰(zhàn)性的教學(xué)活動(dòng)。本文分析了該課程的教學(xué)現(xiàn)狀,明確了教學(xué)目標(biāo)、教學(xué)內(nèi)容、教學(xué)方式及考核方式等方面的內(nèi)容。此外,由于人工智能技術(shù)發(fā)展迅速,而知識(shí)圖譜課程在高校開展時(shí)間較短,所以還需要在實(shí)踐教學(xué)中繼續(xù)優(yōu)化課程內(nèi)容,細(xì)化教學(xué)大綱,為培養(yǎng)我國人工智能專業(yè)人才打下良好的基礎(chǔ)。