国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于教育大數(shù)據(jù)的智慧圖書館學(xué)科資源庫建設(shè)研究

2020-11-29 05:03:57
科技傳播 2020年19期
關(guān)鍵詞:詞庫資源庫樣本

陳 微

智慧圖書館在教育大數(shù)據(jù)的環(huán)境下開展學(xué)科服務(wù),以大數(shù)據(jù)建立智能化數(shù)據(jù)采集系統(tǒng)——學(xué)科資源庫,以支持智慧圖書館的決策、實(shí)施、評(píng)價(jià)等過程。目前我國(guó)高校的學(xué)科資源庫相對(duì)缺乏,教育資源庫在數(shù)量、規(guī)模、標(biāo)準(zhǔn)化等方面存在一定不足,需要根據(jù)不同學(xué)科制定出一套自擴(kuò)充式和以用戶為中心的完備的資源庫以供智慧圖書館使用,滿足學(xué)習(xí)者智慧化需求,為高校師生建立一套精準(zhǔn)的服務(wù)模式,具有個(gè)性推送、智慧交互等功能。

1 國(guó)內(nèi)外研究現(xiàn)狀

1.1 教育大數(shù)據(jù)現(xiàn)狀

2008年,《科學(xué)》雜志發(fā)表文章“Big Data:Science in the Petabyte Era”,“大 數(shù)據(jù)”一詞開始廣泛傳播[1]。聯(lián)合國(guó)在 2012 年發(fā)布的大數(shù)據(jù)白皮書《Big Data for Development:Challenges & Opportunities》中指出大數(shù)據(jù)的出現(xiàn)將會(huì)對(duì)社會(huì)各個(gè)領(lǐng)域產(chǎn)生深刻影響[2]。關(guān)于數(shù)據(jù)驅(qū)動(dòng)教育的理念,美國(guó)早在60年代就開始嘗試采用,直到2012年10月,美國(guó)教育部發(fā)布了《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》的教育大數(shù)據(jù)報(bào)告,這份報(bào)告對(duì)美國(guó)教育界應(yīng)用大數(shù)據(jù)的進(jìn)行教育大數(shù)據(jù)挖掘的案例以及面臨的問題做了詳細(xì)介紹[3]。

我國(guó)有關(guān)教育大數(shù)據(jù)的研究緊隨其后,2012年10月,我國(guó)成立了中國(guó)通信學(xué)會(huì)大數(shù)據(jù)專家委員會(huì),這是國(guó)內(nèi)第一個(gè)專門研究大數(shù)據(jù)應(yīng)用和發(fā)展的學(xué)術(shù)組織。大數(shù)據(jù)研究應(yīng)用到教育領(lǐng)域是在2012年,王震一指出教育數(shù)據(jù)同樣是形式多樣的海量數(shù)據(jù),需要有一套全面的方案來管理教育大數(shù)據(jù),形成信息化教育[4]。2014年,教育部辦公廳《2014年教育信息化工作要點(diǎn)》中指出:加強(qiáng)對(duì)教育預(yù)測(cè)等相關(guān)數(shù)據(jù)資源的整合與集成,為教育決策提供及時(shí)和準(zhǔn)確的數(shù)據(jù)支持,推動(dòng)共享全國(guó)基礎(chǔ)教育數(shù)據(jù)[5]。

1.2 智慧圖書館現(xiàn)狀

2003年,“智慧圖書館”的概念首先由Aittola等人在《智慧圖書館:基于位置感知的移動(dòng)圖書館服務(wù)》一文中提出[6]。隨后,學(xué)者們先后結(jié)合RFID、云計(jì)算、大數(shù)據(jù)和物聯(lián)網(wǎng)等先進(jìn)技術(shù)對(duì)智慧圖書館的實(shí)現(xiàn)途徑進(jìn)行了研究。對(duì)智慧圖書館學(xué)科資源庫的建設(shè)是構(gòu)建智慧圖書館的重要前提和保障。利用教育大數(shù)據(jù)對(duì)學(xué)科資源庫進(jìn)行智慧個(gè)性化推送的實(shí)現(xiàn)需要多種環(huán)境的支持,多種技術(shù)的支撐,多種業(yè)務(wù)的集成,但其中最基礎(chǔ)也最核心的應(yīng)屬教育資源庫或關(guān)鍵詞庫的構(gòu)建。

目前關(guān)鍵詞庫在智慧圖書館方面的應(yīng)用比較少。學(xué)科關(guān)鍵詞庫數(shù)量較少,規(guī)模小,資源結(jié)構(gòu)單一,利用率低,資源重復(fù)建設(shè)和標(biāo)準(zhǔn)化等問題完全阻礙了智慧個(gè)性化推送的發(fā)展。而學(xué)科關(guān)鍵詞庫的建立可以為教育大數(shù)據(jù)環(huán)境下的智慧學(xué)科知識(shí)服務(wù)的發(fā)展建立新的理論基礎(chǔ)、提供新的指導(dǎo)思路。所以本文將在大數(shù)據(jù)的背景下,探討關(guān)鍵詞庫在智慧教育中的應(yīng)用,并建立教育資源庫或關(guān)鍵詞庫,來驅(qū)動(dòng)智慧教育,使智慧教育做到個(gè)性精準(zhǔn)的服務(wù)于各種類型的用戶,從而使其到達(dá)更好的效果。

2 學(xué)科關(guān)鍵詞庫在智慧圖書館中的作用

學(xué)科關(guān)鍵詞庫應(yīng)用于智慧圖書館將主要在以下幾個(gè)方面發(fā)揮作用:

建立詞庫對(duì)知識(shí)管理具有指導(dǎo)作用。一般來說知識(shí)管理過程包括知識(shí)獲取、知識(shí)整合和知識(shí)應(yīng)用。知識(shí)獲取階段,詞庫可以幫助研究者更好的識(shí)別語義;知識(shí)整合階段,詞庫可以幫助研究者對(duì)內(nèi)容進(jìn)行分解和抽?。恢R(shí)應(yīng)用階段,詞庫可以幫助研究者描述資源,開展標(biāo)引工作。因此關(guān)鍵詞詞庫在整個(gè)知識(shí)管理過程中發(fā)揮的作用十分重要。

建立詞庫對(duì)學(xué)科服務(wù)的指導(dǎo)作用。關(guān)鍵詞詞庫是一個(gè)同時(shí)具有標(biāo)準(zhǔn)規(guī)范語言和自然語言的詞庫,多是以學(xué)科概念為主線組庫,詞和詞之間是基于學(xué)科有上下位關(guān)系、關(guān)聯(lián)關(guān)系以及交叉關(guān)系。這種詞庫既可對(duì)已有的學(xué)科名詞進(jìn)行規(guī)范管理,又給學(xué)科發(fā)展中出現(xiàn)的新概念、新詞匯保留一定空間擴(kuò)充。因此,關(guān)鍵詞詞庫對(duì)學(xué)科服務(wù)具有指導(dǎo)作用。

3 學(xué)科關(guān)鍵詞詞庫的建立

關(guān)鍵詞詞庫是特定領(lǐng)域關(guān)鍵詞的合集,關(guān)鍵詞和關(guān)鍵詞詞庫的優(yōu)劣對(duì)各類檢索系統(tǒng)、搜索引擎的性能有著重要影響[7]。建立詞庫也就是把某一個(gè)學(xué)科里邊的關(guān)鍵詞使用各種可能的方法都挖掘出來,從而對(duì)智慧圖書館的知識(shí)服務(wù)做一個(gè)科學(xué)的指導(dǎo),詞庫是非常重要的,它基本上代表了本專業(yè)中用戶所要搜索的詞語,也就是說,詞庫代表著需求。所以關(guān)鍵詞庫應(yīng)用十分廣泛,特別是具體學(xué)科領(lǐng)域的關(guān)鍵詞庫可以使本學(xué)科的學(xué)習(xí)者可以更快速、科學(xué)的發(fā)現(xiàn)專業(yè)的信息。對(duì)于關(guān)鍵詞庫的建立主要方法有:1)利用統(tǒng)計(jì)分析的方法,如對(duì)大量相關(guān)文獻(xiàn)進(jìn)行提取及頻率的統(tǒng)計(jì);2)利用詞語網(wǎng)絡(luò)的方法,即將相關(guān)文檔依據(jù)一定規(guī)則映射為詞語網(wǎng)絡(luò),并對(duì)詞語進(jìn)行相關(guān)性的計(jì)算[8]。3)利用詞語語義的方法,即根據(jù)詞語的語義特征提取關(guān)鍵詞[9]。因?yàn)楸疚倪x取“遠(yuǎn)程教育”這一較小的學(xué)科進(jìn)行關(guān)鍵詞庫的建立,其特征詞匯較少,所以本文將主要使用傳統(tǒng)的統(tǒng)計(jì)方法對(duì)關(guān)鍵詞進(jìn)行提取。

本節(jié)將以“遠(yuǎn)程教育”這一學(xué)科為例,建立一個(gè)以“遠(yuǎn)程教育”為主題面向特定學(xué)科的關(guān)鍵詞庫,旨在為學(xué)習(xí)和研究遠(yuǎn)程教育的學(xué)者提供一個(gè)全面的術(shù)語資源庫,從而為讀者提供更加專業(yè)、更加個(gè)性化的學(xué)科服務(wù)。為了使詞庫更加權(quán)威且具有時(shí)效性,筆者將分四個(gè)步驟對(duì)詞庫進(jìn)行建立,其中包括:一是關(guān)鍵詞庫的樣本獲?。欢顷P(guān)鍵詞提取與優(yōu)化;三是關(guān)鍵詞庫的建立;四是對(duì)詞庫進(jìn)行維護(hù)。

3.1 關(guān)鍵詞庫的樣本獲取

建立詞庫的首要任務(wù)是獲取關(guān)鍵詞庫的樣本。本文關(guān)鍵詞庫樣本主要有兩個(gè)來源:

1)由專業(yè)文獻(xiàn)數(shù)據(jù)庫獲取??茖W(xué)文獻(xiàn)往往能夠反映一個(gè)學(xué)科的研究熱點(diǎn)和趨勢(shì),作者選定的關(guān)鍵詞是其研究的高度概括,所以科學(xué)文獻(xiàn)中的關(guān)鍵詞是一個(gè)學(xué)科或領(lǐng)域的學(xué)術(shù)資源的濃縮,是構(gòu)建詞庫的重要來源之一。首先,我們將利用中國(guó)知網(wǎng)對(duì)遠(yuǎn)程教育的相關(guān)文獻(xiàn)進(jìn)行檢索。為了保證搜集的術(shù)語的全面性,還將對(duì)“遠(yuǎn)程教育”進(jìn)行擴(kuò)展,以期更全面的獲得相關(guān)文獻(xiàn)信息。百度搜索是目前國(guó)內(nèi)應(yīng)用最為廣泛的搜索引擎,其擁有巨大的數(shù)據(jù)庫,可以較全面的覆蓋與“遠(yuǎn)程教育”相關(guān)的關(guān)鍵詞。所以我們利用引擎平臺(tái)挖掘擴(kuò)展工具百度推廣賬號(hào)中的“關(guān)鍵詞規(guī)劃師”來進(jìn)行關(guān)鍵詞的挖掘與擴(kuò)展。通過擴(kuò)展可以得到與“遠(yuǎn)程教育”語義相似的主題詞13個(gè),其中包括:“虛擬教育”“智慧教育”“數(shù)字教育”“移動(dòng)教育”“網(wǎng)絡(luò)教育”“遠(yuǎn)程網(wǎng)絡(luò)教育”“在線教育”“遠(yuǎn)程成人教育”“虛擬現(xiàn)實(shí)教育”“虛擬教學(xué)”“虛擬培訓(xùn)”“教育虛擬仿真”“三維虛擬教學(xué)”。在中國(guó)知網(wǎng)的高級(jí)檢索中,以主題為內(nèi)容檢索條件,在檢索框中依次輸入這14個(gè)主題詞,精確檢索,共檢索出85 315篇文獻(xiàn)。其中最早一篇關(guān)于遠(yuǎn)程教育的文獻(xiàn)是在1951年發(fā)表的,隨后在1982年才再次出現(xiàn)在研究者的視野中,并且研究者越來越多,從2000年到2016年每一年都有數(shù)以千計(jì)的文章發(fā)表。隨后,導(dǎo)出這些文獻(xiàn)的關(guān)鍵詞導(dǎo)入到BICOMB中進(jìn)行提取、統(tǒng)計(jì),共獲得96 558個(gè)關(guān)鍵詞。這些關(guān)鍵詞是建立詞庫的重要來源之一。

2)基于社交網(wǎng)絡(luò)擴(kuò)展關(guān)鍵詞庫。社交網(wǎng)絡(luò)為人們提供了一個(gè)更為廣闊的信息發(fā)表與交流的空間,其明顯區(qū)別與傳統(tǒng)的網(wǎng)站,具有個(gè)性化、交互性等特色。目前,大量互聯(lián)網(wǎng)用戶包括許多科研人員通過網(wǎng)絡(luò)社區(qū)進(jìn)行正式或非正式的交流。社交網(wǎng)絡(luò)儼然已經(jīng)成為許多新型信息及詞匯的集會(huì)地,對(duì)其進(jìn)行挖掘是十分重要的。所以,僅對(duì)專業(yè)文獻(xiàn)數(shù)據(jù)庫進(jìn)行關(guān)鍵詞的挖掘,遠(yuǎn)不能滿足詞庫使用者對(duì)專業(yè)詞匯的需求。為了使關(guān)鍵詞庫更加貼合時(shí)代的發(fā)展,包容更多更全面的信息,筆者還利用社交網(wǎng)絡(luò)社區(qū)進(jìn)行關(guān)鍵詞庫的擴(kuò)展。由于目前中國(guó)缺乏綜合教育類的社交平臺(tái),僅存的粉筆網(wǎng)等教育類平臺(tái)僅提供職業(yè)考試培訓(xùn)等業(yè)務(wù),較少有學(xué)術(shù)方面的交流。所以筆者選擇了我國(guó)較多使用社交網(wǎng)絡(luò)社區(qū),包括:新浪博客、天涯、知乎、果殼等進(jìn)行關(guān)鍵詞樣本的獲取。具體方法如下:(1)樣本的選取。利用社交網(wǎng)絡(luò)平臺(tái)自身檢索功能中,對(duì)擴(kuò)展的14個(gè)關(guān)鍵詞匯進(jìn)行檢索,得到關(guān)于“遠(yuǎn)程教育”的相關(guān)頁面。(2)樣本信息的獲得。利用八爪魚等網(wǎng)絡(luò)爬蟲軟件爬取具有代表性的關(guān)于“遠(yuǎn)程教育”頁面的信息。其中,關(guān)于“遠(yuǎn)程教育”頁面的信息只選擇題目和標(biāo)簽進(jìn)行獲取。因?yàn)轭}目和標(biāo)簽信息可以高度概括文本信息的內(nèi)容,具有代表性。八爪魚網(wǎng)路采集器是一款可以從網(wǎng)絡(luò)中快速便捷的獲取客戶所需要的信息的網(wǎng)絡(luò)信息采集工具,可以實(shí)現(xiàn)數(shù)據(jù)自動(dòng)化采集。(3)網(wǎng)絡(luò)關(guān)鍵詞庫樣本的獲得。利用分詞軟件對(duì)步驟2得到的樣本信息進(jìn)行分詞,得到網(wǎng)絡(luò)關(guān)鍵詞庫的樣本。目前,國(guó)內(nèi)有許多比較成熟的針對(duì)中文的分詞軟件,常用的分詞工具有:中國(guó)科學(xué)院開發(fā)的利用的ICTCLAS、庖丁解牛分詞及盤古分詞等。

3.2 關(guān)鍵詞提取與優(yōu)化

由于獲取關(guān)鍵詞樣本多有重復(fù)或明顯與“遠(yuǎn)程教育”主題無關(guān),且特別是通過社交網(wǎng)絡(luò)社區(qū)提取的詞匯多參差不齊,所以筆者將對(duì)得到詞匯進(jìn)行提取優(yōu)化,只保留有價(jià)值的信息。對(duì)關(guān)鍵詞提取與優(yōu)化,即對(duì)采集的詞庫樣本進(jìn)行初步的過濾,篩選。將從專業(yè)文獻(xiàn)中獲取的關(guān)鍵詞和從社交網(wǎng)絡(luò)中獲取的關(guān)鍵詞整合,作為一個(gè)樣本進(jìn)行過濾、篩選。對(duì)關(guān)鍵詞的提取和過濾采用如下步驟:1)去重,將相同的關(guān)鍵詞去除,只保留一個(gè)。2)去除無意義的關(guān)鍵詞,例如:策略、研究等。3)去除意思相同但表述不同的詞,例如:慕課、大規(guī)模在線課程與MOOCs,網(wǎng)絡(luò)、Web與Internet等,只保留其中之一。4)去除意思相近,表述不同的詞,例如:大數(shù)據(jù)分析與大數(shù)據(jù)研究,遠(yuǎn)程教育與遠(yuǎn)程教學(xué)等,只保留一個(gè)。5)去除小類,保留其大類,例如,若有高校圖書館,則將××高校圖書館去除。按上述五個(gè)步驟對(duì)關(guān)鍵詞進(jìn)行過濾、篩選之后,獲得關(guān)鍵詞包括:遠(yuǎn)程教育、黨員干部、實(shí)況錄像、慕課、認(rèn)知風(fēng)格、師生素質(zhì)等傳統(tǒng)主題詞匯,還有自媒體、教育品牌、教育直播等新型的網(wǎng)絡(luò)關(guān)鍵詞。這些關(guān)鍵詞就構(gòu)成了遠(yuǎn)程教育詞庫的所有術(shù)語。

3.3 關(guān)鍵詞庫的建立

采用一定方法對(duì)提取的關(guān)于“遠(yuǎn)程教育”的關(guān)鍵詞進(jìn)行合并,構(gòu)建關(guān)鍵詞庫;一般建立關(guān)鍵詞庫都采用分類的方法。分類是詞庫建設(shè)的核心,分類就是為了能夠?qū)崿F(xiàn)快速布局。我們根據(jù)遠(yuǎn)程教育不同的意圖及其特征等,對(duì)遠(yuǎn)程教育詞庫進(jìn)行分類,共分為七類。一是遠(yuǎn)程教育的主體,包括學(xué)習(xí)者、教育者、專家、機(jī)構(gòu)等。例如,黨員干部、大中小學(xué)教師、何克抗教授、××高校、××培訓(xùn)機(jī)構(gòu)等。二是遠(yuǎn)程教育相關(guān)的概念術(shù)語,包括理論概念、技術(shù)概念等。例如:遠(yuǎn)程教育、虛擬教育、XML、云計(jì)算、自媒體等。三是教育相關(guān)的術(shù)語。包括情感認(rèn)知、參與式教學(xué)、情景教學(xué)、目標(biāo)式導(dǎo)學(xué)、構(gòu)建主義等。四是遠(yuǎn)程教育相關(guān)的資源與工具。例如:微視頻、慕課、資源庫建設(shè)、在線學(xué)習(xí)系統(tǒng)、移動(dòng)終端、衛(wèi)星設(shè)備等。五是涉及遠(yuǎn)程教育相關(guān)的評(píng)價(jià)。例如:發(fā)展性評(píng)價(jià)、能力評(píng)價(jià)、課程質(zhì)量評(píng)估、評(píng)價(jià)體系創(chuàng)新、評(píng)價(jià)質(zhì)量標(biāo)準(zhǔn)等。六是遠(yuǎn)程教育的研究方法。包括神經(jīng)網(wǎng)絡(luò)、因子分析、文獻(xiàn)計(jì)量、支持向量機(jī)等。最后一類是其他。包括師德建設(shè)、人才隊(duì)伍建設(shè)、資金投入等。之后對(duì)于每一類術(shù)語進(jìn)行排序,我們按照漢語拼音的前后順序排序,這種順序在詞典中廣泛使用,方便使用者進(jìn)行查詢。

3.4 詞庫維護(hù)與更新

一個(gè)領(lǐng)域的術(shù)語并不是一成不變的,科學(xué)概念會(huì)隨時(shí)間進(jìn)行演化,不斷的消亡或者產(chǎn)生新的關(guān)鍵詞。所以對(duì)詞庫進(jìn)行維護(hù)是至關(guān)重要的,衡量一個(gè)詞庫好壞的關(guān)鍵之一是它的與時(shí)俱進(jìn)性,維護(hù)可以保證一個(gè)詞庫的有效性。對(duì)于詞庫的維護(hù),需要不斷地進(jìn)行上述三個(gè)步驟,首先定期查閱文獻(xiàn)和檢索相關(guān)社交網(wǎng)站,提取出其關(guān)鍵詞。然后,在提取的關(guān)鍵詞間,以及關(guān)鍵詞與原詞庫間進(jìn)行去重、過濾、篩選等工作。最后,根據(jù)原詞庫的類別劃分,將新加入的術(shù)語分門別類,并按順序排列。這是一個(gè)重復(fù)的工作,是保證一個(gè)詞庫能永葆價(jià)值的關(guān)鍵。

4 結(jié)語

學(xué)科知識(shí)詞庫是智慧圖書館向內(nèi)容延伸的實(shí)踐。本文建立的“遠(yuǎn)程教育”關(guān)鍵詞庫,只是在某一學(xué)科的簡(jiǎn)單試探,更多的學(xué)科領(lǐng)域還亟待建立自己的學(xué)科知識(shí)詞庫,并在這些詞庫的基礎(chǔ)上,利用個(gè)性化推送、大數(shù)據(jù)和云計(jì)算等技術(shù)實(shí)現(xiàn)進(jìn)一步的精準(zhǔn)服務(wù),完善自擴(kuò)充式詞庫,以用戶為中心,真正做到智慧服務(wù)、智慧學(xué)習(xí)、智慧搜索等,使智慧圖書館一步一步走向?qū)嵺`。

猜你喜歡
詞庫資源庫樣本
健身氣功開放課程資源庫建設(shè)研究
用樣本估計(jì)總體復(fù)習(xí)點(diǎn)撥
貴州●石斛種質(zhì)資源庫
推動(dòng)醫(yī)改的“直銷樣本”
隨機(jī)微分方程的樣本Lyapunov二次型估計(jì)
高中歷史信息化教育資源庫應(yīng)用探索
詞庫音系學(xué)的幾個(gè)理論問題芻議
福建基礎(chǔ)教育教學(xué)資源庫建設(shè)研究——以福建基礎(chǔ)教育網(wǎng)資源庫為例
村企共贏的樣本
環(huán)境變了,詞庫別變
電腦迷(2014年14期)2014-04-29 00:44:03
博兴县| 巴彦县| 尼玛县| 洛隆县| 浪卡子县| 措勤县| 汕尾市| 五台县| 诏安县| 青川县| 寿光市| 顺义区| 肥城市| 丽江市| 彩票| 富源县| 深州市| 长白| 长岛县| 焦作市| 明水县| 丰城市| 出国| 汶川县| 弋阳县| 宽甸| 铅山县| 呼图壁县| 获嘉县| 昌平区| 信丰县| 永善县| 杭锦旗| 仙游县| 阿克苏市| 秦皇岛市| 随州市| 阳春市| 云安县| 双峰县| 孟津县|