鄭芳超
[摘 要]本文主要介紹多源數(shù)據(jù)在高校實(shí)踐教學(xué)改革中的應(yīng)用,包括多源數(shù)據(jù)的整合和利用方法、多源數(shù)據(jù)在實(shí)踐教學(xué)中的應(yīng)用場(chǎng)景和實(shí)踐方法等內(nèi)容。在大數(shù)據(jù)時(shí)代,多源數(shù)據(jù)的整合與利用已成為高校教學(xué)改革和高質(zhì)量發(fā)展的核心問題之一。本文深入探究了多源數(shù)據(jù)整合方法和技術(shù),如數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、文本挖掘、多源數(shù)據(jù)融合和數(shù)據(jù)可視化等技術(shù),為多源數(shù)據(jù)在高校實(shí)踐教學(xué)中的應(yīng)用提供了重要支持和保障。針對(duì)教育大數(shù)據(jù)分析這一應(yīng)用場(chǎng)景,本文從多個(gè)方面介紹了多源數(shù)據(jù)的實(shí)踐方法,包括數(shù)據(jù)來源、數(shù)據(jù)整合、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等方面,幫助讀者更加全面深入地認(rèn)識(shí)多源數(shù)據(jù)在高校實(shí)踐教學(xué)中的應(yīng)用。
[關(guān)鍵詞]大數(shù)據(jù)時(shí)代;高校實(shí)踐教學(xué);教學(xué)改革;多源數(shù)據(jù);整合與利用
doi:10.3969/j.issn.1673-0194.2023.17.065
[中圖分類號(hào)]G642 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1673-0194(2023)17-0229-04
1? ? ?相關(guān)理論概述
1.1? ?高校教育實(shí)踐的界定
高校教育實(shí)踐是指高校為了促進(jìn)學(xué)生全面成長和社會(huì)實(shí)踐能力的提高,通過開展教育實(shí)踐活動(dòng),使學(xué)生在實(shí)踐過程中獲得經(jīng)驗(yàn)和技能的一種教育活動(dòng)。高校教育實(shí)踐包括課堂教育實(shí)踐、社會(huì)實(shí)踐和科技實(shí)踐三個(gè)方面。
首先,課堂教育實(shí)踐。面對(duì)不同專業(yè)特點(diǎn),高校為了加強(qiáng)對(duì)學(xué)生實(shí)際動(dòng)手能力的培養(yǎng),引導(dǎo)學(xué)生對(duì)所學(xué)相關(guān)實(shí)踐技能進(jìn)行訓(xùn)練和實(shí)踐。包括實(shí)驗(yàn)、實(shí)訓(xùn)、實(shí)習(xí)等。例如,在計(jì)算機(jī)專業(yè)中,高??梢蚤_設(shè)相關(guān)的計(jì)算機(jī)實(shí)驗(yàn)系統(tǒng),讓學(xué)生通過實(shí)驗(yàn)來深入了解計(jì)算機(jī)原理和應(yīng)用,并掌握相關(guān)技能。
其次,社會(huì)實(shí)踐。高校為了提高學(xué)生的社會(huì)實(shí)踐能力,培養(yǎng)學(xué)生的社會(huì)責(zé)任感、創(chuàng)新精神和實(shí)踐能力,開設(shè)社會(huì)實(shí)踐系統(tǒng),可以讓學(xué)生到社會(huì)實(shí)踐中去學(xué)習(xí)和提升自己的能力。社會(huì)實(shí)踐可以包括參觀、調(diào)查、實(shí)踐等多種形式,如到企業(yè)考察,到社區(qū)開展志愿活動(dòng),到鄉(xiāng)村進(jìn)行實(shí)地考察,等等。
最后,科技實(shí)踐。高校為了培養(yǎng)學(xué)生的實(shí)踐能力,提高學(xué)生的科技創(chuàng)新能力,因而開展各種形式的科技實(shí)踐活動(dòng),包括科研實(shí)踐、學(xué)科競(jìng)賽、發(fā)明創(chuàng)新等。例如高校可以組織學(xué)生參加全國大學(xué)生電子設(shè)計(jì)競(jìng)賽、機(jī)器人比賽、發(fā)明展覽等科技實(shí)踐活動(dòng),讓學(xué)生運(yùn)用所學(xué)知識(shí)進(jìn)行創(chuàng)新實(shí)踐。
1.2? ?多源數(shù)據(jù)的類型、來源和特征
在大數(shù)據(jù)時(shí)代,各種類型和規(guī)模的數(shù)據(jù)不斷涌現(xiàn),高校教育實(shí)踐中如何將這些多源數(shù)據(jù)進(jìn)行整合和利用,是當(dāng)前高校實(shí)踐教學(xué)改革的重大問題之一。而要進(jìn)行多源數(shù)據(jù)整合,就需要了解多源數(shù)據(jù)的類型、來源和特征。
1.2.1? ?數(shù)據(jù)類型
多源數(shù)據(jù)可以根據(jù)來源和類型進(jìn)行分類。按來源,可分為內(nèi)部數(shù)據(jù)(學(xué)生成績、學(xué)科課程表、選課信息等),外部數(shù)據(jù)(圖書館藏書信息、實(shí)驗(yàn)室設(shè)備數(shù)據(jù)等)和第三方數(shù)據(jù)(政府公共數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)等)[1]。按類型,多源數(shù)據(jù)可分為結(jié)構(gòu)化數(shù)據(jù)(關(guān)系型數(shù)據(jù)庫、表格數(shù)據(jù)等),半結(jié)構(gòu)化數(shù)據(jù)(XML、JSON等)和非結(jié)構(gòu)化數(shù)據(jù)(圖像、文本、音頻、視頻等)。
1.2.2? ?數(shù)據(jù)來源
多源數(shù)據(jù)的來源可以分為內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)。內(nèi)部數(shù)據(jù)是指來自高校學(xué)生、教師、課程管理系統(tǒng)、教學(xué)管理系統(tǒng)等內(nèi)部系統(tǒng)中的各種數(shù)據(jù);外部數(shù)據(jù)則是指來自高校周邊環(huán)境或者是網(wǎng)絡(luò)中的各種數(shù)據(jù)。
1.2.3? ?數(shù)據(jù)特征
多源數(shù)據(jù)有以下幾個(gè)特征。
首先是規(guī)模巨大。隨著現(xiàn)代計(jì)算機(jī)技術(shù)的高速發(fā)展,各類數(shù)據(jù)的規(guī)模呈爆炸式增長。其次是異構(gòu)性。多源數(shù)據(jù)來源、數(shù)據(jù)格式、數(shù)據(jù)結(jié)構(gòu)都可能不同,因此數(shù)據(jù)的異構(gòu)性十分突出。再次是多樣性。由于數(shù)據(jù)來源多,其涉及的問題、應(yīng)用和領(lǐng)域的多樣性也是非常顯著的[2]。再次是不確定性。多源數(shù)據(jù)來源復(fù)雜,數(shù)據(jù)內(nèi)容隨時(shí)可能變化,因此數(shù)據(jù)的不確定性極強(qiáng)。最后是價(jià)值潛力大。多源數(shù)據(jù)集成后能夠發(fā)掘更豐富的信息和價(jià)值,對(duì)決策和管理具有重要意義。
1.3? ?多源數(shù)據(jù)的整合方法和技術(shù)
多源數(shù)據(jù)整合需要利用現(xiàn)代信息技術(shù)手段和方法,如數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、文本挖掘、多源數(shù)據(jù)融合等。下面介紹常用的多源數(shù)據(jù)整合方法和技術(shù)。
1.3.1? ?數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是一種利用計(jì)算機(jī)技術(shù)和統(tǒng)計(jì)方法自動(dòng)地從大量數(shù)據(jù)中提取知識(shí)和信息的過程。通過對(duì)數(shù)據(jù)的分析、處理和挖掘,可以識(shí)別數(shù)據(jù)中隱藏的模式和關(guān)聯(lián)規(guī)律。數(shù)據(jù)挖掘可用于多源數(shù)據(jù)的提取、分析和利用。
1.3.2? ?機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)是一種人工智能領(lǐng)域的分支,其主要思想是利用計(jì)算機(jī)程序模擬人類的學(xué)習(xí)過程,對(duì)數(shù)據(jù)進(jìn)行處理和分析。機(jī)器學(xué)習(xí)可以構(gòu)建分類模型、聚類模型、預(yù)測(cè)模型等,并可以通過數(shù)據(jù)的訓(xùn)練和預(yù)測(cè)來識(shí)別模式和關(guān)聯(lián)規(guī)律。
1.3.3? ?文本挖掘
文本挖掘是一種利用計(jì)算機(jī)技術(shù)和自然語言處理技術(shù),從大量的文字?jǐn)?shù)據(jù)中提取和分析有用信息的過程。利用文本挖掘技術(shù),可以對(duì)數(shù)據(jù)進(jìn)行預(yù)處理、特征提取、分類聚類、主題挖掘等操作,從而提高數(shù)據(jù)的利用價(jià)值。
1.3.4? ?多源數(shù)據(jù)融合
多源數(shù)據(jù)融合是將來自不同數(shù)據(jù)源的數(shù)據(jù)集成成一個(gè)整體,并解決數(shù)據(jù)來源、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)格式等問題的過程。多源數(shù)據(jù)融合包括數(shù)據(jù)庫融合、XML數(shù)據(jù)融合、Web數(shù)據(jù)融合、文本數(shù)據(jù)融合、圖像數(shù)據(jù)融合等[3]。
1.3.5? ?數(shù)據(jù)可視化
數(shù)據(jù)可視化是將數(shù)據(jù)的復(fù)雜結(jié)構(gòu)和信息可視化呈現(xiàn),并提供一種直觀的方法,以幫助用戶理解、識(shí)別和分析多源數(shù)據(jù)信息。數(shù)據(jù)可視化可以實(shí)現(xiàn)挖掘數(shù)據(jù)的編碼和解碼,可以通過數(shù)據(jù)顯示、動(dòng)畫、圖形等方式呈現(xiàn)復(fù)雜的多源數(shù)據(jù)信息。
1.4? ?多源數(shù)據(jù)分析的技術(shù)和方法
以下是多源數(shù)據(jù)分析中常見的技術(shù)和方法。
1.4.1? ?數(shù)據(jù)清洗
數(shù)據(jù)清洗是多源數(shù)據(jù)分析的一個(gè)重要步驟,其目的是去除數(shù)據(jù)中的錯(cuò)誤信息、缺失信息或重復(fù)信息等無用信息,保證數(shù)據(jù)的準(zhǔn)確性和可靠性。數(shù)據(jù)清洗的方法包括數(shù)據(jù)預(yù)處理、數(shù)據(jù)統(tǒng)一、數(shù)據(jù)融合等。
1.4.2? ?數(shù)據(jù)可視化
數(shù)據(jù)可視化是多源數(shù)據(jù)分析不可或缺的一個(gè)環(huán)節(jié),它使得數(shù)據(jù)可視化呈現(xiàn),幫助人們快速、直接地感知和認(rèn)知多源數(shù)據(jù)的整體情況。常用的數(shù)據(jù)可視化技術(shù)和方法有圖表、散點(diǎn)圖、熱力圖、氣泡圖等。
1.4.3? ?數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是多源數(shù)據(jù)分析中的一個(gè)重要過程,它通過數(shù)據(jù)挖掘、數(shù)據(jù)分析和機(jī)器學(xué)習(xí)技術(shù),從數(shù)據(jù)集中自動(dòng)地發(fā)現(xiàn)潛在的關(guān)聯(lián)規(guī)律和模式。常用的數(shù)據(jù)挖掘技術(shù)包括聚類、分類、關(guān)聯(lián)分析、異常檢測(cè)等。
1.4.4? ?機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)是多源數(shù)據(jù)分析中一種重要的方法和技術(shù),它通過建立數(shù)據(jù)模型和算法,利用計(jì)算機(jī)程序來自動(dòng)化地發(fā)現(xiàn)數(shù)據(jù)中的內(nèi)在規(guī)律和模式,不斷優(yōu)化模型和算法,提高數(shù)據(jù)挖掘和分析效率。
1.4.5? ?文本挖掘
文本挖掘是多源數(shù)據(jù)分析中的一項(xiàng)重要技術(shù),它利用自然語言處理、統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)等技術(shù),從文本數(shù)據(jù)中自動(dòng)提取出有用的信息和知識(shí)。常用的文本挖掘技術(shù)包括情感分析、主題建模、關(guān)鍵詞提取等。
1.5? ?數(shù)據(jù)可視化的作用和意義
數(shù)據(jù)可視化是信息技術(shù)發(fā)展和數(shù)據(jù)分析技術(shù)的產(chǎn)物,是將抽象的數(shù)據(jù)轉(zhuǎn)化成圖形、表格、圖像等可視化方式,以增強(qiáng)人們對(duì)數(shù)據(jù)信息的認(rèn)知、理解和分析的過程。在多源數(shù)據(jù)分析中,數(shù)據(jù)可視化有以下幾個(gè)作用和意義。
1.5.1? ?幫助數(shù)據(jù)理解
數(shù)據(jù)可視化通過將大量的、抽象的數(shù)據(jù)轉(zhuǎn)換成有形的、可視的圖形或表格,更容易被用戶理解和掌握。用戶可以通過交互式的方式,直觀地從不同角度、不同維度理解數(shù)據(jù),從而更深入、全面地分析問題。
1.5.2? ?改善數(shù)據(jù)溝通
數(shù)據(jù)可視化呈現(xiàn)數(shù)據(jù)以圖形、表格、動(dòng)畫等方式顯示,極大地減少了數(shù)據(jù)呈現(xiàn)的煩瑣性,使得數(shù)據(jù)分析師可以更加靈活地呈現(xiàn)數(shù)據(jù)和結(jié)果。此外,數(shù)據(jù)可視化使得數(shù)據(jù)和分析結(jié)果更能夠被非專業(yè)和非技術(shù)人員所理解,提高了溝通效率和溝通質(zhì)量。
1.5.3? ?突出數(shù)據(jù)重點(diǎn)
數(shù)據(jù)可視化讓數(shù)據(jù)更具形象、感性的表達(dá),可以幫助用戶快速地找出問題所在,突出數(shù)據(jù)中的重點(diǎn)和特征,以優(yōu)化數(shù)據(jù)分析和處理。它可以有效地提取數(shù)據(jù)中的信息,幫助決策者更好地了解數(shù)據(jù)信息,為決策和策略制定提供了準(zhǔn)確的指導(dǎo)。
1.5.4? ?促進(jìn)建立數(shù)據(jù)分析的思考模式
數(shù)據(jù)可視化通過圖表、動(dòng)畫、圖形等多種方式呈現(xiàn),可以幫助用戶更加抽象地理解數(shù)據(jù)中的規(guī)律。與傳統(tǒng)的數(shù)值模型相比,數(shù)據(jù)可視化幫助用戶從不同角度、不同空間和時(shí)間上理解數(shù)據(jù),幫助用戶建立數(shù)據(jù)分析和解釋的思考模式,從而有效地提升用戶數(shù)據(jù)分析能力。
2? ? ?多源數(shù)據(jù)在實(shí)踐教學(xué)中的應(yīng)用
A高校引用了教務(wù)系統(tǒng),用來實(shí)時(shí)監(jiān)測(cè)跟蹤師生學(xué)習(xí)的大數(shù)據(jù)。在實(shí)踐教學(xué)中,多源數(shù)據(jù)應(yīng)用場(chǎng)景和方法可以包括:利用師生學(xué)習(xí)數(shù)據(jù)分析工具,通過觀察分析學(xué)生的學(xué)習(xí)狀態(tài)、興趣愛好等信息,為學(xué)生提供個(gè)性化的學(xué)習(xí)方案及跟蹤學(xué)習(xí)進(jìn)展;應(yīng)用學(xué)籍?dāng)?shù)據(jù),對(duì)學(xué)生的學(xué)習(xí)情況進(jìn)行整體分析,通過發(fā)掘規(guī)律和趨勢(shì),對(duì)系統(tǒng)設(shè)置進(jìn)行優(yōu)化和改進(jìn)等。此外,多種數(shù)據(jù)源的整合和運(yùn)用,可以更好地支持學(xué)校管理和監(jiān)督教學(xué)質(zhì)量,提升教學(xué)效果并完善對(duì)學(xué)生的綜合素質(zhì)培養(yǎng)。
2.1? ?多源數(shù)據(jù)來源
在該教務(wù)系統(tǒng)中,多源數(shù)據(jù)可以來源于高校教務(wù)管理系統(tǒng)、學(xué)生選課信息系統(tǒng)、校內(nèi)教育研究中心、國家教育統(tǒng)計(jì)數(shù)據(jù)中心等多個(gè)數(shù)據(jù)源,每個(gè)數(shù)據(jù)源收集到的數(shù)據(jù)都具有不同的特征和價(jià)值。
2.2? ?多源數(shù)據(jù)整合
針對(duì)多源數(shù)據(jù)來源的特征,應(yīng)選用合適的數(shù)據(jù)整合方法??梢圆捎脭?shù)據(jù)倉庫構(gòu)建方法,對(duì)學(xué)生、教師、選課、課程表等數(shù)據(jù)進(jìn)行整合,構(gòu)建適用于多種數(shù)據(jù)分析工具的數(shù)據(jù)集。
2.3? ?數(shù)據(jù)挖掘
在多源數(shù)據(jù)整合之后,需要進(jìn)行數(shù)據(jù)挖掘和分析,以尋找數(shù)據(jù)中的統(tǒng)計(jì)規(guī)律和相關(guān)性??梢酝ㄟ^數(shù)據(jù)分析工具對(duì)學(xué)生學(xué)業(yè)成績、家庭背景以及選課行為等數(shù)據(jù)進(jìn)行深入分析和挖掘,以期發(fā)現(xiàn)學(xué)生學(xué)習(xí)績效提升的關(guān)鍵因素和方法。
2.4? ?機(jī)器學(xué)習(xí)
使用機(jī)器學(xué)習(xí)算法對(duì)教育數(shù)據(jù)進(jìn)行分析和處理,以發(fā)現(xiàn)新的知識(shí)和洞見。例如,可以使用決策樹、聚類等算法找出有助于人才培養(yǎng)的因素,為提升教學(xué)質(zhì)量提供依據(jù)。
2.5? ?數(shù)據(jù)可視化
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)可視化是一種重要的展示方式。通過數(shù)據(jù)可視化技術(shù),可以讓數(shù)據(jù)更加直觀、易于理解,對(duì)教育決策和管理具有重要意義。可以將數(shù)據(jù)結(jié)果載入一些數(shù)據(jù)可視化工具如Tableau、Power BI,或者使用Python中的Matplotlib,以圖形化方式展示數(shù)據(jù)分析結(jié)果[4]。
3? ? ?數(shù)據(jù)整合、分析和可視化過程中的實(shí)踐策略
在實(shí)踐教學(xué)中,多源數(shù)據(jù)整合、分析和可視化過程中具體的實(shí)踐包括以下幾個(gè)方面。
3.1? ?數(shù)據(jù)收集與預(yù)處理
首先需要收集來自多個(gè)數(shù)據(jù)源的數(shù)據(jù),并進(jìn)行預(yù)處理。由于數(shù)據(jù)有不同的來源,其格式各不相同,可能需要進(jìn)行格式轉(zhuǎn)換、數(shù)據(jù)過濾、清洗等操作,以便將數(shù)據(jù)整合為一個(gè)統(tǒng)一的數(shù)據(jù)集。
3.2? ?數(shù)據(jù)整合和分析
在數(shù)據(jù)整合和分析過程中,需要考慮多個(gè)來源的數(shù)據(jù)格式、數(shù)據(jù)質(zhì)量等因素。在數(shù)據(jù)整合時(shí),需要借助各種數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)算法,將多源數(shù)據(jù)進(jìn)行融合和集成。在數(shù)據(jù)分析時(shí),需要分析各種教學(xué)數(shù)據(jù)以及相互之間的關(guān)聯(lián)性,將多源數(shù)據(jù)拆分、計(jì)算和組合,探索數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,研究數(shù)據(jù)變化的趨勢(shì)和規(guī)律,發(fā)現(xiàn)問題和提供解決方案等。
3.3? ?數(shù)據(jù)可視化
數(shù)據(jù)可視化是將數(shù)據(jù)通過圖形和圖像的方式展示出來,使數(shù)據(jù)更直觀,易于理解和分析??梢暬夹g(shù)可以加強(qiáng)對(duì)學(xué)生學(xué)習(xí)情況、課程質(zhì)量、實(shí)驗(yàn)數(shù)據(jù)等方面的分析和解釋。例如,通過制作各類圖表,如條形圖、餅圖、熱力圖、矩陣圖等,可以直觀地展現(xiàn)數(shù)據(jù)之間的關(guān)系和趨勢(shì),讓教師和學(xué)生更輕松地理解和分析數(shù)據(jù)。
3.4? ?數(shù)據(jù)挖掘?qū)嵺`
數(shù)據(jù)挖掘可以用于概括出多源數(shù)據(jù)中的潛在規(guī)律或模式,或是因素及原因,或是預(yù)測(cè)性等,提供有助于決策和優(yōu)化的信息。例如,分析學(xué)生成績數(shù)據(jù),挖掘其中關(guān)鍵因素,可以發(fā)現(xiàn)有哪些因素會(huì)影響學(xué)生成績。同時(shí),可以利用數(shù)據(jù)挖掘發(fā)現(xiàn)異常的學(xué)生成績,進(jìn)一步優(yōu)化系統(tǒng),提高教育教學(xué)質(zhì)量。
4? ? ?結(jié)束語
多源數(shù)據(jù)的整合和利用正成為高校實(shí)踐教學(xué)改革中的一個(gè)重要方向,它能夠?yàn)榻逃I(lǐng)域帶來許多新的機(jī)遇和挑戰(zhàn)。本文從多個(gè)方面介紹了多源數(shù)據(jù)的整合和利用方法,以及其在實(shí)踐教學(xué)中的應(yīng)用場(chǎng)景和實(shí)踐方法等,旨在幫助讀者更好地認(rèn)識(shí)多源數(shù)據(jù)在高校實(shí)踐教學(xué)改革中的重要作用和應(yīng)用價(jià)值。
高校實(shí)踐教學(xué)改革是教育發(fā)展的必然趨勢(shì),多源數(shù)據(jù)的整合和利用是高校實(shí)踐教學(xué)改革的重要內(nèi)容之一。我們相信,在未來的新時(shí)代背景下,多源數(shù)據(jù)的應(yīng)用將會(huì)越來越廣泛,不僅是學(xué)校和政府機(jī)關(guān),還包括企業(yè)和社會(huì)組織等各方面。多源數(shù)據(jù)的應(yīng)用將會(huì)為實(shí)踐教學(xué)提供更加精準(zhǔn)的數(shù)據(jù)指導(dǎo),為人才培養(yǎng)和教育改革提供有益的支持和保障。最后,我們希望本文能夠?qū)Ω咝?shí)踐教學(xué)改革和多源數(shù)據(jù)的應(yīng)用提供一定的參考和借鑒。
主要參考文獻(xiàn)
[1]王穎,戴祖旭. 大數(shù)據(jù)時(shí)代高校思想政治教育評(píng)價(jià)方式改革探究[J]. 學(xué)校黨建與思想教育,2018(16):52-54.
[2]李維. 大數(shù)據(jù)時(shí)代高校內(nèi)部審計(jì)改革及發(fā)展策略研究[J]. 教育財(cái)會(huì)研究,2021,32(1):83-87.
[3]呂東剛,譚維智. 高校教學(xué)改革的“數(shù)據(jù)迷思”及其超越[J]. 江蘇高教,2022(6):92-101.
[4]張學(xué)軍. 大數(shù)據(jù)時(shí)代下的高校思政教學(xué)思路研究[J]. 教育研究,2022,4(11):32-35.