鐘志宏
摘 ?要:通過收集、整理和預(yù)處理,獲得較為完整的計算機類畢業(yè)生信息數(shù)據(jù);分析專業(yè)、性別、社會實踐與政治理想、獲取精準扶貧助學(xué)金、違規(guī)違紀處分、畢業(yè)情況等各種因素對學(xué)業(yè)的影響,進而得到地方本科高校計算機學(xué)科教學(xué)管理的若干有意義的指導(dǎo)與建議,為學(xué)生在校期間的學(xué)業(yè)做出預(yù)測性的評估與預(yù)警。
關(guān)鍵詞:數(shù)據(jù)分析;學(xué)業(yè)預(yù)測;計算機教育;地方本科高校;SPSS
中圖分類號:G640 ? ? ? ?文獻標志碼:A ? ? ? ? ? ? 文章編號:2096-000X(2021)19-0052-05
Abstract: By collecting, sorting and preprocessing, this paper obtains more complete information data of computer graduates. Then, the paper analyzes the influence of various factors on academic performance, such as major, gender, social practice and political ideal, targeted poverty alleviation grant, disciplinary punishment and graduation. In the end, some meaningful guidance and suggestions on the teaching management of computer discipline in local universities are put forward, and predictive evaluation and early warning are made for students' academic performance during the school period.
Keywords: data analysis; academic prediction; computer education; local universities and colleges; SPSS
一、問題的提出
隨著我國工業(yè)2025和智能制造戰(zhàn)略的提出,以及信息產(chǎn)業(yè)“自主可控”的現(xiàn)實意義越來越迫切,高素質(zhì)信息技術(shù)人才成為左右國家政治命脈、經(jīng)濟發(fā)展、軍事強弱和文化復(fù)興的關(guān)鍵因素。覆蓋了互聯(lián)網(wǎng)、軟件開發(fā)、硬件設(shè)計、云計算、大數(shù)據(jù)、人工智能等相關(guān)專業(yè)的計算機教育近年來得到了快速發(fā)展。據(jù)統(tǒng)計,目前我國也有1200個院校開設(shè)了計算機類相關(guān)本科專業(yè),其中,“985”“211”院校占15%左右,地方本科院校占85%左右[1]。地方本科院校的計算機類專業(yè)人才培養(yǎng),構(gòu)成了我國信息產(chǎn)業(yè)人才的基礎(chǔ),為區(qū)域經(jīng)濟社會發(fā)展提供了重要智力支持和人才支撐。地方本科院校的生源素質(zhì)與師資水平,決定了其辦學(xué)定位及人才培養(yǎng)目標,當前地方本科院校的計算機類專業(yè)均以就業(yè)為導(dǎo)向、以應(yīng)用型為目標的人才培養(yǎng),以滿足社會發(fā)展與需求。
此外,學(xué)生在校期間的學(xué)業(yè)受多種因素的影響[2],而地方本科院校由于生源情況相關(guān)影響更為顯著;學(xué)校積極利用這些影響因素對學(xué)生在校期間學(xué)習(xí)生活進行指導(dǎo)與激勵,能夠有效提高學(xué)生的學(xué)業(yè)成績;同時,也能夠根據(jù)相關(guān)因素可能導(dǎo)致的不利結(jié)果,對學(xué)生做出學(xué)業(yè)和生活上的合理干預(yù)與預(yù)警,從而確保學(xué)生順利、高效的完成學(xué)業(yè),達成人才培養(yǎng)目標[3]。
二、分析研究方法
數(shù)據(jù)分析與數(shù)據(jù)挖掘成為進行復(fù)雜問題分析的重要方法,通過對客觀真實的數(shù)據(jù)進行分析,不僅能對預(yù)設(shè)問題進行合理解釋,也能發(fā)現(xiàn)隱藏的新問題。數(shù)據(jù)分析與數(shù)據(jù)挖掘方法在教育領(lǐng)域得到了廣泛應(yīng)用[4-5],促進了教育問題的量化分析,成為制定教育教學(xué)各方面決策的主要依據(jù)。
本文通過對獲取我院2020屆計算機類專業(yè)畢業(yè)學(xué)生的學(xué)業(yè)進展數(shù)據(jù)、黨員發(fā)展數(shù)據(jù)、畢業(yè)認證數(shù)據(jù)、精準扶貧獎學(xué)金數(shù)據(jù)、班級班干成員數(shù)據(jù)等進行數(shù)據(jù)集成,然后利用SPSS軟件對數(shù)據(jù)信息綜合分析[6],力求獲得專業(yè)、性別、社會實踐與政治理想、獲取精準扶貧助學(xué)金、違規(guī)違紀處分、畢業(yè)等各種因素對學(xué)業(yè)的影響,進而總結(jié)出有意義的結(jié)論與建議。
三、數(shù)據(jù)準備
數(shù)據(jù)準備(數(shù)據(jù)預(yù)處理)是數(shù)據(jù)分析的前提,合理的、高質(zhì)量的樣本信息是分析結(jié)果準確、有效的保證。在數(shù)據(jù)預(yù)處理中,綜合使用了多種手段和工具,如C語言、Access數(shù)據(jù)庫、SPSS、掃描儀、文字識別軟件等。數(shù)據(jù)預(yù)處理的基本過程如圖1所示。
(一)數(shù)據(jù)抽取
分析研究涉及到2020屆畢業(yè)生的學(xué)業(yè)進展、黨員發(fā)展、畢業(yè)認證、精準扶貧獎學(xué)金、班級班干成員等數(shù)據(jù),這些數(shù)據(jù)來源于不同的系統(tǒng)和渠道、以多種文件格式(包括數(shù)據(jù)庫表、Excel、CSV、文本文檔、數(shù)據(jù)圖片、紙質(zhì)文檔等)存儲。數(shù)據(jù)抽取時,將不同渠道獲取的數(shù)據(jù)均以畢業(yè)生的“學(xué)生編號”作為標識屬性存儲在不同的數(shù)據(jù)表中,并存入用于數(shù)據(jù)初步處理的Access數(shù)據(jù)庫中。
在上述過程中,處理的難點在于非機構(gòu)化存儲的文本文檔、圖片和紙質(zhì)文檔,本文采用的處理方法如下:
1. 對于非結(jié)構(gòu)化存儲的文本文件,編寫字符過濾程序?qū)?shù)據(jù)進行格式化。
2. 對于紙質(zhì)文檔,首先利用掃描儀數(shù)字化以PDF文檔形式存儲在計算機中,再通過文字識別軟件進行識別以獲得文字,最后對獲得的文字進行核對及數(shù)據(jù)格式化。圖片文件采用相應(yīng)的處理方式。
(二)數(shù)據(jù)集成
通過數(shù)據(jù)抽取,將不同渠道信息存儲在Access的不同數(shù)據(jù)表中,并經(jīng)過簡單的處理及分析。然后,將Access中的數(shù)據(jù)表導(dǎo)入SPSS分析軟件,利用“變量合并”功能將多個表中的信息根據(jù)“學(xué)生編號”標識進行數(shù)據(jù)合并;合理設(shè)計合并后數(shù)據(jù)表中的變量屬性:數(shù)據(jù)類型、寬度、小數(shù)點位數(shù)、標簽、值、度量標準、角色等,最后以SPSS支持的“sav”格式保存數(shù)據(jù);通過數(shù)據(jù)的規(guī)范化,便于后續(xù)在SPSS中進行數(shù)據(jù)分析。