宋明麗
摘? ? 要:文章從數據分析實驗課程設置的必要性出發(fā),針對當前數據分析實驗課程現(xiàn)狀,分析數據分析實驗教學存在的問題,提出了基于成果展示(Poster)的數據分析實驗課程改革策略。
關鍵詞:數據分析;實驗課程;成果展示;課程改革
中圖分類號:G642.3? ? ? ? ? 文獻標識碼:A? ? ? ? ? ?文章編號:1002-4107(2020)04-0035-02
數據爆炸與信息高速發(fā)展時代,計算機學科面臨的一個重要問題就是如何從海量的、結構化或非結構化的數據中挖掘出人類需要的知識,這些知識用以幫助人們做出合理的決策。數據分析這門課正是繼概率與數理統(tǒng)計等課程之后,數據挖掘課程等深度分析之前的基本的數據處理與分析的課程[1-2]。數據分析理論課程的主要目標是使學生學會如何收集數據,預處理數據,處理數據,獲取知識。數據分析課程理論性比較強,統(tǒng)計學知識占據很大比例,學生學起來比較吃力。因此,課程一般設有實踐環(huán)節(jié)(實驗課),使學生能夠學以致用,更好地理解理論知識。然而,同傳統(tǒng)的實驗課一樣,數據分析實驗課程不可避免地遇到了一些教學上的問題,如實驗步驟按部就班、學生積極性不高等。
通過幾年的對數據分析理論課與實驗課的教學研究,筆者總結了現(xiàn)有實驗課教學存在的不足,提出了基于成果展示,即Poster(海報)的實驗課程改革研究方案。
一、數據分析實驗課程設置的必要性
數據分析這門課程既包含了一些常用的高級的統(tǒng)計學方法,又囊括了一些基本的簡單的數據挖掘的方法。數據分析與經濟學、管理學、醫(yī)學、天文學、生物學、工學、社會學等其他學科緊密相連。隨著網絡的迅速發(fā)展,來自網絡上的數據量大大增加,社會迫切需要具有數據分析能力與經驗的人才。中國傳媒大學自2015年開設大數據專業(yè)至今,開設了數據分析等相關課程。通過這幾年的教學探索,筆者總結了一點心得體會。數據分析理論課程必須講解經典常用的理論與方法,這些方法大多需要公式的推導,比較枯燥。而數據分析的實驗課程需要應用各學科的實際數據進行編程分析,讓學生真正體會到數據分析理論的作用,這樣才能使學生具備一定的數據分析能力,畢業(yè)后可以直接面對工作中的問題。
(一)有助于培養(yǎng)大學生的科研素質
數據分析實驗課程是將數據分析理論應用于實踐的一門課程。毫不夸張地說,如果沒有實驗課程,學生就不能真正地理解數據分析的方法,就不能很好地從事未來的數據相關的工作。通過實驗課程,學生可以提高兩方面的能力:(1)發(fā)現(xiàn)問題的能力;(2)恰當運用理論方法解決實際問題的能力。在實驗當中,通過數據采集,數據整理,數據分析等過程,培養(yǎng)學生一絲不茍的嚴謹的科學精神。
(二)有利于培養(yǎng)學生的實踐能力
數據分析的實踐必須依附于統(tǒng)計軟件與工具箱,如Excel, SPSS, SAS, Matlab,等。這些軟件雖然不難,但也需要從頭學起,而且要想熟練掌握一個軟件或語言,必須反復練習。數據分析實驗課程不僅讓學生學會了運用數據分析理論的同時,也鍛煉了學生學習與應用軟件的能力。
時代需要數據分析的人才。計算機的出現(xiàn),網絡的發(fā)展,使得當今社會的數據量呈爆炸式增長,如經濟領域、金融領域、人口統(tǒng)計、醫(yī)學領域和社會學等民生領域。怎樣從這些龐大的數據當中選取我們需要的信息一直是科學家努力探索的事情。作為一名大學生,不僅需要掌握統(tǒng)計與挖掘的基礎理論知識,還需要通過數據分析實驗課鍛煉理論與實際相結合的能力。
二、數據分析實驗課程現(xiàn)狀分析
數據分析實驗課程不同于其他的計算機類實驗課程。如C語言的實驗課,教師布置一項題目,學生自行編碼,實驗過程中教師的主要任務是幫助學生找出編碼中的錯誤。數據分析的實驗課程一般由教師給定一個題目,學生進行數據收集,預處理,數據分析,最終獲得結論。這其中的每一個環(huán)節(jié)都可能產生學生解決不了的問題,因此,實驗課程應采取小班制,或者輔以研究生助手。如題目為采用matlab軟件進行判別分析蠓蟲問題[3]。數據收集:是直接在matlab中輸入還是由其他文件導入?如果是輸入數據,必須確定在輸入無誤的情況下才可以進行下一步,否則出錯。數據預處理:數據本身是否需要歸一化?歸一化與不歸一化的結果有何區(qū)別?數據分析:到底是采用總體協(xié)方差矩陣相同還是不相同的方法進行判別?不同的方法產生的結果是否相同?該如何解釋每一種方法下的結果?獲取知識:如果不同方法的結論不一致,該怎樣抉擇?不同的數據是否應考慮不同的方法?這些都是在實驗過程中學生可能碰到的問題。通過對這些問題的思考與解答,學生了解到數據分析理論與應用的緊密性。
數據分析實驗課可選的軟件很多,如SPSS[4], SAS, Matlab, 等等。本人選用了SPSS與Matlab兩種。SPSS是經典的統(tǒng)計分析軟件,它具有大量成熟的統(tǒng)計分析方法,完善的數據定義操作管理,開放的數據接口以及靈活的統(tǒng)計表格與圖形,很多著名公司都采用這個軟件,掌握SPSS使學生能夠更從容地面對未來的工作。Matlab是基于C的一個高級編程工具,它是一套高性能的數值計算和可視化的軟件,集矩陣計算、數值分析、信號處理和圖形顯示于一體,軟件本身有很多內置函數可以直接調用,也可以方便編寫自己想要的程序代碼,對于研究型的題目比較適合。采用這兩個軟件既可以使學生能夠應對未來的就業(yè)問題,也可以提高他們的科研水平,為研究生階段的學習打下基礎。
三、數據分析實驗課程存在的問題
目前有很多優(yōu)秀的數據分析軟件,可以為數據分析的實驗提供準確快速的答案,盡管如此,數據分析的實踐課程還是具有一定的問題與困難[5-6]。
(一)理論知識與實際問題結合困難
學生在數據分析理論課程上學到很多公式定理,怎樣應用于實際問題中是首要問題。一般數據分析的實驗題目通常都是教師提出,用給定的方法解決某一個問題。而實際問題需要學生自己面對并提出解決方案。比如,醫(yī)學上,有一種病癥X是一種常見疾病,目前有5種藥物可以對其進行治療,不同的藥物對不同的病人有不同的療效,新入職的醫(yī)生不具備依據一定的經驗來判斷的能力,怎樣訓練一個決策支持系統(tǒng)是可以利用歷史數據分析得到的。因此,理論與實際問題之間的關系是需要在實驗課上把握好的。
(二)實驗結果難以解釋
數據分析面臨的數據多種多樣,很多學生由于預處理方法不同,采用的分析方法也不同,導致結果可能與給定的結果不一樣,甚至相反。這就需要我們探究每一種方法的理論依據。由結果解釋原因本身就是一個數據分析的過程,也是提高學生能力的一個過程。
(三)教學形式單一
一般的實驗課程包括以下環(huán)節(jié):教師給出題目,學生根據問題選取方法解決,給出報告,教師進行批改講解等。許多計算機類的課程均采取這樣的形式。這種傳統(tǒng)的課程環(huán)節(jié)對學生來說比較沉悶,他們覺得沒有成就感,大大削弱了他們的積極性。每次實驗都采取相同的流程,學生一般屬于應付式的思想,沒有探索精神。
四、數據分析實驗課程改革策略
針對以上討論的數據分析實驗課程的現(xiàn)狀與問題,筆者總結出幾點改革建議。
1.每個題目的考核辦法除了報告之外,最主要是繪出一個Poster,即海報。Poster是報告的主要內容的精煉,將所有重要的結論展示在一張紙上,有圖有表,有分析。讓學生以合適的大小打印出來,答辯時展出Poster進行本題目的講解。這種能看得到成果的方法既可以提高學生的自信,也可以增加趣味性,提高學生參與的積極性。通過講解與Poster的結合,其他學生一下可以比較出自己的優(yōu)勢與不足,在以后的實驗課中予以改進。Poster一般是會議的一項內容,主要陳述參會者的主要貢獻,在這里采用這樣的方法亦可以讓學生提前演練參與會議的流程。
2.在理論課的講解中,每一個算法后面都加入該算法的實際應用問題,如本算法的局限性是什么,優(yōu)勢是什么,在解決什么問題時比較有效。這樣,在實驗課中,教師提出問題之后,讓學生迅速回想都有哪些方法可以解決這個問題。在討論確定了可選用的方法之后再進行實驗操作,這樣從源頭避免了一些問題的產生。
3.實驗過程中將學生分組進行討論。學生2—3人一組,編程時自己獨立實現(xiàn),結果運行成功之后討論結果的有效性與正確性,最后由教師講解。讓學生先討論的辦法可以節(jié)省教師逐一解答的時間,提高課堂效率,也促進了學生之間的相互交流,培養(yǎng)團隊意識。
科學的進步與發(fā)展,不僅要求大學生不斷提高自身的能力,同樣要求教師提高教學質量。作為計算機相關專業(yè)的核心課程,數據分析的作用是至關重要的,而數據分析實驗課程是數據分析課程重要的組成部分,怎樣上好實驗課程是筆者一直學習探索的問題。本文通過分析數據分析實驗課程的現(xiàn)狀與問題,提出了幾點建議,并運用于實際授課過程,取得了不錯的效果。當今社會,信息技術人才與統(tǒng)計應用人才排名位列就業(yè)需求榜的前列,具有統(tǒng)計知識與計算機知識的復合型應用人才在未來具有巨大的發(fā)展?jié)摿?。因此,學好數據分析理論課與實驗課等相關的課程對當代大學生的未來發(fā)展具有重要意義。
參考文獻:
[1]趙衛(wèi)東,趙洪博.基于項目沉浸式的數據分析類課程教學研究[J].計算機教育,2017,(6).
[2]張蕾,魏立斐.大數據時代下“數據分析”課程的探索[J].教育教學論壇,2015,(25).
[3]吳禮斌,李伯年.MATLAB數據分析方法:第2版[M].北京:機械工業(yè)出版社,2017:115.
[4]薛薇.基于SPSS的數據分析方法:第3版[M].北京:中國人民大學出版社,2016:1.
[5]張慧.信息管理專業(yè)數據分析課程實驗教學研究[J].計算機時代,2015,(10).
[6]李玉峰,汪潔明,賀玲,等.實驗設計與數據分析教學的緊要性[J].當代教育理論與實踐,2016,(5).