張汝陽+魏永越+趙楊+于浩+陳峰
摘要:生物統(tǒng)計學(xué)專業(yè)旨在培養(yǎng)高素質(zhì)的復(fù)合型統(tǒng)計應(yīng)用人才。SAS軟件高級編程是優(yōu)秀生物統(tǒng)計學(xué)人才的必備技能。因此,SAS軟件高級編程教學(xué)對專業(yè)人才培養(yǎng)至關(guān)重要。目前,國內(nèi)開設(shè)生物統(tǒng)計學(xué)專業(yè)的醫(yī)學(xué)院校屈指可數(shù),且SAS軟件高級編程教學(xué)經(jīng)驗相對缺乏。本文以我校生物統(tǒng)計學(xué)本科生的課程教學(xué)實踐為例,對課程設(shè)置、教學(xué)內(nèi)容、授課方式、考核形式、參考教材、軟硬件設(shè)施和教學(xué)效果進(jìn)行了總結(jié)和思考,以期進(jìn)一步提高教學(xué)質(zhì)量、保障生物統(tǒng)計學(xué)本科生的職業(yè)競爭力。
關(guān)鍵詞:生物統(tǒng)計學(xué);本科生;SAS軟件高級編程
中圖分類號:G642.0 文獻(xiàn)標(biāo)志碼:A 文章編號:1674-9324(2017)52-0114-03
2011年,經(jīng)國務(wù)院學(xué)位委員會批準(zhǔn),統(tǒng)計學(xué)獨立成為理學(xué)一級學(xué)科,下設(shè)兩個二級學(xué)科:統(tǒng)計學(xué)、應(yīng)用統(tǒng)計學(xué)。生物統(tǒng)計學(xué)是隸屬于應(yīng)用統(tǒng)計學(xué)之下的三級學(xué)科[1]。為適應(yīng)我國生物醫(yī)藥領(lǐng)域?qū)ι锝y(tǒng)計人才的需求,加快培養(yǎng)專業(yè)人才,南京醫(yī)科大學(xué)在2012年正式開設(shè)全日制應(yīng)用統(tǒng)計學(xué)專業(yè)(生物統(tǒng)計學(xué)方向),每年面向全國招收約30名本科生,四年制,授予理學(xué)學(xué)士學(xué)位[2]。該專業(yè)的總體目標(biāo)是培養(yǎng)“具備系統(tǒng)的統(tǒng)計學(xué)知識、了解統(tǒng)計學(xué)理論、掌握統(tǒng)計學(xué)的基本思想和方法,具有利用計算機軟件分析數(shù)據(jù)的能力,能在生物、醫(yī)藥等領(lǐng)域工作的高素質(zhì)、復(fù)合型的統(tǒng)計應(yīng)用人才”[3]。
SAS軟件是全球商業(yè)智能和分析軟件與服務(wù)領(lǐng)袖。全世界超過6萬家企業(yè)利用SAS軟件進(jìn)行數(shù)據(jù)挖掘,以便準(zhǔn)確地進(jìn)行業(yè)務(wù)決策。在新藥臨床試驗領(lǐng)域,SAS軟件更是使用最廣泛的分析平臺。根據(jù)培養(yǎng)目標(biāo),我們在第3學(xué)年的第1學(xué)期開設(shè)了《SAS軟件高級編程》課程。該課程是《SAS應(yīng)用基礎(chǔ)》的進(jìn)階課程,旨在培養(yǎng)學(xué)生編程思維,傳授編程技巧,提高數(shù)據(jù)管理和分析的技能,達(dá)到“技術(shù)高、速度快、失誤少”的業(yè)務(wù)水平,滿足相關(guān)領(lǐng)域?qū)I(yè)人才的需求。
由于我國開設(shè)生物統(tǒng)計學(xué)專業(yè)的醫(yī)學(xué)院校屈指可數(shù),缺乏健全的課程方案參考[4]。在兄弟院校、制藥企業(yè)、我校公共衛(wèi)生學(xué)院、教務(wù)處、研究生院等多方專家指導(dǎo)之下,我們結(jié)合用人單位實際工作需要制定了課程方案。結(jié)合之前2003級五年制預(yù)防醫(yī)學(xué)專業(yè)(生物統(tǒng)計學(xué)方向)的辦學(xué)經(jīng)歷、近5年四年制理學(xué)生物統(tǒng)計學(xué)專業(yè)辦學(xué)經(jīng)驗,我們已經(jīng)持續(xù)10年對生物統(tǒng)計學(xué)本科生培養(yǎng)進(jìn)行了一系列探索和改革。針對《SAS軟件高級編程》課程,我們也不斷根據(jù)學(xué)生的教學(xué)意見反饋、雇主用工反饋等,將課程設(shè)置、教學(xué)內(nèi)容、授課方式等逐年完善。我們在此對該課程進(jìn)行總結(jié)與思考。
一、課程設(shè)置
《SAS軟件高級編程》是生物統(tǒng)計學(xué)專業(yè)的必修課程,學(xué)時設(shè)置為72。其中,理論學(xué)時24,實驗學(xué)時48。學(xué)生通過考核,可獲得4個學(xué)分。
二、教學(xué)內(nèi)容
我們一共安排了18次課程。理論教學(xué)及實踐操作內(nèi)容包括:
1.基礎(chǔ)知識復(fù)習(xí)。復(fù)習(xí)先修課程《SAS應(yīng)用基礎(chǔ)》,承前啟后。從教學(xué)內(nèi)容和學(xué)生心理上,做好由“簡”入“難”的銜接。另外,展示基于SAS軟件完成的項目,突出高級編程技能的作用和優(yōu)勢,激發(fā)學(xué)生課程學(xué)習(xí)的熱情和積極性。
2.宏變量及宏程序。介紹宏程序的基本結(jié)構(gòu)、基本概念和語法、宏變量類型、宏變量的賦值與解析,讓學(xué)生認(rèn)識宏程序;介紹宏的創(chuàng)建、編譯、保存、調(diào)用與更新,以及日志的解讀和宏調(diào)試,讓學(xué)生能夠管理宏程序。
3.宏的循環(huán)體介紹。介紹循環(huán)方式、條件判斷、中止、跳轉(zhuǎn)語句,讓學(xué)生理解程序“批量處理”、“容錯”、“自動化”等概念;介紹SQL過程與DATA步與宏變量的交互方式、動態(tài)構(gòu)造SAS宏語句,讓學(xué)生掌握“用程序?qū)懗绦颉钡年P(guān)鍵技能;介紹宏的嵌套、包裝,讓學(xué)生理解“分而治之、逐個擊破”的概念,掌握撰寫復(fù)雜程序的技能。
4.系統(tǒng)宏函數(shù)介紹。介紹字符函數(shù)、運算函數(shù)、引用函數(shù)、屬性函數(shù)等用法,以及如何使用逃逸符賦值、解析特殊字符等,讓學(xué)生全面掌握系統(tǒng)函數(shù),撰寫高效、簡潔的宏程序。
5.數(shù)據(jù)集函數(shù)介紹。介紹ATTRN、VarNum、FetchOBS、GetVarN、Open、Close等數(shù)據(jù)集函數(shù),使得學(xué)生能夠快速獲取數(shù)據(jù)集本身及變量的基本信息,以便高效地進(jìn)行宏變量與數(shù)據(jù)集間的信息交互。
6.DATA步使用技巧。介紹不同讀取數(shù)據(jù)方式的效率、創(chuàng)建數(shù)據(jù)集的技巧、數(shù)據(jù)集橫向與縱向拼接、記錄的修改、循環(huán)語句、條件語句、RETAIN語句、外部數(shù)據(jù)導(dǎo)入、記錄導(dǎo)出、記錄的擴展、變量排序技巧、數(shù)據(jù)集轉(zhuǎn)置,數(shù)組類型、變量格式化、自定義變量格式、格式互轉(zhuǎn)等常見技巧,以期提高學(xué)生數(shù)據(jù)管理的軟件技能。
7.SQL過程數(shù)據(jù)管理。介紹SQL過程中表格與視圖的差別、表格的創(chuàng)建、更新、拼接、刪除、記錄的查詢、多重查詢等。同時,比較DATA步與SQL過程中相同功能的運算速度,給出實際應(yīng)用的參考建議。
8.IML矩陣運算I。介紹矩陣性質(zhì)、矩陣元素、創(chuàng)建矩陣、運算符號、矩陣運算、下標(biāo)運算、矩陣更新、缺失處理、矩陣函數(shù)等。
9.IML矩陣運算II。介紹IML程序設(shè)計語言(循環(huán)、條件判斷、跳轉(zhuǎn)、定義模塊、調(diào)用模塊)、矩陣與SAS數(shù)據(jù)集相互轉(zhuǎn)換(打開、顯示數(shù)據(jù)集、轉(zhuǎn)換為矩陣、讀取記錄、讀取變量等)、IML環(huán)境下對SAS數(shù)據(jù)集的操作等。通過兩次IML矩陣運算課程,使得學(xué)生可以利用SAS軟件實現(xiàn)指定的復(fù)雜統(tǒng)計算法。
10.模擬試驗I。介紹蒙特卡洛的典故、思想、步驟;介紹各種統(tǒng)計分布的隨機函數(shù);介紹產(chǎn)生縱向和橫向模擬數(shù)據(jù)的方式、優(yōu)缺點。以“分別從不同分布的總體中抽樣,探討不同樣本含量、抽樣次數(shù)對樣本均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤的分布的影響”為案例,介紹模擬試驗的基本步驟:理解模擬試驗?zāi)康摹⒛M試驗流程→預(yù)估模擬試驗結(jié)果→調(diào)試各步SAS的程序→統(tǒng)籌撰寫SAS宏程序→運行程序等待結(jié)果→整理結(jié)果繪制報告。
11.模擬試驗II。設(shè)計多種案例,供學(xué)生上機操作,鞏固模擬試驗技能。例如:從正態(tài)分布中隨機抽取樣本,根據(jù)樣本估計總體均數(shù)的95%可信區(qū)間。重復(fù)1000次,有多少次能估計到總體均數(shù)?不同的樣本含量、不同的可信度對結(jié)果有什么影響?
12.ODS輸出傳送系統(tǒng)。介紹ODS的功能;介紹ODS常用語句,包括:管理輸出對象,打開、關(guān)閉、管理ODS目標(biāo)(輸出為rtf文件、自定義文件的格式等)。
13.DDE文件交互技術(shù)。介紹Excel文件數(shù)據(jù)導(dǎo)入為SAS數(shù)據(jù)集、SAS數(shù)據(jù)集輸出到Excel、整理或修改Excel文件格式、SAS數(shù)據(jù)集輸出到Word等。
14.常見報表過程。著重介紹TABULATE過程的選項、含義,以及自定義表格樣式。
15.綜合案例I:撰寫宏用于:(1)批量進(jìn)行單因素或多因素的線性回歸分析;(2)批量進(jìn)行組間均數(shù)、率或中位數(shù)的描述和比較;(3)評價Fisher確切概率法和卡方檢驗的統(tǒng)計學(xué)性質(zhì)。
16.綜合案例II:撰寫宏用于:(1)批量安裝多個SAS宏程序;(2)實現(xiàn)二分法搜索目標(biāo)值;(3)自動生成MIXED過程中CONTRAST語句兩兩比較的代碼。
17.綜合案例III:(1)從同一個正態(tài)分布總體中隨機抽取2個樣本,設(shè)定檢驗水準(zhǔn)0.05,對均數(shù)進(jìn)行檢驗。重復(fù)1000次,拒絕H0的比例多大?改變檢驗水準(zhǔn)、樣本含量,比例有何變化?從均數(shù)不同、方差相同的兩個正態(tài)分布總體中隨機抽樣。重復(fù)上述步驟,結(jié)果如何?(2)配對設(shè)計的兩均數(shù)比較,如果不用配對t檢驗而采用成組t檢驗,對一類錯誤和檢驗效能有何影響?改變樣本含量有何影響?(3)多組均數(shù)比較,如果不考慮ANOVA的結(jié)果,而直接用兩兩比較,對一類錯誤和檢驗效能有何影響?
18.綜合案例IV:(1)從二元正態(tài)分布中隨機抽樣,并對樣本進(jìn)行回歸分析,畫出回歸曲線。重復(fù)上述過程100次,看到什么圖形?(2)同時對兩個假設(shè)進(jìn)行統(tǒng)計學(xué)檢驗,若要控制總一類錯誤0.05,一般每個檢驗水準(zhǔn)設(shè)為0.025。可否一個0.04,另一個0.01?(3)Permutation檢驗可以利用手頭樣本來進(jìn)行假設(shè)檢驗,對總體分布沒有要求。請利用已有方法進(jìn)行驗證,并編寫程序,對變異系數(shù)進(jìn)行檢驗。
三、授課方式
根據(jù)教學(xué)內(nèi)容,采用“量體裁衣”的策略進(jìn)行授課。課程初期,采用“教師講解示范、學(xué)生上機操作、現(xiàn)場互動答疑”的形式,確保學(xué)生“聽懂了、學(xué)會了”。課程后期,學(xué)生已經(jīng)掌握大部分編程技能。授課方式改為“以學(xué)生為主體”,采用“教師—學(xué)生互動交流”的形式,即:學(xué)生代表給出編程思路,其他學(xué)生給出補充意見,教師再次點評并完善編程思路。學(xué)生在課堂當(dāng)場完成實踐內(nèi)容,并進(jìn)行現(xiàn)場程序與結(jié)果的展示。我們期望發(fā)揮學(xué)生的主觀能動性,提高教學(xué)效果。
四、考核形式
課程成績由平時成績(30%)和卷面成績(70%)組成。課程結(jié)束后,教師通過南京醫(yī)科大學(xué)ELearning課程中心平臺發(fā)放練習(xí)。學(xué)生通過平臺接收題目、提交程序代碼和圖表結(jié)果。教師評閱打分后,折算平時成績。期末考試為上機考試。以實際項目為考題,要求學(xué)生在指定時間內(nèi)完成編程,并提交代碼和結(jié)果。教師評閱打分后,折算成卷面成績。
五、參考教材及軟硬件設(shè)施
由于缺乏合適的教材,我們目前采用內(nèi)部自編講義授課。內(nèi)容主要參考以下白皮書《SAS Macro Programming Made Easy》、《SAS Macro Language Reference》和《SAS SQL Procedures Users Guide》。
軟件設(shè)施:我院生物統(tǒng)計學(xué)系擁有正版SAS軟件的授權(quán)許可。
硬件設(shè)施:本課程涉及統(tǒng)計模擬試驗、大型數(shù)據(jù)管理與分析等計算密集型工作。為提高學(xué)生上機體驗,保證教學(xué)質(zhì)量,我院搭建了高性能計算集成系統(tǒng)。該系統(tǒng)包括1個胖節(jié)點(1TB內(nèi)存,8顆8核處理器)、18個刀片計算節(jié)點(每個節(jié)點64GB內(nèi)存,含2顆16核CPU)、2個管理節(jié)點和一個儲存系統(tǒng)。該集群21個節(jié)點的總內(nèi)存為2280 GB,CPU共704核,浮點運算能力理論峰值達(dá)到5.38千萬億次級。在此系統(tǒng)基礎(chǔ)上,我們專門為生物統(tǒng)計學(xué)專業(yè)本科生部署了云端機房,可同時容納約60名學(xué)生進(jìn)行上機操作與考試。
師資隊伍:生物統(tǒng)計學(xué)系現(xiàn)有專任教師14人。具有博士學(xué)位的12人,高級職稱的5人。8人具有海外留學(xué)經(jīng)歷。10人具有長期SAS教學(xué)經(jīng)驗、SAS技能競賽導(dǎo)師經(jīng)歷。
六、教學(xué)效果
“匯豐杯”中國高校SAS數(shù)據(jù)分析大賽是目前全國規(guī)模最大、認(rèn)可度最高的SAS軟件技能大賽。我院生物統(tǒng)計學(xué)專業(yè)本科生積極組隊參加大賽。2015年,我院2支隊伍分別獲得全國第20名、29名的成績。2016年,我院3支隊伍從658支隊伍中脫穎而出,分別獲全國第6名、22名、46名的好成績。
全國大學(xué)生統(tǒng)計建模大賽由中國統(tǒng)計教育學(xué)會、中國現(xiàn)場統(tǒng)計研究會、中國數(shù)學(xué)與概率統(tǒng)計學(xué)會、中國衛(wèi)生信息學(xué)會、中國市場信息調(diào)查業(yè)協(xié)會聯(lián)合舉辦。我院首屆生物統(tǒng)計學(xué)專業(yè)本科生組成的3支參賽隊伍在2015年第四屆大賽中,分別獲得大數(shù)據(jù)統(tǒng)計建模類(本科生組)二等獎、三等獎、優(yōu)秀獎的成績。本課程研究生助教組成的隊伍則獲得大數(shù)據(jù)統(tǒng)計建模類(研究生組)一等獎第一名的優(yōu)異成績。
此外,自2013年起,生物統(tǒng)計學(xué)專業(yè)的本科生連續(xù)獲得勃林格殷格翰(Boehringer-Ingelheim)獎學(xué)金課題資助,運用編程技能,就臨床試驗熱點問題開展理論與實踐研究。
七、體會與思考
從課程設(shè)置上看,我們通過1∶2的理論與實踐比例,強化學(xué)生的動手意識,著重培訓(xùn)學(xué)生的操作能力。這也符合近年來國家一直倡導(dǎo)的“知行合一”的教學(xué)理念。從教學(xué)內(nèi)容上看,我們從實際需求出發(fā),傳授編程技巧,培養(yǎng)優(yōu)秀程序員的思維。模擬試驗I的案例對應(yīng)的是中心極限定理。模擬試驗II的案例對應(yīng)的是可信區(qū)間。綜合案例則涉及一類錯誤、檢驗效能、兩兩比較等統(tǒng)計學(xué)概念。學(xué)生既能綜合運用編程技術(shù)解決實際問題,又能深刻理解理論知識,達(dá)到“實踐出真知”。此外,從授課方式看,我們以具體案例為切入點,運用以學(xué)生為主體的教學(xué)方法,其本質(zhì)也是“以問題為導(dǎo)向的學(xué)習(xí)(problem-based learning,PBL)”方式,有利于保證教學(xué)質(zhì)量[5]。
盡管目前教學(xué)效果尚可,但仍有值得改進(jìn)之處。就教學(xué)內(nèi)容而言,部分現(xiàn)有案例的主題不夠新穎,案例內(nèi)容需要與時俱進(jìn)[6]。例如,當(dāng)下疾病研究熱點是:從組學(xué)的角度探索影響其發(fā)生、發(fā)展的遺傳因素。能否運用SAS有效地進(jìn)行高維數(shù)據(jù)挖掘值得思考。就授課方式而言,我們可以在課堂上開展小組競賽,設(shè)置獎品,增加課程的趣味性,激發(fā)學(xué)生的積極性。
《SAS軟件高級編程》是一門真正的“理論與實踐相結(jié)合”的專業(yè)技能課程。經(jīng)過本課程培訓(xùn),學(xué)生能夠達(dá)到統(tǒng)計知識與技能“綜合運用、融會貫通”的水平,保障學(xué)生從事生物統(tǒng)計學(xué)相關(guān)工作的職業(yè)競爭力。
參考文獻(xiàn):
[1]袁衛(wèi).機遇與挑戰(zhàn)——寫在統(tǒng)計學(xué)成為一級學(xué)科之際[J].統(tǒng)計研究,2011,28(11):3-10.
[2]趙麗萍,趙楊,于浩,胡志斌,陳峰.生物統(tǒng)計學(xué)本科專業(yè)人才培養(yǎng)方案的設(shè)置與思考[J].中國衛(wèi)生統(tǒng)計,2015,32(2):364-365.
[3]中華人民共和國教育部高等教育司.普通高等學(xué)校本科專業(yè)目錄和專業(yè)介紹[M].北京:高等教育出版社,2012.
[4]陳平雁,安勝利,徐燕,陳征,李丹玲,譚旭輝.南方醫(yī)科大學(xué)生物統(tǒng)計學(xué)專業(yè)本科課程設(shè)置的探討[J].中國衛(wèi)生統(tǒng)計,2009,26(6):666.
[5]周明,王建明,趙麗萍,唐少文,陸慧,章靜,王美林,彭志行,易洪剛,胡志斌.公共衛(wèi)生以問題為導(dǎo)向?qū)W習(xí)的案例撰寫及常見問題分析[J].中華預(yù)防醫(yī)學(xué)雜志,2016,50(4):377-379.
[6]魏永越,趙麗萍,趙楊,柏建嶺,易洪剛,于浩,陳峰.生物統(tǒng)計專業(yè)學(xué)生實踐創(chuàng)新能力培養(yǎng)模式初探[J].中國衛(wèi)生統(tǒng)計,2016,(6):1079-1081.