吳佳芬 李曙光
摘 要 本文提出了在C語言教學實踐中應重視教導學生編寫可靠的程序,特別要強調程序的輸入安全性處理。并針對相關問題展開了具體的討論,指出教學中的關鍵點。
關鍵詞 C語言 教學 實踐 輸入 安全性
中圖分類號:G64文獻標識碼:A
0背景
當前計算機系統(tǒng)安全性問題受到了空前的重視,重要原因是互聯(lián)網(wǎng)的廣泛應用使不知身在何處的人都可能把信息送到我們的計算機里去。隨著近年移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)技術的飛速發(fā)展,系統(tǒng)安全、信息安全等問題又面臨了新的挑戰(zhàn)。歸根溯源,目前廣泛使用的系統(tǒng)和應用軟件中存在大量安全性缺陷,計算機基礎教學中缺乏對學習者在安全性方面知識和規(guī)范的教育可能難辭其咎。
我們希望從學生開始學習程序設計時就特別關注程序安全性問題,在教學中不斷出現(xiàn)對安全性問題的討論,提高學生的編寫健壯性好、安全性高的程序的意識和能力。
1正確與可靠
我們要求學生編寫正確的程序,這是C語言教學最基本的要求。但什么是正確的程序呢?針對一個具體問題寫出的一段程序或是一個函數(shù)的正確與否,可以設法給出嚴格的定義,這種定義可以是一個具有數(shù)學意義的嚴格性定義,程序理論研究者在這方面已經(jīng)做了很多工作。本文并不討論嚴格的定義,主要借助以下直觀觀察:(1)一個C函數(shù)從參數(shù)計算出返回值的過程,即從輸入到輸出。(2)一個與外部交互的程序從輸入的數(shù)據(jù)計算出輸出數(shù)據(jù)的過程。
但是,函數(shù)和程序通常不是對所有輸入都能計算出輸出的。例如求平方根的函數(shù),它只能對非負的double類型的數(shù)值計算出結果。又如,C編譯程序只能對滿足C語言語法的字符串生成目標代碼。參考上述情況,對程序的正確性可以有如下認識:(1)一個C函數(shù)對滿足要求的參數(shù)計算出正確的返回值。(2)一個與外部交互的程序,對滿足要求的輸入數(shù)據(jù)都能計算出正確的輸出。
2遇到不正確輸入時的行為
考慮這樣的情況:如果寫了一個程序,該程序對形式合適的數(shù)據(jù)都能正確的計算并輸出其平均值,這個程序完成了所需工作,那么可以認為該程序是正確的?,F(xiàn)在假設輸入的數(shù)據(jù)有錯,例如文件里出現(xiàn)了不能轉換為數(shù)值的字符或字符序列,這時程序已不能“正?!蓖瓿晒ぷ髁?,那么這個程序可能出現(xiàn)的行為有:
(1)報告被處理數(shù)據(jù)有錯,輸出正常輸入數(shù)據(jù)的平均值后結束;
(2)報告數(shù)據(jù)有錯,丟掉非數(shù)字字符后繼續(xù)處理,直至讀入所有數(shù)據(jù)并輸出得到正確數(shù)據(jù)的平均值后結束;
(3)報告數(shù)據(jù)有錯后立即結束;
(4)沒有任何報告,產(chǎn)生輸出后結束;
(5)不產(chǎn)生任何輸出就立即結束;
(6)陷入無限循環(huán),既不報告數(shù)據(jù)有錯誤也不結束;
(7)進入不明狀態(tài),胡亂修改內(nèi)存甚至破壞其他正在運行的程序,或破壞計算機內(nèi)存或外存里的數(shù)據(jù)后結束或不結束。
對用戶而言,前三種情況比較容易接受。第4種情況容易給人造成假象和誤解。第5、6兩種情況會讓人感到莫名其妙。最后的情況則非??膳隆嶋H程序中常常會遇到不合需要的輸入,任何實用的程序,都必須考慮對錯誤輸入的恰當處理。設計程序時要確定恰當?shù)脑瓌t并始終如一的貫徹。處理的原則可能與應用有關,但也有一般性的原則。例如:(1)保證任何錯誤輸入不破壞本程序自身,不將程序帶入無法預知的狀態(tài)。對上例,就是避免最后兩種情況的產(chǎn)生。(2)保證程序對任何輸入都有合理反應,必要時給用戶提供適當?shù)膱蟾?。上例中的前三種處理方式都有報告。(3)盡可能恢復到能繼續(xù)工作的狀態(tài)。上例中的第2種情況。
可見,設計和實現(xiàn)交互式程序時,必須合理處置錯誤輸入。不但要使程序保證對正確輸入能正確工作,還需要保證它遇到不正確輸入時具有可保證的合理行為。沒有這方面保證的程序或系統(tǒng)是有問題的。
3輸入與安全性
程序安全性的一個大問題就是程序輸入的處理。第一,輸入是不受編寫程序的人控制的;第二,已經(jīng)寫好的程序可能遇到各種各樣不滿足需要的輸入;第三,在遇到不滿足需要的輸入時應該如何處理,常常出現(xiàn)很難權衡的設計選擇。
合理地處理不合要求的輸入,第一個條件是檢查輸入。要幫助學生明白這樣幾點:第一,從理論上說,程序的每個輸入都應該仔細檢查,確定其是否滿足程序的需要。第二,只有滿足需要的輸入才能送給后續(xù)處理階段。第三,要了解處理不正確輸入時的各方面考慮。
C語言標準函數(shù)庫的輸入函數(shù)的輸入機制本身就是有安全性缺陷的。例如,gets函數(shù)沒有輸入長度限制,因此完全不應該使用而應該用fgets函數(shù)來代替;又如,scanf輸入函數(shù)的%s轉換描述不安全,使用時必須加上域長度限制,如%256s等。在使用C語言的輸入函數(shù)時,應該檢查其返回值,了解輸入工作完成的情況,理解如何在輸入未能正常完成的情況并且做出合理的處理。
目前討論較多的輸入問題有兩個:(1)緩沖區(qū)溢出:通過饋入超長字符序列的方式造成程序的輸入緩沖區(qū)溢出,從而將某些信息寫入系統(tǒng)內(nèi)存中不應使用的位置,藉此造成進一步破壞的可能性。(2)整數(shù)溢出:輸入的整數(shù)有時不是簡單地作為程序里的數(shù)據(jù),而是用于做其他事情。例如確定內(nèi)存分配的大小,非合法范圍的整數(shù)就可能導致系統(tǒng)垮臺,或者導致外部取得對程序的控制。
4結語
由于C語言不做運行時檢查,因此可能導致程序運行時出現(xiàn)的錯誤沒有報告,典型的情況有:數(shù)組越界訪問、空指針或不合法指針的間接訪問、聯(lián)合變量的不正確使用等等。在教學的過程中,這些問題都值得向學生提出并加以討論。每個程序設計的學習者,都可能對未來計算機系統(tǒng)的安全運行和社會安全產(chǎn)生影響,因此,作為C語言教學工作的承擔者對此負有重大責任。