FBI(聯(lián)邦調(diào)查局)探員:可惜的是,案件發(fā)生當天,監(jiān)控錄像只拍攝到電腦屏幕和操作者的背影,我們無法判斷操作電腦的人究竟是教授本人還是其他冒充者。
電腦專家:每個人操作電腦的習慣各不相同。我們可以調(diào)出一周前的錄像,通過屏幕上文字出現(xiàn)的節(jié)奏,分析并歸納出教授本人的打字習慣,再對案件發(fā)生當天監(jiān)控錄像中的屏幕變化情況進行對比,就能知道兩位操作者是否同一人。
[教學設計提示]
上面的故事改編自電視系列劇《數(shù)字追兇》中的一集,建立數(shù)學模型對打字習慣進行分析并不是件容易的事,然而,做一個小程序顯示出擊鍵的節(jié)奏卻十分方便。下面是筆者輸入“time prearranged assignment”時,用VB程序繪出的擊鍵時間分布柱狀圖,代碼總共不超過10行。
圖中線條長短表明打字到此處時的間隔時間
● 一些數(shù)據(jù)的細微特征經(jīng)由計算機分析處理并放大后,能顯現(xiàn)出許多意想不到的信息,可以形象地稱之為數(shù)字指紋。編寫一個打字節(jié)奏柱狀圖程序需要的程序設計技能雖然簡單,但程序完成之后的研究空間卻非常廣闊:英文學習程度不同、打字熟練程度不同甚至性格不同都會產(chǎn)生出差異明顯的圖形效果。不妨由此展開更多數(shù)據(jù)搜集與統(tǒng)計分析,并討論哪些研究結(jié)果可以反過來提高程序的“智能”。
●.《格林童話》和《愛麗絲漫游奇境》都深受孩子們喜愛,兩書的“數(shù)字指紋”卻各不相同。作為一個中等難度的考驗,請編寫程序統(tǒng)計兩書中出現(xiàn)數(shù)字(one,two,three……)占全文詞語的比率,并由此分析兩書作者對于使用數(shù)字有哪些不同習慣。
● 不編寫程序,使用哪種常用軟件同樣可以達到統(tǒng)計詞頻的目的呢?
● 找一些科技論文,越多越好,然后搜出文章里所有的數(shù)字,并統(tǒng)計首位是1的數(shù)字有多少,首位是2的數(shù)字有多少,首位是3……如此等等。上述實驗最可能的結(jié)果是:首位是1的數(shù)字所占比例最高,其次是2,再次是3,以此類推。這就是令人匪夷所思的奔福德定律。為什么1到9開頭的數(shù)字不呈平均分布呢?有多種因素影響了科技論文中的數(shù)字分布,四則運算的進位法則是重要原因之一。若編寫程序,任取兩位隨機數(shù)字并進行乘法或除法計算,然后將此過程大量重復,所產(chǎn)生的數(shù)字分布便遵循奔福德定律。問題是,任取兩位隨機數(shù)字進行大量加減法運算,結(jié)果是否同樣如此。
……