李波
“驗(yàn)證碼不匹配,請(qǐng)重新輸入。”這是一句令很多人十分苦惱的話。文字、算術(shù)題、字母、圖片……花樣百出的驗(yàn)證碼雖然給我們帶來了諸多不便,但是它維護(hù)了網(wǎng)絡(luò)安全,甚至有時(shí)候,我們填寫驗(yàn)證碼是在為人類文明和技術(shù)進(jìn)步作貢獻(xiàn)。
提到驗(yàn)證碼,有的同學(xué)可能會(huì)問:“短信驗(yàn)證碼和圖片、字母、文字等類型的驗(yàn)證碼有什么不同?”其實(shí),它們雖然都叫作驗(yàn)證碼,但有很大差別。
當(dāng)我們點(diǎn)擊獲取短信驗(yàn)證碼后,網(wǎng)站或App后臺(tái)會(huì)生成驗(yàn)證碼內(nèi)容,將它和我們的手機(jī)號(hào)等數(shù)據(jù)發(fā)給短信服務(wù)商和運(yùn)營(yíng)商,最后以短信形式發(fā)至手機(jī)。短信驗(yàn)證碼不僅可以作為用戶的身份憑證,還能夠保證賬戶安全,防止惡意注冊(cè)。而包含圖片、字母、文字等的驗(yàn)證碼系統(tǒng)更復(fù)雜。
網(wǎng)絡(luò)安全衛(wèi)士
在驗(yàn)證碼系統(tǒng)出現(xiàn)之前,還沒有微信、QQ等社交軟件,人們都用電子郵件溝通。當(dāng)時(shí),一個(gè)問題深深困擾著大家:黑客開發(fā)出一種程序,能夠批量注冊(cè)賬號(hào),并用這些賬號(hào)進(jìn)行違規(guī)操作。想象一下,如果網(wǎng)站上滿是垃圾評(píng)論和廣告,支付寶密碼被輕松破解,成千上萬的垃圾賬號(hào)操縱網(wǎng)絡(luò)投票……那多么令人抓狂!更崩潰的是,就連互聯(lián)網(wǎng)公司也無法分辨注冊(cè)賬號(hào)的到底是人還是機(jī)器。
解決這一問題的計(jì)算機(jī)天才名叫路易斯·馮·安,來自危地馬拉。2000年,年僅21歲的他提出了一個(gè)革命性解決方案:在注冊(cè)賬號(hào)的過程中設(shè)置一個(gè)判定環(huán)節(jié),讓用戶識(shí)別一串扭曲、重疊、不完整的字母或者數(shù)字,然后輸入。這項(xiàng)工作在人類看來相當(dāng)簡(jiǎn)單,但對(duì)那時(shí)候的機(jī)器來說,根本無法完成。這個(gè)系統(tǒng)叫作全自動(dòng)區(qū)分計(jì)算機(jī)和人類的公開圖靈測(cè)試(Completely Automated Public Turing test to tell Computers and Humans Apart),簡(jiǎn)稱CAPTCHA,就是我們現(xiàn)在常用的驗(yàn)證碼。
驗(yàn)證碼背后的貢獻(xiàn)
阻止黑客惡意注冊(cè)賬號(hào)的問題暫時(shí)得到解決,但又產(chǎn)生了一個(gè)新問題:填寫驗(yàn)證碼太耗費(fèi)時(shí)間。假設(shè)一天中每人只需花10秒填寫驗(yàn)證碼,2000年全球互聯(lián)網(wǎng)用戶約4億人,所有用戶每天要耗費(fèi)的時(shí)間加起來約127年,路易斯·馮·安心想:能不能把這些時(shí)間利用起來呢?
路易斯·馮·安把目光投向了需要被電子化的紙質(zhì)圖書。如果讓人工錄入這些圖書需要耗費(fèi)很大精力,而電子掃描又很難保證質(zhì)量,為了解決這一問題,他重新設(shè)計(jì)了驗(yàn)證碼系統(tǒng),并將其命名為reCAPTCHA。這套系統(tǒng)分為兩個(gè)部分:第一部分和之前的相似,是自動(dòng)生成的內(nèi)容,用來判定被測(cè)試者是否為人類;第二部分是機(jī)器無法識(shí)別的文本。如果第一部分輸入正確,reCAPTCHA就會(huì)假設(shè)第二部分同樣能輸入正確,通過驗(yàn)證,然后把錄入結(jié)果返回給主機(jī)。為了確保不出錯(cuò),主機(jī)會(huì)把第二部分內(nèi)容發(fā)給多個(gè)用戶進(jìn)行交叉驗(yàn)證。2007年,reCAPTCHA系統(tǒng)成功數(shù)字化了《紐約時(shí)報(bào)》20年的報(bào)紙。
隨著技術(shù)進(jìn)一步發(fā)展,驗(yàn)證碼系統(tǒng)也參與到人工智能的優(yōu)化當(dāng)中。谷歌公司把用戶識(shí)別的圖片變成標(biāo)注好的數(shù)據(jù),用來優(yōu)化人工智能算法模型,如標(biāo)注車輛邊框的驗(yàn)證碼是為了訓(xùn)練智能攝像頭的識(shí)別能力。這些數(shù)據(jù)越準(zhǔn)確,數(shù)量越多,模型效果就越好。
不斷升級(jí)的驗(yàn)證碼系統(tǒng)
在驗(yàn)證碼進(jìn)階之路上,黑客也想出了各種辦法對(duì)付驗(yàn)證碼,比如聘用工人填寫驗(yàn)證碼、使用人工智能破解。在與黑客斗智斗勇的過程中,驗(yàn)證碼系統(tǒng)也不斷升級(jí)更新。
2009年,谷歌收購了reCAPTCHA系統(tǒng)。5年之后,谷歌推出了一種不需要驗(yàn)證碼的驗(yàn)證方法:讓用戶點(diǎn)擊“I'm not a robot”的按鈕。這種驗(yàn)證方法看起來簡(jiǎn)單,但是背后離不開強(qiáng)大的人工智能。它會(huì)監(jiān)測(cè)用戶的操作習(xí)慣如移動(dòng)鼠標(biāo)的速度和軌跡、反應(yīng)時(shí)間等,收集大量信息,以此來進(jìn)行判斷。
了解驗(yàn)證碼背后的故事后,我們?cè)谔顚戲?yàn)證碼時(shí),是不是心情沒那么糟糕了?驗(yàn)證碼的發(fā)明離不開人類非凡的創(chuàng)造力。也許以后會(huì)出現(xiàn)更厲害的破解驗(yàn)證碼的方法,但人類一定能想到方法來應(yīng)對(duì),將網(wǎng)絡(luò)秩序拉回正軌!
發(fā)明與創(chuàng)新·小學(xué)生2021年1期