互聯(lián)網(wǎng)是個(gè)繁忙的地方。據(jù)統(tǒng)計(jì),互聯(lián)網(wǎng)上每秒有6000條推特發(fā)出,有4萬(wàn)多次谷歌搜索,還有超過(guò)200萬(wàn)封電子郵件被發(fā)送。但這些數(shù)據(jù)只是略微提示了這個(gè)網(wǎng)絡(luò)的規(guī)模。截至2014年9月,互聯(lián)網(wǎng)上有約10億個(gè)網(wǎng)站,這一數(shù)字始終在變動(dòng)。在這個(gè)大部分人熟悉的互聯(lián)網(wǎng)之下還有一個(gè)“深層網(wǎng)絡(luò)”,它包括搜索引擎沒(méi)有編入索引的部分。
將“表面”網(wǎng)絡(luò)的時(shí)刻變化與深層網(wǎng)絡(luò)的不可定量性結(jié)合起來(lái)就會(huì)很容易地發(fā)現(xiàn),要估算互聯(lián)網(wǎng)規(guī)模是一項(xiàng)困難的任務(wù)。據(jù)統(tǒng)計(jì),截至2016年3月中旬,在線網(wǎng)頁(yè)至少有46.6億個(gè)。這只涵蓋了可搜索到的網(wǎng)頁(yè),并不包括深層網(wǎng)絡(luò)。那么,互聯(lián)網(wǎng)包含多少信息呢?加利福尼亞大學(xué)戴維斯分校傳播學(xué)教授馬丁·希爾伯特說(shuō),“對(duì)于這個(gè)問(wèn)題可以從三個(gè)角度來(lái)看——互聯(lián)網(wǎng)存儲(chǔ)信息、傳播信息并計(jì)算信息。”
2014年,研究人員在《超級(jí)運(yùn)算技術(shù)前沿與創(chuàng)新》雜志上發(fā)表了一項(xiàng)研究,估計(jì)互聯(lián)網(wǎng)的存儲(chǔ)量為100萬(wàn)艾字節(jié)。一個(gè)字節(jié)是包含8個(gè)比特的數(shù)據(jù)單位,相當(dāng)于單詞中的一個(gè)字母。1艾字節(jié)相當(dāng)于100億億字節(jié)。評(píng)估互聯(lián)網(wǎng)傳播能力的一個(gè)方式是計(jì)量它的流量。根據(jù)思科公司的視覺(jué)網(wǎng)絡(luò)指數(shù)項(xiàng)目,互聯(lián)網(wǎng)現(xiàn)在進(jìn)入“澤字節(jié)時(shí)代”。1澤字節(jié)是1000個(gè)艾字節(jié)。思科公司估計(jì),到2016年底,全球互聯(lián)網(wǎng)流量將達(dá)到每年1.1澤字節(jié),到2019年將達(dá)到每年2澤字節(jié)。思科公司稱,1澤字節(jié)相當(dāng)于看3.6萬(wàn)年的高清視頻,相當(dāng)于把在線影片租賃提供商奈飛公司的所有列表播放3177次。
研究人員估計(jì),要把整個(gè)網(wǎng)絡(luò)(包括深層網(wǎng)絡(luò))的內(nèi)容都打印出來(lái)的話,需要砍伐掉2%的亞馬遜雨林來(lái)造紙。在研究中,他們對(duì)在線文本的規(guī)模做了假設(shè),他們估計(jì)平均每個(gè)網(wǎng)頁(yè)需要30張A4紙來(lái)打印。根據(jù)這一假設(shè),互聯(lián)網(wǎng)上的所有文本將需要1.36×1000億張紙來(lái)打印。希爾伯特說(shuō),互聯(lián)網(wǎng)的規(guī)模是個(gè)活動(dòng)目標(biāo),它在飛速增長(zhǎng)。面對(duì)這些海量信息的時(shí)候只有一點(diǎn)值得欣慰:我們計(jì)算能力的提高比數(shù)據(jù)存儲(chǔ)的速度還要快。
全球數(shù)據(jù)存儲(chǔ)量每三年翻一番,而計(jì)算能力每一年半就翻一番。從很多方面來(lái)看,人工智能已經(jīng)超過(guò)了人類的認(rèn)知能力?!坝?jì)算能力的提高是唯一讓在線數(shù)據(jù)暴增變得有用的事,我們正從信息時(shí)代走向知識(shí)時(shí)代?!毕柌卣f(shuō)。