国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)時代數(shù)據(jù)總量增長的新摩爾定律辨析
——吉姆·格雷是否真的提出過新摩爾定律?

2022-09-22 06:00:24辛冬播李廷軍
軟件導(dǎo)刊 2022年9期
關(guān)鍵詞:摩爾定律吉姆信息量

辛冬播,李廷軍

(江漢大學(xué)教育學(xué)院,湖北武漢 430056)

0 引言

1965年4月,《電子》雜志(Electronics)發(fā)表了一篇只有3 頁的論文——Cramming more components onto integrated circuits(《集成電路里正塞入更多的元件》)[1]。文章作者戈登·摩爾(Gordon Moore)當時就職于仙童攝影器材公司的子公司仙童半導(dǎo)體(Fairchild Semiconductor),其在文中指出:隨著成本曲線的降低,集成電路上可以封裝的元件數(shù)目迅速增加,并預(yù)測到1970 年,一個集成電路上可以集成1 000個元件,每個元件的生產(chǎn)成本將是1965年的1/10,并且集成電路的集成程度每年將以2 倍速增長,以公式表示即為:(f(Δtn)=Q2n)。據(jù)此測算,1975年最低成本下單位集成電路封裝的元件數(shù)目可以達到65 000個,具體如圖1所示。

Fig.1 Cost curve(left),component integration(right)圖1 成本曲線(左)、元件集成度(右)

1968 年,戈登·摩爾離開仙童公司并創(chuàng)立了英特爾(Intel),他繼續(xù)將上述觀察和推測作為芯片研發(fā)工作的指引,而后集成電路的不斷發(fā)展印證了他的預(yù)測,于是有人將其命名為摩爾定律[2]。計算機科學(xué)家卡弗·米德(Carver Mead)在很多場合談到過摩爾定律,促進了其傳播,曾被認為是其命名者,但實際情況已難以考證[3]。1975 年,戈登·摩爾認為集成電路增長速度會有所放緩,遂將摩爾定律中的速度修改為每2 年翻一番。雖然此后實際狀況基本上是按每18 個月翻一番的速度發(fā)展的,但戈登·摩爾并沒有再修改其定律[4]。

摩爾定律原指單位集成電路封裝的元件數(shù)目增加及單位成本相應(yīng)下降的趨勢隨時間發(fā)展的一種規(guī)律,但在傳播過程中出現(xiàn)了很多版本,主要有以下幾種:①集成電路芯片上所集成電路的數(shù)目每隔18 個月就翻一番;②微處理器的性能每隔18 個月提高一倍,而價格下降一半[5];③IC 芯片上可容納的晶體管數(shù)目每隔約18 個月便會增加一倍,計算機性能也將提升一倍[6]。嚴格來說,摩爾定律并不是定律,而只是一種觀察和推測。經(jīng)過50 多年的發(fā)展,戈登·摩爾認為集成電路技術(shù)的發(fā)展速度會減慢,摩爾定律可能會逐步退出歷史舞臺。

隨著信息技術(shù)的發(fā)展,人們開始將摩爾定律套用到各種指數(shù)式發(fā)展的技術(shù)和產(chǎn)品上,于是安放在吉姆·格雷(Jim Gray)名下的新摩爾定律便橫空出世了,即每18 個月全球新增信息量是計算機有史以來全部信息量的總和。吉姆·格雷是當代最杰出的數(shù)據(jù)庫大師,是數(shù)據(jù)庫和交換處理系統(tǒng)領(lǐng)域的領(lǐng)頭人,是美國國家工程院院士、美國計算機協(xié)會(ACM)院士、微軟公司高級研究員,曾獲得1994年美國技術(shù)研究院大獎,以及號稱計算機行業(yè)諾貝爾獎的圖靈獎(1998 年)[7]。遺憾的是,他在2007 年出海后失蹤[8]。與戈登·摩爾專注基礎(chǔ)技術(shù)半導(dǎo)體工業(yè)不同,吉姆·格雷是數(shù)據(jù)庫及處理系統(tǒng)方面的專家,如果他真的提出過關(guān)于數(shù)據(jù)量增長的新摩爾定律,以其背景而言似乎水到渠成,理所當然。然而,筆者認為所謂的吉姆·格雷新摩爾定律的表述有些問題。計算機有史以來全部信息量總和是否為固定值并不明確。如果按固定值來看,以Q 表示計算機有史以來全部信息量總和,那么再過18 個月全球新增信息量f(Δt1)=f(t2) -f(t1)=Q,而36 個月之后f(Δt2)=f(t3) -f(t2)=Q,其總量增速如圖2 所示,這是一種減速遞增關(guān)系,簡單計算能得出其倍數(shù)將依次為2、1.5、1.33、1.25……。而摩爾定律是一段周期翻一番的2 倍指數(shù)倍遞增關(guān)系(f(Δtn)=Q2n),二者相差甚遠。如果計算機有史以來全部信息量總和不是固定值,即也包括了每18 個月的信息量,那么就會造成邏輯混亂。筆者深感困惑,于是追溯相關(guān)文獻,探究吉姆·格雷是否真的提出過新摩爾定律。

Fig.2 The information quantity increment relationship圖2 信息量增量關(guān)系

1 新摩爾定律文獻統(tǒng)計與相關(guān)表述

1.1 新摩爾定律文獻統(tǒng)計

在知網(wǎng)以“新摩爾定律”為關(guān)鍵詞進行主題搜索,整理得到65 篇中文文獻,如圖3 所示。文獻發(fā)表年度跨度為1999-2020 年,其中以2009 年發(fā)表的文獻數(shù)量最多,2000年次之,2015年再次之。

采用Citespace 軟件分析關(guān)鍵詞共現(xiàn)情況,結(jié)果如圖4所示??梢钥闯?,各關(guān)鍵詞之間離散程度較大,但新摩爾定律與大數(shù)據(jù)、摩爾定律的關(guān)聯(lián)性在圖中仍有所體現(xiàn)。

關(guān)鍵詞突現(xiàn)分析結(jié)果如圖5 所示,新摩爾定律作為關(guān)鍵詞于2006 年首次出現(xiàn)。以下將對相關(guān)文獻表述進行具體分析。

Fig.3 Annual trends of published Chinese literatures about"New Moore's Law"圖3 新摩爾定律相關(guān)中文文獻發(fā)表年度趨勢

Fig.4 Key words co-occurrence圖4 關(guān)鍵詞共現(xiàn)

Fig.5 Key words with the strongest citation bursts圖5 關(guān)鍵詞突現(xiàn)

在Web of Science 中以“data(數(shù)據(jù))”和“Moore’s Law(摩爾定律)”為關(guān)鍵詞進行主題搜索,共查詢到171 篇相關(guān)英文文獻。同時,在這171 篇文獻中再以“Gray”為關(guān)鍵詞進行搜索,文獻結(jié)果為0,這說明相關(guān)英文文獻的標題、摘要、關(guān)鍵詞中沒有關(guān)于吉姆·格雷新摩爾定律的表述。據(jù)此初步推測,吉姆·格雷并未提出過新摩爾定律,之所以中文文獻中出現(xiàn)相關(guān)表述,應(yīng)是國內(nèi)學(xué)者對吉姆·格雷某些觀點的誤讀。

1.2 新摩爾定律相關(guān)表述

檢索到的中文文獻中關(guān)于新摩爾定律的表述主要有以下幾種:1999 年,侯自強[9]提出:“我們不妨稱因特網(wǎng)流量每半年翻一番的估計為網(wǎng)絡(luò)發(fā)展的新摩爾定律?!?006年,王克朝[10]在其碩士學(xué)位論文的摘要中提到:“圖靈獎獲得者Jim Gray 提出了一個新的經(jīng)驗定律:網(wǎng)絡(luò)環(huán)境下每18個月產(chǎn)生的數(shù)據(jù)量等于有史以來數(shù)據(jù)量之和。”2007 年,謝長生等[11]提到:“信息時代的到來意味著數(shù)字信息量的不斷增長。1998 年圖靈獎獲得者Jim Gray 曾說過:‘從現(xiàn)在起,每18 個月新增存儲量等于有史以來存儲量之和。’”2008 年,孟小峰[12]提到:“圖靈獎獲得者Jim Gray 曾在1998 年的獲獎演說中對未來數(shù)據(jù)量急劇增長的規(guī)律做過這樣的預(yù)言:未來每18 個月產(chǎn)生的數(shù)據(jù)量等于有史以來的數(shù)據(jù)量之和!”2011 年,羅東?。?3]提到:“互聯(lián)網(wǎng)環(huán)境下,每18 個月新產(chǎn)生的數(shù)據(jù)量等于有史以來數(shù)據(jù)量之和?!?013 年,楊寅[14]提出:“圖靈獎獲獎?wù)逬ames Gray 總結(jié)并提出在當今網(wǎng)絡(luò)應(yīng)用環(huán)境下,每18 個月新產(chǎn)生和增加的數(shù)據(jù)存儲總量等于有史以來所有數(shù)據(jù)存儲量之和的經(jīng)驗定律?!?013 年及2015 年,劉鵬等[15-16]提到:“1998 年圖靈獎獲得者杰姆·格雷(Jim Gray)提出著名的新摩爾定律:每18個月全球新增信息量是計算機有史以來全部信息量的總和?!?018年,周蘭[17]指出:“圖靈獎獲得者Jim Gray 更是提出新摩爾定律,即每18 個月全球新增信息量是計算機有史以來全部信息量的總和?!?020 年,董凱[18]提到:“圖靈獎獲得者杰姆·格雷提出的著名的新摩爾定律:每18 個月全球新增信息量是計算機有史以來全部信息量的總和?!?/p>

需要指出的是,相關(guān)學(xué)者引用所謂的新摩爾定律時并未辨析來源,也沒有結(jié)合統(tǒng)計數(shù)據(jù)加以驗證,這也正是令人困惑之處。

2 新摩爾定律的源流及辨析

追溯相關(guān)文獻可以發(fā)現(xiàn),1999 年侯自強首先提出了新摩爾定律的說法,但只是個人經(jīng)驗總結(jié),并沒有具名吉姆·格雷,其所提出的是網(wǎng)絡(luò)流量每半年翻一番與18 個月的時間間隔也不一樣。最早完整提出吉姆·格雷新摩爾定律的應(yīng)是2006 年王克朝的碩士論文,其明確認定該定律是吉姆·格雷的經(jīng)驗定律,并提出“18 個月”和“數(shù)據(jù)量”等關(guān)鍵詞。2007 年謝長生的表述中雖然用到的詞是存儲量,但其緊隨在“數(shù)字信息量的不斷增長”表述之后,極易使人將該存儲量誤解為數(shù)據(jù)量,之后相關(guān)文獻中關(guān)鍵詞采用的是數(shù)據(jù)量、信息量之類的表述。此外,孟小峰關(guān)于“圖靈獎獲得者Jim Gray 曾在1998 年的獲獎演說中……”的表述是不嚴謹?shù)?。吉姆·格雷是?998 年度獎項作的報告,但是在1999 年演講的,與謝長石“1998 年圖靈獎獲得者Jim Gray 曾說過”的表述相比,孟小峰的表述會使人誤以為是在1998 年發(fā)表的演講。2013 年,劉鵬等將此類表述單獨冠以新摩爾定律的稱謂,之后其他文獻的表述與其一致,但均未注明出處。

以上提到新摩爾定律的文獻中,只有2008年孟小峰教授的引用注明了出處:What next?A dozen informationtechnology research goals,J.Gray,ACM Turing Award Lecture,June 1999,MS-TR-99-50[19]。該文獻發(fā)表于2003年,為吉姆·格雷圖靈獎獲獎演說的精簡版,文中有3 處提到摩爾定律,分別為:①Prices are falling faster than Moore’s law——storage will likely be a hundred times cheaper in ten years(價格下跌速度比摩爾定律快——10 年后儲存器價格可能會便宜100 倍);②Moore’s law predicts a doubling every 18 months.This means that,in the next 18 months,there will be as much new storage as all storage ever built,as much new processing as all the processors ever built.The area under the curve in the next 18 months equals the area under the curve for all human history(摩爾定律預(yù)測每18 個月就會翻一番。這意味著,18 個月后新增的存儲器(數(shù)量)將與現(xiàn)在已有的存儲器一樣多,18 個月后新增的處理能力將與現(xiàn)在已有的處理器一樣大。未來18 個月曲線下面積等于現(xiàn)在為止所有人類歷史曲線下的面積);③As I said at the beginning,progress appears to be accelerating;the base-technology progress,in the next 18 months,will equal all previous progress,if Moore’s law holds(正如我在一開始所說的,進展似乎正在加速;如果摩爾定律成立,未來18 個月基礎(chǔ)技術(shù)的進展將等于到現(xiàn)在為止的所有進展)。

為進一步驗證,根據(jù)2003 年這篇文獻的腳注搜索到1999 年版本的原文[20],文中對應(yīng)的3 處表述,與上文完全一致。吉姆·格雷在這份獲獎發(fā)言中主要闡述了12 個長期系統(tǒng)研究問題:①可擴展性(Scalability)。設(shè)計一個可擴展到106倍的軟件和硬件體系結(jié)構(gòu),僅通過添加更多資源,應(yīng)用程序的存儲和處理容量可以自動增加100 萬倍,工作速度更快(加速106倍)或同時做106倍的工作;②圖靈測試(The Turing Test)。建立一個計算機系統(tǒng),模仿游戲的勝率至少達到30%;③語音文本(Speech to Text)。水平如同母語者;④文本語音(Text to Speech)。水平如同母語者;⑤視覺如人一樣(See as Well as a Person)。能識別物體和運動;⑥個人記憶擴展器(Personal Memex)。記錄一個人看到和聽到的一切,并根據(jù)需要迅速檢索到;⑦世界備忘錄(World Memex)。建立一個給定文本語料庫系統(tǒng),可以回答有關(guān)文本的問題,并像該領(lǐng)域的人類專家一樣準確、快速地總結(jié)文本,這個系統(tǒng)也能適用于音樂、圖像、藝術(shù)和電影;⑧遠程臨場(Tele Presence)。模擬其他地方,使你作為觀察者(遠程觀察),就如同一位在現(xiàn)場的人一樣能聽到和看到;模擬作為參與者出席另一地點的活動(遠程臨場)。與他人和環(huán)境互動,就好像你真的在那里一樣;⑨無故障的系統(tǒng)(Trouble-free Systems)。建立一個每天被數(shù)百萬人使用的系統(tǒng),而它只需要一個兼職人員管理;⑩安全系統(tǒng)(Secure System)。確保問題⑨的系統(tǒng)僅服務(wù)授權(quán)用戶,服務(wù)不能被未經(jīng)授權(quán)者中斷,信息也不能被竊?。ㄐ栩炞C);?隨時可用(Always Up)。確保系統(tǒng)每百年故障不到1s,即有99.999 999%的可靠性(需驗證);?自動編程(Automatic Programmer)。設(shè)計一種規(guī)范語言或用戶界面,可使人們更容易表述設(shè)計(更容易1 000 倍),使計算機可直接編譯,并可描述所有應(yīng)用程序(已完成)。系統(tǒng)應(yīng)能質(zhì)疑應(yīng)用程序,對例外情況和規(guī)范完整性提出疑問,但使用起來不應(yīng)很繁瑣。

通過分析全文可以發(fā)現(xiàn),吉姆·格雷闡述的增長是指存儲(Storage)和處理器(Processor),而非數(shù)據(jù)量或信息量,其在文中提到的摩爾定律也只是舊摩爾定律,并未就數(shù)據(jù)量增長提出類似的說法。此外,吉姆·格雷沒有將摩爾定律作為這篇文獻的關(guān)鍵詞之一,也間接證明了這一點。

進一步搜索關(guān)于吉姆·格雷的信息,在Web of Science核心合集發(fā)現(xiàn)其有3 篇以“Gray J”署名的文獻,包含在其ACM 作者檔案[21]中所列的112 篇出版文獻中,其中就有What next?A dozen information-technology research goals(1999 年及2003 年)。此外,微軟公司eScience 研究組(Microsoft Research′s eScience Group)在吉姆·格雷主頁[22]整理了其未完結(jié)的項目,在這些文獻篇名、關(guān)鍵詞、摘要等中均未出現(xiàn)Moore’s Law(摩爾定律)這一關(guān)鍵詞,因此無法證實吉姆·格雷提出過新摩爾定律。

針對漸有流行趨勢的吉姆·格雷新摩爾定律,首先經(jīng)文獻分析發(fā)現(xiàn)大多數(shù)中文文獻中未注明引用出處,也沒有結(jié)合統(tǒng)計數(shù)據(jù)加以驗證;其次進一步追根溯源,分析各文獻表述,理清了國內(nèi)有關(guān)新摩爾定律的各種來由;最后辨析各中文文獻原文,查證相關(guān)英文文獻,未找到吉姆·格雷提出新摩爾定律的直接證據(jù)。結(jié)合邏輯分析,以及全球數(shù)據(jù)量增長的相關(guān)統(tǒng)計,所謂的吉姆·格雷新摩爾定律表述本身也有明顯漏洞。據(jù)此推測,吉姆·格雷并沒有提出過新摩爾定律,該定律應(yīng)是國內(nèi)學(xué)者對吉姆·格雷某些觀點的誤讀。當然,吉姆·格雷也許在其他地方確實提出過類似觀點,受限于文獻查找范圍沒有被發(fā)現(xiàn)。

3 大數(shù)據(jù)時代信息總量增長規(guī)律

所謂的吉姆·格雷新摩爾定律一直強調(diào)計算機有史以來全部信息量,而人類自公元前3000 年開始書寫后就在不斷創(chuàng)造和保存數(shù)據(jù)信息,而且人類歷史上技術(shù)進步促進數(shù)據(jù)和信息量大幅增長的情況也曾發(fā)生過,例如15 世紀印刷術(shù)發(fā)明后以及19 世紀后期出版成本下降時。計算機及互聯(lián)網(wǎng)的相繼問世使數(shù)據(jù)增長速度今非昔比,如今進入大數(shù)據(jù)時代,全球數(shù)據(jù)量更是飛速增長。根據(jù)Statista 的統(tǒng)計和預(yù)測,2020 年全球數(shù)據(jù)產(chǎn)生量預(yù)計達到47ZB(1ZB 即1012GB),而到2035 年,這一數(shù)字將達到2 142ZB。信息技術(shù)在未來較長時期內(nèi)將保持漸進式發(fā)展態(tài)勢,其中數(shù)據(jù)處理能力遠落后于指數(shù)級增長的數(shù)據(jù)體量。圖6 為全球每年產(chǎn)生數(shù)據(jù)量估算圖,這一指數(shù)級增長速率,即年均增速平均為1.3 倍,也就是約每3 年翻一番,這與國際數(shù)據(jù)公司(IDC)預(yù)測的2020-2024 年數(shù)據(jù)增長的年復(fù)合增長率(CAGR)26%基本一致。

Fig.6 Global annual data volume estimation圖6 全球每年產(chǎn)生數(shù)據(jù)量估算

4 結(jié)語

全球數(shù)據(jù)總量飛速增長的趨勢已是共識,其增長規(guī)律預(yù)測的可信度與是否為吉姆·格雷所提出并無直接關(guān)系。將全球數(shù)據(jù)總量指數(shù)級的增長規(guī)律命名為新摩爾定律無可厚非,但也完全沒有必要無中生有地拉吉姆·格雷來為其站臺。根據(jù)前文提到的相關(guān)統(tǒng)計及預(yù)測,大數(shù)據(jù)時代數(shù)據(jù)總量增長的新摩爾定律應(yīng)該表述為全球數(shù)據(jù)總量每3年將翻一番。同樣的,這個新摩爾定律也只是一種觀察和推測,并不是一個真正的定律,今后完全可以根據(jù)數(shù)據(jù)總量增長的實際情況進行修正。

猜你喜歡
摩爾定律吉姆信息量
超高速光電計算芯片"掙脫”摩爾定律
摩爾定律
原始魅力——吉姆·科普
基于信息理論的交通信息量度量
吉姆餐廳
讓身體從紙中穿過
水里的倒影
好孩子畫報(2016年7期)2016-12-12 11:51:23
如何增加地方電視臺時政新聞的信息量
新聞傳播(2016年11期)2016-07-10 12:04:01
基于多尺度互信息量的數(shù)字視頻幀篡改檢測
計算機工程(2015年4期)2015-07-05 08:29:20
基于聯(lián)合熵和交互信息量的視頻篡改檢測
唐海县| 梅河口市| 宝应县| 比如县| 柳江县| 江西省| 襄垣县| 罗城| 阿拉尔市| 龙里县| 涟水县| 平凉市| 福泉市| 张家口市| 横峰县| 璧山县| 仙游县| 公安县| 平武县| 达拉特旗| 新丰县| 嵩明县| 特克斯县| 民丰县| 朔州市| 静乐县| 黔东| 吕梁市| 镇原县| 衡山县| 张家港市| 安塞县| 兖州市| 杨浦区| 清原| 太康县| 新和县| 郎溪县| 红安县| 稻城县| 广南县|