張偉娜,黃 蕾,張 箴
(工業(yè)和信息化部中小企業(yè)發(fā)展促進(jìn)中心 數(shù)據(jù)智能研究部,北京 100082)
目前,以人工智能、區(qū)塊鏈、大數(shù)據(jù)、云計(jì)算等為代表的新一代信息技術(shù)正在成為推動(dòng)中國數(shù)字經(jīng)濟(jì)發(fā)展的新動(dòng)能。人工智能作為新一輪產(chǎn)業(yè)革命的重要引擎,是推動(dòng)實(shí)體經(jīng)濟(jì)發(fā)展的重要驅(qū)動(dòng)力,其開放創(chuàng)新已經(jīng)上升到國家戰(zhàn)略。區(qū)塊鏈自2016 年首次被列入《“十三五”國家信息化規(guī)劃》以來,其技術(shù)發(fā)展持續(xù)推動(dòng)產(chǎn)業(yè)創(chuàng)新,并不斷提高區(qū)塊鏈新興領(lǐng)域產(chǎn)業(yè)優(yōu)勢??梢?,區(qū)塊鏈和人工智能是兩種技術(shù)趨勢,并具有各自的顯著特征及開拓性,且其發(fā)展側(cè)重點(diǎn)各有不同:區(qū)塊鏈的重心在于保持記錄、認(rèn)證和執(zhí)行的準(zhǔn)確,而人工智能則助力于決策、評估和理解某些模式和數(shù)據(jù)集,最終產(chǎn)生自主交互[1]。一方面,兩者具有的主要共同特點(diǎn)和需求,將是其融合發(fā)展的關(guān)鍵;另一方面,兩者都有助于提高對方的能力,同時(shí)也提供了更好的監(jiān)督和問責(zé)的機(jī)會(huì),如果將兩種技術(shù)融合使用,可能是對整個(gè)技術(shù)(甚至人類)的重新定義。
數(shù)據(jù)、算力、算法是人工智能的三大核心要素,大量數(shù)據(jù)為機(jī)器學(xué)習(xí)提供模型訓(xùn)練的“原料”,多來源、實(shí)時(shí)、大量、多類型的數(shù)據(jù)是保障人工智能訓(xùn)練出高質(zhì)量模型的基礎(chǔ)支撐;算力是實(shí)現(xiàn)人工智能大規(guī)模計(jì)算的“助推器”,集群等計(jì)算力的提速是助推人工智能訓(xùn)練和推理效率提升的重要基礎(chǔ)設(shè)施;算法是實(shí)現(xiàn)人工智能的“動(dòng)力”,算法的迭代是從技術(shù)層面的創(chuàng)新到思維方式的轉(zhuǎn)變,意味著人工智能乃至社會(huì)生態(tài)的無限可能。因此,數(shù)據(jù)、算力和算法被稱為人工智能的“三駕馬車”。當(dāng)前,隨著人工智能平臺的落地應(yīng)用,人工智能技術(shù)已在很多行業(yè)領(lǐng)域開始有所應(yīng)用。
從本質(zhì)上講,區(qū)塊鏈技術(shù)是一個(gè)共享數(shù)據(jù)庫,存儲于其中的數(shù)據(jù)或信息,具有“去中心化”、“可追溯”、“不可偽造”等特征[2]。區(qū)塊鏈技術(shù)利用塊鏈?zhǔn)綌?shù)據(jù)結(jié)構(gòu)來驗(yàn)證與存儲數(shù)據(jù)、利用分布式節(jié)點(diǎn)共識算法來生成和更新數(shù)據(jù)、利用密碼學(xué)的方式保證數(shù)據(jù)傳輸和訪問的安全、利用由自動(dòng)化腳本代碼組成的智能合約來編程和操作數(shù)據(jù),是一種全新的分布式基礎(chǔ)架構(gòu)與計(jì)算范式[3]。區(qū)塊鏈的核心關(guān)鍵技術(shù)包括共識機(jī)制、網(wǎng)絡(luò)協(xié)議、加密算法、隱私保護(hù)、智能合約等。
區(qū)塊鏈技術(shù)最初應(yīng)用在金融行業(yè),作為底層技術(shù)與基礎(chǔ)架構(gòu)應(yīng)用于比特幣。當(dāng)前,其巨大的應(yīng)用價(jià)值已經(jīng)從金融行業(yè)向交通、醫(yī)療、傳媒等其他行業(yè)擴(kuò)展和延伸。
人工智能以數(shù)據(jù)為基礎(chǔ),而區(qū)塊鏈本質(zhì)上是一種數(shù)據(jù)存儲方式,或者叫“超級賬本”,體現(xiàn)了數(shù)據(jù)智能[4]。因此,兩種均與數(shù)據(jù)息息相關(guān)的技術(shù)可進(jìn)行有效結(jié)合,互相取長補(bǔ)短,實(shí)現(xiàn)技術(shù)提升。
區(qū)塊鏈技術(shù)具有分布式、公開透明、可追溯、難以篡改等特征,同時(shí)結(jié)合數(shù)據(jù)分布式存儲、點(diǎn)對點(diǎn)傳輸、共識機(jī)制、加密算法等多種技術(shù),能夠提升人工智能使用數(shù)據(jù)的真實(shí)性、關(guān)聯(lián)性和有效性,從數(shù)據(jù)、算力和算法三個(gè)層面,提升人工智能技術(shù)水平,創(chuàng)新人工智能的協(xié)作模式和計(jì)算范式,構(gòu)建人工智能新生態(tài)。
人工智能以其智能化、自動(dòng)化的特點(diǎn),通過AI 算法的優(yōu)化以及模擬,可以促進(jìn)區(qū)塊鏈的自然進(jìn)化、數(shù)據(jù)整理,并且有效地防止區(qū)塊鏈節(jié)點(diǎn)分叉的出現(xiàn),能夠更加有效地處理好區(qū)塊鏈的運(yùn)轉(zhuǎn),智能化提高效率。例如,人工智能可將傳統(tǒng)智能合約改造為智慧合約,有效解決智能合約存在的安全性、易用性、可靠性等問題。同時(shí),人工智能引入的“聯(lián)合學(xué)習(xí)”等去中心化的學(xué)習(xí)系統(tǒng),可用來解決區(qū)塊鏈上信息量冗余的問題,能夠提升區(qū)塊鏈延展性,提高系統(tǒng)效率。
當(dāng)前,人工智能產(chǎn)業(yè)中的海量數(shù)據(jù)缺乏統(tǒng)一高效的共享機(jī)制及管理方式,開源數(shù)據(jù)集維護(hù)性較差導(dǎo)致數(shù)據(jù)質(zhì)量參差不齊,數(shù)據(jù)存在不集中、不統(tǒng)一等問題。此外,人工智能訓(xùn)練所需的大量數(shù)據(jù)主要集中在政府和大公司內(nèi)部[5],監(jiān)管及商業(yè)門檻等條件制約導(dǎo)致數(shù)據(jù)流通性差、獲取困難,嚴(yán)重制約了中小企業(yè)發(fā)展人工智能的步伐。此外,在智能個(gè)體做出決策時(shí),需要獲取盡可能多的實(shí)時(shí)數(shù)據(jù)作為參考,如果沒有足夠的實(shí)時(shí)數(shù)據(jù)或者數(shù)據(jù)不夠?qū)崟r(shí),那么這種人工智能也只能是有限智能。
區(qū)塊鏈分布式數(shù)據(jù)庫將各個(gè)節(jié)點(diǎn)進(jìn)行高效數(shù)據(jù)共享,使得該網(wǎng)絡(luò)上的每個(gè)參與者都可以訪問數(shù)據(jù),可為人工智能提供更廣泛的數(shù)據(jù)訪問以及更有效的數(shù)據(jù)貨幣化機(jī)制。首先,依托區(qū)塊鏈技術(shù)可搭建去中心化的數(shù)據(jù)共享平臺,該平臺是基于區(qū)塊鏈網(wǎng)絡(luò)信息數(shù)據(jù)溝通平臺,它的更新和信息記錄由分布式主體共同交互完成,并非由某個(gè)權(quán)威機(jī)構(gòu)執(zhí)行[6];其次,區(qū)塊鏈數(shù)據(jù)驗(yàn)證將促進(jìn)更干凈、更有組織的個(gè)人數(shù)據(jù)的建立,進(jìn)而提供更加順暢的數(shù)據(jù)集成,形成新的數(shù)據(jù)市場;最后,更多可供分析的開放、共享、實(shí)時(shí)數(shù)據(jù)將使機(jī)器做出的預(yù)測和評估更加準(zhǔn)確,生成更加可靠的算法模型,進(jìn)而提升整個(gè)人工智能的技術(shù)水平。
算力成本是當(dāng)前人工智能行業(yè)的一大痛點(diǎn)。隨著網(wǎng)絡(luò)數(shù)據(jù)幾何倍數(shù)增長以及算法模型復(fù)雜度和精度的提升,人工智能已達(dá)千億參數(shù)、萬億的訓(xùn)練數(shù)據(jù)集規(guī)模,這無疑需要更大更強(qiáng)的運(yùn)算量。普通人工智能科技公司需要百萬元以上的資金購置GPU 等硬件資源建設(shè)計(jì)算中心,這對大部分中小型企業(yè)來說成本極高,導(dǎo)致“算力不充足、成本昂貴、難獲取”的現(xiàn)狀普遍存在。在OpenAI 發(fā)布的一份關(guān)于AI 計(jì)算能力增長趨勢的分析報(bào)告[7]中稱,自2012 年以來,創(chuàng)建最先進(jìn)系統(tǒng)所需的計(jì)算量每年增加10 倍,算力已成為人工智能發(fā)展需要從成本效益等方面考慮的一大瓶頸。
區(qū)塊鏈分布式計(jì)算能夠?qū)⒋笮虶PU 或FPGA 服務(wù)器集群、中小型企業(yè)閑散的空閑GPU 以及個(gè)人閑置GPU作為計(jì)算節(jié)點(diǎn),共享計(jì)算資源,為人工智能提供算力供給。例如,在迅雷的區(qū)塊鏈技術(shù)中,用戶通過迅雷玩客云設(shè)備,可以分享帶寬、存儲和計(jì)算能力等閑置資源[8],雖然每個(gè)設(shè)備的算力很小,但當(dāng)設(shè)備數(shù)量達(dá)到一定基數(shù)時(shí),累計(jì)算力也是巨大的。
此外,如果能將專門為區(qū)塊鏈挖礦機(jī)器設(shè)計(jì)的專用型集成電路芯片ASIC 算力的一部分提供給人工智能,在POW 共識機(jī)制中引入對人工智能ASIC 芯片友好支持的矩陣運(yùn)算和卷積運(yùn)算,可在使用ASIC 芯片挖礦的同時(shí)進(jìn)行人工智能的分布式加速計(jì)算[9]。或者采用對人工智能ASIC 芯片友好型POW 算法,使得礦機(jī)在閑置或被淘汰后,可被用于AI 加速[10]。例如初創(chuàng)公司鈦星區(qū)塊鏈擁有的為算力而生的礦機(jī),在比特幣暴跌而慘遭遺棄后,經(jīng)處理后繼續(xù)為AI 運(yùn)算提供算力支持[11],為未來AI礦機(jī)的面世提供了可能。
當(dāng)前,人工智能市場需求較大,但在算法層面,無論在技術(shù)方向還是專業(yè)領(lǐng)域上,人工智能算法研發(fā)門檻及對人才隊(duì)伍的要求都較高,當(dāng)下算法僅能滿足少數(shù)企業(yè)的需求,而對多數(shù)企業(yè)來說,開發(fā)個(gè)性化的產(chǎn)品具有很高的技術(shù)壁壘和資金壁壘,對于小企業(yè)獨(dú)立開發(fā)的難度極大。此外,多數(shù)企業(yè)基于開源社區(qū)獲取的開源軟件算法,在實(shí)際使用過程中卻有諸多規(guī)則或有版本適配等問題,嚴(yán)重限制了應(yīng)用開發(fā)的靈活度和創(chuàng)新性。在基于開源社區(qū)進(jìn)行代碼托管或進(jìn)行貢獻(xiàn)時(shí),管理自有知識產(chǎn)權(quán)代碼不當(dāng)會(huì)造成產(chǎn)權(quán)泄漏的風(fēng)險(xiǎn)。
利用區(qū)塊鏈分布式協(xié)作的特性,可搭建發(fā)布機(jī)器學(xué)習(xí)任務(wù)的平臺,利用群體智慧優(yōu)化人工智能算法,并由多個(gè)人工智能專家更新維護(hù),實(shí)現(xiàn)算法共享。此外,基于區(qū)塊鏈技術(shù)可構(gòu)建算法交易市場,允許用戶在平臺上發(fā)布任務(wù)、購買算法模型,在保證知識產(chǎn)權(quán)和隱私的條件下激勵(lì)開發(fā)者并大大降低AI 使用門檻。
區(qū)塊鏈挖礦需要大量的算力資源和電力資源。目前比特幣每年消耗電量約25.5 億瓦,幾乎和一些小國家的全年耗電量一樣。將人工智能用于POW 共識機(jī)制和哈希運(yùn)算,可大大提高計(jì)算效率,從而節(jié)省電力和能源。例如新創(chuàng)企業(yè)Matrix,利用AI 將POW 與POS 結(jié)合使用,采用分層的共識機(jī)制,首先利用隨機(jī)聚類算法在整個(gè)節(jié)點(diǎn)網(wǎng)絡(luò)中產(chǎn)生多個(gè)小型集群并主要基于POS 機(jī)制選舉出代表節(jié)點(diǎn),再由選舉出的代表節(jié)點(diǎn)進(jìn)行POW 競爭記賬權(quán),相比全節(jié)點(diǎn)的競爭記賬方式,可大大減少能源的浪費(fèi)。另一方面,智能系統(tǒng)能夠計(jì)算出特定節(jié)點(diǎn)優(yōu)先執(zhí)行任務(wù)的概率,從而提醒礦工找尋其他路徑并降低總運(yùn)算成本。此外,人工智能在優(yōu)化能源消耗上的技術(shù)也可以應(yīng)用在區(qū)塊鏈上,進(jìn)而減少采礦硬件的投資。
與任何其他編程語言一樣,智能合約存在漏洞被黑客利用的安全性問題,且其去人為干預(yù)的特性使得漏洞無法線上修復(fù),從而會(huì)引發(fā)更嚴(yán)重問題或連鎖反應(yīng)[12],犯錯(cuò)代價(jià)巨大,如The DAO 攻擊事件、以太坊Parity 錢包攻擊事件、美鏈BEC 攻擊事件等[13]。另一方面,智能合約的不可篡改性及升級特殊性,使其實(shí)際上僅是基于不同輸入而反饋的一系列確定性的復(fù)雜結(jié)果,在實(shí)際應(yīng)用中缺乏靈活性,因此,當(dāng)前的智能合約并不智能,易用性差。
安全性方面,在智能合約形成中,采用基于人工智能輔助的形式驗(yàn)證技術(shù)及動(dòng)態(tài)約束檢查的方法,能夠在代碼編寫時(shí)主動(dòng)挖掘代碼與合約的漏洞,對智能合約的安全性進(jìn)行自動(dòng)化檢查[14]。此外,人工智能生成對抗網(wǎng)絡(luò)(GAN)具備博弈的特性,在智能合約中引入GANk 可生成對話網(wǎng)絡(luò)形式,在合約生效前不斷進(jìn)行自我攻防測試來發(fā)現(xiàn)合約代碼是否存在漏洞,極大程度上提高智能合約的安全性。
易用性方面,通過引入人工智能引擎,在圖形界面和交互引導(dǎo)下,普通用戶便可通過自然語言(如中文)輸入交易目的及交易條件,由AI 把人類的自然語言轉(zhuǎn)換成對應(yīng)的腳本語言來編寫智能合約程序,自動(dòng)生成可用的智能合約。同時(shí),通過AI 對更多合約樣本的深度學(xué)習(xí),實(shí)現(xiàn)對更復(fù)雜合約的處理。如全球首個(gè)基于智能合約的AI 對話服務(wù)平臺Jarvis Plus[15],其初衷便是讓每個(gè)人可以用自然語言來使用區(qū)塊鏈和智能合約。
由于區(qū)塊鏈的加密特性,在計(jì)算機(jī)上使用區(qū)塊鏈數(shù)據(jù)進(jìn)行操作需要大量的計(jì)算機(jī)處理能力(如比特幣挖礦),即使執(zhí)行最基本的任務(wù)所需的計(jì)算處理量也相當(dāng)大。同時(shí),為保證安全和去中心化,目前的區(qū)塊鏈技術(shù)很難實(shí)現(xiàn)性能、安全和去中心化同時(shí)兼得,共識機(jī)制的執(zhí)行導(dǎo)致了當(dāng)前區(qū)塊鏈系統(tǒng)運(yùn)行性能低、能耗高等缺點(diǎn)。
機(jī)器學(xué)習(xí)系統(tǒng)也可以實(shí)時(shí)記錄區(qū)塊鏈正在發(fā)生的事情,可以在存儲的數(shù)據(jù)類型及在特定的服務(wù)器上識別異常操作和模式,并在某個(gè)事件可能發(fā)生時(shí)提醒用戶。此外,人工智能可以引入新的分散式學(xué)習(xí)系統(tǒng)來解決區(qū)塊鏈上的數(shù)據(jù)冗余問題,擴(kuò)展系統(tǒng)。分散式的學(xué)習(xí)系統(tǒng),如聯(lián)邦學(xué)習(xí)、新的數(shù)據(jù)分片技術(shù)等,可以使系統(tǒng)運(yùn)行更加有效。
憑借人工智能算法的優(yōu)化,結(jié)合POW 和POS 的共識機(jī)制,可節(jié)省區(qū)塊鏈的電力及能源的消耗,并通過提高計(jì)算能力更好地提高區(qū)塊鏈運(yùn)行效率。此外,實(shí)踐證明,通過AI 模型和算法的優(yōu)化,還可實(shí)現(xiàn)區(qū)塊鏈的自然進(jìn)化、動(dòng)態(tài)調(diào)整,可有效地防止分叉的出現(xiàn)。因此,利用人工智能技術(shù)可以優(yōu)化區(qū)塊鏈的運(yùn)行方式,以更聰明、更周到的方式管理區(qū)塊鏈運(yùn)行任務(wù),更加有效地管理好區(qū)塊鏈的自治組織,讓區(qū)塊鏈更安全、更可靠、更高效。
面對人工智能和區(qū)塊鏈領(lǐng)域的現(xiàn)存問題,兩大技術(shù)的融合能夠?qū)崿F(xiàn)取長補(bǔ)短,當(dāng)前已有部分應(yīng)用案例將兩者融合在一起。值得一提的是,無論是從當(dāng)前區(qū)塊鏈的技術(shù)指標(biāo),還是從大數(shù)據(jù)、人工智能的實(shí)際落地性來講,真正實(shí)現(xiàn)技術(shù)融合并落地實(shí)施仍需要面對諸多不確定性因素,其融合的潛在性結(jié)果也難以評估,因此在積極研究AI 與區(qū)塊鏈技術(shù)融合的同時(shí)也要理性看待、注重實(shí)踐落地,有機(jī)結(jié)合、靈活創(chuàng)新,真正實(shí)現(xiàn)人工智能和區(qū)塊鏈技術(shù)融合的實(shí)踐和探索。