趙 濤
(浩鯨云計(jì)算科技股份有限公司,江蘇 南京 211153)
人類文明對(duì)于超現(xiàn)實(shí)、造物和沉浸式體驗(yàn)的情節(jié)自古有之,早在18世紀(jì)初期,就出現(xiàn)過(guò)現(xiàn)實(shí)主義畫家通過(guò)提供360°視野的作畫方式,對(duì)觀賞者提供沉浸式的觀賞體驗(yàn)。在20世紀(jì)50年代,著名電影攝影師Morton Heilig(莫頓·海利格)發(fā)明了由傳感仿真器、3D顯示器、風(fēng)扇、震動(dòng)座椅組成的裝置,為電影觀影提供身臨其境的感覺。20世紀(jì)90年代初,我國(guó)的著名科學(xué)家錢學(xué)森先生將“Virtual Reality”(虛擬現(xiàn)實(shí)技術(shù))一詞翻譯為具有中國(guó)風(fēng)味的“靈境”,被評(píng)價(jià)為“來(lái)自科學(xué)家的浪漫”。近年來(lái)的元宇宙(Metaverse)概念,一般被認(rèn)為起源于1992年的科幻小說(shuō)《雪崩》,代表了和現(xiàn)實(shí)世界對(duì)立的虛擬世界。
在日漸發(fā)展的人工智能、大數(shù)據(jù)、云計(jì)算、增強(qiáng)現(xiàn)實(shí)和區(qū)塊鏈等技術(shù)的發(fā)展加持下,元宇宙概念變得越來(lái)越具像化,同時(shí),隨著新冠疫情的全球蔓延,線上化辦公與生活時(shí)間的明顯增長(zhǎng),人們對(duì)數(shù)字世界的興趣繼續(xù)升溫。元宇宙概念在近一段時(shí)間內(nèi)受到了各行業(yè)的廣泛關(guān)注,在國(guó)家語(yǔ)言資源監(jiān)測(cè)與研究中心2021年12月6日發(fā)布的“2021年度十大網(wǎng)絡(luò)用語(yǔ)”里,更是將元宇宙收入在其中。
元宇宙概念本身還處于一個(gè)不斷發(fā)展和演化的過(guò)程,對(duì)于元宇宙是什么,目前還沒有完全的共識(shí)定義,但它的系統(tǒng)框架至少包括以下方面。
(1)虛擬與現(xiàn)實(shí)的融合交互。元宇宙賽道的玩家們,無(wú)論是通過(guò)數(shù)字孿生來(lái)提升現(xiàn)實(shí)到虛擬的全真投影效率,還是從視聽到體感全方位地反映虛擬世界的感觀,都存在虛擬與現(xiàn)實(shí)融合的縱深有增強(qiáng)的趨勢(shì)、邊界的區(qū)分有淡化的趨勢(shì)。
(2)用戶參與定義和創(chuàng)造。游戲領(lǐng)域的元宇宙先驅(qū)都有這個(gè)相同屬性,支持用戶對(duì)內(nèi)容的設(shè)計(jì)和創(chuàng)造,這也意味著用戶創(chuàng)造的內(nèi)容數(shù)據(jù)量將會(huì)逐漸趨近甚至超過(guò)系統(tǒng)設(shè)定和創(chuàng)造內(nèi)容的數(shù)據(jù)量。
(3)沉浸式和疊加式的體驗(yàn)。已經(jīng)出現(xiàn)的元宇宙代表們幾乎都在或者規(guī)劃向社交、娛樂、支付[1]等人類社會(huì)生活的基礎(chǔ)設(shè)施方向發(fā)展,不斷地疊加著支持現(xiàn)實(shí)社會(huì)行為的基礎(chǔ)元素,并且在視聽、觸覺、情感方面完善體驗(yàn)的界面。
(4)公平與安全的秩序。隨著用戶在虛擬世界行為的豐富、交互復(fù)雜度的增加,系統(tǒng)性的管理難度也會(huì)加大,平臺(tái)運(yùn)營(yíng)所涉獵的法律、公序、秩序需要具備完善的體系保障,并且能夠被相關(guān)機(jī)構(gòu)進(jìn)行必要的監(jiān)管。
元宇宙可能還需要相當(dāng)長(zhǎng)的一段時(shí)間來(lái)對(duì)相應(yīng)的技術(shù)進(jìn)行研發(fā)和迭代,它在什么時(shí)間完全到來(lái),本文不展開討論。但可以肯定的是,數(shù)據(jù)技術(shù)是數(shù)字化和智能化進(jìn)程中的一項(xiàng)基礎(chǔ)型技術(shù)。數(shù)據(jù)的快速增長(zhǎng)、多形態(tài)數(shù)據(jù)存儲(chǔ)的管理、數(shù)據(jù)交互能力需求的增強(qiáng)、跨系統(tǒng)多元化數(shù)據(jù)的安全管控等方面都將驅(qū)動(dòng)與之配套的數(shù)據(jù)治理能力。
虛擬世界即是現(xiàn)實(shí)世界的仿真投影,用戶會(huì)在其中根據(jù)基礎(chǔ)投影進(jìn)行創(chuàng)造和開發(fā),同時(shí)AI自動(dòng)生成的內(nèi)容數(shù)據(jù),用戶的行為數(shù)據(jù)以及創(chuàng)造的內(nèi)容數(shù)據(jù)都會(huì)因?yàn)榇笠?guī)模的線上并發(fā)與協(xié)作,而驅(qū)動(dòng)數(shù)據(jù)量的高速增長(zhǎng)。伴隨VR、AR、MR、全息影像等交互類技術(shù)的應(yīng)用,圖像、語(yǔ)音等非結(jié)構(gòu)化數(shù)據(jù)也會(huì)大量產(chǎn)生。據(jù)國(guó)際數(shù)據(jù)公司IDC(International Data Corporation)報(bào)告,全球數(shù)據(jù)總量2020年約為53 ZB,而2025年預(yù)計(jì)將達(dá)到175 ZB。大數(shù)據(jù)的摩爾定律依然存在。
元宇宙通過(guò)多種數(shù)據(jù)形式對(duì)用戶提供沉浸式服務(wù),數(shù)據(jù)承載了現(xiàn)實(shí)世界的投影、體系內(nèi)的自身數(shù)據(jù)、用戶行為創(chuàng)造的數(shù)據(jù)、AI自動(dòng)生成的數(shù)據(jù)。數(shù)據(jù)存儲(chǔ)的形態(tài)變得更加豐富,包括中心化的數(shù)據(jù)中心存儲(chǔ)、基于區(qū)塊鏈的去中心化存儲(chǔ)、覆蓋邊緣端設(shè)備的分散式存儲(chǔ)。離散分布的數(shù)據(jù)在原子性、一致性、安全性方面需要有自動(dòng)化的保障或管理機(jī)制。在多形態(tài)的數(shù)據(jù)存儲(chǔ)和使用的模式下,統(tǒng)一的管理范式是數(shù)字化系統(tǒng)運(yùn)轉(zhuǎn)的必要保障。
隨著多技術(shù)的復(fù)合應(yīng)用、數(shù)字世界與現(xiàn)實(shí)世界交互形式的增多、數(shù)字世界社會(huì)屬性的不斷豐富,在元宇宙內(nèi)云端與邊端之間、應(yīng)用與運(yùn)營(yíng)之間、虛擬行為與法律法規(guī)監(jiān)管之間,數(shù)據(jù)的高效交互和安全流通是其良性運(yùn)轉(zhuǎn)的關(guān)鍵。
第一,支持大規(guī)模并發(fā)在線模式的云或多云架構(gòu)是必然的選擇。第二,沉浸式的視覺、音覺、觸覺等體驗(yàn)需求帶來(lái)了設(shè)備終端的使用要求,通過(guò)對(duì)云端與本地設(shè)備的數(shù)據(jù)進(jìn)行融合分析來(lái)提供安全、可靠、低延時(shí)的感知服務(wù)。第三,在元宇宙體系中,AI除了協(xié)助完成邊端的決策響應(yīng),也同時(shí)負(fù)責(zé)虛擬內(nèi)容的生成制造。AI的核心目標(biāo)是通過(guò)將可復(fù)用的算法模型進(jìn)行封裝,為業(yè)務(wù)場(chǎng)景提供低成本、敏捷的AI能力[2]。第四,基礎(chǔ)的保障性運(yùn)營(yíng)有多個(gè)方面構(gòu)成[3],例如,以用戶偏好體系畫像、用戶行為分析及以預(yù)測(cè)為主的“客戶洞察體系”,以新進(jìn)分析、活躍分析、支付分析、流失分析、路徑分析為主的“基礎(chǔ)專題運(yùn)營(yíng)”,以曝光分析、停留分析、分享分析為主的“內(nèi)容優(yōu)化運(yùn)營(yíng)”。這些基礎(chǔ)的運(yùn)營(yíng)分析需求都需要在元宇宙體系內(nèi)對(duì)從業(yè)務(wù)實(shí)體到數(shù)據(jù)實(shí)體進(jìn)行規(guī)范,才能完成有價(jià)值、有效率的數(shù)據(jù)計(jì)算。
在元宇宙體系中,隨著數(shù)據(jù)的體量、產(chǎn)生的來(lái)源、存儲(chǔ)的形態(tài)、使用的場(chǎng)景更加復(fù)雜和多元化,數(shù)據(jù)安全面臨的風(fēng)險(xiǎn)和隱患同樣變得更加多樣化、復(fù)雜和隱秘。
(1)用戶數(shù)據(jù)的確權(quán)。虛擬世界中各類尤其是用戶定義、制作以及改編自顯示世界影音文學(xué)等作品的數(shù)據(jù)資產(chǎn)在確權(quán)和使用的機(jī)制還不完善或存在缺失。
(2)用戶隱私的保護(hù)。用戶隱私的外沿放大,如身份、行為、運(yùn)動(dòng)、生理、社交、財(cái)產(chǎn)、場(chǎng)景、甚至情感類等信息,都可能被納入到虛擬世界用戶的隱私信息中,來(lái)確保用戶的隱私安全。
(3)人工智能計(jì)算。為了滿足對(duì)圖像和語(yǔ)音等非結(jié)構(gòu)化數(shù)據(jù)的識(shí)別與計(jì)算決策、打造和優(yōu)化動(dòng)態(tài)的虛擬現(xiàn)實(shí)交互體驗(yàn)等需要[4],AI都將被廣泛地應(yīng)用于元宇宙。AI計(jì)算結(jié)果的路徑與規(guī)則都不同于可以解釋的顯性規(guī)則,對(duì)使用帶來(lái)的安全隱患需要進(jìn)行考量。
(4)跨境的法規(guī)界定。虛擬世界中缺少現(xiàn)實(shí)世界中的國(guó)界與行政區(qū)域的顯性制約,跨境跨域的信息交互和數(shù)據(jù)流通對(duì)區(qū)域級(jí)、國(guó)別級(jí)的法律法規(guī)邊界界定帶來(lái)新的復(fù)雜度。
結(jié)合前面對(duì)元宇宙這類復(fù)雜的大規(guī)模系統(tǒng)的數(shù)據(jù)技術(shù)驅(qū)動(dòng)的分析,我們從多元化方面、組織模式方面、技術(shù)演進(jìn)方面分析數(shù)據(jù)治理可能的發(fā)展趨勢(shì)。
在數(shù)據(jù)加大對(duì)用戶感知、體驗(yàn)、生活等類型服務(wù)支持的背景下,數(shù)據(jù)治理的范疇也在向更加多元化的方式進(jìn)行延展。
(1)學(xué)科與原理的多元化。隨著應(yīng)用在多領(lǐng)域的展開,數(shù)據(jù)表達(dá)業(yè)務(wù)的范疇增多,數(shù)據(jù)治理體系涉及的原理和底層邏輯也相應(yīng)地?cái)U(kuò)展到了政治學(xué)、法學(xué)、社會(huì)學(xué)、管理學(xué)、經(jīng)濟(jì)學(xué)、數(shù)據(jù)科學(xué)、信息資源管理學(xué)等更多領(lǐng)域的學(xué)科。
(2)數(shù)據(jù)所有權(quán)的多元化。隨著數(shù)據(jù)產(chǎn)生模式和應(yīng)用場(chǎng)景的拓展,數(shù)據(jù)的所有權(quán)向著社會(huì)公有、機(jī)構(gòu)組織私有、機(jī)構(gòu)組織與企業(yè)共有、企業(yè)私有、個(gè)人私有、企業(yè)個(gè)人共有等多模式或多模式并存的方式轉(zhuǎn)變。
(3)數(shù)據(jù)治理價(jià)值的多元化。過(guò)去我們對(duì)數(shù)據(jù)治理的價(jià)值更多的是關(guān)注數(shù)據(jù)在共享、流通、交易過(guò)程中,因?yàn)樾矢倪M(jìn)而產(chǎn)生的應(yīng)用或經(jīng)濟(jì)價(jià)值。而對(duì)支持保障情感和感知的AI準(zhǔn)確性計(jì)算,對(duì)虛擬世界中的秩序完善、風(fēng)險(xiǎn)防范、合規(guī)監(jiān)管等過(guò)程中帶來(lái)的幫助也會(huì)產(chǎn)生更多的“隱性價(jià)值”。
數(shù)據(jù)治理的組織機(jī)制通常屬于中心化的組織模式,即以統(tǒng)一組織、分級(jí)或分類負(fù)責(zé)的方式開展。但當(dāng)相關(guān)方變得復(fù)雜甚至存在跨境情況、業(yè)務(wù)關(guān)聯(lián)領(lǐng)域變得多元化、多方向的專業(yè)技術(shù)疊加,想要搭建一個(gè)更高層面的的權(quán)威中心化數(shù)據(jù)治理組織的難度也就變得更大。
(1)聯(lián)盟共治模式。由多專業(yè)化技術(shù)疊加的復(fù)雜大規(guī)模系統(tǒng),采取技術(shù)的生態(tài)化聯(lián)盟共同完成系統(tǒng)的搭建或拼接是目前的一個(gè)趨勢(shì)。同樣,數(shù)據(jù)治理的組織模式,也可以采取與之匹配的聯(lián)盟共同治理模式,在通過(guò)法律或契約均衡利益的保障下,聯(lián)合協(xié)同開展數(shù)據(jù)治理是降低技術(shù)成本、達(dá)到參與方收益最大化的一個(gè)方式。
(2)分布式自治模式。2019年出現(xiàn)的“分布式自治組織”(Distributed Autonomous Organization,DAO)是通過(guò)一系列公開的規(guī)則達(dá)到自運(yùn)行的組織形態(tài)。DAO的管理標(biāo)準(zhǔn)以智能合約的形式編碼在區(qū)塊鏈上,在沒有集中控制和第三方干預(yù)的情況下,通過(guò)智能化管理手段和通證經(jīng)濟(jì)激勵(lì),實(shí)現(xiàn)自運(yùn)轉(zhuǎn)、自治理、自演化,進(jìn)而實(shí)現(xiàn)組織的最大效能和價(jià)值流轉(zhuǎn)的組織形態(tài)[5]。
效率、成本、客戶感知和業(yè)務(wù)創(chuàng)新始終都是技術(shù)前進(jìn)的驅(qū)動(dòng)力[6],同時(shí)也是對(duì)數(shù)據(jù)治理的驅(qū)動(dòng)力。數(shù)據(jù)治理不完全等同于數(shù)據(jù)管理。如何更高效、更準(zhǔn)確、更安全地管理和使用數(shù)據(jù)、提供更佳的數(shù)據(jù)服務(wù)體驗(yàn),是數(shù)據(jù)治理的演進(jìn)目標(biāo)。
(1)元數(shù)據(jù)管理要求的升級(jí)。元數(shù)據(jù)管理的作用會(huì)更加重要,伴隨云計(jì)算、邊緣計(jì)算技術(shù)的廣泛應(yīng)用,數(shù)據(jù)治理也相應(yīng)地面臨對(duì)分布式數(shù)據(jù)、分散式數(shù)據(jù)的管理和協(xié)調(diào)要求。數(shù)據(jù)存儲(chǔ)的位置是數(shù)據(jù)治理的視線方向之一,數(shù)據(jù)治理依據(jù)元數(shù)據(jù)來(lái)展開數(shù)據(jù)的定義和管理,無(wú)論數(shù)據(jù)分散存儲(chǔ)在何處,通過(guò)元數(shù)據(jù)都可以把它們關(guān)聯(lián)在一起。對(duì)于數(shù)據(jù)的管理者,元數(shù)據(jù)不止提供對(duì)數(shù)據(jù)的功能與特性描述,還包括數(shù)據(jù)存儲(chǔ)和索引等客觀介紹;對(duì)于數(shù)據(jù)的開發(fā)者和消費(fèi)者,元數(shù)據(jù)提供屏蔽數(shù)據(jù)存儲(chǔ)和分布的技術(shù)細(xì)節(jié),支持直接使用工具或接口對(duì)數(shù)據(jù)進(jìn)行邏輯操作。
(2)數(shù)據(jù)標(biāo)注對(duì)多態(tài)數(shù)據(jù)的治理支持。在結(jié)構(gòu)化數(shù)據(jù)、圖像、聲音、視頻、文字等多態(tài)存儲(chǔ)模式下的數(shù)字化系統(tǒng)中,子模塊系統(tǒng)數(shù)據(jù)和設(shè)備側(cè)數(shù)據(jù)容易形成數(shù)據(jù)黑盒。需要預(yù)防多態(tài)存儲(chǔ)模式下的數(shù)據(jù)成為不互通的孤島。數(shù)據(jù)標(biāo)注在業(yè)界數(shù)據(jù)湖治理中已經(jīng)具備一些初步的實(shí)踐,它通過(guò)對(duì)非結(jié)構(gòu)化數(shù)據(jù)包含的業(yè)務(wù)實(shí)體或基礎(chǔ)特征進(jìn)行標(biāo)識(shí)和注明,為數(shù)據(jù)的消費(fèi)者提供查詢或關(guān)聯(lián)的條件,提高數(shù)據(jù)的檢索和使用效率。使非結(jié)構(gòu)化數(shù)據(jù)形態(tài)下的分析、關(guān)聯(lián)使用成為可能。
(3)治理規(guī)則的自學(xué)習(xí)。數(shù)字孿生、虛擬現(xiàn)實(shí)以及不斷新增的物聯(lián)網(wǎng)設(shè)備,都會(huì)帶來(lái)動(dòng)態(tài)的、未知種類的新增數(shù)據(jù)。已有的數(shù)據(jù)治理規(guī)則要能夠不斷適應(yīng)新的數(shù)據(jù)甚至業(yè)務(wù)標(biāo)準(zhǔn),面臨著向探索性、自動(dòng)化、智能化的方式轉(zhuǎn)變。治理規(guī)則的自學(xué)習(xí)和自優(yōu)化是解決上述需求的一個(gè)可能路徑。以數(shù)據(jù)標(biāo)準(zhǔn)為例,當(dāng)出現(xiàn)新增的數(shù)據(jù)集或者樣本后,對(duì)它的各個(gè)數(shù)據(jù)項(xiàng)進(jìn)行統(tǒng)計(jì)分析。當(dāng)其數(shù)值明顯偏離其余的觀測(cè)值的情況時(shí),結(jié)合樣本數(shù)據(jù)中可枚舉性的原則進(jìn)行匹配,制定出這個(gè)數(shù)據(jù)項(xiàng)的參考主數(shù)據(jù)范圍。依據(jù)這樣的參考主數(shù)據(jù)標(biāo)準(zhǔn)自動(dòng)化機(jī)制,可以將不匹配的記錄進(jìn)行識(shí)別、確認(rèn)并進(jìn)行必要的溯源或清洗。
(4)數(shù)據(jù)安全要求的升級(jí)。由于用戶數(shù)據(jù)確權(quán)復(fù)雜度加大、用戶隱私的保護(hù)范圍復(fù)雜化、人工智能計(jì)算過(guò)程對(duì)安全的影響、跨境數(shù)據(jù)管理的法規(guī)尚不完善,數(shù)據(jù)安全會(huì)向著更加多元化的安全防控體系延伸?;谌ブ行幕膮^(qū)塊鏈技術(shù)在明確數(shù)據(jù)來(lái)源、所有權(quán)、使用權(quán)和流通路徑、事后追溯方面有著天然的優(yōu)勢(shì)[7],去中心化的數(shù)據(jù)安全治理是此類場(chǎng)景的可選項(xiàng)。除了數(shù)據(jù)存儲(chǔ)、訪問、確權(quán)與應(yīng)用安全的狹義數(shù)據(jù)安全,用戶隱私保護(hù)、算法規(guī)則安全也都將納入數(shù)據(jù)層面安全需要考量的內(nèi)容。總的來(lái)看,安全體系的范圍和縱深都會(huì)大于現(xiàn)階段的要求?!?/p>