劉 達
(中國電影科學技術研究所(中央宣傳部電影技術質量檢測所))
近年來,在云計算、分布式計算、大數(shù)據(jù)、物聯(lián)網、無線傳感網 (WSN)、第五代移動通信(5G)、人工智能 (AI)、機器學習、深度學習等新一代信息通信技術 (ICT)和智能科學技術的有力驅動下,電影產業(yè)由傳統(tǒng)視聽產業(yè)加快向以云計算和人工智能等為關鍵支撐技術的高新技術產業(yè)轉型升級。特別是,自2021 年10 月臉書 (Facebook)公司更名為Meta并提出致力于建立元宇宙 (Metaverse)以來,元宇宙 (Metaverse)成為ICT 及相關領域炙手可熱的概念和熱點,進軍元宇宙成為全球互聯(lián)網、電子游戲、人工智能 (AI)、虛擬現(xiàn)實(VR)、增強現(xiàn)實 (AR)、人機交互 (HCI)等領域諸多科技公司的發(fā)展戰(zhàn)略。
電影作為文化產業(yè)發(fā)展龍頭和現(xiàn)代視聽技術的發(fā)展制高點,在文化與科技的融合創(chuàng)新領域實現(xiàn)重要突破,在文化強國和科技強國建設中發(fā)揮引領示范作用,是新時代電影產業(yè)高質量發(fā)展的必然要求和核心要義。因此,適應技術演進趨勢、國家戰(zhàn)略目標和產業(yè)發(fā)展需求,借鑒汲取元宇宙 (Metaverse)的先進思想、理念和關鍵技術,以電影產業(yè)的云化 (Cloudization)與智能化 (Intellectualization)升級為抓手,推動中國電影提質增效升級,是推進電影強國建設的題中應有之義。
進入新時代新征程,我國經濟、社會、文化、科技等由高速增長逐漸轉向高質量發(fā)展,在此背景下,中國電影積極推進電影大國向電影強國的歷史性跨越。新時代電影強國建設的科技內涵極其豐富,相融相通,主要涵蓋以下內容:
(1)電影銀幕 (數(shù)字視音頻解碼放映顯示系統(tǒng))、數(shù)字攝影棚、數(shù)字影視制作基地、數(shù)字發(fā)行傳輸網絡、云計算數(shù)據(jù)中心(Cloud Data Center)、人工智能(AI)系統(tǒng)設施等電影相關傳統(tǒng)基礎設施建設和新型基礎設施建設引領世界。
(2)國產電影的拍攝制作水平、視效水準、視聽品質、科技含量、國際傳播力與影響力居世界領先,基于圖像高分辨率(4K/8K)、高幀率(HFR)、高動態(tài)范圍 (HDR)、廣色域 (WCG)、沉浸式音頻(Immersive Audio)等新興視聽技術的高新技術格式電影(High-Tech Format Film)的制作生產能力強勁,能夠充分滿足人民日益增長的高品質視聽文化生活需要。
(3)電影科技自主創(chuàng)新能力和電影民族工業(yè)發(fā)展實現(xiàn)重要突破,在電影核心器件、關鍵芯片、基礎模型、核心算法、原創(chuàng)技術研發(fā)、關鍵軟硬件系統(tǒng)研制等領域無明顯發(fā)展短板,基本實現(xiàn)電影科技自立自強,能夠有效抵御西方世界嚴格苛刻的封鎖管制。
(4)電影全產業(yè)鏈的信息化建設、云化(Cloudization)與智能化 (Intellectualization)升級水平居世界領先,多元化現(xiàn)代化工業(yè)化的電影拍攝制作發(fā)行放映技術體系和安全版權保護體系構建形成,電影線上線下業(yè)務融合并進和協(xié)調發(fā)展,電影產業(yè)韌性和魯棒性(Robustness)強勁。
云化 (Cloudization)與智能化 (Intellectualization)升級是電影產業(yè)高質量可持續(xù)發(fā)展的大勢所趨和必然要求,符合新時代電影強國的建設目標,必須順勢而為、科學推進。與此同時,電影產業(yè)的云化與智能化升級是一項龐大的系統(tǒng)工程,必須統(tǒng)籌設計和整體推進,需要研究制定科學、高效、精準的實施策略與實現(xiàn)路徑,推動電影的智能化制作生產發(fā)行播映,推動電影多平臺分發(fā)和多終端播映,推動電影工藝鏈創(chuàng)新優(yōu)化升級,進而有力支撐和有效服務新時代電影強國建設。
當前,全球已經進入大科學時代 (Age of Great Science),科學研究和技術應用的復雜性、系統(tǒng)性、協(xié)同性顯著增強,產業(yè)行業(yè)交叉融合發(fā)展趨勢日益明顯。適應大科學時代發(fā)展要求,需要建構適應現(xiàn)代科技演進趨勢、國家與行業(yè)戰(zhàn)略需求的新型電影科技支撐體系,統(tǒng)籌科學研究和技術應用的戰(zhàn)略性、系統(tǒng)性、專業(yè)性、協(xié)作性和融合性,推進融合并進和協(xié)同創(chuàng)新。迄今云計算 (Cloud Computing)已成為信息通信技術(ICT)產業(yè)技術創(chuàng)新和業(yè)務服務創(chuàng)新升級的基石,不僅貫穿整個ICT 技術鏈,而且衍生出諸多新興技術模式,云計算數(shù)據(jù)中心成為支撐數(shù)字經濟 (Digital Economy)發(fā)展升級的重要新型基礎設施。對于電影產業(yè),云化趨勢日益明顯,云化進程持續(xù)深化,未來有望加快步入全云(All-in-Cloud)時代。
關于元宇宙 (Metaverse),迄今尚無統(tǒng)一、明確、規(guī)范的定義。元宇宙(Metaverse)一詞最先出現(xiàn)于1992年出版的美國科幻作品 《雪崩》一書中,其中提及與真實世界平行的虛擬世界,真實世界與虛擬世界的融合共存應該是元宇宙的基本設想。當前,從科技視角看,元宇宙(Metaverse)的核心思想理念是虛擬世界與真實世界的深度融合和智能交互,其應該是一個集成應用新興視聽技術、云計算、分布式計算、大數(shù)據(jù)、物聯(lián)網、無線傳感網、人工智能、機器學習、高速網絡 (光纖固網/5G/6G/衛(wèi)星通信網)、可信計算(Trusted Computing)、區(qū)塊鏈(Block Chain)、虛擬現(xiàn)實/增強現(xiàn)實/混合現(xiàn)實/擴展現(xiàn)實(VR/AR/MR/XR)等諸多高新技術的巨型生態(tài)系統(tǒng),創(chuàng)建和布局元宇宙必然是一項極其復雜和十分龐大的系統(tǒng)工程。自電影數(shù)字化演進以來,迄今數(shù)字電影已經全面取代膠片電影。數(shù)字電影本質上是信息通信技術 (ICT)和電影文化的融合體,不僅集中展現(xiàn)了虛擬世界與真實世界的融合、交互和呈現(xiàn),而且伴隨新一代信息通信技術和智能科學技術的發(fā)展演進也在不斷提質升級。因此,元宇宙與數(shù)字電影在諸多方面具有相似性和互通性,元宇宙的先進思想理念非常值得下一代數(shù)字電影系統(tǒng)借鑒參考。
近年來,在電影攝制領域,拍攝制作技術手段持續(xù)創(chuàng)新升級,呈現(xiàn)多元化、現(xiàn)代化、智能化、融合化趨勢,數(shù)字實拍、計算機視覺/計算機圖形學/計算機生成圖像 (CV/CG/CGI)制作、視覺特效(VFX)、虛擬攝制、虛擬角色、數(shù)字資產、虛實融合等技術融合并進,傳統(tǒng)電影制作與沉浸式媒體制作統(tǒng)籌推進,電影云端制作與本地制作相輔相成、互為補充,基于云計算和人工智能等關鍵技術的電影分布式網絡化遠程跨域協(xié)同制作和智能化制作生產成為重要趨勢。在電影播映領域,不同技術規(guī)格、安全等級和應用需求的多元化電影解碼播放顯示技術與軟硬件系統(tǒng)統(tǒng)籌發(fā)展,專業(yè)影院、農村與社區(qū)流動影院、點播影院、VR/AR/MR/XR 沉浸式影院、家庭影院、移動影院等有效服務電影產業(yè)整體效能提升。綜上所述,適應大科學時代發(fā)展要求,借鑒汲取元宇宙(Metaverse)的先進思想理念,立足電影科技自主創(chuàng)新,以高水平科技自立自強為發(fā)展目標,設計構建實現(xiàn)下一代數(shù)字電影系統(tǒng) (技術特征如圖1 所示),推動電影全產業(yè)鏈的信息化建設、云化與智能化升級,對于支撐電影強國建設具有重要的戰(zhàn)略意義和現(xiàn)實意義。
圖1 下一代數(shù)字電影系統(tǒng)技術特征
智能科學技術 (Intelligence Science&Technology)的發(fā)展與應用水平是體現(xiàn)一個國家在智慧時代的綜合國力和核心競爭力的關鍵要素。人工智能(Artificial Intelligence)基于計算機模擬人類思維過程和智能行為以實現(xiàn)高層級應用,自1956年達特茅斯會議首次提出人工智能以來,源于對智能(Intelligence)的不同理解,人工智能發(fā)展形成了符號主義 (Symbolism)、聯(lián)結主義 (Connectionism)、行為主義(Actionism)三大學派。根據(jù)學習和認知能力的強弱,人工智能分為弱人工智能和強人工智能?,F(xiàn)有人工智能系統(tǒng)均為實現(xiàn)特定功能的專用智能,屬于弱人工智能的范疇。強人工智能即達到人類水平、能夠自適應外部環(huán)境挑戰(zhàn)、具有自我意識的人工智能,又稱通用人工智能或類人智能,是人工智能的發(fā)展演進方向,其目標是研制類人智能系統(tǒng)。從學習和認知能力上看,現(xiàn)有人工智能距離人類智能(Human Intelligence)還十分遙遠,實現(xiàn)強人工智能任重道遠。
機器學習 (Machine Learning)是人工智能的重要分支,研究計算系統(tǒng)如何利用經驗來提升系統(tǒng)性能,其核心思想是從數(shù)據(jù)中自動提取知識,進而發(fā)現(xiàn)規(guī)律和把握趨勢。相對于經典程序設計,機器學習屬于一種新型編程范式。對于經典程序設計,系統(tǒng)輸入為規(guī)則 (即程序)和數(shù)據(jù),系統(tǒng)輸出為求解;對于機器學習,系統(tǒng)輸入為數(shù)據(jù)和從數(shù)據(jù)中預期得到的求解,系統(tǒng)輸出為規(guī)則,這些規(guī)則后續(xù)可應用于新數(shù)據(jù),并使機器實現(xiàn)自主求解 (圖2 所示)。深度學習 (Deep Learning)是一種端到端的機器學習(End-to-End Machine Learning),不同于分而治之 (Divide&Conquer)學習模式,其通過多級人工神經網絡級聯(lián)來實現(xiàn)復雜函數(shù)逼近,突破了傳統(tǒng)機器學習基于先驗知識手工設計低層特征的模式,而是從數(shù)據(jù)中自動學習有效的特征表示。機器學習和深度學習的算法對比分析如圖3所示,傳統(tǒng)機器學習基于特征工程人工設計特征,特征向任務目標的映射通過學習算法直接從數(shù)據(jù)中學習;深度學習則無論簡單特征、低層抽象特征、高層抽象特征、高層語義表征向任務目標的映射,均基于學習算法直接從數(shù)據(jù)中學習。近年來計算技術由縱向擴展(Scale-Up)向橫向擴展 (Scale-Out)發(fā)展演進,高性能云計算數(shù)據(jù)中心、超算中心等迅猛發(fā)展,計算能力顯著提升,與此同時,大規(guī)模訓練數(shù)據(jù)集相繼推出,使計算能力和數(shù)據(jù)規(guī)模能夠有力支撐復雜深度神經網絡(DNN)的模型訓練,進而有效推動深度學習技術在諸多行業(yè)和領域實現(xiàn)落地應用。
圖2 一種新型編程范式——機器學習
圖3 機器學習和深度學習的算法對比分析
在深度學習領域,具有廣闊發(fā)展與應用前景的生成對抗網絡 (Generative Adversarial Networks,GAN)炙手可熱,其基于零和博弈 (Zero-Sum Game)原理、納什平衡 (Nash equilibrium)原理和紅皇后假說(Red Queen Hypothesis)。零和博弈屬于非合作博弈 (Non-cooperative Game),是指博弈雙方在嚴格競爭下,一方的收益必然意味著另一方的損失,博弈雙方的收益和損失的總和始終為零;納什平衡又稱非合作博弈均衡,在博弈過程中,每個博弈者都會選擇某個支配性策略以達到自身期望收益的最大值,博弈雙方的策略組合稱為納什平衡,在該平衡點,博弈中的任何一方將無法通過自身行為增加收益;紅皇后假說是生物學領域的一種生物協(xié)同進化假說,即物種間為爭奪有限資源,必須持續(xù)優(yōu)化自身以對抗捕食者與競爭者,對于捕食者與競爭者,需要不斷進化以獲取資源,使物種之間保持一種復雜的相互作用、相互依存的協(xié)同進化關系和動態(tài)平衡狀態(tài)。圖像深度生成模型與生成對抗網絡(GAN)如圖4所示,生成器(Generator)和判別器 (Discriminator)是GAN 的核心組成部分,生成器生成虛假數(shù)據(jù),使判別器D 盡可能評分1,判別器區(qū)分真實數(shù)據(jù)和虛假數(shù)據(jù),對于真實數(shù)據(jù)盡可能評分1,對于虛假數(shù)據(jù)盡可能評分0,需要計算的納什平衡點正是要尋找一個生成器和判別器,使各自的目標函數(shù)(Objective Function)最小化。
圖4 圖像深度生成模型與生成式對抗網絡 (GAN)
在電影行業(yè),基于新興視聽技術的高新技術格式電影 (High-Tech Format Film)發(fā)展極其迅猛,并驅動電影的智能化制作生產需求持續(xù)增強。電影視聽品質是圖像分辨率、采樣格式、量化深度、幀速率、動態(tài)范圍、色域、聲音等諸多技術要素綜合應用和有機融合的結果,不僅依賴于數(shù)字成像器件(CCD/CMOS 圖像傳感器)和數(shù)字顯示器件(DMD/SXRD/LED)的技術性能,而且需要統(tǒng)籌考慮數(shù)字攝影系統(tǒng)、數(shù)字后期制作系統(tǒng)、數(shù)字母版制作系統(tǒng)、數(shù)字放映系統(tǒng)在技術規(guī)格上的兼容性與一致性。因此,相對于常規(guī)技術格式電影,高新技術格式電影對攝制流程、視效制作、后期合成、顏色管理、模型渲染、數(shù)據(jù)處理、計算存儲、網絡傳輸、監(jiān)看環(huán)境等均提出了更高要求。基于深度學習模型和算法,例如深度卷積神經網絡 (DCNN)、變分自編碼器 (VAE)、生成對抗網絡 (GAN)等基礎模型及其衍生模型,同時采用并行化系統(tǒng)設計策略,涵蓋模型、算法、數(shù)據(jù)、程序、硬件系統(tǒng)等并行化設計,可有效服務電影的智能化制作生產并實現(xiàn)行業(yè)落地應用。
基于深度學習生成對抗網絡 (GAN)衍生模型,數(shù)字電影可采用圖像超分辨率 (SR)重建技術和并行化系統(tǒng)設計策略實現(xiàn)2K (2048×1080)→4K(4096×2160)→8K (8192×4320)、標準幀率(SFR)→高幀率 (HFR)、標準動態(tài)范圍 (SDR)→高動態(tài)范圍 (HDR)、常規(guī)色域 (CCG)→廣色域(WCG)等升級轉換,以實現(xiàn)圖像分辨率、幀速率、量化深度、動態(tài)范圍、色域等提升和擴展,從而可基于常規(guī)技術格式電影生成高新技術格式電影,進而有效豐富高新技術格式電影片源 (圖5所示)。在電影后期制作環(huán)節(jié),深度學習生成對抗網絡(GAN)衍生模型可用于電影的智能化剪輯與智能化調色,并結合剪輯師與調色師的人工剪輯和人工調色工作,實現(xiàn)“智能化粗剪+人工精剪”和 “智能化粗調+人工精調”,還可用于服務電影視效制作、數(shù)字角色智能生成和影視圖像風格智能化遷移,以及對傳統(tǒng)專業(yè)影視渲染引擎和商業(yè)級圖形渲染器實施定制優(yōu)化。
圖5 基于深度學習技術及并行化設計策略制作生產高新技術格式電影
近年來,在人工智能、機器學習、深度學習、認知計算 (Cognitive Computing)、腦科學等智能科學技術的有力驅動下,人類社會由信息時代(Age of Information)加速向智慧時代 (Age of Wisdom)演進升級。相對于信息時代,智慧時代具有更強算力、更優(yōu)算法、更高效的數(shù)據(jù)分析處理、更自然友好的人機交互、以數(shù)據(jù)為中心的體系架構、類似人類大腦的自主學習等技術特征。中國科學院梅宏院士在《企業(yè)軟件化》推薦序言 《步入軟件定義的時代》中提出 “在某種意義上,信息技術及其深度應用已經推動人類社會步入到一個新發(fā)展階段,并可以從不同的視角去考察和認知。從計算模式視角,可視為是以支持計算、存儲、網絡、數(shù)據(jù)、應用等資源的集約式管理和服務化使用為特征的云計算時代;從信息應用視角,可視為是以人工智能技術為基礎,支持感知、認知到決策為特征的智能化時代”,這對于理解和把握智慧時代的核心要義具有重要指導意義。
影院是現(xiàn)代電影產業(yè)的多媒體終端,其遵循高品質、專業(yè)化、差異化、可持續(xù)的發(fā)展建設準則,不僅要持續(xù)提高視聽質量、沉浸感和臨場感,而且要有效提升運營質量、服務水平和管理效率。在媒體融合、云化和智能化進程持續(xù)深化的背景下,云化智慧融媒體影院 (Cloudizating I ntelligent Convergence Media Cinema)成為現(xiàn)代影院的發(fā)展演進趨勢,其通過將電影、電視、廣告、預告片、數(shù)字增值內容、云計算、互聯(lián)網、移動終端等多種媒體內容與服務模式進行有機整合和集成應用,實現(xiàn)資源共享、相融相通、價值集聚和智能分發(fā)播映,使影院的內涵、價值、效能等實現(xiàn)整體提升,符合融媒體時代特征和電影產業(yè)高質量發(fā)展需求。
云化智慧融媒體影院的系統(tǒng)架構如圖6 所示,主要由智慧融媒體影院業(yè)務系統(tǒng)、智慧融媒體影院運營支撐系統(tǒng)、智慧融媒體影院外部接入網絡三大部分組成。智慧融媒體影院業(yè)務系統(tǒng)基于智慧融媒體影院數(shù)字電影播映系統(tǒng),涵蓋融媒體智能分析模塊、數(shù)據(jù)預處理模塊、集成媒體模塊/圖像媒體模塊(IMB)、LED 電影顯示屏、數(shù)字電影放映機、高品質銀幕和沉浸式音頻系統(tǒng)等,節(jié)目來源覆蓋電影節(jié)目源(DCP)、電影密鑰 (KDM)、電影廣告、電影預告片、電視傳輸流 (TS)、云終端/云桌面、智能移動終端、影院增值內容直播轉播等多元化內容;智慧融媒體影院運營支撐系統(tǒng)涵蓋影院管理系統(tǒng)(TMS)、網絡運營中心 (NOC)、中央存儲系統(tǒng)(SAN/NAS/云存儲)、衛(wèi)星接收設施 (SAT)、計算機票務系統(tǒng) (POS)、云計算數(shù)據(jù)中心 (CDC)、人工智能(AI)系統(tǒng)設施、5G/6G 移動通信網絡切片等子系統(tǒng);智慧融媒體影院外部接入網絡包括高速互聯(lián)網、移動通信網、光纖通信網、衛(wèi)星通信網、物聯(lián)網/無線傳感網、量子通信網等不同類型的寬帶信息通信網絡??傊?,發(fā)展建設云化智慧融媒體影院,離不開云計算數(shù)據(jù)中心 (Cloud Data Center)和人工智能(AI)系統(tǒng)設施的有力支撐。基于云計算和智能科學技術設計構建云化智慧融媒體影院,已成為新時代影院高質量可持續(xù)發(fā)展的必然要求。
圖6 云化智慧融媒體影院系統(tǒng)架構
中國電影已經步入全面建設社會主義現(xiàn)代化國家新征程、向第二個百年奮斗目標進軍的新發(fā)展階段,在新時代新征程,推進電影全產業(yè)鏈的云化與智能化升級,推動電影產業(yè)由傳統(tǒng)視聽產業(yè)向以云計算和人工智能等為關鍵支撐技術的高新技術產業(yè)轉型升級,是推進電影強國建設的重大時代課題。電影發(fā)展至今的一百二十余年,其核心關鍵要素始終是質量(Quality)、安全 (Security)、版權(Copyright)和效益(Benefit),電影產業(yè)的云化與智能化升級必須緊密圍繞上述四大核心關鍵要素,統(tǒng)籌視聽質量、內容安全、版權保護和綜合效益。
當前及未來,制約中國由電影大國向電影強國實現(xiàn)跨越的技術短板主要在于:一是兼具高視聽品質、高科技含量的國產精品電影數(shù)量有限,中國電影的工業(yè)化攝制發(fā)行播映體系建設與中國的綜合國力和大國地位不相稱;二是電影科技自主創(chuàng)新能力與電影強國建設要求尚存較大差距,中國電影在核心器件與芯片、基礎模型與算法、后期與特效制作工具、原創(chuàng)關鍵技術研發(fā)與核心軟硬件系統(tǒng)研制等領域亟待實現(xiàn)自立自強。綜上所述,我們要在遵循科技規(guī)律、深化自主創(chuàng)新的基礎上,加快補足補齊技術短板,不斷探索優(yōu)化新時代中國特色電影科技發(fā)展道路。我們要以新時代電影強國建設的科技內涵為目標,以電影產業(yè)的云化與智能化升級為抓手,堅持電影科技自主創(chuàng)新和推進高水平自立自強,加快構建完善工業(yè)化、現(xiàn)代化、多元化的電影攝制發(fā)行播映技術體系和安全版權保護體系,持續(xù)提升電影視聽品質和產業(yè)綜合效益,為建設實現(xiàn)電影強國提供強大的科技力量和智慧。