重構與挑戰(zhàn)：“深度合成”的傳播影響與技術反思

2021-12-04 09:06喻國明

山西大學學報（哲學社會科學版） 2021年2期

喻國明,梁爽

(1.北京師范大學新聞傳播學院，北京 100875；2.北京郵電大學數(shù)字媒體與藝術設計學院，北京 100876)

在智慧傳播的時代背景下，不斷成熟革新的人工智能傳播技術及海量流動數(shù)據(jù)的結(jié)合，為媒介數(shù)據(jù)實現(xiàn)從傳統(tǒng)文本數(shù)據(jù)、電子文本數(shù)據(jù)到音視頻數(shù)據(jù)的過渡提供了支撐和保障。尤其是當下日益復雜的信息傳播場景，大大豐富了媒介用戶的多維使用體驗，“媒介-技術-用戶”互動全面滲透人們的社會生活。在此媒介技術語境下，“深度合成(Deep synthesis)”技術應運而生，一經(jīng)推出便迅速在世界范圍內(nèi)廣泛傳播并產(chǎn)生深刻影響。如今，作為人工智能技術進步和媒介社會發(fā)展的產(chǎn)物，結(jié)合多種信息網(wǎng)絡技術的深度合成已參與到社會生活的方方面面，在還原社會情境、虛擬人物形象、深度文本融合等環(huán)節(jié)中發(fā)揮著重要的作用。不少技術樂觀主義者認為，深度合成技術的商業(yè)價值不容忽視，其在影視產(chǎn)業(yè)、游戲產(chǎn)業(yè)、時尚產(chǎn)業(yè)中的技術參與能有效降低生產(chǎn)難度與制作成本，更能通過技術支持以促進用戶與產(chǎn)品的雙向互動，拉近用戶與內(nèi)容產(chǎn)品的距離，大大提升相應的媒介傳播效果及影響力；也有技術悲觀主義者提出，應當警惕當今社會中深度合成技術所帶來的國家公民安全、新聞公正性、算法監(jiān)督處理等方面的問題與挑戰(zhàn)。

與持續(xù)升溫的市場應用與社會討論相比，圍繞深度合成議題進行的學術研究剛剛起步，現(xiàn)階段的國內(nèi)外研究大多集中在深度合成機器學習與智能算法[1-3]、合成技術之深度偽造[4-7]等方面，但較少對深度合成整體生態(tài)發(fā)展的把握?？傮w看來，在對技術的剖析、應用的既有研究中，深度合成的技術邏輯、媒介社會反思成為研究者普遍關注的重點議題，怎樣理解現(xiàn)階段深度合成的技術邏輯及結(jié)構特征，包括智能算法、計算機結(jié)構模型對深度合成技術演進的支撐性作用？如何認知智慧傳播時代背景下深度合成技術參與下的媒介社會互動？又如何合理利用深度合成技術對社會產(chǎn)業(yè)結(jié)構及社會價值產(chǎn)生的深刻影響，并積極應對技術媒介融合趨勢下的機遇與挑戰(zhàn)？這些問題的探討關系著對深度合成技術既有影響的社會反思與媒介技術未來發(fā)展的把握。本文沿著“技術溯源—媒介技術互動—消解與重構—挑戰(zhàn)與策略”的邏輯思路，對現(xiàn)階段深度合成技術的結(jié)構特征、技術參與、社會影響等內(nèi)容進行深入剖析，并結(jié)合技術帶來的一系列影響進行媒介社會反思，提出應對措施與策略建議。

一、技術溯源：“深度合成”技術邏輯與結(jié)構特征

“深度合成”的概念來源于計算機科學中“深度學習(Deep learning)”和“合成(Synthesis)”的結(jié)合，作為一種基于算法指令自動化運行的合成媒體(Synthetic media)技術手段，深度合成技術泛指借助人工智能算法和計算機虛擬合成技術生成的數(shù)字化文本內(nèi)容，包括自動生成的文本、圖像、語音、視頻等內(nèi)容形態(tài)。從技術實現(xiàn)手段而言，深度合成技術主要依賴于生成器(Generator)、鑒別器(Discriminator)等智能算法手段——于2014年正式合并生成為深度神經(jīng)網(wǎng)絡形態(tài)“生成式對抗網(wǎng)絡(Generative Adversarial Network, GAN)”；除此之外，卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)、變分自編碼器(Variational Auto Encoders,VAE)等技術模型的加入也為深度合成提供了核心支撐與技術基礎。隨著通信網(wǎng)絡技術的逐步革新，深度合成現(xiàn)如今已發(fā)展為集文本合成、圖像合成、音頻合成、視頻合成等內(nèi)容為一體的多模態(tài)合成技術。

究其本源，深度合成技術在20世紀90年代被學術界納入智能科學的研究范疇之中，并在計算與應用的演變過程中日趨優(yōu)化與完善，其應用操作的基本邏輯為通過將文字、圖像、音頻、視頻片段的疊加、合并或替換，從而實現(xiàn)新文本、新內(nèi)容的合成與虛擬。起初，深度合成技術的進步主要得益于GAN模型的不斷精進，Korshunova等人在2017年首先提出利用生成式對抗網(wǎng)絡來訓練面孔識別模型[8]，隨后，有科學家致力于研究基于長短期記憶(Long Short Term Memory,LSTM)的架構模型，通過語音以提煉人類口腔特征[9]?？茖W研究成果的面世引發(fā)了市場上開源方案的提出，加速了深度合成內(nèi)容的推動與演化進程。如今，技術推動下的深度合成不僅能完成圖像合成、視頻合成等程序功能，更能通過機器深度學習實現(xiàn)真人聲音模擬、虛擬人物創(chuàng)造等多線程模態(tài)任務。

就深度合成技術的結(jié)構特點而言，一是結(jié)構模型穩(wěn)定，由生成器和鑒別器生成的GAN首先將提供材料中的隨機噪聲轉(zhuǎn)化為目標圖像模型，再針對即將合成圖像進行驗證與判別，一旦由鑒別器判定為假，生成器則立即收到反饋并進行相應改進。隨著兩個對抗算法不斷進行自我優(yōu)化，經(jīng)過“機器自我學習”模式的合成圖像最終“進化”為高度逼真的文本模態(tài)，從而達到“以假亂真”“混淆視聽”的呈現(xiàn)效果。二是合成內(nèi)容精密度高，人眼在有限時間內(nèi)無法進行準確的辨別。從理論上講，只要有充足的數(shù)據(jù)學習資料和過硬的運算及硬件支持，深度偽造出的合成內(nèi)容就能無限度逼近“真實”，可以說，“更大的數(shù)據(jù)、更優(yōu)的算法、更好的硬件約等于無限接近真實的合成內(nèi)容”。接下來，基于光線調(diào)控、眨眼頻率、微表情捕捉等功能的多模態(tài)特征融合技術進一步增加真假內(nèi)容文本的識別難度。三是兼容普適性較強，深度合成技術支持多載體、多任務兼容，且隨著技術的不斷開源與優(yōu)化，技術的準入門檻逐漸降低，用戶無須具備編程語言知識和軟件庫支持即可進行運行操作。因此，滿足了用戶獵奇、模仿心理的深度合成產(chǎn)品通過社交網(wǎng)絡、陌生人傳播模式的助力，迅速吸引了大量關注，在促進傳輸速率、傳播效果的同時迅速實現(xiàn)流量到價值紅利的轉(zhuǎn)化。

二、媒介技術互動：智慧傳播時代“深度合成”的技術參與

2020年被稱為是“深度合成的商業(yè)化元年”，實現(xiàn)人工智能換臉、人臉合成、語音合成、視頻生成甚至數(shù)字虛擬人等諸多應用形式的深度合成技術，作為人工智能發(fā)展到一定階段的產(chǎn)物，逐步從深度偽造(deepfake)的陰影中脫離，迎來了商業(yè)化時代。[10]在走入智慧傳播時代的當今社會，未來網(wǎng)絡、5G/6G、區(qū)塊鏈等新興智能技術的耦合與應用將多維智慧媒介推向新的歷史發(fā)展階段，“萬物皆媒”“萬物互聯(lián)”被賦予新的內(nèi)涵外延?，F(xiàn)階段，人工智能技術迎來第三次發(fā)展浪潮，在超強算法、生物智能、移動傳感等技術的加持下，人與機器、人與技術、人與媒介的互動合作更加親密無間，無論是區(qū)塊鏈技術應用推動下的智慧媒介生態(tài)系統(tǒng)改革，“5G+AI”對“場景化傳播”模態(tài)結(jié)構改革的全面推動，還是下一代網(wǎng)絡技術推動下“用戶中心”傳播格局的進一步深化，都為今天的媒介技術互動發(fā)展提供了新的時代情境與現(xiàn)實需求，新興智能技術正快速進入社會傳播活動的各個環(huán)節(jié)。

實際上，深度圖像合成(Deep image synthesis)、深度視頻合成(Deep video synthesis)、深度語音合成(Deep sound synthesis)以其高技術融合性和算法成熟性，較早地進入了人們的視線?，F(xiàn)階段，具備高度仿真能力和信息捕捉能力的深度合成技術正在被廣泛應用于影視、娛樂、教育、醫(yī)療、社交、電商、科研等諸多領域，在媒介技術互動、推動社會智慧傳播進程方面發(fā)揮了一定的技術貢獻。例如，應用于電商領域的深度合成技術通過“快速換臉”技術，實現(xiàn)了消費者在購買前的“數(shù)字虛擬試穿”；醫(yī)療領域的深度合成技術能夠通過說話者自適應(Speaker adaption)和說話者編碼(Speaker encoding)技術，讓失聲患者重新獲得“自己的聲音”；在科普教育領域，英國公司利用語音合成技術將貝克漢姆的聲音自動合成為八國語言，面向不同語言地區(qū)的青少年進行科學普及推廣工作。

與此同時，在音視頻深度合成技術的基礎之上，借助自然語言處理的深度身體合成(Deep whole-body synthesis)技術也在近年走入大眾的生活場景之中。2019年，日本人工智能數(shù)據(jù)網(wǎng)絡公司Data Grid正式宣布仿真人AI的面世，新智能產(chǎn)品能夠在身體深度合成技術的支持下自動生成虛擬人體模型，可全面應用于時尚、服裝、娛樂等產(chǎn)業(yè)。同年，騰訊人工智能實驗室(AI Lab)正式發(fā)布首個電競虛擬人T.E.G(天鵝靜)，利用3D人臉塑型技術和深度身體合成技術，實現(xiàn)了語音、面部表情、肢體動作的人體深度合成遷移。一方面，不斷升級優(yōu)化的深度合成技術將協(xié)助人工智能進一步優(yōu)化升級，完成更多、更廣的服務工作；另一方面，通過自主學習與算法調(diào)整，技術得以進入“自主操縱”“自動合成”的全新生產(chǎn)階段，從而實現(xiàn)從單純“復制-粘貼”的簡單操作到“學習-優(yōu)化-進階”復雜算法的跳躍。

三、消解與重構：“深度合成”對社會產(chǎn)業(yè)結(jié)構及價值邏輯的深刻影響

不可否認，深度合成技術的進步給今天的媒介社會結(jié)構帶來前所未有的挑戰(zhàn)。正如《黑鏡(Black Mirror Season 5)》中展示的虛擬合成偶像“Ashley Too”生產(chǎn)過程，表現(xiàn)了深度合成技術對人類社會生活、情感認知帶來的沖擊性影響。近年來，深度合成內(nèi)容的廣泛傳播對媒介信息、政府機構乃至整個社會系統(tǒng)的信任、安全情況帶來深刻的影響，同時對社會政治、經(jīng)濟、文化、軍事以及社會成員的認知、交往方式等社會價值邏輯產(chǎn)生重要變革。

首先，深度合成技術以其算法優(yōu)越性和技術跨越性，對社會文化引擎與價值邏輯不斷進行著消解與重構?；谥悄芩惴夹g和智能通訊手段發(fā)展而來的深度合成，自誕生以來，就以其融合性、互動性、精準性影響著人們的社會價值認知與文化產(chǎn)業(yè)發(fā)展進程。深度合成技術的滲透參與持續(xù)推動著社會文化形態(tài)的演進，在“符號價值”與“體驗價值”高度凸顯的當今社會，媒介產(chǎn)業(yè)的價值邏輯不斷被重構，更貼近消費者需求、更重視用戶體驗的“用戶中心”社會文化生態(tài)被逐漸建立，具有高度包容性、鮮明個人性的深度合成技術迅速受到年輕用戶群體的青睞，如美國NETFLIX公司制作的《怪奇物語》借助Facebook的深度合成特效技術，支持用戶與劇中演員“同框”制作短視頻，拉近了作品與觀眾的距離，以參與其中的互動方式提升了觀眾的整體觀看體驗。近年來，隨著深度合成技術的不斷成熟與優(yōu)化升級，其產(chǎn)研聯(lián)動價值與藝術文化價值也逐漸顯現(xiàn)，如2019年MIT-IBM Watson人工智能實驗室發(fā)布了基于深度合成技術的“AI藝術畫師”產(chǎn)品，正是以大量人類畫作“投喂”生成對抗網(wǎng)絡(GAN)的形式，通過計算工具“GAN Paint Studio”不斷訓練“AI畫師”的藝術鑒賞、藝術創(chuàng)作能力，重塑了社會對藝術價值、文化價值的認知方式與評判標準。

其次，深度合成技術通過與多產(chǎn)業(yè)、多場域的聯(lián)動融合，給社會眾多產(chǎn)業(yè)發(fā)展提供了新思路、新路徑，同時也注入了鮮活的生機與動力。近年來，深度合成技術的普及與推廣深刻影響了游戲、藝術、娛樂、社交通訊、新零售等產(chǎn)業(yè)領域，從媒介技術融合的方式手段上為影視制作公司、博物館修復、深度報道、數(shù)字復活等工作開辟了新的工具和平臺，切實提升了文化產(chǎn)品的創(chuàng)建效率。尤其是自動數(shù)據(jù)生成、全身合成、3D塑型等技術形態(tài)的加入，大大節(jié)約了今天挖掘新聞數(shù)據(jù)、視頻特效制作、多維圖像修復等任務的時間與資金成本，推動了數(shù)字應用場景的拓展與落地。實際上，最基本的深度圖像合成、深度視頻合成技術早已通過與移動應用App合作嫁接的形式多次出現(xiàn)在我們的生活場景之中。與深度偽造技術有所不同，深度合成技術在維護數(shù)據(jù)安全、識別虛假信息等方面具有一定的技術優(yōu)勢與研究基礎，AI合成主播、虛擬偶像、虛擬客服等也隨著深度合成技術的不斷深化融合而變得愈加逼真可信。以深度合成技術支持下的虛擬偶像為例，計算機通過對圖像、聲音、空間位置等信息的精準捕捉與復雜計算，為虛擬形象、虛擬人物的全方位塑造以及次元界限的打破提供了技術可能；加上深度語音合成技術對真人聲音、語態(tài)的編碼塑造，進一步為虛擬偶像的跨場域傳播創(chuàng)造了條件，經(jīng)過機器深度學習和算法訓練之后的虛擬偶像更能擔負與粉絲實時互動、進行情感創(chuàng)作等工作任務。

四、挑戰(zhàn)與應對：“深度合成”技術的媒介社會反思

正如前面探討的，深度合成技術在一定程度上對媒介社會帶來了變革性影響，其輻射范圍涉及社會結(jié)構、系統(tǒng)及社會成員認知、生活的方方面面。在如今智慧傳播時代的媒介社會大背景下，無論是深度合成技術對媒介樣態(tài)的豐富與催生，從傳受結(jié)構、傳播模態(tài)上給今天的媒介傳播格局帶來震動與重構，還是媒介技術互動參與過程中衍生的社會結(jié)構、倫理與安全問題，都需要將技術、社會倫理與人的關系緊密關聯(lián)起來進行考量。正如有專家對“技術-倫理”關系的闡述：技術不可能以獨立于倫理的態(tài)勢獲得發(fā)展，倫理是前沿科技發(fā)展的框架和底線，倫理的反思和引導需要一直貫穿技術發(fā)展的終始。[11]對深度合成技術的媒介社會反思亦是如此，技術的發(fā)展應遵循社會倫理,在社會倫理規(guī)范和框架下有序推動技術的革新和進步。

實際上，為對抗深度合成技術給媒介社會帶來的一系列影響，學界和業(yè)界正在積極尋找相應的實施策略與解決方案。例如，結(jié)合無須權限的區(qū)塊鏈技術(Permissionless blockchain)，可以適用于深度合成的防范與監(jiān)測工作，主要應用場景包括監(jiān)測日志與傳播行為、防篡改元數(shù)據(jù)及相關記錄、維護身份認證密碼及通行監(jiān)測等等。另外，利用循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Networks,RNN)、成對學習(Pairwise Learning)、數(shù)字圖像取證技術(Digital Image Forensic)等人工智能技術，在處理深度合成監(jiān)測、任務判定的過程中取得了一定的效果。谷歌在《人工智能：我們的原則(AI at Google: our principles)》中承諾：“我們致力于開發(fā)人工智能的最佳實踐，以減少技術濫用所帶來的潛在危害”[12]。2018年以來，谷歌著力研發(fā)的新型數(shù)據(jù)監(jiān)測系統(tǒng)，旨在開發(fā)新的深度合成內(nèi)容檢測工具，更高效地識別深度合成假視頻。但必須認識到的是，隨著深度合成技術的不斷成熟與算法升級，相關虛假合成內(nèi)容的檢測難度也逐漸增加。應當基于不同國家、地區(qū)的社會特點及區(qū)域優(yōu)勢，尊重社會技術發(fā)展邏輯與安全治理經(jīng)驗，整合技術發(fā)展、社會參與和政府監(jiān)管力量的綜合力量，循序漸進、科學有效地實現(xiàn)對深度合成內(nèi)容的規(guī)范與整改。

我國較早對深度合成的社會影響進行了關注與應對，相關政府職能部門面對這一社會問題制定了一系列管理措施。2018年3月，國家新聞出版廣電總局辦公廳下發(fā)《關于進一步規(guī)范網(wǎng)絡視聽節(jié)目傳播秩序的通知》，其中明確規(guī)定：“堅決禁止非法抓取、剪輯改編視聽節(jié)目的行為，嚴格管理包括網(wǎng)民上傳的類似重編節(jié)目，不給存在導向問題、版權問題、內(nèi)容問題的剪拼改編視聽節(jié)目提供傳播渠道?！盵13]并立即采取措施，對社交網(wǎng)絡市場中存在問題的合成音視頻、移動應用進行全面整改。次年1月，中央網(wǎng)信辦、工業(yè)和信息化部、公安部、市場監(jiān)管總局四部門聯(lián)合發(fā)布《關于開展App違法違規(guī)收集使用個人信息專項治理的公告》，并迅速成立移動應用違法違規(guī)手機使用個人信息專項治理工作組，對多款設計違規(guī)操作的移動應用進行查處。[14]緊接著，國家互聯(lián)網(wǎng)信息辦公室、文化和旅游部、國家廣播電視總局聯(lián)合發(fā)布《網(wǎng)絡音視頻信息服務管理規(guī)定》，其中指出：“網(wǎng)絡音視頻信息服務提供者和網(wǎng)絡音視頻信息服務使用者利用基于深度學習、虛擬現(xiàn)實等的新技術、新應用制作、發(fā)布、傳播非真實音視頻信息的，應當以顯著方式予以標識。”[15]這一新規(guī)定于2020年1月1日起正式生效實施，同時積極推動相關立法規(guī)制的確立進程。

國際方面，美國較早對深度合成內(nèi)容的社會公信問題進行關注，在《2019年深度合成報告法案》中明確指出：“出于誤導目的、使用新興技術(包括人工智能、機器學習等)，偽造或者操縱音視頻或其他文本數(shù)據(jù)的數(shù)字內(nèi)容偽造(Digital content forgery)，將使他人對偽造內(nèi)容的真實性產(chǎn)生誤信，進而對社會公信、政府能力產(chǎn)生懷疑，并可能給社會系統(tǒng)帶來后續(xù)更大危害，”[16]。2020年1月8日，美國國會針對數(shù)字操縱問題舉行新聞聽證會，有媒體報道認為，此聽證會是一個明確的信號，它表示議員們正在認真對待“深偽”帶來的威脅。[4]另外,英國出臺的《網(wǎng)絡危害白皮書(Online Harms White Paper)》于2019年4月被正式遞交國會，證實了英國將采取確實措施對深度合成內(nèi)容進行政府監(jiān)管[17，18]。綜合來看，深度合成技術所觸發(fā)的智能風險問題已得到國際社會普遍重視，大家都在積極尋找相應的方案給予應對和解決。

五、結(jié)語

今天，“深度合成”給人類社會帶來了前所未有的顛覆和改變，不斷推動媒介社會的格局創(chuàng)新與價值重構。正如麥克盧漢所說的：“媒介是社會發(fā)展的基本動力，也是區(qū)分不同社會形態(tài)的標志。每一種新媒介的產(chǎn)生與應用都宣告我們進入一個新的時代?！盵19]作為人工智能技術進步的產(chǎn)物，深度合成由誕生之初的科研技術產(chǎn)品，逐漸演變?yōu)槊浇榧夹g互動融合的典型代表，值得我們對現(xiàn)階段媒介技術倫理進行深刻的思考。

尤其是伴隨著媒介技術社會的高度發(fā)展，人們對技術、機器之依賴度、黏性度、親密度日益提升，而“技術的鐵籠”(1)“技術的鐵籠”的概念最初源自Weber的社會學論述，由法國技術哲學家Ellul正式提出，后由美國科技倫理學家Spinello進行了“技術鐵籠之倫理、道德”的經(jīng)典論證。有中國學者指出：“我們說工具的場景分隔，在技術理想主義者看來，這就是所謂機械的‘技術的鐵籠’?！盵20]對人的束縛、制約甚至控制呈增強之勢。深度合成作為技術工具既可以拓寬人類認知、豐富媒介體驗，同時也加劇了人的軟弱性。[21]人們在享受技術帶來便利、優(yōu)勢的同時，也不得不面對由技術濫用、數(shù)據(jù)偽造等帶來的一系列問題。我們必須認識到深度合成技術給娛樂、時尚、教育、游戲產(chǎn)業(yè)發(fā)展帶來的活力與契機，給相關領域的延伸與拓展開辟了新的路徑。例如，結(jié)合深度合成技術的科普教育能輕松合成多國語言進行世界大范圍的傳播；利用數(shù)字合成技術的影視制作能更高效、低成本地合成電影視覺特效，從而提升用戶的觀影體驗。然而，也應高度警惕深度合成技術給社會安全帶來的風險，以及給現(xiàn)有法律體系造成的新的挑戰(zhàn)?，F(xiàn)階段，應當積極采取防范措施以應對深度合成帶來的危害，并將其納入全球治理的框架范圍之內(nèi)；大力推動國際打擊深度合成虛假信息的有效協(xié)作，避免深度合成虛假信息在世界范圍內(nèi)的肆意擴散，維護國家和社會的繁榮與穩(wěn)定。

恰如尼葛洛龐帝說的，“不管怎么樣，我們無法否定這個媒介化生存時代的存在，也無法阻止傳播技術的前進?！盵22]目前，深度合成技術在我國的演化發(fā)展尚在可控范圍之內(nèi)，未來應如何從算法、數(shù)據(jù)、應用等層面科學管控技術倫理規(guī)程，發(fā)揮新興技術優(yōu)勢以促進媒介社會發(fā)展、造福人類社會，將是一項值得持續(xù)關注的重點議題。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

重構與挑戰(zhàn)：“深度合成”的傳播影響與技術反思

一、技術溯源：“深度合成”技術邏輯與結(jié)構特征

二、媒介技術互動：智慧傳播時代“深度合成”的技術參與

三、消解與重構：“深度合成”對社會產(chǎn)業(yè)結(jié)構及價值邏輯的深刻影響

四、挑戰(zhàn)與應對：“深度合成”技術的媒介社會反思

五、結(jié)語

一、技術溯源：“深度合成”技術邏輯與結(jié)構特征

二、媒介技術互動：智慧傳播時代“深度合成”的技術參與

四、挑戰(zhàn)與應對：“深度合成”技術的媒介社會反思

五、結(jié)語