莊文杰 童名文
(華中師范大學 人工智能教育學部, 湖北 武漢 430079)
非物質文化遺產(以下簡稱“非遺”)是人民群眾在勞動中形成的集體智慧結晶,彰顯著鮮明的民族特色和歷史記憶,是珍貴和不可再生的精神文化寶藏。黨和國家非常注重對傳統(tǒng)文化的保護、傳承與可持續(xù)發(fā)展,多次提出“文化是一個國家、一個民族的靈魂”①,“實施中華優(yōu)秀傳統(tǒng)文化傳承發(fā)展工程,是建設社會主義文化強國的重大戰(zhàn)略任務”②等重要論斷。因此,發(fā)揮信息技術優(yōu)勢、提升文化與科技深度融合能力,符合我國文化大繁榮和提升文化軟實力的主旋律,是對文化振興與文化強國號召的響應,更是文化、科技工作者的歷史責任與時代使命。
視頻作為一種優(yōu)秀的媒介載體,可利用其特有的視聽敘事和藝術渲染手段,來系統(tǒng)、直觀、多元地呈現文化元素和表達文化內涵,是非遺數字資源的重要組成部分。歷經長期積淀和努力探索,對非遺視頻的管理與利用已上升到新的高度,涌現出了大批膾炙人口、制作精良的新作品,凝結了較多資源組織、傳播推廣的新模式,并呈現出一派百家爭鳴、百花齊放的新態(tài)勢。但是,相較智能時代的要求,目前非遺視頻資源的傳播進程仍處于粗放、單向、靜態(tài)的傳統(tǒng)范式中,還不足以在反映視頻規(guī)律的前提下智能匹配受眾個性需求,也不能根據受眾認知變化實時地做出策略調整。為解決上述問題,需要以創(chuàng)新的視野重新審視非遺視頻資源的傳播要素,理清其內部的作用機制,并展開應對策略的研究與實踐。因此,本文聚焦非遺視頻資源,通過資源、受眾、策略三方關系的邏輯梳理來創(chuàng)設智能傳播情境,同時結合對非遺視頻結構化組織、目標受眾個性特征解析、智能傳播引擎實施路徑的深入探討,分別去解決內容智能生成、過程智能診斷、策略智能修正的問題,以期能為非遺視頻智能傳播的實現提供有價值的參考思路。
智能視域下,非遺視頻資源的傳播是一項復雜的系統(tǒng)工程,現以傳播中關鍵環(huán)節(jié)為線索,分別從資源組織、受眾畫像、智能策略這三個方面來展開相關研究的述評。
結構良好的組織狀態(tài)有利于資源的存儲、管理和調取,是智能傳播的前提。較多研究者針對不同領域,從標準規(guī)范、方法過程、應用實踐等層面做了大量的理論探討和經驗總結。B.Murtha從元數據架構出發(fā),利用受控詞表和分類體系,豐富了藝術與建筑領域的描述模式③。Noriko Kando等通過對文化遺產中異構資源的多維元數據整合,實現了資源的無縫檢索與融合④。印度學者Hiranmay Ghosh等利用MOWL本體語言,構建出多媒體資源與領域概念間的感知模型,從而實現了古典舞蹈知識與視頻之間的關聯⑤。翟珊珊以“楚劇”為例,在資源本體基礎上,利用元數據關聯和語義化標注的方法,實現了楚劇多媒體資源的有效聚合⑥。董坤等根據非遺知識屬性提出7元組的本體結構模型,并基于D2RQ平臺,完成了RDF格式轉化與關聯數據發(fā)布⑦。在實踐中,更多的研究者立足于特定項目,通過綜合方法的選用來揭示多維度、多層級的資源本質。徐雷等對敦煌壁畫中靜態(tài)圖像元素采用復合語義標注,從敘事維度出發(fā)完成了基于情節(jié)、實體和活動信息的組織與表達⑧。侯西龍等使用SURF算法和窗口閥值的鏡頭分割法,將“七夕節(jié)”視頻分割成不同顆粒度的邏輯單元,并通過單元的語義標注實現了概念與視頻間的語義關聯⑨。
非遺視頻,不僅在格式、形態(tài)、內容、對象、時空上具有多維的描述角度,還擁有文化空間、人物關系、影音敘事、藝術手法等獨特的語境關系?,F有研究雖可提供一定的方法指導,但還不能全面匹配非遺視頻的邏輯結構并揭示內在關系。所以,有必要深入思考非遺視頻的媒介屬性和知識表征過程,進一步理順其知識空間和本體架構思路。
受眾是傳播的主體,對其準確的解讀決定了交互走向和體感效果,是智能傳播實現的必要條件。不少研究表明,捕捉受眾需求、描述個性特征可實現資源與對象的精確匹配,提升服務的智慧化水平。陳丹等通過讀者的個性特征定位,為數字館藏資源的智慧服務提供了思路⑩。Rossi等通過分析登機用戶的個性軌跡,實現了智能化的資訊服務和機場管理。受眾行為是內在屬性的外在顯化,Chikhaoui利用概率后綴樹和標準化互信息的綜合方法來抽取受眾特征行為,并通過因果推理完成活動的預測。徐海玲等通過概念格方法,對讀者群體的特征行為進行關聯數據挖掘,以此來預測潛在閱讀興趣。在受眾畫像中,也有不少研究專注于社會屬性和個性屬性的細致闡述,比如,邱云飛等從自然屬性、需求偏好和特征行為幾方面來構建社交媒體的用戶標簽;肖君等從基本特征、學習行為、學習路徑等方面來進行在線學習者畫像分析;自適應學習平臺Knewton,從用戶偏好、認知風格、知識結構和能力水平等角度來動態(tài)評估學習者智能的在線學習過程。
對非遺視頻受眾而言,因項目在內容上的復雜性,其在年齡分布、興趣愛好、目標需求、認知基礎上存在較大差異。現有研究在解決群體認知差異大、范圍跨度廣的問題的深度略顯不足,還需在此基礎上進一步凝練受眾共性和增強包絡性,并通過受眾行為的定量分析與深度挖掘以構建動態(tài)修正的合理機制。
隨著時代進步與技術提升,現代傳播更為注重先進理念的引領和科技元素的融入。在文化傳播領域,代表性的觀點有:智能媒體可以嶄新的形態(tài)實現非遺內容的裂變式傳播;依托5G和多種數字技術,可加快非遺知識轉型并提供智能、即時的內容與產品;VR和AI技術,可幫助構建文化體感情境,加深文化認知和促進文化服務;短視頻,可在“互聯網+”時代實現非遺文化的大眾普及并產生傳播的集聚效應。在知識傳播領域,美國的ISIS-TUTOR、Adaptive VIBE、Knewton,可實現特定領域知識內容的智能推送;荷蘭愛因霍芬科技大學的AHA可實現學科內容的智適應呈現與導航;雅典大學的INSPIRE可實現個性化學習內容的智能生成。在智能算法優(yōu)化領域,徐天偉等從基于項目、用戶和屬性值矩陣的協同過濾,盈艷等從預測填充矩陣的聚類算法,馬相春從知識路徑和資源推送的智適應系統(tǒng)架構等角度都給出了一定的解決方案。
智能傳播是未來的發(fā)展趨勢和前沿陣地,有必要從智能化視野上對非遺視頻的傳播模式和方法展開探討:通過對資源智能布局、受眾智能分析的深入剖析,實現領域視頻資源的精準投放;通過對智能診斷與智能決策原理的系統(tǒng)研究,創(chuàng)設豐富的智能交互情境。只有解放思想,吸收、借鑒和融合相關領域中的新理念、新方法、新技術,并將理論與實踐相結合,才能創(chuàng)新文化傳播業(yè)態(tài),順應時代發(fā)展的需要。
為達到對非遺視頻資源的智能傳播目標,在系統(tǒng)架構中不僅需要思考如何突出特定文化空間內所蘊含的豐富語境關系,并按照特征內容做好對視頻信息載量、數據標識、關聯方式、鏈接強度的規(guī)劃,而且需要考慮如何提煉傳播對象的共性,采用動態(tài)視角定量分析受眾個性特征,更為關鍵的是如何體現智能性,即通過創(chuàng)設智能傳播情境去挖掘受眾交互行為的數據、去接受眾個性需求定向匹配視頻資源并實時做出策略上的智能調整?;谝陨嫌^點,本文從“非遺視頻資源組織”“受眾個性特征解析”“智能傳播處理引擎”這三個方面設計了非遺視頻資源的智能傳播模型,具體框架如圖1所示。
圖1 非遺視頻資源智能傳播模型示意圖
非遺視頻,是采用動態(tài)影音去直觀呈現文化內容、表達文化知識、反映文化情境的專屬數字資源。在實際的管理與利用中,常因制作標準不同,其在格式規(guī)范、清晰程度、光影質感、語音規(guī)范、畫面節(jié)奏上會有較大差異;因敘事維度不同,在知識闡述、學術深度、藝術表現上亦表現出不同的可利用價值。所以,為深度刻畫非遺文化內涵,克服碎片化、無序化的組織障礙,從而實現立體、全面、系統(tǒng)的組織過程,在資源選取中,可遵循“保障非遺知識敘事完整、優(yōu)先選擇歷史稀缺資源、注重質量與風格的協調統(tǒng)一”,即“取其意、用其珍、統(tǒng)于形”的原則,來對視頻資源進行篩選與過濾。在粒度標定中,應以表述內容的知識點為界限,通過剪輯、加工與重塑的處理,采用非遺視頻元(最小視頻單位)的形式來輸出可播放的單個視頻實體。在語境表達中,應在文化學者的指導下,通過多維的數據屬性描述、語義關系標注、難度系數標記等途徑來實現資源的鏈接與聚合,進而構建出高效、智能的結構化非遺視頻資源網絡。另外,為監(jiān)測受眾認知和掌握情況,并為智能決策提供依據,每個非遺知識單元都將設置一組認知測試題,該集合也對應存儲于資源庫中。
受眾是智能傳播的中介與橋梁,決定了資源調取和策略實施的具體走向??紤]到系統(tǒng)冷啟動問題,將采用“老受眾”與“新受眾”兩種方式:“老受眾”通過登錄,可直接載入特征數據;“新受眾”將通過基本信息注冊、特征初始化后在特征庫中存入其個性數據?;拘畔?,將分別從姓名、性別、年齡、身份、職業(yè)、興趣、愛好等維度收集信息,用于群體分類和相似度比較;特征初始化,將利用國際通用的成熟量表和認知測試題,分別從目標需求、訪問風格和認知狀態(tài)上量化受眾的個性數據。同時,在資源交互過程中,將采集受眾的特征行為和項目評價數據,并通過特定算法去智能、動態(tài)地修正與更新初始的特征數據。
處理引擎是智能傳播的核心驅動模塊,擔負著資源提取、智能布局、情境交互、認知評測、智能決策、信息反饋等諸多功能。智能傳播引擎的運轉流程可解讀為以下幾個環(huán)節(jié):第一,讀取受眾個性特征數據,根據受眾的目標與需求,調用資源庫中對應的非遺視頻單元,并按照受眾的訪問風格屬性定位進行合理的、匹配的資源布局;第二,創(chuàng)設豐富的受眾與資源交互情境,呈現訪問視頻的先后序列、已通過和未通過的知識點表單,設置符合受眾習慣的項目評價按鈕,提供多元化的導航方式(比如:知識點圖譜、項目地域分布圖)以供順序式或跨越式點播;第三,待當前非遺內容單元訪問結束后,調用對應的認知測試題對受眾的掌握狀態(tài)進行智能評估與決策;第四,將決策信息反饋給資源智能布局模塊,對于通過的受眾可直接進入下一認知單元,對于不通過的受眾則需要進行認知內容的補充或難度系數的調整。
以上模型架構,為智能傳播的實現提供了一定的理論指導和方法思路,下面將對其中的具體細節(jié)、實施路徑、技術路線進一步展開策略的詳細探討與研究。
面對項目眾多、內容復雜且形式多樣、表現靈活的非遺視頻資源,若要實現對其有效組織并能可視化地反映出內部的組織結構,還需理清非遺視頻在知識承載、敘事方式、內容闡述、媒體制作等方面的內在規(guī)律,并在此基礎上建構出合理解決組織基因提煉、邏輯層次表述、關聯關系表達的系統(tǒng)方案。
非遺視頻是非遺知識的載體。按“世界經濟合作與發(fā)展組織”(OECD)對知識體系的劃分,非遺知識可對應地分解為事實型知識(know-what)、原理型知識(know-why)、技能型知識(know-how)和人員型知識(know-who)。非遺的事實型知識主要包括基本信息和歷史資訊,即項目概述、傳承現狀、演變歷程、歷史故事、存世資料等;原理型知識大多為反映文化空間的事件知識與時空知識,即事件順序、儀式流程、服裝道具、時空節(jié)點等;技能型知識主要是“做”與“唱”中步驟流程與器物使用的程序型知識,即工藝流程、唱法腔段、制作技能、演述技巧等;人員型知識是對代表人物和典型人物的了解,即各級代表性傳承人、領域專家、重點承繼人和參與人等信息。理解非遺的知識類別,做好知識跨度范圍的界定,將有助于非遺視頻最小內容表征單位的提煉與析出。
視頻作為視聽融合的大眾媒介,因現場影像與聲音的寫實束縛,在創(chuàng)作中只能采用有限的手法來進行素材采集和內容表征。但是,通過后期的藝術加工和綜合的敘事組合,也可完成無限的表意功能。經過對制作過程的系統(tǒng)分析,可將非遺視頻歸納出“事件紀實”“人物訪談”“情境再現”“畫外解說”“細節(jié)展演”這五種視聽形態(tài)。事件紀實,是以主觀或客觀視角,在現場通過攝像機去記錄和還原事件發(fā)生過程和發(fā)展全貌;人物訪談,是通過話題引導和自由講述,呈現個人對歷史、過程、事件及物品的見解與觀念;情境再現,是通過場景復原和真人演繹,重現虛幻人物和歷史故事;畫外解說,是以語言為線索,通過對應的視覺畫面來進行原理闡述和觀點表達;細節(jié)展演,利用特寫鏡頭和“點”的刻畫,去展現和演示技術與技巧的細微內容。不同形態(tài)的視頻,具備各自的信息表達優(yōu)勢,通過復合與疊加即可全方位、多角度、立體化地系統(tǒng)表征非遺知識內容。具體映射關系可參見圖2所示。
圖2 不同視頻形態(tài)與非遺知識表征的關系映射示意圖
在非遺視頻元的提取中,需要非遺領域和視頻技術人員的通力配合與相互協作,采用層層遞進、逐步細化的方法與原則。素材的篩選,應按照視頻形態(tài)完成以項目為單位的視頻歸類與集中,并在資源儲備較為充足的前提下優(yōu)先選用質量較高的影音數據。在知識覆蓋范圍的界定中,應以領域專家為主導,通過非遺知識最小表征單位的理解,實施對視頻中長鏡頭的切分和單個鏡頭的重組。在畫面與聲音的優(yōu)化組合中,應做到以內容敘事為導向,通過角度與景別的切換,來豐富畫面節(jié)奏和提升視覺張力,同時,應盡量保留現場同期聲,并添加恰當的音響效果以烘托整體氛圍。
非遺視頻經過視頻元提取,可得到諸多完整的視頻實體。為進一步清晰表達視頻間的邏輯結構和相互關系,還需要搭建合理的資源本體。
本體模型,一般采用最核心、最簡潔以及包絡性最強的術語或關鍵詞來描述對象的結構層次,是對事物邏輯和組織關系的頂層設計,有助于知識的抽象歸納和具象聯結。目前,國內絕大多數非遺資源本體模型,均借鑒了文化類資源概念參考模型(CIDOC CRM)的核心思想,采用以內容敘事為線索、以點串面的構建思路。該思路主要針對非遺泛在資源,雖可一定程度解決內容共聯、項目共通等問題,但還無法刻畫視頻的內在規(guī)律及突出其在媒介表達、敘事組織、藝術創(chuàng)作中的本質特征。所以,在非遺視頻的本體模型構建中,一定要遵循視頻的創(chuàng)作思維,在符合視頻內容語境的基礎上,進一步突出概念之間的邏輯層次。為了快速識別與定位視頻實體,本文以知識表征中視頻形態(tài)為切入點,從“事件紀實”“細節(jié)展演”“畫外解說”“情境再現”“人物評述”這五個方面來構建非遺視頻資源本體中的一級層次。以視頻的信息表述形態(tài)來完成本體中基本概念層次搭建,一方面無須對表達內容進行完整解讀,即可快速識別與定位非遺視頻元屬類,這有利于提升視頻實體的組織效率;另一方面,以形態(tài)來進行非遺視頻建構,能更貼近受眾的訪問習慣和風格判斷,將有利于后期智能傳播過程的實踐。
非遺具有眾多的門類,比如民俗、舞蹈、美術、音樂、文學等,同類別下不同項目亦表現出不同的專屬特征。結合對非遺視頻闡述內容的共性提煉,本體中的二級概念層次可做如下標定:事件紀實,按照事件類別細分出競技事件、儀式事件、內容事件與活動事件;細節(jié)展演,根據展示對象的不同,細分出步驟演示和說唱演述;畫外解說,依據概況角度和解說對象的不同,細分出基本信息、時空特性、資料與物品、發(fā)展脈絡;情境再現,從再現對象和虛構情境的角度,可細分出歷史故事、歷史人物、環(huán)境與物品;人物評述,可根據訪談對象的差異,拓展為代表性傳承人、典型人物、專家與學者、參與人。具體本體模型框架可參見圖3所示。
圖3 非遺視頻資源本體模型構建示意圖
上述的兩級概念層次體現了非遺項目的共通性,能較為全面地滿足不同項目的本體架構。但在三級及以下概念層級的拓展中,還需緊密結合具體非遺項目中多元的文化內容、多樣的文化語境以及復雜的人員關系等,做到具體情境具體分析。
為構建有序、聚合、結構與可視化的非遺視頻資源網絡,對單個非遺視頻元實體,可通過屬性描述建立外部的邏輯關聯,通過視頻間豐富的語境聯系建立內部的語義關聯。
元數據,作為一種對實體屬性描述的標簽數據,可為資源的識別、管理、組織及追蹤提供導向。為詳細說明非遺視頻元在基本信息、非遺屬性、視頻屬性、關聯屬性這四個維度的特征,本文在參考國際通用的DC、CDWA、VRC等元數據標準的基礎上,經過重點篩選與利弊權衡,確立17個核心元素來完成非遺視頻元實體的元數據描述。其中,選取{名稱、標識符}來標注基本信息,以實現檢索、查詢和調用的功能;選取{民族、項目類型、內容概述、傳承人、領域專家、參與人}來說明視頻實體在項目性質、內容以及人員方面的信息;選取{發(fā)布機構、制作人、拍攝時間、拍攝地點、視頻形態(tài)}來突出視頻在出品、制作及類別中的特征;選取{關鍵詞、屬類資源、層級資源、平行資源}來建構視頻間相互關聯的渠道。在元數據著錄后,經過RDF語言的關系標注,并結合相似特征屬性的數據比較,即可實現相同維度的非遺視頻元集聚。
在本體結構框架的指引下,因敘事視角的復雜性、呈現形態(tài)的多變性、藝術表現的多樣性,非遺視頻元各實例間會具有豐富的語義關系。通過對視頻間概念與概念、概念與實例、實例與實例間潛存關系的共性提煉,可以發(fā)現:在視頻創(chuàng)作中,圍繞同一個主題,不同形態(tài)視頻可采用不同藝術加工角度來表達平行的內容;在內容敘事中,可通過不同視角來展現事物的整體與局部,比如事件紀實強調事件發(fā)展過程的面,細節(jié)展演注重具體環(huán)節(jié)中的點;在表意功能中,視頻還具備解釋、說明、重現等作用,比如解說類視頻可用語言來詮釋事件發(fā)生的歷史背景,情境再現可重現歷史人物與故事;在人物行為中,可通過人員主持、參與等主動行為以及對客體的述說、回憶、評論等言語行為產生較為復雜的關系。因此,可將非遺視頻元間的語義關系總結為同一關系、點面關系、釋義關系和行為關系這四大類別,詳細說明參見表1。
表1 非遺視頻元間語義類別及關系說明(部分)
在明確了元數據和語義關系的基礎上,本文使用LodLive工具來生成非遺視頻的可視化關聯圖譜。在圖譜中,每個節(jié)點均代表著單個視頻實例,鏈接箭頭則描述了兩者間的關系,以任意節(jié)點為起點,都可搜尋到與之相關的視頻實體,并以遞進的方式說明兩者之間的關聯屬性。圖4展示出了“黑暗傳”視頻間部分的關聯圖譜,其左側是以元數據為導向的外部關聯數據集,可從不同的相似程度上建立自建數據集與眾多開源數據集之間的聯接;右側為領域內部非遺視頻元的關聯數據集,表示出了概念邏輯和豐富的語義關系。非遺視頻的可視化關聯圖譜,能幫助發(fā)現更多有價值的隱含信息,也更有利于實現對非遺視頻元實體的查找、調取和管理。
圖4 民間文學“黑暗傳”的視頻關聯圖譜
受眾是連接視頻資源和傳播引擎的紐帶與橋梁,對其個性化特征的準確解讀,將影響和決定內容投放及策略實施。面對紛繁各異的目標對象,在個性特征刻畫中,不僅要明確與分析出可描述的共性維度,搭建全面與系統(tǒng)的特征解析模式,還需確立根據受眾狀態(tài)進行定量分析與動態(tài)描述的方案。
開展非遺視頻資源的智能傳播研究,主要是為了讓更多的人了解、傳承和弘揚我國優(yōu)秀的傳統(tǒng)文化,通過系統(tǒng)的文化探索、文化認知、文化實踐,樹立起文化認同與文化歸屬的正確價值觀。隨著非遺文化的日益普及,更多的人渴望通過視頻來提升自身的文化素養(yǎng)。根據預期目標不同,非遺視頻的傳播與推廣對象可大致包含非遺項目承繼人、“非遺進校園”所覆蓋的中小學生、相關文化專業(yè)的在校大學生、文化專題研究人員以及對某類項目具有濃厚興趣的普通民眾這五類群體。上述目標群體,在年齡分布、知識基礎、工作性質上均有不同,在預期目標、文化需求、認知習慣等層面也表現出較大差異。但是,經過對傳播中受眾外顯共性的分析,可以歸納出:在起始階段,多數受眾會利用知識地圖和搜索引擎來定位資源和表達需求,會設定目標,并通過對資源價值和自身績效的判斷來評價傳播效果;在過程階段,會具備穩(wěn)定的視頻類型訪問偏好,并按照一定順序來接受和處理信息,會通過同化與順應方式來完成新舊知識融合和自身知識體系改造等。因此,本文將從需求與目標、訪問風格、認知狀態(tài)這三個維度來完成目標受眾的共性分析。
受眾需求,可通過內容檢索與熱區(qū)點擊來明確;受眾目標,在參考布魯姆在認知目標領域分類標準的基礎上,依據注冊角色的不同,劃分出“知道與領會”“應用”“分析”“綜合”“評價”這5個等級。當然,受眾也可根據對內容了解和認知情況的變化,自主選擇或改變相應的目標層級。訪問風格是對受眾喜好方式的理性判斷,是資源智能布局的重要參數。為了便于定量計算,借鑒相關研究成果,可分別從信息加工、信息感知、信息輸入和內容理解這四個角度來剖析。通過對“學”與“做”先后順序的解讀,來定位活躍型或沉思型;通過對“具體”與“抽象”知識特征的加工分析,來定位感覺型或直覺型;通過對“視覺”或“聽覺”信息偏愛程度的測量,來定位畫面型或言語型;通過對導航路徑和習慣的記錄,來定位序列型與綜合型。在認知狀態(tài)的分析中,應該立足于單個知識點,通過知識標號、抽象系數、難度等級的導入來標注內容細節(jié),通過瀏覽記錄與測試結果來備案訪問過程,通過對知識掌握程度和能力水平的變化來呈現認知結果。
綜合上述分析,圖5給出了詳細的受眾特征解析模式。在該模式中,除了明確需求與目標、訪問風格、認知狀態(tài)這三個特征維度,并根據內在結構對其核心要素進行拓展以外,還從數據傳輸的角度給出了合理架構,也就是:利用基本信息數據庫存儲需求與目標數據,構建個性風格數據庫存儲確定的訪問風格屬性,同時根據受眾交互行為,采用算法來修正其中的訪問風格數據;調用資源單元信息數據完成知識點信息的標注,同時構建認知狀態(tài)數據庫完成對訪問歷史和認知結果的信息儲存,以供智能傳播引擎進行數據分析。
圖5 目標受眾解析模式的架構示意圖
訪問風格是對受眾信息處理偏好方式的定性分析,為快速、精確地定位出風格維度屬性,同時兼顧新、老受眾的不同處理方式,可采用初始描述與動態(tài)修正相結合的遞進過程。
1.初始化描述
為解決新受眾在初次進入智能傳播系統(tǒng)時所遇到的冷啟動問題,本文選用在國際上通用且內容全面、問題精煉、耗時較短的Felder-Silverman量表來完成初始訪問風格維度定位。
Felder-Silverman量表,共有44道客觀選擇題,分別從信息加工、信息感知、信息輸入、內容理解這4個方向來探知受眾的訪問風格特征。根據受眾的問卷作答情況,量表將結果屬于單個維度左側的標記為a,右側的標記為b,通過數值累加和“(較大數-較小數)+較大數字母”的規(guī)則來推斷訪問風格屬性;同時,為處理因過于接近而判斷模糊的問題,將處于{3a、2a、a、b、2b、3b}區(qū)間的標記為“平衡型”。因此,通過一系列的作答數據統(tǒng)計,可描繪出該受眾初始的訪問風格屬性值,比如:某受眾,其信息加工為3b、信息感知為5a、信息輸入為7a、內容理解為5b,初始化結果即為{平衡型、感悟型、畫面型、綜合型}。
2.動態(tài)修正過程
由于Felder-Silverman風格量表在評測中維度過于宏觀,其精度會存在一定缺陷,并且在問卷答題過程中受眾會表現出一定程度的主觀隨意性,所以上述初始化結果并不能準確反映受眾真實的訪問風格屬性。行為是受眾偏好方式的外在顯化,分析、提煉、積累、挖掘受眾與資源交互中的有效特征行為,將有利于推斷出真實的受眾訪問風格參量,從而完成動態(tài)的修正過程。
受眾在對非遺視頻的選擇過程中,經常會依據自身偏好做出視頻類型的優(yōu)先序列組合,即表明非遺視頻形態(tài)與訪問風格維度之間存在一定的前因后果規(guī)律。為了清晰地呈現該因果概率的關系,本文采用貝葉斯網絡來實施以上不確定性事件的推理過程。依據訪問風格維度的劃分,同時結合非遺視頻在表述形態(tài)、內容組織以及信息導向中的貢獻大小,可確立如圖6所示的訪問風格貝葉斯網絡有向無環(huán)圖。
受眾行為具有多維性,在遵循“重點突出、力求簡潔”的原則下,經過比較與權衡可選取“點擊次數”和“訪問時長”作為其核心基元。點擊次數,凸顯了受眾興趣的外在表現,包含對視頻、導航、按鈕、熱區(qū)的操作計數;訪問時長,強調了興趣的持續(xù)跨度,包含對特定視頻瀏覽、論壇閱讀和導航停留的時間長度。為簡化貝葉斯網絡的推理過程及呈現邏輯細節(jié),本文以信息輸入維度為例,分別從“紀實”與“訪談”視頻出發(fā),同時結合受眾特征行為,可得到如圖7所示反映信息輸入維度中各種概率關系的貝葉斯有向無環(huán)圖。
概率關系是下級指標對上級維度的影響權重,經過相關文獻的梳理與歸納,可分別標注出如表2、表3、表4中所示的諸條件概率參考值。
表3 “訪談”類視頻條件概率表
表4 信息輸入條件概率表
上述各表中條件概率參數的取值,表示了在某狀態(tài)的前提下,另一相關事件發(fā)生的可能性。比如:表2中,P2=1和P1=1,表示“紀實”類視頻訪問的時間長且頻率高,意味著該受眾偏愛“紀實”類資源,所以P5=1的賦值較高;P2=1和P1=0,表示該類視頻訪問時間長,但點擊次數少,可能是專注于某一個視頻,或者處于暫停狀態(tài),所以P5取中間值。同理,可依次得到其他情境中的條件概率參考值。
為完成動態(tài)的定量推理過程,還需將受眾特征行為數據轉化成與之相匹配的先驗概率值。比如,初始化為“平衡型”的某受眾,經過一段時間,其對紀實類視頻共瀏覽6次、訪談類為1次、紀實類時長為5小時、訪談類為0.2小時。利用加權平均計算,可確定該受眾的先驗概率取值,分別為:P(P1=1)=0.86、P(P2=1)=0.96、P(P3=1)=0.14、P(P4=1)=0.04;P(P1=0)=0.14、P(P2=0)=0.04、P(P3=0)=0.86、P(P4=0)=0.96。
將以上數據分別代入貝葉斯全概率公式,即:
可得:P(P7=0)=0.904;P(P7=1)=0.096。
在終端的維度偏向判定中,可設置合理的比例來比較兩參數之間的差距。對于以上結果,因P(P7=0)> [P(P7=1)*1.5],可推斷出該受眾的信息輸入維度偏向左側,即屬于“畫面型”。同理,亦可修正其他維度中訪問風格的初始化參數。
受眾對非遺內容的認知過程以單個知識點為線索,通過“點”的突破以達到“面”的積累。為此,在知識點認知狀態(tài)的刻畫中,應將重點放在內容、目標和掌握情況這三個方面。其中內容闡述通過知識點本身和相互關聯屬性來說明,認知目標通過認知等級和難度層次來為智能判斷提供依據,掌握情況更多反映出瀏覽過程、測試狀態(tài)、掌握程度和能力水平的變化。另外,為方便計算機建模和信息處理,還應當明確各參數的字母標識、數據類型、值域范圍和初始賦值,具體如表5所示。
表5 以知識點為單位的認知狀態(tài)初始化參數說明表
隨著對內容的深入了解,受眾認知狀態(tài)會發(fā)生變化,特別體現在能力水平上。為及時監(jiān)測和評估受眾在該方面的變化,一般采用知識點后測的方式,并通過“累計積分”的方法來分析數據。后測試題項,由領域專家根據項目反應模型并結合具體內容來給出,以3-5項為宜,并采用難度平均分配的標準。表6列舉出了認知目標為“分析”的某大學生在單個知識后測中的得分和實際累計積分情況。
表6 某受眾的測試狀態(tài)和實際累計積分統(tǒng)計表
為準確衡量該受眾在能力水平上是否達到對應的認知等級,可比較“實際累計積分值/積分參考值”與“平均難度系數/難度閾值跨度”的數值比例大小。比如表7中,“分析”維度的積分比值為0.667,平均難度系數與閾值最大值的比值為0.889,因0.667>0.889*2/3,所以該受眾達到“分析”的能力要求;而“綜合”維度積分比值為0.333,平均難度系數與閾值最大值的比值為0.896,因0.333<0.896*2/3,所以該受眾沒有達到“綜合”的能力要求。
所以,通過以上數據計量的方法,可以準確地評估受眾在認知狀態(tài)中的動態(tài)變化,并為智能診斷和策略調整提供數理支撐。
經過資源結構化組織與受眾個性特征解析過程后,智能傳播的實現打下了夯實的基礎,下一步將要重點研究智能引擎模型設計、內容智能生成以及資源智能調整等問題的解決思路。
智能傳播引擎,是實現對非遺視頻資源智能傳播功能的關鍵驅動模塊。在整體模型框架設計中,應當以內容需求和目標定位為前提,在充分理解核心數據采集與挖掘、資源有效調用與布局、策略智能應用與調整等原理的基礎上,通過對受資交互、認知診斷、信息反饋、資源修正等過程與細節(jié)的探討,來揭示智能傳播的內在規(guī)律。因此,本文結合對傳播中諸要素及其相互作用機理的綜合分析,設計了非遺視頻資源智能傳播引擎的整體模型,具體架構如圖8所示。
圖8 智能傳播引擎的模型架構示意圖
以上模型,分別從數據挖掘、數據處理、數據反饋這三個角度,詳細說明了智能傳播中關于需求定位與內容生成、資源匹配與受眾交互、認知診斷與資源調整的整個過程。
首先,受眾利用知識圖譜中熱區(qū)的點擊或搜索單元中關鍵詞的輸入來進行需求表達,引擎將根據非遺視頻領域本體的資源數據,完成相關單元的檢索與調用。在內容生成中,為突出受眾間興趣的相似性和內容間知識的關聯性,引擎將結合受眾對視頻元的評分數據以及相關的元數據和語義關聯數據,采用“基于受眾”和“基于內容”的混合式協同過濾算法,分別從受眾相似性和內容關聯性兩方面生成候選視頻單元集合,并通過預測評分計算產生最接近的TOP-N資源推薦列表。
其次,混合式協同過濾算法生成的資源表單與受眾個性并不完全匹配,還需結合訪問風格維度,對推薦表單進行重組與排列。同時,為提升資源生成精度,在受眾與資源的交互情境中,可創(chuàng)設“點贊”、“分享朋友圈”、“轉發(fā)微信”、“發(fā)表評論”環(huán)節(jié)以捕獲顯式評分數據,通過對瀏覽次數、訪問時長等特征行為的挖掘以生成隱式評分數據。
再次,在一個單元訪問結束后,引擎將調用相應的后測試題集對受眾認知情況進行評測,其結果將反饋并記錄于認知掌握狀態(tài)數據庫中。經過與預設目標的比對,通過的受眾可直接進入下一非遺視頻單元;不通過的受眾,則需進行一定的認知補償,即使用“難度過濾”以降低相同內容的難度系數,直至通過評測為止。
智能傳播引擎是一個有機的整體,為保障其高效運轉,重點在于如何提升推薦算法精度以達到內容智能生成效果,難點在于如何適應受眾特性以達到資源智能調整目標。
在相關聯的內容提取中,僅依靠受眾對資源的喜好評價會導致數據稀疏性問題,僅根據有效行為的數據挖掘也不足以描繪出受眾興趣以及各視頻間的邏輯關系。所以,為進一步提高內容生成的精度,除利用好顯式、隱式評分數據外,還應當多元化地審視受眾對內容的興趣表達,并采用交叉、復合的方法做好特征數據的量化與混合。經過綜合比較,本文選用對視頻元評分、瀏覽次數、訪問時間、受眾興趣與知識特征相似性這四個特征維度,并通過數據矩陣的制定來完成混合式推薦算法的數據輸入,具體過程如下:
1.“受眾—視頻元”評分矩陣
受眾對視頻元的評分行為反映了其對視頻內容的喜好程度,可通過統(tǒng)計交互過程中點擊“點贊”、“轉發(fā)”、“分享”等按鈕的次數來得到。假設受眾集合為U={u1,u2,u3,…,um},視頻元集合為I={i1,i2,i3,…,in},以受眾集合為縱軸、視頻元集合為橫軸,具有點擊行為標注為1,不具行為標注為0,這樣可得到一個m*n的二維矩陣,記為Rm×n。
2.“受眾—視頻類別”瀏覽次數比例矩陣
瀏覽次數,是通過單類視頻的訪問頻率來反映受眾興趣。對于紀實、情境、訪談、解說、細節(jié)這5種非遺視頻,假設a為其中一類,用Iua表示單個受眾對a類視頻的瀏覽次數,用Iu表示該受眾對所有視頻的瀏覽次數。為表示某類視頻的瀏覽次數比例,采取Iua除以Iu的規(guī)則,即可得到橫坐標為受眾、縱坐標為視頻類別的i*5矩陣,記為Pua。
3.“受眾—視頻類別”訪問時間比例矩陣
瀏覽次數比例矩陣僅表達了歷史中的受眾訪問興趣狀態(tài),但引入訪問時間參數,可更真實地動態(tài)反映受眾當前的興趣點。在矩陣生成中,采用起始訪問時間與當前時間的差值來表示訪問時間跨度,對a類視頻,用Tua表示某受眾訪問該類視頻的時間跨度總和,用Tu表示該受眾所有視頻類別的時間跨度。為呈現某類視頻的訪問時間比例,將Tua除以Tu,即可得到一個j*5的j名受眾在不同類型視頻的訪問時間比例矩陣,記為Sua。
4.知識特征與受眾興趣相似度矩陣
知識特征可說明視頻元在非遺內容中的屬性,受眾興趣可通過評分比重來反映對某內容視頻的偏好程度,將兩者進行相似程度比較,可以更好地從內容關聯角度提煉受眾期望的視頻元序列。
對知識特征的描述可按照逐級細化方式,分別從非遺屬類、項目名稱、視頻形態(tài)、內容層次來展開,即包括{[民俗、民間文學、傳統(tǒng)音樂、傳統(tǒng)舞蹈、傳統(tǒng)戲劇、曲藝、雜技與競技、傳統(tǒng)美術、傳統(tǒng)技藝、傳統(tǒng)醫(yī)藥]、[項目名稱]、[事件紀實、細節(jié)展演、畫外解說、情境再現、人物評述]、[內容事件、活動事件、步驟演示、典型人物……]}這33個關鍵點。通過空間向量表示的方法,可采用分段函數來標記知識特征中的各維度權重,如果具備該屬性就在對應位置標注“1”,不具備就標注為“0”。這樣,可得到一個j*33的知識特征二維矩陣,記為Vj={(t1,wj1),(t2,wj2),(t3,wj3),…,(tn,wjn)}。同樣的道理,運用受眾對知識特征單項的評分之和除以全部項目評分總和的方法,可得一個i*33的受眾興趣二維矩陣,記為Ui={(t1,wi1),(t2,wi2),(t3,wi3),…,(tm,wim)}。因向量Ui與Vj具有相同維數,利用余弦相似度計算,就可得到一個表達知識特征受眾興趣的相似度矩陣,記為Bm×n。
以上述構建的四個矩陣為基礎,就可進行相關數據的交叉與混合。在“基于受眾”的列表生成中,為解決瀏覽次數比例和訪問時間比例矩陣不同維的問題,可引入興趣函數intr(u,a),通過設置比例權重系數θ(為平衡起見,一般取值為0.5),來實現次數和時間這兩個矩陣的線性相加;可引入興趣相似性函數intr_cmp(u,v),來完成受眾對單個視頻元興趣的相似度比較,并得到與評分矩陣同維的m*n矩陣;使用Pearson相似度系數,通過同維的興趣相似性函數與“受眾-視頻元”評分矩陣相乘,并復用“基于受眾”的協同過濾算法,即可得到受眾可能喜歡的視頻元表單。在“基于內容”的列表生成中,采用分段函數將數據稀疏的評分矩陣與“受眾興趣-知識特征”相似度矩陣進行疊加,可得到新的“受眾—視頻元”評分矩陣Cm×n,然后進行內容關聯的視頻元間相似度比較,并復用“基于內容”的協同過濾算法,即可得到內容關聯的視頻元表單。以上兩條路徑的數據混合與計算過程可參見圖9所示。
圖9 內容智能生成的數據混合與計算過程
為了更好地使受眾獲得豐富的智能交互體驗,還需對生成的資源進行一系列整合,主要是調整視頻元的呈現順序以符合當前受眾的訪問習慣、調整知識的難度系數以匹配當前受眾的認知狀態(tài)。
混合式協同過濾在視頻資源的生成中存在一定的局限,其最小推薦單位只能聚焦到單個非遺知識點上。但對于單個知識點來說,其下還可按敘事角度的變化細分出多個不同表述形態(tài)的非遺視頻元。比如:民間文學項目《黑暗傳》中的“盤古開天”知識點,下面就包含了“喪事現場紀實”、“完整唱腔演述”、“故事真人情境演繹”、“唱本傳承歷史解說”、“代表性傳承人訪談”、“領域專家點評”等非遺視頻元。這就需要采用恰當策略,來實施對諸多非遺視頻元呈現順序的調整。在前文受眾個性的訪問風格定位基礎上,為便于計算機對標簽數據的載入、分析與處理,可將風格維度左側的屬性標記為“0”、右側標記為“1”,即用不同的二進制編碼代表不同的受眾訪問風格。例如,訪問風格為{活躍型、直覺型、畫面型}的受眾,可簡化為{010}。按訪問風格的定義,每種風格屬性都對應著不同的視頻偏好,將固定的視頻形態(tài)進行編碼,即可產生與受眾相匹配的視頻呈現序列,具體操作可參見表7。因此,訪問風格為{010}的受眾,其視頻偏好順序為{451},在“盤古開天”單元呈現中可采用{唱腔演述、傳承人訪談、專家點評、喪事現場、真人演繹、歷史解說}的視頻序列。
表7 訪問風格維度與視頻偏好關系映射表
另外,資源的調整還應體現在知識難度的智能上下浮動上。為了更符合受眾直觀感受,提升難度系數的智適應調整能力,可利用基于深度學習的循環(huán)神經網絡。在資源的組織中,每一個非遺視頻元都標注有對應的難度系數,多個富有難度梯度的知識點共同組成了一個非遺知識單元。為培育循環(huán)神經網絡的難度系數智能調整能力,在訓練樣本的初始采集中,可由領域專家全程參與并指導,采用隨機抽取的方式完成資源的初始布局。然后,根據受眾的訪問內容和認知狀態(tài),人工調整并指定與之相匹配的具有不同難度層次的非遺視頻元,對已通過的知識點,下一單元可適當地提高平均難度,對未通過的知識點,則調用低于平均難度等級的視頻資源。經過一定量的積累,即可得到較為全面的難度系數調整訓練集。最后,導入訓練集樣本數據,通過設定神經網絡的層數和形態(tài),完成網絡訓練以達一定的智能調整精度。
對于學習后的循環(huán)神經網絡,即可用于對樣本集外的受眾進行難度等級的智能匹配。當然,該受眾的難度調整反饋數據,也可添加入先前的訓練樣本數據集中,繼而不斷地優(yōu)化神經網絡的難度調整精度。
以智能化視野開展對非遺視頻資源的傳播研究,是一項較為前沿的課題。本文在系統(tǒng)梳理相關研究經驗和成果的基礎上,通過對傳播核心要素中內部作用機制和外部影響原理的系統(tǒng)分析,分別從非遺視頻資源組織、受眾個性特征解析、智能傳播處理引擎這三個方面構建出了非遺視頻資源智能傳播的整體模式。為了更為深入、有效、準確、智能地實施整個傳播過程,在內容上以最小粒度的非遺視頻元為組織單位,通過對非遺視頻敘事邏輯和形態(tài)本質的剖析,從概念層次、元數據描述、語義標注層面探索了數據關聯與可視表達的方法;在對象上明確目標主體類別,通過提煉共性特征維度并采用行為挖掘和定量分析的策略,形成了基于訪問風格和認知狀態(tài)初始設置與動態(tài)修正的具體思路;在引擎驅動上,結合數據的交換與反饋過程,分別從內容智能生成與資源智能調整兩方面給出了具體的方案細則。
以上諸多工作,為非遺視頻資源智能傳播的實現提供了一定參考思路和借鑒經驗,但在平臺的開發(fā)、應用以及針對具體非遺案例所開展的智能傳播效果評測上還略顯不足。所以,下一步的研究重心將集中于非遺具體案例的應用實踐,同時深入拓展對受眾情境體驗的量化評估。
注釋
①習近平:《決勝全面建成小康社會 奪取新時代中國特色社會主義偉大勝利》,北京:人民出版社,2017年,第51-52頁。
②《中共中央辦公廳 國務院辦公廳印發(fā)〈關于實施中華優(yōu)秀傳統(tǒng)文化傳承發(fā)展工程的意見〉》,2017年1月25日,http://www.xinhuanet.com/politics/2017-01/25/c_1120383155.htm,2020年11月18日。
③B. Murtha, “Practical Issues in Applying Metadata Schemas and Controlled Vocabularies to Cultural Heritage Information,”Cataloging&ClassificationQuarterly, vol.36, no.3-4, 2018,pp.47-55.
④Noriko Kando and Jun Adachi, “Cultural Heritage Online:Information Access across Heterogeneous Cultural Heritage in Japan,” http://www.kc.tsukuba.ac jpdlkc e-proceedings/papers/d1kc04pp 136.
⑤A. Mallik, S. Chaudhury and H. Ghosh, “Nrityakosha:Preserving the Intangible Heritage of Indian Classical Dance,”JournalonComputing&CulturalHeritage, vol.4, no.3, 2017, pp.1-25.
⑥參見翟姍姍:《基于關聯數據的非物質文化遺產資源聚合研究》,北京:科學出版社,2015年。
⑦董坤、謝守美:《基于關聯數據的MOOC資源語義化組織與聚合研究》,《情報雜志》2016年第6期。
⑧徐雷、王曉光:《敘事型圖像語義標注模型研究》,《中國圖書館學報》2017年第5期。
⑨侯西龍、談國新等:《非物質文化遺產視頻語義標注方法研究》,《情報科學》2018年第11期。
⑩陳丹、柳益君、羅燁、錢秀芳、吳智勤:《基于用戶畫像的圖書館個性化智慧服務模型框架構建》,《圖書館工作與研究》2019年第6期。