柴功昊+劉微
摘要:互聯(lián)網(wǎng)的飛速發(fā)展擴大了圖片、視頻、文字等多媒體信息的傳播范圍。圖片和視頻在社交網(wǎng)絡中已經(jīng)成為了最為活躍的一類信息載體。該文初步探討了互聯(lián)網(wǎng)視覺媒體的基本內(nèi)容、視覺媒體的關鍵技術以及互聯(lián)網(wǎng)視覺媒體的發(fā)展前景等相關內(nèi)容。
關鍵詞:互聯(lián)網(wǎng)視覺媒體;多媒體信息處理;發(fā)展前景
中圖分類號:TP37 文獻標識碼:A 文章編號:1009-3044(2016)04-0202-02
作為第三次工業(yè)革命重要產(chǎn)物的信息技術,是20世紀以來對人類社會造成影響最大的產(chǎn)物。在其誕生后的短短幾十年間,迅速地得到了發(fā)展和普及,并且對人們生產(chǎn)、生活和工作等等多個領域產(chǎn)生了長遠而深入的影響,使人們的各項工作都變得更加的便利和高效。在眾多的互聯(lián)網(wǎng)應用技術中,互聯(lián)網(wǎng)視覺媒體的應用對社會的發(fā)展和人們的生活息息相關,具有重要意義。而網(wǎng)絡上越來越多的圖片、視頻和文字等多媒體信息被用戶不斷上傳到互聯(lián)網(wǎng)上。
1 互聯(lián)網(wǎng)視覺媒體的研究意義
目前,大多數(shù)互聯(lián)網(wǎng)視覺媒體數(shù)據(jù)的開發(fā)和應用已經(jīng)可以達到讓非專業(yè)用戶輕松創(chuàng)造和編輯新的視覺媒體的商業(yè)價值。但是,這些軟件只是提供了最基礎的圖像和視頻處理操作,用戶無法根據(jù)自己的意圖對圖片和視頻等進行更加高級或專業(yè)的編輯和智能的調整。現(xiàn)在的互聯(lián)網(wǎng)視頻媒體資源大多為非結構化,缺乏對后續(xù)應用開發(fā)的考慮。其中,圖片和視頻在社交網(wǎng)絡中已經(jīng)成為了最為活躍的一類信息載體,能夠高效地提供直觀的視覺效果。新的實時平臺開始崛起且增長強勁。而互聯(lián)網(wǎng)的技術更新和普及發(fā)展極大地擴大了圖片、視頻、文字等多媒體信息的傳播范圍,加之當前移動互聯(lián)網(wǎng)技術的革新,使得多媒體信息更是由以往的點對點傳播方式轉變?yōu)榱它c向面的輻射式傳播模式。因此,如何借助多媒體計算技術和社交網(wǎng)絡上存在的大量圖片及相關信息,來對系統(tǒng)工具實現(xiàn)進一步的開發(fā),已經(jīng)成為互聯(lián)網(wǎng)比較關注的方向。
多媒體計算即多種多媒體信息通過計算機的交互式綜合處理后建立起邏輯連接,集成為一個具有交互性的系統(tǒng)。多媒體技術主要處理的對象包括文字、圖像、圖形、音頻和視頻等。另外,目前網(wǎng)絡上存在的大量圖片或視頻等媒質,以及對這些媒質所附帶的標注、評論、用戶喜好等信息,常常被用來進行多源異質的媒體信息分析、處理及應用,這就是基于互聯(lián)網(wǎng)視覺媒體的信息處理。其研究內(nèi)容涉及廣泛,而且可以充分利用現(xiàn)有的視覺媒體資源。通過文本進行簡單的索引效果并不準確,這些困難給互聯(lián)網(wǎng)上視覺媒體資源的開發(fā)利用帶來了一定的阻礙。因此,對互聯(lián)網(wǎng)視覺媒體的改進和完善刻不容緩。
2 多媒體視覺信息處理簡介
目前,在計算機的多媒體信息中,文本、圖像、視頻和音頻這四類素材是構成計算機多媒體信息的主要部分,而且在多媒體檢索領域以及與多媒體有關其他研究領域的應用也已經(jīng)成為研究的熱點?;ヂ?lián)網(wǎng)視覺媒體處理流程一般包括三個步驟:視覺內(nèi)容的獲取,視覺數(shù)據(jù)集的收集整理和基于數(shù)據(jù)的開發(fā)和應用。視覺內(nèi)容的獲取即從互聯(lián)網(wǎng)的海量視覺數(shù)據(jù)的資源中選擇收集有意義的目標圖片或視頻建立數(shù)據(jù)集。視覺數(shù)據(jù)集的收集整理即通過特征提取、目標分割等方法找到采集到的圖片、視頻等視覺媒體的基本關系,確保視覺媒體資源可以直接運用于下一步的研究和開發(fā)。對數(shù)據(jù)的開發(fā)和應用即可通過改進方法等使圖像和視頻處理適應多媒體的應用。
近年來,隨著計算機成本的降低,使得計算機和網(wǎng)絡得到的迅速的普及,而互聯(lián)網(wǎng)用戶數(shù)量的激增極大地促進了互聯(lián)網(wǎng)多媒體創(chuàng)新和應用的發(fā)展。計算機圖像學、計算機視覺技術和多媒體信息處理技術針對互聯(lián)網(wǎng)視覺媒體的研究和應用已經(jīng)取得豐富的成果。目前,給予互聯(lián)網(wǎng)多媒體視覺信息處理的研究主要集中在基于內(nèi)容的圖像、視頻檢索;視覺媒體的數(shù)據(jù)庫的創(chuàng)建;視覺內(nèi)容合成;視覺媒體編輯等四個方面?;趦?nèi)容的圖像、視頻檢索即通過提取關鍵特征檢索到客戶所需要的圖片、視頻等資源;視覺媒體的數(shù)據(jù)庫的創(chuàng)建即通過互聯(lián)網(wǎng)及互聯(lián)網(wǎng)上的搜索引擎等建立一個附帶高語義標簽和高效率索引的大型多媒體數(shù)據(jù)庫,減少查詢所需時間;視覺內(nèi)容合成即利用已有的視覺媒體資源來生成新的內(nèi)容;視覺媒體編輯即基于圖片和視頻進行音頻編輯、著色、去霧、邊緣感知等編輯。
3 視覺媒體處理的關鍵技術分析
3.1 視覺媒體的圖像渲染技術
計算機圖形學作為一門新興學科,得到了迅速的發(fā)展和廣泛的應用。其主要內(nèi)容為研究如何在計算機中表示圖形以及用計算機進行圖形的計算、處理和顯示的相關原理和算法。數(shù)字圖像的數(shù)量由于互聯(lián)網(wǎng)的發(fā)揮在那和圖像獲取設備的普及呈現(xiàn)出幾何級的增長狀況,用戶對圖像關注點已經(jīng)從如何獲取照片上傳到網(wǎng)絡轉移至如何在分享的過程中更好更生動地展示圖形的內(nèi)容。因此,圖像渲染技術隨之成為計算機圖形學中一項重要的研究內(nèi)容。
按照不同的渲染風格劃分,渲染技術主要分為兩大類:真實效果的渲染和非真實效果的渲染。具體來說,真實效果渲染一直是學術界和工業(yè)界研究的主流。真實感要求在計算機中生成具有真實感的圖像,如構建幾何場景或光照模型等,其效果及其逼真,能夠使觀眾產(chǎn)生身臨其境的感覺。然而在有些情況下,用戶更希望計算機能夠生成一些和真實照片不同的圖像效果,如將自己拍攝的照片轉換成油畫、素描、水墨畫等。因此,非真實感繪制也逐漸得到了重視和發(fā)展,開始成為計算機圖形圖像處理領域的一個研究熱點問題。非真實效果的圖像渲染不以生成類似照片的圖像為目標,而是通過省略與圖形無關的細節(jié),簡化物體的形狀,甚至暴露被消隱的細節(jié)等來表達繪制者的意圖。非真實效果的渲染還包括基于筆畫的渲染、基于區(qū)域的渲染、基于樣本的渲染等?;诠P畫的渲染即通過控制畫筆的形狀、顏色、方向等元素產(chǎn)生各種藝術風格的圖像,繪制離散的繪畫元素,來模擬一個特定的風格?;趨^(qū)域的渲染可以分為渲染區(qū)域內(nèi)的渲染基礎單元的排列布局和改變圖像的外形、繪圖形式或者各區(qū)域的組合,在分析圖像結構時被大量使用,可以對基于圖像局部內(nèi)容信息進行渲染。基于樣本的渲染就是通過模仿藝術家繪畫的風格來對現(xiàn)有景象進行藝術風格的創(chuàng)作,對原畫像和渲染風格目標圖像之間進行映射轉換。
3.2 視覺媒體圖像的特征提取
視覺媒體圖像的特征提取,即計算機為識別圖像而去提取作為圖像構成的相關像素點,并對像素點進行分析以確定其特征歸屬的過程。有效的視覺特征的提取對后續(xù)的圖像分類識別、圖像檢索等研究有著重要的意義,一直是計算機視覺領域里重要的研究問題。圖像特征可以作為區(qū)分不同目標類別的依據(jù),具有可重復性、可區(qū)分性、集中性等,能夠應對亮度、旋轉、尺度等變化的影響。圖像視覺特征的提取和表示是將圖像的視覺信息轉化成計算機能夠識別和處理的定量形式的過程。視覺特征的提取主要包括以下幾種:1)顏色特征。顏色特征是人類認識世界的最基本視覺特征,屬于全局特征,常被使用的表示方法有顏色直方圖、顏色矩、顏色聚合向量、顏色相關圖等。2)LBP特征。LBP特征是局部二值模式的簡稱,用來描述空間結構的非參數(shù)算子。3)SLFT特征,即尺度不變特征變換,基于圖像局部特征的描述,可以對圖像的初讀和旋轉變化保持不變性。4)彩色SLFT特征。彩色SLFT特征具有尺度旋轉不變性,廣泛應用于以特征提取為基礎的工作中。5)HOG特征,即方向梯度直方圖,對圖像的微小幾何形變和局部對比度變化可以保持很好的不變性,通過計算和統(tǒng)計圖像局部區(qū)域的梯度方向直方圖來構成特征。
3.3 視覺媒體圖像的分類
視覺媒體圖像的分類主要有兩種方法:傳統(tǒng)的圖像分類方法和基于深度學習的圖像分類方法。傳統(tǒng)的分類方法是利用圖像特征提取算法,利用K-Means算法構造單詞表,最終利用單詞表中的詞匯表示圖像。在圖像中提取獨立的視覺詞匯通常需要經(jīng)過特征檢測、特征標識和單詞本的生成三個步驟。基于深度學習的圖像分類方法是通過底層特征形成更加抽象的高層表示屬性類別或特征,從而能夠發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。
4 互聯(lián)網(wǎng)視覺媒體的應用與發(fā)展前景
4.1 多模態(tài)圖像渲染系統(tǒng)
所謂的多模態(tài)融合渲染,即是指通過對文字的卷繞和對圖像的包裝來實現(xiàn)將兩種模態(tài)融合的效果,將圖像、文字、視頻、音頻等進行有機地結合,進而呈現(xiàn)出一種更加藝術性的效果,通過這一方式不僅能實現(xiàn)照片的圖像,而且還能傳達出簡要的文字信息。在現(xiàn)實生活中,我們經(jīng)??梢钥吹礁鞣N文字拼接的廣告和海報,這也是多模態(tài)圖像渲染的表現(xiàn)。通過多模態(tài)渲染系統(tǒng),可以讓計算機自動生成具有這種效果的圖像,讓人類的視覺系統(tǒng)同時獲得整體的圖像效果與細節(jié)的文字效果,感受到圖像和組成圖像的文字之間的一種動態(tài)的張力。
多模態(tài)圖像渲染系統(tǒng)結合了圖像和文字多模態(tài),包含圖像模塊、文字模塊、兩種模態(tài)的結合模塊以及后處理部分四個部分。具體來說,圖像模塊作為文字模塊輸出的容器,在圖像模塊里,給定一張圖片,首先生成圖像的二值化剪影,然后對保留下來的圖塊根據(jù)單詞變形的合適程度進行排序,生成用來填充關鍵詞的圖像塊;文字模塊輸出經(jīng)過排序的包含文字的圖片;兩種模態(tài)金融結合后,通過后處理部分進一步改善視覺效果。多模態(tài)圖像渲染系統(tǒng)屬于非真實圖像渲染,具有藝術化的展示效果。
4.2 皮影戲的繼承與發(fā)揚
皮影戲又稱“影子戲”或“燈影戲”,是一種以獸皮或紙板做成的人物剪影,在蠟燭或燃燒的酒精等光源的照射下用隔亮布進行演戲。對于皮影戲的繼承與發(fā)揚,主要利用互聯(lián)網(wǎng)上現(xiàn)存的皮影戲圖片和皮影戲視頻等視覺媒體資源,設計出一個皮影戲的遺產(chǎn)電子化系統(tǒng),從而將皮影戲的創(chuàng)作個性化、操作簡潔化。皮影戲的遺產(chǎn)電子化系統(tǒng)主要包括兩個模塊,分別是創(chuàng)作模塊和操作模塊。創(chuàng)作模塊的輸入時兩張人臉圖像,自動生成類似人物的皮影戲頭部,提取輸入人臉圖像的中部側影線,并將皮影的眼睛卷繞進世紀人臉的眼睛區(qū)域中。另外,系統(tǒng)還將皮影的文理轉移到側影線中。操作模塊中,重點是在操作皮影戲的過程中保持皮影戲中角色原有的運動模式和特點,生動再現(xiàn)皮影戲中人物的動作獨特性,最終實現(xiàn)元動作的平滑效果、動畫整體的平滑效果和皮影戲短視頻的表演效果等。
近年來,遺產(chǎn)的電子化保護逐漸受到人們的重視,越來越多的人想要通過計算機技術的應用開發(fā)來保護文化遺產(chǎn)。遺產(chǎn)的電子化保護已經(jīng)成為了熱門的研究課題,主要是物質遺產(chǎn)保護和非物質遺產(chǎn)保護兩種。物質遺產(chǎn)包括建筑、古跡、文物等;非物質遺產(chǎn)包括傳統(tǒng)節(jié)日、民俗風情、口頭藝術等。
4.3 家具風格的視覺分類
家具風格是家具最具判別力的外觀視覺特征。人們在設計和選擇家具時常常將家具美學價值作為一項重要的參考指標,結合功能和美學,通過家具的類型、顏色和材料等傳達出室內(nèi)裝修的視覺效果。隨著經(jīng)濟的發(fā)展和人們物質需求的不斷提高,家具也不斷地發(fā)展和創(chuàng)新,門類繁多,用料各異,品種齊全,用途不一。家具的研究主要包括家具設計和室內(nèi)家具擺放。將互聯(lián)網(wǎng)視覺媒體與家具風格設計的具體應用就是設計出一個交互設計家具的框架,開發(fā)出實用的家具幾何構造和實體,通過在系統(tǒng)中加入幾何元素來幫助用戶設計出可靠的家具外形。具體操作該系統(tǒng)時,首先提取家具之間的空間關系,然后根據(jù)最小化能量方程來迭代地調整家具的位置,在對目標檢測和識別后,根據(jù)家具的功能進行分類,最終實現(xiàn)對家居風格的分類的識別和分析。
為了更好地對家具風格的視覺特征進行詳細的分析,還可以構建家居風格數(shù)據(jù)庫,包含室內(nèi)圖片和家居圖片等,應用于對家居風格的研究。目前市場上主要流行的家具風格主要是美式風格、巴洛克風格、帝政式風格、哥特式風格、文藝復興風格、洛可可風格、中式明朝風格、中式清朝風格、新古典主義風格、地中海風格、鄉(xiāng)村風格、現(xiàn)代法式風格、日式風格、現(xiàn)代中式風格、東南亞風格以及現(xiàn)代主義風格等十六種風格。數(shù)據(jù)庫中的圖片來自于不同的網(wǎng)絡資源,每張圖片都標注了特定的家居風格的標簽和家居功能標簽,簡單直觀。
4.4 互聯(lián)網(wǎng)視覺媒體的發(fā)展前景
雖然當前基于視覺媒體信息的研究和應用開發(fā)已經(jīng)取得了很大的進展,但隨著互聯(lián)網(wǎng)媒體信息的不斷增長,仍然具有廣闊的研究空間。第一,對圖像的藝術化渲染不僅存在真實效果渲染和非真實效果渲染,還有多種的角度。并且,對圖像的藝術化渲染已經(jīng)從圖像圖形學領域延伸至計算機視覺和機器學習技術領域。但是,在視頻領域中圖像渲染仍面臨很多挑戰(zhàn)。第二,深度學習作為現(xiàn)在的研究熱點,已經(jīng)得到廣泛應用,如圖像分類、場景識別、圖像分割等方面。今后值得研究的問題之一就是如何將深度學習和圖像、視頻藝術化渲染結合在一起。第三,視覺媒體資源的豐富性提供了大量豐富的素材可供視覺媒體的開發(fā)應用。同時,社交網(wǎng)絡下用戶之間的互動也為多媒體提供了更多的輔助信息和應用環(huán)境。如何將多媒體信息處理和社交網(wǎng)絡進行有機結合,仍然值得研究。
5 總結
綜上所述,隨著信息技術的不斷發(fā)展,互聯(lián)網(wǎng)視覺媒體的應用范圍將會不斷有所拓展和創(chuàng)新。由此,相關從業(yè)人員應當把握當前這個良好的機遇加強對互聯(lián)網(wǎng)視覺媒體相關技術的開發(fā)和應用,不斷完善和改進,為社會的進步和人們生活質量的提升產(chǎn)生積極作用,從而實現(xiàn)互聯(lián)網(wǎng)技術的不斷進步與社會經(jīng)濟的不斷發(fā)展。
參考文獻:
[1] 劉麗娜. 淺談日本報紙視覺呈現(xiàn)——探討互聯(lián)網(wǎng)時代下傳統(tǒng)媒體視覺突圍[J].設計,2012(10):134-135.
[2] 杜比視覺(Dolby Vision)技術提升互聯(lián)網(wǎng)媒體圖像質量[J].現(xiàn)代電影技術,2014(3):61-62.
[3] 謝薇. 基于互聯(lián)網(wǎng)的視覺傳達設計的研究[J].才智,2011(13):59.