廖金材,張燕丹
(福建省龍巖市永定區(qū)融媒體中心 福建 龍巖 364100)
媒資檔案是在廣播電視節(jié)目制作以及傳播過程中形成的電視、網(wǎng)絡(luò)等媒體的資源檔案,不僅包含文字資源,還包括語音、視頻等資源信息,具有數(shù)量大、種類多等特點,因其獨特的特性存在,導(dǎo)致媒資檔案管理具有難度高、易丟失、工作量大等特征。最初媒資檔案管理方法主要是通過人工收集、整理、建檔存儲,對于文字類的媒體資源信息整理成紙質(zhì)檔案,對于語音、視頻類的媒體資源信息存儲到獨立的硬盤上,并將標(biāo)簽貼在硬盤上,方便媒資檔案查找和使用。這種方式需要花費大量的資金,并且消耗大量的人力資源,不僅效率低,如果不對其進行定期整理和檢查,非常容易出現(xiàn)檔案丟失現(xiàn)象。隨著信息技術(shù)和網(wǎng)絡(luò)技術(shù)逐漸與檔案領(lǐng)域融合,為了提高檔案管理效率,相關(guān)學(xué)者提出了數(shù)字化管理方式,在一定程度上推動了媒資檔案數(shù)字化、信息化建設(shè)。左晉佺等[1]利用大數(shù)據(jù)技術(shù),構(gòu)建用戶、節(jié)點、組織、下屬機構(gòu)、檔案云儲存模式的檔案管理平臺。在數(shù)據(jù)庫中利用元數(shù)據(jù)特征屬性完成可視化檔案管理。但是,該方法無法對檔案管理系統(tǒng)中存在的數(shù)據(jù)進行融合處理,導(dǎo)致檔案管理響應(yīng)時間較長,存在系統(tǒng)響應(yīng)效率低的問題。相世強[2]以Java語言為基礎(chǔ),利用JFinal技術(shù)構(gòu)建急速WEB開發(fā)框架,實現(xiàn)系統(tǒng)化、自動化、多元化的檔案信息管理。但是,該方法在規(guī)定時間內(nèi)無法對多個媒資檔案數(shù)據(jù)包進行有效處理,存在系統(tǒng)媒資處理能力和并發(fā)性較差的問題。
雖然目前媒資檔案管理已經(jīng)取得了相應(yīng)的成果,但是由于國內(nèi)媒資檔案信息化管理起步比較晚,仍然處于比較低的技術(shù)水平?,F(xiàn)有的管理方法存在不足,在實際應(yīng)用中當(dāng)對海量媒體資源信息管理時,經(jīng)常出現(xiàn)信息殘缺,建立的媒資數(shù)字檔案完整性較差,檔案信息丟失量較大、響應(yīng)時間較長、并發(fā)性較差等問題?;诖?,本文提出大數(shù)據(jù)技術(shù)的媒資檔案管理方法,以期優(yōu)化媒資檔案管理效益,同時確保檔案信息安全性和完整性。
為了保證媒資信息的完整性和安全性,利用大數(shù)據(jù)技術(shù)對媒資檔案數(shù)據(jù)序列進行加密分類,在加密分類前對待管理的媒資信息建立相應(yīng)的數(shù)字標(biāo)簽,以元數(shù)據(jù)作為檔案數(shù)字標(biāo)簽構(gòu)建的對象,以媒資信息內(nèi)容元數(shù)據(jù)為主,比如媒資主題、信息源、資源、時間,其中媒資主題的確定是根據(jù)媒資信息中出現(xiàn)頻率最高的關(guān)鍵詞確定,以關(guān)鍵詞作為媒資檔案主題,對媒資檔案本體劃分[3]。信息源是指媒資信息的來源,資源主要為媒資信息的主要形式,包括文本、圖片、音頻以及視頻。時間是指媒資信息的產(chǎn)生時間,根據(jù)以上四個媒資信息屬性,生成媒資檔案數(shù)字標(biāo)簽,用公式表示為:
式c中,V表示媒資檔案s數(shù)字標(biāo)簽;a表示媒資檔案主題;表示媒資信息源;表示媒資檔案資源類型,其中文本資源類型用“1”表示,圖片資源類型用“2”表示,音頻資源類型用“3”表示,視頻資源類型用“4”表示;e表示媒資檔案時間屬性[4]。
根據(jù)媒資檔案數(shù)字標(biāo)簽,對媒資數(shù)據(jù)序列進行加密分類處理,下圖為基于大數(shù)據(jù)技術(shù)的媒資數(shù)據(jù)序列加密分類如圖1所示。
圖1 基于大數(shù)據(jù)技術(shù)的媒資數(shù)據(jù)序列加密分類示意圖
媒資數(shù)據(jù)序列加密包括3個功能層:數(shù)據(jù)分類層、數(shù)據(jù)塊內(nèi)部結(jié)構(gòu)層和加密分類格式層。數(shù)據(jù)分類層實現(xiàn)媒資數(shù)據(jù)包中的文本、圖片、音頻以及視頻等類型劃分。數(shù)據(jù)塊內(nèi)部結(jié)構(gòu)層主要包含數(shù)據(jù)頭、數(shù)據(jù)塊和數(shù)據(jù)位,通過數(shù)據(jù)頭存儲媒資數(shù)據(jù)基本信息,利用數(shù)據(jù)塊對空間進行實時調(diào)整,根據(jù)數(shù)據(jù)位改變鏈接行或遷移行。加密分類格式層中通過數(shù)據(jù)塊數(shù)量計算索引數(shù)據(jù),限制數(shù)據(jù)操作者數(shù)量擴大空余空間,根據(jù)大數(shù)據(jù)長度讀取媒資數(shù)據(jù)記錄,利用本組擁有密鑰管理和跟蹤數(shù)據(jù)塊。
隨機選取一個已經(jīng)生成數(shù)字標(biāo)簽的媒資信息,假設(shè)該媒資n信息數(shù)據(jù)序列長度為h,該媒資信息數(shù)據(jù)操作者數(shù)量為,按照等價分類法將媒資信息數(shù)據(jù)序列分類成長度相等的m和大數(shù)據(jù)塊,每個大數(shù)據(jù)塊的第一個數(shù)據(jù)作為該數(shù)據(jù)塊的密鑰,將其作為變量,計算出媒資信息數(shù)據(jù)密鑰組合值,其計算公式為:
式中,x表示媒資檔案數(shù)據(jù)密鑰;wm表示第m個大數(shù)據(jù)塊密鑰[5]。生成大數(shù)據(jù)塊密鑰后,設(shè)定length-sive為大數(shù)據(jù)塊列表,利用singther-length表示大數(shù)據(jù)塊位長,根據(jù)大數(shù)據(jù)塊所在位置,生成大數(shù)據(jù)塊位置編號,并將其與數(shù)據(jù)塊密鑰添加在大數(shù)據(jù)塊塊頭位置,媒資信息密鑰組合值添加在大數(shù)據(jù)塊塊尾位置,從而實現(xiàn)為媒資信息數(shù)據(jù)序列的加密分類。
按照分類的大數(shù)據(jù)塊信息特征,對媒資檔案進行整合,首先構(gòu)建媒資檔案信息分析模型,該模型用公式表示為:
式中,u表示構(gòu)建的媒資檔案信息分析模型;Cm表示媒資信息數(shù)據(jù)塊特征量;F(X,t)表示時間t時媒資數(shù)據(jù)X的模糊度;p(t)表示媒資數(shù)據(jù)分類函數(shù);K表示媒資信息總特征值[6]。利用該模型對媒資檔案信息特征進行分析,根據(jù)分析結(jié)果對媒資檔案信息特征進行重構(gòu),得到的媒資檔案主成分特征為:
式中,z表示特征重組后的媒資檔案信息主成分特征;A表示媒資檔案信息的模糊特征分量;g表示媒資檔案信息的譜分解系數(shù);α表示媒資檔案信息狀態(tài)點頻率;γ表示媒資檔案信息采樣率[7]。根據(jù)媒資檔案信息主成分特征,對具有相同特征的媒資檔案信息組合在一起,從而實現(xiàn)媒資檔案整合。
將整合后的媒資檔案存儲到數(shù)據(jù)庫中,進行建檔存儲,為了保證數(shù)據(jù)存儲具有充足的空間,配備西部數(shù)據(jù)(Western Digital)硬盤,存儲容量為14 T,輔助數(shù)據(jù)庫完成媒資檔案存儲管理任務(wù)[8]。將整合好的數(shù)據(jù)信息進行轉(zhuǎn)碼,其中音頻和視頻信息統(tǒng)一轉(zhuǎn)化為MP4格式,圖片轉(zhuǎn)換為JPG格式、文字信息統(tǒng)一轉(zhuǎn)化為PDF格式,在數(shù)據(jù)庫中建立數(shù)據(jù)表格,利用數(shù)據(jù)表格對媒資檔案進行分類存儲,表1為媒資檔案存儲數(shù)據(jù)表。
表1 媒資檔案存儲數(shù)據(jù)表
將整合后的媒資信息存儲到數(shù)據(jù)表中,生成媒資數(shù)字檔案,將其存儲到數(shù)據(jù)庫中,當(dāng)用戶想要訪問媒資數(shù)字檔案時,數(shù)據(jù)庫會自動審核用戶身份,如果身份驗證通過,用戶在數(shù)據(jù)庫檢索欄中搜索關(guān)鍵詞,數(shù)據(jù)庫根據(jù)媒資檔案特征,將媒資數(shù)字檔案與關(guān)鍵詞進行匹配[9]。用戶可以事先在數(shù)據(jù)庫中設(shè)定一個匹配閾值,如果關(guān)鍵詞與數(shù)字檔案匹配度大于該閾值,則數(shù)據(jù)庫會向用戶發(fā)送媒資數(shù)字檔案壓縮包,用戶利用密鑰對數(shù)字檔案進行解密處理,即可實現(xiàn)對媒資數(shù)字檔案可視化展示,用戶在服務(wù)器上對媒資數(shù)字檔案進行下載、轉(zhuǎn)發(fā)等操作,從而實現(xiàn)對媒資檔案管理。
為了驗證本次提出的基于大數(shù)據(jù)技術(shù)的媒資檔案管理思路的可行性與可靠性,選取某媒資檔案數(shù)據(jù)包作為實驗對象,該媒資檔案數(shù)據(jù)包大小為10.62 GB,其中包含2.62 GB文字信息、3.46 GB音頻信息、1.06 GB視頻信息、1.61 GB圖片信息以及其他信息,利用本次設(shè)計方法與左晉佺[1]方法、相世強[2]方法對該媒資數(shù)據(jù)包進行檔案管理。為了保證本次實驗結(jié)果具有較高的可信度,兩種方法的實驗環(huán)境相同,均采用Windows11操作系統(tǒng),配備兩臺SFHF-554服務(wù)器,以及一臺西部數(shù)據(jù)(Western Digital)硬盤,按照上述流程對媒資檔案數(shù)據(jù)序列加密分類、整合以及存儲,實驗共生成7個媒資檔案。
存儲完成后,令用戶每隔1 s對媒資檔案進行下載和轉(zhuǎn)發(fā)一次,30 min后檢驗媒資檔案信息是否存在丟失,記錄每個媒資檔案信息丟失量,將其作為三種方法管理質(zhì)量評價指標(biāo),信息丟失量越大,表示媒資檔案完整性越低,媒資檔案管理質(zhì)量越差,根據(jù)記錄的實驗數(shù)據(jù)繪制成表格,具體數(shù)據(jù)如下表2所示。
表2 不同方法應(yīng)用下媒資檔案信息丟失量對比
通過對上表中數(shù)據(jù)分析,可以得出以下結(jié)論:應(yīng)用設(shè)計方法管理媒資檔案,檔案信息丟失量較小,最小可以達到0,最高數(shù)據(jù)丟失量僅為0.09 GB,數(shù)值較小,基本可以忽略不計,說明設(shè)計方法能夠有效保證媒資檔案信息的完整性。而應(yīng)用左晉佺[1]方法管理媒資檔案,檔案信息丟失量最小為0.38 GB,最高數(shù)據(jù)丟失量已經(jīng)達到0.96 GB,相世強[2]方法管理媒資檔案,檔案信息丟失量最小為0.18 GB,最高數(shù)據(jù)丟失量為0.77 GB。左晉佺[1]方法和相世強[2]方法數(shù)值遠遠高于設(shè)計方法,設(shè)計因為本次設(shè)計方法采用大數(shù)據(jù)技術(shù)對媒資檔案信息進行了加密分類處理,提高了檔案數(shù)據(jù)信息的安全性。因此實驗結(jié)果證明了在保證檔案完整性方面,設(shè)計方法優(yōu)于左晉佺[1]方法和相世強[2]方法,相比較左晉佺[1]方法和相世強[2]方法更適用于媒資檔案管理,同時也驗證了大數(shù)據(jù)技術(shù)在媒資檔案管理中具有良好的應(yīng)用效果。
在媒資檔案數(shù)據(jù)包中隨機選取文字信息、音頻信息、視頻信息、圖片信息以及其他信息共計800個檔案信息數(shù)據(jù)作為測試對象,分別采用設(shè)計方法、左晉佺[1]方法和相世強[2]方法對檔案信息數(shù)據(jù)進行管理,對比不同方法的檔案管理響應(yīng)時間,測試結(jié)果如圖2所示。
圖2 檔案管理響應(yīng)時間
分析圖2可知,隨著檔案信息數(shù)據(jù)數(shù)量的增加,設(shè)計方法、左晉佺[1]方法和相世強[2]方法的檔案管理響應(yīng)時間不斷增長。對上述方法的測試結(jié)果進行對比發(fā)現(xiàn),設(shè)計方法的檔案管理響應(yīng)時間均低于左晉佺[1]方法和相世強[2]方法的檔案管理響應(yīng)時間,由此表明設(shè)計方法具有較高的檔案管理響應(yīng)效率。這是因為設(shè)計方法利用大數(shù)據(jù)技術(shù)在媒資檔案數(shù)據(jù)序列加密分類前對媒資信息建立了相應(yīng)的數(shù)字標(biāo)簽,以元數(shù)據(jù)作為檔案數(shù)字標(biāo)簽構(gòu)建對象,以此提高了檔案管理響應(yīng)效率,進而縮短了檔案管理響應(yīng)時間。
每分鐘檔案信息融合個數(shù)表明檔案信息融合能力,即檔案管理能力。因此,將檔案信息融合能力作為測試指標(biāo),在時間為30 min內(nèi),測試設(shè)計方法與左晉佺[1]方法、相世強[2]方法的檔案信息融合能力,測試結(jié)果如圖3所示。
圖3 檔案信息融合能力
對圖3中的數(shù)據(jù)進行分析可知,時間與管理媒資檔案信息數(shù)據(jù)集之間成正比關(guān)系,隨著時間的增加,設(shè)計方法、左晉佺[1]方法和相世強[2]方法檔案信息融合數(shù)量不斷增加,在相同時間內(nèi),左晉佺[1]方法和相世強[2]方法的檔案信息融合數(shù)量均低于設(shè)計方法。這是因為設(shè)計方法構(gòu)建了媒資檔案信息分析模型,以數(shù)據(jù)塊特征量為依據(jù)完成媒資檔案整合,進而提高了檔案信息融合能力。在相同時間內(nèi)檔案信息融合數(shù)量越多,表明媒資檔案數(shù)據(jù)管理能力越強,通過測試發(fā)現(xiàn)設(shè)計方法具有較強的檔案管理能力。
綜上所述,此次將大數(shù)據(jù)技術(shù)應(yīng)用到媒資檔案管理中,提出了一條新的媒資檔案管理思路,并通過實驗驗證了該思路的可行性與可靠性,有效保證了媒資檔案信息的安全性和完整性,此次研究為了提高檔案管理質(zhì)量,推廣大數(shù)據(jù)技術(shù)在媒資檔案管理中的應(yīng)用,為基于大數(shù)據(jù)技術(shù)的媒資檔案管理提供理論參考,具有良好的現(xiàn)實意義。但是由于此次研究時間有限,并且提出的管理方法尚未在實際中進行大量應(yīng)用與操作,在某些方面可能存在一些不足之處,今后會對基于大數(shù)據(jù)技術(shù)的媒資檔案管理方法優(yōu)化進行研究,為媒資檔案管理提供有力的理論支撐。