■文/殷圣忠 朱 穎
媒體融合發(fā)展下多媒體采編系統(tǒng)技術(shù)建設(shè)方案
■文/殷圣忠 朱穎
隨著媒體融合時(shí)代的到來,傳統(tǒng)媒體固有的信息傳播方式已經(jīng)被互聯(lián)網(wǎng)所顛覆,互聯(lián)網(wǎng)不僅是新聞傳播的手段,更成為獲取新聞的一種重要途徑。原有新聞采編發(fā)系統(tǒng)受其所固有的封閉性限制,已難以滿足媒體融合時(shí)代信息傳播模式下的面向公眾開放交互、以數(shù)據(jù)服務(wù)為核心、即時(shí)采編發(fā)等需求;另一方面,面向互聯(lián)網(wǎng)下的多類型多維度海量數(shù)據(jù)管理、即時(shí)分發(fā)、深度挖掘,也對(duì)新聞采編發(fā)系統(tǒng)在可靠性、安全性、擴(kuò)展性方面提出了更高的要求。
媒體融合;采編;建設(shè)方案
中國(guó)新聞社原有新聞采編發(fā)系統(tǒng)基于信息管理系統(tǒng)框架構(gòu)建,面向新聞采編流程,實(shí)現(xiàn)了新聞采編發(fā)自動(dòng)化作業(yè)和全程監(jiān)控管理,極大提高了新聞采編發(fā)效率,探索出了一條行之有效的、規(guī)范的信息采編流程。
新聞采編發(fā)系統(tǒng)作為媒體轉(zhuǎn)型融合的技術(shù)支撐平臺(tái),應(yīng)將傳統(tǒng)媒體和新媒體傳播通道有效結(jié)合、資源共享、集中處理,從而衍生出更加符合受眾需求的信息產(chǎn)品。同時(shí)需要看到,通過多年實(shí)踐,新聞采編發(fā)業(yè)務(wù)模型、流程已經(jīng)形成,新平臺(tái)構(gòu)建中需要在總體上延續(xù)原有運(yùn)行模式,針對(duì)媒體融合特點(diǎn),合理重構(gòu)采編流程,設(shè)計(jì)符合互聯(lián)網(wǎng)思維的、滿足國(guó)內(nèi)外業(yè)務(wù)部門需求的、支持媒體融合發(fā)展的多媒體采編大平臺(tái)。
2.1建設(shè)需求
綜合考慮媒體融合應(yīng)用和未來發(fā)展需求,新多媒體采編系統(tǒng)在保持原有業(yè)務(wù)模型、數(shù)據(jù)和采編發(fā)基本功能不變的基礎(chǔ)上,主要建設(shè)目標(biāo)如下:
為記者、編輯構(gòu)建在線投稿、移動(dòng)辦公平臺(tái),支持媒體融合下業(yè)務(wù)發(fā)展格局和業(yè)務(wù)流程,并充分考慮與原有應(yīng)用系統(tǒng)的無縫連接;
統(tǒng)一管理分布在不同區(qū)域的數(shù)據(jù)資源,實(shí)現(xiàn)智能分析,資源共享,支持大數(shù)據(jù)新聞?shì)o助編輯;實(shí)時(shí)監(jiān)控系統(tǒng)運(yùn)行狀態(tài)、數(shù)據(jù)業(yè)務(wù)流程,實(shí)現(xiàn)智能高效的運(yùn)維管理;負(fù)載能力高、可擴(kuò)展性強(qiáng),為各類應(yīng)用提供即時(shí)響應(yīng)。
2.2系統(tǒng)架構(gòu)設(shè)計(jì)
新一代多媒體采編發(fā)大平臺(tái)采用“五橫兩縱”的多層應(yīng)用架構(gòu)設(shè)計(jì),安全保障體系與標(biāo)準(zhǔn)規(guī)范體系貫穿整個(gè)系統(tǒng),基本架構(gòu)如圖1所示。
表現(xiàn)層是系統(tǒng)和用戶間的橋梁,為記者、編輯、管理人員提供了交互良好的操作界面,為用戶提供信息展示交互、授權(quán)下載、查詢檢索、分析報(bào)表等功能;應(yīng)用服務(wù)層是系統(tǒng)的核心層,采用面向服務(wù)的體系結(jié)構(gòu)(SOA),為各類應(yīng)用提供包括統(tǒng)一身份認(rèn)證、在線投稿、移動(dòng)采編、文字圖片編輯、公共稿庫管理、成品稿庫及發(fā)布服務(wù)、稿件統(tǒng)計(jì)、監(jiān)控預(yù)警等核心服務(wù)支持;接口層完成應(yīng)用服務(wù)層與數(shù)據(jù)存儲(chǔ)層之間的通信和接口轉(zhuǎn)換,確保各類應(yīng)用對(duì)共享數(shù)據(jù)資源的統(tǒng)一訪問;數(shù)據(jù)存儲(chǔ)層采用關(guān)系型數(shù)據(jù)庫和全文數(shù)據(jù)庫相結(jié)合的方式,建立了新聞資源的公共稿庫,實(shí)現(xiàn)對(duì)資源數(shù)據(jù)的匯聚、存儲(chǔ)和管理,采用全文檢索實(shí)現(xiàn)對(duì)關(guān)系數(shù)據(jù)中數(shù)據(jù)資源的全文索引創(chuàng)建;支撐環(huán)境層主要包含操作系統(tǒng)、應(yīng)用中間件和防毒軟件等軟件環(huán)境,以及服務(wù)器、存儲(chǔ)、交換機(jī)等硬件環(huán)境部分。
安全保障體系縱向貫穿整個(gè)層面,從支撐環(huán)境層到表現(xiàn)層都進(jìn)行安全管理,保障系統(tǒng)安全運(yùn)行;標(biāo)準(zhǔn)規(guī)范體系在各層建設(shè)統(tǒng)一接口規(guī)范,包括文件存儲(chǔ)規(guī)范、XML文件格式規(guī)范、數(shù)據(jù)完整性一致性要求、統(tǒng)一身份認(rèn)證系統(tǒng)與第三方應(yīng)用系統(tǒng)的接口規(guī)范等。
2.3系統(tǒng)主要技術(shù)特點(diǎn)
基于分層架構(gòu)構(gòu)建應(yīng)用系統(tǒng),各層相互獨(dú)立,前后臺(tái)分離,既保證系統(tǒng)良好的可擴(kuò)展性、易用性,又保證系統(tǒng)核心數(shù)據(jù)安全。
綜合多種安全技術(shù)進(jìn)行分區(qū)、分層防護(hù),建立安全高效的網(wǎng)絡(luò)安全體系。
統(tǒng)一具體標(biāo)準(zhǔn)和規(guī)范,便于海量數(shù)據(jù)管理和監(jiān)控系統(tǒng)的智能化。
采用非關(guān)系數(shù)據(jù)庫和智能處理技術(shù),有效提升系統(tǒng)的大數(shù)據(jù)應(yīng)用能力。
新多媒體采編系統(tǒng)實(shí)現(xiàn)了整體架構(gòu)與業(yè)務(wù)需求接軌,同時(shí)在主要環(huán)節(jié)上引入了關(guān)鍵技術(shù),有效提高系統(tǒng)工作性能。
3.1采用可伸縮線性擴(kuò)展系統(tǒng)架構(gòu),便于擴(kuò)展和管理
綜合考慮系統(tǒng)當(dāng)前性能以及擴(kuò)展需求,系統(tǒng)硬件平臺(tái)采用集群和網(wǎng)絡(luò)存儲(chǔ)模式,并綜合采用縱向擴(kuò)展(Scale-up)和橫向擴(kuò)展 (Scale-out)兩種方式進(jìn)行系統(tǒng)擴(kuò)展。后臺(tái)服務(wù)器集群根據(jù)訪問群與承載功能的不同進(jìn)行分區(qū)部署和冗余備份,當(dāng)系統(tǒng)壓力增大需要擴(kuò)展時(shí),可在原有集群組中加入新的服務(wù)器;存儲(chǔ)平臺(tái)采用網(wǎng)絡(luò)連接存儲(chǔ)(NAS)及存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)混合存儲(chǔ)方式,NAS存儲(chǔ)主要存儲(chǔ)業(yè)務(wù)應(yīng)用非格式化數(shù)據(jù),SAN存儲(chǔ)主要用于存儲(chǔ)數(shù)據(jù)庫核心數(shù)據(jù)。需要擴(kuò)展時(shí),SAN存儲(chǔ)采用Scale-up方式擴(kuò)充,NAS存儲(chǔ)采用Scale-out方式擴(kuò)充。
3.2綜合緩存加速、讀寫分離、按需存儲(chǔ)、組播等多種手段,提升大數(shù)據(jù)處理能力
為滿足多用戶并發(fā)、海量多媒體信息快速檢索訪問的需求,系統(tǒng)在設(shè)計(jì)時(shí)針對(duì)影響系統(tǒng)性能的各個(gè)環(huán)節(jié)進(jìn)行優(yōu)化,綜合利用多種技術(shù)手段提升用戶交互的響應(yīng)速度。
在數(shù)據(jù)服務(wù)上,采用緩存加速技術(shù),實(shí)現(xiàn)海量多媒體信息快速訪問。為提高請(qǐng)求的處理效率,采用Apache + Squid方案提升系統(tǒng)的抗負(fù)載能力。Apache響應(yīng)靜態(tài)請(qǐng)求,應(yīng)用服務(wù)器響應(yīng)動(dòng)態(tài)請(qǐng)求。
在數(shù)據(jù)庫結(jié)構(gòu)上,采用ORACLE數(shù)據(jù)庫集群技術(shù)來實(shí)現(xiàn)讀寫分離,通過主從數(shù)據(jù)庫的讀寫分離,有效減輕數(shù)據(jù)庫壓力,進(jìn)一步提高了數(shù)據(jù)庫的工作效率,改善用戶體驗(yàn)。
在訪問模式上,利用異步JavaScript 和XML技術(shù)(Ajax)來實(shí)現(xiàn)數(shù)據(jù)的按需獲取,以減輕系統(tǒng)整體負(fù)擔(dān)。Ajax相當(dāng)于在用戶和服務(wù)器上加一個(gè)中間層,使用戶操作與服務(wù)器響應(yīng)異步化,用戶處的Ajax完成一部分?jǐn)?shù)據(jù)驗(yàn)證和數(shù)據(jù)處理工作,僅將必須的新數(shù)據(jù)申請(qǐng)發(fā)給服務(wù)器,從而減輕服務(wù)器負(fù)擔(dān)、減少用戶等待時(shí)間。
在網(wǎng)絡(luò)傳輸上,采用組播技術(shù)來實(shí)現(xiàn)集群服務(wù)器間的數(shù)據(jù)同步,優(yōu)化網(wǎng)絡(luò)環(huán)境。組播技術(shù)不僅控制網(wǎng)絡(luò)流量、消除流量冗余,而且降低服務(wù)器和交換機(jī)的負(fù)擔(dān),有效提升面向互聯(lián)網(wǎng)的分布式應(yīng)用性能。
3.3靈活運(yùn)用內(nèi)容管理、數(shù)據(jù)檢索和文本挖掘技術(shù),支持大數(shù)據(jù)條件下的新聞?shì)o助編輯
分析海量數(shù)據(jù)來挖掘數(shù)據(jù)表象之下的真相獲取“數(shù)據(jù)新聞”,已成為當(dāng)前一種重要的新聞生產(chǎn)方式,媒體融合下新聞采編系統(tǒng)的內(nèi)容管理是一個(gè)集人、過程與技術(shù)于一體的“技術(shù)—社會(huì)”工程,將各種非結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù)資源進(jìn)行采集、管理、利用、傳遞和增值,并有機(jī)集成到結(jié)構(gòu)化數(shù)據(jù)庫中,讓不同部門、不同需求的用戶都能流暢使用,以實(shí)現(xiàn)真正高效的內(nèi)容管理服務(wù)。
數(shù)據(jù)檢索技術(shù)幫助使用者快速定位所需內(nèi)容。按照搜索方法可分為全文搜索、上下文搜索等。面對(duì)海量的內(nèi)容數(shù)據(jù)和并發(fā)檢索壓力,新采編系統(tǒng)綜合采用智能化信息檢索技術(shù)、自然語言查詢、多媒體信息檢索技術(shù)等來實(shí)現(xiàn)智能檢索。
在新聞編輯審核過程中,采用文本挖掘技術(shù),對(duì)海量數(shù)據(jù)進(jìn)行有效的分析處理,包括了信息抽取、信息檢索、自然語言處理和數(shù)據(jù)挖掘。利用內(nèi)容語義分析、統(tǒng)計(jì)等各種智能手段,實(shí)現(xiàn)了自動(dòng)分類、常識(shí)校對(duì)、文本相似性檢索、信息過濾、自然語言檢索等,在大規(guī)模的異構(gòu)文本資源中提取出符合用戶需求的簡(jiǎn)潔、精煉、可理解的數(shù)據(jù)信息。
推動(dòng)傳統(tǒng)媒體和新興媒體融合發(fā)展是一項(xiàng)復(fù)雜的系統(tǒng)工程,多媒體采編系統(tǒng)的建設(shè)是媒體融合的基礎(chǔ)。我們應(yīng)當(dāng)實(shí)時(shí)關(guān)注和把握技術(shù)發(fā)展趨勢(shì),堅(jiān)持先進(jìn)技術(shù)為支撐、內(nèi)容建設(shè)為根本,結(jié)合媒體應(yīng)用實(shí)際,找到新技術(shù)在媒體融合中的應(yīng)用切入點(diǎn),探索傳統(tǒng)媒體與新興媒體在內(nèi)容、渠道、平臺(tái)、經(jīng)營(yíng)、管理等方面的深度融合。在中國(guó)新聞社多媒體采編系統(tǒng)項(xiàng)目的建設(shè)過程中,我們初步探討并重構(gòu)了多媒體采編資源共享,完善了系統(tǒng)內(nèi)部標(biāo)準(zhǔn)、流程和要求,強(qiáng)化了互聯(lián)網(wǎng)思維和一體化發(fā)展理念,進(jìn)行了相應(yīng)的內(nèi)容建設(shè)、人才建設(shè)和機(jī)制建設(shè),為立體多樣、融合發(fā)展的現(xiàn)代化傳播體系構(gòu)建了堅(jiān)實(shí)的基礎(chǔ)。
(作者單位:中國(guó)新聞社技術(shù)部)
G203
A