国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

電視臺(tái)大數(shù)據(jù)理念與建設(shè)實(shí)踐

2019-07-31 07:56江慶成都索貝數(shù)碼科技股份有限公司售前總監(jiān)
視聽界(廣播電視技術(shù)) 2019年3期
關(guān)鍵詞:架構(gòu)數(shù)據(jù)庫

江慶 成都索貝數(shù)碼科技股份有限公司售前總監(jiān)

大數(shù)據(jù)發(fā)展已經(jīng)很多年了,并正在各個(gè)領(lǐng)域得到廣泛應(yīng)用。我們打開手機(jī),今日頭條、抖音會(huì)自動(dòng)推薦給你所感興趣的內(nèi)容,這是大數(shù)據(jù);淘寶、京東會(huì)自動(dòng)推薦給你所感興趣的商品,這也是大數(shù)據(jù);我們在朋友圈經(jīng)常會(huì)看到一些廣告,每個(gè)人看到廣告不一樣,這也是大數(shù)據(jù)。大數(shù)據(jù)的應(yīng)用在我們生活中已經(jīng)無處不在。我們現(xiàn)在經(jīng)常聽到的智慧城市、智慧交通、智慧醫(yī)療,這些都是大數(shù)據(jù)在不同領(lǐng)域的典型應(yīng)用。索貝是一家專注廣電行業(yè)的企業(yè),一直致力于將先進(jìn)的IT技術(shù)與行業(yè)經(jīng)驗(yàn)結(jié)合,為用戶提供優(yōu)質(zhì)的解決方案,大數(shù)據(jù)在電視臺(tái)中的應(yīng)用是一個(gè)非常重要的方向。接下來與大家分享索貝在電視臺(tái)大數(shù)據(jù)項(xiàng)目建設(shè)過程中的理念和建設(shè)經(jīng)驗(yàn)。

1.大數(shù)據(jù)定義與特點(diǎn)

首先我們來看一下什么是大數(shù)據(jù),大數(shù)據(jù)的特點(diǎn)是什么?

百度百科給出的“大數(shù)據(jù)”定義是:大數(shù)據(jù)(big data),指無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。

麥肯錫全球研究所給出的定義是:一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、 快速的數(shù)據(jù)流轉(zhuǎn)、 多樣的數(shù)據(jù)類型和價(jià)值密度低四大特征。

我們看一下電視臺(tái)有哪些數(shù)據(jù)?這些數(shù)據(jù)是不是符合大數(shù)據(jù)的特性。電視臺(tái)數(shù)據(jù)分為兩類,一類是臺(tái)內(nèi)數(shù)據(jù),一類是臺(tái)外數(shù)據(jù)。臺(tái)內(nèi)數(shù)據(jù)是臺(tái)內(nèi)各個(gè)系統(tǒng)存儲(chǔ)產(chǎn)生的數(shù)據(jù),包括內(nèi)容數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、設(shè)備數(shù)據(jù)、辦公數(shù)據(jù)、經(jīng)營數(shù)據(jù)。

臺(tái)外數(shù)據(jù)包括輿情傳播數(shù)據(jù)、傳播力數(shù)據(jù)、影響力數(shù)據(jù)、用戶數(shù)據(jù)、收視率數(shù)據(jù)。

電視臺(tái)臺(tái)內(nèi)數(shù)據(jù)和臺(tái)外數(shù)據(jù)都具備了海量的數(shù)據(jù)規(guī)模、 快速的數(shù)據(jù)流轉(zhuǎn)、 多樣的數(shù)據(jù)類型和價(jià)值密度低這四大特征,都是大數(shù)據(jù)。

2.數(shù)據(jù)運(yùn)用及索貝大數(shù)據(jù)技術(shù)架構(gòu)

圖1 數(shù)據(jù)的運(yùn)用

數(shù)據(jù)運(yùn)用來自我們的需求。現(xiàn)在電視臺(tái)有很多事情不能進(jìn)行量化,例如我們的收益如何,黨和國家的政策宣傳效果如何,系統(tǒng)設(shè)備的使用情況什么樣,員工的工作效率怎么樣等等還不能完全做到量化,只能憑自己的主觀去判斷這些東西是好還是壞,是優(yōu)還是良。當(dāng)我們有足夠的數(shù)據(jù),然后通過對這些數(shù)據(jù)的分析,就可以從數(shù)據(jù)中得到一個(gè)準(zhǔn)確的答案。要想做好這樣的數(shù)據(jù)分析,首先我們需要有一個(gè)大數(shù)據(jù)的體系和架構(gòu)來支撐。

圖2是索貝企業(yè)數(shù)據(jù)平臺(tái)的架構(gòu)圖,它能夠滿足電視臺(tái)大數(shù)據(jù)的業(yè)務(wù)應(yīng)用。數(shù)據(jù)平臺(tái)分為四個(gè)部分,企業(yè)數(shù)據(jù)管理、企業(yè)數(shù)據(jù)倉庫、企業(yè)數(shù)據(jù)集成與數(shù)據(jù)平臺(tái)管理。其中企業(yè)數(shù)據(jù)管理、企業(yè)數(shù)據(jù)倉庫、企業(yè)數(shù)據(jù)集成是核心部分。企業(yè)數(shù)據(jù)管理是對實(shí)時(shí)數(shù)據(jù)的存儲(chǔ)、管理、協(xié)同的核心單元,其核心是能對各種類型的數(shù)據(jù)進(jìn)行統(tǒng)一的管理;企業(yè)倉庫主要用于一些離線數(shù)據(jù)的運(yùn)算,可以采用比較成熟的Hadoop、Spark的能力;企業(yè)數(shù)據(jù)集成是對數(shù)據(jù)的采集和應(yīng)用,其核心是能支撐多種數(shù)據(jù)的采集、處理和轉(zhuǎn)換,特別是具有對媒體行業(yè)視頻、圖片數(shù)據(jù)的采集、處理和轉(zhuǎn)換的能力。

圖2 企業(yè)數(shù)據(jù)平臺(tái)技術(shù)架構(gòu)

索貝媒體大數(shù)據(jù)平臺(tái)具有以下三個(gè)特點(diǎn)。第一個(gè)是能夠?qū)佣喾N數(shù)據(jù)來源,在后面的案例介紹中,可以看到索貝媒體大數(shù)據(jù)平臺(tái)不僅能對接多種數(shù)據(jù)庫、采集器,還能夠?qū)用襟w的內(nèi)容庫,采集視頻大數(shù)據(jù)。第二個(gè)是與Hadoop/Spark開源的有機(jī)結(jié)合,能夠使用其開源的一些能力,能夠融入現(xiàn)在一些主流的大數(shù)據(jù)生態(tài)。第三個(gè)是支持多種的數(shù)據(jù),特別是具備媒體視頻大數(shù)據(jù)的處理能力。

索貝企業(yè)數(shù)據(jù)平臺(tái)的核心技術(shù)主要有三個(gè),第一個(gè)是索貝自主研發(fā)的Vernox數(shù)據(jù)庫。從上個(gè)世紀(jì)六七十年代數(shù)據(jù)庫誕生,隨著存儲(chǔ)數(shù)據(jù)類型的增多,關(guān)系型數(shù)據(jù)庫、非關(guān)系型數(shù)據(jù)庫、圖數(shù)據(jù)庫、內(nèi)存數(shù)據(jù)庫應(yīng)運(yùn)而生。但這些數(shù)據(jù)庫都是獨(dú)立運(yùn)行的,我們聯(lián)合的查詢檢索相當(dāng)困難,面對大數(shù)據(jù)時(shí)代數(shù)據(jù)存儲(chǔ)的要求,索貝自主開發(fā)了Vernox數(shù)據(jù)庫。

Verno數(shù)據(jù)庫有三個(gè)特性,第一個(gè)是融合,它能夠原生的支持關(guān)系型、非關(guān)系型數(shù)據(jù)庫,也能夠原生的支持文檔型數(shù)據(jù)庫、圖數(shù)據(jù)庫,是一個(gè)融合的數(shù)據(jù)庫。第二個(gè)是高效,能通過索貝獨(dú)創(chuàng)的中文索引與基于成本執(zhí)行的機(jī)制,對數(shù)據(jù),特別是漢字進(jìn)行高效的檢索查詢,這是在中國的一個(gè)特殊應(yīng)用,對此需要對漢字有深入的理解。我們曾經(jīng)做過一個(gè)測試,在一張近650萬條數(shù)據(jù)表中,Oracle、Myspl和Vernox分別執(zhí)行一條相同的漢字檢索語句服務(wù)端的耗時(shí),Vernox的耗時(shí)要遠(yuǎn)遠(yuǎn)小于Oracle、Myspl的耗時(shí)。

第二個(gè)核心技術(shù)是VIDA(Video Innovative Data Architecture)的視頻架構(gòu)。對視頻大數(shù)據(jù)進(jìn)行處理,一直是大數(shù)據(jù)處理的一個(gè)難題。索貝通過獨(dú)創(chuàng)的VIDA視頻架構(gòu),使用了視頻的智能分片網(wǎng)格技術(shù),能夠支持視頻文件多格式、多碼率的高效并發(fā)訪問,同時(shí)通過Video MapReduce技術(shù),實(shí)現(xiàn)了視頻的高性能并發(fā)處理,滿足大數(shù)據(jù)時(shí)代實(shí)時(shí)視頻數(shù)據(jù)處理的要求。

第二個(gè)核心技術(shù)是VIDA(Video Innovative Data Architecture)的視頻架構(gòu)。對視頻大數(shù)據(jù)進(jìn)行處理,一直是大數(shù)據(jù)處理的一個(gè)難題。索貝通過獨(dú)創(chuàng)的VIDA視頻架構(gòu),使用了視頻的智能分片網(wǎng)格技術(shù),能夠支持視頻文件多格式、多碼率的高效并發(fā)訪問,同時(shí)通過Video MapReduce技術(shù),實(shí)現(xiàn)了視頻的高性能并發(fā)處理,滿足大數(shù)據(jù)時(shí)代實(shí)時(shí)視頻數(shù)據(jù)處理的要求。

第三個(gè)技術(shù)核心是索貝自主開發(fā)的Ficus企業(yè)數(shù)據(jù)集成平臺(tái)。企業(yè)數(shù)據(jù)集成是企業(yè)數(shù)據(jù)平臺(tái)的核心部分,F(xiàn)icus企業(yè)數(shù)據(jù)集成平臺(tái)具有輕量化、云延伸的架構(gòu),易用、易開發(fā),部署簡單。企業(yè)數(shù)據(jù)平臺(tái)運(yùn)用索貝Vernox數(shù)據(jù)庫解決了分布式主數(shù)據(jù)管理及安全的問題,具有原生的Hadoop、Spark不支持的能力,例如Hadoop、Spark比較弱的媒體處理能力,也支持Hadoop、Spark的能力集成,能接入大數(shù)據(jù)的生態(tài)。

圖3 技術(shù)架構(gòu)核心1:Vernox

圖4 技術(shù)架構(gòu)核心2:VIDA

3.索貝大數(shù)據(jù)在電視臺(tái)項(xiàng)目中的實(shí)踐

首先是SobeyHive 媒體內(nèi)容平臺(tái)。SobeyHive不僅是一個(gè)paas平臺(tái),也是一個(gè)DaaS平臺(tái)。首先我們來看一下Hive是怎么產(chǎn)生的。在電視臺(tái)網(wǎng)絡(luò)化建設(shè)初期,索貝建設(shè)了很多獨(dú)立系統(tǒng),例如大家熟知的新聞生產(chǎn)、制作、媒資、播出、新媒體等系統(tǒng)。后來通過SOA、MSB把這些系統(tǒng)連接起來,但是系統(tǒng)互聯(lián)互通以后,并沒有完全解決問題。例如在電視臺(tái)找一個(gè)內(nèi)容比在互聯(lián)網(wǎng)找一個(gè)內(nèi)容要困難,在互聯(lián)網(wǎng)找一個(gè)內(nèi)容,打開百度搜索就可以找到,在電視臺(tái)找一個(gè)內(nèi)容,不知道去哪個(gè)系統(tǒng)找。此外,傳統(tǒng)媒體和新媒體的融合也存在問題,因此需要在全臺(tái)實(shí)現(xiàn)統(tǒng)一的內(nèi)容檢索。

索貝開發(fā)了第一個(gè)數(shù)據(jù)服務(wù)平臺(tái)Hive,結(jié)合大數(shù)據(jù)核心的主數(shù)據(jù)管理的理念,把所有系統(tǒng)的數(shù)據(jù)做了整合,所有業(yè)務(wù)做了整合。平臺(tái)建設(shè)好之后,我們發(fā)現(xiàn)不僅僅實(shí)現(xiàn)了全臺(tái)內(nèi)容的統(tǒng)一檢索與使用、業(yè)務(wù)數(shù)據(jù)統(tǒng)一展現(xiàn)與指揮、傳統(tǒng)媒體與新興媒體的融合等目標(biāo),還帶來了一些新的效果。例如現(xiàn)今比較流行的移動(dòng)辦公,索貝通過Hive平臺(tái)完成了APP工具的整合,使節(jié)目生產(chǎn)也能夠在手機(jī)、平板電腦移動(dòng)端上完成。此外還能做到在新聞生產(chǎn)過程中,相關(guān)媒資內(nèi)容可以主動(dòng)推薦,這就是融合跨界整合、數(shù)據(jù)整合帶來的效果。

Hive發(fā)布以后,索貝獲得了多個(gè)國際獎(jiǎng)項(xiàng),包括中央電視臺(tái)在內(nèi),80%國內(nèi)電視臺(tái)融合媒體都采用了這個(gè)方案。此外,索貝在經(jīng)濟(jì)日報(bào)、中國國際廣播電臺(tái)也采用了這個(gè)方案。為什么這里會(huì)說報(bào)業(yè)、廣播的案例?索貝做了多年的廣電業(yè)務(wù),對電視臺(tái)系統(tǒng)之間的數(shù)據(jù)結(jié)構(gòu)已比較了解,而目前報(bào)業(yè)、廣電國內(nèi)大都是方正、英夫美迪的系統(tǒng)和產(chǎn)品,通過Hive平臺(tái)建設(shè),索貝已經(jīng)能實(shí)現(xiàn)與廣電系統(tǒng)外異構(gòu)系統(tǒng)的對接。

圖5 SobeyHive 媒體內(nèi)容平臺(tái)

圖6 央視全球融合新聞系統(tǒng)

第一個(gè)應(yīng)用案例是央視全球新聞云,該項(xiàng)目去年獲得了大獎(jiǎng)。它采用Hive架構(gòu),支撐了央視三個(gè)分臺(tái)、四個(gè)中心站,國內(nèi)外一百多記者站全球業(yè)務(wù)生產(chǎn)的發(fā)布,實(shí)現(xiàn)了全球范圍內(nèi)工作視圖的統(tǒng)一。

圖7 北京臺(tái)大數(shù)據(jù)在運(yùn)營運(yùn)維中的應(yīng)用案例

Hive在國外的項(xiàng)目中也得到廣泛認(rèn)可。路透社將建設(shè)部署在亞馬遜上的全球報(bào)道生產(chǎn)平臺(tái),支撐路透社在全球范圍內(nèi)的新聞報(bào)道,該系統(tǒng)也將以Hive的架構(gòu)為核心。Hive架構(gòu)得到了國際電視臺(tái)的充分認(rèn)可,瑞士的SRG SSR、美國的COMCAST、中國香港TVB、荷蘭的RTV等電視臺(tái)也在系統(tǒng)中采用Hive架構(gòu)。

第二個(gè)應(yīng)用案例是北京臺(tái)數(shù)據(jù)治理項(xiàng)目,這個(gè)項(xiàng)目是大數(shù)據(jù)在運(yùn)維方面的一個(gè)典型案例。首先介紹一下項(xiàng)目的背景,在北京臺(tái)融合媒體生產(chǎn)平臺(tái)項(xiàng)目的交流中,除制作生產(chǎn)業(yè)務(wù)之外,用戶還經(jīng)常會(huì)提到一些運(yùn)維的難點(diǎn),例如系統(tǒng)運(yùn)行狀況沒有客觀的判斷,只能靠經(jīng)驗(yàn)判斷;現(xiàn)在的服務(wù)器、CPU、內(nèi)存等資源使用經(jīng)常不超過10%,這部分資源不能充分得到應(yīng)用;系統(tǒng)故障不能預(yù)警,只有等故障發(fā)生了才能去處理問題。經(jīng)過對這些需求進(jìn)行邏輯分析,并對目標(biāo)所需要的數(shù)據(jù)進(jìn)行梳理,我們得出結(jié)論,通過收集數(shù)據(jù)、分析數(shù)據(jù)可以解決上述運(yùn)維中的難點(diǎn)。

北京臺(tái)數(shù)據(jù)治理項(xiàng)目實(shí)現(xiàn)了四個(gè)維度的目標(biāo)。一是業(yè)務(wù)健康度,可以對臺(tái)內(nèi)系統(tǒng)各個(gè)模塊的狀態(tài)進(jìn)行可量化的分析和監(jiān)控。二是可以對臺(tái)內(nèi)所有設(shè)備資源不同時(shí)段的使用數(shù)據(jù)進(jìn)行有效統(tǒng)計(jì)。三是在資源優(yōu)化配置方面,可以對臺(tái)內(nèi)常用業(yè)務(wù)的資源進(jìn)行配置,統(tǒng)計(jì)結(jié)果和生產(chǎn)平臺(tái)結(jié)合,實(shí)現(xiàn)資源自動(dòng)化的動(dòng)態(tài)調(diào)度。例如通過一段時(shí)間的統(tǒng)計(jì),我們發(fā)現(xiàn)每天上午時(shí)間段,用戶設(shè)備的使用量不大。我們運(yùn)用大數(shù)據(jù)平臺(tái)分析,系統(tǒng)會(huì)自動(dòng)在上午時(shí)段把一些云非編資源釋放出來,把它自動(dòng)部署成合成磚碼,提高了臺(tái)內(nèi)一些節(jié)目的生產(chǎn)效率,形成了大數(shù)據(jù)與生產(chǎn)系統(tǒng)之間的一個(gè)業(yè)務(wù)閉環(huán)。四是業(yè)務(wù)預(yù)警,可以根據(jù)數(shù)據(jù)分析,對可能發(fā)生的故障進(jìn)行預(yù)警和報(bào)警。

第三個(gè)應(yīng)用案例是體奧動(dòng)力的視頻大數(shù)據(jù)項(xiàng)目,這個(gè)項(xiàng)目是大數(shù)據(jù)在視頻內(nèi)容運(yùn)營方面的一個(gè)典型案例。體奧動(dòng)力在六年前已經(jīng)開始擁有中超、亞冠、亞洲游戲類所有比賽的版權(quán),并保存了這些比賽的大量視頻數(shù)據(jù)。他們希望通過視頻分析得到相關(guān)一些球員、球隊(duì)的有用信息,并將這部分信息能夠用于運(yùn)營。在和體奧動(dòng)力的溝通過程中,我們發(fā)現(xiàn)他們不僅有所有的視頻數(shù)據(jù),此外每場比賽都還有比較全面的場記信息,每個(gè)場記信息包含了上萬的數(shù)據(jù)量,能夠?qū)δ繕?biāo)提供有用的幫助。但是這些場記信息不具備直接顯示性,沒有連貫性,而且沒有數(shù)據(jù)解釋。我們進(jìn)行了大量的數(shù)據(jù)分析,通過算法和匹配,將這些場記信息與視頻分析信息進(jìn)行結(jié)合,得出了有效的結(jié)果數(shù)據(jù),依據(jù)結(jié)果數(shù)據(jù)能夠?qū)η蜿?duì)進(jìn)行數(shù)字分析。這些數(shù)據(jù)對球隊(duì)教練、球隊(duì)管理層非常有用,他們可以把這些數(shù)據(jù)賣給一些中超的公司和專業(yè)機(jī)構(gòu)。相信隨著未來博彩業(yè)的發(fā)展,這部分?jǐn)?shù)據(jù)對他們也是有用的。

4.A.I.將助力于大數(shù)據(jù)的發(fā)展

展望未來,大數(shù)據(jù)應(yīng)用還有很多,例如業(yè)務(wù)優(yōu)化、資源優(yōu)化、員工效率提升等。在未來,可以隨時(shí)隨著報(bào)道的鏈條開展,讓實(shí)時(shí)的輿情數(shù)據(jù)、報(bào)道內(nèi)容的傳播力數(shù)據(jù)與臺(tái)內(nèi)的數(shù)據(jù)相結(jié)合,進(jìn)行碰撞,通過大數(shù)據(jù)平臺(tái)為每個(gè)報(bào)道鏈條節(jié)點(diǎn)自動(dòng)準(zhǔn)備內(nèi)容,在不遠(yuǎn)的將來可以實(shí)現(xiàn)自動(dòng)編節(jié)目、自動(dòng)寫稿。這些應(yīng)用其實(shí)就是智能,大數(shù)據(jù)的下一步是A.I.人工智能,A.I.將助力于大數(shù)據(jù)的發(fā)展。

猜你喜歡
架構(gòu)數(shù)據(jù)庫
基于FPGA的RNN硬件加速架構(gòu)
自主式MaaS系統(tǒng)多維架構(gòu)映射關(guān)系設(shè)計(jì)
功能架構(gòu)在電子電氣架構(gòu)開發(fā)中的應(yīng)用和實(shí)踐
基于云服務(wù)的圖書館IT架構(gòu)
數(shù)據(jù)庫
WebGIS架構(gòu)下的地理信息系統(tǒng)構(gòu)建研究
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
文登市| 莎车县| 关岭| 遂平县| 北宁市| 金门县| 武陟县| 开封市| 宜川县| 桓台县| 平凉市| 武平县| 德江县| 房山区| 合水县| 威信县| 南部县| 类乌齐县| 阿合奇县| 班戈县| 长寿区| 普陀区| 陇南市| 鹤山市| 黄浦区| 察隅县| 西丰县| 通江县| 静安区| 韶关市| SHOW| 玉山县| 富宁县| 错那县| 岳西县| 南溪县| 台东县| 阿合奇县| 青田县| 吴川市| 雷州市|