国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)時代媒體行業(yè)數(shù)字資源研究

2013-05-11 06:14齊宇杰
中國傳媒科技 2013年11期
關(guān)鍵詞:數(shù)據(jù)挖掘資源內(nèi)容

文|齊宇杰

一、大數(shù)據(jù)研究的背景

隨著信息技術(shù)的不斷發(fā)展與快速普及,信息交流,數(shù)據(jù)交換爆炸性增長,大數(shù)據(jù)時代來了。目前全球的電子化信息量是千萬億兆的數(shù)據(jù)量,預計2020年整個數(shù)據(jù)量可能會達到35千萬億兆。著名分析調(diào)研機構(gòu)IDC的研究報告《從混沌中提取價值》顯示,僅2011年,全球就產(chǎn)生了1.8ZB(也就是1.8萬億GB)的大數(shù)據(jù),由此可見,海量數(shù)據(jù)就在眼前。我們把那些大小超出傳統(tǒng)數(shù)據(jù)庫軟件工具的抓取、存儲、管理、分析能力的數(shù)據(jù)群稱之為大數(shù)據(jù)。IBM公司曾經(jīng)把大數(shù)據(jù)屬性概括為以下三點:大量化(Volume)、多樣化(Variety)、快速化(Velocity),而這三點也或明或暗的展示了大數(shù)據(jù)的價值(Value),只是由于大數(shù)據(jù)的海量屬性,鑄就這種價值密度偏低。

關(guān)于“大數(shù)據(jù)”的表述,某著名搜索網(wǎng)站認為最早是Apache公司2009年3月發(fā)布的開源項目Nutch。其中,“大數(shù)據(jù)”用來描述為更新網(wǎng)絡(luò)搜索索引而同時進行批量處理或分析的大量數(shù)據(jù)集。其實,早在2008年國際頂級學術(shù)刊物Nature就出版過??癇ig Data”來探討對大數(shù)據(jù)的研究。也許名稱的最早提出已經(jīng)不重要,然而,大數(shù)據(jù)理念的產(chǎn)生,應(yīng)該是在1980年阿爾文·托夫勒出版的轟動世界的未來學思想體系名著《第三次浪潮》中首次提及。作者認為,人類社會在經(jīng)歷了始于一萬年前的農(nóng)業(yè)階段、始于十七世紀的工業(yè)階段之后,從20世紀50年代后期開始已經(jīng)步入信息化階段,在這個階段,大數(shù)據(jù)將是“第三次浪潮的華彩樂章”。

二、大數(shù)據(jù)研究與應(yīng)用

無論是大數(shù)據(jù)理念的產(chǎn)生,還是大數(shù)據(jù)表述的問世,這些都不妨礙大數(shù)據(jù)應(yīng)用的思考與推廣?!按髷?shù)據(jù)”的數(shù)據(jù)來自哪里,有很多說法,不盡相同,匯總看來,主要來自三個方面:第一、政府相關(guān)部門的數(shù)據(jù),第二、企業(yè)自身運營的數(shù)據(jù),第三、自媒體時代的個人數(shù)據(jù)。前兩個方面的大數(shù)據(jù)積累其實早就有之,而正是因為互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、智能移動設(shè)備的大規(guī)模普及,從而催生自媒體時代的急速邁入,進而使得大數(shù)據(jù)慢慢向個人數(shù)據(jù)傾斜。

大數(shù)據(jù)應(yīng)用層面,主要集中在大型公司、一些民間組織、政府行業(yè)等。美國麻省理工學院設(shè)計的全球疾病警報地圖(Health Map)利用廣泛的自媒體數(shù)據(jù),結(jié)合官方發(fā)布的數(shù)據(jù),不間斷掃描博客、推特、官方監(jiān)控數(shù)據(jù)、新聞網(wǎng)站等等信息,然后用十多種語言進行發(fā)布,當前國內(nèi)最具影響力的H7N9禽流感進展也在他們的發(fā)布數(shù)據(jù)當中。政府行業(yè)的大數(shù)據(jù)事件最著名的莫過于奧巴馬總統(tǒng)在2012年3月22日,簽署的美國政府投資兩億美元的大數(shù)據(jù)研究和發(fā)展計劃。大家都知道大數(shù)據(jù)是“未來的新石油”,然而美國政府更是將對大數(shù)據(jù)研究上升為國家意志。毫無疑問,這將對世界科技與經(jīng)濟發(fā)展帶來深遠影響。

三、媒體行業(yè)大數(shù)據(jù)研究與應(yīng)用現(xiàn)狀分析

1、最新研究成果簡介

大數(shù)據(jù)在媒體行業(yè)的研究與應(yīng)用就是媒體行業(yè)數(shù)字資源的研究與應(yīng)用。在這方面,國外最新研究與應(yīng)用是數(shù)據(jù)新聞學的興起。所謂數(shù)據(jù)新聞學,就是以大數(shù)據(jù)為依托,憑借各種新技術(shù)呈現(xiàn)手段,用數(shù)據(jù)來報道新聞。在多種學科的技術(shù)支持下,實現(xiàn)豐富的、交互式的新聞呈現(xiàn)方式,把社會、個人、數(shù)據(jù)之間復雜的關(guān)系運用可視化手段展示出來,既客觀,又便于理解。最近,哥倫比亞大學新聞學院花巨資進行數(shù)據(jù)新聞學項目的研究,該項目主要關(guān)注以下三個方面的研究:對于公共數(shù)據(jù)的分析挖掘,哪些可用,哪些不可用;對于新聞內(nèi)容的表現(xiàn)方式研究,什么方式可以更為吸引讀者;對于新聞影響力的研究,什么工具,什么新聞更有利于提升媒體的影響力與知名度。

2、媒體行業(yè)大數(shù)據(jù)來源

媒體行業(yè)擁有龐大的數(shù)字資源。IDC曾經(jīng)發(fā)布一項調(diào)查數(shù)據(jù)顯示,在美國,擁有大數(shù)據(jù)最多的前三個行業(yè)分別是離散式制造業(yè)(966PB)、政府行業(yè)(848PB)、媒體行業(yè)(715PB),這說明媒體數(shù)據(jù)資源之龐大。這些資源來自于傳統(tǒng)媒體的數(shù)據(jù)積累和新媒體的自媒體互動。對于傳統(tǒng)媒體,由于自身歷史較長,積累了大量數(shù)據(jù),其中,結(jié)構(gòu)化數(shù)據(jù)容量并不是很大,非結(jié)構(gòu)化數(shù)據(jù)的大小根據(jù)媒體具體展現(xiàn)方式不同而不同。新媒體行業(yè)主要是網(wǎng)站文字、圖片、視音頻信息的大容量,特別是一些SNS興起后交互信息產(chǎn)生的數(shù)據(jù)信息。除此之外,在當下一個自媒體時代,人人都是記者,個個都能廣播,網(wǎng)絡(luò)給了所有人公平的話語權(quán)。而這些話語、這些信息對于媒體管理者來說就是龐大的數(shù)據(jù)來源。

3、內(nèi)容信息的整合利用早已部署

很多人認為,大數(shù)據(jù)是當下對信息化時代最新發(fā)展階段的描述,其實,在媒體領(lǐng)域,關(guān)于數(shù)據(jù)整合、信息匯總、系統(tǒng)融合,在此基礎(chǔ)上進而展開個性化服務(wù)、增值業(yè)務(wù)的工作,一些省級以上的單位早就開始部署了。只是沒有人意識到這是大數(shù)據(jù)時代的必然,沒有人想著給這項工作套上一個“大數(shù)據(jù)”的帽子,大家都只是在結(jié)合自身業(yè)務(wù)拓展的需要來對媒體內(nèi)容產(chǎn)物進行開發(fā)利用。

能否稱為大數(shù)據(jù)并不妨礙媒體對已有數(shù)據(jù)的分析挖掘再利用。在這些再利用的較大媒體中,就有很多單位做的不錯。比如杭州日報報業(yè)集團在十余年前就意識到報業(yè)自身數(shù)據(jù)的重要性,著手對報刊數(shù)據(jù)進行匯總,部署實施報刊數(shù)字資源存儲管理系統(tǒng)。當然,開始只是實現(xiàn)對紙媒內(nèi)容的匯總查詢,既方便了內(nèi)部員工的工作需要,又對外提供數(shù)據(jù)的查詢與光盤出版。最近兩年,杭報集團部署實施了全新的數(shù)字資源內(nèi)容數(shù)據(jù)庫項目,匯總的就不僅僅是自己報社的近期紙媒,還包括了自上世紀五十年代創(chuàng)刊以來的全部數(shù)據(jù)、全國的重要報刊數(shù)據(jù)、各大互聯(lián)網(wǎng)站數(shù)據(jù)。隨著大數(shù)據(jù)時代的到來,接下來還有兩個方面工作要展開:第一、在現(xiàn)有全媒體內(nèi)容數(shù)據(jù)庫基礎(chǔ)上深度開發(fā)挖掘,拓展業(yè)務(wù),做足內(nèi)容服務(wù)。第二、建立完善統(tǒng)一客戶資源平臺,充分利用優(yōu)質(zhì)客戶資源,開展更多精準化業(yè)務(wù)。

4、客戶資源的整合利用相對薄弱

一直以來,很多媒體都把自身的內(nèi)容數(shù)據(jù)看得很重要,特別是“內(nèi)容為王”思想的根深蒂固,他們認為即使是新媒體時代,“渠道為王”也離不開內(nèi)容的加工生成,因此基于內(nèi)容深加工、深挖掘成了很多人的固有模式。國外對于媒體數(shù)字資源的研究絕大多數(shù)就是圍繞著內(nèi)容展開的,只是他們更多的是通過技術(shù)手段把內(nèi)容展現(xiàn)的更為親民、更為準確、更為快捷。最近一兩年開始,國內(nèi)也有一些媒體認識到客戶數(shù)據(jù)的重要性,圍繞客戶數(shù)據(jù)可以有針對性的推出很多定向服務(wù)產(chǎn)品。媒體在自身發(fā)展中,通過發(fā)行、廣告、與受眾之間的互動熱線、各種形式定期或者不定期的推廣活動積累的客戶信息是一筆寶貴的資源,充分利用這些資源不但可以為傳統(tǒng)業(yè)務(wù)高效運轉(zhuǎn)增加亮點,同時也能開辟不少新業(yè)務(wù),創(chuàng)造不少新模式。比如在對內(nèi)業(yè)務(wù)系統(tǒng)的支撐服務(wù)方面,把廣告用戶信息整合進入其他業(yè)務(wù)系統(tǒng),將廣告用戶需求及時反饋到其他各個業(yè)務(wù)系統(tǒng)中,實現(xiàn)廣告用戶與媒體的互動。從某種意義上講,這種互動比普通受眾與媒體之間的互動要更重要,因為在生存環(huán)境越來越惡劣的媒體行業(yè),先生存下來尤為迫切。除了傳統(tǒng)方式積累的客戶資源,隨著網(wǎng)絡(luò)的發(fā)展、智能設(shè)備的普及,通過互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)等新媒體方式積累的客戶資源也在快速增長中,而且針對這些用戶的分析挖掘更快捷方便。

但是比較可惜的是,目前大多數(shù)媒體針對以上兩大類客戶資源的整合挖掘還沒有真正開始,有的媒體甚至還沒有意識到客戶資源的重要性。這個問題需要外部競爭環(huán)境的壓力,需要大數(shù)據(jù)時代的沖擊,更需要媒體內(nèi)部自身眼界的開闊。

5、媒體大數(shù)據(jù)的整體分析挖掘略顯單薄

1) 大數(shù)據(jù)是基礎(chǔ),數(shù)據(jù)挖掘才是關(guān)鍵

大數(shù)據(jù)不是目的,只是一個平臺,一個容納海量數(shù)據(jù)的容器。其目的是為了應(yīng)用,為了創(chuàng)造更多、更新的價值,這就需要數(shù)據(jù)分析與數(shù)據(jù)挖掘。嚴格說來,數(shù)據(jù)分析與數(shù)據(jù)挖掘是不一樣的,數(shù)據(jù)分析,是以輸入的數(shù)據(jù)為基礎(chǔ),通過先驗的約束,對數(shù)據(jù)進行整理,篩選,加工,由此得到信息。數(shù)據(jù)挖掘是對數(shù)據(jù)分析后的信息,進行價值化的分析,不考慮數(shù)據(jù)本身,而是考慮數(shù)據(jù)是否有價值。數(shù)據(jù)挖掘是一門跨學科的技術(shù),需要用到統(tǒng)計學,數(shù)據(jù)庫技術(shù),人工智能,可視化技術(shù)等等。具體的數(shù)據(jù)挖掘方法學界有不同的認識,比較有共識的有:分類和聚類分析、回歸分析、決策樹算法等等。廣義層面,我們暫且把數(shù)據(jù)分析和數(shù)據(jù)挖掘統(tǒng)一看待,都是通過對數(shù)據(jù)的處理,獲得數(shù)據(jù)的規(guī)律,從而產(chǎn)生價值的可能。

2) 國內(nèi)媒體行業(yè)大數(shù)據(jù)趨利性挖掘明顯

媒體行業(yè)對于大數(shù)據(jù)的挖掘利用程度參差不齊,有的也許剛剛聽說大數(shù)據(jù),相關(guān)大數(shù)據(jù)的工作還沒開展;有的也許沒聽過大數(shù)據(jù),但是與大數(shù)據(jù)相關(guān)的工作早已展開;也有少數(shù)單位已經(jīng)在自己所謂的“大數(shù)據(jù)”基礎(chǔ)上準備展開新一輪數(shù)據(jù)挖掘。雖然發(fā)展程度不一樣,但是在數(shù)據(jù)挖掘的目的性上有一個共性,那就是太趨利。媒體行業(yè)大數(shù)據(jù)基本上包括內(nèi)容產(chǎn)品與客戶資源,這兩方面都是媒體多年來積累的資源,都很重要,可以進行數(shù)據(jù)挖掘,只是在經(jīng)營屬性層面程度不同。目前,國內(nèi)媒體的著眼點越來越注重客戶資源的分析挖掘,寄希望匯總各業(yè)務(wù)分支的客戶數(shù)據(jù),經(jīng)過關(guān)聯(lián)、查重、清洗等多項具體流程,形成以客戶為中心的為廣告、經(jīng)營提供數(shù)據(jù)分析報表的數(shù)據(jù)倉庫,從而為精細化營銷和集團決策規(guī)劃提供數(shù)據(jù)支持。為此,有個別媒體甚至對外購買某領(lǐng)域互聯(lián)網(wǎng)站積累的客戶資源?;趦?nèi)容資源的大數(shù)據(jù)挖掘也有一些媒體在做,表現(xiàn)出來就是對內(nèi)容產(chǎn)品的歸檔、查詢、二次銷售,還是趨利性明確。反觀國外媒體在大數(shù)據(jù)挖掘方面,更多的對媒體內(nèi)容生產(chǎn)的幫助,而不是對客戶資源的定向推送。對于數(shù)據(jù)挖掘的重心,國外媒體行業(yè)更多是用于新聞事實的準確還原,新聞內(nèi)容的準確到位,新聞呈現(xiàn)方式的活潑親民。比如2011年倫敦騷亂發(fā)生后,《衛(wèi)報》的“解讀騷亂”數(shù)據(jù)團隊通過分析260萬條推特信息,制作騷亂發(fā)生地圖,幫助受眾更好地理解了事態(tài)的進展以及騷亂背后的原因,并因此做出了兩大現(xiàn)實貢獻:讓“騷亂與貧窮無關(guān)”的政治話語不攻自破;糾正了“社交媒體煽動騷亂”的錯誤言論。類似的數(shù)據(jù)挖掘不僅提升了媒體影響力,更為重要的是,體現(xiàn)了媒體的社會責任,呈現(xiàn)了媒體的社會良知。

四、媒體行業(yè)數(shù)字資源研究利用關(guān)鍵點

1、媒體行業(yè)大數(shù)據(jù)理解偏差急需糾正

很多媒體人根據(jù)定義認為,大數(shù)據(jù)是數(shù)據(jù)量大到超出傳統(tǒng)軟硬件處理的數(shù)據(jù)集,一般數(shù)據(jù)量在PB級別,而媒體行業(yè)數(shù)據(jù)偏小,特別是傳統(tǒng)平面媒體行業(yè),視音頻數(shù)據(jù)少,大多是數(shù)據(jù)庫、文圖數(shù)據(jù)。所以,雖然有很多媒體人在討論大數(shù)據(jù),但是在媒體行業(yè),特別是平面媒體行業(yè),相當多的人不認可大數(shù)據(jù)的存在。筆者認為,這種認識存在兩個偏差:

1) 大數(shù)據(jù)概念偏差

大數(shù)據(jù)不僅僅是指數(shù)據(jù)量大,關(guān)鍵是不同應(yīng)用、多個平臺的數(shù)據(jù)集,重點在于對該數(shù)據(jù)集的挖掘利用。通過匯總多方數(shù)據(jù),建立數(shù)據(jù)集,可以重新審視自身擁有的數(shù)據(jù)資源,突破單個應(yīng)用平臺的視野,打通數(shù)據(jù)壁壘,從高屋建瓴的角度重新認識數(shù)字資源的價值與意義。而這種價值與意義是單個應(yīng)用系統(tǒng)無法想象或者無法實現(xiàn)的。

2) 大數(shù)據(jù)范圍偏差

現(xiàn)在很多大型媒體行業(yè)都實行集團化戰(zhàn)略,走多元化發(fā)展,平面媒體、廣播媒體、電視媒體、網(wǎng)絡(luò)媒體、戶外媒體和移動媒體都有涉足。他們所擁有的數(shù)據(jù)種類多,分布廣,這些數(shù)據(jù)的直接擁有者單打獨斗,各自為陣,有些甚至相互競爭,拒絕共享。當然,這都是集團內(nèi)部管理體制問題,需要制度層面的改進完善,但是從技術(shù)層面考慮,這些數(shù)據(jù)都屬于一個大的集團或者公司,技術(shù)應(yīng)該做好準備,通盤考慮,把這些數(shù)據(jù)統(tǒng)統(tǒng)算起來加以利用。如果這樣考慮,媒體行業(yè)的數(shù)據(jù)量也是驚人的。

2、媒體行業(yè)數(shù)字資源研究利用四個目標

解放日報報業(yè)集團社長尹明華曾經(jīng)說過:如果數(shù)據(jù)被賦予背景,它就成了信息;如果數(shù)據(jù)能夠提煉出規(guī)律,它就是知識;如果數(shù)據(jù)能夠借助于各種各樣的工具在分析的基礎(chǔ)之上為我們提供正確的決策,它就是資源。這段話簡單表述了大數(shù)據(jù)研究利用的過程與目的。對于過程,更多是技術(shù)層面的實現(xiàn)手段;而對于目的,筆者認為,除了為領(lǐng)導層提供決策之外,媒體行業(yè)數(shù)字資源研究還應(yīng)該有另外三個目標:對外增值服務(wù);對內(nèi)業(yè)務(wù)支持;受眾平穩(wěn)遷移。

對外增值服務(wù)包括根據(jù)相關(guān)數(shù)據(jù)資源展開的票務(wù)服務(wù)、教育咨詢、就業(yè)中介、房屋中介、電子商務(wù)以及物流配送等便民服務(wù);短信營銷、精準投遞、電商營銷、DM、EDM等營銷擴展業(yè)務(wù)。對內(nèi)業(yè)務(wù)支持包括與其他各個接口業(yè)務(wù)系統(tǒng)的數(shù)據(jù)對接,意見回饋,比如客戶關(guān)系系統(tǒng)(CRM)中受眾對媒體發(fā)布內(nèi)容的意見建議,或者對于熱點選題等相關(guān)內(nèi)容推送到內(nèi)容制作系統(tǒng),為記者編輯下一步優(yōu)化內(nèi)容做出參考。對于受眾平穩(wěn)遷移的功能,傳統(tǒng)媒體最為期待,也最為擔憂。因為在媒體融合的今天,關(guān)于傳統(tǒng)媒體如何更具有粘性,如何吸引忠實用戶群體平穩(wěn)遷移到其他系列種類的媒體平臺,一直是每一個媒體從業(yè)者思考的問題?;诿襟w行業(yè)數(shù)字資源研究的大數(shù)據(jù)平臺建立了統(tǒng)一的用戶平臺,打通了傳統(tǒng)媒體、新媒體用戶之間的壁壘,數(shù)據(jù)共融,信息共享。這就為用戶的遷移、共享、擴容提供了可能。

3、媒體行業(yè)大數(shù)據(jù)挖掘應(yīng)該有試錯精神

有人說現(xiàn)在是信息化時代,也有人說是大數(shù)據(jù)時代,但是有一點肯定沒錯,現(xiàn)在是創(chuàng)新的時代。創(chuàng)新就要有試錯精神,創(chuàng)新就要允許失敗。大數(shù)據(jù)挖掘,同樣要有“勇于試錯”的創(chuàng)業(yè)環(huán)境。而這一點就需要領(lǐng)導層非比尋常的魄力和高瞻遠矚的眼光。2011年3月,《紐約時報》大膽開始自己的網(wǎng)絡(luò)付費時,大多數(shù)人都曾經(jīng)提出質(zhì)疑,認為《紐約時報》錯了,然而,2012年《紐約時報》卻實現(xiàn)了2.33億美元的發(fā)行收入,超過2.2億美元的廣告收入,實現(xiàn)了歷史上大型報紙第一次訂閱收入大于廣告收入,此時,誰又能說《紐約時報》錯了呢。當然,在創(chuàng)新過程中,真正走進死胡同的不乏人在,而且可能一敗涂地,但正是因為沒有人是先知,所以我們要創(chuàng)造“勇于試錯”的創(chuàng)新環(huán)境,要有試錯精神。

猜你喜歡
數(shù)據(jù)挖掘資源內(nèi)容
內(nèi)容回顧溫故知新
基礎(chǔ)教育資源展示
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費中的應(yīng)用淺析
一樣的資源,不一樣的收獲
資源回收
資源再生 歡迎訂閱
主要內(nèi)容
高級數(shù)據(jù)挖掘與應(yīng)用國際學術(shù)會議
高級數(shù)據(jù)挖掘與應(yīng)用國際學術(shù)會議
武穴市| 宁德市| 库伦旗| 五指山市| 如东县| 本溪市| 织金县| 鄱阳县| 景宁| 柞水县| 胶南市| 紫阳县| 仁寿县| 辛集市| 山东省| 曲水县| 拜城县| 邯郸市| 淮滨县| 衡南县| 贵州省| 海南省| 沅陵县| 赣州市| 吴川市| 南通市| 芦溪县| 额敏县| 武鸣县| 龙山县| 卢氏县| 铁岭县| 凌云县| 平潭县| 剑川县| 罗山县| 呈贡县| 阳曲县| 安乡县| 即墨市| 福泉市|