国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

傳媒數(shù)據(jù)庫建設與數(shù)字資產開發(fā)利用的思考
——以湖北日報傳媒集團為例

2019-11-18 23:31:33鄒漢青
新聞前哨 2019年12期
關鍵詞:數(shù)據(jù)庫資源內容

◎鄒漢青

大數(shù)據(jù)(Big Data)或稱巨量資料,是指涉及的數(shù)據(jù)資料規(guī)模巨大, 需要新型數(shù)據(jù)處理模式才能對其進行采集、存儲、加工和分析的海量、高增長、多樣化電子資訊集合。

數(shù)字資產(Digital Assets)是指企業(yè)或個人擁有或控制的,以電子數(shù)據(jù)形式存在,以備使用或出售的非貨幣資產。

本文討論的傳媒大數(shù)據(jù), 僅限于傳媒機構基于內容生產形成的文字、照片、音視頻等電子資料。

一、傳媒內容數(shù)字化建設的現(xiàn)狀

數(shù)據(jù)是基礎性戰(zhàn)略資源,是21 世紀的“鉆石礦”。 大數(shù)據(jù)的產生,得益于辦公自動化。 傳媒集團化和采編無紙化,為傳媒機構建立內容數(shù)據(jù)庫提供了條件。

(一)傳媒集團積累起巨量內容資源。 以黨報黨臺為主體的傳媒機構,因辦報辦臺歷史久(大多數(shù)傳媒機構辦報辦臺達70 年甚至更久),積累起規(guī)模龐大的圖文、音視頻等內容資源。 特別是上世紀90 年代以來,隨著都市類報刊(頻道)、網站等新生代媒體相繼興起,傳媒機構由單一黨報黨臺衍生出報、刊、網、屏、端、微、出版社等多媒體形態(tài),形成“1+N”式媒體集團,內容生產呈爆發(fā)式增長。 如湖北日報傳媒集團(以下簡稱“湖報集團”)高光時期擁有11 報、11 刊、5 網站,期發(fā)量過百萬媒體6 個,報刊期發(fā)量800 多萬份,日原創(chuàng)新聞信息漢字100 多萬個, 居全國內容生產第一方陣。 巨量的內容,為建立傳媒數(shù)據(jù)庫提供了豐富資源。

(二)傳媒數(shù)據(jù)庫建設初具雛形。 隨著上世紀末互聯(lián)網技術引入,無紙化采編出版系統(tǒng)在傳媒業(yè)得到普遍應用,使得大規(guī)模大原創(chuàng)性內容即時生產、在線存儲成為可能。 同時,各大傳媒集團相繼啟動內容資源庫建設,如湖報集團的電子稿庫存儲查詢系統(tǒng) (后升級為 “數(shù)字資產存儲管理系統(tǒng)”),將2001 年以來重點媒體刊發(fā)的文稿、圖片存儲于該系統(tǒng)。 據(jù)筆者統(tǒng)計,2001 年 7 月至 2016 年 1 月,存儲原創(chuàng)稿件達485 萬余篇、數(shù)十億漢字。

另一方面,隨著大數(shù)據(jù)時代到來,傳媒集團開始推進數(shù)字化檔案建設,運用OCR 等技術,將各種紙質、膠片、聲像等傳統(tǒng)介質的歷史內容轉化為數(shù)字信息。 如湖報集團將湖北日報1949 年7 月創(chuàng)刊以來所有文章、版面、圖片、圖表、廣告等內容電子化, 獲得10 多萬個數(shù)字版面、10 億多漢字、近20 萬張照片、100 多萬篇各類稿件, 形成時間跨70年、涵蓋政治經濟文化社會等各方面的歷史數(shù)據(jù)。

傳媒機構數(shù)據(jù)資源具備規(guī)模大 (Volume)、內容多樣(Variety)、時效高(Velocity)、真實準確(Veracity)、高價值(Value)“5V”特點,為數(shù)據(jù)資源開發(fā)奠定了基礎。

二、傳媒大數(shù)據(jù)資源開發(fā)利用狀況

2013 年是我國大數(shù)據(jù)建設 “元年”。 2014、2015 年,以BAT 為代表的商業(yè)互聯(lián)網公司,陸續(xù)推出各自大數(shù)據(jù)產品。2015 年,國務院出臺《促進大數(shù)據(jù)發(fā)展行動綱要》,大數(shù)據(jù)成為國家戰(zhàn)略。

近年來,各大傳媒機構紛紛啟動媒體大數(shù)據(jù)平臺建設,南方報業(yè)、浙報傳媒等地方傳媒集團2013 年前后開始籌建大數(shù)據(jù)中心,湖報集團荊楚網2014 年成立輿情中心(研究院),利用互聯(lián)網平臺監(jiān)測網絡輿情,開發(fā)《網絡新輿情》產品,為黨政機關提供輿情專報等個性化服務,目前年營收上千萬元,但利用的主要是網絡公共信息而非傳媒數(shù)據(jù)資源。

總體上看,傳媒數(shù)據(jù)資源開發(fā)利用率較低,可資借鑒的成功范例尚不多,未能充分分享大數(shù)據(jù)的紅利,特別是未能將積累的傳媒特色數(shù)據(jù)資源轉化為特色商品。

以湖報集團內容生產重點產品之一的圖片資源為例,集團檔案科采集整理存儲的電子照片近9 萬張, 其中不少屬“孤品”級珍稀史料照片,但主要作為資料留存,極少且被動地向社會提供圖片商業(yè)服務,年服務收入僅幾十萬元。與之相對照的是, 國內三大民營圖片供應商視覺中國、全景網、東方IC,圖片生意做得風生水起。 視覺中國財報顯示,2019 上半年核心主業(yè) “視覺內容與服務” 營收3.94 億元。2018 年,北京字節(jié)跳動公司投資買下東方IC 圖庫,顯示資本看好商用圖片市場前景。

三、制約傳媒數(shù)據(jù)資源開發(fā)利用的原因

傳媒機構內容資源庫,大多只能算是數(shù)據(jù)庫的雛形,離真正意義上的數(shù)據(jù)庫還有較大差距。 傳媒數(shù)據(jù)資源開發(fā)利用率低,既有體制機制原因,也有觀念意識問題,還有技術資金等客觀因素。 概括起來,主要有以下幾方面:

(一)對傳媒數(shù)據(jù)資源價值認識不夠。 盡管各傳媒機構對追逐大數(shù)據(jù)“風口”意愿強烈,也作了一些探索嘗試,如很多媒體都在利用網絡平臺開展輿情業(yè)務, 但目光瞄多向外部“紅海”市場,反而忽視了傳媒內容數(shù)據(jù)這片“藍?!?,創(chuàng)辦的一些網絡科技公司經營艱難, 對自己原創(chuàng)內容被商業(yè)互聯(lián)網平臺無償轉載辦法不多。

很多傳媒機構很早啟動電子圖文、電子檔案庫建設,積累了巨量傳媒數(shù)據(jù),但基于存檔自用的初級目標,極少考慮增值開發(fā)問題,對傳媒數(shù)據(jù)庫建設缺乏深入研究、頂層設計和系統(tǒng)規(guī)劃,導致資源采集存儲不及時不全面。如檔案照片收集僅限于已刊用部分, 大量未刊用的照片沉積在攝影記者電腦或硬盤里,甚至被當作無價值資料清除;部分子報子刊和網端微內容未納入采集范圍。同時,現(xiàn)有數(shù)據(jù)的后續(xù)加工不夠,格式、標引不規(guī)范統(tǒng)一。

(二)管理體制機制制約。 一是身份“二重性”制約資源開發(fā)利用。以黨報黨臺為主體的傳媒機構,身份是地方黨委直屬事業(yè)單位,盡管后來組建傳媒集團成為企業(yè),但數(shù)字檔案仍參照機關檔案管理,處于不開放或半封閉狀態(tài),成為市場化開發(fā)的障礙。 二是服務市場意愿不強。 檔案管理,保管是基礎,開發(fā)利用才是目的。 但檔案室、資料室作為事業(yè)單元,收費服務須經主管部門批準,“收費無據(jù)”影響開發(fā)用戶市場的動力,造成數(shù)字檔案管理上存在重保管輕利用、壟斷獨占意識,內容檔案數(shù)字化成了“搬進電腦的傳統(tǒng)檔案”。

(三)數(shù)字資產意識不強。 傳媒機構的“數(shù)字資產”意識還較欠缺,沒有認識到傳媒特色數(shù)據(jù)資源的價值,盡管傳統(tǒng)媒介經濟受市場沖擊巨大,受思維定式影響,仍習慣于主要圍繞報道、廣告版面做文章,甚至投入大量人財物投資傳媒主業(yè)無關聯(lián)的領域。 有的傳媒機構雖引入了“數(shù)字資產”概念,但極少研究謀劃如何盤活數(shù)字資產,沒有將“數(shù)字資產”納入資產運營。

(四)資金技術人才等制約。 大數(shù)據(jù)平臺主要由技術驅動,從數(shù)據(jù)采集、存儲到平臺運營、數(shù)據(jù)開發(fā),需要爬蟲、交互、開源、算法等技術支撐,技術開發(fā)投入較大,資金籌措難。檔案、資料室作為傳媒機構二線部門,資金投入少,軟硬件建設滯后,人員結構老化,新技術應用能力不足。 互聯(lián)網思維欠缺, 只注重自我生產內容的采集, 對各媒體平臺讀者、用戶、客戶等信息的采集存儲未引起重視。

四、開發(fā)利用傳媒大數(shù)據(jù)的途徑

傳媒大數(shù)據(jù)是記錄歷史的文獻性數(shù)據(jù), 深度開發(fā)傳媒數(shù)據(jù)資源,對內可服務精細化管理,對外可服務史志圖書編著、宣傳推廣、咨詢智庫等,實現(xiàn)內容資源二次變現(xiàn)。

(一)機器人寫新聞。從2016 年新聞機器人首次露臉奧運會,到2018 年世界杯機器人“小封”秒發(fā)新聞,再到今年全國兩會央視AI 合成主播上崗……傳媒業(yè)已進入智媒時代。 在發(fā)稿上爭分搶秒的新媒體,新聞機器人更以精準、秒發(fā)等優(yōu)勢成為發(fā)展方向。而機器人寫稿的核心,是利用大數(shù)據(jù)對信息進行分析計算。

(二)智慧校對。文稿校對是一件繁瑣復雜、工作量大且易出錯的工作,因此傳媒業(yè)素有“無錯不成報”之說。差錯既有一般文字差錯,也有重要人名、地名、統(tǒng)計數(shù)據(jù)等事實性差錯,輕則影響報道公信力,重則引起重大責任事故,如前不久某視頻平臺關于山東臺風災害的報道差錯就引起軒然大波。利用人工智能技術與傳媒數(shù)據(jù)庫信息進行比對,可自動快速勘錯,提高校對效率、防堵差錯發(fā)生。

(三)服務精細管理精準營銷。如基于紙媒發(fā)行、網媒點擊閱讀數(shù)據(jù),建立包含讀者閱讀喜好、職業(yè)、消費信息等的用戶數(shù)據(jù)庫,為報道稿件取舍、欄目設置、廣告投放等提供決策依據(jù),通過算法技術等,向讀者精準推送閱讀內容,更好滿足用戶需求,提高用戶粘性。

(四)分析預測參謀智庫。 傳媒數(shù)據(jù)庫存儲了各個時期經濟社會文化等各方面權威統(tǒng)計數(shù)字。利用大數(shù)據(jù)、云計算等技術,對各時間跨度的歷史數(shù)據(jù)進行統(tǒng)計分析、繪圖制表等處理,分析行業(yè)趨勢、拐點等,既可為報道提供選題和論據(jù)支撐,也可為行業(yè)、企業(yè)提供咨詢服務。

(五)服務編史修志圖書出版。歷史長河浩如煙海,媒體忠實記錄歷史。 傳媒大數(shù)據(jù)是電子文獻史料庫,可為編志修史著書提供考證史料和各個歷史時期的圖片。 如湖報集團檔案科除為黨委政府等提供政治服務外,一些單位編修方志圖書、制作宣傳畫冊展板等時,也向檔案科索取圖文資料。

(六)數(shù)據(jù)包租憑轉讓。傳媒大數(shù)據(jù)具有反復使用、用之不遏的特點,根據(jù)旅游、金融、交通等特定用戶的不同需要,抽取專項信息數(shù)據(jù)打包,通過租賃、轉讓等獲得收益。

(七)圖文及音視頻商業(yè)供應。建立文稿跟蹤追索系統(tǒng),向轉載文稿的商業(yè)平臺收取版權費; 傳媒平臺擁有最大的圖片音視頻生產專業(yè)隊伍,建立激勵機制,激勵創(chuàng)作提供更多高質量影像作品,發(fā)揮媒體平臺優(yōu)勢,網絡一批攝影攝像行家,打造圖片音視頻資源供應商、分發(fā)商。 在內容創(chuàng)業(yè)時代,微博、微信、網站等商業(yè)自媒體群體龐大,對圖文、音視頻需求巨大。據(jù)“西瓜數(shù)據(jù)”平臺報告,該平臺收錄的微信公眾號達500 多萬個,2019 年仍在更新的175 萬個。

隨著技術進步,傳媒大數(shù)據(jù)開發(fā)利用范圍將更廣泛,前提是在充分論證的基礎上科學規(guī)劃、整合資源,建立標準化數(shù)據(jù)庫。通過事企分離改革,將數(shù)據(jù)資源開發(fā)從事業(yè)單元剝離,破除市場服務的體制障礙;爭取國家鼓勵產業(yè)的項目扶持資金,或通過合資、合伙、合作等途徑,解決資金、技術等難題。在開發(fā)利用上,根據(jù)現(xiàn)有條件分步實施、先易后難,優(yōu)先開發(fā)圖文、音視頻、文獻資料等市場服務。

猜你喜歡
數(shù)據(jù)庫資源內容
內容回顧溫故知新
科學大眾(2022年11期)2022-06-21 09:20:52
基礎教育資源展示
一樣的資源,不一樣的收獲
資源回收
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
數(shù)據(jù)庫
財經(2017年2期)2017-03-10 14:35:35
主要內容
臺聲(2016年2期)2016-09-16 01:06:53
數(shù)據(jù)庫
財經(2016年15期)2016-06-03 07:38:02
數(shù)據(jù)庫
財經(2016年3期)2016-03-07 07:44:46
數(shù)據(jù)庫
財經(2016年6期)2016-02-24 07:41:51
平江县| 孟连| 册亨县| 达州市| 伊通| 彰武县| 伽师县| 兴海县| 石泉县| 罗源县| 苏尼特右旗| 武宁县| 永寿县| 淄博市| 靖边县| 星座| 东明县| 稻城县| 巴林右旗| 开江县| 钦州市| 镇坪县| 巴塘县| 永昌县| 五莲县| 黔西县| 丰都县| 利津县| 新巴尔虎右旗| 霍山县| 吕梁市| 岫岩| 宣汉县| 南皮县| 耒阳市| 天津市| 芜湖市| 马龙县| 麻栗坡县| 翼城县| 浮山县|