唐 錚,李開宇
(1.中國(guó)人民大學(xué) 新聞學(xué)院,北京100872;2.清華大學(xué) 計(jì)算機(jī)系,北京100091)
媒體融合帶來了新聞內(nèi)容生產(chǎn)的組織機(jī)制重構(gòu),將新聞生產(chǎn)者大量轉(zhuǎn)化為全媒體生產(chǎn)者,由此促進(jìn)了新聞生產(chǎn)力的提升。而隨著融合背景下的媒體日漸增加且內(nèi)容產(chǎn)品日益豐富,如何對(duì)新機(jī)構(gòu)下的新內(nèi)容產(chǎn)品進(jìn)行效能評(píng)估便成為擺在眼前的迫切問題。既有的媒體效能評(píng)估大多基于單一媒介類型的單一新聞產(chǎn)品,并長(zhǎng)期處在隨機(jī)性和任意性較強(qiáng)的狀態(tài)下,難以適應(yīng)媒體融合下內(nèi)容生產(chǎn)力改造后的實(shí)際需求。本研究力求從大數(shù)據(jù)角度出發(fā),基于媒體運(yùn)行的真實(shí)數(shù)據(jù),將新聞從生產(chǎn)者的特性進(jìn)行量化建模,從“人力—產(chǎn)出”的角度為這一實(shí)際困境提出或可實(shí)踐的解決方案。
融合格局下,傳統(tǒng)媒體在宣傳理念、新聞生產(chǎn)模式、傳播技術(shù)、載體更新等各方面實(shí)施組織重構(gòu)和業(yè)務(wù)再造。在這一過程中,新聞工作者逐漸告別新聞常規(guī),即日常完成新聞工作的一系列模式化的、常規(guī)的、重復(fù)的實(shí)踐和形式(1)Shoemaker,P.J.,Reese,S.D. ,“Mediating the message”.London:White Plains Longman.1996,p105.,新聞生產(chǎn)也隨之進(jìn)入“一次采集、多次生成”的融合生產(chǎn)模式。
融合型記者成為大勢(shì)所趨,單個(gè)新聞工作者常常肩負(fù)著同時(shí)生產(chǎn)不同體裁、不同形式新聞作品的任務(wù)。在這一過程中,有新聞工作者成長(zhǎng)為全媒體生產(chǎn)者的自我提升,也有組織調(diào)整例如搭建“中央廚房”的結(jié)構(gòu)性助力。以上融合機(jī)制重構(gòu)均以媒體能夠持續(xù)地產(chǎn)出高質(zhì)量、跨媒體形態(tài)的融合性內(nèi)容產(chǎn)品為目標(biāo)。隨著內(nèi)容生產(chǎn)者的素質(zhì)提升、內(nèi)容生產(chǎn)平臺(tái)的科學(xué)化以及一些更為先進(jìn)的內(nèi)容管理系統(tǒng)的引入,新聞生產(chǎn)的單位時(shí)間越來越短。尼格倫(Nygren)在2009 年的調(diào)查表明,傳統(tǒng)媒體的記者一天可以制作2 到3 條新聞,但在網(wǎng)絡(luò)媒體工作的記者效率最高的可以達(dá)到一天5 到10 條(2)Preston.P,“Making the news:Journalism and news cultures in Europe”,New York:Routledge,2009,p.66.。
新聞內(nèi)容作為高流動(dòng)性的信息綜合體,其生產(chǎn)過程高度機(jī)動(dòng)而不可控,在生產(chǎn)中需要包含結(jié)構(gòu)化的經(jīng)驗(yàn),獨(dú)到見解,對(duì)經(jīng)驗(yàn)的反思以及有價(jià)值的、整合的相關(guān)信息(3)Davenport,T.H.,Prusak,L.“Working knowledge:How org-anization manage what they know”,Boston:Harvard Bus-iness School Press,1998,p.108.,完成創(chuàng)造性工作是新聞從業(yè)者的核心價(jià)值所在。正因其顯著的創(chuàng)造性、靈活性和機(jī)動(dòng)性,此前包括媒體在內(nèi)的內(nèi)容生產(chǎn)機(jī)構(gòu)一直無法針對(duì)新聞內(nèi)容生產(chǎn)設(shè)立精準(zhǔn)的效能評(píng)估方法。傳統(tǒng)媒體的內(nèi)容生產(chǎn)機(jī)制和考核標(biāo)準(zhǔn),是以專業(yè)機(jī)構(gòu)持續(xù)穩(wěn)定地生產(chǎn)單一屬性的新聞產(chǎn)品為前提,內(nèi)核是沿用“信息收集—把關(guān)人篩選—分發(fā)”的機(jī)制模式,效能衡量體系也相應(yīng)地為原有載體服務(wù),采用工作量統(tǒng)計(jì)和打分評(píng)估等手段,對(duì)于新聞生產(chǎn)者進(jìn)行評(píng)價(jià)。
目前媒體使用較為廣泛的新聞生產(chǎn)效能評(píng)估方式主要有以下幾種:(:(1)完全按量評(píng)價(jià);(;(2)完全按質(zhì)評(píng)價(jià);(;(3)質(zhì)、量結(jié)合評(píng)價(jià)。這三種主流衡量方式分別對(duì)應(yīng)知識(shí)組織效能評(píng)估的三種主流視角,即行為視角、效果視角和能力視角。
行為視角下的效能被定義為“一套與組織或個(gè)體所工作的組織單位的目標(biāo)相關(guān)的行為”(4)Murphy G.“Human Resource Management”,NewYork:Internantional Journal of Project Management,1993,pp.3-12.。在行為論視角下,行為被視為效能的最核心體現(xiàn)。使用這種方式的媒體效能評(píng)估單純以新聞發(fā)布數(shù)量(條數(shù)、字?jǐn)?shù)、時(shí)長(zhǎng)等)為衡量指標(biāo)。
基于效果視角,特別是以實(shí)踐為導(dǎo)向的效能評(píng)價(jià)體系中,大多將績(jī)效理解為結(jié)果。BerMrdin 將績(jī)效定義為“在特定的時(shí)間內(nèi),由特定的工作職能或活動(dòng)產(chǎn)生的產(chǎn)出紀(jì)錄,工作績(jī)效的總和相當(dāng)于關(guān)鍵和必要工作職能中績(jī)效的總和(或平均值)”(5)理查德·威廉姆斯:《業(yè)績(jī)管理》,趙政斌譯,大連:東北財(cái)經(jīng)大學(xué)出版社,1999 年版,第81 頁(yè)。。使用這種方式的媒體效能評(píng)估單純以新聞發(fā)布質(zhì)量(版面位置、時(shí)段、社會(huì)評(píng)價(jià))為衡量指標(biāo)。
而McBer 咨詢公司和Spencer 倡導(dǎo)從能力角度衡量效能,認(rèn)為基于能力的判斷是“向前看”的績(jī)效管理方式(6)French W.“Human resource management”.Boston:Hongton Miffin Company.1990,Chapter20.,這一觀點(diǎn)將效能進(jìn)行了更為立體化的解構(gòu),將其對(duì)應(yīng)為與組織戰(zhàn)略目標(biāo)、用戶滿意感及投資相關(guān)的過程與結(jié)果的綜合體。使用這種方式的媒體效能評(píng)估既計(jì)算新聞產(chǎn)品的發(fā)布數(shù)量,同時(shí)通過打分、定級(jí)等方式界定質(zhì)量,再計(jì)算綜合指標(biāo)得到最終結(jié)果。
然而,以上三種方式在媒體融合背景下都出現(xiàn)了障礙,無法有效地界定內(nèi)容生產(chǎn)的效能。“效果視角”注重衡量目標(biāo)與結(jié)果,但融媒體新聞生產(chǎn)工作是創(chuàng)造性的、獨(dú)特的、機(jī)動(dòng)的,幾乎不可能在內(nèi)容生產(chǎn)前就清晰明確地做出結(jié)果定義。目標(biāo)只能是在進(jìn)行中不斷調(diào)整、修正和明確。因而,僅僅以效果為導(dǎo)向有明顯的不足之處?!靶袨橐暯恰卑研侣勆a(chǎn)者的作品數(shù)量作為重點(diǎn)衡量目標(biāo),這與新聞生產(chǎn)者的熟練程度、努力程度和資源駕馭能力直接相關(guān),但完成創(chuàng)造性工作是新聞從業(yè)者的核心價(jià)值所在,單純以數(shù)量定江山,是對(duì)新聞生產(chǎn)的簡(jiǎn)單化和庸俗化。而在新聞生產(chǎn)中,生產(chǎn)者的能力、潛力往往難以從其工作的過程或工作表現(xiàn)中體現(xiàn)出來,特別是在媒體融合時(shí)代,“中央廚房”式的集約化社會(huì)化生產(chǎn)日成主流,一則新聞產(chǎn)品往往由整個(gè)團(tuán)隊(duì)甚至由外部支援來支撐,所以“能力視角”也難以完成對(duì)新聞內(nèi)容生產(chǎn)效能的準(zhǔn)確評(píng)估。
以上分析證明,目前傳統(tǒng)媒體內(nèi)部在融合背景下尚未形成一種有效的績(jī)效評(píng)價(jià)管理機(jī)制,難以配合媒體深度融合轉(zhuǎn)型發(fā)展戰(zhàn)略目標(biāo)的實(shí)現(xiàn)。
大數(shù)據(jù)技術(shù)的完善和媒體融合的不斷推進(jìn),給效能評(píng)估的進(jìn)一步量化提供了可能。移動(dòng)媒體時(shí)代,新聞信息從生產(chǎn)、發(fā)布、反饋等各環(huán)節(jié)的效果都是可定量化分析的。根據(jù)后臺(tái)數(shù)據(jù),媒體不但可以監(jiān)測(cè)到新聞內(nèi)容的點(diǎn)擊率、瀏覽量、轉(zhuǎn)載率、評(píng)論情況、情感極性(7)Alexandra Balahur, Hristo Tanev:“Detecting Event-Related Links and Sentiments from Social Media Texts”,Sofia, Bulgaria: ACL (Conference System Demonstrations)2013:pp.25-30.,從而了解讀者閱讀偏好,把握?qǐng)?bào)道節(jié)奏,策劃報(bào)道內(nèi)容,也能夠?qū)⒋髷?shù)據(jù)應(yīng)用于媒介組織架構(gòu)和效能評(píng)估,使得新聞生產(chǎn)者和媒體組織之間通過更科學(xué)的評(píng)價(jià)體系,建立互信、支持和協(xié)作的“雙向依賴”關(guān)系。
建立科學(xué)而全面的效能評(píng)估體系是一個(gè)長(zhǎng)期而綜合的過程,需要大量數(shù)據(jù)支撐。本研究旨在使用定量方式,基于媒體真實(shí)運(yùn)行數(shù)據(jù)的推演,將上海某媒體的真實(shí)內(nèi)容生產(chǎn)及人力運(yùn)轉(zhuǎn)數(shù)據(jù)用于構(gòu)建模型,將真實(shí)數(shù)據(jù)代入模型進(jìn)行“空轉(zhuǎn)”,這一設(shè)計(jì)參考了我國(guó)在重慶、上海進(jìn)行的“房地產(chǎn)稅空轉(zhuǎn)”體系實(shí)踐,以及借鑒了人民日?qǐng)?bào)“中央廚房”從無到有的機(jī)制搭建經(jīng)驗(yàn)。把真實(shí)的數(shù)據(jù)帶入到仿真體系中加以驗(yàn)證,能夠從一定程度上看到效能模型在媒體現(xiàn)有體系下運(yùn)行時(shí)的真實(shí)狀況,進(jìn)而提出媒介融合背景下媒體調(diào)整和改進(jìn)效能評(píng)估機(jī)制的新模式。
基于既往數(shù)據(jù)的相對(duì)缺乏和內(nèi)容生產(chǎn)的機(jī)動(dòng)性,構(gòu)建這個(gè)初級(jí)模型時(shí)暫且排除了其他更為復(fù)雜的變量,而只是以“人力—產(chǎn)出”的邏輯來推導(dǎo)內(nèi)容生產(chǎn)的效能最優(yōu)。
這一模型基于下述邏輯:如果將新聞生產(chǎn)視為人的創(chuàng)意性生產(chǎn),那么,新聞產(chǎn)出與人力(包括時(shí)間、精力、創(chuàng)意性生產(chǎn)的工作狀態(tài)等)直接相關(guān),而這種相關(guān)性可以用具體的具有可解釋性的模型來描述。同時(shí),假設(shè)新聞生產(chǎn)的數(shù)量在非重大影響(例如重大自然災(zāi)害、重大突發(fā)新聞等)的情況下,在一定程度上是存在周期性的。也就是說,持續(xù)增加的工作時(shí)間并不能使得新聞產(chǎn)量無限量擴(kuò)張,新聞產(chǎn)量在受到人力限制的同時(shí)還會(huì)受到新聞資源的限制。另外,新聞工作者一旦不眠不休地進(jìn)行新聞生產(chǎn)的話,會(huì)因?yàn)閯?chuàng)造力下降而影響新聞的產(chǎn)量。因此對(duì)于實(shí)際新聞生產(chǎn)而言,通過建立模型來找到關(guān)鍵性節(jié)點(diǎn),以便確定生產(chǎn)效能,是有意義的。
因而,模型以真實(shí)新聞生產(chǎn)量為基礎(chǔ)參考值,以生產(chǎn)周期為變量,可以得出現(xiàn)階段新聞內(nèi)容生產(chǎn)力下的呈理想化狀態(tài)的新聞產(chǎn)量。進(jìn)而在工作人數(shù)不變的前提下,可以獲知實(shí)際新聞生產(chǎn)量和理想化產(chǎn)量之間的邏輯關(guān)系,由此為制定科學(xué)的新聞效能產(chǎn)出提供依據(jù)。
于2014 年提速建設(shè)的媒體融合改革為研究提供了可靠的數(shù)據(jù)源。自2014 年媒體融合全面提速以來,新聞生產(chǎn)的硬件配置及軟件配備全面升級(jí),全面的數(shù)字化和線上化成為各個(gè)媒體在融合時(shí)的必要項(xiàng)。本研究所采集的數(shù)據(jù),便源自上海某媒體近年來的相關(guān)真實(shí)數(shù)據(jù):
1.使用線上簽到工具,統(tǒng)計(jì)記者的日均工時(shí)和年均工作日。這部分?jǐn)?shù)據(jù)能夠提供該媒體從事新聞生產(chǎn)的人員的準(zhǔn)確數(shù)量,并提供他們的工作時(shí)長(zhǎng)。
2.使用多媒體處理系統(tǒng),統(tǒng)計(jì)新聞產(chǎn)品的生產(chǎn)周期。這部分?jǐn)?shù)據(jù)來自于媒體的數(shù)字化處理系統(tǒng)。按照媒體的要求,所有內(nèi)容產(chǎn)品都要在該媒體的多媒體數(shù)字化處理系統(tǒng)上上傳并簽發(fā),通過“大花臉”功能記錄全部流程。由此可以記錄新聞作品從入庫(kù)提交、修改、簽發(fā)的全過程中每個(gè)節(jié)點(diǎn)的時(shí)間,從而得知新聞作品的生產(chǎn)時(shí)長(zhǎng)。
3.該媒體2017 年8 月3 日至2019 年12 月31 日的每月新聞生產(chǎn)量。這部分?jǐn)?shù)據(jù)來自于數(shù)字化處理系統(tǒng)的后臺(tái)統(tǒng)計(jì)功能。根據(jù)這一功能,能夠準(zhǔn)確列出該媒體在此期間的每日新聞生產(chǎn)量,并根據(jù)需求進(jìn)行相應(yīng)的分類和歸并。
根據(jù)該媒體的大數(shù)據(jù)記錄進(jìn)行清洗和梳理后,得出的數(shù)據(jù)如下:
1.根據(jù)媒體稿件入庫(kù)記錄,獲得該媒體2017 年8 月3 日至2019 年12 月31 日共881 天的數(shù)據(jù)。
2.根據(jù)線上簽到工具上的數(shù)據(jù)記錄,該媒體共有新聞生產(chǎn)者126 人,平均工作時(shí)長(zhǎng)為9.7 小時(shí)(法定工作時(shí)長(zhǎng)8 小時(shí)),年平均工作日為304.3 天(2018 年法定工作日為252 天,2019 年法定工作日為250 天)。
3.根據(jù)多媒體處理系統(tǒng)上的數(shù)據(jù)記錄,2017 年8 月3 日至2019 年12 月31 日該媒體共計(jì)生產(chǎn)新聞作品40 673 件,分為文字稿件、圖片稿件和音視頻稿件三類,并得到這三類稿件在2017 年8 月至2019 年12月的每天的新聞產(chǎn)量。
4.通過新聞編輯文稿系統(tǒng)修改功能,能夠記錄每篇稿件的入庫(kù)、修改過程、簽發(fā)過程等每一步驟的時(shí)間。在媒體融合進(jìn)程中,多數(shù)媒體已經(jīng)實(shí)現(xiàn)了這一功能的實(shí)現(xiàn)及運(yùn)用。這一功能被媒體俗稱“大花臉”功能,可以被用來界定每篇新聞的生產(chǎn)周期長(zhǎng)度。根據(jù)“大花臉”功能,對(duì)以上三類新聞的生產(chǎn)周期進(jìn)行統(tǒng)計(jì),取平均數(shù)±5%的區(qū)間,得到如下結(jié)果:文字稿件的生產(chǎn)周期為4.9~25.7 小時(shí),圖片稿件的生產(chǎn)周期為2.4~4.5小時(shí),音視頻稿件的生產(chǎn)周期為14.3~48.9 小時(shí)。
繼而,基于數(shù)據(jù)清洗技術(shù)(8)Xu Chu, Ihab F. Ilyas, Sanjay Krishnan, Jiannan Wang:“Data Cleaning: Overview and Emerging Challenges”, San Francisco:SIGMOD Confer?ence ,2016,pp.2201-2206.對(duì)數(shù)據(jù)的空值與非法值進(jìn)行了清洗與修正,使得數(shù)據(jù)的取值在合理的范圍內(nèi),之后在底層使用MongoDB 作為基本的數(shù)據(jù)管理引擎。
建模過程中引入人工智能領(lǐng)域的前沿技術(shù)——神經(jīng)網(wǎng)絡(luò)技術(shù),從既有的數(shù)據(jù)當(dāng)中通過機(jī)器學(xué)習(xí)算法,得出規(guī)律,繼而通過數(shù)學(xué)模型來描述人力與產(chǎn)出之間的關(guān)系。神經(jīng)網(wǎng)絡(luò)技術(shù)模擬人腦的神經(jīng)元結(jié)構(gòu),通過構(gòu)造多層次的網(wǎng)絡(luò)結(jié)構(gòu),來表征數(shù)據(jù)特征(輸入)與因變量(輸出)之間的關(guān)系(9)Lecun Y,Bengio Y,Hinton G,“Deep Learning”,No.521(7553),Nature,2015,p.436.。
舉例來講,如果想要知道一處房產(chǎn)的屬性與房?jī)r(jià)之間的關(guān)系,可以將屬性X(建筑面積、使用面積、城市、地段、樓層、朝向和是否有電梯等)作為自變量,而將房屋的價(jià)格Y 作為因變量。假設(shè)因變量和自變量之間存在某種關(guān)系滿足Y=f(X),當(dāng)今后給定一個(gè)新的房屋的基本屬性值時(shí),便可以預(yù)測(cè)該房屋的房?jī)r(jià)。機(jī)器學(xué)習(xí)中的回歸問題(10)Ripley,Brian D,“Pattern Recognition and Neural Networks”.Cambridge:Cambridge University Pess,2009,pp.97-118.,也就是如何在給定一部分真實(shí)數(shù)據(jù)情況下(同時(shí)包含因變量與自變量),去尋找一個(gè)最可能真實(shí)的模型f。而深度學(xué)習(xí)理論假設(shè)函數(shù)f是由一個(gè)網(wǎng)狀的神經(jīng)元結(jié)構(gòu)組成的,以自變量作為第0層,網(wǎng)狀結(jié)構(gòu)的每一層會(huì)對(duì)上一層的輸入進(jìn)行一次非線性的變換,從而計(jì)算出最終的結(jié)果。
本文將基于以上理論和數(shù)據(jù),尋找合適的自變量表達(dá)方式,去對(duì)媒體內(nèi)容生產(chǎn)者工時(shí)投入進(jìn)行量化。同時(shí)尋找合適的網(wǎng)絡(luò)模型參數(shù),通過機(jī)器學(xué)習(xí)算法確定一個(gè)最為合理的模型,從而建模出生產(chǎn)者工時(shí)與產(chǎn)出模型,用于完成媒體產(chǎn)出效益最優(yōu)化的預(yù)測(cè)。
本節(jié)著重研究這樣一個(gè)問題“給定一個(gè)媒體生產(chǎn)組織(例如,某上海媒體),已知其過往的具體工時(shí)X與真實(shí)產(chǎn)出數(shù)據(jù)Y,如何尋找模型f,可以近似描述工時(shí)與產(chǎn)出的關(guān)系,即“Y≈f(x)”。
模型的雛形出于最樸素的邏輯“人力—產(chǎn)出”,也就是說,無論媒體形態(tài)和最終產(chǎn)品發(fā)生了什么變化,現(xiàn)階段的新聞內(nèi)容生產(chǎn)仍然基本全部依靠于人力,因此“新聞工作者的數(shù)量和產(chǎn)能——新聞內(nèi)容產(chǎn)品”之間存在緊密的正相關(guān)性。而后一層層對(duì)問題進(jìn)行具象化,不斷在機(jī)器學(xué)習(xí)的過程中加入各種參數(shù)和影響因素,最終得到可解釋性較高的“新聞發(fā)稿量預(yù)測(cè)模型”。
首先,建模中考慮一種簡(jiǎn)單的映射關(guān)系,假設(shè)共有n個(gè)生產(chǎn)者(實(shí)際數(shù)據(jù)為126),定義每天的工作時(shí)長(zhǎng)為X(小時(shí))=[X1,X2......Xn],其中Xi表示第i個(gè)生產(chǎn)者本日的工作時(shí)長(zhǎng)。相應(yīng)的總產(chǎn)量為Y=[Y1,Y2,Y3],Y1,Y2,Y3分別表示文字稿件,圖片稿件和視頻稿件的產(chǎn)出。如果兩者之間存在簡(jiǎn)單的映射關(guān)系,則可以表示為簡(jiǎn)單的Y=f(X),即給定X即可通過其映射關(guān)系找到Y(jié)。
其中的函數(shù)f可以使用多種方式來表達(dá),其中最簡(jiǎn)潔的形式是使用線性模型進(jìn)行回歸分析,擬合出X與Y的關(guān)系。本模型使用更復(fù)雜的方式,即深度神經(jīng)網(wǎng)絡(luò),給予足夠多的網(wǎng)絡(luò)層數(shù),通過調(diào)參技巧學(xué)習(xí)出精確的模型參數(shù)。
在使用數(shù)據(jù)集訓(xùn)練模型之前,需要先將整個(gè)數(shù)據(jù)集分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。訓(xùn)練集是用來訓(xùn)練模型的,通過嘗試不同的方法和思路使用訓(xùn)練集來訓(xùn)練不同的模型,再通過驗(yàn)證集使用交叉驗(yàn)證來挑選最優(yōu)的模型,再通過不斷地迭代,來改善模型在驗(yàn)證集上的性能,最后再通過測(cè)試集來評(píng)估模型的性能。數(shù)據(jù)集劃分得越好,模型的應(yīng)用部署就越強(qiáng),但如果劃分不好,則會(huì)大大影響模型的應(yīng)用部署。在建模時(shí),基于交叉驗(yàn)證的準(zhǔn)則(11)周志華:《機(jī)器學(xué)習(xí)》.北京:清華大學(xué)出版社2016 年版,第210-219 頁(yè)。將881 條數(shù)據(jù)進(jìn)行切分,其中500 條用于訓(xùn)練,100 條用作驗(yàn)證集,其余281 條用于下一節(jié)進(jìn)行最優(yōu)產(chǎn)出模型擬合。在這一過程中,使用損失函數(shù)來描述模型的精準(zhǔn)程度,即真實(shí)數(shù)據(jù)與預(yù)測(cè)值之間的誤差。
理論上來講,隨著模型訓(xùn)練的過程,參數(shù)將會(huì)越來越精準(zhǔn),相應(yīng)的損失(LOSS)應(yīng)該越來越小,然而,當(dāng)下展示出的學(xué)習(xí)過程并沒有明顯使LOSS 變小,而當(dāng)模型逐漸變得復(fù)雜,層數(shù)增多時(shí),損失函數(shù)漸漸出現(xiàn)明顯變化。這說明模型選擇并不合理。應(yīng)該進(jìn)一步思考加入更為合理的系數(shù),發(fā)掘更合理的模型。
結(jié)合實(shí)際情況則能夠發(fā)現(xiàn):一個(gè)部門的實(shí)際工作產(chǎn)出不應(yīng)該只取決于新聞工作者的工作時(shí)間,還應(yīng)當(dāng)取決于當(dāng)前這一天的具體時(shí)間屬性。例如,這一天是周一還是周五對(duì)于新聞工作者來講是不同的,不僅他們的工作熱情不同,實(shí)際生活中,可供加工的新聞素材也可能不同。其次,要看這一個(gè)工作日是否是假日,是否是重大節(jié)日,這些信息都應(yīng)當(dāng)被編碼在輸入項(xiàng)X當(dāng)中,因?yàn)槭欠袷羌偃眨瑐€(gè)人工作熱情應(yīng)當(dāng)不同,是否是節(jié)日,可能產(chǎn)生的新聞數(shù)量與話題度就不同,例如,重大的節(jié)日一般會(huì)有許多活動(dòng)和紀(jì)念儀式可供報(bào)道。其次,還需要考慮一年當(dāng)中各個(gè)月份中由于季節(jié)性,會(huì)導(dǎo)致新聞內(nèi)容的具體產(chǎn)出出現(xiàn)差異(包含陽(yáng)歷、陰歷)。因此,應(yīng)該基于這樣的考慮,增加時(shí)間屬性特征的系數(shù)。
因此在不考慮隨機(jī)擾動(dòng)的情況下,額外編碼了上述五種信息,編碼規(guī)則如表1。
表1 基于時(shí)間屬性的編碼信息
在實(shí)際情況中,具體的新聞內(nèi)容生產(chǎn)過程其實(shí)相當(dāng)于一個(gè)時(shí)序序列,因此在考慮某一個(gè)時(shí)間點(diǎn)的產(chǎn)量時(shí),不可忽略前面若干個(gè)時(shí)間點(diǎn)的產(chǎn)量,也就是說,7 月12 日的新聞生產(chǎn)量其實(shí)對(duì)于7 月13 日是有影響的,兩者并不是孤立的存在,其中存在時(shí)序關(guān)系。因此,應(yīng)該基于這樣的考慮,增加基于時(shí)序關(guān)系特征的系數(shù)。
根據(jù)這個(gè)因素,設(shè)定為第i天,Yi的產(chǎn)量應(yīng)當(dāng)同時(shí)取決于Xi和Yi-1,Yi-2,......Y1兩個(gè)因素,由此得出的模型為:Yi=g(Xi|Yi-1,Yi-2,......Y1)。在實(shí)際中,為了簡(jiǎn)化模型,同時(shí)為了使模型具有更高的合理性,通常認(rèn)為當(dāng)前狀態(tài)量只和前一狀態(tài)量有關(guān),即滿足齊次馬爾科夫性(12)張波,張景肖:《應(yīng)用隨機(jī)過程》,北京:清華大學(xué)出版社2004 年版,第28-59 頁(yè)。,這一性質(zhì)使得模型的求解更為便利,同時(shí),假如采取遞推的鏈?zhǔn)椒▌t,第i- 1 個(gè)變量里面,實(shí)則已經(jīng)包含了前i- 2 個(gè)變量的信息,因此,形如Yi=g(Xi|Yi-1)的形式對(duì)于求解參數(shù)更為方便。
經(jīng)過數(shù)據(jù)工程方法處理,得到更全面的向量后,運(yùn)用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)進(jìn)行建模。這是一種經(jīng)過實(shí)踐證明在處理時(shí)序序列時(shí)優(yōu)于隱馬爾科夫模型的一種方式。在經(jīng)典的神經(jīng)網(wǎng)絡(luò)模型中,隱藏層的值只取決于x輸入,然而在本例中,需要考慮到當(dāng)前狀態(tài)可能不僅與當(dāng)前輸入有關(guān),還與上一狀態(tài)有關(guān),因此其相應(yīng)的結(jié)構(gòu)應(yīng)該表達(dá)如圖1 所示,其中y為實(shí)際產(chǎn)出,W 為相應(yīng)的權(quán)重。最終計(jì)算得出的結(jié)果如圖2 所示。
圖1 循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)示意圖
圖2 損失函數(shù)在模型訓(xùn)練過程中的變化(越小代表性能越好):循環(huán)神經(jīng)網(wǎng)絡(luò)
然而,目前的模型仍然包含兩個(gè)重要缺陷:(:(1)從模型可解釋性的角度,需要對(duì)于上述提出的方法進(jìn)行進(jìn)一步的改進(jìn),考慮到現(xiàn)實(shí)生活中,內(nèi)容生產(chǎn)對(duì)于歷史數(shù)據(jù)應(yīng)當(dāng)是具有記憶性的,即假如去年的10 月1 日印象發(fā)稿量非常大,那么將可以判斷出今年10 月1 日的發(fā)稿量也會(huì)比較大。(2)模型進(jìn)行學(xué)習(xí)的參數(shù)與前一階段的數(shù)據(jù)有關(guān),在具體實(shí)現(xiàn)中,由于神經(jīng)元個(gè)數(shù)過多,特別容易出現(xiàn)參數(shù)累計(jì)相乘后出現(xiàn)數(shù)值膨脹或萎縮的情況,導(dǎo)致數(shù)值不穩(wěn)定,出現(xiàn)所謂的“梯度爆炸”與“梯度消失”的情況,即當(dāng)神經(jīng)網(wǎng)絡(luò)很深時(shí),梯度呈指數(shù)級(jí)增長(zhǎng),不穩(wěn)定的數(shù)值造成模型失當(dāng)。梯度爆炸和梯度消失的問題在循環(huán)神經(jīng)網(wǎng)絡(luò)中最為常見。
針對(duì)上述兩個(gè)問題,引入長(zhǎng)短記憶神經(jīng)網(wǎng)絡(luò)(LSTM)予以解決(13)Greff,Klaus,Srivastava,Rupesh Kumar,Koutník,Jan,etc,“LSTM:A Search Space Odyssey”,NewYork :IEEE Transactions on Neural Networks&Learning Systems,vol.28(10),2015,pp.2222-2232.。該網(wǎng)絡(luò)在1997 年被學(xué)者Hochreiter和Schmidhuber 引入,用于解決具有長(zhǎng)依賴特性的時(shí)序數(shù)據(jù)建模。通過LSTM 可以對(duì)于有效的信息進(jìn)行保留。從而解決對(duì)于模型輸出預(yù)測(cè)的長(zhǎng)依賴問題。如果將預(yù)測(cè)結(jié)果的誤差求均值后作為偏差量,能夠得出結(jié)果如圖3。
圖3 損失函數(shù)在模型訓(xùn)練過程中的變化:LSTM 模型
在LSTM 模型中,損失越小代表性能越好。從圖上可以看出,經(jīng)過幾次調(diào)整,模型已經(jīng)逐漸收斂,誤差值非常小。通過前期的參數(shù)調(diào)整與數(shù)據(jù)工程,這一模型在該數(shù)據(jù)集上可達(dá)到平均90%以上的準(zhǔn)確率(Preci?sion)和召回率(Recall),據(jù)此可以使用這個(gè)模型去進(jìn)一步預(yù)測(cè)新聞內(nèi)容生產(chǎn)量及生產(chǎn)效能。
根據(jù)此前得出的模型,本節(jié)將解決這樣一個(gè)問題——“在假定人力不變的前提下,制定多少新聞內(nèi)容生產(chǎn)數(shù)量時(shí),效能是最優(yōu)的”。
由于單日的新聞內(nèi)容產(chǎn)量具有較大隨機(jī)性,容易受到突發(fā)事件和各種偶然因素的干擾,因此在模型中把時(shí)間軸放寬至以月度為單位,依據(jù)上一節(jié)計(jì)算所得的模型,計(jì)算在未來一段時(shí)間內(nèi)單月的新聞產(chǎn)量如何達(dá)到最優(yōu)效能。
首先,在假定工作總?cè)藬?shù)不變的前提下,根據(jù)模型預(yù)測(cè)出該媒體后281 天的內(nèi)容生產(chǎn)產(chǎn)出數(shù)量,作為輸入值,并以真實(shí)的281 天數(shù)據(jù)作為輸出值,在模型中擬合出預(yù)期產(chǎn)出與真實(shí)產(chǎn)出之間的關(guān)系,并對(duì)這一擬合結(jié)果進(jìn)行觀測(cè)和分析。這一擬合的實(shí)際意義在于:如果將預(yù)期產(chǎn)出理解為該媒體的管理者給新聞工作者下達(dá)的工作任務(wù),那么根據(jù)預(yù)期產(chǎn)出對(duì)真實(shí)產(chǎn)出的影響就可以真切地觀測(cè)出,在人力不變的情況下,新聞內(nèi)容生產(chǎn)將在何時(shí)出現(xiàn)變化節(jié)點(diǎn),又將在何時(shí)達(dá)到最優(yōu)化的生產(chǎn)效能。因此,這一結(jié)果將有助于衡量真實(shí)的新聞工作,為媒體管理者在融媒體變化大勢(shì)下更科學(xué)準(zhǔn)確地下達(dá)新聞生產(chǎn)任務(wù)提供重要的參考。
其次,在融合媒體背景下,全媒體記者成為必需,一則新聞內(nèi)容通常會(huì)由單人進(jìn)行采寫,隨后以文字、圖片或音視頻等不同的方式單一發(fā)布或結(jié)合多種形式融合發(fā)布。不同新聞內(nèi)容所耗費(fèi)時(shí)間不同,會(huì)導(dǎo)致新聞產(chǎn)出量的差異。根據(jù)該上海媒體的真實(shí)數(shù)據(jù),文字稿件的生產(chǎn)周期為4.9~25.7 小時(shí)(平均時(shí)間15.3 小時(shí)),圖片稿件的生產(chǎn)周期為2.4~4.5 小時(shí)(平均3.45 小時(shí)),音視頻稿件的生產(chǎn)周期為14.3~48.9 小時(shí)(平均31.6小時(shí))。在計(jì)算中,使用平均數(shù)對(duì)新聞產(chǎn)出總量進(jìn)行量化。根據(jù)生產(chǎn)周期的平均時(shí)間計(jì)算,文字、圖片、音視頻的新聞生產(chǎn)時(shí)長(zhǎng)比例約為30:7:63。音視頻新聞的生產(chǎn)時(shí)長(zhǎng)是圖片新聞生產(chǎn)時(shí)長(zhǎng)的7 倍。在假定人力不變的前提下,這三類新聞內(nèi)容的總量必然符合恒定的總工時(shí)所能出產(chǎn)的新聞產(chǎn)量,且三類內(nèi)容呈現(xiàn)此消彼長(zhǎng)的關(guān)系。
第三,研究中使用的全部是真實(shí)數(shù)據(jù),實(shí)際新聞內(nèi)容產(chǎn)量是由該媒體的126 名在職新聞工作者完成的,因此,預(yù)期新聞產(chǎn)量仍以126 人作為基礎(chǔ)量,并在輸入數(shù)值時(shí)折算為126 人的工作總時(shí)長(zhǎng)。
基于以上三點(diǎn),以預(yù)期生產(chǎn)時(shí)間作為橫坐標(biāo),以實(shí)際產(chǎn)出作為縱坐標(biāo),進(jìn)行擬合操作,擬合結(jié)果如圖4所示。
圖4 期望發(fā)稿量與真實(shí)發(fā)稿量模型預(yù)測(cè)
擬合結(jié)果得到了四個(gè)坐標(biāo)節(jié)點(diǎn),分別是(20 160,20 160)、(42 012,47 106)、(60 480,28 130)和(37 599,46 023)。這四個(gè)節(jié)點(diǎn)標(biāo)記了新聞內(nèi)容生產(chǎn)效能的變化。在(20 160,20 160)之前,新聞內(nèi)容的預(yù)期產(chǎn)出和實(shí)際產(chǎn)出呈45°直線。在(20160,20160)和(42012,47106)之間,新聞內(nèi)容的預(yù)期產(chǎn)出和實(shí)際產(chǎn)出呈上升拋物線,并在(42 012,47 106)這一坐標(biāo)點(diǎn)上達(dá)到最高值。在(42 012,47 106)和(60 480,28 130)之間,新聞內(nèi)容的預(yù)期產(chǎn)出和實(shí)際產(chǎn)出呈下降拋物線,并在(60480,28130)之后,呈水平直線。在拋物線左側(cè)(37599,46023)坐標(biāo)點(diǎn)之前,導(dǎo)數(shù)值低于1,在此點(diǎn)之后導(dǎo)數(shù)值高于1。也就是說,(,(37599,46023)是拋物線與水平坐標(biāo)軸的夾角呈45°的分界線。
由此,基于總工時(shí)則能夠計(jì)算出三種不同形式的新聞內(nèi)容的生產(chǎn)量。由于總工時(shí)確定之下,三種不同形式的新聞內(nèi)容產(chǎn)量是互相約束、此消彼長(zhǎng)的,便可以描繪出三種稿件的生產(chǎn)占用時(shí)間的比例隨不同工作期望下的不同結(jié)果,如圖5 所示。
圖5 各類稿件占比隨月總工時(shí)的變化
根據(jù)圖5,隨著月度總工時(shí)的上升,文字類新聞的比例逐漸增加,音視頻類新聞的比例則呈現(xiàn)逐步減少的趨勢(shì),圖片類新聞基本保持恒定。
通過使用上海某媒體600 天新聞生產(chǎn)的真實(shí)數(shù)據(jù),長(zhǎng)短記憶神經(jīng)網(wǎng)絡(luò)(LSTM)模型計(jì)算后得到了對(duì)后續(xù)281 天新聞生產(chǎn)預(yù)期數(shù)據(jù)的推演,并與真實(shí)的281 天相比對(duì),得到了期望發(fā)稿量與真實(shí)發(fā)稿量模型的預(yù)測(cè)結(jié)果。根據(jù)這一結(jié)果,可以得出以下結(jié)論:
(1)坐標(biāo)點(diǎn)(20 160,20 160)約為126 名在職新聞工作者每天工作8 小時(shí),每月工作20 天的總工作時(shí)長(zhǎng),與法定工作時(shí)間基本吻合。也就是說,在不需加班的情況下,真實(shí)新聞產(chǎn)量與預(yù)期呈現(xiàn)線性對(duì)應(yīng)關(guān)系,所有預(yù)期的新聞產(chǎn)量都能夠被如期完成。而坐標(biāo)點(diǎn)(60 480,28 130)為126 名在職新聞工作者每人每天工作16 小時(shí),每月工作30 天,這一工作時(shí)長(zhǎng)形成了超平面,是新聞生產(chǎn)者的工作負(fù)荷極限。當(dāng)預(yù)期新聞產(chǎn)量所需的工作時(shí)長(zhǎng)超過這一負(fù)荷極限后,無論再怎么增加預(yù)期,都不能帶來新聞?wù)鎸?shí)產(chǎn)量的增長(zhǎng)。這兩個(gè)坐標(biāo)點(diǎn)成為了工作時(shí)長(zhǎng)的下限和上限。
(2)根據(jù)擬合結(jié)果,最優(yōu)的預(yù)期新聞產(chǎn)量就是在預(yù)期總工時(shí)達(dá)到42 012 小時(shí),即126 名在職新聞工作者大約每月工作時(shí)長(zhǎng)約333 小時(shí)的時(shí)候,實(shí)際新聞產(chǎn)量可達(dá)到47 106 小時(shí)的效果,這一新聞產(chǎn)量也是實(shí)際內(nèi)容生產(chǎn)總量的峰值。
(3)在(42 012,47 106)節(jié)點(diǎn)左側(cè),拋物線呈上升狀態(tài),表明提高預(yù)期對(duì)于新聞效能有正向的促進(jìn)作用。而當(dāng)超過(42 012,47 106)這一節(jié)點(diǎn),拋物線呈下降狀態(tài),表明繼續(xù)提高預(yù)期對(duì)于新聞工作者有負(fù)向的促進(jìn)作用,真實(shí)新聞產(chǎn)量隨著預(yù)期目標(biāo)的上升而緩慢增長(zhǎng)。
(4)在拋物線左側(cè),(,(37 599,46 023)坐標(biāo)點(diǎn)之前的導(dǎo)數(shù)值高于1,在此點(diǎn)之后導(dǎo)數(shù)值低于1。這意味著,在(37 599,46 023)點(diǎn)之前,增加預(yù)期對(duì)新聞工作者的激勵(lì)作用比45°對(duì)角線的效率更高。這一節(jié)點(diǎn),即126名在職新聞工作者大約每月工作時(shí)長(zhǎng)約298 小時(shí)的時(shí)候,實(shí)際新聞產(chǎn)量可達(dá)到42 012 小時(shí)的效果。而在(37 599,46 023)至(42 012,47 106)這個(gè)區(qū)間內(nèi),即使真實(shí)發(fā)稿量仍能夠隨著期望發(fā)稿量呈現(xiàn)正向增長(zhǎng),但是其增益速度已經(jīng)低于期望的增長(zhǎng)速度。也就是說,如果在這一區(qū)間內(nèi)再繼續(xù)給新聞工作者加壓,他們雖然還能根據(jù)預(yù)期目標(biāo)增加新聞產(chǎn)量,但是已經(jīng)顯示出力有不逮,難以繼續(xù)。
綜上,這一模型的擬合結(jié)論提供了一個(gè)全新的視角:按照既有的真實(shí)數(shù)據(jù)計(jì)算,126 名新聞工作者在法定工作時(shí)間內(nèi)能夠完成所有預(yù)期任務(wù),且呈現(xiàn)出工作量不飽和、積極性未被充分調(diào)動(dòng)激發(fā)的狀況。在達(dá)到法定的工作時(shí)長(zhǎng)并繼續(xù)調(diào)高預(yù)期目標(biāo)后,擬合曲線呈現(xiàn)拋物線上升,這證明了適度的工作壓力反而能夠更加充分地調(diào)動(dòng)和激發(fā)新聞工作者的工作積極性,達(dá)到更高的效能。然而,這種超出預(yù)期的實(shí)際工作量增長(zhǎng)并不能長(zhǎng)時(shí)間持續(xù),拋物線增長(zhǎng)漸趨平緩,在到達(dá)(37 599,46 023)坐標(biāo)點(diǎn)時(shí)角度小于45°,這表明新聞工作者在持續(xù)增加的預(yù)期目標(biāo)壓力之下無法保持足夠的工作積極性,真實(shí)新聞產(chǎn)量逐漸放緩。進(jìn)而,拋物線在到達(dá)頂峰后進(jìn)一步下降。這是由于新聞業(yè)是一個(gè)創(chuàng)造性的工作,過高的預(yù)期產(chǎn)量會(huì)造成新聞工作者的過度焦慮、體力不濟(jì)等,反而會(huì)傷害新聞效能。最終,當(dāng)工作壓力超出新聞工作者的能力,形成超平面,屆時(shí)預(yù)期新聞產(chǎn)量對(duì)于實(shí)際不起作用。
因此,根據(jù)擬合結(jié)果,管理者日常的最優(yōu)預(yù)期效能目標(biāo)可以制定在拋物線起點(diǎn)至45°角的坐標(biāo)點(diǎn)之間,即工作時(shí)長(zhǎng)在每月20 160 小時(shí)到37 599 小時(shí)之間。當(dāng)遇到重大新聞或者重要突發(fā)事件時(shí),可短暫將最優(yōu)效能目標(biāo)調(diào)高至拋物線45°角至頂點(diǎn)之間,即工作時(shí)長(zhǎng)在每月37 599 小時(shí)和每月42 012 小時(shí)之間,但總工時(shí)42 012 小時(shí)是總工作量的極限峰值。
根據(jù)圖5 即各類稿件占比隨月總工時(shí)的變化圖可以觀察出,當(dāng)工作時(shí)間的預(yù)期要求較短時(shí),新聞生產(chǎn)者一般會(huì)保持一個(gè)合理的生產(chǎn)數(shù)量,三類新聞產(chǎn)出的比例比較均衡。而當(dāng)預(yù)期任務(wù)要求過高時(shí),生產(chǎn)者會(huì)為了追求更多的新聞產(chǎn)量,刻意選擇生產(chǎn)周期更短的新聞?lì)愋?,即生產(chǎn)更多的文字稿件和圖片稿件,而減少視頻類稿件的產(chǎn)出,這從新聞內(nèi)容生產(chǎn)上講是一種不健康的規(guī)劃方式。因此管理者應(yīng)當(dāng)制定適中的工作計(jì)劃,以期達(dá)到合理的生產(chǎn)比例。
本研究主要做出了兩個(gè)貢獻(xiàn):首先,提出將媒體的生產(chǎn)特征量化的方式并使用真實(shí)數(shù)據(jù)進(jìn)行建模。在量化的過程中同時(shí)考慮了某媒體的基本屬性和時(shí)序?qū)傩?,基于此,做出的模型可以預(yù)測(cè)每日的發(fā)稿數(shù)量。本文使用的方法可以對(duì)更為復(fù)雜場(chǎng)景下的異構(gòu)數(shù)據(jù)生產(chǎn)進(jìn)行預(yù)測(cè),在基于更大的數(shù)據(jù)量與更多維的數(shù)據(jù)描述下,可以得到更為精準(zhǔn)的模型。其次,根據(jù)模型擬合了預(yù)期投入與真實(shí)產(chǎn)出之間的關(guān)系,因此可以更為科學(xué)和準(zhǔn)確地制定出新聞內(nèi)容生產(chǎn)量的預(yù)期目標(biāo)。如果在相應(yīng)數(shù)據(jù)支持下,這一模型可以應(yīng)用于類似于新聞生產(chǎn)的知識(shí)性生產(chǎn)環(huán)境,如著作、文章等,針對(duì)具體情況,給出期望情況下能獲得最高產(chǎn)出的產(chǎn)量預(yù)期。
本研究還存在以下幾點(diǎn)改進(jìn)空間:
(1)在應(yīng)用循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行產(chǎn)出預(yù)測(cè)時(shí),需要提取更多的特征,來更加多維地建模描述一個(gè)媒體的生產(chǎn)能力。(2)目前的模型可以相對(duì)較準(zhǔn)確地對(duì)單個(gè)新聞機(jī)構(gòu)或知識(shí)生產(chǎn)型單位進(jìn)行效能評(píng)估,但無法在更大的范圍內(nèi)使用。未來可以對(duì)內(nèi)容產(chǎn)出進(jìn)行更加細(xì)化的分類,進(jìn)一步精準(zhǔn)測(cè)算各類產(chǎn)出之間的約束關(guān)系(相關(guān)系數(shù)),如規(guī)制、外界影響等,以期得到更好的預(yù)測(cè)結(jié)果。(3)目前的新聞生產(chǎn)效能模型主要基于“人力—產(chǎn)出”這一邏輯,而忽視了近年來越來越多的機(jī)器人寫作或其他智能化新聞生產(chǎn)方式,且新聞產(chǎn)出仍以傳統(tǒng)的文字、圖片、音視頻類作品為主。當(dāng)新聞生產(chǎn)環(huán)境隨著科技發(fā)展而發(fā)生變化,或當(dāng)AR、VR等實(shí)驗(yàn)性新聞產(chǎn)品的比例增加時(shí),本模型無法對(duì)于屆時(shí)的新聞生產(chǎn)效能做出評(píng)估。
海南大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版)2020年6期