国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

關(guān)于新聞視頻主題識(shí)別與跟蹤的研究

2016-12-13 08:09:11關(guān)莉莉
山西青年 2016年23期
關(guān)鍵詞:新聞節(jié)目新聞報(bào)道聚類

關(guān)莉莉

吉林電視臺(tái),吉林 長(zhǎng)春 130021

?

關(guān)于新聞視頻主題識(shí)別與跟蹤的研究

關(guān)莉莉

吉林電視臺(tái),吉林 長(zhǎng)春 130021

伴隨著通信技術(shù)和多媒體的飛速發(fā)展,人們能夠用于表達(dá)、傳遞和存儲(chǔ)信息的手段也越來(lái)越多,與此同時(shí)人們每天需要接觸的信息數(shù)量也正呈爆炸式增長(zhǎng),因此在新聞?lì)I(lǐng)域當(dāng)中研究關(guān)于自動(dòng)識(shí)別、分析以及檢測(cè)追蹤新聞視頻的方式方法具有極其重要的現(xiàn)實(shí)意義。本文將以此為基礎(chǔ),簡(jiǎn)要探究關(guān)于新聞視頻主題的識(shí)別與跟蹤。

新聞視頻主題;識(shí)別;跟蹤

通常情況下,一套完整的新聞節(jié)目是由若干個(gè)新聞單元組合而成,因此人們?cè)诜治鲂侣勔曨l內(nèi)容之前,首先需要做的就是按照新聞數(shù)據(jù)之間的關(guān)聯(lián)程度,將完成的新聞節(jié)目還原成若干新聞單元的初始形式;之后將新聞視頻新聞報(bào)道基于語(yǔ)義特征進(jìn)行切分。而本文則主要探究的是以自然語(yǔ)言和文本形式為主的新聞視頻報(bào)道,并在此基礎(chǔ)上著重圍繞新聞視頻主題的識(shí)別與跟蹤進(jìn)行簡(jiǎn)要分析論述。

一、主題識(shí)別與跟蹤的簡(jiǎn)要概述

美國(guó)國(guó)防高級(jí)研究計(jì)劃署最早提出了識(shí)別和跟蹤主題這一概念,也就是說(shuō)徹底拋棄傳統(tǒng)的人工干預(yù)操作,完全使用自動(dòng)化模式用于對(duì)新聞數(shù)據(jù)流及其主題進(jìn)行合理判斷[1]。最初識(shí)別和跟蹤主題的目的主要適用于尋找主體之間的一致性,利用系統(tǒng)對(duì)兩件事之間的界進(jìn)行自動(dòng)判斷,故而區(qū)分出出現(xiàn)的新事件以及再現(xiàn)的舊事件。后期隨著科學(xué)技術(shù)的不斷發(fā)展進(jìn)步,識(shí)別和跟蹤主題也得到了深入細(xì)化,被分為了如表1所示的五個(gè)任務(wù)。

表1 識(shí)別和跟蹤主題的五大任務(wù)

二、切分新聞報(bào)道

所謂切分新聞報(bào)道具體來(lái)說(shuō)就是指將從同一個(gè)信息源當(dāng)中獲得的語(yǔ)言信息流分割成為若干個(gè)不同的新聞報(bào)道。由于新聞專線當(dāng)中的文本信息流,從本質(zhì)上來(lái)說(shuō)就是呈現(xiàn)出單個(gè)報(bào)道形式,因此只有在處理來(lái)自廣播、電視等傳統(tǒng)媒體音頻數(shù)據(jù)的過(guò)程當(dāng)中才會(huì)涉及切分新聞報(bào)道[2]。通常情況下,若干條不同的新聞報(bào)道組合在一起構(gòu)成一段完整的新聞節(jié)目,但是通過(guò)觀察可知,幾乎沒(méi)有任何新聞節(jié)目會(huì)用分隔標(biāo)記用以區(qū)分不同的報(bào)道。好比說(shuō)人們常常能夠在某一篇報(bào)道當(dāng)中發(fā)現(xiàn)商業(yè)廣告的存在等等。而需要被切分的語(yǔ)料或數(shù)據(jù),有可能是音頻記錄,也有可能是利用語(yǔ)音識(shí)別功能后將音頻記錄轉(zhuǎn)化形成的文字記錄。

三、識(shí)別新事件

所謂的識(shí)別新事件,其根本目標(biāo)就于能夠發(fā)現(xiàn)以往從未出現(xiàn)過(guò)或是從未被討論過(guò)的新聞主題,有可能是地震、海嘯,有可能是發(fā)射導(dǎo)彈、衛(wèi)星,也有可能是某個(gè)八卦?shī)蕵?lè)新聞等等。通常情況下此類新聞主題還兼具用于識(shí)別主題系統(tǒng)的測(cè)試功能,這主要是由于識(shí)別新聞主題系統(tǒng)的重要基礎(chǔ)就是對(duì)每一個(gè)新聞報(bào)道當(dāng)中是否討論新話題進(jìn)行判斷。現(xiàn)階段人們習(xí)慣使用向量或分布概率的形式用以識(shí)別新事件。具體來(lái)說(shuō)就是指在概括每一篇新聞報(bào)道時(shí)都會(huì)借助于向量或分布概率形式,其最終形成的集合表示新聞主題的所有特征,而一旦出現(xiàn)新報(bào)道,將會(huì)比較以往報(bào)道的所有特征集合與現(xiàn)在新聞報(bào)道的特征集合,并且將其作為判斷新主題是否參與討論的重要依據(jù)[3]。也有部分研究人員認(rèn)為利用單純的比較文本相似性方法很難完成調(diào)整參數(shù)、提高系統(tǒng)性能的任務(wù),因此還需要尋找其他方法。

四、識(shí)別新聞視頻主題

識(shí)別新聞視頻主題指的就是通過(guò)對(duì)新聞視頻進(jìn)行深度識(shí)別,最終將主題內(nèi)容歸攏到與之相對(duì)應(yīng)的主題庫(kù)當(dāng)中,結(jié)合實(shí)際情況可以適當(dāng)建立全新的新聞主題。從本質(zhì)上看,識(shí)別新聞視頻主題幾乎和無(wú)指導(dǎo)的聚類研究一模一樣,即面對(duì)新聞視頻的主題數(shù)量、出現(xiàn)時(shí)間等系統(tǒng)無(wú)法進(jìn)行預(yù)測(cè),只能有限的向前看。通常意義上的聚類等同于將全局信息也就是整個(gè)新聞數(shù)據(jù)集合進(jìn)行聚類,但識(shí)別視頻新聞主題時(shí)則是使用增量方法完成聚類。這也正意味著,只能向前看到有限的文本、報(bào)道才能進(jìn)入最終的決策環(huán)節(jié)。作為一種增量式的聚類,人們習(xí)慣于將識(shí)別新聞視頻主題分成兩個(gè)階段:第一個(gè)階段為識(shí)別新事件是否出現(xiàn);第二個(gè)階段為對(duì)于新聞視頻中出現(xiàn)的主題歸攏至相應(yīng)的主題庫(kù)當(dāng)中。顯而易見(jiàn),在第一個(gè)階段當(dāng)中,就是識(shí)別新事件的發(fā)生。識(shí)別新聞視頻主題其實(shí)也是將識(shí)別新事件進(jìn)行自然的擴(kuò)展[4]。但是,二者之間存在明顯的區(qū)別,即在第一個(gè)階段當(dāng)中系統(tǒng)只負(fù)責(zé)在新聞視頻當(dāng)中識(shí)別出主題,若這一任務(wù)無(wú)法得到有效落實(shí)將會(huì)引發(fā)嚴(yán)重的后果;而在第二個(gè)階段當(dāng)中需要將新聞視頻中的主題進(jìn)行識(shí)別并且歸入到主題庫(kù)當(dāng)中,即使無(wú)法在視頻當(dāng)中識(shí)別出主題也并不會(huì)引發(fā)嚴(yán)重后果。

五、跟蹤新聞視頻主題

跟蹤新聞視頻主題具體來(lái)說(shuō)就是在給出某一主題當(dāng)中的一個(gè)或幾個(gè)新聞報(bào)道視頻,之后將輸入進(jìn)的相關(guān)新聞報(bào)道與新聞視頻主題進(jìn)行有機(jī)整合。在此過(guò)程中首先需要給出一組樣本報(bào)道,通過(guò)訓(xùn)練最終得到一個(gè)主題模型,然后在后續(xù)跟蹤報(bào)道的新聞視頻當(dāng)中識(shí)別出所有與目標(biāo)主題有關(guān)的新聞視頻。由此我們可以看出,跟蹤新聞視頻主題與通過(guò)查詢例子和過(guò)濾信息的相關(guān)研究有著異曲同工之妙但是在目前跟蹤新聞視頻主題當(dāng)中之后很少的已知訓(xùn)練正例,并且與新聞主題有關(guān)的新聞視頻通常會(huì)集中出現(xiàn)在某一段特定的時(shí)間段。值得注意的是,在跟蹤新聞視頻主題的過(guò)程當(dāng)中訓(xùn)練使用的視頻數(shù)量,測(cè)試語(yǔ)料、使用語(yǔ)言質(zhì)量等均會(huì)對(duì)追蹤任務(wù)產(chǎn)生不同程度的影響。隨著科學(xué)技術(shù)水平的不斷提高,跟蹤新聞視頻主題的系統(tǒng)也得到了相應(yīng)的發(fā)展,即使在某些特定領(lǐng)域當(dāng)中也可以得以運(yùn)用。相信再經(jīng)過(guò)幾年的發(fā)展,跟蹤新聞視頻主題的正確率將會(huì)得到進(jìn)一步提升。

六、結(jié)論

總而言之,本文通過(guò)從切分新聞報(bào)道、識(shí)別新事件、識(shí)別新聞視頻主題以及追蹤新聞視頻主題等幾個(gè)方面進(jìn)行簡(jiǎn)要分析,幫助人們對(duì)新聞視頻主題的識(shí)別追蹤產(chǎn)生一個(gè)大致的了解,但是由于當(dāng)前在相關(guān)方面的研究少之又少,因此本文還有許多不足之處,還需得到進(jìn)一步的完善和研究。

[1]吳玲達(dá),文軍,陳丹雯,袁志民.新聞視頻主題識(shí)別與跟蹤技術(shù)研究綜述[J].計(jì)算機(jī)科學(xué),2015,06:5-10.

[2]文軍,吳玲達(dá),曾璞,欒悉道.關(guān)于新聞視頻主題識(shí)別與跟蹤分析研究[J].軟件學(xué)報(bào),2016,11:2971-2984.

[3]朱旭東.關(guān)于新聞視頻主題識(shí)別與跟蹤的研究[D].西安電子科技大學(xué),2015.

[4]王衛(wèi)威.新聞視頻中識(shí)別與跟蹤主題的技術(shù)研究[D].國(guó)防科學(xué)技術(shù)大學(xué),2015.

TP

A

猜你喜歡
新聞節(jié)目新聞報(bào)道聚類
淺析如何在新聞報(bào)道中彰顯以人為本
活力(2019年15期)2019-09-25 07:22:10
新聞節(jié)目中主持人的“可為”與“不可為”
新聞傳播(2018年8期)2018-12-06 09:03:00
地方電視臺(tái)如何辦好新聞節(jié)目
新聞傳播(2018年11期)2018-08-29 08:15:30
基于DBSACN聚類算法的XML文檔聚類
如何做好電視新聞節(jié)目編排
新聞傳播(2016年10期)2016-09-26 12:15:03
基于改進(jìn)的遺傳算法的模糊聚類算法
深化“走轉(zhuǎn)改”在新聞報(bào)道中踐行群眾路線
新聞傳播(2015年21期)2015-07-18 11:14:22
如何讓新聞報(bào)道鮮活起來(lái)
新聞傳播(2015年9期)2015-07-18 11:04:11
方言新聞節(jié)目探索
新聞傳播(2015年9期)2015-07-18 11:04:11
新聞報(bào)道要求真實(shí)的細(xì)節(jié)描寫(xiě)
新聞傳播(2015年13期)2015-07-18 11:00:41
奉节县| 敦煌市| 左权县| 沈阳市| 江华| 万州区| 枣阳市| 嘉定区| 清涧县| 北安市| 安仁县| 琼中| 扬中市| 沂水县| 南充市| 吉木乃县| 汝阳县| 衡山县| 镇平县| 安吉县| 鹿泉市| 岑溪市| 呼伦贝尔市| 友谊县| 普洱| 会东县| 南陵县| 新营市| 永新县| 屯门区| 恩平市| 镇康县| 贡山| 舟山市| 阳谷县| 凭祥市| 商都县| 建瓯市| 苏州市| 嫩江县| 无极县|