国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于彈幕的視頻高潮探測分析

2020-04-22 20:36:14高旭
電腦知識與技術(shù) 2020年6期
關(guān)鍵詞:聚類

高旭

摘要:在當今快節(jié)奏的生活中,大多數(shù)人只會用零散的時間來瀏覽視頻。因此,他們傾向于看一些自己感興趣的高潮剪輯。同時,視頻中的彈幕數(shù)據(jù)越來越龐大,并且在一定程度上,每個時間戳下的彈幕數(shù)量代表了該時刻的視頻受觀眾喜愛的程度以及視頻是否為高潮的相關(guān)性程度。分析這些彈幕數(shù)據(jù)可以捕獲視頻的高潮區(qū)間。因此,以此分析視頻并對其進行切片可以區(qū)分視頻的高潮部分和低潮部分。針對視頻高潮探測這種無標簽數(shù)據(jù)的分析場景,基于彈幕數(shù)據(jù),使用彈幕數(shù)量這一數(shù)據(jù)特征并設定移動閾值進行分析獲得了比傳統(tǒng)聚類方法更好的實驗結(jié)果。

關(guān)鍵詞:視頻高潮;彈幕數(shù)量;移動閾值;聚類

中圖分類號:TP311 文獻標識碼:A

文章編號:1009-3044(2020)06-0209-02

1概述

隨著人們生活節(jié)奏的加快,他們會更傾向于在一些閑暇的片段時間瀏覽視頻的精彩片段。這能很大程度上減少觀看視頻的時間成本,同時也能大致了解視頻的主要內(nèi)容。該文基于彈幕數(shù)量這一個能夠在某種程度上反映視頻片段是否為高潮的數(shù)據(jù)特征進行了分析研究,采用該方法只需要很少的計算資源和時間需求便能夠獲得相較于傳統(tǒng)的聚類方法更好的實驗效果。

2背景

目前,也有一些基于文本數(shù)據(jù)的分析研究工作。比如一種探測視頻片段主題的研究方法。利用彈幕來區(qū)分視頻的邊界。根據(jù)體育賽事中的評論數(shù)量來探測比賽的高潮時段。目前,大部分文本類的研究工作是關(guān)于微博以及商品評論等等領(lǐng)域,而對視頻中的彈幕文本的分析較少。

本篇論文考慮使用LDA或者word2vec先將文本數(shù)據(jù)轉(zhuǎn)換成詞向量再進行聚類。最終的實驗結(jié)果顯示采用彈幕數(shù)量這一特征進行分析比聚類獲得了更好的實驗效果。

3數(shù)據(jù)預處理

此論文使用的是從嗶哩嗶哩網(wǎng)站爬取的兩部電影的彈幕數(shù)據(jù),分別是唐伯虎點秋香和楚門的世界。這兩部電影也分別代表了兩種不同風格的電影。爬取的彈幕數(shù)據(jù)的格式如下表1所示。其中唐伯虎點秋香一共有大約24000條彈幕,楚門的世界有大約11000條彈幕。

由于彈幕中包含許多網(wǎng)絡用語,比如“233”“+1”等。它們分別是大笑和贊同的意思,因此我們需要用中文去替換他們。

4高潮探測分析

4.1基于彈幕數(shù)量的高潮探測

該方法通過每個視頻片段里的彈幕數(shù)量這一特征并構(gòu)建移動閾值來進行高潮探測。構(gòu)建移動閾值是因為之前的探測方法通常會定義一個固定的閾值來探測高潮,因此閾值的制定在一定程度上決定了探測的效果。另外,一種閾值在一種數(shù)據(jù)集上效果良好,但不一定在另一種數(shù)據(jù)集上依然表現(xiàn)良好。因此,我們采用構(gòu)建移動閾值這一靈活的方法來解決高潮探測這一問題。該方法用到的一些參數(shù)如下所示:

確定某一個片段i是否為高潮片段的算法過程如下所示:

(1)對每個片段i計算它的meani,std;和Ti。

(2)如果Nfi>Ti,判斷該片段為高潮。

(3)如果Nfi≤i,判斷該片段為非高潮。

下圖是對利用彈幕數(shù)量并構(gòu)建移動閾值來探測視頻高潮這一方法的圖形解釋。

4.2基于聚類算法的高潮探測

除了以上的研究方法,目前主流的機器學習方法也能處理這類無標簽的數(shù)據(jù),例如一些常規(guī)的聚類算法K-means,DN-BSCAN和AHC。這些方法的實驗結(jié)果將作為比較對象與我們的方法進行對比。

5實驗評估

我們選擇了唐伯虎點秋香和楚門的世界這兩部電影的彈幕作為我們的數(shù)據(jù)集,下面的表2,表3展示了收集的兩部影片的實際高潮片段。其中片段范圍是指該播放時間內(nèi)所屬的之前所劃分好的片段區(qū)間。表里的片段范圍將用來評價我們實驗結(jié)果的好壞。

6總結(jié)

整體而言,基于彈幕數(shù)量對電影視頻進行高潮探測的實驗方法,能夠較為簡便快速地達到找到高潮片段這一研究目標,它相較于常規(guī)的聚類算法有更好的實驗結(jié)果,對于簡便快捷地找到長視頻中的高潮片段提供了一種研究思路。

猜你喜歡
聚類
稠密度聚類在艦船網(wǎng)絡微弱信號自適應增強中的應用
基于K-means聚類的車-地無線通信場強研究
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
基于高斯混合聚類的陣列干涉SAR三維成像
雷達學報(2017年6期)2017-03-26 07:53:02
條紋顏色分離與聚類
基于Spark平臺的K-means聚類算法改進及并行化實現(xiàn)
局部子空間聚類
自動化學報(2016年8期)2016-04-16 03:38:58
基于改進的遺傳算法的模糊聚類算法
一種層次初始的聚類個數(shù)自適應的聚類方法研究
基于熵權(quán)和有序聚類的房地產(chǎn)周期分析
河南科技(2014年23期)2014-02-27 14:19:14
客服| 栖霞市| 德州市| 辽源市| 会昌县| 余姚市| 仪征市| 舒兰市| 延庆县| 陇南市| 金山区| 湘西| 黎平县| 竹山县| 女性| 临邑县| 兴业县| 石家庄市| 新兴县| 深泽县| 务川| 巴林左旗| 新宁县| 新邵县| 郸城县| 错那县| 乐山市| 柘城县| 镇巴县| 绥德县| 巨野县| 海林市| 安新县| 左贡县| 枣阳市| 苏州市| 安顺市| 茌平县| 十堰市| 涟源市| 巴中市|