国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于決策樹的多媒體視頻關(guān)鍵幀實時提取方法研究

2022-09-24 10:19:10陳少偉王志固
關(guān)鍵詞:關(guān)鍵幀決策樹增益

陳少偉,王志固

(漳州城市職業(yè)學院 文化藝術(shù)創(chuàng)意系,福建 漳州 363000)

0 引言

5G時代的到來快速推動了社會發(fā)展進程.多媒體短視頻代替?zhèn)鹘y(tǒng)媒介成為一種新的傳播方式[1],其中的海量視覺信息顛覆人們固有思維.人們通過視覺方式獲取信息量占比超過85%,最為生動形象的視頻成為最高效的交流方式[2].在全球范圍內(nèi)采集及傳輸過程中,由于傳統(tǒng)海量視覺信息未能獲得高效處理,導致很多資源的浪費[3].為解決此類問題,多媒體技術(shù)在視頻處理方面的技術(shù)獲得推動式迅猛發(fā)展,視頻關(guān)鍵幀作為該問題的核心環(huán)節(jié),受到高度重視[4].多媒體網(wǎng)絡技術(shù),涉及各行各業(yè),能夠幫助用戶快速精確搜索到感興趣的內(nèi)容[5],這對多媒體視頻中關(guān)鍵幀進行實時提取極為重要[6-7].為此,相關(guān)研究者進行了很多研究,并取得了一定成果.

仲夢潔等[8]提出一種基于視覺顯著性的視頻關(guān)鍵幀提取方法,該方法以多特征融合圖像為參考,利用視覺顯著性有效提取關(guān)鍵幀圖像并壓縮,并有效提取車輛關(guān)鍵幀信息,但該方法需測量多方面特征,時間成本極高,無法適用于普通視頻的需求.張曉宇等[9]提出一種視頻關(guān)鍵幀提取方法,該方法利用融合特征提取視頻特征并分割關(guān)鍵幀,缺點是在關(guān)鍵幀分割時存在錯誤劃分.為解決上述方法中存在的問題,本文提出基于決策樹的多媒體視頻關(guān)鍵幀實時提取方法.決策樹作為預測模型,其實質(zhì)上是一種監(jiān)督模式機器學習方法,決策樹依據(jù)選定特征屬性對視頻樣本集進行層級分類,再判斷特征分類.決策樹具有效率高、易操作、可同步處理數(shù)據(jù)型以及常規(guī)型屬性等多種優(yōu)勢,廣泛應用于歸類信息以及選取特征等應用場景中.將其應用到本文方法中,精準高效提取分割視頻關(guān)鍵幀,促使用戶更為快捷的瀏覽、檢索感興趣視頻,同時能高效地掌握視頻的核心內(nèi)容,使檢索效率進一步提升.

1 多媒體視頻關(guān)鍵幀提取方法

1.1 基于信息增益比率的多媒體視頻關(guān)鍵幀特征選擇

多媒體視頻關(guān)鍵幀實時提取之前,為了提升提取的精度,首先需要利用信息增益比率選擇多媒體視頻中的關(guān)鍵幀特征.

設S為多媒體視頻幀樣本集,用Ci,i=1,2,…,n描述多媒體視頻幀樣本類別標號,通過公式(1)描述:

(1)

其中:多媒體視頻幀樣本集S中樣本總數(shù)量以及歸屬Ci類別樣本數(shù)量分別用|S|、mum(Ci,S)表示;熵代表樣本集的純度(purity).

考量訓練樣本集純度的參考指標為熵,信息增益作為衡量關(guān)鍵幀特征歸類訓練樣本能力的準則,利用關(guān)鍵幀特征分割樣本集,達到熵變小的目的[10],擬定用S和A分別描述樣本集與關(guān)鍵幀特征,通過公式(2)計算信息增益,表示為:

(2)

在信息增益應用熵過程中,僅衡量視頻幀樣本集S內(nèi)各關(guān)鍵幀數(shù)值的熵,視頻幀樣本集S內(nèi)關(guān)鍵幀特征A中每個值的熵為分裂數(shù)據(jù),通過公式(3)得到分裂數(shù)據(jù)為:

(3)

其中:多媒體視頻幀樣本集S被c個數(shù)值的關(guān)鍵幀特征A切割,切割后獲取到c個樣本子集為S1-Sc.

信息增益比率利用信息熵及信息增益、分裂信息求解獲取[11],用公式(4)描述信息增益比率:

(4)

通過分支產(chǎn)生有效數(shù)據(jù)比率即為信息增益比率,信息增益比率數(shù)值越低,代表分支內(nèi)擁有的有效數(shù)據(jù)占比越低,反之,則代表該分支內(nèi)存在較多有效數(shù)據(jù)[12].

1.2 基于優(yōu)化ID3決策樹的視頻關(guān)鍵幀提取

ID3決策樹是一種利用信息增益比率確定關(guān)鍵幀特征選取準則,可將最高信息增益比率的關(guān)鍵幀點當作最新節(jié)點,并在此基礎(chǔ)上進行子樹繁衍.

1.2.1 ID3決策樹算法

依據(jù)數(shù)據(jù)獲取分類器且多方應用的邏輯方法即決策樹.決策樹隸屬于監(jiān)督學習,是一種機器學習方法.決策樹的重要構(gòu)成要素如圖1所示,包含決策樹的決策節(jié)點、分支節(jié)點和葉子節(jié)點.

圖1 決策樹重要構(gòu)成要素

結(jié)合圖1可以看出,決策樹是一種樹狀構(gòu)造.其中,各節(jié)點表示測試或選擇各個屬性的取值,測試或者選擇結(jié)果則用分支描述;類別選用決策樹的各個葉節(jié)點描述.根節(jié)點選擇樹的最高層節(jié)點作為決策樹的起始點.

ID3決策樹算法作為使用時間最久、范圍最廣的決策樹算法,于上世紀末提出,已經(jīng)取得較高成就.該算法實現(xiàn)流程如圖2所示.

(1)確定最佳劃分屬性

ID3決策樹內(nèi)對信息熵進行初步界定,確定的最佳劃分屬性取決于信息熵結(jié)果.多媒體視頻幀樣本的純度為信息熵含義,表示為:

(5)

其中:視頻幀樣本集信息熵指標用Ent(S)描述;該視頻樣本集內(nèi)第k類樣本占比用pk描述;視頻幀樣本總類型為y;當信息熵數(shù)值偏高則代表視頻幀樣本集純度偏小,反之,則偏大.

圖2 決策樹算法的訓練步驟

因此,最佳關(guān)鍵幀特征選取信息熵增益最高的幀特征需要滿足以下條件,即:

(6)

其中:最佳劃分關(guān)鍵幀特征用a*描述;視頻幀樣本集S依據(jù)關(guān)鍵幀特征a分割相應信息熵增益為Gain(S,a);各屬性取值數(shù)量用Va描述;視頻幀樣本子集信息熵為Ent(Sv);視頻幀樣本集樣本數(shù)目以及在視頻幀樣本集內(nèi)關(guān)鍵幀特征a且取值v視頻幀樣本子集Sv分別用|Sv|和|S|描述.

(2)分支衍生

依據(jù)最佳劃分屬性,將選取的值進行分割操作,分支數(shù)為關(guān)鍵幀特征取值數(shù)值.

(3)循環(huán)判斷

遞歸問題決策過程即決策樹的演變過程.判斷是否繼續(xù)返回時要符合下述條件之一:①視頻幀樣本集為空集;②最佳關(guān)鍵幀特征為空集;③分割后獲取視頻幀樣本子集為同類時則結(jié)束循環(huán)分割.

1.2.2 ID3決策樹關(guān)鍵幀分類

以信息增益比率最高關(guān)鍵幀特征作為參考指標,選取決策樹各個節(jié)點上屬性即關(guān)鍵幀特征,并利用各個非葉節(jié)點完成測試,獲取被測試記錄有關(guān)最大類別數(shù)據(jù).詳細步驟為:①對全部關(guān)鍵幀特征進行檢測并選取其中信息增益最高的關(guān)鍵幀特征當作決策樹節(jié)點;②依據(jù)該關(guān)鍵幀特征的各個取值確定分支,之后調(diào)用該方法遞歸操作各個分支的多媒體視頻子集,搭建決策樹節(jié)點分支;③當全部多媒體視頻幀子集內(nèi)部只有同一個類型的信息時結(jié)束分支構(gòu)建.確定關(guān)鍵幀數(shù)據(jù)類型及關(guān)鍵幀特征之間的關(guān)系,并以此獲取決策樹,歸類最新視頻幀樣本[13].詳細流程如下:

步驟1:對全部關(guān)鍵幀特征的信息增益進行求解,根節(jié)點選取其中信息增益數(shù)值最高的關(guān)鍵幀特征來表示.

(1)對已知的訓練數(shù)據(jù)集歸類信息期望I進行求解.

設含有s個信息的多媒體視頻幀樣本集合用S描述,其類別關(guān)鍵幀特征,分別選取m個值同時產(chǎn)生m個類別Ci,i=1,2,…,m,若Ci類內(nèi)部樣本數(shù)量用si描述,用公式(7)描述歸類給定視頻幀樣本信息的信息量:

(7)

其中:隨機選取一個信息數(shù)據(jù)Si歸屬于Ci的概率用pi描述.

(2)對關(guān)鍵幀特征各個取值的信息預期值E(A)進行求解.

擬定n為關(guān)鍵幀特征A內(nèi)包含的各個取值{a1,a2,…,an},多媒體視頻幀樣本集S分割是通過關(guān)鍵幀特征A實現(xiàn),拆分為n類集合{S1,S2,…Sn},其中,多媒體視頻幀樣本集關(guān)鍵幀特征A取值為aj,且該值存在Sj中.

假設用測試節(jié)點屬性定義關(guān)鍵幀特征A,將其應用在分割樣本集過程中,擬設多媒體視頻幀樣本子集Sj內(nèi)歸屬為Ci類的樣本數(shù)總和用sij描述,則信息熵的求解結(jié)果為:

(8)

用公式(9)描述多媒體視頻幀樣本子集Sj的信息量求解,即

(9)

其中:多媒體視頻幀樣本子集內(nèi)隨機挑選一個數(shù)據(jù)樣本在Ci在類別內(nèi)的概率為pij.

(3)求解關(guān)鍵幀特征A的信息增益InfoGain(A).

利用關(guān)鍵幀特征A對當前分支節(jié)點進行對應多媒體視頻幀樣本集劃分,用公式(10)獲取的信息增益為:

InfoGain(A)=
I(S1j,S2j,…,Smj)-E(A).

(10)

劃分多媒體視頻幀樣本集InfoGain(A)獲取信息熵降低數(shù)量是通過關(guān)鍵幀特征A取值結(jié)果實現(xiàn)的.當信息增益數(shù)值偏高,則表示關(guān)鍵幀特征A在歸類過程中為其提供較多信息量,降低了取值的不確定性,保障數(shù)據(jù)的可靠性[14].求解每個關(guān)鍵幀特征的信息增益并將其進行比較;

步驟2:由根節(jié)點屬性的各類取值繼續(xù)構(gòu)建決策樹分支[15].

步驟3:通過遞歸方法選取信息增益最高的關(guān)鍵幀特征,作為子節(jié)點后直至全部子集內(nèi)搜集完同類信息,實現(xiàn)多媒體視頻關(guān)鍵幀提取.

1.2.3 多媒體視頻關(guān)鍵幀提取流程設計

ID3決策樹缺點表現(xiàn)在無法協(xié)調(diào)矛盾特征及模糊特征信息之間的關(guān)系,因此,本文選用優(yōu)化ID3決策樹分類方法.以提取的關(guān)鍵幀特征作為優(yōu)化ID3決策樹的屬性值,對多媒體視頻幀數(shù)據(jù)集中連續(xù)屬性取值進行離散化處理,并求解每個條件屬性重要性,此處采取k-means++算法完成.其中,分裂節(jié)點選取重要性最高的屬性,以上為優(yōu)化的ID3算法的主要思想.經(jīng)過循環(huán)迭代,當全部條件屬性成為分裂節(jié)點時,結(jié)束循環(huán).剪枝處理,生成最終決策樹.優(yōu)化ID3算法詳細流程為:

(1)初始化多媒體視頻數(shù)據(jù)信息;

(2)對屬性值離散與否進行判定.當屬性值離散時,則進行下一步驟.當不能存在離散情況時,要確定離散化后取值數(shù)量,并對其使用k-means++算法進行離散化處理,用離散值代替原有連續(xù)值;

(3)對活躍條件屬性重要程度進行求解;

(4)對多媒體視頻樣本集進行劃分,分裂節(jié)點選取其中重要程度最高的條件屬性;

(5)再次劃分多媒體視頻樣本集,重復(3)和(4),選取其余條件屬性劃分多媒體視頻樣本集,當全部條件屬性都被當作分裂節(jié)點時,結(jié)束循環(huán)操作;

(6)剪枝,決策樹完成優(yōu)化.

將提取到的關(guān)鍵幀特征輸入優(yōu)化后的ID3決策樹進行分類,實現(xiàn)多媒體視頻關(guān)鍵幀提取.

2 實驗及結(jié)果分析

2.1 實驗環(huán)境

選用Matlab2021軟件進行仿真實驗,選取多媒體數(shù)據(jù)庫中500段視頻作為本次實驗對象,分別從提取效果以及性能兩方面進行分析驗證.

2.2 實驗結(jié)果分析

從數(shù)據(jù)庫中選取一段籃球比賽視頻片段進行投籃時的關(guān)鍵幀提取,部分圖像關(guān)鍵幀提取效果如圖3 所示.

分析圖3可知,該方法可有效提取籃球比賽視頻投籃的部分關(guān)鍵幀,依據(jù)該關(guān)鍵幀提取結(jié)果可分析該運行員投籃動作.

圖3 關(guān)鍵幀提取效果

為全面評價本文方法提取效果,開展密集型實驗,分別選出新聞、動畫、綜藝、電影和體育賽事5種不同特征類型的多媒體視頻作為樣本集,設定視頻長度區(qū)間范圍為5 000到6 000幀,利用本文方法提取各類型視頻關(guān)鍵幀,驗證其與人工檢測實際關(guān)鍵幀效果,關(guān)鍵幀提取效果如圖4 所示.

圖4 關(guān)鍵幀提取結(jié)果

分析圖4可知,本文方法檢測出的各類型視頻關(guān)鍵幀數(shù)量與人工檢測的關(guān)鍵幀總數(shù)幾乎一致,鑒于動畫、體育及綜藝3種視頻皆屬于復雜運動類型,提取關(guān)鍵幀總數(shù)與人工檢測關(guān)鍵幀總數(shù)相比僅存在1項漏洞,總體效果良好.另外,視頻關(guān)鍵幀提取受所選視頻的分辨率因素影響,由于這些視頻存在噪聲干擾,因此,結(jié)果中存在微少的誤判視為正?,F(xiàn)象.

為驗證本文方法的關(guān)鍵幀提取精度,將多媒體視頻幀樣本集等分為3部分,訓練數(shù)據(jù)選取前兩部分,其余一部分則作為測試集.驗證ID3決策樹優(yōu)化前后在遭受各類攻擊狀態(tài)下的關(guān)鍵幀提取準確率,擬設ID3決策樹優(yōu)化前后的節(jié)點數(shù)量及葉子節(jié)點數(shù)可進行自適應調(diào)節(jié),驗證關(guān)鍵幀提取準確率是否受外界干擾影響,即驗證本文方法的關(guān)鍵幀提取性能是否穩(wěn)定.遭受各種攻擊狀態(tài)下ID3決策樹優(yōu)化前后的準確率對比結(jié)果如表1 所列.

分析表1可知,ID3決策樹優(yōu)化前在遭受各類攻擊狀態(tài)時其準確率維持在82.5%到88.6%區(qū)間范圍內(nèi),整體偏低,性能略差;ID3決策樹優(yōu)化后的節(jié)點數(shù)及葉子節(jié)點數(shù)均為最少,同時準確率最高,全程保持在96.9%到98.8%,各種攻擊狀態(tài)下性能表現(xiàn)極佳,實驗證明該方法能夠準確提取海量多媒體視頻關(guān)鍵幀.

選用DR、ACC作為衡量本文方法關(guān)鍵幀提取性能的兩個指標,繼續(xù)開展實驗.DR代表多媒體視頻關(guān)鍵幀提取率;ACC代表決策樹能夠準確識別出假陰性及真陽性的占比,結(jié)果如圖5所示,橫坐標為多媒體視頻幀數(shù)量,圖中曲線表示隨著視頻幀數(shù)量的變化,DR、ACC兩者之間關(guān)系變化浮動大小.

分析圖5可知,隨著視頻幀數(shù)量的增加,DR及ACC兩項指標始終保持平穩(wěn)狀態(tài),不會過多受視頻幀數(shù)量干擾,證明本文方法的多媒體視頻關(guān)鍵幀提取性能整體優(yōu)秀.

表1 遭受各種攻擊狀態(tài)下2種方法的準確率

圖5 視頻幀數(shù)量對關(guān)鍵幀提取性能的影響

3 結(jié)語

當前,傳統(tǒng)視頻幀提取方法中由于視頻內(nèi)含有較多的冗余信息,難以提升關(guān)鍵幀的提取效果.本文提出基于決策樹的多媒體視頻關(guān)鍵幀實時提取方法.對視頻樣本集進行視頻幀的關(guān)鍵幀特征提取,將獲取的關(guān)鍵幀特征輸入優(yōu)化后的ID3決策樹,完成視頻關(guān)鍵幀提取.實驗結(jié)果證明,該方法能夠高效分類提取海量多媒體視頻關(guān)鍵幀,在不同視頻幀數(shù)量下提取性能較好.

猜你喜歡
關(guān)鍵幀決策樹增益
基于增益調(diào)度與光滑切換的傾轉(zhuǎn)旋翼機最優(yōu)控制
基于單片機的程控增益放大器設計
電子制作(2019年19期)2019-11-23 08:41:36
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
基于Multisim10和AD603的程控增益放大器仿真研究
電子制作(2018年19期)2018-11-14 02:37:02
決策樹和隨機森林方法在管理決策中的應用
電子制作(2018年16期)2018-09-26 03:27:06
基于改進關(guān)鍵幀選擇的RGB-D SLAM算法
基于決策樹的出租車乘客出行目的識別
基于相關(guān)系數(shù)的道路監(jiān)控視頻關(guān)鍵幀提取算法
基于聚散熵及運動目標檢測的監(jiān)控視頻關(guān)鍵幀提取
基于肺癌CT的決策樹模型在肺癌診斷中的應用
英山县| 宜宾县| 克什克腾旗| 凤山县| 锡林浩特市| 浙江省| 小金县| 朝阳县| 宁南县| 无极县| 大邑县| 海宁市| 南丰县| 武鸣县| 屯昌县| 长沙市| 德州市| 白玉县| 宁远县| 平乐县| 靖西县| 三门峡市| 蓬莱市| 吉安县| 行唐县| 江口县| 红安县| 濉溪县| 鄄城县| 凤台县| 靖边县| 金山区| 沅陵县| 西畴县| 黄骅市| 兰西县| 盐源县| 台湾省| 南康市| 垦利县| 长沙市|