張本茂 李森森
摘 要 近年來,先進科學(xué)技術(shù)的發(fā)展推動了社會和行業(yè)發(fā)展,越來越多的科學(xué)技術(shù)逐漸得到了開發(fā)和使用,而機器學(xué)習(xí)作為一種智能化科技手段,成為人們關(guān)注的熱點和焦點內(nèi)容。目前,在很多領(lǐng)域內(nèi)都對機器學(xué)習(xí)實現(xiàn)了運用,盡管視頻識別比圖像識別難度更大,機器學(xué)習(xí)依然實現(xiàn)了對視頻的智能識別效果。下面,本文就針對機器學(xué)習(xí)在視頻智能識別中的實踐進行分析,希望對相關(guān)工作研究提供參考。
關(guān)鍵詞 機器學(xué)習(xí);視頻識別;智能識別;實踐應(yīng)用
前言
視頻是一種連續(xù)性動態(tài)化圖片集合狀態(tài),而想要實現(xiàn)對視頻圖像有效識別,對識別系統(tǒng)的性能要求是很高的,而在很多領(lǐng)域內(nèi)都需要使用到視頻圖像的識別技術(shù),且他們一般都是通過人工方式完成,距離智能識別的目標還比較遠。而基于機器學(xué)習(xí),就借助智能化的手段能夠?qū)崿F(xiàn)對視頻智能化的識別效果,但在實際的運用中還處在探索和改進階段,而機器學(xué)習(xí)如何在視頻智能識別中進行實踐應(yīng)用,就是本文主要研究的內(nèi)容。
1視頻智能識別中機器學(xué)習(xí)研究背景
新時期環(huán)境下,人們對人工智能技術(shù)的研究十分關(guān)注,而機器學(xué)習(xí)就是一種人工智能技術(shù)的手段,通過機器學(xué)習(xí)能夠?qū)崿F(xiàn)對諸多領(lǐng)域工作的完成,其中借助機器學(xué)習(xí)進行圖像識別已經(jīng)在生活中得到了普遍的應(yīng)用。如借助遙感影像對房屋和道路等識別、按照快遞單號對快遞實現(xiàn)分揀和遞送、借助違章拍攝的視頻對違章車輛的車牌號碼實現(xiàn)識別等[1]。目前,物聯(lián)網(wǎng)的技術(shù)得到逐漸發(fā)展和應(yīng)用普及,在城市內(nèi)所設(shè)置監(jiān)察點都進行各類的攝像頭布設(shè),來供不同的單位以及部門進行數(shù)據(jù)的調(diào)用和分析,來推動智慧城市建設(shè)和發(fā)展;同時互聯(lián)網(wǎng)環(huán)境內(nèi)存在大量的視頻資源,這類視頻資源各種各樣,對網(wǎng)站視頻審核存在很大的難度。而借助機器學(xué)習(xí)就能夠有效實現(xiàn)目標的識別,現(xiàn)階段識別對象已經(jīng)從像素向圖像延伸,視頻作為大量圖像連續(xù)性時間狀態(tài)下所產(chǎn)生的動態(tài)化信息,被當作計算機的視覺里暗物質(zhì)類型,其不能和圖片一樣達到便捷搜索的目的,也不能像圖片將像素單做基本單元實施像素灰度的差異性分析和識別,所以視頻的智能識別具有很大的挑戰(zhàn),需要繼續(xù)進行研究和實踐探索[2]。
2機器學(xué)習(xí)在視頻智能識別中的實踐
在人工智能研究中,機器學(xué)習(xí)占據(jù)著核心位置,它主要是對計算機如何對人類學(xué)習(xí)的行為實施模擬和實現(xiàn),獲取新知識和技能,并對已有知識的結(jié)構(gòu)重新進行組織,實現(xiàn)對自身性能的不斷改善。它不再嚴格按照人員操作的步驟死板地進行工作的完成,用戶僅僅輸入相應(yīng)數(shù)據(jù)和參數(shù),則機器學(xué)習(xí)就能夠按照內(nèi)在的機制實現(xiàn)智能化地運行和計算,且給出相應(yīng)的分析結(jié)果,因此機器學(xué)習(xí)其實已經(jīng)具備人類一定程度對事情處理的能力[3]。由于視頻數(shù)據(jù)和圖片數(shù)據(jù)對比,呈現(xiàn)出動態(tài)化、海量化和實時化特點,它是大數(shù)據(jù)重要的對象,借助機器學(xué)習(xí)能夠?qū)A恳曨l數(shù)據(jù)資源實現(xiàn)高效和高精度的識別,這也是大數(shù)據(jù)技術(shù)研究中的重點內(nèi)容。
通過機器學(xué)習(xí)對視頻實現(xiàn)智能識別,主要原理是使用機器學(xué)習(xí)的算法來對視頻資源內(nèi)的對象相應(yīng)訓(xùn)練樣本實施模擬性訓(xùn)練,建立出符合智能化識別精度標準的學(xué)習(xí)模型類型,將已經(jīng)訓(xùn)練完成的模型當作核心,對需要識別的視頻數(shù)據(jù)實施模型的實踐以及推理,從而從視頻的數(shù)據(jù)內(nèi)實現(xiàn)對目標對象的快速準確檢測和識別[4]。
在現(xiàn)階段國際IT企業(yè)都在加大對視頻的智能識別相關(guān)工作的研究,而谷歌所公布的新型機器學(xué)習(xí)平臺API,它能夠?qū)σ曨l內(nèi)物體實現(xiàn)自動識別效果,相關(guān)開發(fā)者在視頻的內(nèi)部開發(fā)出對目標偵測的程序,將視頻轉(zhuǎn)變?yōu)槟軌蛩阉骱桶l(fā)現(xiàn)的動態(tài)視頻。借助動詞或者名詞對此類目標對象代表,如“跑”和“狗”等,后實施搜索就能夠?qū)⒁曨l內(nèi)相應(yīng)信息實現(xiàn)有效提取[5]。在此API平臺中,其工作的原理主要是在服務(wù)和應(yīng)用間設(shè)置相應(yīng)橋梁,把新的API和谷歌云的機器學(xué)習(xí)平臺實施連接,此平臺發(fā)揮計算功能;并且此API還能夠把完成注釋后的視頻在谷歌的云存儲內(nèi)存儲。通過谷歌的新型API所開發(fā)出應(yīng)用的程序,具備特殊性的功能,能夠讓終端的用戶對視頻內(nèi)目標實現(xiàn)便捷的搜索;同時用戶能夠在視頻的文件內(nèi)對每個瞬間實現(xiàn)搜索,對事件查找和意義的探尋;此API平臺還能夠使用戶于視頻內(nèi)進行名詞實體的確定,對視頻內(nèi)目標對象出現(xiàn)時間和出現(xiàn)頻率實施確定,另外還能夠?qū)σ曨l和照片內(nèi)每一幀相關(guān)的信息檢索,實現(xiàn)了對信號以及噪音的有效分離效果。
使用API平臺來對某動物案例實施智能識別的演示,對案例的演示中,于MP4的視頻文件內(nèi)進行動物的搜索,文件的時長約是1.5min。API平臺會生成相應(yīng)的標簽,如動物園、動物、旅游、陸生的動物和自然等。此API能夠?qū)σ曨l的場景進行偵測,如在相同演示的視頻內(nèi),借助此API平臺發(fā)現(xiàn)了場景出現(xiàn)48次變化,其能夠?qū)ψ兓瘜崿F(xiàn)實時性偵測,在場景出現(xiàn)變化時對目標物進行標簽的標貼;其中有一幕顯示出老虎的場景,則API的平臺就產(chǎn)生7種類型標簽的標注;還有一幕是關(guān)于動物園進行標志,此系統(tǒng)產(chǎn)生兩種類型的標簽,此類標簽實時產(chǎn)生,這也體現(xiàn)出視頻的智能識別具有的功能和特征。借助API平臺,用戶能夠使用工具對視頻內(nèi)目標實施搜索,和文檔搜索相似,且對視頻內(nèi)目標實施搜索和識別的準確定和效率性都十分高。
3結(jié)束語
綜上所述,機器學(xué)習(xí)是人工智能技術(shù)的重要體現(xiàn),它在視頻智能識別具有顯著的應(yīng)用價值,為了更好促進其在視頻智能識別中的應(yīng)用且提高其應(yīng)用的效果,還需要對其技術(shù)進行不斷地實踐探索,來更好推動行業(yè)應(yīng)用和發(fā)展。
參考文獻
[1] 楊永吉,史麗娟,趙劍,等.基于機器學(xué)習(xí)的視頻表情識別研究[J].無線互聯(lián)科技,2018,134(10):150-152.
[2] 盧旻昊,邱文嘉,董小舒.基于特征點篩選的實時視頻拼接算法[J].指揮信息系統(tǒng)與技術(shù),2018,9(2):85-88.
[3] 屠要峰,吉鋒,文韜.機器學(xué)習(xí)在大視頻運維中的應(yīng)用[J].中興通訊技術(shù),2017,23(4):1-8.
[4] 李帥.基于機器學(xué)習(xí)的運動目標識別與跟蹤技術(shù)研究[J].中國科學(xué)院長春光學(xué)精密機械與物理研究所,2016(6):63.
[5] 張祥,王紫悅,楊清清,等.基于知識圖譜的實體標簽可視化[J].指揮信息系統(tǒng)與技術(shù),2020,11(3):1-9.