劉明明
?
人工智能研究的新前線:生成式對(duì)抗網(wǎng)絡(luò)
劉明明
武警工程大學(xué)密碼工程學(xué)院,陜西 西安 710086
得益于計(jì)算能力的提高、信息化工具的普及以及數(shù)據(jù)量的積累,人工智能研究的迫切性和可行性都大為提高,近些年來實(shí)現(xiàn)了一系列新突破和新應(yīng)用,并獲得了可觀的收益。這些企業(yè)獲得的成功進(jìn)一步帶動(dòng)了機(jī)器學(xué)習(xí)的研究熱度,使得人工智能的研究進(jìn)入了一個(gè)新的高潮時(shí)期。對(duì)人工智能研究的新方法——生成式對(duì)抗網(wǎng)絡(luò)進(jìn)行了分析和研究,為其進(jìn)一步發(fā)展打下堅(jiān)實(shí)的基礎(chǔ)。
生成式對(duì)抗網(wǎng)絡(luò);人工智能;研究
近年來,很多學(xué)者開始嘗試以對(duì)抗網(wǎng)絡(luò)進(jìn)行人工智能方面的研究,而且已成為該領(lǐng)域的研究熱點(diǎn)。該方法是受到運(yùn)籌學(xué)相關(guān)理論的影響而逐步形成的,屬于一種全局概率收縮。國內(nèi)外很多學(xué)者都開始在人工智能研究中應(yīng)用對(duì)抗網(wǎng)絡(luò),而且取得的成果也是十分可喜的。然而,由于基于對(duì)抗網(wǎng)絡(luò)的測試要求全部數(shù)據(jù)都需要運(yùn)行,進(jìn)而實(shí)現(xiàn)對(duì)測試數(shù)據(jù)性能的有效分析,這就導(dǎo)致耗費(fèi)的時(shí)間較長[1]。
一是信息量大。根據(jù)統(tǒng)計(jì),人工智能范疇內(nèi)每天產(chǎn)生的內(nèi)容可以制作成2億張光盤。這些人工智能數(shù)據(jù)表明在互聯(lián)網(wǎng)時(shí)代,社交網(wǎng)絡(luò)和移動(dòng)互聯(lián)網(wǎng)絡(luò)已把人們的信息量擴(kuò)大了很多。人工智能數(shù)據(jù)的大不僅是信息量大,而且信息也非常全面。很多信息都可以使用計(jì)算機(jī)來集聚,使其滿足分析的需求。
二是多樣化程度高。目前,人工智能數(shù)據(jù)類型已經(jīng)不僅是文本形式,而且存在有大量的圖片、音頻等超文本信息。從結(jié)構(gòu)上來看,人工智能數(shù)據(jù)的結(jié)構(gòu)變化多樣,很多人工智能數(shù)據(jù)的結(jié)構(gòu)并不是傳統(tǒng)的結(jié)構(gòu)化人工智能數(shù)據(jù),因此需要采用更高效的技術(shù)手段和硬件設(shè)備來對(duì)其進(jìn)行處理,才能夠更好地讀取這些人工智能數(shù)據(jù)當(dāng)中所蘊(yùn)藏的價(jià)值[2]。
三是人工智能數(shù)據(jù)價(jià)值大。網(wǎng)絡(luò)每天都會(huì)產(chǎn)生大量有價(jià)值的信息和一些噪聲信息。這些原始信息中所含的核心內(nèi)容還是很少的。人們需要在大量的人工智能數(shù)據(jù)中進(jìn)行尋找,才能夠找到自己真正需要的。如何采用更好的算法來對(duì)其進(jìn)行人工智能數(shù)據(jù)的挖掘,將人工智能數(shù)據(jù)當(dāng)中有用的信息提取出來是目前人工智能數(shù)據(jù)研究領(lǐng)域當(dāng)中非常重要的一個(gè)課題[3]。
四是速度快。人工智能數(shù)據(jù)的產(chǎn)生速度是非??斓?,在金融、證券等多個(gè)領(lǐng)域,需要及時(shí)進(jìn)行傳輸,需要對(duì)其進(jìn)行較快的處理和分析。信息如果沒有被實(shí)時(shí)挖掘,就可能成為無效信息。如何采用更有效的算法來傳輸信息是非常關(guān)鍵的。提升人工智能數(shù)據(jù)的處理效率有利于社會(huì)的進(jìn)一步發(fā)展。
生成式對(duì)抗網(wǎng)絡(luò)的主要思想是設(shè)置一個(gè)零和博弈,通過兩個(gè)玩家的對(duì)抗實(shí)現(xiàn)學(xué)習(xí)。博弈中的一名玩家稱為生成器,它的主要工作是生成樣本,并盡量使得其看上去與訓(xùn)練樣本一致。另外一名玩家稱為判別器。生成式對(duì)抗網(wǎng)絡(luò)的訓(xùn)練過程類似于偽鈔制造者盡可能地提高偽鈔制作水平以騙過警察,而警察則不斷提高鑒別能力以識(shí)別偽鈔。隨著生成式對(duì)抗網(wǎng)絡(luò)的不斷訓(xùn)練,偽鈔制造者與警察的能力都會(huì)不斷提高[4]。通過整個(gè)過程,不斷提升判別器的性能,有利于對(duì)圖像文本等信息進(jìn)行進(jìn)一步的特征提取與挖掘,使其特征更加清晰地展示出來,從而提升準(zhǔn)確率。
2.2.1 網(wǎng)絡(luò)數(shù)據(jù)流分析
利用生成式對(duì)抗網(wǎng)絡(luò)對(duì)用戶產(chǎn)生的視頻網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行科學(xué)分析是非常重要的技術(shù)。分析網(wǎng)絡(luò)數(shù)據(jù)的前提是保存和挖掘數(shù)據(jù)流。網(wǎng)絡(luò)數(shù)據(jù)流指的是通過互聯(lián)網(wǎng)爬蟲等方式研究網(wǎng)上的主題以及相應(yīng)的傳播情況。這種技術(shù)的主要問題是只有具備較好的準(zhǔn)確性,才能夠避免信息的重復(fù)和冗雜,同時(shí)生成式對(duì)抗網(wǎng)絡(luò)實(shí)時(shí)性只有非常好,才能夠更好地捕捉到熱點(diǎn)。對(duì)突發(fā)事件進(jìn)行處理,人們很多時(shí)候是通過歷史數(shù)據(jù)來進(jìn)行數(shù)據(jù)分析的,但是有時(shí)候這樣的分析并不具有科學(xué)性,因?yàn)楹芏嘈畔⒌淖兓厔莶⒉皇前凑諅鹘y(tǒng)的信息流進(jìn)行傳遞的,因此需要借助計(jì)算機(jī)強(qiáng)大的運(yùn)算力進(jìn)行優(yōu)化。
2.2.2 短文本信息挖解決
短文本是受到廣泛關(guān)注的信息形式。利用生成式對(duì)抗網(wǎng)絡(luò)可以獲得大量信息,但很多時(shí)候文本中也包含很多垃圾信息,因此用戶產(chǎn)生的一些信息并不都是有必要被采集的,我們需要做好轉(zhuǎn)文本的分析和挖掘工作。只有排除重要性程度較低的信息,才能高效率地收集與推送信息。通過對(duì)抗網(wǎng)絡(luò)的逐次逼近來優(yōu)化策略,越來越接近于實(shí)際的需求,這樣就可以得到最優(yōu)的指標(biāo)。通常情況是用兩個(gè)神經(jīng)網(wǎng)絡(luò)優(yōu)化控制函數(shù),這樣就能有效地分析文本分析問題中的信息特征。
2.2.3 可視化數(shù)據(jù)技術(shù)
可視化數(shù)據(jù)非常多。很多媒體在圖像上進(jìn)行關(guān)鍵詞的標(biāo)注,利用生成式對(duì)抗網(wǎng)絡(luò)提取圖像的特征,把圖像轉(zhuǎn)換為文本,也將一些文本轉(zhuǎn)換為圖像描述。這樣就將數(shù)據(jù)進(jìn)行了可視化,對(duì)于數(shù)據(jù)挖掘分析來說是極為關(guān)鍵的??梢暬瘮?shù)據(jù)技術(shù)可以融合信息,做到信息較高層次的匹配,使信息的可用程度更強(qiáng)[3]。
2.2.4 工業(yè)圖像分析
在以往的工業(yè)生產(chǎn)中,超聲波、紅外燈無線傳感器測距定位的方法被廣泛應(yīng)用于各種工業(yè)現(xiàn)場。雖然這種方法經(jīng)過長時(shí)間的廣泛應(yīng)用技術(shù)已十分成熟,但是這種固定線路的測距定位往往十分笨拙,可變性差。近些年來,國內(nèi)外許多專家學(xué)者利用智能裝備,結(jié)合生成式對(duì)抗網(wǎng)絡(luò)的理論和在各個(gè)領(lǐng)域的實(shí)際應(yīng)用進(jìn)行了相關(guān)研究,研究成果豐碩。因此在如今的科學(xué)技術(shù)下,將機(jī)器視覺引入工業(yè)生產(chǎn)領(lǐng)域已成為可能。通過Python腳本語言編程來實(shí)現(xiàn)控制攝像頭聚焦判斷工業(yè)設(shè)備空間位置信息、提取數(shù)據(jù)特征和顏色追蹤以及引導(dǎo)火控計(jì)算機(jī)追蹤物體等功能。這使得OpenCV可以快速獲得圖像信息,并使得生成式對(duì)抗網(wǎng)絡(luò)定位系統(tǒng)可以得到更多的位置信息,然而在生成式對(duì)抗網(wǎng)絡(luò)實(shí)際應(yīng)用中,由于工作環(huán)境處于室外,從早上開工到下午工作結(jié)束環(huán)境光強(qiáng)度變化明顯且極易受環(huán)境影響。生成式對(duì)抗網(wǎng)絡(luò)法是一種利用Tag標(biāo)記粘貼到物體進(jìn)而判斷物體距離的方法,所以極易因環(huán)境光線強(qiáng)度的變化而失效。在實(shí)驗(yàn)過程中,環(huán)境光的變化會(huì)直接導(dǎo)致黑白像素差的減少,標(biāo)志位識(shí)別出錯(cuò)。如果貿(mào)然將其應(yīng)用在生成式對(duì)抗網(wǎng)絡(luò)上,就很可能會(huì)定位失敗。因此也可以使用攝像頭可視角度測距法作為環(huán)境光較弱時(shí)生成式對(duì)抗網(wǎng)絡(luò)法失效時(shí)的替代方案。
在生成式對(duì)抗網(wǎng)絡(luò)的運(yùn)行中,我們需要解決項(xiàng)目的維護(hù)和運(yùn)行中存在的問題,管理好系統(tǒng)的驗(yàn)收工作,對(duì)系統(tǒng)的運(yùn)行質(zhì)量負(fù)責(zé)。做好整個(gè)項(xiàng)目過程中的抗干擾管理,在調(diào)研系統(tǒng)需求中就要進(jìn)行風(fēng)險(xiǎn)識(shí)別,提前預(yù)測與解決可能出現(xiàn)的問題,以便取得較好的效果。
[1]孫玉強(qiáng),彭磊,李慧云. 基于循環(huán)生成式對(duì)抗網(wǎng)絡(luò)實(shí)現(xiàn)停車場時(shí)空數(shù)據(jù)的修復(fù)[J]. 集成技術(shù),2018(6):1-2.
[2]馮浩. 基于Maximum Mean Discrepancy的生成式對(duì)抗網(wǎng)絡(luò)研究[D]. 上海:華東師范大學(xué),2018.
[3]尹傳龍. 基于深度學(xué)習(xí)的網(wǎng)絡(luò)異常檢測技術(shù)研究[D].鄭州:中國人民解放軍戰(zhàn)略支援部隊(duì)信息工程大學(xué),2018.
[4]張衛(wèi),馬麗,黃金. 基于生成式對(duì)抗網(wǎng)絡(luò)的人臉識(shí)別開發(fā)[J]. 電子世界,2017(20):164-165.
New Frontiers in Artificial Intelligence Research:Generative Adversarial Networks
Liu Mingming
School of Cryptography, Engineering University of PAP, Shaanxi Xi’an 710086
Thanks to the improvement of computing power,the popularization of information tools and the accumulation of data, the urgency and feasibility of artificial intelligence research has been greatly improved. In recent years, a series of new breakthroughs and new applications have been realized. The success of these companies has further stimulated the research of machine learning, which has brought the research of artificial intelligence to a new climax. The paper analyzes and studies generative adversarial networks, a new method of artificial intelligence research, and lays a solid foundation for its further development.
generative adversarial networks; artificial intelligence; study
TN912.35
A
劉明明(1992—),男,漢族,山東五蓮人,研究生學(xué)歷,研究方向?yàn)樾畔㈦[藏、生成對(duì)抗網(wǎng)絡(luò)。