小樣本類人概念學(xué)習(xí)與大數(shù)據(jù)深度強(qiáng)化學(xué)習(xí)的對(duì)比分析

2020-10-09 11:18肖堅(jiān)

速讀·下旬 2020年1期

關(guān)鍵詞：對(duì)比

肖堅(jiān)

摘要：本文對(duì)小樣本類人概念學(xué)習(xí)與大數(shù)據(jù)深度強(qiáng)化學(xué)習(xí)進(jìn)行對(duì)比分析，文中對(duì)大數(shù)據(jù)深度強(qiáng)化學(xué)習(xí)、小樣本類人概念學(xué)習(xí)兩者含義、發(fā)展、優(yōu)劣等進(jìn)行了探討，最后對(duì)兩者進(jìn)行總體比較。

關(guān)鍵詞：小樣本學(xué)習(xí);類人概念學(xué)習(xí);深度強(qiáng)化學(xué)習(xí);對(duì)比

在現(xiàn)代計(jì)算機(jī)發(fā)展的過(guò)程中，機(jī)器學(xué)習(xí)是現(xiàn)階段較為新穎的領(lǐng)域，但實(shí)際上是極為寬泛的概念，大數(shù)據(jù)深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)是其中較為重要的分支，深度強(qiáng)化學(xué)習(xí)則是兩種學(xué)習(xí)算法的融合。小樣本類人概念也是較為新穎的概念，相比于深度強(qiáng)化學(xué)習(xí)，其有更多待發(fā)掘的內(nèi)涵。

一、大數(shù)據(jù)深度強(qiáng)化學(xué)習(xí)

深度學(xué)習(xí)最初發(fā)展于2006年，是一種機(jī)器學(xué)習(xí)中隱藏建模數(shù)據(jù)分布、多層表達(dá)的算法。換言之，深度學(xué)習(xí)算法能夠?qū)Ψ诸愔行枨蟮牡讓踊蛘吒邔犹卣鞯淖詣?dòng)提取。所以深度學(xué)習(xí)算法對(duì)于數(shù)據(jù)特征能夠進(jìn)行更好的進(jìn)行表達(dá)，同時(shí)因?yàn)槟Ｐ蛥?shù)和層次多，容量也極大，能夠進(jìn)行大規(guī)模數(shù)據(jù)表示，對(duì)于語(yǔ)音、圖形此類特征不明顯數(shù)據(jù)，能夠使用深度學(xué)習(xí)算法進(jìn)行大規(guī)模數(shù)據(jù)訓(xùn)練，效果也能夠保證良好。深度學(xué)習(xí)算法模型中，會(huì)把特征與分類器進(jìn)行結(jié)合，形成一個(gè)框架，之后使用數(shù)據(jù)進(jìn)行特征的學(xué)習(xí)，以此也使得使用中手工提取特征這一工作減少，學(xué)習(xí)算法中的工作量大大降低，因此使用便利、效果良好。深度學(xué)習(xí)算法使得數(shù)據(jù)處理中語(yǔ)音及圖像的識(shí)別得到極大推動(dòng)。

強(qiáng)化學(xué)習(xí)則是一種連續(xù)決策過(guò)程，該算法的最大特點(diǎn)就是對(duì)任何數(shù)據(jù)都不會(huì)進(jìn)行標(biāo)注，只會(huì)提供唯一回報(bào)函數(shù)，這一函數(shù)對(duì)當(dāng)前狀態(tài)結(jié)果有著決定性的影響。從數(shù)學(xué)的額角度來(lái)看，也是馬爾科夫決策過(guò)程。強(qiáng)化學(xué)習(xí)最終的目標(biāo)是使得決策過(guò)程中整體回報(bào)函數(shù)期望最優(yōu)化。在經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，深度學(xué)習(xí)算法對(duì)于較多實(shí)際問(wèn)題有了解決辦法，比如圖像搜索、人臉識(shí)別、色情語(yǔ)言識(shí)別、實(shí)時(shí)翻譯等。強(qiáng)化學(xué)習(xí)與深度學(xué)習(xí)的融合，使深度學(xué)習(xí)得到更為長(zhǎng)遠(yuǎn)的發(fā)展，比如進(jìn)行游戲深度學(xué)習(xí)網(wǎng)絡(luò)的建立，就能夠在強(qiáng)化學(xué)習(xí)的支持下，實(shí)現(xiàn)自己與自己對(duì)戰(zhàn)，不斷實(shí)現(xiàn)自我的進(jìn)化。

二、小樣本類人概念學(xué)習(xí)

深度學(xué)習(xí)在得到開(kāi)發(fā)前，人工神經(jīng)網(wǎng)絡(luò)也曾風(fēng)靡一時(shí)。上世紀(jì)八十年代末，人工神經(jīng)網(wǎng)絡(luò)中應(yīng)用的反向傳播算法出現(xiàn)，使得以統(tǒng)計(jì)模型為基礎(chǔ)的機(jī)器學(xué)習(xí)得到發(fā)展。此前，有研究人員希望通過(guò)BP算法使人工神經(jīng)算法模型從訓(xùn)練中學(xué)習(xí)統(tǒng)計(jì)性的規(guī)律，以此使其獲得對(duì)未來(lái)進(jìn)行預(yù)測(cè)的能力。BP算法無(wú)法實(shí)現(xiàn)這一目標(biāo)，所以在上世界九十年代這一浪潮便逐漸平息。但是在BP算法的發(fā)展過(guò)程中，也有了更多的新奇思路，使以統(tǒng)計(jì)為基礎(chǔ)的機(jī)器學(xué)習(xí)算法和以人工規(guī)則為基礎(chǔ)的系統(tǒng)得到對(duì)比，明確了以統(tǒng)計(jì)為基礎(chǔ)的機(jī)器學(xué)習(xí)算法在較多方面都擁有先天的優(yōu)勢(shì)。但深度學(xué)習(xí)也并非無(wú)所不能，科學(xué)進(jìn)步都存在一定兩面性，一方面是優(yōu)勢(shì)提升，一方面是限制增大。

在機(jī)器學(xué)習(xí)的整個(gè)行業(yè)而言，深度學(xué)習(xí)對(duì)于行業(yè)所要求的人工智能需求也是難以達(dá)成的。深度學(xué)習(xí)是以大數(shù)據(jù)為基礎(chǔ)，在多層網(wǎng)絡(luò)的處理下實(shí)現(xiàn)抽象概念理念，這也說(shuō)明在進(jìn)行應(yīng)用中，數(shù)據(jù)越多則擁有更好的效果。但是也即是說(shuō)，在沒(méi)有大數(shù)據(jù)支持的情況下，或者數(shù)據(jù)量較小的情況下，便無(wú)法進(jìn)行學(xué)習(xí)。人類知識(shí)與深度學(xué)習(xí)有一定相似之處，都是通過(guò)積累所得，但人類在知識(shí)的沒(méi)有積累的情況下，也可以根據(jù)形貌進(jìn)行分析、學(xué)習(xí)，進(jìn)而模仿。深度學(xué)習(xí)從這一方面來(lái)看，與人類智能還存在較大的差距，人類在陌生環(huán)境中可以通過(guò)學(xué)習(xí)來(lái)對(duì)變化進(jìn)行適應(yīng)。所以類人概念學(xué)習(xí)的發(fā)展過(guò)程中，對(duì)于深度學(xué)習(xí)存在的弊端進(jìn)行改良，可以再?zèng)]有大數(shù)據(jù)的情況下自行學(xué)習(xí)，這一概念也被研究者稱為小樣本學(xué)習(xí)。

小樣本學(xué)習(xí)早在神經(jīng)網(wǎng)絡(luò)出現(xiàn)之前就已經(jīng)被提出，而關(guān)鍵核心為貝葉斯規(guī)劃學(xué)習(xí)，也被稱作BPL方法。該方法是通過(guò)參數(shù)先驗(yàn)分布，使用小樣本數(shù)據(jù)進(jìn)行后驗(yàn)分布的計(jì)算，進(jìn)而得到總體分布。該方法是使用概率進(jìn)行所有形式不確定性的標(biāo)識(shí)，通過(guò)概率規(guī)則來(lái)進(jìn)行推理和學(xué)習(xí)。BPL方法是以人類思維作為基礎(chǔ)的方法，即能夠不依賴大量數(shù)據(jù)來(lái)進(jìn)行學(xué)習(xí)，只需要小樣本便能迅速進(jìn)行學(xué)習(xí)精髓。拿漢字為例，將一個(gè)漢字作為小樣本使用BPL方法進(jìn)行學(xué)習(xí)，很快便能夠?qū)W習(xí)到精髓，并寫(xiě)出該漢字，甚至能夠?qū)⑵渌愃莆淖謱?xiě)出。因?yàn)樵摲椒總€(gè)訓(xùn)練樣本都能進(jìn)行增量升高或降低一種假設(shè)估計(jì)概率，BPL方法也順利達(dá)成視覺(jué)圖靈測(cè)試要求，而其他算法對(duì)于某一假設(shè)和其他任何樣本不統(tǒng)一時(shí)，將假設(shè)摒棄。BLP方法在進(jìn)行應(yīng)用中，對(duì)于概率初始知識(shí)有所要求的，在概率位置的情況下可以根據(jù)數(shù)據(jù)、背景知識(shí)、基準(zhǔn)分布假設(shè)來(lái)進(jìn)行此類概率的估算。

三、小樣本類人概念學(xué)習(xí)與大數(shù)據(jù)深度強(qiáng)化學(xué)習(xí)的對(duì)比分析

通過(guò)上文對(duì)兩個(gè)學(xué)習(xí)算法的分析來(lái)看，深度學(xué)習(xí)算法在現(xiàn)階段中已經(jīng)獲得重大成功，但是在未來(lái)發(fā)展過(guò)程中其也具有較大的局限性，最為突出的便是深度學(xué)習(xí)使用的效果是與數(shù)據(jù)量成正比的，同時(shí)在較多任務(wù)中表現(xiàn)一般;而B(niǎo)PL方法則對(duì)機(jī)器學(xué)習(xí)、認(rèn)知科學(xué)、人工智能有著極大貢獻(xiàn)，在未來(lái)發(fā)展中也具有一定前景。深度學(xué)習(xí)對(duì)于計(jì)算機(jī)中的大數(shù)據(jù)處理需求進(jìn)行了滿足，實(shí)現(xiàn)大量數(shù)據(jù)中習(xí)得抽象概念;BPL方法使得樣本量小的情況下機(jī)器學(xué)習(xí)實(shí)現(xiàn)，能夠?qū)π颖具M(jìn)行學(xué)習(xí)、決策。更加形象化的理解，深度學(xué)習(xí)能夠?qū)σ?guī)律、趨勢(shì)進(jìn)行分析和預(yù)測(cè)，而B(niǎo)PL方法則能當(dāng)機(jī)立斷，舉一反三;深度學(xué)習(xí)與人類閱讀書(shū)籍一樣，積累會(huì)形成相應(yīng)的判斷能力，BPL方法則是通過(guò)個(gè)案學(xué)習(xí)來(lái)進(jìn)行迅速化的決策。

四、結(jié)論

本文對(duì)兩種學(xué)習(xí)算法進(jìn)行了分析和對(duì)比，明確了兩種算法自身存在的有點(diǎn)及缺陷：小樣本類人概念學(xué)習(xí)算法具有通過(guò)小樣本學(xué)習(xí)迅速?zèng)Q斷的能力，但有一定概率錯(cuò)誤，尤其在先驗(yàn)概率為形成的情況下;大數(shù)據(jù)深度強(qiáng)化學(xué)習(xí)通過(guò)大量數(shù)據(jù)的學(xué)習(xí)，來(lái)形成判斷能力大，判斷也有錯(cuò)誤概率，但相對(duì)BPL更小，但明顯依賴大數(shù)據(jù)數(shù)量。在應(yīng)用中，兩者并非是互相對(duì)立的，反而能夠通過(guò)借鑒、互補(bǔ)實(shí)現(xiàn)學(xué)習(xí)算法進(jìn)一步發(fā)展。

參考文獻(xiàn)

[1]崔小洛，欒曉飛，基于深度強(qiáng)化學(xué)習(xí)的圖像修復(fù)算法設(shè)計(jì)[J].物聯(lián)網(wǎng)技術(shù)，2019（06）：58-60.

[2]李旭，曹繼征，大數(shù)據(jù)在公安交通管理中的應(yīng)用探討[J].環(huán)球市場(chǎng)，2018（09）：166-167.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

小樣本類人概念學(xué)習(xí)與大數(shù)據(jù)深度強(qiáng)化學(xué)習(xí)的對(duì)比分析