肖堅(jiān)
摘要:本文對(duì)小樣本類人概念學(xué)習(xí)與大數(shù)據(jù)深度強(qiáng)化學(xué)習(xí)進(jìn)行對(duì)比分析,文中對(duì)大數(shù)據(jù)深度強(qiáng)化學(xué)習(xí)、小樣本類人概念學(xué)習(xí)兩者含義、發(fā)展、優(yōu)劣等進(jìn)行了探討,最后對(duì)兩者進(jìn)行總體比較。
關(guān)鍵詞:小樣本學(xué)習(xí);類人概念學(xué)習(xí);深度強(qiáng)化學(xué)習(xí);對(duì)比
在現(xiàn)代計(jì)算機(jī)發(fā)展的過(guò)程中,機(jī)器學(xué)習(xí)是現(xiàn)階段較為新穎的領(lǐng)域,但實(shí)際上是極為寬泛的概念,大數(shù)據(jù)深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)是其中較為重要的分支,深度強(qiáng)化學(xué)習(xí)則是兩種學(xué)習(xí)算法的融合。小樣本類人概念也是較為新穎的概念,相比于深度強(qiáng)化學(xué)習(xí),其有更多待發(fā)掘的內(nèi)涵。
一、大數(shù)據(jù)深度強(qiáng)化學(xué)習(xí)
深度學(xué)習(xí)最初發(fā)展于2006年,是一種機(jī)器學(xué)習(xí)中隱藏建模數(shù)據(jù)分布、多層表達(dá)的算法。換言之,深度學(xué)習(xí)算法能夠?qū)Ψ诸愔行枨蟮牡讓踊蛘吒邔犹卣鞯淖詣?dòng)提取。所以深度學(xué)習(xí)算法對(duì)于數(shù)據(jù)特征能夠進(jìn)行更好的進(jìn)行表達(dá),同時(shí)因?yàn)槟P蛥?shù)和層次多,容量也極大,能夠進(jìn)行大規(guī)模數(shù)據(jù)表示,對(duì)于語(yǔ)音、圖形此類特征不明顯數(shù)據(jù),能夠使用深度學(xué)習(xí)算法進(jìn)行大規(guī)模數(shù)據(jù)訓(xùn)練,效果也能夠保證良好。深度學(xué)習(xí)算法模型中,會(huì)把特征與分類器進(jìn)行結(jié)合,形成一個(gè)框架,之后使用數(shù)據(jù)進(jìn)行特征的學(xué)習(xí),以此也使得使用中手工提取特征這一工作減少,學(xué)習(xí)算法中的工作量大大降低,因此使用便利、效果良好。深度學(xué)習(xí)算法使得數(shù)據(jù)處理中語(yǔ)音及圖像的識(shí)別得到極大推動(dòng)。
強(qiáng)化學(xué)習(xí)則是一種連續(xù)決策過(guò)程,該算法的最大特點(diǎn)就是對(duì)任何數(shù)據(jù)都不會(huì)進(jìn)行標(biāo)注,只會(huì)提供唯一回報(bào)函數(shù),這一函數(shù)對(duì)當(dāng)前狀態(tài)結(jié)果有著決定性的影響。從數(shù)學(xué)的額角度來(lái)看,也是馬爾科夫決策過(guò)程。強(qiáng)化學(xué)習(xí)最終的目標(biāo)是使得決策過(guò)程中整體回報(bào)函數(shù)期望最優(yōu)化。在經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),深度學(xué)習(xí)算法對(duì)于較多實(shí)際問(wèn)題有了解決辦法,比如圖像搜索、人臉識(shí)別、色情語(yǔ)言識(shí)別、實(shí)時(shí)翻譯等。強(qiáng)化學(xué)習(xí)與深度學(xué)習(xí)的融合,使深度學(xué)習(xí)得到更為長(zhǎng)遠(yuǎn)的發(fā)展,比如進(jìn)行游戲深度學(xué)習(xí)網(wǎng)絡(luò)的建立,就能夠在強(qiáng)化學(xué)習(xí)的支持下,實(shí)現(xiàn)自己與自己對(duì)戰(zhàn),不斷實(shí)現(xiàn)自我的進(jìn)化。
二、小樣本類人概念學(xué)習(xí)
深度學(xué)習(xí)在得到開(kāi)發(fā)前,人工神經(jīng)網(wǎng)絡(luò)也曾風(fēng)靡一時(shí)。上世紀(jì)八十年代末,人工神經(jīng)網(wǎng)絡(luò)中應(yīng)用的反向傳播算法出現(xiàn),使得以統(tǒng)計(jì)模型為基礎(chǔ)的機(jī)器學(xué)習(xí)得到發(fā)展。此前,有研究人員希望通過(guò)BP算法使人工神經(jīng)算法模型從訓(xùn)練中學(xué)習(xí)統(tǒng)計(jì)性的規(guī)律,以此使其獲得對(duì)未來(lái)進(jìn)行預(yù)測(cè)的能力。BP算法無(wú)法實(shí)現(xiàn)這一目標(biāo),所以在上世界九十年代這一浪潮便逐漸平息。但是在BP算法的發(fā)展過(guò)程中,也有了更多的新奇思路,使以統(tǒng)計(jì)為基礎(chǔ)的機(jī)器學(xué)習(xí)算法和以人工規(guī)則為基礎(chǔ)的系統(tǒng)得到對(duì)比,明確了以統(tǒng)計(jì)為基礎(chǔ)的機(jī)器學(xué)習(xí)算法在較多方面都擁有先天的優(yōu)勢(shì)。但深度學(xué)習(xí)也并非無(wú)所不能,科學(xué)進(jìn)步都存在一定兩面性,一方面是優(yōu)勢(shì)提升,一方面是限制增大。
在機(jī)器學(xué)習(xí)的整個(gè)行業(yè)而言,深度學(xué)習(xí)對(duì)于行業(yè)所要求的人工智能需求也是難以達(dá)成的。深度學(xué)習(xí)是以大數(shù)據(jù)為基礎(chǔ),在多層網(wǎng)絡(luò)的處理下實(shí)現(xiàn)抽象概念理念,這也說(shuō)明在進(jìn)行應(yīng)用中,數(shù)據(jù)越多則擁有更好的效果。但是也即是說(shuō),在沒(méi)有大數(shù)據(jù)支持的情況下,或者數(shù)據(jù)量較小的情況下,便無(wú)法進(jìn)行學(xué)習(xí)。人類知識(shí)與深度學(xué)習(xí)有一定相似之處,都是通過(guò)積累所得,但人類在知識(shí)的沒(méi)有積累的情況下,也可以根據(jù)形貌進(jìn)行分析、學(xué)習(xí),進(jìn)而模仿。深度學(xué)習(xí)從這一方面來(lái)看,與人類智能還存在較大的差距,人類在陌生環(huán)境中可以通過(guò)學(xué)習(xí)來(lái)對(duì)變化進(jìn)行適應(yīng)。所以類人概念學(xué)習(xí)的發(fā)展過(guò)程中,對(duì)于深度學(xué)習(xí)存在的弊端進(jìn)行改良,可以再?zèng)]有大數(shù)據(jù)的情況下自行學(xué)習(xí),這一概念也被研究者稱為小樣本學(xué)習(xí)。
小樣本學(xué)習(xí)早在神經(jīng)網(wǎng)絡(luò)出現(xiàn)之前就已經(jīng)被提出,而關(guān)鍵核心為貝葉斯規(guī)劃學(xué)習(xí),也被稱作BPL方法。該方法是通過(guò)參數(shù)先驗(yàn)分布,使用小樣本數(shù)據(jù)進(jìn)行后驗(yàn)分布的計(jì)算,進(jìn)而得到總體分布。該方法是使用概率進(jìn)行所有形式不確定性的標(biāo)識(shí),通過(guò)概率規(guī)則來(lái)進(jìn)行推理和學(xué)習(xí)。BPL方法是以人類思維作為基礎(chǔ)的方法,即能夠不依賴大量數(shù)據(jù)來(lái)進(jìn)行學(xué)習(xí),只需要小樣本便能迅速進(jìn)行學(xué)習(xí)精髓。拿漢字為例,將一個(gè)漢字作為小樣本使用BPL方法進(jìn)行學(xué)習(xí),很快便能夠?qū)W習(xí)到精髓,并寫(xiě)出該漢字,甚至能夠?qū)⑵渌愃莆淖謱?xiě)出。因?yàn)樵摲椒總€(gè)訓(xùn)練樣本都能進(jìn)行增量升高或降低一種假設(shè)估計(jì)概率,BPL方法也順利達(dá)成視覺(jué)圖靈測(cè)試要求,而其他算法對(duì)于某一假設(shè)和其他任何樣本不統(tǒng)一時(shí),將假設(shè)摒棄。BLP方法在進(jìn)行應(yīng)用中,對(duì)于概率初始知識(shí)有所要求的,在概率位置的情況下可以根據(jù)數(shù)據(jù)、背景知識(shí)、基準(zhǔn)分布假設(shè)來(lái)進(jìn)行此類概率的估算。
三、小樣本類人概念學(xué)習(xí)與大數(shù)據(jù)深度強(qiáng)化學(xué)習(xí)的對(duì)比分析
通過(guò)上文對(duì)兩個(gè)學(xué)習(xí)算法的分析來(lái)看,深度學(xué)習(xí)算法在現(xiàn)階段中已經(jīng)獲得重大成功,但是在未來(lái)發(fā)展過(guò)程中其也具有較大的局限性,最為突出的便是深度學(xué)習(xí)使用的效果是與數(shù)據(jù)量成正比的,同時(shí)在較多任務(wù)中表現(xiàn)一般;而B(niǎo)PL方法則對(duì)機(jī)器學(xué)習(xí)、認(rèn)知科學(xué)、人工智能有著極大貢獻(xiàn),在未來(lái)發(fā)展中也具有一定前景。深度學(xué)習(xí)對(duì)于計(jì)算機(jī)中的大數(shù)據(jù)處理需求進(jìn)行了滿足,實(shí)現(xiàn)大量數(shù)據(jù)中習(xí)得抽象概念;BPL方法使得樣本量小的情況下機(jī)器學(xué)習(xí)實(shí)現(xiàn),能夠?qū)π颖具M(jìn)行學(xué)習(xí)、決策。更加形象化的理解,深度學(xué)習(xí)能夠?qū)σ?guī)律、趨勢(shì)進(jìn)行分析和預(yù)測(cè),而B(niǎo)PL方法則能當(dāng)機(jī)立斷,舉一反三;深度學(xué)習(xí)與人類閱讀書(shū)籍一樣,積累會(huì)形成相應(yīng)的判斷能力,BPL方法則是通過(guò)個(gè)案學(xué)習(xí)來(lái)進(jìn)行迅速化的決策。
四、結(jié)論
本文對(duì)兩種學(xué)習(xí)算法進(jìn)行了分析和對(duì)比,明確了兩種算法自身存在的有點(diǎn)及缺陷:小樣本類人概念學(xué)習(xí)算法具有通過(guò)小樣本學(xué)習(xí)迅速?zèng)Q斷的能力,但有一定概率錯(cuò)誤,尤其在先驗(yàn)概率為形成的情況下;大數(shù)據(jù)深度強(qiáng)化學(xué)習(xí)通過(guò)大量數(shù)據(jù)的學(xué)習(xí),來(lái)形成判斷能力大,判斷也有錯(cuò)誤概率,但相對(duì)BPL更小,但明顯依賴大數(shù)據(jù)數(shù)量。在應(yīng)用中,兩者并非是互相對(duì)立的,反而能夠通過(guò)借鑒、互補(bǔ)實(shí)現(xiàn)學(xué)習(xí)算法進(jìn)一步發(fā)展。
參考文獻(xiàn)
[1]崔小洛,欒曉飛,基于深度強(qiáng)化學(xué)習(xí)的圖像修復(fù)算法設(shè)計(jì)[J].物聯(lián)網(wǎng)技術(shù),2019(06):58-60.
[2]李旭,曹繼征,大數(shù)據(jù)在公安交通管理中的應(yīng)用探討[J].環(huán)球市場(chǎng),2018(09):166-167.