国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

探討智能機(jī)器人的認(rèn)知與學(xué)習(xí)

2020-09-10 11:16禤耀佳
內(nèi)燃機(jī)與配件 2020年11期
關(guān)鍵詞:智能機(jī)器人范式

禤耀佳

摘要:基于人工智能理論發(fā)展,其應(yīng)用進(jìn)一步拓展,對于下一代人工智能而言,認(rèn)知與學(xué)習(xí)已經(jīng)是其重要任務(wù),例如智能機(jī)器人的出現(xiàn),充分發(fā)揮了人工智能技術(shù),進(jìn)一步模仿人類智能,以完成各式各樣的工作,并持續(xù)提升自身學(xué)習(xí)、認(rèn)知能力。本文將針對這一情況予以研究。

關(guān)鍵詞:智能機(jī)器人;認(rèn)知與學(xué)習(xí);機(jī)器學(xué)習(xí)算法;范式;強(qiáng)化學(xué)習(xí)

0? 引言

關(guān)于智能機(jī)器人,其具備高層認(rèn)知能力,可以很好地適應(yīng)復(fù)雜環(huán)境,并完成對應(yīng)的工作,具體認(rèn)知包括三個步驟,其一獲得數(shù)據(jù);其二加工數(shù)據(jù),并得出結(jié)果;其三自我完善,自我學(xué)習(xí)。對比機(jī)器學(xué)習(xí),機(jī)器認(rèn)知與其既有區(qū)別,即前者重視人腦學(xué)習(xí)能力,后者重視人體、人腦的行為與感知,同時二者又有關(guān)聯(lián)的地方,即模仿人類智能。

1? 機(jī)器學(xué)習(xí)算法本質(zhì)及原理

在長期探索人類社會、自然界中,科學(xué)家給出了許多數(shù)學(xué)模型,以描述現(xiàn)象、事物,其可以歸納為三類。

其一,歸納模型:其包含幾個參數(shù)變量,同時任一變量都代表獨(dú)特的物理意義。借助該類模型,可以獲得某一對象的規(guī)律、本質(zhì),比如大部分物理、數(shù)學(xué)定律均屬于這一模型[1]。

其二,預(yù)測模型:該模型具備一個萬能函數(shù),這一函數(shù)可以擬合大部分訓(xùn)練樣本,同時其中的參數(shù)沒有物理意義。模型只用來預(yù)測、模擬等某一特定現(xiàn)象、事物,不會獲得某一對象的規(guī)律、本質(zhì)。目前,大部分機(jī)器學(xué)習(xí)算法均應(yīng)有這一模型。

其三,直推模型:其不具備明確的數(shù)學(xué)函數(shù),會借助其采集的大數(shù)據(jù),以預(yù)測特定標(biāo)簽。該類模型主要結(jié)合采集的大數(shù)據(jù),客觀描述某一現(xiàn)象、事物,同時數(shù)據(jù)規(guī)模越大,客觀描述就越準(zhǔn)確、越全面[2]。換而言之,與其它模型相比,其不需要明確數(shù)學(xué)模型,使用起來更加簡單直接,但其充分依賴大數(shù)據(jù),一般要耗費(fèi)大量的使用成本、計(jì)算量。此外,該模型無法獲得某一對象的規(guī)律、本質(zhì)?;谠絹碓蕉嗟娜耸褂没ヂ?lián)網(wǎng)技術(shù),可越來越廉價、簡單地獲得大數(shù)據(jù),為直推模型的應(yīng)用提供了便利[3]。比如,在各大互聯(lián)網(wǎng)中,搜索引擎會借助用戶點(diǎn)擊率,以改善網(wǎng)頁排序精度。

結(jié)合上述內(nèi)容可以知曉,就機(jī)器學(xué)習(xí)算法而言,其本質(zhì)是獲得一個萬能函數(shù),以建立預(yù)測模型。在訓(xùn)練過程中,結(jié)合用戶予以的訓(xùn)練樣本,可以獲得最優(yōu)參數(shù)集,從而科學(xué)的分布訓(xùn)練樣本集。借助訓(xùn)練,可獲得預(yù)測模型,換而言之,提取訓(xùn)練樣本集分布,并將其編碼到參數(shù)集中。利用預(yù)測模型,可以預(yù)測未知樣本x,包括屬性、標(biāo)簽等[4]。如今,大部分機(jī)器學(xué)習(xí)算法均應(yīng)用這一原理,比如谷歌公司的AlphaGo。

結(jié)合某一現(xiàn)象、事物獲得的訓(xùn)練樣本,蘊(yùn)含著眾多先驗(yàn)知識,可以直觀描述某一現(xiàn)象、事物。例如,在ImageNet ILSVRC比賽中,其獲得1000類訓(xùn)練樣本集,彩色圖像共計(jì)一百多萬張。其中,每一類都對應(yīng)一種物體,包括鳥、汽車等,并涉及不同角度、場景的彩色圖像1000張[5]。通過這樣的訓(xùn)練,可以獲得深度卷積神經(jīng)網(wǎng)絡(luò),其本質(zhì)是每類物體的個體差異、共性特征,并從中提取信息,以編碼的形式錄入?yún)?shù)集中。一旦出現(xiàn)未知圖像,神經(jīng)網(wǎng)絡(luò)就會充分利用先驗(yàn)知識,以分類、識別輸入圖像。

2? 智能機(jī)器人的體系結(jié)構(gòu)

關(guān)于智能機(jī)器人,其體系結(jié)構(gòu)可以明確各部分功能分配、信息流通關(guān)系、以及相互關(guān)系,并獲得邏輯計(jì)算結(jié)構(gòu)。智能機(jī)器人出于完成任務(wù)的目的,就要建立科學(xué)的體系結(jié)構(gòu)?,F(xiàn)階段,體系結(jié)構(gòu)可以結(jié)合執(zhí)行、規(guī)劃、感知等進(jìn)行劃分,大體可分為混合型、包容型、慎思型等范式。

2.1 傳統(tǒng)范式分類及問題

關(guān)于智能機(jī)器人,其系統(tǒng)范式可以界定某一問題的技術(shù)、假設(shè),其既是解決問題的工具,也是看待智能的方式。體系結(jié)構(gòu)屬于實(shí)例,范式屬于抽象類,結(jié)合機(jī)器人體系結(jié)構(gòu),范式包括三種,其一,分層范式;其二,反應(yīng)范式;其三,反應(yīng)/慎思混合范式[6]。關(guān)于傳統(tǒng)分類方法,其自信息流動方向入手,但沒有明確說明產(chǎn)生過程。另外,機(jī)器人要具備較高的適應(yīng)性,在系統(tǒng)設(shè)計(jì)機(jī)器人時,學(xué)習(xí)能力是重要因素,但傳統(tǒng)范式,沒有考慮學(xué)習(xí)能力。

2.2 智能產(chǎn)生方式范式分類

就智能產(chǎn)生方式而言,機(jī)器人系統(tǒng)可以劃分為五種,其一基于知識的范式;其二基于行為的范式;其三基于學(xué)習(xí)的范式;其四基于進(jìn)化的范式;其五基于認(rèn)知的范式。

2.2.1 基于知識的范式

關(guān)于基于知識的范式,其意味著程序員可以借助編程,把知識輸入機(jī)器。在自動推理與證明、專家系統(tǒng)領(lǐng)域,這一方法是適用的,但是其使用范圍有限,即其只適用于抽象思維、邏輯推理知識。另外,基于環(huán)境復(fù)雜性的限制,有些知識是無法輸入到機(jī)器中的。就傳統(tǒng)分層范式而言,借助符號化知識予以決策,即基于知識的范式。

2.2.2 基于行為的范式

關(guān)于基于行為的范式,意味著在編寫程序時,要完成機(jī)器人自主感知周邊環(huán)境,同時作出反應(yīng)的任務(wù),并且在機(jī)器人內(nèi)部存在大量并行的簡單指令,結(jié)合優(yōu)先級的不同,可以進(jìn)行簡單組合,從而做出復(fù)雜行為。換而言之,其等價于傳統(tǒng)反應(yīng)范式。

2.2.3 基于學(xué)習(xí)的范式

就基于學(xué)習(xí)的范式,其意味著程序員會結(jié)合特定問題,編寫學(xué)習(xí)程序。該種學(xué)習(xí)范圍有限,只針對特定任務(wù),即輸出、輸入均受到約束。借助人為的方式,可以輸入特定知識結(jié)構(gòu),通過學(xué)習(xí)過程,持續(xù)調(diào)整其中參數(shù)。在以往研究中,機(jī)器人模式識別、學(xué)習(xí)等方法,只針對特定任務(wù),也是基于學(xué)習(xí)的范式。

2.2.4 基于進(jìn)化的范式

就基于進(jìn)化的范式,其主要按照生物演化規(guī)律。首先,提出機(jī)器人知識結(jié)構(gòu);其次,將其放置在運(yùn)行環(huán)境中自行淘汰,發(fā)育;最后,選取新的后代。在這一過程中,機(jī)器人的參數(shù)、知識結(jié)構(gòu)處于變化狀態(tài)。在模擬環(huán)境中,此種范式比較適用;而在現(xiàn)實(shí)環(huán)境中,由于機(jī)器人造價高、進(jìn)化耗時過長,其使用起來具有一定的難度[7]。為此,誕生了“進(jìn)化機(jī)器人”,其既繼承了這一范式,又進(jìn)行了適當(dāng)?shù)陌l(fā)展。關(guān)于“進(jìn)化機(jī)器人”,其意味著在進(jìn)化機(jī)制中,不斷融入符號、聯(lián)結(jié)機(jī)制,促使機(jī)器人在交互中,自主實(shí)現(xiàn)控制系統(tǒng)。

2.2.5 基于認(rèn)知的范式

就基于認(rèn)知的范式,其重點(diǎn)知機(jī)器人認(rèn)知過程,相比較進(jìn)化過程,其是有區(qū)別的,進(jìn)化意味著整個歷史的生命進(jìn)化,認(rèn)知注重機(jī)器人自主學(xué)習(xí),其與機(jī)器人學(xué)習(xí)相關(guān)。在這一過程中,機(jī)器人主動認(rèn)知世界、主動與環(huán)境交互,并形成內(nèi)在知識。相比較基于學(xué)習(xí)的范式,其最大不同是學(xué)習(xí)范圍更廣闊,即任何知識,不需要編程特定任務(wù)。

3? 基于強(qiáng)化學(xué)習(xí)、認(rèn)知的學(xué)習(xí)方法

3.1 認(rèn)知的強(qiáng)化學(xué)習(xí)特征

①ODMDP特性:就可以認(rèn)知得機(jī)器人而言,環(huán)境狀態(tài)均可以依靠觀測的方式獲得,具備ODMDP特性,而行動、狀態(tài)空間不可以人為事先給出,均可要借助環(huán)境交互產(chǎn)生。為此,強(qiáng)化學(xué)習(xí)模型,要實(shí)現(xiàn)ODMDP策略學(xué)習(xí),并實(shí)現(xiàn)增量學(xué)習(xí)。

②多任務(wù)學(xué)習(xí)能力:對于智能機(jī)器人而言,其不會只針對一個任務(wù),還會涉及充電、導(dǎo)航等任務(wù),同時任務(wù)是可以任意添加的。而對于強(qiáng)化學(xué)習(xí)系統(tǒng)而言,其只完成一個任務(wù)。另外,智能機(jī)器人可面向不同任務(wù),完成多個策略間轉(zhuǎn)換,即自其他的強(qiáng)化學(xué)習(xí)任務(wù)中,獲得策略經(jīng)驗(yàn)。最后,就強(qiáng)化學(xué)習(xí)系統(tǒng)而言,其需要機(jī)器人予以選擇,并給出行動決策。

③興趣驅(qū)動的學(xué)習(xí):就智能機(jī)器人來講,其基本的能力就是自主學(xué)習(xí),其針對的對象既包括面向任務(wù)的知識,也包括由興趣驅(qū)動的知識,借助探索、玩耍等行為,可以廣泛學(xué)習(xí)知識,提升自身能力,這屬于智能發(fā)展本質(zhì)。

④實(shí)時學(xué)習(xí)能力:對于認(rèn)知機(jī)器人而言,其重視環(huán)境真實(shí)交互,為此要具備實(shí)時學(xué)習(xí)能力。同時,對于強(qiáng)化學(xué)習(xí)而言,原始的動作、傳感器等不適用。對此,要借助合理計(jì)算分布式、行動、狀態(tài)空間、優(yōu)化初始值等,提高學(xué)習(xí)速度。

⑤狀態(tài)轉(zhuǎn)移可以不同時進(jìn)行:在強(qiáng)化學(xué)習(xí)算法中,跡衰退系數(shù)A、回報折扣率Y等狀態(tài)轉(zhuǎn)移時間一樣。然而機(jī)器人環(huán)境交互,這一條件難以達(dá)成,為此要更新強(qiáng)化學(xué)習(xí)方式。

3.2 認(rèn)知的強(qiáng)化學(xué)習(xí)模型

結(jié)合傳統(tǒng)強(qiáng)化學(xué)習(xí)方法,知識模塊可作為中心數(shù)據(jù)結(jié)構(gòu),通過狀態(tài)值表等予以表示,并通過中心控制程序,持續(xù)更新數(shù)據(jù)結(jié)構(gòu)。若以神經(jīng)網(wǎng)絡(luò)以表示,可以統(tǒng)一知識、學(xué)習(xí)過程。但就神經(jīng)網(wǎng)絡(luò)而言,設(shè)計(jì)結(jié)構(gòu)需要一定的技巧,并結(jié)合具體任務(wù)來設(shè)計(jì),同時行動輸出、感知輸入等要符合馬爾科夫特性,通過調(diào)整權(quán)值的方式,對應(yīng)實(shí)現(xiàn)行動、狀態(tài)。

3.3 強(qiáng)化學(xué)習(xí)算法實(shí)現(xiàn)

在STAMN中,任一狀態(tài)行動值,要借助行動、狀態(tài)節(jié)點(diǎn)間權(quán)值以表示。對于任一行動、狀態(tài)節(jié)點(diǎn)而言,其在被內(nèi)部激活后,要更新狀態(tài)行動值。一旦獲得獎勵值,不僅作用于前一步已激活的狀態(tài)行動值,還要反映在多步激活的狀態(tài)行動值中。對于強(qiáng)化學(xué)習(xí)方法而言,其本質(zhì)是局部更新,為此不需任何修改,就能應(yīng)用在強(qiáng)化學(xué)習(xí)模型中。

4? 結(jié)束語

綜上所述,出于精準(zhǔn)理解環(huán)境的目的,在設(shè)計(jì)機(jī)器人時,要考慮觸覺、聲覺、視覺等傳感器,并利用大數(shù)據(jù)處理、云計(jì)算等技術(shù),借助與環(huán)境的交互,加強(qiáng)機(jī)器人認(rèn)決策知、理解、感知環(huán)境等能力。另一方面,出于精準(zhǔn)操作的目的,既要研制新型傳感器,也要研制新型執(zhí)行器,借助決策、認(rèn)知、學(xué)習(xí),改善機(jī)器人解決復(fù)雜任務(wù)能力。此外,在如今的機(jī)器人應(yīng)用,也引入了新的技術(shù),比如增強(qiáng)現(xiàn)實(shí)、虛擬現(xiàn)實(shí)等技術(shù),并結(jié)合多種穿戴式傳感技術(shù),橫跨知識、虛擬、物理等空間進(jìn)行學(xué)習(xí),同時自主學(xué)習(xí)人類智能。

參考文獻(xiàn):

[1]陳玲玲,馮琦,馬小霞,等.基于深度學(xué)習(xí)的認(rèn)知無線電智能功率控制算法設(shè)計(jì)與實(shí)現(xiàn)[J].信息技術(shù)與信息化,2019(7):95-97.

[2]孫富春.智能機(jī)器人的認(rèn)知與學(xué)習(xí)[J].機(jī)器人,2019,41(5):561.

[3]孔令龍,田國會.智能家庭中一種基于本體的機(jī)器人服務(wù)認(rèn)知機(jī)制[J].山東大學(xué)學(xué)報(工學(xué)版),2019,49(6):85-87.

[4]李振,周東岱,王勇.“人工智能+”視域下的教育知識圖譜:內(nèi)涵、技術(shù)框架與應(yīng)用研究[J].遠(yuǎn)程教育雜志,2019(4):75-77.

[5]王廣新,王悅.支持智慧學(xué)習(xí)的語境化敘事游戲開發(fā)與學(xué)習(xí)效果驗(yàn)證[J].中國遠(yuǎn)程教育:綜合版,2019(10):15-17.

[6]黃敏,路飛,李曉磊,等.基于IHDR算法和BP神經(jīng)網(wǎng)絡(luò)復(fù)合框架的機(jī)器人服務(wù)自主認(rèn)知和發(fā)育系統(tǒng)[J].機(jī)器人,2019,41(5):609-619.

[7]王薇,吳鋒,周風(fēng)余.機(jī)器人操作技能自主認(rèn)知與學(xué)習(xí)的研究現(xiàn)狀與發(fā)展趨勢[J].山東大學(xué)學(xué)報(工學(xué)版),2019,49(6):195-197.

猜你喜歡
智能機(jī)器人范式
基于SCP范式的貴州省食用菌產(chǎn)業(yè)分析
范式守信不負(fù)約
謹(jǐn)言慎行
從教師視角談“讀思達(dá)”課堂范式——以“百分?jǐn)?shù)的認(rèn)識”為例
史上最感人的約飯
工商銀行與第四范式正式簽約共建銀行AI核心系統(tǒng)
人工智能在智能機(jī)器人系統(tǒng)中的應(yīng)用研究
智能機(jī)器人實(shí)踐課程自主創(chuàng)新能力培養(yǎng)研究
人工智能的發(fā)展現(xiàn)狀及其難點(diǎn)問題分析
“智能機(jī)器人”的社會學(xué)思考