石家澍
摘 要 隨著社會(huì)經(jīng)濟(jì)的迅速發(fā)展和科學(xué)技術(shù)的全面進(jìn)步,以人工智能技術(shù)為基礎(chǔ)的智能機(jī)器人產(chǎn)業(yè)正處于蓬勃發(fā)展的時(shí)期。具備感覺要素、反應(yīng)要素和思考要素的機(jī)器人稱為智能機(jī)器人,與傳統(tǒng)機(jī)器人相比,其更加類似于人類,擁有自我學(xué)習(xí)和獨(dú)立工作能力,在某些領(lǐng)域能完成人類無法完成的任務(wù),在醫(yī)療、家居、消防乃至銀行服務(wù)等領(lǐng)域,其功能逐漸豐富,具有至關(guān)重要的作用。文章從智能機(jī)器人的概念講起,歸納了其主要應(yīng)用領(lǐng)域及存在的缺陷,最后對(duì)智能機(jī)器人的發(fā)展趨勢(shì)做出了展望。
關(guān)鍵詞 人工智能;機(jī)器人;語音識(shí)別
中圖分類號(hào) G2 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2018)224-0101-02
1 智能機(jī)器人的相關(guān)概念
廣義上,機(jī)器人是一種有計(jì)算機(jī)控制的機(jī)電一體化產(chǎn)品,模仿人的各種運(yùn)動(dòng)能力,用來取代人完成復(fù)雜和重復(fù)性工作。控制裝置、傳感裝置、驅(qū)動(dòng)裝置及電源裝置是機(jī)器人的基本構(gòu)成要素(如表1所示)。從能力上來看,普通機(jī)器人只是增加自動(dòng)控制功能的普通機(jī)電設(shè)備,其只能按照預(yù)先設(shè)計(jì)的程序完成既定的任務(wù),智能化程度不高。而智能機(jī)器人則在普通機(jī)器人的基礎(chǔ)上增加了傳感檢測(cè)、模式識(shí)別、深度學(xué)習(xí)和自主決策功能,使其能夠產(chǎn)生類似人類的智能大腦,在各種復(fù)雜環(huán)境中可以通過智能行為完成各種任務(wù)。
簡(jiǎn)單來說,智能機(jī)器人就是“傳統(tǒng)機(jī)器人+人工智能”,人工智能是指利用計(jì)算機(jī)等機(jī)器模擬人類智能能力的技術(shù),涉及到數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)學(xué)、運(yùn)籌學(xué)等多個(gè)學(xué)科,其研究領(lǐng)域在機(jī)器人界包括智能機(jī)器人、語音識(shí)別和人臉識(shí)別等,人工智能賦予了機(jī)器人無限的想象力[ 1 ]。
2 智能機(jī)器人的應(yīng)用
2.1 醫(yī)療機(jī)器人
現(xiàn)階段,隨著醫(yī)療領(lǐng)域?qū)C(jī)器人的逐漸認(rèn)可和各診療階段應(yīng)用的普及,醫(yī)療機(jī)器人在未來可能成為機(jī)器人領(lǐng)域的剛性需求產(chǎn)品。醫(yī)療機(jī)器人一般以機(jī)械臂為主,通過智能控制和實(shí)時(shí)跟蹤功能使其可以完成各種臨床手術(shù)操作[ 2 ]。其中,遠(yuǎn)程醫(yī)療機(jī)器人因?yàn)榭梢越鉀Q醫(yī)療資源分布不均衡,緩解偏遠(yuǎn)地區(qū)居民看病難問題而備受期待。
同時(shí),具備擴(kuò)展性功能的機(jī)器人還可以與醫(yī)護(hù)人員和病人通話,檢查心跳及脈搏,甚至進(jìn)行X射線透視,病人也可以通過機(jī)器人向醫(yī)生咨詢病情,增加醫(yī)患之間的溝通交流。另外,機(jī)器人也可集成多種疾病的治療方案,通過實(shí)時(shí)的診斷,智能調(diào)取特定疾病的解決方案,并自動(dòng)化地生成治療流程,高精度地執(zhí)行各種手術(shù)操作。
2.2 家居機(jī)器人
智能家居機(jī)器人是為人類提供服務(wù)的特種機(jī)器人,主要從事家庭服務(wù)、維護(hù)、運(yùn)輸工作,包括智能音箱、掃地機(jī)器人、智能插座等設(shè)備。智能家居領(lǐng)域運(yùn)用語音識(shí)別、圖像識(shí)別、智能控制、路徑規(guī)劃等諸多人工智能技術(shù)。以智能家居機(jī)器人為例,其最關(guān)鍵的技術(shù)是語音識(shí)別(如圖1所示)。利用聲波轉(zhuǎn)換和詞義轉(zhuǎn)換技術(shù)可以將人類說的話轉(zhuǎn)化為特定的文字。在確定語音特征處理等規(guī)則之后,接下來的任務(wù)就是教會(huì)機(jī)器聽懂“人話”,這個(gè)教學(xué)過程就是語音識(shí)別系統(tǒng)的模型訓(xùn)練階段了,模型訓(xùn)練一般又分為聲學(xué)模型訓(xùn)練和語言模型訓(xùn)練。在完成后臺(tái)的模型訓(xùn)練和輸入語音的前端處理以后,將相關(guān)信息送入語音識(shí)別系統(tǒng)的解碼引擎進(jìn)行處理。解碼引擎在一個(gè)巨大的網(wǎng)絡(luò)里邊進(jìn)行搜索,網(wǎng)絡(luò)由數(shù)億節(jié)點(diǎn)及弧組成,并且里邊已經(jīng)糅合了之前所描述的聲學(xué)模型以及語言模型信息,搜索出來的最優(yōu)路徑上所攜帶的信息就是對(duì)應(yīng)的語音識(shí)別結(jié)果,此過程也稱為基于深度神經(jīng)網(wǎng)絡(luò)的自然語言處理(NLP)過程,AI可以根據(jù)與人類交流的反饋結(jié)果調(diào)整網(wǎng)絡(luò)權(quán)值,從而不斷完善自身,變得更加“聰明”。
2.3 消防機(jī)器人
消防機(jī)器人作為特種機(jī)器人的一種,對(duì)減少國(guó)家財(cái)產(chǎn)損失和滅火救援人員的傷亡有著重要作用。目前,消防部隊(duì)和部分石化企業(yè)中投入使用的消防機(jī)器人有100多臺(tái),其中主要是滅火機(jī)器人和排煙機(jī)器人。2003年,“9·15”湖北利川天然氣井噴事故中,消防滅火機(jī)器人首次投入實(shí)戰(zhàn),并初戰(zhàn)告捷,取得了顯著的社會(huì)和經(jīng)濟(jì)效益[ 3 ]。消防機(jī)器人主要用于撲救地鐵隧道、地下建筑、石油化工等大面積火災(zāi)及水域救援。
未來,具有智能分析判斷功能的消防機(jī)器人將代替滅火救援人員進(jìn)入易燃易爆、有毒、缺氧、濃煙等危險(xiǎn)災(zāi)害事故現(xiàn)場(chǎng)進(jìn)行數(shù)據(jù)采集、處理、反饋,救助遇險(xiǎn)人員,噴火冷卻作業(yè)以及其他處置措施。
2.4 銀行機(jī)器人
銀行機(jī)器人不僅可以擔(dān)任迎送賓客、引導(dǎo)分流、信息查詢、打印取號(hào)等簡(jiǎn)單職能,還可以展開信用卡推介、理財(cái)產(chǎn)品推介等主動(dòng)營(yíng)銷工作。在中國(guó)首家“無人銀行”中,銀行機(jī)器人擔(dān)負(fù)起了網(wǎng)點(diǎn)大堂經(jīng)理的角色,通過人臉識(shí)別技術(shù)進(jìn)行客戶身份識(shí)別,實(shí)現(xiàn)網(wǎng)點(diǎn)設(shè)備的智慧聯(lián)動(dòng),引導(dǎo)客戶進(jìn)入不同服務(wù)區(qū)域完成所需交易。
人臉識(shí)別的主要流程課分為人臉檢測(cè)、圖像預(yù)處理、特征提取和匹配識(shí)別等四個(gè)環(huán)節(jié),每個(gè)環(huán)節(jié)互相銜接,必不可少(如圖2所示)。人臉檢測(cè)主要是在整幅畫面中分割出可以參與識(shí)別的人臉,此過程通過要用到模式識(shí)別的方案,通過人臉圖像的分割、二值化、銳化等過程提取中特定的人臉。特征提取是人臉識(shí)別各環(huán)節(jié)中最關(guān)鍵的一步,人臉的瞳距,眉毛大小,嘴唇大小,鼻子長(zhǎng)度和寬度都是若干特征,除非是雙胞胎,世界上任何兩個(gè)人的以上特征都存在一定的差異,計(jì)算機(jī)通過一定的算法提取這些差異,將其轉(zhuǎn)化為特定的數(shù)字量?jī)?chǔ)存起來;最后便是匹配識(shí)別了,人臉識(shí)別的后臺(tái)有專用的數(shù)據(jù)庫(kù),通過將前一環(huán)節(jié)中得到的若干特征參數(shù)與數(shù)據(jù)庫(kù)對(duì)比,得出最終的匹配結(jié)果,從而完成了整個(gè)人臉識(shí)別,如果在數(shù)據(jù)庫(kù)中均沒有該類特征出現(xiàn),則認(rèn)定無法識(shí)別或不明身份對(duì)象。
3 智能機(jī)器人的缺陷和未來
據(jù)世界機(jī)器人大會(huì)各國(guó)達(dá)成的共識(shí),機(jī)器人的研發(fā)和制造不得超過若干規(guī)則,其中最重要的規(guī)則便是不能對(duì)人類本身產(chǎn)生任何安全性的威脅。因此在設(shè)計(jì)智能機(jī)器人時(shí)必須確保使用人員擁有充分控制權(quán),將使用人員的人身安全放在首位,開發(fā)的各類功能要嚴(yán)格遵守法律條文,智能機(jī)器人不能保留或披露機(jī)密信息。目前還不能完美地讓機(jī)器人的行為符合人類倫理道德。
在賦予智能機(jī)器人某些權(quán)利的同時(shí),我們更應(yīng)該對(duì)智能機(jī)器的權(quán)利進(jìn)行限制,在算法的設(shè)計(jì)上,設(shè)立道德準(zhǔn)繩,使其行為更加適合人類社會(huì)的倫理道德體系。另外,目前的智能機(jī)器人還需要在智能度上進(jìn)一步提升,此領(lǐng)域必須基于AI的發(fā)展,通過AI的深度應(yīng)用,使得機(jī)器人能夠具有超過人類思維能力的智能大腦。
伴隨AlphaGo、無人駕駛、機(jī)器翻譯以及智能機(jī)器人在工業(yè)、制造業(yè)以及服務(wù)業(yè)的大規(guī)模應(yīng)用,各種智能機(jī)器人的實(shí)踐落地都大大開拓了人類的視野,更深刻促進(jìn)了各行業(yè)的發(fā)展。對(duì)于智能機(jī)器人的發(fā)展趨勢(shì),概括性地分析如下。
一是視覺系統(tǒng)更強(qiáng)大。視覺系統(tǒng)應(yīng)該增加景深和對(duì)比度,縮短圖像處理時(shí)間,強(qiáng)化機(jī)器人的觀測(cè)能力,使其能夠“眼觀六路”。
二是聽覺系統(tǒng)更靈敏。從簡(jiǎn)單的聲波存在檢測(cè)到復(fù)雜的聲波頻率分析,直到對(duì)連續(xù)自然語言的辨別,聽覺是智能機(jī)器人重要的信息獲取途徑。未來聽覺系統(tǒng)能夠?qū)崿F(xiàn)聲源精準(zhǔn)定位、中文方言的識(shí)別、音量高低區(qū)分等功能,真正做到“耳聽八方”。
三是多傳感信息耦合技術(shù)再升級(jí)。智能機(jī)器人不僅應(yīng)該具有單一傳感器的解析能力,還需要將各種傳感器信息綜合起來,通過智能的算法減小各種傳感器之間的偶然誤差,從而提高智能機(jī)器人的環(huán)境測(cè)量精度,使其智能決策的錯(cuò)誤率不斷降低[ 4 ]。
參考文獻(xiàn)
[1]韓曄彤.人工智能技術(shù)發(fā)展及應(yīng)用研究綜述[J].電子制作,2016(12):95.
[2]青黛.2017互聯(lián)網(wǎng)醫(yī)療人工智能應(yīng)用企業(yè)TOP50[J].互聯(lián)網(wǎng)周刊,2017,20(12):62-63.
[3]方戌,董非.消防機(jī)器人“喜”與“憂”[J].現(xiàn)代職業(yè)安全,2016,16(4):20-23.
[4]金耀青,姜永權(quán),譚炳元.智能機(jī)器人現(xiàn)狀與發(fā)展趨勢(shì)[J].電腦與電信,2017(5):27-28,34.