萬(wàn)昌 武漢科技大學(xué)
機(jī)器視覺(jué)技術(shù)已經(jīng)在各領(lǐng)域得到了廣泛應(yīng)用,并在不斷進(jìn)行技術(shù)開(kāi)發(fā)的過(guò)程中,展現(xiàn)出了優(yōu)勢(shì)性的功能。但在當(dāng)前的技術(shù)條件下,大多數(shù)的可視化程序,都作為固定的工序內(nèi)容發(fā)揮作用。而本文提出的技術(shù)條件,則呈現(xiàn)出更加明顯的動(dòng)態(tài)性特征,在接收與感知信息內(nèi)容的同時(shí),使機(jī)器視覺(jué)的功能近似率人工的視覺(jué)效果,人機(jī)交互式的動(dòng)態(tài)工作。
視覺(jué)識(shí)別系統(tǒng)中,對(duì)物體的分辨是最為核心的內(nèi)容。對(duì)機(jī)器視覺(jué)的優(yōu)化目標(biāo),就是利用科技條件,完成機(jī)器對(duì)人類識(shí)別能力的模仿。在內(nèi)容上,需要對(duì)相關(guān)的硬件系統(tǒng)、計(jì)算方法、知識(shí)體系等內(nèi)容進(jìn)行完善,在保證圖像處理技術(shù)的同時(shí),加強(qiáng)對(duì)已知特征條件的識(shí)別能力。
對(duì)機(jī)器視覺(jué)系統(tǒng)的設(shè)計(jì),應(yīng)將技術(shù)發(fā)展分為圖像的處理與識(shí)別兩個(gè)階段。處在圖像處理階段時(shí),需集中整理采集的數(shù)據(jù)信息,在剔除噪音、環(huán)境等干擾調(diào)價(jià)的同時(shí),進(jìn)行區(qū)域圖像的分割處理[1]。而在進(jìn)行圖像識(shí)別階段時(shí),應(yīng)將重點(diǎn)放在尺寸、形狀等關(guān)鍵的內(nèi)容上,通過(guò)取值范圍的確定,過(guò)濾出圖像中的非關(guān)鍵信息條件,然后再對(duì)相應(yīng)的模板進(jìn)行匹配,完成目標(biāo)對(duì)應(yīng)管理。
Alpha Go系統(tǒng),是智能化人際圍棋對(duì)弈的典型案例。在一次執(zhí)白對(duì)弈比賽的過(guò)程中,系統(tǒng)通過(guò)采集黑子的位置信息,攝像器材采集的圖像進(jìn)行整理,校正拍照角度中的畸變,并對(duì)周圍的環(huán)境條件與邊框進(jìn)行剪裁。當(dāng)完成整理后,并將圖像進(jìn)行二值化處理,通過(guò)黑白色亮度對(duì)比的內(nèi)容,完成伽馬值的調(diào)整,使圖像的顯影更加清晰。然后再利用0/1的二值化位置圖,形成完整的坐標(biāo)系統(tǒng)。在轉(zhuǎn)換格式與閾值的基礎(chǔ)上,帶入圍棋運(yùn)算核心的19×19直方圖分析,通過(guò)直角坐標(biāo)系的確認(rèn),定位并捕捉自己白棋的棋盤定位。
人工智能技術(shù)是當(dāng)前學(xué)術(shù)研究與應(yīng)用實(shí)踐的重點(diǎn)的方向,受到高速率硬件處理技術(shù)影響,在整合大量企業(yè)與科研研究成果內(nèi)的基礎(chǔ)上,此項(xiàng)技術(shù)已經(jīng)可以在較低的成本條件下,達(dá)到提升應(yīng)用條件的效果。
延續(xù)上一部分中的圍棋應(yīng)用案例,在智能AI技術(shù)的開(kāi)發(fā)中,針對(duì)圍棋的對(duì)弈規(guī)則,技術(shù)人員研發(fā)出了Alpha Go系統(tǒng)的核心運(yùn)算內(nèi)容。將完全博弈與MCTS算法作為基礎(chǔ),形成了三層神經(jīng)網(wǎng)絡(luò)環(huán)境下的運(yùn)算系統(tǒng),在對(duì)預(yù)測(cè)策略網(wǎng)絡(luò)、判斷策略網(wǎng)絡(luò)、價(jià)值網(wǎng)絡(luò)的整合中,使用量化評(píng)估與加權(quán)計(jì)算的方法得到最優(yōu)化的計(jì)算結(jié)構(gòu),滿足運(yùn)算與對(duì)弈的基本需要。而在運(yùn)算模型中,整合形成的運(yùn)算系統(tǒng)中,會(huì)使用APV-MCTS系統(tǒng)對(duì)棋局的每條邊線,從決策收益——Q(s,a)、訪問(wèn)次數(shù)——N(s,a)、先驗(yàn)概率——P(s,a),這三個(gè)狀態(tài)進(jìn)行閾值選擇,并最終得到公式:
以此達(dá)到執(zhí)行系統(tǒng)計(jì)算的效果,保證人機(jī)對(duì)弈的進(jìn)行。
而在人工智能系統(tǒng)中,還需組建其完整的硬件平臺(tái),通過(guò)對(duì)CPU的特性設(shè)計(jì),增加其中的浮點(diǎn)運(yùn)算能力,保證對(duì)層次的神經(jīng)網(wǎng)絡(luò)計(jì)算內(nèi)容。以此,使人工智能系統(tǒng)在在計(jì)算優(yōu)勢(shì)的保證下,不斷進(jìn)行深入的內(nèi)容學(xué)習(xí),對(duì)海量運(yùn)算數(shù)據(jù)進(jìn)行整合,提高技術(shù)條件下的運(yùn)算結(jié)果利用率[2]。通過(guò)在圍棋人機(jī)對(duì)弈過(guò)程中積累的樣本,完成記錄數(shù)據(jù)積累,使人工智能系統(tǒng)的圍棋水平,趕上甚至是超越人類棋手。
在完成感知與運(yùn)算的內(nèi)容后,就需要相應(yīng)的機(jī)器設(shè)備,完成智能人機(jī)交互的最終步驟。自從1961年美國(guó)的Unimate公司推出第一臺(tái)商用機(jī)器人以來(lái),在此項(xiàng)領(lǐng)域持續(xù)半個(gè)世紀(jì)的發(fā)展中,機(jī)器人技術(shù)已經(jīng)得到了廣泛且全面的應(yīng)用,并在進(jìn)行工業(yè)化生產(chǎn)的過(guò)程中積累了豐富的技能內(nèi)容,從基礎(chǔ)的焊接、搬運(yùn)等技術(shù)內(nèi)容中,逐漸演化出了多種類型的高級(jí)能力。而在與感知、分析系統(tǒng)的配合下,可以更加全面的提升數(shù)據(jù)信息的應(yīng)用條件,通過(guò)動(dòng)態(tài)化的信息處理,自主的完成預(yù)定工作內(nèi)容。在進(jìn)行機(jī)器人人機(jī)對(duì)弈設(shè)計(jì)的過(guò)程中,可以將這一動(dòng)作內(nèi)容作為執(zhí)行整體功能的終端,完成對(duì)弈程序的功能需要。
為了更加精確的完成技術(shù)處理,首先要對(duì)機(jī)器的應(yīng)用條件與技術(shù)內(nèi)容進(jìn)行分析,以此確定執(zhí)行過(guò)程中應(yīng)用機(jī)器人的具體類型。在內(nèi)容上,應(yīng)從以下四個(gè)方面展開(kāi)分析,最終確定機(jī)器人的型號(hào)與工作方式。其一,需對(duì)控制模式進(jìn)行選擇,將點(diǎn)位控制與連續(xù)控制作為基本的選擇類型;其二,在驅(qū)動(dòng)條件上,應(yīng)對(duì)液壓、氣壓、電力等多種類型的技術(shù)條件進(jìn)行討論;其三,需在使用環(huán)境與應(yīng)用空間的內(nèi)容上,分析機(jī)器人的負(fù)重條件;其四,應(yīng)從經(jīng)濟(jì)性狀上,選擇市場(chǎng)環(huán)境中通用的大眾型號(hào)機(jī)器人,還是專業(yè)化較強(qiáng)的定制型機(jī)器人。
以圍棋的對(duì)弈為例,可以結(jié)合應(yīng)用特征,使用點(diǎn)位控制模式的機(jī)器人,并在綜合分析視覺(jué)采集模型的內(nèi)容,將攝像頭、吸附盤等用于配合的功能設(shè)備總重量控制在5kg以內(nèi),以此保證機(jī)型構(gòu)建的執(zhí)行功能的高效率條件。同時(shí),可以為其增添電控式的機(jī)械臂,使其長(zhǎng)度條件可以覆蓋整個(gè)棋盤,以此保證人機(jī)互動(dòng)過(guò)程中能正常的進(jìn)行對(duì)弈。
通信系統(tǒng),是為了保證機(jī)器人設(shè)備與圖像、計(jì)算系統(tǒng)連接的重要條件,在通信端口,可以施工RS232型號(hào)的串口,通過(guò)網(wǎng)絡(luò)或是線路的形式完成控制。以RS232串口為例,在就執(zhí)行通信過(guò)程中,可以直接對(duì)其中的波特率、數(shù)據(jù)位、停止位、校驗(yàn)參數(shù)等內(nèi)容進(jìn)行確認(rèn)與合適,以此保證機(jī)器人端口與計(jì)算數(shù)據(jù)端口的同步性條件,以高匹配度完成人際互動(dòng)。而為了更好的執(zhí)行這一內(nèi)容,還需細(xì)致且全面的完成信息編寫內(nèi)容,在使用特定程序協(xié)議的基礎(chǔ)上,執(zhí)行AI計(jì)算機(jī)的內(nèi)部序列,并在執(zhí)行指令的基礎(chǔ)上,確定放置棋子與提取棋子的動(dòng)作指令。
將機(jī)器視覺(jué)、人工智能、機(jī)器智能這三個(gè)模塊進(jìn)行整合,可以更好的完成動(dòng)態(tài)化的機(jī)器視覺(jué)應(yīng)用,并在加強(qiáng)人際交互過(guò)程的同時(shí),提高智能化水平。通過(guò)對(duì)智能圍棋對(duì)弈系統(tǒng)的分析,可以從簡(jiǎn)單的技術(shù)模型基礎(chǔ)上,加深機(jī)器視覺(jué)的交互研究?jī)?nèi)容,并在拓展應(yīng)用條件的基礎(chǔ)上,擴(kuò)大適用范圍,使機(jī)械視覺(jué)背景下的人機(jī)交互展現(xiàn)出更加明顯的示范作用,推進(jìn)技術(shù)的持續(xù)發(fā)展。