王偉健 楊為民 李凱 李志文
摘要:在Robocup3D比賽中,防守一直是一個重要的研究方向。該文提出了一種基于迭代擴展卡爾曼濾波(IEKF)的足球定位方法。這種方法能為為守門員提供精確的足球位置信息,從而提高守門員的撲球與截球成功率。守門員的防守策略包括撲球、主動截球解圍等動作,在不同情況下做出合適的選擇才能夠的更好地提高防守效率與成功率。
關鍵詞:迭代擴展卡爾曼濾波;撲球;防守策略
中圖分類號:TP242 文獻標識碼:A 文章編號:1009-3044(2016)19-0152-04
Research on Defensive Strategy of Goalkeeper in RobocCup3D
WANG Wei-jian, YANG Wei-min, LI Kai, LI Zhi-wen
(1.Department of Computer Science and Technology, Anhui University, Hefei 230601, China)
Abstract: Defense is always a critical research target in the match of RoboCup3D.This paper proposed a method to locate soccer ball based on Iteraative Extend Kalman Filter(IEKF).This method can provide goalkeeper accurate information of soccer ball which aimed to improve the success rates of catching and intercepting.Goalkeepers strategy consists of many action such as ball-catching and ball-intercepting,making correct choices in different cases can improve success rates and enable goalkeepers to defense more effectively.
Key words: Iteraative Extend Kalman Filter; ball-catching; defensive strategy
1 概述
Robocup3D即機器人世界杯足球錦標賽仿真組比賽,其比賽環(huán)境是3D的,世界模型與機器人模型也都依賴于物理引擎,這使得比賽更加逼近真實的足球比賽。沒有復雜的硬件問題,研究人員可以更好地將精力投入到比賽中機器人的決策問題上。其研究背景以MAS(多智能體系統(tǒng))和DAI(分布式人工智能)【1】為主,通過實時異步、分布式控制的平臺對比賽中機器人與世界模型進行仿真模擬,可以實現(xiàn)機器人的各種行為動作,測試機器人的進攻與防守決策系統(tǒng)。比賽目標是在2050年之前組建一支可以打敗人類世界杯足球賽冠軍的機器人球隊。近年來該項目以其新穎的比賽模式、具有挑戰(zhàn)性的技術難度吸引了國內外許多高校隊伍。
比賽中的得分方式是將球帶入或踢入對方球門,所以這就需要制定合適高效的進攻策略,相應地,這也要求我們在面對對方球員的帶球進攻下,組織有效的防守。當比賽結束時雙方戰(zhàn)平,則會采用點球進行勝負判別。在點球比賽階段,每個隊伍都只有一名球員在球場上,即進攻隊點球球員和防守隊守門員。守門員作為球門的最后一道防線起著至關重要的作用。守門員通過對足球的定位與運動路線的預測,結合場上不同的情況,做出不同的防守動作,如撲球,主動截球,大腳解圍等。本文介紹了一種基于卡爾曼濾波【2】的足球定位方法,為守門員提供足球的準確位置信息并詳細介紹了守門員的模型構建,防守策略。
2 守門員的結構模型
2.1 NAO模型簡介
NAO是由 Aldebaran Robotics公司開發(fā)的雙足結構仿人智能機器人[3],在學術領域世界范圍內被廣泛運用。NAO參與的研究項目包括語音識別、視頻處理、模式識別、多智能體、自閉癥治療系統(tǒng)、自動化、訊號處理、全身運動以及路徑規(guī)劃等。2007年,機器人世界杯足球錦標賽RoboCup組委會將NAO定為比賽標準平臺。
NAO高度約為57cm,質量接近4.5Kg ,擁有22個關節(jié)感應器。這22個關節(jié)使得NAO更具移動性,可以靈活地完成各種復雜的高難度動作,其關節(jié)結構圖見圖1[4]。
2.2 NAO模型的異構
比賽采用NAO型仿真機器人作為球員(Agent),但球員的結構模型并非完全一樣,其中存在著異構現(xiàn)象。雖然機器人的關節(jié)包括頭部攝像機都是相同的,但是手臂,左右腿的長度以及腳掌結構卻存在著區(qū)別。RoboCup3D比賽服務器 Rcssserver3D (最新版本0.6.10 )規(guī)定了幾種類型的機器人異構。具體模型見圖2(a,b,c)。
由圖2可以看出,b型異構機器人的手臂與雙腿較長,防守范圍比其他類型機器人防守范圍大,結合守門員的撲球動作可以有效地進行防守。
3 守門員的防守策略
3.1撲球與快速起身
當對方球員帶球至禁區(qū)或射門時,守門員需要快速做出判斷,選擇合適的撲球動作。目前使用的最多的撲球動作有(a)側身倒地撲球;(b)劈叉倒地撲球[5]。
對方進攻球員射門時,守門員對球速與球的軌跡進行預測,當足球越過撲球分界線并且球速超過預定安全閾值,則判定為一次有效的射門,并采取相應地撲球動作。足球方向朝向守門員站位時,采取劈叉倒地撲球的方式,否則采取側身倒地撲球的方式。兩種方式各具優(yōu)缺點,側身倒地撲球的防守范圍大,大約可以擋住球門的一半,但是從動作開始執(zhí)行到完成撲球大約需要1.0~1.3S。而劈叉倒地撲球的方式雖然防守范圍小了一點,但是動作執(zhí)行時間僅需0.8~0.9S。
當守門員撲球成功后,但沒有己方后衛(wèi)協(xié)助防守時,對方進攻球員可能發(fā)動二次進攻,此時敵方在禁區(qū)內會對我方造成很大的威脅。所以這就需要守門員在倒地后快速起身,實行相應地防守策略。為實現(xiàn)快速起身可以采取“俯臥撐式”起身動作[6]。守門員倒地后,膝蓋關節(jié)彎曲,雙手撐地,身體向上抬起,以膝關節(jié)為軸轉動,與此同時需要踝關節(jié)進行彎曲,在直立過程中支撐點由膝關節(jié)轉移到腿部實現(xiàn)快速穩(wěn)定的原地起身。
3.2防守解圍
比賽中可能出現(xiàn)足球在禁區(qū)內低速運動的情況,如果此時守門員采取撲球策略,不但不能有效地進行撲球防守,對方進攻隊員可能在守門員倒地與起身的時間里抓住時機進行射門。針對這種特殊情況,可以設置球速的最低值供守門員進行決策判斷。當足球在防守的危險區(qū)內且球速低于設定的最低值
圖3根據(jù)上述論述的不同情況給出了抽象的防守流程圖。其中
4 守門員對足球進行定位
守門員防守策略的核心是對足球的定位與足球到達防守區(qū)域時速度的預測。守門員根據(jù)這兩個信息做出不同情況下的防守決策,所以足球的精準定位起著至關重要的作用。
4.1 足球位置信息的獲取
機器人每隔兩個仿真周期( Rcssserver3D 0.6.10重新規(guī)定了一個周期為0.01
為了模擬真實的比賽環(huán)境,rcssserver3D 0.6.1 版服務器就在視覺信息中加入了視覺噪聲。視覺噪聲服從以
4.2 迭代擴展卡爾曼濾波
卡爾曼濾波為線性、高斯條件下的遞推貝葉斯估計問題提供了最優(yōu)解的形式,但是在一般的非線性系統(tǒng)中,滿足最優(yōu)解的條件不再成立。一種解決方法是對非線性系統(tǒng)函數(shù)進行近似化處理,利用泰勒級數(shù)展開技術得到非線性函數(shù)的多項式近似表示,在此基礎上提出了擴展卡爾曼濾波算法EKF【7】,而其衍生算法IEKF近似精度更高。首先介紹EKF:
第二步:預測
(1)計算狀態(tài)模型的雅可比矩陣
(2)更新時間
(1)計算觀測模型的雅可比矩陣
(2)測量更新
4.3 基于IEKF的足球定位
足球位置的狀態(tài)模型可由球速衰減經(jīng)驗公式【8】式(18)推導出:
<
式(19)即是足球位置的狀態(tài)函數(shù)。
觀測模型為機器人通過視覺信息獲得的足球相對自身的極坐標位置,經(jīng)過式(2)、(3)轉化得到,過程噪聲Wk在世界模型下可以看做為0,觀測噪聲Vk即是視覺信息中加入的噪聲。通過4.2介紹的IEKF算法對足球位置進行最優(yōu)估計。
4.4實驗結果分析
為驗證IEKF算法在實際比賽中對足球定位的精確性,通過真實比賽對抗,記錄800個仿真周期內足球位置的觀測值與經(jīng)過IEKF濾波處理的最優(yōu)估計值,通過MATLAB對實驗數(shù)據(jù)進行處理。比賽仿真環(huán)境為Ubuntu14.10系統(tǒng),服務器為rcssserver3d0.6.10,Simspark 0.2.3。足球起始位置為(0,0),實驗結果見圖4、圖5。
實驗表明迭代的擴展卡爾曼濾波算法能夠很好地跟蹤足球位置,具有良好的估計性能。守門員通過該算法可以得到更為精確的足球位置,為守門員作出防守決策提供了堅實基礎。
5 結束語
結合迭代的擴展卡爾曼濾波處理的足球位置信息與守門員自身的決策系統(tǒng),可以極大地提高守門員在比賽中的防守效率,幫助球隊在比賽中取得好成績。
參考文獻:
[1] 陳濤.RoboCup3D仿真足球機器人的研究與實現(xiàn)[D].馬鞍山:安徽工業(yè)大學,2014.
[2] 張青,李龍澍,劉躍.基于卡爾曼濾波的仿真機器人定位方法[J].計算機仿真,2013,30(12):317-320.
[3] 王凡,李龍澍.實時解析法在NAO模型運動學求逆解中的應用[J].計算機應用,2011,31(10):2825-2827.
[4] JoschkaBoedecker.SimSparkUsersManual[EB/OL].http://simspa rk.sourceforge.net
[5] 陳濤,陳業(yè)斌,張學峰.關于RoboCup3D仿真系統(tǒng)中守門員關鍵技術研究[J].宿州學院學報,2014,29(3):78-81.
[6] 陳天皓,錢成,談英姿.類人足球仿真機器人快速起身方法的實現(xiàn)[C].濟南:濟南大學學報,2007.
[7] 占榮輝,張軍.非線性濾波理論與目標跟蹤應用[M].北京:國防工業(yè)出版社,2013.40-45.
[8] 黃儒,許元,談英姿.RoboCup守門員動作與策略的研究和實現(xiàn)[J].中國科技信息,2008(21):36-37.