郭 銳 張 松 劉嘉義
刑偵犬的訓(xùn)練中,培養(yǎng)犬良好的嗅認嗅源的習(xí)慣和行為是非常關(guān)鍵的,這是氣味作業(yè)的基礎(chǔ),只有犬充分感受和記憶嗅源,才可能以此為依據(jù)展開氣味鑒別、追蹤、物證搜索等工作。握鼻嗅是比較常見的一種嗅認方法,過去在德國、荷蘭、芬蘭等國警犬鑒別、追蹤中比較常見,近年來,我國警方也在教學(xué)訓(xùn)練中逐漸重視了這種方法。握鼻嗅的好處在于付予嗅認物比較好送持,犬呼吸習(xí)慣有助于嗅源氣味自然進入鼻腔,有助于感受記憶氣味,這與美國實驗動物通過固定導(dǎo)管筒、荷蘭鹿特丹學(xué)校鑒別墻固定送氣筒讓犬呼吸感受樣本氣味是同理的。但通過訓(xùn)導(dǎo)員強制性握住犬的口吻部,使犬“被迫”嗅認所給予的物品氣味,在訓(xùn)練中比較容易出現(xiàn)犬被動、假嗅等問題,如何讓犬學(xué)會積極、主動、自然地嗅認,對訓(xùn)導(dǎo)員的握鼻行為不抗拒,是值得探究的。筆者通過標定訓(xùn)練法的實踐,在握鼻嗅訓(xùn)練中取得良好的效果,下面介紹這種方法,供同行借鑒。
圖1 德國警方使用握鼻嗅進行氣味鑒別訓(xùn)練
標定訓(xùn)練法是一種正強化為主的訓(xùn)練方法。這種訓(xùn)練方法利用特定標定工具,如響片、特定光標、特定發(fā)聲等,對我們期待的行為進行準確標定,隨后給予獎勵,使該行為得到強化,逐漸趨近目標行為,最終形成目標行為。響片訓(xùn)練法就是標定訓(xùn)練體系中一種最為常見的方法。
標定訓(xùn)練的原理源于美國上世紀60年代著名行為學(xué)家斯金納的操作性條件反射學(xué)說,其核心就是動物得到強化的行為出現(xiàn)的幾率會增大,忽略的行為會出現(xiàn)消退。這個理論巨大地影響了動物訓(xùn)練界,從難以控制的海洋動物,到難以馴服的猛獸,還包括了鳥、魚、貓、兔、犬等,使訓(xùn)練手段從過去強迫式的被動建立條件反射,開啟與動物溝通的途徑,讓動物開始思考,主動去嘗試開啟獎勵“開關(guān)”的行為,通過自主學(xué)習(xí)產(chǎn)生行為反應(yīng)。這種方法風靡全世界,上世紀70年代成功用于海豚訓(xùn)練,90年代用于犬的訓(xùn)練。近年來,美國、德國、比利時等國警軍方也在逐漸嘗試使用這種理論和方法來提高警軍犬的訓(xùn)練效率、精準度,收到良好效果,尤其在犬的參與主動性方面得到很大改善。
訓(xùn)練中的幾個關(guān)鍵詞是“充電、行為標定、塑形、鏈接”。
“充電”是讓犬對標定信號(本文中特指響片)發(fā)生聯(lián)系,知道這個信號意味著“有獎勵了”;
“行為標定”是通過誘導(dǎo)、捕捉等方法使犬出現(xiàn)某些我們期待的行為,使用響片來做瞬間準確標定,告訴犬“我喜歡你此刻的行為,一會就有獎勵了”;
“塑形”是將目標分解為小的步驟,一步一步去達成,如同雕塑一個作品,從大輪廓逐漸到小局部,再到對細節(jié)的精確雕琢;
“鏈接”則是將不同的行為元素進行合成,使之成為一個較復(fù)雜的目標行為。反而言之,終極目標的分解就非常重要,要分解出科學(xué)、易操作的小的行為元素,這是訓(xùn)練分散實施、最終鏈接的系統(tǒng)訓(xùn)練的關(guān)鍵。
訓(xùn)導(dǎo)員一只手握住犬的口吻部,另外一只手持嗅源物靠近犬鼻孔部,輕輕晃動,同時下“嗅嗅”口令,犬能夠主動、充分、細致嗅聞,無抗拒、閉氣、假嗅、舔咬、緊張、被動抑制等行為。
將目標行為進行分解,分別安排訓(xùn)練,最后再進行行為鏈接。具體分解為握鼻行為訓(xùn)練和嗅認行為訓(xùn)練:
1、握鼻行為訓(xùn)練:采用塑形法,一步一步趨近目標行為;
2、嗅認行為訓(xùn)練:在日常接觸和帶犬外出時,因時因地,利用自然條件和人為設(shè)置的條件,引導(dǎo)和激發(fā)犬的探求和嗅尋的行為。
1、握鼻行為訓(xùn)練
日常接觸犬時,尤其在喂犬時,讓犬習(xí)慣主人的撫摸。用溫和的聲音獎勵犬,先從犬的胸背、頭部、耳根、背部,逐漸到犬的腳部、腰部、下腹部、尾部等敏感部位,讓犬習(xí)慣、喜歡主人對其身體各部的接觸。這個階段,可以使用響片來標定犬樂于接觸的行為,及時給予食物獎勵。
當犬習(xí)慣主人的撫摸接觸,可伸手輕托住犬下巴,開始時手掌和下巴接觸到即可,用響片及時標定,給予食物,用“好”的聲音溫和地進行鼓勵。逐漸延長托下巴的時間到5 ~10 秒,用響片標定,并給予獎勵。然后用拇指圍過犬吻部,輕輕壓在嘴吻上部,起初不要加力量,不能讓犬感覺到太大壓力。標定和獎勵方法同上。直到犬看到訓(xùn)導(dǎo)員伸手時,會主動把下巴放到手掌上,之后,訓(xùn)導(dǎo)員將拇指合攏,犬不出現(xiàn)抗拒和不 適表現(xiàn)。
2、嗅認行為訓(xùn)練
日常通過將物品、食物放在草叢、縫隙、石板等地方,通過指嗅,讓犬學(xué)會聽到“嗅嗅”口令時,積極主動嗅聞。此刻,可以看到犬閉口嗅聞,伴隨深重的鼻息。
起初進行平面嗅聞,逐漸加入立體嗅聞,鼓勵犬對提前擺放好的陌生物品的自然探求,如在路邊提前放一把釘錘,有意識帶犬經(jīng)過,當犬出現(xiàn)探求行為時,下口令“嗅嗅”,指向釘錘,對犬的嗅探行為,使用響片標定,隨后給予獎勵(可以是食物,也可以是犬喜歡的玩具)。
這個練習(xí)要達到訓(xùn)導(dǎo)員下“嗅”口令時,犬能出現(xiàn)對指向?qū)ο笪锘颦h(huán)境特定突出異物進行積極主動嗅聞的行為。
3、行為鏈接
圖2 握鼻嗅訓(xùn)練目標分解示意圖
準備好一些犬日常接觸不多的物品,如卡片、木塊、橡皮、鑰匙扣、眼鏡布等,放在隨手可取的地方。伸手托住犬下巴,拇指合攏(可以用響片標定一次行為,不獎勵),另外一只手拿一件物品靠近犬鼻子,起初距離不要太近,下口令“嗅嗅”,如果犬發(fā)出嗅探的鼻息聲,立即再次標定,釋放行為,給予獎勵。然后,重復(fù)同樣的練習(xí),更換物品種類,適當延長嗅聞時間,可以重復(fù)數(shù)次,適當變化物品位置,如果是紗布輕微晃動,使氣味散發(fā)出來,便于犬充分感受和記憶氣味。直到犬完全習(xí)慣主人握鼻,并對給予的嗅認對象認真嗅聞,握鼻嗅便基本掌握。
(一)訓(xùn)練前,首先給犬充電。標定訓(xùn)練法首先要給犬進行“充電”,每次按響片后馬上給予食物,通過幾天的練習(xí),犬在任何狀態(tài)下,聽到響片的聲音會出現(xiàn)行為“停頓”,等待注視訓(xùn)導(dǎo)員,說明充電達到效果,可以進行之后的訓(xùn)練了。
(二)不可操之過急,要耐心。正向強化訓(xùn)練需要科學(xué)的設(shè)計,還需要有足夠的耐心,不能因所期待的行為暫時未出現(xiàn),而逼迫犬去完成達不到的目標??梢赃m當減低目標,或把過程再做細化,改變行為導(dǎo)向手段,使行為容易發(fā)生。
(三)初期不要使用玩具獎勵。在訓(xùn)練開始時,食物用作獎勵效果比較好,可以多次反復(fù)獎勵,采用不同量的獎勵、不同食物類型的獎勵,犬進步大、努力多,給予等級較高的食物獎勵,讓犬明確練習(xí)目的和形成期待,容易激發(fā)犬努力完成任務(wù)的動力,這種食物動力平緩、穩(wěn)定、持續(xù)性好,犬在練習(xí)中表現(xiàn)會比較理性。而玩具物品的使用,容易讓犬出現(xiàn)過強的期待,神經(jīng)活動過于興奮,完成動作容易不到位、難以把握,尤其在獎勵后,如果犬占有欲過高,會出現(xiàn)強迫取物的狀況,把“強化獎勵”變成“強迫懲罰”,沖淡了強化的效果。食物獎勵一定要使犬在適當?shù)摹梆囸I感”狀態(tài)下,才能達到好的效果。
(四)訓(xùn)練逐漸復(fù)雜化實戰(zhàn)化。訓(xùn)練初期以培養(yǎng)良好的握鼻嗅習(xí)慣為主,可以在相對熟悉的清靜環(huán)境,在飼喂、外出訓(xùn)練時,靈活地安排訓(xùn)練,以保證犬的主動性為基本,把練習(xí)做為一個好玩的游戲來進行,這樣便可使犬對訓(xùn)練樂此不疲。當犬建立基本的握鼻嗅能力后,就要進行復(fù)雜化實戰(zhàn)化訓(xùn)練,經(jīng)常到陌生環(huán)境,周圍有人、車、動物、雜音等干擾,讓犬適應(yīng)在復(fù)雜條件下進行握鼻嗅,而不受干擾,并結(jié)合所訓(xùn)科目使用握鼻嗅,如:對付予嗅源物品進行握鼻嗅后,尋找同一氣味物品(原物或其他不同類物品),或者尋找同一氣味跡線展開追蹤,或者進入鑒別形式進行氣味識別分化等。握鼻嗅是一個技術(shù)環(huán)節(jié),始終要以最終的使用為目的,才能發(fā)揮出握鼻嗅的作用。在實戰(zhàn)化階段,要注意帶手套、使用鑷子來送持嗅源物,讓犬適應(yīng)實戰(zhàn)及實驗室條件下的嗅源送持方法,不污染嗅源。
本文介紹的是一個訓(xùn)練小環(huán)節(jié)的標定訓(xùn)練法實施思路和方法,按照同樣的原理和方法,我們可以把這種方法應(yīng)用到警犬日?;灸芰ε囵B(yǎng)、服從科目訓(xùn)練及使用科目訓(xùn)練中。通過精心設(shè)計、勇于嘗試,改變過去“訓(xùn)導(dǎo)員為主導(dǎo)”的訓(xùn)練理念禁錮,讓犬“主動學(xué)習(xí)”,學(xué)會主動去試錯。在系統(tǒng)、科學(xué)的訓(xùn)練中,增強警犬的自主性、參與感、自信心,必定會收到意想不到的訓(xùn)練效果。目前,我國警方對標定訓(xùn)練的嘗試還比較少,有不理解、有質(zhì)疑、有猶豫,還有在嘗試之后又回到傳統(tǒng)的“被動強迫式”建立條件反射的路子上,本文權(quán)作拋磚引玉,以期待這種訓(xùn)練方法得到推廣,成為提高警犬訓(xùn)練的有效工具。
圖3 變換環(huán)境、變換物品保持犬“游戲”的積極性,提高實戰(zhàn)能力