趙勤濤 熊玉強(qiáng) 蘆 帥 葛 崢 張建華
(作者單位:趙勤濤、熊玉強(qiáng)、蘆帥、張建華,公安部南昌警犬基地,330100;葛崢,江西省上饒市公安局特警支隊(duì),334000)
在工作犬的訓(xùn)練過(guò)程中,獎(jiǎng)勵(lì)是最重要的手段之一,通過(guò)對(duì)犬表現(xiàn)出的期望行為的獎(jiǎng)勵(lì),增強(qiáng)期望行為出現(xiàn)的概率,加速對(duì)犬行為的培養(yǎng)和塑造。在實(shí)際訓(xùn)練過(guò)程中獎(jiǎng)勵(lì)的方式和種類是多樣的,既有儀式化的獎(jiǎng)勵(lì),比如“好”的口令、撫摸或撫拍等,也有物質(zhì)的獎(jiǎng)勵(lì),最常用的是食物獎(jiǎng)勵(lì)和物品獎(jiǎng)勵(lì)。雖然已有文章闡述了獎(jiǎng)勵(lì)的方法,但是尚未有研究對(duì)獎(jiǎng)勵(lì)的原理進(jìn)行詳細(xì)解析。研究普遍認(rèn)為犬大約是15000年前從狼逐步馴化而來(lái),在行為上遺傳了很多狼的行為習(xí)性,但近二百年來(lái)隨著人類生活環(huán)境的變化,犬的行為特點(diǎn)也發(fā)生了很大的變化,比如隨著食物越來(lái)越富足,犬的季節(jié)性發(fā)情變得愈發(fā)不明顯,集體狩獵和貯藏食物的本能在不斷退化,釋放獵取行為的刺激閾值在不斷提高等,深刻理解這些行為上的變化對(duì)于犬的訓(xùn)練具有重要意義。本文從行為學(xué)和行為進(jìn)化的角度,根據(jù)食物和物品的屬性論述食物獎(jiǎng)勵(lì)和物品獎(jiǎng)勵(lì)在工作犬訓(xùn)練中的使用原則和方法,以期為犬的訓(xùn)練提供參考。
對(duì)人來(lái)說(shuō),犬的訓(xùn)練是訓(xùn)導(dǎo)員對(duì)犬行為的人工選擇過(guò)程。對(duì)犬來(lái)說(shuō),訓(xùn)練的過(guò)程是犬不斷理解訓(xùn)導(dǎo)員的行為,通過(guò)不斷調(diào)整自己的行為進(jìn)而獲得最適生活環(huán)境的過(guò)程。最適生活環(huán)境既包括趨利避害的選擇平衡,也包括以最小的代價(jià)使得欲求得到滿足或?qū)崿F(xiàn)。犬的作業(yè)行為通常可以分為欲求行為階段和完成行為階段,在欲求行為階段犬按照訓(xùn)導(dǎo)員的指令積極尋找和搜索目標(biāo),一旦找到目標(biāo),欲求行為結(jié)束,并開(kāi)始完成行為階段,獲得獎(jiǎng)勵(lì)后,完成行為結(jié)束。完成行為將會(huì)導(dǎo)致犬的欲求下降,使該行為系統(tǒng)在此后的一段時(shí)間內(nèi)不再發(fā)生或者誘發(fā)欲求行為的刺激閾值大大提高。因此工作犬的訓(xùn)練既要求訓(xùn)導(dǎo)員的行為有規(guī)律可循,讓犬充分理解訓(xùn)導(dǎo)員的目的和意圖,更重要的是訓(xùn)導(dǎo)員能充分認(rèn)識(shí)犬的基本行為原理,不斷調(diào)整犬的欲求,通過(guò)不同的獎(jiǎng)勵(lì)方法使犬的欲求得到逐步或集中釋放,從而達(dá)到對(duì)犬行為選擇的目的和訓(xùn)練的預(yù)期效果。由此可見(jiàn),獎(jiǎng)勵(lì)在犬訓(xùn)練過(guò)程中的重要性,獎(jiǎng)勵(lì)物的選擇、獎(jiǎng)勵(lì)的程度、獎(jiǎng)勵(lì)的層次和作業(yè)的難度都會(huì)影響犬的訓(xùn)練效果。
在工作犬訓(xùn)練過(guò)程中選擇食物還是物品進(jìn)行獎(jiǎng)勵(lì),需要理解兩種獎(jiǎng)勵(lì)物的區(qū)別。首先,選擇食物獎(jiǎng)勵(lì)或物品獎(jiǎng)勵(lì)分別對(duì)應(yīng)的是選擇利用犬的食物欲求或獵取欲求進(jìn)行訓(xùn)練。其次,食物和物品對(duì)犬的需求層次不一樣,食物是犬滿足生存和發(fā)展的基礎(chǔ)需要,具有一定的周期性,犬吃飽了以后,饑餓感消失,犬的食物欲求下降,停止進(jìn)食一段時(shí)間后,饑餓感上升,食物欲求會(huì)再次上升。犬對(duì)物品的欲求是在食物欲求的基礎(chǔ)上,獵取欲求和游戲欲求的集中反映,是更高層次的需求。再次,食物欲求的釋放是漸進(jìn)的,因此食物獎(jiǎng)勵(lì)可以重復(fù)多次,而獵取欲求的釋放是集中的,一次物品獎(jiǎng)勵(lì)后會(huì)使犬的欲望下降,再次誘發(fā)犬欲求行為的刺激閾值會(huì)大大提高或暫時(shí)失效,因此物品獎(jiǎng)勵(lì)不宜多次重復(fù)。最后,食物獎(jiǎng)勵(lì)和物品獎(jiǎng)勵(lì)的程度是不一樣的,犬作業(yè)的難度應(yīng)與獎(jiǎng)勵(lì)的程度相結(jié)合,難度高獎(jiǎng)勵(lì)大,難度低獎(jiǎng)勵(lì)小,食物獎(jiǎng)勵(lì)的量可以明顯區(qū)分出獎(jiǎng)勵(lì)的大小,而物品獎(jiǎng)勵(lì)的區(qū)分是不明顯的,但是物品獎(jiǎng)勵(lì)有利于犬的欲求得到集中釋放,增強(qiáng)犬的獲得感。
犬的行為動(dòng)機(jī)是犬為實(shí)現(xiàn)一定的目標(biāo)所表現(xiàn)出來(lái)的主觀愿望和意圖,是犬機(jī)體內(nèi)部刺激和外部刺激共同作用的結(jié)果,動(dòng)機(jī)引起的行為變化具有可逆性。獲取食物的動(dòng)機(jī)與犬的饑餓程度有關(guān),食物欲求通常隨著饑餓程度的增加而增加。比如犬不吃東西會(huì)變得越來(lái)越饑餓,此時(shí)吃食物的動(dòng)機(jī)更為強(qiáng)烈,但當(dāng)喂給它食物后,機(jī)體恢復(fù)到非饑餓狀態(tài),食物欲求下降,那么犬游戲的動(dòng)機(jī)可能變得更為強(qiáng)烈。研究認(rèn)為,犬在同一時(shí)刻只能做一件事,也就是說(shuō)兩種行為不能同時(shí)發(fā)生。準(zhǔn)確把握犬的行為動(dòng)機(jī)對(duì)獎(jiǎng)勵(lì)物品的選擇至關(guān)重要,當(dāng)食物和物品同時(shí)存在時(shí),如果犬選擇物品,說(shuō)明此時(shí)食物欲求小于物品欲求,此時(shí)用物品獎(jiǎng)勵(lì)更能激發(fā)犬的積極性。由于欲求行為本身并不能減少犬的動(dòng)機(jī)欲望,也就是說(shuō)犬的搜索過(guò)程并不能減少犬對(duì)物品的欲望,直到獲得物品獎(jiǎng)勵(lì),欲求得到釋放為止。根據(jù)這一原理,訓(xùn)導(dǎo)員可以在計(jì)劃的3次訓(xùn)練中,前面兩次給予食物獎(jiǎng)勵(lì),最后一次給予物品獎(jiǎng)勵(lì)。如此不僅可以增加訓(xùn)練的次數(shù),還可以增強(qiáng)訓(xùn)練的效果。
行為反應(yīng)的疲勞現(xiàn)象是指同一刺激多次重復(fù),那么對(duì)應(yīng)該刺激的行為會(huì)逐步減弱,直到完全消失,疲勞現(xiàn)象是復(fù)雜行為的一個(gè)普遍特征,當(dāng)該現(xiàn)象發(fā)生后,導(dǎo)致釋放行為的刺激閾值升高,同樣的刺激不能使犬釋放行為,但刺激的轉(zhuǎn)換能重新誘發(fā)一個(gè)已經(jīng)疲勞的行為反應(yīng)。使用食物雖然可以多次重復(fù)給予獎(jiǎng)勵(lì),但是隨著獎(jiǎng)勵(lì)次數(shù)的增加,犬的饑餓感不斷下降,食物欲求隨之下降。除此之外,食物的重復(fù)刺激會(huì)造成行為反應(yīng)的疲勞,犬不愿意為獲得食物再繼續(xù)作業(yè)甚至停止作業(yè),那么獎(jiǎng)勵(lì)的效果將會(huì)大打折扣。此時(shí)如果希望訓(xùn)練繼續(xù)進(jìn)行,可以更換成犬更愛(ài)吃的食物或者將食物換成物品給予獎(jiǎng)勵(lì),即轉(zhuǎn)換外部刺激重新喚起已經(jīng)疲勞的行為,以便時(shí)刻保持犬對(duì)訓(xùn)導(dǎo)員的高度注意和欲求。
最適覓食理論指的是動(dòng)物應(yīng)在投資最小和收益最大的情況下進(jìn)行覓食或改變覓食行為。以烏鴉捕食海螺為例,為了能吃到海螺肉,烏鴉需要先從海邊啄起海螺,然后飛到內(nèi)陸,再把它從高空扔到巖石上,待海螺殼摔破后再吃海螺肉,海螺越大,殼被摔破的概率也越大,烏鴉總是選擇較大的海螺捕食,雖然與小海螺相比,搬運(yùn)大海螺的過(guò)程中需要消耗更多的能量,但小海螺殼難以摔破,烏鴉需要飛得更高或更多地扔螺次數(shù),這會(huì)造成不能達(dá)到收益的最大化。對(duì)工作犬的訓(xùn)練來(lái)說(shuō),最適覓食理論實(shí)際上涉及兩種選擇,即做什么工作和獲取什么獎(jiǎng)勵(lì)。犬所獲取獎(jiǎng)勵(lì)的類型受到最適原則的支配,比如在可以得到的食物中犬會(huì)選擇最有利或最可口的食物,當(dāng)有利性較大的食物數(shù)量增加時(shí),有利性較小的食物就不能再次激發(fā)犬的工作欲望。當(dāng)犬的工作強(qiáng)度和難度增加時(shí),意味著犬的精力投入也會(huì)隨之增加,如果犬完成一次“坐”的動(dòng)作和完成200m2的草地搜索任務(wù)都給予同樣的食物或物品獎(jiǎng)勵(lì),那么就會(huì)造成付出和收益的比例失衡,引起犬搜索作業(yè)的積極性下降,此時(shí)訓(xùn)導(dǎo)員應(yīng)給予比一般訓(xùn)練更大量的或者更可口的食物獎(jiǎng)勵(lì),如果使用物品獎(jiǎng)勵(lì),應(yīng)該給予犬更喜歡的、更難獲得的物品進(jìn)行獎(jiǎng)勵(lì)。
獎(jiǎng)勵(lì)的刺激過(guò)濾是指犬在面對(duì)的各種獎(jiǎng)勵(lì)刺激中,只有一部分獎(jiǎng)勵(lì)刺激能使犬做出反應(yīng),也就是說(shuō)只有能夠被犬感知的獎(jiǎng)勵(lì)對(duì)訓(xùn)練才具有生物學(xué)意義,因此足夠的獎(jiǎng)勵(lì)刺激才可以影響犬的行為。比如在訓(xùn)練犬“坐”的時(shí)候,只有訓(xùn)導(dǎo)員的獎(jiǎng)勵(lì)刺激足以使犬的注意力在訓(xùn)導(dǎo)員身上時(shí),獎(jiǎng)勵(lì)才有意義,如果犬此時(shí)的注意力正盯著周圍車輛或行人,即使給予獎(jiǎng)勵(lì),對(duì)于“坐”的訓(xùn)練本身毫無(wú)意義。行為釋放是指在內(nèi)外部刺激下犬的某種行為得以發(fā)生,行為釋放和獎(jiǎng)勵(lì)刺激的閾值、犬的行為動(dòng)機(jī)、刺激過(guò)濾密切相關(guān)。比如在多次重復(fù)的搜索作業(yè)訓(xùn)練中,隨著訓(xùn)練的進(jìn)行,刺激行為釋放的閾值也不斷提高,那么對(duì)犬獎(jiǎng)勵(lì)的量需要逐步增加,同時(shí)根據(jù)犬行為動(dòng)機(jī)的變化,訓(xùn)導(dǎo)員需要不斷變換獎(jiǎng)勵(lì)物,保持訓(xùn)導(dǎo)員獎(jiǎng)勵(lì)刺激的有效性。
食物和物品獎(jiǎng)勵(lì)作為犬訓(xùn)練過(guò)程中最主要的兩種獎(jiǎng)勵(lì)物,本身沒(méi)有好壞之分,但是要根據(jù)犬的行為動(dòng)機(jī)、作業(yè)的難易程度、訓(xùn)練的強(qiáng)度等方面選擇不同的獎(jiǎng)勵(lì)物、獎(jiǎng)勵(lì)物的種類和數(shù)量,以達(dá)到最好的訓(xùn)練效果。根據(jù)食物和物品的屬性差異和動(dòng)物的需求層次理論,通常情況下選擇食物作為優(yōu)先獎(jiǎng)勵(lì)物,當(dāng)犬的饑餓感下降食物欲求降低時(shí),可以更換成更可口的食物或者選擇物品進(jìn)行獎(jiǎng)勵(lì),單一物品重復(fù)獎(jiǎng)勵(lì)會(huì)造成犬的行為疲勞,因此訓(xùn)練過(guò)程中要準(zhǔn)備盡可能多的物品,根據(jù)犬對(duì)不同物品的欲求,依次進(jìn)行獎(jiǎng)勵(lì),爭(zhēng)取在有限的訓(xùn)練時(shí)間內(nèi),保持獎(jiǎng)勵(lì)刺激對(duì)犬行為的影響,以便獲得更好的訓(xùn)練效果。