于 毅
條件反射理論是警犬訓(xùn)練基本理論,警犬作業(yè)能力培養(yǎng)過程就是若干個條件反射建立和組合過程。加深對條件反射理論的理解將有助于我們提高警犬訓(xùn)練技術(shù)。
巴甫洛夫反射理論主要觀點是:具有生命的個體和它所處的外部條件是相互聯(lián)系的。高等生物個體和他們所處的外部世界的所有聯(lián)結(jié)實質(zhì)上就是通過神經(jīng)體系來聯(lián)結(jié)的。神經(jīng)體系與外部世界聯(lián)結(jié)的形式就是反射。反射就是當外部世界和機體內(nèi)部對生命體產(chǎn)生刺激后,生命個體通過大腦和神經(jīng)系統(tǒng)產(chǎn)生的應(yīng)答性反應(yīng)。其核心思想就是條件反射理論,這一理論亦稱為經(jīng)典性條件反射理論。
巴甫洛夫條件反射理論的形成來源于研究消化生理的實驗,也稱“搖鈴實驗”。在實驗中,他選擇食物作為非條件刺激,犬吃到食物時會自然地分泌唾液。他又選擇鈴聲作為中性刺激。在實驗中,巴甫洛夫首先讓犬聽到鈴聲,然后立即給它喂食,這時,犬會分泌大量的唾液。反復(fù)多次訓(xùn)練之后,聽到鈴聲后犬就像已經(jīng)吃到食物一樣,自然地分泌唾液。此時說明條件反射已經(jīng)形成,原本的中性刺激鈴聲已經(jīng)成為引起唾液分泌的條件刺激。巴甫洛夫的實驗印證了條件反射的存在,說明它可以替代非條件反射引起個體相同的反應(yīng)。巴甫洛夫的經(jīng)典性條件反射實驗以科學(xué)實驗的方式給我們揭示了動物行為的學(xué)習(xí)途徑。一是食物可以使犬流唾液,流唾液是自然的、無法控制的反應(yīng),食物是一種非條件刺激;二是鈴聲不會使犬流唾液,鈴聲是一種條件刺激;三是把食物和鈴聲配合起來,使犬學(xué)會把這兩者聯(lián)系起來;四是即使沒有食物,鈴聲也可以引起犬流唾液。這種將兩個本沒有關(guān)聯(lián)的事物聯(lián)系在一起,就是條件反射的建立過程。
斯金納是操作性條件反射理論的奠基者,斯金納箱實驗最能說明操作性條件反射原理。這一實驗把貓放到一個“問題箱”里,此時貓在本能驅(qū)使下就會想方設(shè)法逃出去,它會到處沖撞試圖找到出口。最后它可能因某一個偶然性動作而踩踏了1 塊木板,門便通過機關(guān)自動打開或者實驗人員按下開關(guān)把門打開,于是貓便逃出箱外獲得了自由,即得到了獎勵。如果把逃出的貓再關(guān)入“問題箱”,使這一過程不斷重復(fù),貓就能越來越快地從“問題箱”中逃出來,最后貓便能學(xué)會把踩踏木板和開門這兩件事聯(lián)系起來。此時如果再把貓放入箱中,它就會為了開門而直接去踩踏木板。操作性條件反射就是這樣建立起來的。在此基礎(chǔ)上,我們將動物的這種學(xué)習(xí)行為進一步延伸,在其中加入某種信號,使動物根據(jù)人為發(fā)出的信號執(zhí)行某種行為。例如,訓(xùn)練動物在聽到蜂鳴器發(fā)出聲響的時候去壓桿,起初1 只饑餓的動物是隨機運動的,也許當蜂鳴器發(fā)出聲響時它偶然壓了1 次桿,此時食物立刻出現(xiàn)使之得到獎勵。以后,食物的每次都是在這一特定的情況下出現(xiàn),經(jīng)過反復(fù)練習(xí),動物就建立了對蜂鳴器聲響的條件反射,聽從其指令去壓桿。操作性條件反射建立過程的邏輯關(guān)系是:將動物放在某種我們設(shè)計的特定的場景中,其在本能驅(qū)使下產(chǎn)生自發(fā)行為,某種自發(fā)行為自動獲得或者人為施與的獎勵,使這種自發(fā)行為反復(fù)得到強化,這樣,當某種特定的場景再次出現(xiàn),動物就“學(xué)會”了采取其不斷得到強化的那種行為去“解決問題”,條件反射就此建立。
在經(jīng)典性條件反射中,條件刺激與非條件刺激(強化物)幾乎同時出現(xiàn),經(jīng)過反復(fù)練習(xí),使這兩個刺激暫時建立神經(jīng)聯(lián)系,當?shù)谝粋€刺激出現(xiàn)時就能引發(fā)與第二個刺激一樣的反應(yīng)。例如,將鈴聲(條件刺激)與食物(非條件刺激)反復(fù)結(jié)合共同作用于犬,反復(fù)練習(xí),鈴聲就能引發(fā)犬產(chǎn)生流唾液的反應(yīng)。
在操作性條件反射中,當動物的某一個反應(yīng)發(fā)生后,緊接著對其施加特定形式的刺激,這種刺激分為獎勵和懲罰兩種性質(zhì),即正、負強化。如果動物得到的是獎勵性質(zhì)的刺激(正強化),這種反應(yīng)將趨向于再次發(fā)生;如果動物得到的是懲罰性質(zhì)的刺激(負強化),反應(yīng)將逐漸弱化,直至不再發(fā)生。獎勵或懲罰是伴隨條件反應(yīng)的發(fā)生而出現(xiàn)的,反應(yīng)決定強化,無反應(yīng)就無強化。
操作性條件反射同經(jīng)典性條件反射的區(qū)別在于,前者沒有所謂的條件刺激,也不是靠條件刺激與非條件刺激相結(jié)合而形成條件反射,它的形成是動物的一種隨意活動,而且是本能行為的結(jié)果。動物在本能驅(qū)使下不斷去嘗試,因此是一種“試錯式”學(xué)習(xí)。在操作性條件反射建立過程中,動物具有“主動學(xué)習(xí)”的特點。
犬體不健康時,建立經(jīng)典性條件反射時,當非條件刺激施加于犬體,可能影響犬做出相應(yīng)的應(yīng)答性行為。建立操作性條件反射時,當某種情境出現(xiàn)時,犬可能不出現(xiàn)我們預(yù)期的行為,強化手段無法實施,條件反射將無法建立。因此,我們應(yīng)加強對犬的飼養(yǎng)管理,當犬患有疾病時應(yīng)及時治療,消除犬的病痛才能進行訓(xùn)練。
如果犬因疲倦、睡眠不足等原因,導(dǎo)致頭腦不清醒,將影響條件刺激與非條件刺激、犬主動行為與強化之間結(jié)合的效果,導(dǎo)致犬學(xué)習(xí)效率低下。因此,我們應(yīng)避免過度、長時間的訓(xùn)練。每天分多次、短時間地開展訓(xùn)練,是避免過度訓(xùn)練的有效方法。
安靜的環(huán)境是訓(xùn)練必要的條件。訓(xùn)練中干擾因素太多將導(dǎo)致犬無法集中精力,甚至對干擾刺激產(chǎn)生反應(yīng),亦稱產(chǎn)生“外抑制”,將嚴重影響訓(xùn)練效果。一方面我們應(yīng)堅持對犬進行環(huán)境鍛煉,以消除犬對訓(xùn)練、使用環(huán)境中常見刺激的過激反應(yīng),以至不再反應(yīng);另一方面,要避免在過于復(fù)雜的環(huán)境中進行訓(xùn)練,尤其是在條件反射建立初期。
與警犬訓(xùn)練密切相關(guān),應(yīng)重點利用的非條件反射主要有:食物反射、防御反射、探求反射、獵取反射、姿勢反射、自由反射、性反射。條件反射建立過程中,犬相應(yīng)的非條件反射神經(jīng)活動應(yīng)處于興奮狀態(tài),警犬訓(xùn)練才能取得預(yù)期效果。例如,利用食物反射誘導(dǎo)犬做出某種作業(yè)行為,或者用食物獎勵犬的某種作業(yè)行為,將食物作為正強化的手段,以建立某種條件反射時,如果剛給犬喂食,其處于飽腹狀態(tài),或者犬患病導(dǎo)致食欲不振,食物反射的神經(jīng)活動處于抑制狀態(tài),利用食物來建立條件反射就失去了原有的基礎(chǔ),條件反射將難以建立。
在經(jīng)典性條件反射建立過程中,要注意非條件刺激和條件刺激的強度。強刺激引起強反應(yīng),弱刺激引起弱反應(yīng),但超過犬生理承受范圍的強刺激將引起超限抑制。例如,長時間單調(diào)重復(fù)訓(xùn)練將使犬處于抑制狀態(tài),服從科目訓(xùn)練中對犬施加的機械刺激過強也將導(dǎo)致犬處于抑制狀態(tài)等。值得注意的是,在建立條件反射時,非條件刺激強度要大于條件刺激。在操作性條件反射建立過程中,對犬施加的正、負強化刺激也要注意強度,刺激強度的大小要因“犬”制宜,尤其是正強化刺激不應(yīng)太弱,負強化刺激不能過強,否則將影響訓(xùn)練效果。
巴普洛夫在研究條件反射建立過程中發(fā)現(xiàn),條件刺激先于非條件刺激出現(xiàn)的效果最佳,同時出現(xiàn)的效果次之,而其他結(jié)合方式則很難建立條件反射。在警犬訓(xùn)練中,我們應(yīng)先對犬發(fā)出條件刺激——口令、手勢等,再對犬施加非條件刺激。例如,“坐”科目訓(xùn)練,先對犬下達“坐”的口令、手勢,再按壓犬的腰角、提拉脖圈等,使犬做出“坐”的動作,兩個刺激之間一般間隔幾秒鐘,但口令、手勢一定要在前。
條件反射的建立過程就是學(xué)習(xí)的過程,學(xué)習(xí)就離不開反復(fù)練習(xí)。經(jīng)典性條件反射要將條件刺激與非條件刺激反復(fù)結(jié)合,操作性條件反射要將犬的某種自發(fā)行為與訓(xùn)導(dǎo)員施加的正負強化刺激反復(fù)結(jié)合。結(jié)合的次數(shù)因科目難度和犬的個體差異有所不同,從數(shù)十次到成百上千次不等。值得注意的是,條件反射建立后也不是一勞永逸的,如果條件刺激頻頻出現(xiàn)而其后沒有非條件刺激出現(xiàn),那么這兩種刺激之間的聯(lián)系就會逐漸消失。例如,拿犬看到燈光就分泌唾液這一條件反射來說,如果不是不斷地同時給予犬食物刺激,條件反射就會慢慢衰退,這種現(xiàn)象就叫消退。因此,犬的條件反射形成后,還要經(jīng)常性地進行復(fù)習(xí)鞏固,這也就是我們要堅持開展日常訓(xùn)練,定期進行復(fù)訓(xùn)的原因。