狗狗行為訓練塑造法
強化對提高行為反應的頻率具有十分重要的作用。但是要想運用它進行行為訓練,就必須在訓練的過程中讓目標行為至少出現過幾次。
相反,當狗狗達不到目標行為或者無法直接出現某個行為,則該行為的出現頻率就無法被增加、強化。
因此,遇到這種情況,就需要操作條件強化原則使目標行為或某個行為出現并強化,即行為塑造。
什么是行為塑造?
行為塑造是在斯金納博士操作條件作用的理論上演化而來,
是用來塑造狗狗無法直接作出目標行為的手段,使狗狗的目標行為不斷接近,而最終做出這種目標行為的逐步強化過程。
行為塑造又稱連續逼近法,是對目標行為的一系列連續動作的趨近和不斷強化,最終使狗狗做出目標行為并穩定下來。
行為塑造在狗狗的訓練中應用很多,
如飛盤狗狗的訓練過程:
讓狗狗對玩具(球、繩結)感興趣→學會追逐玩具→學會銜取玩具換回→培養狗狗玩飛盤→近距離接飛盤→遠距離接飛盤。
這一系列過程中,形成了一連串的動作。
同時訓犬師對狗狗接飛盤過程中的每一階段的進步,都應感到開心并及時給予鼓勵,這個過程就是強化,這是一個循序漸進的,逐步強化的過程。
行為塑造的特點
關聯的階段性
行為塑造一般用于比較復雜的行為。一個復雜的行為只靠一個步驟是很難到達目標行為的。
因此在行為塑造的過程中,常把最終的目標行為分解成一個個相互聯系的階段性的目標行為。
如狗狗學裝死的過程可以細化為以下階段性的目標行為:
狗狗來到我身邊→在我身邊坐下→在我身邊臥下→在我身邊側躺→在我身邊完全躺下→在我身邊躺下并能保持一段時間→到最后人離開了狗狗依舊躺著保持不動。
在階段性的目標行為中,第一階段目標行為也是初始行為,是一種最簡單的行為訓練階段,是狗狗很容易就能獲得的行為。
人離開了狗狗依舊躺著保持不動是最終的目標行為,
因此最后一個階段的目標行為也叫終點目標行為,是塑造結果最終要達到的目標行為。
逐步漸進性
行為塑造過程中每一階段的目標行為都是相互聯系的,是一種連續的趨近行為,只有在前一行為完成的基礎上,才能進入下一個目標行為,這樣就形成了一系列的逐步的推進的過程。
如訓練狗狗撿回球:
將狗狗帶到一個安靜的房間,在房間里某個地方放一個球。
這個訓練塑造過程的步驟就是:
狗狗看向球的方向→移動接近球→觸碰到球→嘴巴碰球→嘴巴叼起球→球在嘴巴里保持不掉→叼著球往回走→將球吐在人的手上。
狗狗只有看向球的方向后才有可能去接近球,
在有了接近球的行為動作后,才有可能去觸碰球,以此類推,最終逐步到達終點目標行為。
行為塑造的過程,實際上就是從最簡單,最易被狗狗獲得的動作開始,一步一步地朝著最終的目標行為行進的過程。
兼用強化與消退策略
在行為塑造過程中,每個階段的趨近目標行為實際上都是一種新行為。
狗狗每到達一個預定的階段性目標,訓練師都要給予強化。
當強化到一定程度的時候,訓練師就會停止強化,這往往會導致行為的消失,實際上這一過程就是行為消退的過程。
當然,停止強化的主要目的是為了進入下一階段性目標行為。
如當狗狗第一次主動去觸碰飛盤時,主人會非常開心的抱緊狗狗,和他拔河以及給予食物,
這實際上就是對狗狗的一種強化,得到強化信息的狗狗會繼續表現出類似的行為。
最初幾次,訓犬師會繼續給予及時的回應來強化。
當訓犬師覺得不在需要在對單純的觸碰飛盤進行強化時,如果狗狗還繼續出現只是觸碰飛盤,訓犬師就不要回應了,
因為如果在繼續強化下去,狗狗只會做出那種單純的觸碰飛盤行為,不再會發生叼起飛盤或帶著飛盤回到主人身邊行為。
同樣的,當狗狗做出幾次單純觸碰飛盤都得到不訓犬師的回應時,狗狗就會失去繼續做出這種觸碰行為的興趣。
有時訓犬師要用一些方法教會狗狗學會叼起飛盤行為。
比如模仿學習,在學習狗狗面前強化其他狗狗叼起飛盤的行為。有些狗狗會試圖學習其他狗狗如何叼起飛盤,想得到訓犬師的積極回應。
在狗狗叼起飛盤,訓犬師要及時給予積極回應。此時,這個過程就是對狗狗出現叼飛盤新行為的強化。