在操作性條件反射中,可變比率時間表是一個強化的時間表,其中響應在不可預知的響應數量之後得到加強。 這個計劃創造了一個穩定,高回應率。 賭博和彩票遊戲是基於可變比例時間表的獎勵的好例子。
強化時間表在強化調節過程中起著核心作用。 行為得到加強的頻率可以幫助確定學習響應的速度以及響應的強度。 每個強化的時間表都有其獨特的特徵。
特點
有三個常見的眾所周知的因素:
- 導致高的,穩定的回應率
- 加強後只會導致短暫停頓
- 在無法預測的回複數量之後提供獎勵
在確定不同的強化時間表時,首先查看個人時間表本身的名稱可能非常有幫助。 在可變比率時間表的情況下,術語變量表示強化在不可預知數量的響應之後傳遞。 比例表明,強化是在一定數量的反應後給出的。 所以在一起,這個術語意味著在不同數量的反應之後提供鋼筋。
將鋼筋的變比表與鋼筋的固定比率表進行對比可能也是有幫助的。 在一個固定比率的時間表中,在一定數量的答復之後提供強化。
因此,例如,在具有VR 5時間表的可變比率時間表中,動物平均可以每五次獲得獎勵。 這意味著有時獎勵可能會在三次回應之後出現,有時在七次回復之後,有時在五次回復之後,等等。 強化計劃的平均每5個回應將得到獎勵,但實際交貨計劃仍將完全不可預測。
另一方面,在一個固定比例的時間表中,強化時間表可能被設置為FR 5。這意味著每五個響應就會有一個獎勵。 如果可變比例時間表不可預測,則固定比率時間表設定為固定比率。
例子
- 老虎機:玩家無法知道他們贏得比賽之前需要玩多少次。 他們所知道的是,最終,一場比賽將贏得勝利。 這就是為什麼老虎機非常有效,玩家往往不願意退出。 他們投入的下一個硬幣總是有可能成為贏家。
- 銷售獎金:呼叫中心通常為員工提供隨機獎金。 工作人員不知道他們需要多少次才能獲得獎金,但他們知道他們增加了撥打電話或銷售額的機會。
- 門到門銷售:銷售人員一家一家旅行,但從不知道他們何時會找到感興趣的買家。 它可能是下一個房子,或者可能需要多站才能找到新客戶。
- 視頻遊戲 :在某些遊戲中,玩家收取代幣或其他物品以獲得獎勵或達到下一級別。 玩家可能不知道他們需要多少令牌才能獲得獎勵,甚至不知道獎勵會是多少。