经典条件反射（3）

身边的心理学（美）亚当·喀什

使用惩罚也有弊端：可能导致恐惧。当惩罚对某些人产生了效果，他们可能会因为预料到将来的惩罚，从而产生严重的焦虑情绪，就像等着另一只鞋掉下来。这有可能给他们的生活造成破坏性影响，有时导致逃避和冷漠。攻击性是惩罚的另一个负面结果。我在监狱和拘留所都工作过，我看到那里有人变得易怒，更具攻击性，甚至对监禁中所面对的严厉的管束感到恐惧。当他们被释放，可以以新的面貌面对世界时，他们已经不能适应，变得非常刻板，常常不能从监狱过渡到外面的世界。行为消失如果在成功地增加了行为出现的频率后，我突然撤销强化，会发生什么事？行为最终会消失，具体时间取决于之前强化的频率。我保证如果不发工资，很可能用不了多长时间，我的工作行为就会停止。这叫做消退，强化撤销后行为停止。

就像惩罚一样，消退也是一种方法，可以阻止行为再次发生。第8章对消退有更多的介绍。强化程序你有没有想过，为什么有些人一次次地到拉斯韦加斯或者亚特兰大这样的地方去花钱赌博？赌博的结果是，卡西诺赌场成了最大的赢家。但人们就是不愿离开。上次我在拉斯韦加斯时，在卡西诺价值数百万的别墅和度假村里过得非常愉快。我猜我能有这样的享受，全是赌徒们的功劳。人们禁不住再次回来是因为某种叫做强化程序的东西，一个时间表或者是一个定势――关于什么样的反应受到强化和在什么时间进行强化。有四种不同的强化时间安排，每一种都可以对行为产生不同的效果。固定时间间隔不固定时间间隔固定比率间隔不固定比率间隔最常见的强化形式是持续强化。每一次行为出现时都进行强化。每一次我拉动自动售卖机的把手，我就赢！我是这么期望的。持续强化有助于塑造学习的过程，也对获得阶段有好处。每次我学习一个新的行为，都要花一定的时间。持续强化可以帮助我学得更快。但是，持续强化的问题是，它消失得也快。如果我们每次午饭后按时回去工作都受到强化，那么老板一旦停止强化，我就立即会恢复原来的行为。但是，大部分的强化都是间断的、偶发的。当然，我们不可能每次拉动自动售卖机的把手时都能有奖。斯金纳没有设计过自动售卖机；卡西诺的行为主义心理学家洛瑟（B·A·Loser）设计了这种装置。低频率的强化称作部分强化。有两种部分强化程序，按照强化出现的可预见性或者偶然性，每一种部分强化程序又被进一步地分类。第一种部分强化又称比率强化程序。只在出现了特定数量的反应时才给予强化。如果父母对孩子采用这种强化，可能是在孩子得了一定数量的A或者打扫房间达到一定的次数之后。

● 有时我们需要固定数量的反应，有时是不固定数量的反应，所以比率程序也有所不同。固定比率的强化（见图91）总是在出现了固定数量的反应后给予强化。如果我的孩子每得两个A就受到奖赏，而且永远不变，那么就是每两个A强化一次。

● 不固定比率的强化（见图92）不按照反应出现的次数进行。可能这次孩子得了两个A我进行了强化，但是以后可能他得了一个A、三个A、十个A我才强化。就是要让对方不断地猜却总也猜不到什么时候强化。这种方法对行为的持续出现有很大效果。因为对方不知道什么时候会有强化，所以会不停地表现出必要的行为。比起持续强化，这种方法不易使行为消退。图91固定比率的强化是有规律可循的图92不固定比率的强化是无规律可循的另一种部分强化程序叫“时间间隔强化程序”，通过间隔时间来实施强化。

● 我每月拿工资，什么时候拿有固定时间。我的工资就是一个固定时间间隔强化程序（见图93），这个时间不会变。

● 另一种时间间隔强化程序叫不固定时间间隔强化程序（见图94）。

上次强化和这次强化的时间间隔不定。可能月底发工资，也可能三周后发，或者其他时间。这种强化也不易使行为消退，原因与不固定比率的强化一样。接受者永远不知道什么时候会被强化，所以他会一直表现出期望的行为。图93固定时间间隔强化程序并不意味着强化是NEUTERED图94不固定时间间隔强化程序中强化是变化着的不固定时间间隔强化正是赌博得以持续的原因。卡西诺设计机器，让它不定时地给出奖赏，这样我们就不停地往里面投钱，希望得个大奖。如果你不玩，就不可能赢。所以你就想，下次该轮到你赢了，或者这次你一定赢，因为你已经守着这台机器三天了（不洗澡，不睡觉，甚至饭都不吃），但是，请记住它是没准的。你永远不知道机器什么时候青睐你。如果你放弃了，下一个坐下的人大大赢了一笔，你也别抱怨！这就是赌博。避免对罚单的泛化你有没有注意到，当人们在高速路上看到骑警时会减速？很可能是因为他们都或多或少地从骑警那收到过罚款单。但是，当看见一个称职的、年老的普通警察，他们会减速吗？没有人减速。他们就当没看见。这是在公开违法吗？不。这是刺激控制的一个例子。期望的行为是否出现，取决于刺激是否在强化或者惩罚的同时发挥作用。虽然执法当局也会给超速者开罚单，但是我们大部分人都知道通常普通警察是不会在高速路上开罚单的。这种刺激会导致不同的后果，对我们的行为的影响也不同。只有骑警才实施惩罚。有时，当我们在强化后学会了一种反应，我们可能会自动地把这种反应泛化到其他的类似刺激中。如果我把骑警的罚单泛化到所有警察都会开超速罚单，那我可能每次遇到警察都会减速。如果我们午饭后按时上班得到强化，我可能会泛化这种行为，早上也按时上班。泛化帮助我们加速学习的过程，因为我们没有时间为每一次单个的行为去接受强化。（关于泛化的更多内容，请查阅第8章）。

分化有时人们会过度地学习一个行为或者反应。然后在不需要反应的时候，他们也会作出反应，因为他们已经把那个行为泛化得有点过头了。我想有时这种事情会发生在心理治疗师身上。当我们在一个社交场合，不是在上班，有人开始谈论他这一天有多糟。心理治疗师脱口而出，“告诉我你的感受，”每个人都怀疑地看着心理治疗师，就像看着一个冒牌医生？他也许该去度假了。我也在电影里看到过这样的现象。原来做过警察的人，对他孙子拿水枪指着他有些反应过度，他把这个孩子拿下，才算“解除了威胁”。这提出了一个分化的问题，只对一两个或者多个特定的刺激中的一个作出反应。通过同时呈现两种刺激并且强化对正确刺激的反应，可以解决这个问题。把祖父放在一个被劫持的情境中，然后把持水枪的孙子也混在情境中。只有当这位爷爷侦探成功地解除了抢劫者（刺激1）的威胁并且没有逮捕孙子（刺激2）时才给予强化。这样，他就学会了区分真正的威胁和根本不存在的威胁。