斯金纳箱(Skinner box)是心理学实验装置。行为主义者斯金纳1938年发明,并于动物操作条件作用实验。其基本结构:在箱壁的一边有一个可供按压的杠杆(大多是一块金属板),在杠杆旁边有一个承受食物的小盒紧靠着箱壁上的小孔,小孔外是食物释放器,其中贮有颗粒形食物。动物在箱内按一下杠杆,即有一粒食物从小孔口落入小盒内,动物可取食。一只白鼠禁食24小时后被放入箱内,开始它在箱内探索,偶尔按压了杠杆,获得食丸。白鼠开始可能并没有注意到食物落下,但若干次重复后,就形成了压杆取食的条件反射。以后稍有改进,如外包隔音箱,食物释放装置由程序控制等,可测试动物能否学会按三次杠杆以得到食物,或间隔一定时间按压杠杆才能得到食物。对不同物种的动物,其设计稍有不同。该装置实际是对桑代克迷箱的改进,后被用于研究动物学习能力和自我刺激与合作行为等心理学研究。现已采用电子线路,使用更方便。
斯金纳(Burrhus Frederic Skinner,1904—1990)是新行为主义心理学的创始人之一。他1904年3月20日生于美国宾夕法尼亚州东北部的一个车站小镇,在那里他度过了他的童年和中学时代。出于对文学的兴趣,他进入了汉密尔顿学院,主修英国文学。本来他想成为作家,毕业后从事写作,但两年后他便觉得“没有什么重要的事要说了”。于是他于1928年考入哈佛大学读研究生,改修学心理学。1931年他获得哲学博士学位。此后他相继执教于明尼苏达大学和印第安纳大学。1947年他受聘重返哈佛大学,担任学校心理系终身教授。
新行为主义学习理论—操作性条件反射
斯金纳关于操作性条件反射作用的实验,是在他设计的一种动物实验仪器即著名的斯金纳箱中进行的。箱内放进一只白鼠或鸽子,并设一杠杆或键,箱子的构造尽可能排除一切外部刺激。动物在箱内可自由活动,当它压杠杆或啄键时,就会有一团食物掉进箱子下方的盘中,动物就能吃到食物。箱外有一装置记录动物的动作。斯金纳的实验与巴甫洛夫的条件反射实验的不同在于:(1)在斯金纳箱中的被试动物可自由活动,而不是被绑在架子上;(2)被试动物的反应不是由已知的某种刺激物引起的,操作性行为(压杠杆或啄键)是获得强化刺激(食物)的手段;(3)反应不是唾液腺活动,而是骨骼肌活动;(4)实验的目的不是揭示大脑皮层活动的规律,而是为了表明刺激与反应的关系,从而有效地控制有机体的行为。
操作性条件反射这一概念,是斯金纳新行为主义学习理论的核心。斯金纳把行为分成两类:一类是应答性行为,这是由已知的刺激引起的反应;另一类是操作性行为,是有机体自身发出的反应,与任何已知刺激物无关。与这两类行为相应,斯金纳把条件反射也分为两类。与应答性行为相应的是应答性反射,称为S(刺激)型(S型名称来自英文Stimulation);与操作性行为相应的是操作性反射,称为R(反应)型(R型名称来自英文Reaction)。S型条件反射是强化与刺激直接关联,R型条件反射是强化与反应直接关联。斯金纳认为,人类行为主要是由操作性反射构成的操作性行为,操作性行为是作用于环境而产生结果的行为。在学习情境中,操作性行为更有代表性。斯金纳很重视R型条件反射,因为这种反射可以塑造新行为,在学习过程中尤为重要。
实验1:将一只很饿的小白鼠放入一个有按钮的箱中,每次按下按钮,则掉落食物。
结果:小白鼠自发学会了按按钮。
这个实验比“给狗狗摇铃喂食”的巴普洛夫实验更进了一步,建立行为。
何为学习?就是指将行为与操作者的需求建立相倚性联系。换句话说,使行为者感觉到“行为”与“奖励”是有联系的。
只要通过将行为与奖励不断重复、建立联系,就可以培养起操作者的行为模式。
奖励可以培养行为习惯,很棒吧?那么看实验2。
2.行为与惩罚
实验2:将一只小白鼠放入一个有按钮的箱中。每次小白鼠不按下按钮,则箱子通电。
结果:小白鼠学会了按按钮。
但遗憾的是,一旦箱子不再通电,小白鼠按按钮的行为迅速消失。
“惩罚”,作为奖励的邪恶双生子,可以迅速建立行为模式。然而,惩罚具有一定的副作用:它建立起来的行为模式,来得快,去得也快。一旦惩罚消失,则行为模式也会迅速消失。
从长远来看,惩罚对于行为的制止并不会起到显著作用。现实生活中,因为惩罚带来的凡勃伦效应,有时甚至会使惩罚起反作用。
凡勃伦效应:美国学者凡勃伦认为,与产品越降价、需求越增多的一般规律不同,特定的产品越涨价,需求越增多。部分上流阶层的消费目的在于,炫耀自己的社会地位和成功,满足虚荣心,所以价格越高,需求则增加。相反,如果降价,体现上流阶层的界限变得模糊,所以需求减少。
如果想要控制行为者不去进行某个行为时,应找到该错误行为的“奖励物”,移除该奖励,从而制止其错误行为。
然而,即使是奖励,当不再掉落食物时,小白鼠的学习行为也会逐渐消失(虽然消失得稍慢一些)。而且这样太浪费食物了!那该怎么办呢?
接下来是实验3。
3.固定时间奖励
实验3:将一只很饿的小白鼠放入斯金纳箱中,由一开始的一直掉落食物,逐渐降低到每1分钟后,按下按钮可概率掉落食物。
结果:小白鼠一开始不停按钮。过一段时间之后,小白鼠学会了间隔1分钟按一次按钮。
当掉落食物停止时,小白鼠的行为消失。
啧啧,失败了。没有培养起小白鼠连续按按钮的行为,反而使小白鼠“偷懒”了。为什么?因为行为者知道短期内行为不会再得到奖励。……好吧。最关键的实验4。
4.概率型奖励
实验4:将一只很饿的小白鼠放入斯金纳箱中,多次按下按钮,概率掉落食物。
结果:小白鼠学会了不停按钮。
当不再掉落食物时,小白鼠的学习行为消失速度非常慢。
随着概率越来越低,小白鼠按按钮的学习行为没有变化,直至40-60次按按钮掉落一个食物,小白鼠仍然会不停按按钮,持续很久一段时间。
(同样的,用鸽子做实验,平均每5分钟获得变化时距的食物强化的鸽子,每秒能做出2-3次反应,连续反应长达15小时)
这个实验模拟了为什么“赌博”——如简单的老虎机,或者更复杂的赌博——会给予人类以依赖感,或者说,成瘾性。
由于概率性给予结果,行为者很难直观地判断机制是否失效,所以单次的失败不会给予明显的“惩罚”效果,终止行为者的习惯,从而行为者的学习行为会一直持续下去。
然后是一个有趣的实验5。
5.迷信的小白鼠?
实验5:好吧,其实实验5还是实验4,概率型斯金纳箱。
结果:这些小白鼠有很多培养出了奇特的行为习惯,比如撞箱子、比如作揖、比如转圈跳舞。
这是因为掉落食物前,小白鼠正好在进行这些行为,于是产生了“迷信”。
许多游戏中传出的谣言,比如“在中午抽奖容易得到大奖”,或者“带满一背包幸运兔脚可以获得更好的装备”之类,其原理与之相同。
斯金纳通过实验发现,动物的学习行为是随着一个起强化作用的刺激而发生的。斯金纳把动物的学习行为推而广之到人类的学习行为上,他认为虽然人类学习行为的性质比动物复杂得多,但也要通过操作性条件反射。操作性条件反射的特点是:强化刺激既不与反应同时发生,也不先于反应,而是随着反应发生。有机体必须先作出所希望的反应,然后得到“报酬”,即强化刺激,使这种反应得到强化。学习的本质不是刺激的替代,而是反应的改变。斯金纳认为,人的一切行为几乎都是操作性强化的结果,人们有可能通过强化作用的影响去改变别人的反应。在教学方面教师充当学生行为的设计师和建筑师,把学习目标分解成很多小任务并且一个一个地予以强化,学生通过操作性条件反射逐步完成学习任务。