考点4 斯金纳的操作性条件作用说

斯金纳是美国心理学家,新行为主义学习理论的创始人。他以严格控制的动物实验 为基础,对操作行为及其形成过程、强化的原则、类型和程序进行了精细的研究,系统 性地阐明了操作性条件作用理论。

1.斯金纳的经典实验: 白鼠的操作性条件作用实验

斯金纳在桑代克的迷笼实验的基础上发明了一种学习装置——斯金纳箱。

斯金纳箱内装上一根操纵杆,操纵杆与另一提供食丸的装置连接。把饥饿的白鼠置于箱内,白鼠偶然踏上操纵杆,供丸装置就会自动落下一粒食丸。白鼠经过几次尝试,会不断按压杠杆,直到吃饱为止。白鼠从这一过程中学会了按压杠杆以取得食物的反应。

巴甫洛夫认为,一个明确的刺激(铃声)引起了被试动物的反应(流口水),这是之前所学的S-R 的 过程,是一个刺激引起一种行为的应答的过程,叫作应答性条件作用。斯金纳的被试动物的反应(按压杠杆) 不是由某种刺激引起的,而是这个刺激(食丸)变成了一种强化行为再次发生的强化物,呈现在反应(按压杠杆)之后,这是R—S 的过程。斯金纳把这种没有刺激就能使有机体产生某种行为的过程叫作 操作性条件作用。

从表面看,二人的实验都是把小动物关在笼子里,找到开关获得食物。但从深层次看,两个实验具有 不同之处: 桑代克的被试动物(猫)是看到了笼子外的食物,积极地多次试误,学会了找到开关,然后才 可以吃到食物,他没有改变S—R 的呈现顺序,还是通过食物在刺激猫要先找到开关,并说明S 与R 之间 需要多次试误;斯金纳的被试动物(老鼠)产生按压杠杆的反应之前没有看到任何食物,只有老鼠学会了 按压杠杆才会有食物作为奖励。斯金纳的实验想说明的是在产生行为R 之前,可以不用呈现一个特定的刺 激(如食物),这也说明了人类存在另一种学习,即先产生行为,后给一个强化物作为刺激去巩固这个行为, 如R-S。

2.学习的实质

通过上述实验对比的分析,我们可以总结如下:

(1)斯金纳认为学习的实质是一种反应概率的变化,而强化是增强反应概率的手段。实验中的老鼠出 现按压杠杆的反应行为,是由吃到食丸强化的。斯金纳把这种先操作行为再强化的学习方式叫作操作性条 件作用,也叫操作性条件反射,用符号表示为R—S。

①任何反应如果随之紧跟强化(奖励)刺激,这个反应就有重复出现的趋向。

②任何能提高操作反应率的刺激都是强化剌激。操作性条件作用强调的是行为及其结果,操作性条件 作用的形成就是机体把强化和所发出的操作反应相联系的过程。

斯金纳认为所有行为可以分为两类: 应答性行为和操作性行为。相应地,斯金纳把条件作用也分为两 类:经典性条件作用(应答性条件作用)和操作性条件作用(反应型条件作用)。经典性条件作用是刺激- 反应(S—R)的联结,反应是由剌激引起的。如铃声引起狗分泌唾液,谈虎色变等。(刺激在先,反应在后) 操作性条件作用是操作一强化(R—S)的过程,重要的是跟随操作反应之后的强化(刺激)。如有了食丸 的奖励,老鼠更能学会按压杠杆;学生对老师微笑,老师再用微笑回应,学生才更愿意做出微笑的行为等。

类别 经典性条件反射 操作性条件反射
代表人物 巴甫洛夫 斯金纳、桑代充
反应特征 应答性行为 操作性行为
联结公式 刺激-反应(S-R),反应是由刺激引起的 操作一强化(R-S),重要的是跟随操作反应之后的强化(刺激)
形成条件 无条件刺激和条件刺激多次同时或近乎同时的反复出现 学习是通过行为受强化而进行的
刺激 对特定刺激才能产生反应 不需要特定的刺激就能产生反应
消退 条件刺激多次单独出现 将强化物去掉
 

相同点

(1)两者研究的都是外部刺激和个体反应之间的关系;

(2)两者都可以建立多级条件作用;

(3)两者都有消退、泛化和分化的现象;

(4)两者中的很多观点都对现实中的教学有很大的指导意义

教学应用 (1)在教育过程中,教师应多用正强化的手段来塑造学生的良性行为,用不予强化的方法来消除消极行为;

(2)在教学过程中,教师要注意观察学生对什么强化物感兴趣,针对学生的兴趣与年龄特点使用不同的强化物

3.操作性条件作用的主要规律

强化指通过某一事件或刺激增强某种行为的过程。其中的事件或刺激叫作强化物。强化分为正强化和 负强化。

①正强化

含义: 正强化也称积极强化,指当有机体做出某种反应,并得到了令人愉悦的强化物的刺激,那么这 一反应在今后发生的频率就会增加。

举例: 当学生受到教师的表扬时,更愿意努力学习;妈妈为了激励小明提高成绩,提出如果他期末考 试进入班级前十名,就给他买他一直想要的电脑,这里“表扬”和“买电脑”就是一种正强化。

②负强化

含义: 负强化也称消极强化,指当厌恶刺激或不愉快情境出现时,若有机体做出某种反应,从而避免 了厌恶刺激或不愉快情境(负强化物的移去或取消),则该反应在以后的类似情境中发生的概率便增加了。

举例: 当学生表现不好,受到学校或教师的处罚,一旦处罚解除,学生表现好的概率增加,这里解除 处罚就是一种负强化;学生打架,家长取消了他一周的零花钱作为恁罚,该学生为了保住零花钱再也不打 架了,这里不取消他一周的零花钱就是一种负强化。

此外,强化还可以分为立即强化和延缓强化,间隔强化和连续强化。立即强化的效果优于延缓强化, 间隔强化的效果优于连续强化。

 

程式 定义 示例 反应建立方式 强化终止后的反应
连续强化 给予每个反应强化 一开灯就亮 迅速学会反应 反应迅速消失,毫无持续性
 

定时强化

 

固定时段后给予强化

 

按时发工资

随着强化时间的临近, 反应数量迅速增加,强 化后反应数量骤减 反应具有很短的持续性,当强化时间 过去,不再出现强化物时,反应速度 迅速降低
 

定比强化

固定反应次数后给予强 化  

计件工作

反应建立迅速,强化后 反应会暂停 反应具有很强的持续性,当达到预期 的反应数而不再有强化物时,反应速 度降低
变时强化 不定时给予强化 随堂测验 反应建立缓慢、稳定, 强化后反应不会暂停 反应具有更长的持续性,反应降低的 速度缓慢
变比强化 在不定反应次数后给予 强化 买彩票、老虎机 反应建立的速度很快, 强化后几乎不会暂停 反应具有最长的持续性,一直保持很 高的水平,不会消失

普雷马克原理:在强化时,我们可以使用普雷马克原理,即用高频的活动作为低频活动的强化物, 或者说用学生喜爱的活动去强化学生不喜爱的活动。如果一个儿童喜爱做航空模型而不喜欢阅读,可以 让学生先完成一定的阅读之后再去做模型。

逃避条件作用和回避条件作用都是负强化的条件作用类型。

①逃避条件作用: 当厌恶刺激或不愉快情境出现时,若有机体做出某种反应,从而逃避了厌恶刺激 或不愉快情境,则该反应在以后的类似情境中发生的概率会增加。

举例:在自习室学习时,有同学大声喧哗,嬉戏打闹。小明认为这影响了自己的学习,因此,回寝室进行学习的次数越来越多。
②回避条件作用:当预示厌恶刺激或不愉快情境即将出现的信号呈现时,有机体自发地做出某种反应, 从而避免了厌恶刺激或不愉快情境的出现,则该反应在以后的类似情境中发生的概率也会增加。回避条件 作用是在逃避条件作用的基础上建立的。
举例:小明去自习室自习,当他走到自习室门口的时候,听到同学们在里面大声喧哗,嬉戏打闹,所 以他就掉头回寝室进行学习。



①惩罚;当有机体做出某种反应后,呈现一个厌恶刺激或不愉快刺激,以消除或抑制此类反应的过程, 叫作惩罚。惩罚又分为正惩罚和负惩罚。◎—— (名21宁波)
正惩罚是指当儿童出现不适宜的行为时,家长可以施加一个厌恶刺激,从而减少儿童不适宜行为的出 现。如学生打架,教师罚他写检查,该生为了以后不再写检查再也不打架了。
负惩罚是指当儿童出现一个不适宜行为时,去掉一个愉快刺激,即不给予原有的奖励,以减少儿童不 适宜行为的出现概率。如学生打架,教师取消该生的优秀学生称号,该生也不再打架了。
②消退;消除强化从而消除或降低某一个行为的过程。如教师不理会那些不举手就回答问题的学生, 从而消除学生这一行为。
③维持:减弱甚至停止强化之后行为的持续。操作性条件作用一旦形成,为了永久保持所获得的行为, 应当逐渐减少强化的频次,或者使强化变得不可预测。
惩罚并不能使行为发生永久性改变,只能暂时抑制行为的发生,只是让学生明白什么不能做,而不明 白怎么做才对。消退在减少不良行为上比惩罚有效,在教育过程中,教师应多用正强化的手段来塑造学生 的良性行为,用不予强化的方法来消除消极行为,慎重使用惩罚。

4.教育应用;程序教学与行为矫正

操作性条件作用理论在实际教学中应用广泛,主要应用于程序教学与行为矫正。


可含义: 以课本或教学机器的形式向学生呈现程序化的教材,使学生按规定的程序自学教材内容。
②原则
a.小步子原则: 把学习的整体内容分解成由许多片段知识所构成的教材,把这些片段知识按难度逐渐 增加排成序列,使学生循序渐进地学习。
b,积极反应原则: 要使学生对所学内容做出积极的反应。
c.及时强化(反馈)原则: 对学生的反应要及时强化,使其获得反馈信息。
d.自定步调原则: 学生根据自己的学习情况,自己确定学习进度。
③操作方法:把一门课程的教学总目标分为许多小步骤,学习者每完成一步骤后,都会及时得到强化, 然后进入下一步骤的学习。学习过程中,学生可以自定步调,自主进行反应,逐步达到总目标。

含义:行为矫正是属于对人类行为进行分析和矫正的心理学领域。分析,指识别环境与某一特定行为 之间的相互作用的关系,从而识别该行为发生的原因,或者确定为什么个体会表现出这样的行为。矫正是 指开展和实施某些程序和方法来帮助人们改变他们的行为。

举例:对儿童发脾气、厌学、说谎、言行不一等不良行为进行矫正治疗;对成人酗酒等行为进行矫正治疗。

①含义。斯金纳设计了连续渐进法,用以研究包括一连串反应的学习。用此种类似分解动作的方式渐进, 最后将多个反应连贯在一起形成复杂行为的方法,称为塑造。斯金纳认为教育就是塑造行为。塑造是对与 期望行为越来越接近的行为的强化过程。它旨在通过小步子反馈帮助学生达到目标。具体而言,就是要采 用连续接近的方法,对趋向于所要塑造的反应的方向不断地给予强化,直到引出所需要的新行为。

②步骤。第一步: 选择目标,目标越具体越好。(终点行为)第二步: 了解学生目前能做什么,已经 知道什么。(起点行为)第三步: 列出一系列阶梯式的步子,让学生从他们目前的状态迈向目标。步子的 大小因学生的能力而异。(步调划分)第四步: 对学生的每一次进步都予以反馈,材料越新,学生要求的 反馈就越多。(即时反馈)

5.评价

(1)责献

①拓展了联结派的眼界,加深了人们对行为习得机制的理解,使人们能成功地预测、控制和塑造、矫 正行为。在这种理论的指导下,人们也开发出了一些自我调节或自我控制的技术,如认知行为矫正、认知 行为治疗或自我控制等。

②程序教学理论是今天的CAI 教学(计算机辅助教学)的理论基础。CAI具有这样几个优越性;a.交 互性,即人机对话,学生可以根据自己的学习情况选择学习路径、学习内容等;b.即时反馈;c.以生动形 象的手段呈现信息;d.自定步调等。这是以程序性教学理论为基础建立的。

(2)局限

①忽略了人与动物的区别。把人的学习等同于动物的学习,试图用操作性条件作用去解释一切机体行 为,并将其简单归结为操作性条件反射,过于偏狭。

②把人的学习等同干学习机器。斯金纳只注重学习的外部条件,不注重人的学习的内部机制和过程,培养出的学生知识技能扎实,但是创造性差,综合分析能力弱。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

在线客服
在线客服
旺旺客服