万维百科粤语版

行為強化

跳去導覽 跳去搵嘢
將隻大家鼠韞喺個斯金納箱裏面嘅圖解;一般嚟講,嘢食係一種強化。

行為強化粵拼hang4 wai4 koeng4 faa3英文behavioral reinforcement),通常就噉叫強化,喺心理學動物行為學上係操作制約(operant conditioning)必然涉及嘅一個概念。基本上,強化係指一啲會「強化」(reinforce)帶嚟自己嘅行為嘅結果,當中「強化」一樣行為指嘅嘢包括:

  • 令一樣行為發生得更加頻密(例:撳掣撳得密啲);
  • 令一樣行為發生嘅時間更加長(例:撳掣嗰陣對手撳住個掣耐啲);
  • 令一樣行為嘅強度提升(例:撳掣撳得大力啲);
  • 令一樣行為嘅等待期短啲(例:撳掣撳得快手啲)... 等等。

舉個例說明,想像韞隻大家鼠入個斯金納箱裏面[1],佢每次撳碌反應槓桿(response lever)嗰時都會有嘢食喺個分配器(dispenser)嗰度跌出嚟;實證嘅研究表明咗,嘢食會令到隻大家鼠更有興致去撳碌反應槓桿,令佢撳得密啲、或者撳得大力啲呀噉-响成個過程當中,「有嘢食」呢個結果係個強化,強化咗「撳反應槓桿」呢樣行為。即係話簡化噉講,強化可以想像成「會提升一隻動物做某樣行為嘅動力」嘅奬勵[2][3]

對強化嘅心理學同神經科學研究有廣泛嘅應用價值:呢啲研究會諗「強化嘅過程由邊啲腦區控制」等嘅問題,而呢啲研究會俾人應用喺精神醫學(例:要點樣用控制衝動呢啲源於強化相關功能失靈嘅心理病?)[4]人工智能(例:點樣教人工智能程式好似真嘅動物噉透過強化嚟學習?)[5]同埋遊戲設計(例:點樣將隻遊戲設計成最能夠強化「繼續玩落去」呢樣行為?)[6]等嘅多個領域嗰度。

基礎

內文:操作制約斯金納箱

操作制約(operant conditioning)係心理學動物行為學上嘅一個概念,泛指一隻動物因為對某個刺激()起某個反應()持續噉引致某啲後果,而將 聯想埋一齊(刺激同反應之間嘅關係起變化;Stimulus-Response),通常會導致 之間嘅關係變強或者變弱,會令 變強嘅後果係所謂嘅強化,而會令 變弱嘅後果就係所謂嘅懲罰(punishment)[7]

舉個簡單例子說明,想像家吓研究者擺一隻大家鼠喺一個斯金納箱入面,個箱入面有條槓桿(),每當隻大家鼠撳條槓桿()嗰時,個箱就會自動噉有嘢食跌落嚟俾隻大家鼠食;實證嘅研究表明咗,噉做會令到隻大家鼠學識「撳槓桿」()同「有嘢食」(結果)之間有啦掕,跟住會係噉勁撳條槓桿-「有嘢食」係一個行為強化,會「強化」隻動物知道會帶嚟嘢食嘅行為,提升隻動物做嗰樣行為嘅機會率同做嗰樣行為嗰時嘅強度(例:撳起槓桿上嚟撳得幾大力)。行為強化呢種現象喺身上都可以輕易觀察得到[7]

一隻蜜蜂試過「推開個塞」會「有蔗醣」之後,學識次次見到個塞都走去推-展示咗操作制約。

進化起源

動物唔使學都會識得「想要嘢食」。
內文:原級強化物次級強化物

行為強化可以用進化心理學嘅角度嚟諗,分做原級強化物(primary reinforcer)同次級強化物(secondary reinforcer)兩大種:

  • 原級強化物係指一隻動物唔使都識要對佢哋有反應嘅強化,例如係嘢食呀噉-一般認為,喺一個動物物種進化史上,嘢食同水係生存必需嘅嘢,唔使學都曉行埋去嘢食同水嗰度嘅動物個體生存能力會強啲,所以現存嘅動物物種冚唪唥都進化到會本能上對呢啲原級強化物有反應。不過要留意嘅係,一種原級強化物嘅強化效果()依然可以受各種因素影響-同一個物種嘅唔同個體之間可以喺「對原級強化物嘅反應」上有個體差異(簡單例子:有啲人大食啲有啲人冇咁大食,即係嘢食對唔同人嚟講 都唔同),而且 仲可以受內部因素影響,例如一隻動物肚餓嗰陣會零舍想去搵嘢食,令嘢食對佢嘅強化能力()喺短時間內提升[8][9]
  • 次級強化物係指一隻動物要學先識對佢哋有反應嘅強化;想像古典制約(classical conditioning)嘅現象-古典制約係指當一隻動物多次噉發覺兩個刺激 硬係一齊出現,變到將兩個刺激聯想埋一齊,對 出現本來淨係對 有嘅反應,例如想像一隻,嘢食()對佢嚟講係原級強化物,不過佢個主人次次喺俾狗餅佢食之前都會講句「乖仔」(),令到隻狗將句嘢同狗餅聯想埋一齊,令到「俾人讚係『乖仔』」對佢嚟講變成一個強化(對 出現本來淨係對 有嘅反應)-句嘢成為咗個次級強化物[10]

正同負強化

強化程序

內文:強化程序

強化程序(schedules of reinforcement)係指做出一個強化「出現嘅時間」以及「出唔出現」同相應嘅行為之間係咪成可靠嘅關係。

個體差異

睇埋:強化敏感度理論同埋外向度

數學模型

精神醫學研究

睇埋:精神醫學

上癮

內文:上癮

應用行為分析

內文:應用行為分析

人工智能研究

內文:強化學習

睇埋

參考文獻

  1. Pineño, O. (2014). ArduiPod Box: A low-cost and open-source Skinner box using an iPod Touch and an Arduino microcontroller (PDF). Behavior research methods, 46(1), 196-205.
  2. Glickman, S. E., & Schiff, B. B. (1967). A biological theory of reinforcement. Psychological review, 74(2), 81.
  3. Wiegand, D. M., & Geller, E. S. (2005). Connecting positive psychology and organizational behavior management: Achievement motivation and the power of positive reinforcement. Journal of Organizational Behavior Management, 24(1-2), 3-25.
  4. Robbins, T. W., Gillan, C. M., Smith, D. G., de Wit, S., & Ersche, K. D. (2012). Neurocognitive endophenotypes of impulsivity and compulsivity: towards dimensional psychiatry. Trends in cognitive sciences, 16(1), 81-91.
  5. Wiering, M., & Van Otterlo, M. (2012). Reinforcement learning. Adaptation, learning, and optimization, 12(3).
  6. Joseph Kim: The Compulsion Loop Explained 互聯網檔案館歸檔,歸檔日期2020年1月16號,., Gamasutra.
  7. 7.0 7.1 Schacter, Daniel L., Daniel T. Gilbert, and Daniel M. Wegner. "B. F. Skinner: The role of reinforcement and Punishment", subsection in: Psychology; Second Edition. New York: Worth, Incorporated, 2011, 278–288.
  8. Fleischman, D. S. (2016). An evolutionary behaviorist perspective on orgasm. Socioaffective neuroscience & psychology, 6(1), 32130.
  9. Buss, D. M. (2020). Evolutionary psychology is a scientific revolution (PDF). Evolutionary Behavioral Sciences.
  10. Bersh, P. J. (1951). The influence of two variables upon the establishment of a secondary reinforcer for operant responses. Journal of Experimental Psychology, 41(1), 62.


本页面最后更新于2021-04-30 13:34,点击更新本页查看原网页

本站的所有资料包括但不限于文字、图片等全部转载于维基百科(wikipedia.org),遵循 维基百科:CC BY-SA 3.0协议

万维百科为维基百科爱好者建立的公益网站,旨在为中国大陆网民提供优质内容,因此对部分内容进行改编以符合中国大陆政策,如果您不接受,可以直接访问维基百科官方网站


顶部

如果本页面有数学、化学、物理等公式未正确显示,请使用火狐或者Safari浏览器