Condizionamento Classico e Operante


Cos'è il Condizionamento Classico?

All'interno della teoria dell'apprendimento costituiscono riferimenti centrali i paradigmi del condizionamento classico (o rispondente) e del condizionamento operante (o strumentale). Prima di descrivere la differenza e le caratteristiche del condizionamento operante,  del riforzo positivo e del rinforzo negativo , occorre dare alcune indicazioni sul procedimento che caratterizza il condizionamento classico che è relativamente semplice sia a livello concettuale, sia a livello operativo.

Nella situazione sperimentale classica la somministrazione di uno stimolo neutro provoca una semplice risposta di orientamento (RO); successivamente allo stimolo neutro viene associato lo stimolo incondizionato (SI) che dà luogo ad una risposta incondizionata (RI); dopo aver ripetuto l'associazione un certo numero di volte, previsto dal piano sperimentale, la sola presenza dello stimolo neutro, che diventa stimolo condizionato (SC) è in grado di produrre la risposta originaria che viene definita risposta condizionata (RC).

SCHEMA CONDIZIONAMENTO CLASSICO

condizionamento classico
L'aspetto centrale del paradigma del condizionamento classico di Pavlov consiste nel fatto che uno stimolo neutro che prima non era in grado di produrre una risposta (nel nostro caso la salivazione del cane), dopo ripetute associazioni con lo stimolo incondizionato finisce per evocare tale risposta secondo lo schema (SC) -> (RC).

Nel caso del condizionamento classico non vengono prese in considerazione le conseguenze del comportamento. Le conseguenze del comportamento possono produrre effetti di retroazione (feed-back), che possono aumentare la probabilità che il comportamento che le aveva prodotte possa ripetersi nuovamente. E. L. Thorndike studiò i cambiamenti prodotti dalle conseguenze del comportamento in quello che definì “apprendimento per prove ed errori”. Attraverso esperimenti effettuati utilizzando un gatto posto in una gabbia, osservò che la frequenza dei comportamenti che producevano un determinato risultato aumentava. In particolare il comportamento che portava il gatto a premere una maniglia che apriva una piccola porta che permetteva di uscire dalla gabbia rimaneva "impresso" nell'animale e quindi aveva una probalità maggiore di essere ripetuto nella stessa situazione. Le osservazioni di Thorndike lo portarono a formulare la "legge dell'effetto", secondo la quale "delle diverse risposte date nella stessa situazione, quelle che sono accompagnate, o immediatamente seguite, da soddisfazione per l'animale saranno più fortemente correlate con la situazione stessa in modo che, quando questa si ripresenterà, tali risposte avranno maggiori probabilità di ripresentarsi".

Cos'è il Condizionamento Operante?

Partendo da questi presupposti teorici e dalla loro limitatezza nello spiegare il comportamento nei suoi molteplici aspetti, attraverso un continuo perfezionamento metodologico dello studio delle conseguenze del comportamento, B. F. Skinner ha formulato un approccio teorico che riveste una notevole importanza per la teoria dell’apprendimento “il condizionamento operante”. Proprio la definizione contiene la caratteristica principale, quella di “operare nell’ambiente”. Nrl condizionamento operante a differenza del condizionamento classico in cui si fa riferimento ad un organismo passivo l’organismo è considrato attivo e agisce su, e nell’ambiente.

Cos'è il Rinforzo?

Il rinforzo è così definito: Un comportamento che è seguito da una conseguenza che aumenta le probabilità di nuova emissione di quel comportamento anche in situazioni simili a quella originaria allora quella conseguenza è un rinforzo.

Dal punto di vista formale ed operativo un rinforzo per essere efficace deve seguire immediatamente il comportamento. Il rinforzo (reinforcement, alcune volte viene anche usato come sinonimo rafforzatore-reinforcer) è qualsiasi evento che nelle stesse situazioni o in situazioni analoghe aumenta la probabilità di comparsa della risposta che lo ha provocato. Pertanto prima di affermare che un determinato evento ha proprietà rinforzanti per un dato organismo, è necessario esporre l'organismo a questo evento in modo sistematico ed osservare il comportamento successivo.

Come afferma Skinner: "il solo modo per dire se un determinato evento sia o meno un rafforzante per un determinato organismo, in determinate condizioni, è quello di fare un esperimento diretto: osserviamo la frequenza di una certa risposta e poi facciamo dipendere da essa un evento. Osserviamo ogni cambiamento di frequenza. Se c'è un cambiamento, classifichiamo l'evento come rafforzante per l'organismo nelle condizioni esistenti"

Schema rinforzo

Rinforzo Positivo e Rinforzo Negativo

A seconda degli effetti prodotti sul comportamento dall’evento rinforzante, sono stati individuati due tipi fondamentali di rinforzo: Rinforzo Positivo e Rinforzo Negativo.

Con rinforzo positivo si intende qualsiasi evento la cui presentazione aumenta la frequenza della risposta dalla quale esso dipende; Con rinforzo negativo si intende invece qualsiasi evento la cui cessazione consolida la risposta dalla quale questa cessazione dipende. Gli esempi relativi a questi due tipi di rinforzo sono molteplici. Un rinforzo positivo può essere il cibo, l'acqua, l'attività sessuale, la lode, l'approvazione sociale, ecc. Il rinforzo negativo consiste nella cessazione di una situazione aversiva che crea disagio. La situazione sperimentale che meglio di altre descrive il concetto di rinforzo negativo è la seguente: si colloca un organismo all'interno di una gabbia, sul cui pavimento viene applicata una griglia dove si fa passare una corrente elettrica; il passaggio della corrente elettrica può essere interrotto solo azionando una leva che si trova all'interno della gabbia.

L'organismo sottoposto ad una continua scossa elettrica emette inizialmente una serie di risposte casuali, fin quando sempre in modo casuale abbasserà la leva provocando conseguentemente la cessazione del dolore prodotto dalla scossa elettrica. La risposta che pone termine alla stimolazione elettrica tenderà nella stessa situazione o in situazioni analoghe ad essere emessa con maggior frequenza. La cessazione della stimolazione aversiva costituisce il rinforzo negativo e la tipologia di apprendimento che consegue da tale situazione viene denominata apprendimento di fuga.

Oltre ai cosiddetti rinforzi primari, che servono a condizionare direttamente la risposta da cui essi dipendono ne esistono altri denominati rinforzi secondari o condizionati che sono rafforzanti perché precedono, o sono concomitanti con la comparsa di un rinforzo primario. Nelle situazioni sperimentali in cui viene impiegata la gabbia di Skinner, uno dei rinforzi secondari più comuni è il suono provocato dalla pressione esercitata dal ratto sulla leva che aziona il distributore di cibo. Il suono dovuto all’azionamento della leva precede la comparsa dell'evento agendo da rinforzo anch’esso. Quando un rinforzo secondario è in relazione con diversi rinforzi primari, viene denominato rinforzo secondario generalizzato. Un esempio Tipico di rinforzo secondario generalizzato è il denaro.

Programmi di Rinforzo

I programmi di rinforzo sono generalmente suddivisi in due tipologie: Programmi Continui di Rinforzo e Programmi Intermittenti di Rinforzo.

Con il primo termine si fa riferimento a quel rinforzamento in cui la risposta è rinforzata in modo costante ogni volta che viene emessa; con il secondo termine si fa riferimento ad un tipo di rinforzamento in cui la risposta viene rinforzata in modo discontinuo, ad intermittenza appunto (rinforzo intermittente). Questa seconda tipologia di rinforzo può essere ulteriormente suddivisa in quattro diverse modalità:

a. programma a rapporto fisso nel quale il rinforzo viene erogato solo dopo che l'organismo ha emesso un certo numero di risposte;

b. programma a rapporto variabile in cui l'organismo prima di ricevere il rinforzo, deve emettere un certo numero di risposte che varia in modo casuale da un rinforzo all'altro;

c. programma ad intervallo fisso nel quale viene rinforzata la prima risposta che viene emessa dopo un certo intervallo di tempo, che inizia a decorrere dal momento successivo all'erogazione del rinforzo;

d. programma ad intervallo variabile in cui il rinforzo viene erogato dopo intervalli di tempo che variano in modo casuale anche se in genere si mantengono attorno ad un valore medio.

Generalizzazione

Se un soggetto emette un comportamento in una situazione, è molto probabile che lo stesso comportamento venga emesso in situazioni simili. Il fenomeno per cui la risposta emessa nei confronti di uno specifico stimolo viene emessa anche nei confronti di stimoli simili viene definito "generalizzazione". La diminuzione della frequenza di risposta al crescere della diversità tra stimolo originario e stimolo simile viene definito "Gradiente di generalizzazione"

.

Discriminazione (controllo del comportamento da parte dello stimolo)

Quando un comportamento viene emesso solo in presenza di un determinato stimolo e non di altri, questo viene denominato "stimolo controllo". per produrre un comportamento discriminativo viene seguito un programma di rinforzo differenziale. Sono rinforzate solo le risposte relative a un determinato comportamento e questo processo viene definito apprendimento discriminativo, mentre lo stimolo che produce la specifica risposta prende il nome di stimolo discriminativo.

Contingenze di Rinforzo

Le contingenze di rinforzo sono composte da una sequenza di eventi strettamente connessi tra loro come qui descritto: SD -> R -> Rinforzo

Il primo elemento è costituito dallo stimolo discriminativo o di controllo. In questo caso il rinforzo oltre che aumentare la frequenza di emissione della risposta la rende controllata da una specifica situazione-stimolo o da una situazione analoga. Il rinforzo segue la risposta solo quando questa è preceduta dallo specifico stimolo discriminativo

Modellaggio (Shaping)

Nelle sue caratteristiche essenziali il modellaggio consiste nel definire prima dell'inizio delle procedure sperimentali un comportamento-meta al quale far pervenire il soggetto sperimentale. Sulla base dell'obbiettivo predefinito si imposta un piano di azione che prevede il rinforzo successivo e progressivo di tutte quelle unità comportamentali che permettono di avvicinarsi in modo graduale al comportamento-meta.

Estinzione

Se un comportamento precedentemente rinforzato non è più seguito da un rinforzo allora le probabilità che detto comportamento venga nuovamente emesso diminuiscono. Il fattore che risulta determinante nell'estinzione della risposta non è tanto il tempo che trascorre quanto la mancata erogazione del rinforzo ad una risposta che precedentemente era stata rinforzata. Quando il rinforzo non fa più seguito ad una risposta, questa diventa sempre meno frequente e il processo che ne deriva viene definito "estinzione operante". Così Skinner descrive praticamente il processo di estinzione: generalmente quando ci impegnamo in un comportamento che non rende più, diveniamo meno propensi a comportarci nuovamente in quel determinato modo: se abbiamo perso una penna stilografica, porteremo sempre meno frequentemente la mano e la tasca che prima la conteneva; se non riceviamo risposta alle chiamate telefoniche, alla fine smentiamo di telefonare; se il nostro pianoforte si scorda, gradatamente lo suoneremo sempre meno; se la radio diventa rumorosa o se i programmi trasmessi peggiorano in qualità, smettiamo di ascoltarla».

Dato che l'estinzione operante avviene molto più lentamente del condizionamento operante il processo risulta più facilmente osservabile. Il comportamento durante il processo di estinzione è il risultato del condizionamento precedente. Se sono state rinforzate solo alcune risposte l'estinzione avviene velocemente. anche se ad esempio nel programma di rinforzamento intermittente che viene eseguito in maniera metodica l'estinzione ha una forte resistenza.

Punizione

Se un comportamento è seguito da una conseguenza che riduce la probabilità di nuova emissione di quel comportamento anche in situazioni simili a quella originaria allora quella conseguenza è una punizione. La punizione consiste nell'eliminazione di un rinforzo positivo o nella somministrazione di uno stimolo aversivo che fa seguito ad una determinata risposta. La punizione, generalmente si limita ad inibire temporaneamente la frequenza di emissione della risposta senza però eliminarla del tutto. Inoltre la punizione produce diversi effetti controproducenti che la rendono del tutto disfunzionale nei processi di apprendimento. Per descrivere gli effetti impropri della punizione si può fare riferimento al contesto scolastico e alla relazione insegnante-allievi. Quando un insegnante si trova di fronte ad un comportamento di un allievo giudicato negativamente spesso decide di utilizzare punizioni in forma di stimoli aversivi, come ad esempio rimproveri verbali, ammonizioni, sospensioni, ecc. Tale processo è esemplificato nello schema seguente:

Schema punizione

Glossario Terminologico:

nel condizionamento classico si dice che la risposta è elicitata o evocata;

nel condizionamento operante si dice che la risposta viene emessa;

per il condizionamento operante sono validi alcuni principi del condizionamento classico come l’estinzione, il recupero spontaneo, la generalizzazione e la discriminazione;

i rinforzi possono essere erogati o sottratti;

i rinforzi possono essere positivi o negativi;

i rinforzi possono essere primari o secondari

i programmi di rinforzo possono essere continui o intermittenti

i rinforzi possono riguardare la sfera comportamentale, cognitiva ed emozionale-fisiologica.

Bibliografia 

Burrhus F. Skinner - Correll Werner, Pensare ed apprendere, Armando, Roma, 1992

Burrhus F. Skinner - Scienza e comportamento [1953], Franco Angeli, Milano, 1992

Burrhus F. Skinner - La tecnologia dell'insegnamento, "La Scuola" ed. Brescia, 1972

Lieberman A.D. (1993). Learning – Behaviour and Cognition. Pacific Grove, Ca.: Brooks/Cole Publishing.

Skinner B.F (1938). The Behaviour of Organisms. New York: McMillan

Sutton R.S., Barto A.G. (1998). Reinforcement Learning: An Introduction. Cambridge, Mass.: MIT Press.

Thorndike E.L. (1911). Animal Intelligence. New York: McMillan.