Art2_76742_Aprendizaje_Discriminativo

* Dirigir correspondencia al primer autor: Universidad Autónoma de Tlaxcala, Carretera Tlaxcala-Puebla km. 1.5, Tlaxcala, Tlax., México, C.P. 90000, e-mail: jacamachoc_fcdh@uatx.mx.. El primer autor agradece al CONACyT por el apoyo con la Beca 180783.El segundo autor fue apoyado con el financiamiento del CONACyT, Proyecto CB-180443.

Efecto del aprendizaje discriminativo previo sobre la conducta de búsqueda de alimento en el laberinto radial: los brazos del laberinto como posibilitadores de acción y el ED como inductor aprendido

(Effect of the previous discriminative learning on foraging

behavior in the radial-arm maze: The maze’s arms as affordances

and SD as learned inducer)

Josué Antonio Camacho-Candia1 y Felipe Cabrera 2

1Universidad Autónoma de Tlaxcala

2 Centro de Investigación en Conducta y Cognición Comparada

Universidad de Guadalajara-Cuciénega

Recibido: 2 de febrero de 2020; aceptado: 25 de agosto de 2020

Resumen

Se evaluó el efecto del aprendizaje discriminativo previo sobre la conducta de búsqueda de alimento en el laberinto radial no elevado con tres configuraciones. Se trabajó con 24 ratas macho divididas en tres grupos. En la primera fase (preprueba) las ratas debieron obtener el alimento que se encontraba en los contenedores del laberinto radial al final de cada brazo del laberinto. En la segunda fase (entrenamiento) los tres grupos fueron expuestos a una tarea de discriminación visual simple en una caja de condicionamiento operante. En la tercera fase (posprueba) los sujetos nuevamente fueron expuestos al laberinto radial correspondiente, en donde algunos contenedores, ahora en extinción, fueron señalados por el estímulo discriminativo (ED) entrenado en la fase anterior. Los resultados mostraron que durante la posprueba la probabilidad de elegir inicialmente un contenedor con ED fue menor en los casos que no correspondía con la presencia de brazos que conducían a él y aumentó la conducta exploratoria en la plataforma de inicio. Se discute el papel de los posibilitadores de acción (Affordances) en el desempeño de los sujetos y la importancia de la configuración del laberinto y del inductor entrenado para la búsqueda de alimento desde una perspectiva de los sistemas conductuales.

Palabras clave: Aprendizaje Discriminativo, Posibilitadores de Acción, Inductor Aprendido.

Abstract

This experiment assessed the effect of the previous discriminative learning on foraging behavior in the radial-arm floor maze with three different configurations. Twenty four male rats were used as subjects. Pre-test in the radial-arm maze was the first phase of the experiment; rats had to obtain the food contained in the feeder at the end of each arm of the maze. The training was the second phase. All groups were trained to respond to a simple visual discrimination task in an operant conditioning chamber. The third phase was a post-test in the radial-arm maze. Here some of the feeders, now in extinction, were indicated by the SD trained in the previous phase. The outcome of our study suggests that the probability of initially choosing a feeder indicated with SD was lower when the feeder and the arms of a maze didn’t match, and exploratory behavior increasing in the start area. The results are discussed in terms of a molar and ecological perspective in analysis of behavior, and the implication of affordances in the performance of subjects in foraging behavior, particularly under a behavioral system view

Keywords: Discriminative Learning, Affordances, Learned Inducer.

Introducción

El control del estímulo se ha identificado como el cambio que ocurre en el comportamiento como consecuencia del cambio en alguna característica del ambiente denominado estímulo; cuando éste logra ese efecto a partir de su asociación con la consecuencia reforzante se le llama estímulo discriminativo (ED, Terrace, 1966).

Algunos autores han propuesto una perspectiva molar para describir el control del estímulo (Fetterman, 1996; Baum, 1995, 2002, 2012), en donde éste no se define como un evento discreto sino extendido en tiempo, y por ende, para su análisis se hace necesario considerar la actividad completa del organismo. Desde esta perspectiva, el ED no tiene una relación temporal unívoca con una conducta particular, sino que induce un cambio en la distribución del comportamiento en general. Por otro lado, este cambio ocurre no solo por las contingencias ambientales presentes, como el programa de reforzamiento impuesto (Harzem, Lowe & Spencer, 1978), también se afecta por la historia de reforzamiento, y los patrones de comportamiento desarrollados ontogenética y filogenéticamente (Lowe & Harzem, 1977; Timberlake, 1993; Timberlake & Hoffman, 2002), mismos que son especialmente relevantes cuando los sujetos responden a eventos filogenéticamente importantes (Baum, 2005, 2012).

Para considerar todas las conductas posibles de emitirse en un espacio experimental, es necesario identificar las relaciones existentes entre el organismo y los diversos elementos presentes en el ambiente. El aparato experimental en sí mismo propicia la emisión de ciertas conductas, a la vez que restringe otras, según la especie y otras características del organismo (Timberlake & Hoffman, 2002), fenómeno que se relaciona íntimamente con los posibilitadores de acción (en inglés affordances, ver Gibson, 1979) y que Timberlake denominó ‘sintonización’ (en inglés tuning, ver Timberlake, 2001, 2004) del espacio experimental (ver Cabrera, Jiménez y Covarrubias, 2015, 2019). Desde esta perspectiva, el reforzador como un elemento ambiental con cierta estructura y características relevantes para un organismo privado de alimento, también es un posibilitador de acción (Killeen & Jacobs, 2017) que puede ser obtenido por medio de distintas conductas, dependiendo de la estructura del espacio experimental, de la forma en la que ésta se relaciona con las conductas posibles de emitir por un organismo, por el estado motivacional del organismo y de la forma en que éstos elementos se relacionen (Baum & Davison, 2014a, 2014b; Cabrera y Ortega, 2017; Hoffman, Timberlake, Leffel, & Gont, 1999; Killeen & Pellón, 2013; Lotfizadeh, Edwards, Redner & Poling, 2012; Timberlake, Leffel & Hoffman, 1999; Timberlake & Lucas, 1991; Timberlake & Wozny, 1979).

Killeen & Jacobs (2017), proponen que surgen conductas instrumentales alternativas cuando, a partir de un estado del organismo, se incluyen contingencias adicionales en un arreglo experimental donde se había establecido previamente una relación entre la emisión de una conducta, el ED y la consecuencia obtenida. Considerando que el organismo parte de predisposiciones sensoriales y motoras para responder a determinados estímulos que se asocian con sistemas de conductas de sobrevivencia o de reproducción (Timberlake, 1993, 1994), Baum (2005, 2012) propone que el control del estímulo es susceptible de establecerse como resultado tanto de la historia filogenética como ontogenética, donde los estímulos filogenéticamente importantes se combinan con inductores aprendidos.

Aunque se asume que el control del estímulo como un inductor aprendido se incorpora en el organismo como parte de un comportamiento funcional en ciertas situaciones, son escasos los estudios que evalúan los efectos de entrenar en un contexto y evaluar los efectos en otra situación notoriamente diferente. Evaluar lo aprendido en un contexto en otro ha sido materia de estudio en inhibición latente, aprendizaje perceptual, transferencia, entre otros (De la Casa & Timberlake, 2006; Gibson, 1963; Lubow & Gewirtz, 1995; McLaren, Kaye & Mackintosh, 1989; McLaren & Mackintosh, 2000). No obstante, una modificación radicalmente diferente que implica un cambio de aparato experimental es menos común, pero es importante porque pretende identificar qué elementos del contexto, y no sólo señales o estímulos discretos, predicen y soportan ciertos comportamientos (Nadel & Willner, 1980; Tolman, 1932).

Algunos estudios ya clásicos han evaluado el efecto de pre-exponer o entrenar a los sujetos a ciertos estímulos o características del ambiente que posteriormente jugarían un papel importante en su desempeño en un contexto completamente diferente. En un estudio, Saltzman (1949) muestra cómo un grupo de ratas que entrenó a responder a un estímulo condicional (EC) en un aparato (i.e., corredor recto), evalúa en una fase subsiguiente, empleando un laberinto en forma similar a una Y, la elección entre una meta con la presencia del EC y otra sin él. Los sujetos eligieron significativamente la meta que mostraba al estímulo condicional. Otro estudio (Williams, 1929), un grupo de ratas fue entrenado en una caja de condicionamiento de lugar a discriminar entre blanco y negro; transcurridos un tiempo en el que los sujetos adquirieron la discriminación, se probó su desempeño en extinción en un laberinto de múltiples elecciones en T. Los sujetos mostraron preferencia elegir los lugares con el color previamente entrenado.

Estos estudios que tuvieron como meta evaluar el valor del reforzador condicional de un estímulo que previamente fue entrenado como estímulo discriminativo (ED), es relevante desde la perspectiva ecológica de Timberlake (1984, 1993, 1994, 2001), particularmente en el modelo de Sistemas Conductuales. Es decir, a los estímulos que Saltzman (1949) y Williams (1929) denominaron ‘reforzador condicional’ dada su correlación con el reforzador en una fase previa, tales estímulos, desde el modelo de sistemas conductuales de Timberlake, constituirían el elemento ambiental que señala la presencia inminente de alimento. A consecuencia del encuentro con dicho estímulo, cesaría en el organismo un modo de búsqueda general, propiciándose un modo de búsqueda focal de alimento (Timberlake, 1994).

A pesar que un estímulo o un segmento del ambiente puede señalar de manera inminente la presencia de alimento, el modelo de sistemas conductuales reconoce que diversos elementos del ambiente pueden controlar la elección del organismo, y no sólo el estímulo previamente entrenado; ello porque hay predisposiciones sensoriales y ciertos patrones de comportamiento dispuestos filogenéticamente en el organismo, que pueden ser expresados, modificados o alterados por la configuración particular del ambiente que posibilitan más una conducta o aprendizaje que otro, precisamente por la sintonización entre dicho ambiente y el organismo (véase Timberlake, 2004). Al respecto, Roche & Timberlake (1998), evaluaron el efecto de caminos o rutas artificiales y marcas verticales sobre la conducta de búsqueda de alimento en ratas, encontrando diferencias en la eficiencia del comportamiento relacionada con la forma del camino o la distancia recorrida al inicio del entrenamiento.

Desde esa perspectiva y tomando en cuenta los antecedentes mencionados, en el presente trabajo se cuestiona si un estímulo que fue establecido como inductor de una conducta en una situación de entrega de alimento en una cámara de condicionamiento operante estándar, mantiene su efecto inductor en una situación de búsqueda de alimento en el laberinto radial con tres configuraciones distintas, mismas que difieren en el número de brazos presentes y la relación de éstos con las fuentes de alimento y el estímulo entrenado.

Método

Sujetos

Se utilizaron 24 ratas macho de la cepa wistar, de 120 días al inicio del estudio. Las ratas fueron alojadas en el bioterio del Instituto de Neurociencias de la Universidad de Guadalajara, en cajas transparentes individuales (13 x 15 x 20 cm) mantenidas en un régimen de privación alimentaria, al 85% ± 5 gr. de su peso promedio ad libitum, y con libre acceso al agua. Se empleó el amaranto (Amaranthus cruentus) como reforzador (Cabrera, Robayo-Castro y Covarrubias, 2010) en las sesiones de entrenamiento en discriminación y en la preprueba en el laberinto radial. Todos los sujetos, experimentalmente ingenuos al inicio del experimento, estuvieron sometidos a un ciclo de 12 hrs. de luz/obscuridad y la manipulación y los procedimientos a emplearse estuvieron regidos por las Especificaciones Técnicas para la producción, cuidado y uso de los animales de laboratorio establecidos en la Norma Oficial Mexicana (NOM-062-Z00-1999).

Aparatos

Cámara de condicionamiento operante

Para el entrenamiento en discriminación se utilizaron dos cámaras de condicionamiento operante MED (ENV-007-VP). Cada cámara tenía dos comederos (orificios de 5 cm. de ancho, 3 cm. de profundidad y 5 cm. de altura) localizados a 2 cm. del piso, uno en cada pared lateral de la cámara, los cuales contaban con sensor que detectaba cuando la rata introducía su cabeza, para activar la entrega del alimento o bien el reinicio de los intervalos entre ensayos según correspondiera con las contingencias programadas. Sobre cada comedero, a dos centímetros de distancia se colocó un estímulo luminoso circular (28V, 100mA, de 2.5 cm. de diámetro) que emitió luz blanca. Los estímulos fueron controlados por una computadora PC marca comercial y las respuestas se registraron por medio de la interfaz MED-PC©.

Laberinto radial no elevado

Se utilizó un laberinto radial de seis brazos construidos de acrílico de 30 cm de altura x 10 cm de ancho, 60 cm de largo y 0.5 cm de grosor cada pared, colocado sobre el piso del laboratorio. Los brazos se encontraban unidos en el centro por una plataforma hexagonal dónde se colocaba una caja de inicio que impedía a los sujetos desplazarse por los brazos antes del comienzo del ensayo. El laberinto estuvo delimitado por un perímetro de 2 X 2 m. y 30 cm. de altura. La base del laberinto y el borde perimetral fueron elaborados de aserrín comprimido de 1.5 cm de grosor. Al final de cada brazo, a 5 cm. de distancia, se encontraba un panel que contenía un comedero y un foco similares a los utilizados en la cámara de condicionamiento. Se emplearon tres configuraciones de laberinto radial para cada grupo, mismas que se describen posteriormente.

Procedimiento

La Tabla 1 muestra el diseño utilizado, compuesto de tres fases que se explican posteriormente.

Fase I: Preprueba (entrega de alimento no señalada en laberinto radial)

Las ratas se asignaron a tres grupos, cada uno utilizó una configuración diferente del laberinto radial descrito previamente. Las ratas pertenecientes al grupo RADCOM fueron colocadas en el laberinto radial con seis brazos (Figura 1a). Las ratas del grupo RADBRA (Figura 1b) y RADNBRA (Figura 1c) fueron colocadas en un laberinto radial incompleto, con sólo tres brazos. Las ratas fueron colocadas en la plataforma central del laberinto radial, permaneciendo apagadas las luces de los ED. Cada contenedor ubicado al final de cada brazo, contuvo 0.5 gramos de amaranto. La prueba iniciaba cuando se retiraba la caja de inicio y terminaba cuando la rata hubo visitado los 6 contenedores o después de haber transcurrido 5 minutos de

Journal of Behavior, Health & Social Issues
Vol. 13, Num. 1 (2021) pp. 12-21
DOI: http://dx.doi.org/10.22201/fesi.20070780e.2021.13.1.76742

J. A. Camacho-Candia & F. Cabrera. / Journal of Behavior, Health & Social Issues, 13, 1 (2021) pp. 12-21

J. A. Camacho-Candia & F. Cabrera. / Journal of Behavior, Health & Social Issues, 13, 1 (2021) pp. 12-21

J. A. Camacho-Candia & F. Cabrera. / Journal of Behavior, Health & Social Issues, 13, 1 (2021) pp. 12-21

Tabla 1

Diseño experimental utilizado donde se identifican las fases del estudio y las características de cada laberinto por grupo

Grupos

Fase I: Preprueba

(entrega de alimento no señalada en laberinto radial).

Fase II: Entrenamiento (entrega contingente de alimento en cámara de condicionamiento)

Fase III: Posprueba (contenedores no operativos señalados con estímulo luminoso)

RADCOM

(Laberinto radial completo)

Búsqueda de alimento en el laberinto radial con contenedores no señalados con ningún estímulo.

Entrenamiento en discriminación

en cámara de condicionamiento operante.

Búsqueda de alimento en el laberinto radial con contenedores en extinción y señalados con el ED entrenado en la fase anterior.

RADBRA

(Laberinto radial con tres brazos, coincidiendo brazos con contenedores señalados)

RADNBRA

(Laberinto sólo con tres brazos sin coincidir brazos con contenedores señalados)

de inactividad, lo que ocurriera primero. Se realizaron 5 ensayos, uno por día para cada participante.

Fase II: Entrenamiento (entrega contingente de alimento en cámara de condicionamiento)

Para el entrenamiento en discriminación y el análisis de los videos se empleó el procedimiento utilizado por Camacho y Cabrera (2014). De forma general, dicho procedimiento consistió en que cada rata debía introducir su cabeza en el comedero que se encontraba indicado por el ED para recibir alimento; si ésta introducía la cabeza en el comedero que no estaba indicado por el ED, no recibía alimento. Para la activación de los ED se programaron intervalos entre ensayos aleatorios de 10, 15 y 20 seg., los cuales se reiniciaban tanto después de recibir alimento como con cada elección al comedero no indicado por el ED, los cuales también se activaban cada uno de forma aleatoria y se apagaban inmediatamente con cada respuesta correcta. Cada participante tuvo 11 sesiones de entrenamiento de 45 min cada una.

Fase III: Posprueba (contenedores no operativos señalados con estímulo luminoso)

Las ratas pertenecientes al grupo RADCOM fueron colocadas en el laberinto radial con seis brazos pero con ED encendidos sólo en tres de ellos (Figura 1a). Las ratas del grupo RADBRA fueron colocadas en un laberinto radial incompleto, con sólo tres brazos, los ED se colocaron al final de cada brazo (Figura 1b). Las ratas del grupo RADNBRA también fueron colocadas en un laberinto radial incompleto, con sólo tres brazos, pero los ED se colocaron en los

comederos sin brazos de laberinto (Figura 1c). Por tratarse de una prueba, en todos los casos los contenedores estuvieron vacíos (i.e. extinción). Se realizaron 5 ensayos por cada participante.

Al inicio de la posprueba, en cada configuración, la rata se colocó en la plataforma central del laberinto dentro de una caja de acrílico color negro que le impedía ver el exterior y le imposibilitaba iniciar el ensayo. La prueba iniciaba cuando se retiraba la caja central y terminaba cuando había visitado los 3 contenedores con ED o después de 5 minutos de inactividad. Al iniciar el recorrido, los sujetos del grupo RADCOM, una vez que salían por uno de los brazos tenían la opción de regresar por el brazo o recorrer por fuera del laberinto en busca de alimento en los contenedores. En los otros dos grupos los sujetos, desde el inicio, podían dirigirse a los comederos por uno de los brazos o bien iniciar la exploración saliendo por los espacios donde no había brazo. El perímetro que delimitaba a cada laberinto impedía que la rata se alejara del radial.

Los ED indicados en la Figura 1 se mantuvieron encendidos al inicio de cada ensayo y sólo se apagaron cuando la rata visitaba el contenedor que era señalado por éste. Al finalizar la sesión, se colocaba a la rata en una caja transportadora y se le regresaba a su caja-habitación. Cada rata fue expuesta a cinco ensayos sin alimento. El laberinto y el perímetro que lo delimitaba se limpiaron con alcohol etílico desnaturalizado (con benzoato de denatonio 0.7 mg/100 ml), diluido al 50% con agua después de cada ensayo.

J. A. Camacho-Candia & F. Cabrera. / Journal of Behavior, Health & Social Issues, 13, 1 (2021) pp. 12-21

Figura 1

a) Laberinto radial completo grupo RADCOM, b) laberinto radial incompleto, grupo RADBRA, c) laberinto radial incompleto, grupo RADNBRA. Los cuadros al final de cada brazo indican la presencia de los contenedores con alimento en la preprueba y en extinción en la posprueba. Los puntos negros señalan la presencia de los ED activados sólo en la posprueba. Los brazos punteados indican su ausencia. Cada laberinto delimitado por un perímetro.

Análisis de datos

Todas las sesiones fueron videograbadas para su análisis posterior utilizando el programa CowLog (Hänninen & Pastell, 2009) para el análisis de la preprueba y posprueba. En la Fase II, se obtuvo la latencia de respuesta como criterio para identificar el índice de discriminación. En la Fase I y III se identificaron las elecciones de contenedores que se hicieron y la vía o ruta para llegar a ellos, también se identificaron las conductas que ocurrían en la plataforma central del laberinto radial, una vez retirada la caja de inicio. Estas conductas fueron relevantes ya que si la presencia de los ED en la posprueba tenía algún efecto sobre la conducta, éste podría identificarse no sólo en la elección del contenedor que realizara sino también en las conductas emitidas al inicio del ensayo, es decir, antes de la primera elección.

Tabla 2

Conductas que se identificaron en la plataforma central del laberinto radial durante la preprueba y posprueba antes de la primera elección

CONDUCTAS

DEFINICIÓN

Inmóvil

Permanece en un sitio por lo menos 3 segundos, sin realizar ningún movimiento de orientación que afecte su posición en un radio de 1 cm.

Acicalarse

Contacto entre el hocico de la rata y alguna parte de su cuerpo de forma continua y repetida por más de 3 ocasiones.

Rascarse

Frotar su cuerpo con las patas de forma continua y repetida.

Explorar

Movimiento de su cabeza hacia por lo menos 2 direcciones, sin moverse de su lugar en un radio de 3 cm.

Saltar

Cambiar de brazo pasando por la pared del mismo.

Además de identificar las conductas en la plataforma central, se obtuvo la probabilidad con la que los sujetos eligieron un comedero en las tres primeras elecciones. Este cálculo permitió identificar con qué probabilidad los sujetos elegían contenedores señalados con el ED respecto a los que no estaban señalados. Se contrastó la probabilidad al azar con la probabilidad obtenida en cada elección. La probabilidad al azar, se obtuvo dividiendo el número de contenedores señalados con el ED entre el número total de contenedores del laberinto (seis para todos los grupos). De este modo, en la primera elección, la probabilidad de elegir al azar uno de los contenedores con brazo con ED era de 0.5, dado que había tres contenedores señalados y otros tres sin ED y sin brazo. Si su primera elección es un contenedor con ED, la segunda elección tendría una probabilidad al azar de 0.33 (es decir, 2 contenedores disponibles con ED sobre 6 contenedores totales), así sucesivamente hasta la tercera elección.

Una vez obtenida la probabilidad al azar (pazar), se contrastó con la proporción o probabilidad observada (pObs) de elegir un contenedor con ED mediante la siguiente fórmula (ver Tonneau, Cabrera & Corujo, 2012): p(ED)= (pObs – pazar) / (1- pazar).

Mediante esta fórmula, valores cercanos a 1 significa elección de contenedores con ED, y valores cercanos a -1 significa elección de contendores sin ED. Valores cercanos a 0 indica indiferencia o elección cercana al azar.

J. A. Camacho-Candia & F. Cabrera. / Journal of Behavior, Health & Social Issues, 13, 1 (2021) pp. 12-21

Resultados

Entrenamiento en discriminación

La Figura 2 muestra el índice de discriminación y las latencias de respuesta durante los entrenamientos por sujeto para cada una de las tres configuraciones del laberinto radial. En los tres grupos se observa un crecimiento típico de una curva de aprendizaje en el índice de discriminación en todos los sujetos, iniciando con valores de 0.5, indicando respuestas indiferenciadas a la presencia o ausencia del ED, llegando a valores cercanos a 1.0 desde la séptima sesión. En las figuras insertadas al índice de discriminación se muestra la latencia de respuesta, misma que inicia con valores de entre 10 a 16 segundos (notar escala logarítmica base 2), continuando con una disminución constante, llegando a valores cercanos a 1 segundo.

Preprueba y Posprueba

Con el propósito de identificar si las primeras elecciones que realizaron los sujetos en el laberinto radial durante la posprueba se dirigieron o no al comedero señalado con el ED, la Figura 3 muestra la probabilidad, en las tres primeras elecciones, con la que los sujetos eligieron comederos con ED, mismos a los que corresponden valores mayores a 0.0, o bien eligieron comederos sin ED, a los que corresponden a valores negativos. La indiferencia entre elegir unos y otros está representada por el valor 0.0. El panel superior corresponde a la configuración del laberinto completo, habiendo sólo tres comederos señalados con ED (RADCOM), la gráfica intermedia corresponde al laberinto incompleto que mantuvo los brazos coincidentes con el ED (RADBRA) y la gráfica inferior corresponde a la configuración de laberinto incompleto con los brazos no coincidentes con el ED (RADNBRA).

Figura 2

Índice de discriminación y latencias de respuesta durante los entrenamientos por sujeto para cada una de las tres configuraciones del laberinto radial. Cada símbolo representa a un sujeto, y la línea continua corresponde al promedio (Nótese la escala logarítmica base 2 de las latencias). En el índice de discriminación valores cercanos a cero significan que no se estableció la discriminación y valores cercanos a 1 que ésta se ha establecido. La disminución de la latencia de respuesta es indicador del aprendizaje discriminativo.En las figuras insertadas al índice de discriminación se muestra la latencia de respuesta, misma que inicia con valores de entre 10 a 16 segundos (notar escala logarítmica base 2), continuando con una disminución constante, llegando a valores cercanos a 1 segundo

En la configuración del laberinto RADCOM (panel superior) se muestra una alta variabilidad en la probabilidad de elegir un comedero con ED en las diferentes sesiones, siendo oscilante la primera elección (línea contínua) a elegir un brazo con ED (valores positivos) y brazos sin ED (valores negativos), por lo que no se observa un patrón definido que muestre una preferencia de elegir en función de la presencia o ausencia del ED; no obstante, en la segunda y tercera elección muestra un sesgo hacia valores positivos (elección a un ED), a excepción de la Sesión 5 de la segunda elección (línea punteada) y en la Sesión 3 de la tercera eleción (línea entrecortada). En el RADBRA los sujetos se dirigieron predominantemente hacia un contenedor con ED en su primera elección (línea contínua), con valores de p=1.00 (excepto la primera sesión con valor cercano a p=0.75), correspondiendo además con la presencia de brazos que conducían a un comedero con ED. Esta preferencia disminuyó en la segunda y tercera elección (líneas punteada y entrecortada, correspondientemente) que oscilaron en un rango de valores entre p=0.1 a p=0.9. Contrariamente, en la configuración del laberinto RADNBRA (panel inferior) los sujetos mostraron la menor probabilidad de dirigirse hacia el contenedor con un ED, con valores desde -0.70, hasta -1.0 en la quinta sesión; es decir, predominó dirigirse hacia los brazos que conducían a un contenedor sin ED (i.e., valores menores a 0.0). Sólo hasta la tercera elección (línea entrecortada) mostró mayor estabiliad cerca de la indiferencia (valores cercanos a 0) durante las 5 sesiones, manteniendo un ligero sesgo a valores negativos (rango de -0.05 a -0.4).

La Figura 4 muestra, para cada grupo, la proporción de las conductas que ocurrieron antes de la primera elección en la plataforma central del laberinto radial una vez que se hubo retirado la caja de inicio durante la pre prueba

J. A. Camacho-Candia & F. Cabrera. / Journal of Behavior, Health & Social Issues, 13, 1 (2021) pp. 12-21

Figura 3

Probabilidad de las primeras tres elecciones por grupo y sesión en la posprueba. Gráfica superior RADCOM, gráfica intermedia RADBRA y gráfica inferior RADNBRA. El valor 1 indica que se habría elegido el contenedor con el ED con una alta probabilidad, el valor -1 indica que se habría elegido el EΔ (ausencia del ED) con alta probabilidad

(panel izquierdo) y la posprueba (panel derecho). La conducta de ‘explorar’ sobresale entre las conductas emitidas en esta condición, tanto en la preprueba como en la posprueba. Se puede observar, sin embargo, que en el grupo RADCOM (barras negras) dicha conducta tuvo poca variación entre ambas pruebas, obteniéndose una frecuencia promedio de 1.3 en la preprueba, e incrementándose muy ligeramente a 1.75 durante la posprueba. . Por otro lado, el grupo RADBRA (barras en gris claro) mostró un aumento en la conducta de exploración durante la posprueba respecto a la preprueba; de un valor promedio de 1.5 en la preprueba incrementó a una frecuencia de 2.3. Este incremento en las conductas exploratorias fue aún mayor para el grupo RADNBRA (barras en gris obscuro), que de ocurrir con una frecuencia de sólo 1.2 en la preprueba, aumentó a 3.1, siendo este grupo el que mayor

frecuencia de conductas de exploración presentó en la posprueba. El resto de las conductas observadas, dada su baja frecuencia de ocurrencia, no mostraron cambios notorios entre pruebas ni entre grupos.

Discusión

En el presente trabajo se cuestionó si un estímulo que fue establecido como inductor en una situación de entrega de alimento en una cámara de condicionamiento operante estándar, mantiene su efecto inductor en una situación de búsqueda de alimento en el laberinto radial con tres configuraciones distintas, mismas que difieren en el número de brazos presentes y la relación de éstos con los contenedores de alimento.

Los resultados indican que el efecto inductor del estímulo establecido durante el entrenamiento no se mantuvo en todas las configuraciones del laberinto radial. Se observó que los tres grupos, a pesar de tener el mismo entrenamiento en discriminación en la cámara de condicionamiento operante, variaron su conducta en relación con la configuración del laberinto correspondiente, siendo estas variaciones consistentes con hallazgos reportados sobre patrones de búsqueda de alimento en laberintos radiales (Olton, 1982; Krebs & McCleery, 1984; Hoffman, Timberlake, Leffel & Gont, 1999; Timberlake & Hoffman, 2002; De La Casa & Timberlake, 2006).

Para el Grupo RADCOM la primera elección en el laberinto radial osciló entre valores positivos y negativos en las cinco sesiones con algunos valores cercanos a 0 o nivel de azar, indicando indiferencia a elegir comederos con ED que sin él. A este grupo contrastó el Grupo RADBRA en el que los sujetos en su primera elección en todas las sesiones obtuvieron valores cercanos a 1.0, indicando preferencia por contenedores con ED y que además, sus a preferencia disminuyó en la segunda y tercera elección, prácticamente se mantuvo en valores positivos, mostrando una tendencia a pasar por los brazos del laberinto al elegir los contenedores con ED. Finalmente, el Grupo RADNBRA, en el que los comederos con ED no coincidían con la presencia de los brazos del laberinto para llegar a él, la primera elección en todas las sesiones fue negativa mostrando una alta preferencia por los contenedores flanqueados por los brazos más que los contenedores señalados con ED. Estos resultados son consistentes con los hallazgos reportados por Hoffman, Timberlake, Leffel y Gont (1999), apoyando la idea de que las ratas, para su desplazamiento, prefieren hacerlo por los brazos del laberinto que por caminos alternativos que no poseen esa característica.

Por otro lado, el Grupo RADNBRA fue el que mayor número de conductas exploratorias mostró en la plataforma central antes de la primera elección durante la posprueba, notoriamente por encima de lo mostrado durante la preprueba. Esta característica está relacionada con ciertas conductas pre-elección en la que los sujetos identifican las características estructurales y funcionales del lugar

J. A. Camacho-Candia & F. Cabrera. / Journal of Behavior, Health & Social Issues, 13, 1 (2021) pp. 12-21

Figura 4

Proporción de la distribución de la conducta que ocurrió en la plataforma central del laberinto radial, una vez que se había retirado la caja de inicio durante la preprueba y la posprueba por grupo

(Brown, 1992; Rojas-Leguizamón, Yañez & Cabrera, 2019) descritas también como conductas vicarias por ensayo y error (en inglés vicarious trial-and-error o VTE, Tolman, 1938; Hu, Xu y González-Lima, 2006), en las que realizar una discriminación ambivalente puede llevarse más tiempo que una elección más fácilmente discriminable. En este caso, el probable conflicto entre la señal del ED que no correspondía al camino flanqueado por paredes pudo llevar a una mayor latencia por realizar conductas de observación de las alternativas que en el caso en que los ED coincidieron con los caminos flanqueados por brazos y en el que no había ningún ED que introdujera ambivalencia alguna. Esta observación nos permite suponer que el ED tuvo efecto en la elección de los sujetos con respecto a cuál alternativa seguir en el laberinto radial, poniéndose de manifiesto en las conductas emitidas previas a la primera elección, mostrando mayor conducta exploratoria en la plataforma central, especialmente después del entrenamiento. Este cambio se observó en los tres grupos, pero con énfasis en el grupo RADNBRA (ver Figura 4).

Retomando el propósito de integrar o relacionar las posturas de Gibson, Timberlake y Baum (para una revisión ver Cabrera, Covarrubias y Jiménez, 2009, Cabrera, Jiménez & Covarrubias, 2019), con respecto al papel del reforzador como inductor (Baum, 2012; Killeen & Jacobs, 2017), se puede interpretar que en el grupo RADNBRA existió un conflicto entre un posibilitador de acción, a saber, la pared de los brazos del laberinto y un inductor, a saber, el ED, que en ese grupo conducían a metas distintas. Lo cual no se observa en el grupo RADBRA, ya que tanto el posibilitador de acción como el inductor (brazos y ED respectivamente) llevaban a la misma meta, por lo que los resultados son más consistentes incluso que en el grupo RADCOM, donde la probabilidad de elegir el contenedor señalado con el ED fue con una tendencia más aleatoria a

diferencia de los otros grupos. Si esto ocurrió así, entonces el sistema conductual alimenticio (como lo interpreta Timberlake, 1993, 1994) es susceptible de ser modificado o entrar en conflicto a partir de conductas que son aprendidas en la ontogenia. En términos de los posibilitadores de acción que propone Gibson (1979), se hace relevante considerar en estudios posteriores la naturaleza de éstos y su relación con los sistemas perceptuales, en este caso en todos los grupos competían un inductor (ED) contra un posibilitador de acción (presencia o ausencia de brazos del laberinto), ambos identificados como tales por el sistema perceptual visual y relacionados con el sistema alimenticio. Los resultados obtenidos sugieren que el posibilitador de acción, jugó un papel más relevante que el inductor aprendido previamente, posiblemente debido a la modificación radical del espacio de entrenamiento que implicó pasar de la cámara de condicionamiento al laberinto radial. Investigaciones posteriores deberán conducirse a evaluar las diferencias entre sistemas perceptuales en relación con la naturaleza de los estímulos, superficies, distancia, altura entre otros, como posibilitadores de acción (Affordances) y su relación con la modificación de los diferentes sistemas conductuales desarrollados por distintas especies, así como la competencia entre inductores y posibilitadores de acción de distinta naturaleza.

Referencias

Baum, W. M. (1995). Introduction to molar behavior analysis. Mexican Journal of Behavior Analysis, 21, 7-25. http://dx.doi.org/10.5514/rmac.v21.i1.ESP.25408

Baum, W. M. (2002). From molecular to molar: a paradigm shift in behavior analysis. Journal of the Experimental Analysis of Behavior, 78, 95-116. https://doi.

org/10.1901/jeab.2002.78-95

J. A. Camacho-Candia & F. Cabrera. / Journal of Behavior, Health & Social Issues, 13, 1 (2021) pp. 12-21

Baum, W. M. (2005). Understanding behaviorism: behavior, culture and evolution (2da. Ed.). Malden, MA: Blackwell Publishing.

Baum, W. M. (2012). Rethinking reinforcement: allocation, induction and contingency. Journal of the Experimental Analysis of Behavior, 97, 101-124. https://doi.org/10.1901/jeab.2012.97-101

Baum, W. M. & Davison, M. (2014a). Choice with frequently-changing food rates and food ratios. Journal of the Experimental Analysis of Behavior, 101, 246-274. https://doi.org/10.1002/jeab.70

Baum, W. M. & Davison, M. (2014b). Background activities, induction and behavioral allocation in operant performance. Journal of the Experimental Analysis of Behavior, 102, 213-230. https://doi.org/10.1002/jeab.100

Brown, M. F. (1992). Does a cognitive map guide choices in the radial-arm maze? Journal of Experimental Psychology: Animal Behavior Processes, 18, 56-66. https://doi.org/10.1037/0097-7403.18.1.56

Cabrera, F. & Ortega, S. (2017). Affordance for reaching behavior: rats change limb preferences while reaching for food. Studies in Perception & Action XIV, 69-72.

Cabrera, F., Covarrubias, P. y Jiménez, Á. A. (2009). Sistemas conductuales desde una aproximación ecológica. En: Varela, J.A., Cabrera, F., Irigoyen, J.J. (Eds.), Estudios sobre comportamiento y aplicaciones Vol. 1 (pp. 31-50). México: Universidad de Guadalajara.

Cabrera, F., Jiménez, A. & Covarrubias, P. (2015) Discriminanda, manipulanda, utilitanda: el concepto de soporte conductual de Edward C. Tolman revisitado. En F. Cabrera, O. Zamora, H. Martínez, P. Covarrubias y V. Orduña (Coords.). Estudios sobre comportamiento y aplicaciones, volumen IV (p. 29-59). México: UNAM-Universidad de Guadalajara.

Cabrera, F., Jiménez, Á. A., & Covarrubias, P. (2019). Timberlake’s behavior systems: A paradigm shift toward an ecological approach. Behavioural Processes, 167, 103892. https://doi.org/10.1016/j.beproc.2019.103892

Cabrera, F., Robayo-Castro, B. Covarrubias, P. (2010). The ‘Huautli’ alternative: Amaranth as reinforcer in operant procedures. Mexican Journal of Behavior Analysis, 36, 71-91.

Camacho, J. A. & Cabrera, F. (2014). Allocation of behavior in a simple discrimination task. Conductual, 2 3, 4-16.,

De La Casa, L. G. & Timberlake, W. (2006). Effects of preexposure and retention interval placement on latent inhibition and perceptual learning in a choice-maze discrimination task. Learning & Behavior, 34, 2, 193-201. https://doi.org/10.3758/BF03193194

Fetterman, J.G. (1996). Dimensions of stimulus complexity. Journal of Experimental Psychology: Animal Behavior Processes, 22, 3-18. https://doi.org/10.1037/0097-7403.22.1.3

Gibson, E. J. (1963). Perceptual learning. Annual

Review of Psychology, 14, 29-56. https://doi. org/10.1146/annurev.ps.14.020163.000333

Gibson, E. J. (1969). Principles of perceptual learning and development. New York: Appleton-Century-Crofts.

Gibson, J. J. (1979). The ecological approach to visual perception. New Jersey: Lawrence Erlbaum Associates.

Hänninen, L. & Pastell, M. (2009). CowLog: open-source software for coding behaviors from digital video. Behavior Research Methods, 41, 472-176.https://doi.org/10.3758/BRM.41.2.472

Harzem, P., Lowe, C. F. & Spencer, P. T. (1978). Temporal control of behavior: Schedule interactions. Journal of the Experimental Analysis of Behavior, 30, 255-270.https://doi.org/10.1901/jeab.1978.30-255

Hoffman, C. M., Timberlake, W., Leffel, J. & Gont, R. (1999). How is radial arm maze behavior in rats related to locomotor search tactics? Animal Learning & & Behavior, 27, 4, 426-444.

Hu, D., Xu, X., & González-Lima, F. (2006). Vicarious trial-and-error behavior and hippocampal cytochrome oxidase activity during Y-maze discrimination learning in the rat. International Journal of Neuroscience, 116, 265-280. https://doi.org/10.1080/00207450500403108

Killeen, P. R. & Jacobs, K. W. (2017). Coal is not black, snow in not White, food is not a reinforcer: The roles of affordance and dispositions in the Analysis of Behavior. Behavior Analyst, 40, 17-38.https://doi.org/10.1007/s40614-016-0080-7

Killeen, P. R. & Pellón, R. (2013). Adjuntive behaviors are operants. Learning & Behavior, 41, 1-24. https://doi.org/10.3758/s13420-012-0095-1

Krebs, J. R., & McCleery, R. H. (1984). Optimization in behavioral ecology. In J. R. Krebs & N. B. Davies (Eds.). Behavioural ecology (2nd ed., pp. 91-121) Sunderland, MA: Sinauer.

Lotfizadeh, A. D., Edwards, T. L., Redner, R. & Poling, A. (2012). Motivating Operations Affect Stimulus Control: A Largely Overlooked Phenomenon in Discrimination Learning. Behavior Analyst, 35,89-100.https://doi.org/10.1007/BF03392268.

Lowe, C. F. & Harzem, P. (1977). Species differences in temporal control of behavior. Journal of the Experimental Analysis of Behavior, 28, 189-201.https://doi.org/10.1901/jeab.1977.28-189

Lubow, R. E. (1997). Latent inhibition as a measure of learned inattention: some problems and solutions. Behavioural Brain Research, 88, 75-83. https://doi.org/10.1016/S0166-4328(97)02307-3

Lubow, R. E., & Gewirtz, J. (1995). Latent inhibition in humans: Data, theory, and implications for schizophrenia. Psychological Bulletin, 117, 87-103.https://doi.org/10.1037/0033-2909.117.1.87

McLaren, I. P. L., & Mackintosh, N. J. (2000). An elemental model of associative learning: I. Latent inhibition and perceptual learning. Animal Learning & Behavior, 28, 211-246. https://doi.org/10.3758/BF03200258

Nadel, L., & Willner, J. (1980). Context and conditioning: A

place for space. Physiological Psychology, 8, 218-228.

J. A. Camacho-Candia & F. Cabrera. / Journal of Behavior, Health & Social Issues, 13, 1 (2021) pp. 12-21

Norma Oficial Mexicana NOM-062-Z00-1999.

Olton, D. S. (1982). Staying and shifting: Their effect on discrimination learning. In M. L. Commons, R. J. Herrnstein, & H. Rachlin (Eds.). Quantitative analyses of behavior: Vol.2. Matching and maximizing accounts (pp. 205-226). Cambridge, MA: Ballinger.

Roche, J. P. & Timberlake, W. (1998). The influence of artificial paths and landmarks on the foraging behavior of Norway rats (Rattus norvegicus). Animal Learning & Behavior, 26, 1, 76-84. https://doi.org/10.3758/BF03199163

Rojas-Leguizamón, M., Yañez, N. & Cabrera, F. (2019). Spatial memory in hamsters (Mesocricetus auratus): Depleting/Replenishing environments and pre-choice behaviors in the Radial Arm Maze. International Journal of Comparative Psychology, 32, 1-8.

Saltzman, I. J. (1949). Maze learning in the absence of primary reinforcement: a study of secondary reinforcement. Journal of Comparative and Physiological Psychology, 42, 161–173.

Terrace, H. S. (1966). Stimulus control. In W. K. Honig (Ed.). Operant Behavior: areas of research and application (pp. 271-344). New York: Appleton Century Crofts.

Timberlake, W. & Lucas, G.A., (1991). Periodic water, interwater interval, and adjunctive behavior in a 24-hour multi-response environment. Animal Learning & Behavior, 19, 369-380. https://doi.org/10.3758/BF03197898

Timberlake, W. (1984). An ecological approach to learning. Learning & Motivation, 15, 321-333. https://doi.org/10.1016/0023-9690(84)90001-8

Timberlake, W. (1990). Natural learning in laboratory paradigms. In D. A. Dewsbury (Ed.), Contemporary issues in comparative psychology (pp. 31-54). Sunderland, MA: Sinauer. https://doi.org/10.1037/11525-002

Timberlake, W. (1993). Behavior Systems and reinforcement: an integrative approach. Journal of the Experimental Analysis of Behavior, 60, 105-128.https://doi.org/10.1901/jeab.1993.60-105

Timberlake, W. (1994). Behavior systems, associationism and Pavlovian conditioning. Psychonomic Bulletin & Review, 1, 405-420. https://doi.org/10.3758/BF03210945

Timberlake, W. (2001). Integrating niche-related and general process approaches in the study of learning. Behavioural Processes, 54, 79-94. https://doi.org/10.1016/S0376-6357(01)00151-6

Timberlake, W. (2002). Niche-related learning in laboratory paradigms: the case of maze behavior in laboratory rats. Behavior & Brian Research, 134, 355-374. https://doi.org/10.1016/S0166-4328(02)00048-7

Timberlake, W. (2004). Is the operant contingency enough for a science of behavior? Behavior & Philosophy, 32, 197-229.

Timberlake, W., & Hoffman, C.M. (2002). How does the ecological foraging behavior of desert kangaroo rats (Dipodomys deserti) relate to their behavior in radial mazes? Animal Learning & Behavior, 30,342-354.https://doi.org/10.3758/BF03195959

Timberlake, W., & Wozny, M. (1979). Reversibility of reinforcement between eating and running by schedule changes: A comparison of hypotheses and models. Animal Learning & Behavior, 7(4), 461–469.https://doi.org/10.3758/BF03209702

Timberlake, W., Leffel, J., & Hoffman, C. M. (1999). Stimulus control and function of arm and wall travel by rats on a radial arm floor maze. Animal Learning & Behavior, 27, 445-460. https://doi.org/10.3758/BF03209980

Tolman, E.C. (1932). Purposive behavior in animals and men. New York: Century C.

Tolman, E.C. (1938). The determiners of behavior at a choice point. Psychological Review, 45,1-41.https://doi.org/10.1037/h0062733

Tonneau, F., Cabrera, F., y Corujo, A. (2012). Hamsters’ (Mesocricetus auratus) memory in a radial maze analog: The role of spatial versus olfactory cues. Journal of Comparative Psychology, 126,82-86.https://doi.org/10.1037/a0025019

Williams, K. A. (1929). The reward value of a conditioned stimulus. University of California Publications in Psychology, 4, 31–55.