Metodología experimental

  • Orfelio G. León García

    Doctor en Psicología. Profesor titular del Área de Metodología de las Ciencias del Comportamiento de la Universidad Autónoma de Madrid.

  • Ignacio Montero García-Celay

    Doctor en Psicología. Profesor titular del Área de Metodología de las Ciencias del Comportamiento de la Universidad Autónoma de Madrid.

PID_00215492

Objetivos

  1. Discriminar un auténtico experimento de otro tipo de estudio.

  2. Aprender a asignar de manera correcta los participantes a las condiciones del experimento.

  3. Conocer las exigencias para que el mismo grupo de participantes pueda pasar por todas las condiciones experimentales.

  4. Conocer los condicionantes de la clínica para investigar.

  5. Conocer cómo se interpreta adecuadamente el efecto de una variable cuando actúa al mismo tiempo que una segunda variable.

  6. Hacer las gráficas factoriales.

1.Experimentos con una variable independiente diferentes sujetos

1.1.Introducción: ¿qué es experimentar en psicología? Presentación de un caso

Suponed que queremos investigar cómo se comportan las personas en situación de presión de tiempo; en concreto, a la hora de ir al trabajo por la mañana. Podemos preparar un cuestionario en el que se pregunte por su comportamiento y por el de sus semejantes y seleccionar una muestra representativa para ser interrogada (metodología de encuestas). Suponed que dudamos de la sinceridad de los encuestados, dado que la deseabilidad social les puede hacer aparecer más civilizados de lo que realmente son.
Podemos adoptar otra estrategia: nos apostamos en la salida del metro de una gran ciudad a primera hora de la mañana; anotamos todas las conductas de las personas que aparecen durante un periodo de cinco minutos (metodología de observación). Sin embargo, nos surgen dudas: algunos no tendrán prisa, incluso llegan con tiempo para tomar un café antes del trabajo; otros no van a trabajar, sino que vuelven de fiesta; algunos llegan media hora tarde, mientras que otros llegan sólo un par de minutos tarde; en esos cinco minutos, unos piden un taxi, otros corren, otros cruzan por un semáforo, otros son asaltados por un indigente...
La lista de circunstancias que afectan a la conducta, además de la prisa por llegar al trabajo, es grande (variables extrañas). Dudamos de la capacidad de obtener datos consistentes. Necesitamos crear unas condiciones controladas por nosotros (variable independiente) para estar seguros de lo que está pasando (variable dependiente) y poder interpretarlo.
Por ejemplo, Darley y Bateson (1973) crearon dos condiciones. En una, los participantes eran forzados a llegar tarde, y en la otra, no. En medio del proceso aparecía un indigente solicitando ayuda. ¿Tenía algún efecto la prisa sobre la solidaridad hacia el indigente? El grupo que tenía prisa ayudó en un 10% de los casos, mientras que el grupo que no tenía prisa ayudó en un 63% de los casos. Como los investigadores hicieron que ambos grupos fueran iguales excepto en la prisa, pudieron concluir que la prisa hacía que la gente fuera menos solidaria.
A esta forma de investigar la llamamos metodología experimental: producimos el fenómeno, controlamos las circunstancias y decidimos quién estará bajo qué condiciones. Fíjaos en lo difícil que habría sido concluir que la prisa estaba relacionada negativamente con la conducta de ayuda mediante la encuesta; muchos de nosotros, de haber sido encuestados quizá dijéramos de buena fe que ayudaríamos, pero la realidad mostraría otra cosa; también hubiera sido difícil mediante observación decir que los que no ayudaban eran los que tenían más prisa, ya que no sabríamos si se debía a otra circunstancia.
Mediante la experimentación podemos contrastar que una variable es la causa de otra.
Veamos ahora con detenimiento cómo se desarrolla un experimento en psicología. El blanco y el negro han simbolizado desde antiguo el bien y el mal en muchas culturas. Por ejemplo, los justos que gozan en presencia de Dios, tal como los describe san Juan en el Apocalipsis (Juan, Ap, 7, 9), llevan vestiduras blancas. Darth Vader, el representante del lado oscuro en la saga de La guerra de las galaxias, viste de negro riguroso. Mozart, en la Flauta Mágica, contrapone la reina de la Noche y el sacerdote del Sol; los caballos de Ben Hur son blancos, mientras que los de Mesala son negros. Incluso Rowling (1999), en su obra del superhéroe infantil Harry Potter, encasilla al malo Voldemort como el representante del lado oscuro. ¿Hasta qué punto los colores blanco y negro condicionan nuestra percepción, o se trata sólo de signos culturales?
Para probarlo, Frank y Gilovich (1988) realizaron la investigación siguiente. Primero analizaron las estadísticas: a los equipos de fútbol americano y de hockey con camiseta negra les pitaban más faltas que a los que llevaban camiseta blanca. Este tipo de dato -descriptivo- no les aseguraba que el responsable fuera el color de la camiseta. Quizá fuera otra la causa. Es incluso posible que los equipos que se perciben como más agresivos elijan el color negro.
Como hemos comentado en las metodologías con encuestas, incluso con altas correlaciones, no podemos asegurar la causación entre dos variables. Los autores necesitaban reproducir el fenómeno bajo su entero control, de forma que otras explicaciones distintas de la suya pudieran ser descartadas. Necesitaban planear un experimento.
Su hipótesis fue que si un jugador de fútbol americano lleva una camiseta negra, entonces se le pitarán más faltas que cuando lleva una blanca. Un experimento de campo sería muy costoso: por ejemplo, hacer que un equipo jugara la mitad de sus partidos de blanco y la otra mitad de negro... Podría ser que algunos sintieran que su honor se ponía en entredicho al ponerse la elástica blanca.
Su proyecto fue más sencillo: primero recopilaron vídeos con jugadas dudosas o sancionadas, en las que los supuestos infractores vistieran unas veces (50%) de blanco, y otras (50%) de negro. Después, un grupo de árbitros profesionales, discutiendo entre ellos y con moviola, valoraría si había falta o no. El resultado final sería un vídeo donde "los de blanco" cometían el mismo porcentaje de faltas que "los de negro".
Pasemos ahora a los participantes. ¿Quiénes podían ser jueces de fútbol?
Cualquiera no servía. En primer lugar, tenían que conocer correctamente las reglas del juego. En segundo lugar, debían verlo habitualmente. En tercer lugar, no podían ser seguidores -ni "adversarios", se entiende- de ninguno de los equipos que aparecían en las grabaciones.
Sus edades no debían ser extremas, de forma que establecieron un rango entre 25 y 55 años. Mantuvieron un discreto 15% de chicas, similar al porcentaje de asistentes a los campos de fútbol.
Como la tarea consistiría en ver jugadas en un monitor, seguro que descartaron algún candidato con mala visión. Los participantes -60- se escogieron entre los que contestaron a una solicitud por escrito, repartida en un estadio durante varios partidos, en una gran ciudad del este de Estados Unidos.
Para estar más seguros de que era el color de la camiseta lo que determinaba el mayor número de sanciones de faltas, diseñaron la estrategia siguiente. En una copia con las jugadas conflictivas modificaron digitalmente el color de todas las camisetas, de manera que todos los equipos supuestamente infractores aparecían de gris. De esta forma podían ver cuántas faltas les "pitaban los jueces", sin estar afectados por el color de las camisetas; a esta cinta en gris, la llamaremos control. En la otra cinta aparecían los colores blanco y negro; a esta cinta la llamaremos experimental.
Ya sólo faltaba que la mitad de los jueces vieran -y pitaran- las jugadas de la cinta control y la otra mitad las de la experimental. Por supuesto, los dos grupos de jueces debían ser equivalentes, no podía ser que unos fueran más estrictos que otros. Para conseguirlo hicieron una lista de todos por orden alfabético y después les pusieron un número de orden. Sacaron un número al azar entre 1 y 60. El juez con ese número fue asignado al vídeo control, el juez con el número siguiente al experimental, y así sucesivamente hasta agotar la totalidad de los jueces. (Si queréis saber cómo se lleva a cabo una asignación aleatoria, podéis practicar haciendo la actividad 3.1 (1) .)
(1) Actividad 3.1
Con la actividad siguiente podéis realizar una asignación aleatoria.
Veamos cómo están las cosas hasta este momento: tenemos dos cintas de vídeo que son idénticas, excepto el color de las camisetas de los infractores; tenemos dos grupos igualados de jueces dispuestos a valorar cada cinta. Si el color de la camiseta no influye en su decisión de pitar falta, en ambas cintas el equipo "negro" recibirá las mismas faltas que el equipo "blanco".
Los resultados fueron los siguientes:
  1. en la condición de control ambos equipos recibieron el mismo número de faltas;

  2. en la condición experimental el equipo con camiseta negra recibió el doble de faltas que el equipo con camiseta blanca (Frank y Gilovich, 1988).

1.2.Diseño con grupos aleatorios: la hipótesis; los participantes y su asignación; el diseño, las variables y su operativización; los resultados y la discusión

En el experimento de Frank y Gilovich (1988), se utilizó un plan que consistió en disponer de dos grupos de participantes que realizarían una tarea bajo dos condiciones distintas. Es decir, dos grupos de jueces que observarían el mismo vídeo y atribuirían faltas, bajo dos condiciones distintas, como eran los distintos colores de las camisetas. El grupo de jueces que veía a los jugadores vestidos de gris formaba el grupo control. El grupo de jueces que analizaba las faltas de jugadores con camiseta blanca o negra formaba el grupo experimental. Veamos cuáles podían ser las razones para desarrollar esta estrategia:
Primera, los dos grupos de jueces debían ser distintos, porque se quería mantener el mismo material (las mismas jugadas conflictivas) y, por lo tanto, los mismos jueces no podían ver dos veces la misma cinta; esto alteraría las respuestas de la segunda vez.
Segunda, fueron dos los grupos, porque había dos condiciones experimentales (o dos niveles de la variable independiente), pero podrían haber hecho un plan con tres o con cuatro grupos (podían haber contrastado si el rojo o el verde tenían algún efecto diferencial). Cuando se utilizan sólo dos grupos y uno de ellos está en una condición en la que recibe un nivel nulo de la variable independiente, a éste se le llama grupo control; al otro grupo, que recibe un valor cualquiera de la variable independiente, se le llama grupo experimental. El grupo control sirve como nivel de partida para valorar la cuantía del efecto del grupo experimental; en este contexto, no asumimos que los de gris no van a realizar ninguna falta, sino de saber cuántas faltas se ven en las jugadas, cuando el color de la camiseta no afecta nada al observador.
Tercera, los dos grupos fueron generados mediante la acción del investigador. Ninguna otra circunstancia externa determinó la pertenencia al grupo experimental o al grupo control. El investigador tuvo en su mano decir quién iba a cada grupo. La forma en que dividió a los participantes (asignación aleatoria) es la que da nombre al diseño: diseño de grupos aleatorios. En el diseño con grupos aleatorios el investigador genera tantos grupos como niveles tiene la variable independiente y mediante un procedimiento basado en el azar reparte a los participantes entre los grupos. El azar consigue que las variables extrañas asociadas a las diferencias individuales queden repartidas y, por lo tanto, que los grupos sean equivalentes (o, en expresión sinónima, que estén equilibrados). Un buen plan de investigación con grupos de participantes distintos debe asegurar que los grupos reaccionarán de la misma manera ante la misma condición experimental. Asegurado esto, si reaccionan de forma distinta, deduciremos que se debe a los distintos niveles de la variable independiente. Para significar que distintos participantes pasarán por los distintos niveles de la variable independiente, también se utiliza como abreviación la palabra inter. Así, se dice de una variable que es inter o intersujetos (experimento con los mismos participantes); en reciprocidad, cuando son los mismos participantes los que pasan por todas las condiciones de la variable independiente, se utiliza la expresión intra, y se dice que tal variable es intra o intrasujetos. Así, en este experimento decimos que la variable color de las camisetas es intersujetos.
En todo experimento hay explícita una hipótesis de relación causal. En nuestro caso era:

"si el color negro en la camiseta de los jugadores hace que su conducta se perciba como más beligerante en una situación dudosa, entonces cuando esos mismos jugadores, en las mismas jugadas, lleven una camiseta de color gris recibirán menos sanciones que cuando la lleven negra."

Podéis observar dos cosas en esta hipótesis:
  • En primer lugar, tiene una estructura "si..., entonces..." que encadena la variable independiente con la variable dependiente y establece con claridad qué es lo que debe suceder en el caso de que la relación que se establece en el antecedente sea cierta.

  • En segundo lugar, está redactada con un elevado grado de meticulosidad; decimos que está operacionalizada u operativizada: está concretada de manera que lo que se expresa se puede observar y registrar.

En la exposición, hemos utilizado el término variable con diferentes adjetivos y ahora conviene que lo sistematicemos.
  • El color de las camisetas era la variable independiente; que hipotéticamente produce el efecto. Sus niveles eran las formas en que se presentaba: primer nivel, negro/blanco; segundo nivel, gris/gris.

  • El investigador tenía en sus manos la capacidad de presentar estos niveles y de hacer que los participantes que él quisiera se encontraran bajo un nivel u otro (aunque ya sabemos que confió la tarea al azar). Por este motivo, se dice que el investigador tiene la capacidad de manipular la variable independiente.

  • La calificación de falta en el juego del vídeo era la variable dependiente. Aquella conducta de los participantes estaba influida en potencia por la independiente. Para que esté correctamente operativizada, es preciso especificar la manera de medirla. En nuestro caso se trata del número de faltas adjudicadas al equipo cuando lleva la camiseta negra y cuando lleva la gris.

En el experimento había otras variables sobre las que el investigador no hipotetizaba nada en relación con la dependiente. Sin embargo, ante la sospecha de su influencia las tenía en cuenta y las controlaba. Así, las variables controladas eran las siguientes:
  1. El nivel de conocimientos técnicos. Controlada mediante igualación, ya que todos entraban en la misma categoría "con conocimientos adecuados".

  2. La asistencia a partidos. Controlada mediante igualación. Todos asistían regularmente a ver partidos.

  3. La edad. Controlada por equilibrado. Es decir, al haberse repartido por asignación aleatoria a los participantes en dos grupos, habrá personas de todas las edades en las dos condiciones.

  4. El género. Controlada por equilibrado. La asignación aleatoria habrá repartido hombres y mujeres de forma no sesgada a los dos grupos.

  5. La pasión y la animadversión. Controlada por eliminación. Aquellos seguidores -o detractores- de los equipos filmados quedaron fuera de la investigación.

  6. La capacidad de visión. Controlada por eliminación. Aquellos candidatos con dificultades de visión no participaron; el resto, con sus diferencias naturales, veía con normalidad.

¿No hay más variables que pudieran influir en la dependiente? Seguramente, pero en algún sitio hay que cortar. Lo que suelen hacer los investigadores es leer antes en otros trabajos publicados qué variables influyen y en consecuencia controlarlas. Que no se conozcan no quiere decir que no estén presentes. ¿Qué pasa, pues, con ellas? Actuar, actúan; y la prueba es que no todos los participantes bajo la misma condición se comportan de la misma manera.
Justamente, estas diferencias son la prueba de que hay otras variables que afectan a la dependiente. Como no se conocen, reciben el nombre de variables extrañas.
Dentro de las variables extrañas existe una clase particularmente perniciosa: las enmascaradas.
Cambiamos de contexto de investigación. Suponed que leemos en un estudio que se ha comprobado que las familias españolas que han decidido vivir en casas de madera gozan de mayor salud que las que viven en casas de ladrillos. Como explicación se aduce su mejor aislamiento y su capacidad de "respirar". Existe una posible variable enmascarada: que las familias que viven en casas de madera tengan mayor poder adquisitivo. Si esto es así, el poder adquisitivo cambia al mismo tiempo que cambian los niveles de la variable independiente y es una variable que puede explicar las diferencias en la dependiente. Una vez detectada la posible variable enmascarada, el investigador debe controlarla. En este caso, eligiendo familias en casas de ladrillo con similar poder adquisitivo al de las familias que viven en casas de madera.
Cuando leemos un informe de investigación no consideramos aceptable que nos digan cosas como "el grupo que vio el vídeo en colores fue menos deportivo", o, en otro contexto, "los enfermos que no siguieron tal terapia consiguieron levantar su plano vital". Cuando leemos un informe de investigación esperamos encontrar una sección de "resultados" donde se exprese de forma numérica cuáles han sido los valores de la variable dependiente bajo cada condición de la independiente.
Cuando se ha utilizado un diseño con grupos, hay que resumir la información de cada grupo mediante un índice de tendencia central. El más utilizado, como sabéis, es la media.
En el caso que hemos relatado, se informó que el porcentaje de faltas pitadas por el grupo que veía las camisetas de negro era el doble que el porcentaje pitado por el grupo que veía las camisetas de gris (en el original aparecen los valores concretos).
Los resultados se discuten en relación con la hipótesis planteada, y establecen si pueden mantenerse provisionalmente o rechazarse.
Asimismo, en la fase de discusión deben relacionarse los hallazgos presentes con los de otros autores, de forma que el conocimiento no se parcele en exceso y permita establecer reglas lo más generales posible.

1.3.Cualidades de la investigación con experimentos: control; fiabilidad; sensibilidad; validez interna; validez externa

La primera cualidad que distingue la metodología experimental es el control. Veamos en qué indicios del experimento anterior podemos descubrir acciones de control:
  1. "Vídeos con jugadas dudosas o sancionadas". De esta forma la atención de los jueces se centraba sobre el problema y no tenían que ver todo el partido.

  2. "Los supuestos infractores vestían unas veces (50%) de blanco y otras (50%) de negro". El resultado final sería un vídeo donde "los de blanco" cometían el mismo porcentaje de faltas que "los de negro". De esta forma, si el color no afecta, se espera que los jueces "vean" las mismas faltas en "los de blanco" que en "los de negro".

  3. "Los jueces tenían que conocer correctamente las reglas del juego". Para esta investigación no servía cualquiera. Además de ser aficionado, debía tener un buen conocimiento técnico.

  4. "Debían verlo [el fútbol] habitualmente". Esta condición complementa a la anterior; no sólo debían conocer las reglas, sino ver partidos regularmente para poder ser buenos jueces.

  5. "No podían ser seguidores -ni adversarios-". Con esta exigencia controlaban una de las variables que más prejuicios ocasiona en la valoración de faltas en el deporte de equipos.

  6. "Sus edades (...) entre 25 y 55". Con esta franja de edad los investigadores tratan de representar al público que habitualmente sigue los partidos.

  7. "Chicas, (...) un 15%, similar al porcentaje de asistentes a los campos de fútbol". No sabemos si las mujeres son más o menos estrictas que los hombres al considerar las faltas. Los investigadores optaron por una representación similar a la del público que asiste a los partidos.

  8. "Descartaron algún candidato con mala visión". Puesto que la tarea consistía en valorar lo que se veía en un monitor, había que ver bien.

  9. "Los dos grupos de jueces debían ser equivalentes". Con esta medida de control se aseguraron que los dos grupos estarían afectados por la mismas variables extrañas cuando juzgaran los vídeos. Esta técnica de control -asignación aleatoria- será expuesta en el próximo apartado.

Las acciones 1 y 2 fueron encaminadas a obtener una tarea que permitiera generar el fenómeno deseado, en condiciones de "laboratorio". Junto a estas indicaciones, había otras como el tamaño del monitor y sus características, la distancia a la que estaban los jueces, la hora del día... todas ellas medidas de control con cuya especificación otros investigadores podrán replicar el experimento.
Las medidas de control 3 a 8 van encaminadas a que los participantes de esta investigación sean los adecuados para que pueda producirse el fenómeno que se estudia. (Nosotros difícilmente serviríamos para analizar jugadas dudosas de fútbol americano.)
La medida de control 9 va encaminada a que la única diferencia entre las dos condiciones de visión del vídeo fuera la ausencia -todos de gris- o presencia del color -de blanco y de negro. Sorteando los jueces a cada condición () nos aseguramos de que un grupo de jueces no difiere del otro.
¿Creéis que podíamos haber adoptado estas medidas de control con las metodologías descriptivas?
El control es una de las características esenciales de la metodología experimental.
¿Fue fiable este experimento? Cuantas más medidas de control tenga un experimento es más probable que sea fiable.
Sin embargo, hasta que no se repita no lo sabremos, ya que la fiabilidad es el grado en el que se estima que, al realizar de nuevo un experimento, obtendremos los mismos resultados.
Todos los procesos que hacen aportaciones relevantes para la ciencia son repetidos en numerosas ocasiones, ya que, a veces, algunos resultados deslumbrantes no se vuelven a obtener (como ejemplo reciente podemos citar los casos de los laboratorios que obtenían fusiones en frío y luego no podían repetirlas). Cuando al repetir un experimento no se obtienen los mismos resultados, eso significa que alguna variable no se controló bien, o que existe alguna variable desconocida que interviene de forma diferente en cada repetición. ¿Qué creéis que hubiera pasado si en lugar de ver un vídeo con una selección de jugadas dudosas hubieran visto un partido completo? Lo más probable es que en todo el partido aparecieran, como mucho, media docena de jugadas dudosas. Con este reducido número es probable que no se pusieran de manifiesto las diferencias entre el vídeo en gris y el coloreado.
Cuando un experimento no tiene la capacidad para producir la presencia del fenómeno, decimos que no tiene sensibilidad.
Esto puede ocurrir por múltiples causas; en nuestro caso, por un mal conocimiento técnico de los participantes o porque la toma de la cámara fue tal que no se apreciaba bien la responsabilidad en la acción.
La siguiente cualidad que expondremos es la validez interna. Probablemente, la calidad más identificativa de las metodologías experimentales. Lo primero que vamos a hacer es definirla con una sola palabra del lenguaje cotidiano para facilitar su comprensión: causación.
Para que podamos decir que una investigación, y en este caso un experimento, tiene una adecuada validez interna debe cumplir tres requisitos: antecesión de la variable independiente, covariación entre la variable independiente y la dependiente, y capacidad para descartar explicaciones alternativas.
Esta ordenación está hecha siguiendo la secuencia temporal en que se realiza la investigación.
Antecesión:
¿Se produjo la manipulación del color de las camisetas antes de que se produjeran las atribuciones de faltas? La respuesta es que sí. Este requisito es fácil de cumplir, ya que, al tratarse de un experimento, la acción de la variable independiente está bajo el control de los investigadores y son ellos los que presentan la tarea de la forma adecuada. Primero aparece la variable independiente y después se registra la dependiente. Para que pueda decirse que existe causación entre dos variables debemos estar seguros de cuál antecede.
En resumen, el primer requisito para asegurar la validez interna es que la variable independiente se produzca antes que la dependiente.
Covariación:
¿Qué ocurre con el número de faltas cuando el investigador hace que el equipo pase de verse con camiseta blanca a verse con camiseta negra? Respuesta: las faltas aumentan. Es decir, cuando se cambian los valores de la variable independiente cambian los valores de la dependiente. A este fenómeno, en estadística, se le llama covariación: cambiar simultáneamente los valores de dos variables. Resumiendo:
el segundo requisito para que pueda existir causación es que se dé covariación entre la variable independiente y la dependiente.
Capacidad de descartar explicaciones alternativas:
¿Estamos seguros de que la única causa por la que se pitaron distinto número de faltas en las dos condiciones era el color de la camiseta? Recordad: el equipo objetivo era visto en el mismo vídeo, en condiciones similares, por dos grupos de jueces similares, y la única diferencia de las dos sesiones era que en una iba de blanco y la otra de negro... Si la respuesta es afirmativa, entonces habremos cumplido la tercera condición para hablar de causación.
Para asegurarnos de este tercer requisito, además, deberemos estar en condiciones de rechazar otras explicaciones alternativas. Por ejemplo, si alguien dijera que "eso ocurrió porque en el grupo de jueces que pitó más faltas había más hombres", nosotros debemos justificar que la proporción de hombres fue similar en ambos grupos (cosa que se hizo mediante la asignación aleatoria). Si alguien dijera que "a lo mejor, el grupo de jueces que pitó menos faltas sabría menos de fútbol", tendremos que rechazarlo argumentando que la calificación de ambos grupos fue similar y que se aseguró mediante la asignación aleatoria. Por lo tanto, podemos asegurar que se cumple el tercero, y último, de los requisitos para poder asegurar la causación y evaluar positivamente el grado de validez interna del experimento.
La mayor aportación de la metodología experimental es poder contrastar la existencia de causalidad entre una variable y el fenómeno que, supuestamente, produce.
¿Creéis que pitar más faltas a los "de negro" es exclusivo de esta situación experimental o creéis que se dará también en los campos de juego? Si pensáis que ocurrirá lo mismo en los campos de juego es porque este experimento tiene capacidad de generalización, tiene validez externa. Suponed por un momento que las condiciones en que se realiza la visión del vídeo incluyen: cámara superlenta, moviola tantas veces como desee el espectador, trazado de líneas adicionales en la pantalla, discusión en grupo por parte de los participantes y consulta telefónica directa con un árbitro profesional. ¿Pensáis ahora que los resultados de este segundo experimento podrían generalizarse? Seguramente pensaréis que no. Os faltará validez externa.
Ejemplo
Aquí tenéis otro caso de un experimento con distintos sujetos.
Caso 3.1
¿Os pueden inducir a ver lo que no habéis visto?
Algunos investigadores como Loftus, Miller y Burns (1978) han mostrado experimentalmente que nos pueden engañar haciéndonos recordar cosas que no hemos visto.
Para probarlo llevaron a cabo varios experimentos del estilo del que se describe a continuación.
Su hipótesis era:
"Si en un interrogatorio os inducen a pensar que cierto suceso ocurrió, posteriormente, al preguntaros por ese suceso es probable que creáis que sucedió."
Cien estudiantes fueron divididos al azar para formar un grupo experimental y otro control. Tanto el grupo experimental como el control vio veinte diapositivas en torno a un atropello. En una de ellas aparecía un coche en un cruce junto a un poste que no tenía ninguna señal. Después de veinte minutos haciendo una tarea para distraerlos, se les pasó un cuestionario sobre las diapositivas.
El cuestionario fue igual para los dos grupos excepto una pregunta malévola respecto a la diapositiva del cruce.
A los participantes del grupo control se les pedía que dijeran si recordaban el color del coche que estaba en el cruce. A los participantes del grupo experimental se les pedía que dijeran si recordaban el color del coche que estaba "junto a la señal de ceda el paso".
Nuevamente fueron entretenidos y un último cuestionario apareció. En éste, una pregunta para los dos grupos pedía recordar si en el cruce había un ceda el paso o nada.
El grupo control informó que recordaba un ceda el paso en un 2% de los casos.
El grupo experimental informó que recordaba un ceda el paso en un 75% de los casos.
Es decir, la pregunta anterior, que daba por supuesta la existencia de la señal, hizo que el 75% de los testigos creyeran de buena fe que habían visto una señal de ceda el paso. (Para más información sobre falsos recuerdos, podéis consultar Diges, 1997.)
Cuando las condiciones de los laboratorios se vuelven muy artificiales, se emplea también la expresión de falta de validez ecológica, que expresa las diferencias entre el laboratorio y el contexto natural.

1.4.Diseño de grupos aleatorios con una variable bloqueada

En la actividad 3.1 (1) veíamos cómo mediante la asignación aleatoria de los participantes podíamos conseguir que las variables extrañas asociadas a las diferencias individuales quedaran equilibradas entre las condiciones experimentales. Ese "quedar equilibradas", o producir grupos equilibrados, se concretaba en que las variables extrañas se repartieran de "forma no sesgada". En concreto, el porcentaje de chicos en el grupo experimental fue del 40%, y en el control, del 60%. En una variable dependiente donde el género tenga un papel secundario, este reparto podemos considerarlo adecuado. Pero ¿qué ocurre si el género es una variable muy relevante respecto a la dependiente?
Por ejemplo, suponed que investigamos sobre trastornos en la conducta alimentaria de los adolescentes (Toro y Castro, 2000). Primero, elaboramos un cuestionario que identifica predictores de futuros desórdenes. Posteriormente, con el cuestionario desarrollado, se identifican veinte adolescentes de riesgo, con edades entre los trece y los dieciséis años, dentro de un gran centro de educación secundaria. De los veinte, catorce son chicas (70%).
La fase siguiente consiste en aplicar un programa para modificar actitudes y hábitos alimentarios. Se divide el grupo al azar en dos grupos de diez, para participar en el programa o en el grupo control -en espera.
Finalmente, se comprueba que el programa produce cambios en el grupo experimental al compararlo con el de control. Sin embargo, al redactar las conclusiones nos damos cuenta de que, por "azar", estaba compuesto sólo por un 40% de chicas. ¿Estaríamos seguros de que produciría los mismos cambios si ese grupo hubiera sido compuesto por un riguroso 70%? No lo estaríamos.
Por lo tanto, en este caso, como el grupo experimental y el de control tienen diferentes porcentajes en cuanto al género de los participantes, no podemos desechar una explicación alternativa que dijera que las diferencias entre los grupos del experimento se debieron a la diferente composición de sus participantes.
Si el género debe ser correctamente controlado debemos encontrarnos con porcentajes iguales de chicos y chicas en los grupos del experimento. No podemos confiar en que el azar repartirá de forma exacta un 70% a cada uno de los grupos, especialmente cuando se trata de grupos pequeños. Si mediante el azar no podemos asegurarlo, sí podemos conseguirlo mediante una adecuada estrategia. Veamos cómo se haría en este caso:
a) Dividimos a los participantes en dos bloques: uno de chicas (14) y el otro de chicos (6).
b) Repartimos a los componentes del bloque de las chicas -al azar- a cada una de las condiciones experimentales, de manera que siete irán al grupo experimental y otras siete al de control.
c) Repartimos a los componentes del bloque de los chicos -al azar- a cada una de las condiciones experimentales, de forma que tres irán al experimental y tres al de control.
Esta técnica de control recibe el nombre de diseño de bloques aleatorios. Recordad que los bloques se hacen en una variable extraña, cuyo efecto sobre la dependiente deseamos controlar.
¿Qué variable elegir? Debe ser una variable que influya con seguridad sobre la dependiente y que en el experimento no va a ser manipulada. Puesto que la variable que se elige para bloquear es relevante para explicar las variaciones en la dependiente, tampoco conviene que todos los participantes estén igualados en valor. No hubiera sido bueno que los dos grupos fueran sólo de chicas. De hacerlo así, los participantes no representarían bien al resto de la población. Deseamos que se dé todo el rango natural de sus valores. Si, como en nuestro ejemplo, existen chicos con trastornos alimentarios, la variable género debe tener sus dos aspectos representados. Se utiliza control por equilibrado y no por igualación.
  • En la variable extraña, objeto del control, elaboraremos tantos bloques como queramos -cuantos más bloques, más control.

  • Los bloques pueden tener todos la misma medida o diferente, como en nuestro caso. Dependerá de la naturaleza de la variable.

  • A continuación, aplicamos a cada bloque la técnica de asignación aleatoria para repartir a los integrantes del bloque en las condiciones experimentales; de este modo, el resto de las variables asociadas a las diferencias individuales quedarán controladas por equilibrio.

En definitiva, con la técnica de control de una variable extraña mediante bloques aleatorios en una variable extraña, conseguimos una mayor validez interna en el experimento, lo cual redunda en que sea más fácil poner de manifiesto la relación causal entre la independiente y la dependiente.

2.Experimentos con una variable independiente los mismos sujetos

2.1.Presentación de un caso

Os invitamos ahora a que proyectéis con nosotros la réplica de un experimento clásico de Eckman, Levenson y Friesen (1983) sobre el papel de las expresiones faciales en las emociones. Uno de los hallazgos de esta investigación fue que "poner caras" activando los músculos implicados en la expresión de emociones -pero sin nombrarlas- produce algunas respuestas fisiológicas como si se experimentaran las emociones de verdad.
En concreto, vamos a contrastar si las expresiones faciales ira, miedo y alegría conllevan unas tasas cardíacas (TC) superiores a la tasa cardíaca asociada a la expresión de alegría.
Nuestra variable independiente es la expresión facial con los tres niveles especificados. La forma de operativizarla será siguiendo las instrucciones para activar adecuadamente los músculos que forman cada expresión. Por ejemplo, para representar el miedo hay que juntar y elevar las cejas, elevar los párpados y estirar la boca horizontalmente. La variable dependiente la mediremos con un pulsómetro.
Si seguimos la estrategia del diseño de grupos aleatorios necesitaremos tres grupos de participantes equivalentes en su TC y con habilidad similar para controlar sus músculos faciales. La TC es una medida fisiológica que, dentro de la normalidad, presenta grandes diferencias individuales, lo cual nos obligaría a formar grupos grandes de participantes para que la variabilidad de la TC, antes de empezar, quede equilibrada entre las condiciones experimentales. Adicionalmente, encontrar grupos de personas -actores- con similares habilidades obligaría a evaluarlos previamente. Deberíamos, además, controlar todas las variables que pueden afectar a la TC: edad, género, práctica deportiva habitual, posibles enfermedades, etc. En definitiva, este diseño para este propósito no es el mejor.
Lo adecuado aquí es utilizar el mismo grupo de actores para representar cada una de las tres emociones. De esta forma los tres "grupos" son absolutamente equivalentes: de hecho son el mismo grupo en tres situaciones. Una vez conseguidos los participantes (por ejemplo, en el último curso de una escuela de arte dramático) nos aseguraremos de que son capaces de ejecutar correctamente las instrucciones. Tendremos especial cuidado en no decirles el propósito de la investigación ni nombrar ninguna de las tres emociones, para evitar que utilicen imágenes o recuerdos para ayudarse en la expresión. Recordad que el objetivo es ver el efecto de la configuración muscular, sin etiqueta emocional.
¿Por qué emoción empezamos? ¿Os parece que empecemos por ira, luego miedo y por último alegría? (de esta forma acabaréis el experimento más "contentos"), o ¿ponemos la alegría en medio para que no haya tanta expresión negativa junta? ¿Os parece que da igual o intuís que deberíamos tener en cuenta el orden? Si os sentís inclinados hacia la última opción, habéis acertado. En esta investigación, es importante controlar el orden en que se ejecutan los tres niveles de la variable independiente. Es posible que cueste más representar ira después de alegría que representarla después de miedo; aunque esta tarea es muy corta, quizá un ligero cansancio -en la última representación- afecte a la TC; o un ligero nerviosismo en la primera. Es más, deberíamos asegurarnos de que cuando se comienza una expresión la TC ha vuelto al mismo nivel de antes de la primera expresión, ya que la TC tarda unos minutos en recuperarse después de pasado el estímulo que la incrementó. Teniendo en cuenta lo anterior, decidimos que las tres expresiones sean representadas en estos tres órdenes elegidos, de entre los posibles:
  • ira-miedo-alegría

  • alegría-ira-miedo

  • miedo-alegría-ira

Si os fijáis, la ira se representa una vez la primera, otra vez después de la alegría y otra después del miedo: se representa en todas las posiciones posibles. Lo mismo ocurre con las otras dos "caras". Con esta estrategia de controlar el orden de presentación de los niveles de la variable independiente conseguimos que todos los valores de la TC que registramos cuando se pone una cara determinada se hayan producido en las mismas condiciones.
Supongamos que cada expresión toma quince minutos de preparación y medio minuto para observar el cambio de la TC. Podemos dejar un minuto para que la TC vuelva a su nivel inicial y cinco -con una distracción preparada- para empezar una nueva serie de tres. En total la tarea durará veinte minutos y medio, teniendo en cuenta que diez minutos serán de descansos. Un tiempo que parece razonable para un actor.
Realizamos la tarea de manera individual, en el mismo local, en el mismo momento del día, con el mismo instructor y teniendo cuidado de que los actores no vean el reloj con las pulsaciones. Agrupamos todos los valores medidos para cada una de las tres expresiones faciales y calculamos su media. Supongamos que se han obtenido los resultados siguientes:
4/figura3_01.gif
Con los resultados anteriores podemos decir que hemos conseguido repetir los resultados de Eckman y otros (1983). Estos resultados nos dicen que nuestro cuerpo nos envía señales que están interpretadas de acuerdo con la emoción que está experimentando. Es algo así como si nuestra conciencia nos dijera: "fíjate qué triste estás que estás llorando". Comportarnos "como si estuviéramos bien" parece contribuir a sentirnos bien.

2.2.Ventajas de experimentar con los mismos sujetos: control y economía. Inconvenientes: aprendizaje, fatiga, motivación y práctica

Como recordaréis de los núcleos anteriores, la mayor preocupación del investigador cuando desea formar los grupos de participantes para que respondan a cada una de las condiciones experimentales es que estos grupos estén lo más equilibrados posible. Para conseguirlo, primero controlaba el máximo de variables extrañas y después utilizaba el azar para generar los grupos y así equilibrar las diferencias individuales. Casi todas estas preocupaciones desaparecen si podemos hacer que el mismo grupo de participantes pase por todas las condiciones. Pensad un momento en nuestro caso: si tenemos tres actores con un control excepcional de sus músculos faciales, esos mismos tres estarán equilibrados cuando les pidamos que muevan los músculos del miedo, los de la ira y los de la alegría. El posible efecto incrementador de su habilidad se mostrará por igual en todas las condiciones y no alterará las comparaciones de los resultados. Pensad que el ideal es que si los niveles de la variable independiente producen el mismo efecto, entonces las respuestas de los grupos de sujetos a los distintos niveles sean iguales. Cuando los sujetos que responden a las distintas condiciones son distintos, conseguir esto es trabajoso. Cuando son los mismos sujetos, casi podemos asegurar que se consigue. Por lo tanto, si la TC del mismo grupo de actores es distinta ante las diferentes solicitudes musculares, eso querrá decir que la única causa del cambio será el grupo muscular activado.
El control de las variables extrañas asociadas a las diferencias individuales es la ventaja mayor pero no la única. Conseguir participantes para las investigaciones no siempre es fácil (aunque es más fácil cuando sirven los estudiantes de la propia facultad), y conseguir "buenos" participantes, menos. Por eso, con esta lógica intrasujetos, es mucho más fácil porque se necesitan menos; es más económico.
Utilizar los mismos participantes para todas las condiciones experimentales es la mejor forma de detectar la acción de la variable independiente.
Si es mejor para el control y más económico, ¿por qué no se hacen todos los diseños con los mismos participantes? Porque también existen grandes impedimentos. Empecemos por el primero. ¿Sabéis conducir? Suponemos que sí (si no, elegid otro contexto).
Sigamos suponiendo: leéis un artículo en la prensa donde se refiere cómo un revolucionario método para aprender a conducir consigue reducir los suspensos en el primer examen a la mitad y, por si fuera poco, la formación adquirida es mejor. ¿Os animaríais a probarlo? Vuestra respuesta será que no. Ya no podéis pasar por la segunda condición de una variable independiente llamada métodos de aprender a conducir. Habéis aprendido. Ya no podéis volver a la situación anterior (no podemos bañarnos dos veces en las aguas del mismo río). Repasemos nuestro experimento. ¿Aprenden nuestros actores de una condición a la siguiente? No, puesto que no hay una modificación sustancial en su organismo que les haga acometer la siguiente tarea más eficazmente.
Por tanto, cuando se produzca aprendizaje en alguna de las condiciones experimentales será imposible aplicar la lógica intra.
Vayamos con el segundo impedimento. Nos disponemos a comprobar si las formas A y B de un nuevo test de cálculo numérico son igual de difíciles. La población objetivo son estudiantes de cuarto de secundaria. Haciendo gala de nuestra mejor sonrisa aparecemos un viernes a las dos de la tarde, al finalizar la última clase del instituto. Les indicamos que sólo se tarda una hora y que... por supuesto, es voluntario quedarse. ¿Anticipáis el resultado? ¿Qué falló? Seguramente la motivación. Será mejor estrategia separar la aplicación de las dos formas, hacerlo entre horas y quizá premiar con un bote o, mejor, con una entrada para ir al cine.
Si volvéis unas pantallas atrás encontraréis que en el diseño de nuestro experimento de expresión facial nos preocupaba la duración total. En concreto decíamos: "en total la tarea durará veinte minutos y medio, teniendo en cuenta que diez minutos serán de descansos. Un tiempo que parece razonable para un actor". Esta preocupación era para evitar que la fatiga se acumulase al final del experimento y afectara a los resultados. Antes de hacer el experimento, habrá que preverlo. Si no tenemos información previa, lo mejor será hacer un experimento piloto (un experimento de prueba) para obtener información que permita mejorar el diseño definitivo.
Las tres amenazas anteriores (aprendizaje, motivación y fatiga) deberán ser analizadas antes de llevar a cabo el experimento con los mismos sujetos, ya que si se da alguna de las tres amenazas el experimento quedará invalidado.
Existen otras dos amenazas que se producen durante la realización del experimento y a las que debe estar atento el investigador. Estas dos amenazas son la persistencia y la práctica.
Recordad cómo entre una expresión y la siguiente dejábamos pasar medio minuto para que la TC volviera a la normalidad; si no lo hubiéramos hecho así, al empezar la expresión siguiente el incremento de la TC se sumaría al provocado por la condición anterior. Si la expresión de ira hace aumentar diez pulsaciones y -sin esperar a que bajen- a continuación solicitamos la expresión de alegría -que hace aumentar dos pulsaciones-, la medida que registraremos para la alegría será, falsamente, de doce. Se ha producido un efecto de persistencia.
Por lo tanto, al comenzar una condición experimental tendremos que asegurarnos de que los efectos provocados por la condición aplicada anteriormente han desaparecido.
Esta precaución es especialmente pertinente cuando se investiga con sustancias que producen alteraciones en el organismo, como medicinas, drogas, dietas alimenticias, etc.
La persistencia a veces produce un cambio en la condición siguiente que no es posible reequilibrarlo con la ordenación inversa: en estos casos se habla de persistencia diferencial, que quiere decir que pasar del nivel uno al dos no es igual que pasar del nivel dos al uno. Observad la secuencia siguiente: aceite caliente-huevo-sal. Y ahora: sal-huevo-aceite caliente. Los efectos acumulados de la ordenación no son reversibles. Cuando esto ocurre, se considera que se ha alterado la naturaleza del experimento y que no es válido.
La última amenaza que se produce siempre -en mayor o menor cuantía- es el efecto derivado de repetir varias veces tareas parecidas. No es lo mismo responder a una condición en primer lugar que hacerlo en último. Siempre habrá una ligera diferencia debida a la práctica que se lleva realizada. Recordad cómo solucionábamos esta dificultad con las expresiones faciales: hacíamos que cada expresión se realizara en cada una de las posiciones posibles, 1.ª, 2.ª y 3.ª.
Ésta es la técnica que se utiliza para contrarrestar el efecto de la práctica: controlar el orden de presentación.
En el núcleo siguiente presentamos varias de estas técnicas de control.
Antes de seguir, os sugerimos que os familiaricéis más con este tipo de experimentos realizando la actividad 3.2 (2) .

2.3.Tipos de diseños para controlar el efecto de la práctica: aleatorización simple; aleatorización en bloques; reequilibrado y cuadrado latino

Si ya habéis realizado la actividad 3.2 os habréis dado cuenta de que para poder obtener información de cada uno de los niveles de procesamiento necesitamos hacer varias presentaciones de cada uno de los niveles de la variable independiente. ¿Qué pasaría si hacemos una sola pregunta en cada una de las condiciones? Lo más probable es que se recordaran las tres, no importa el nivel de procesamiento al que se hubieran procesado. Este tipo de investigación necesita muchas repeticiones y -afortunadamente- cada una consume muy poco tiempo. Cuando se dan estas circunstancias, para controlar el efecto de la práctica es suficiente con hacer una ordenación aleatoria simple del total de las presentaciones. Por ejemplo, en la actividad 3.2 tenemos tres niveles de la variable independiente; deseamos hacer seis repeticiones de cada nivel; en total tendremos dieciocho presentaciones. La apariencia final será el resultado de sortear el orden para esas dieciocho presentaciones. De este modo, la práctica se va repartiendo de manera aleatoria para cada una de las condiciones experimentales.
Si el número total de estímulos no es grande, o si no queremos confiar al azar el reparto de la práctica, se pueden ir haciendo ordenaciones aleatorias en bloques. Cada bloque contendrá el total de los niveles de la variable independiente. Por ejemplo, si la variable independiente tiene tres niveles (A, B, C) cada bloque tendrá tres presentaciones y éstas serán obligatoriamente los tres niveles de la variable. El orden de estas tres presentaciones para el primer bloque se hará mediante el azar: vg. B-C-A. Después prepararemos un segundo bloque siguiendo la misma lógica del primero; volvemos a sortear el orden para el segundo bloque: vg. C-B-A; y así sucesivamente hasta completar tantos bloques como el número de repeticiones que deseemos.
En las clases presenciales que impartimos en la UAM los estudiantes están divididos en dos subgrupos para hacer las prácticas. Al acabar un tema, el subgrupo "uno" debe tener preparado su trabajo para el "día de prácticas", que es uno a la semana. Hasta la semana siguiente no lo presentará el subgrupo "dos". Para evitar que se enmascare un efecto extraño al hecho de ser los primeros en exponer al final de cada tema (menos tiempo, no conocer las correcciones hechas a los demás, etc.), al cambiar de tema el orden de las prácticas se reequilibra: primero el subgrupo "dos", y a la semana siguiente el "uno". La comprobación de si conseguimos controlarlo efectivamente la hicimos contrastando, al final de curso, que los dos subgrupos sacaron notas similares.
Cuando la variable independiente tiene dos niveles y las tareas que tienen que realizar los participantes son largas, la técnica adecuada es el reequilibrado.
En el diseño con reequilibrado se busca que la descompensación (desequilibrio) que produce una ordenación determinada de las condiciones experimentales sea compensada (reequilibrada) con la ordenación simétricamente inversa. Cuando son dos niveles (A, B) esto se consigue fácilmente: la ordenación A-B es reequilibrada con la ordenación B-A. En este diseño, como se sabe cómo se respondió a A cuando se presentó en primer lugar y cuando se presentó en segundo lugar, -lo mismo para B- puede calcularse el efecto de responder "en primer lugar" y responder "en segundo lugar". Conocer matemáticamente este efecto ayuda a dejar más aislado y más claro el efecto debido a la variable independiente. Un ejemplo de control por reequilibrado lo tenéis al final de este bloque de conocimiento en el caso 3.2 (3) .
Cuando el investigador tiene una variable independiente con más de dos niveles y desea que se produzcan el mínimo de repeticiones de cada nivel, entonces la estrategia que tiene que seguir es que cada nivel se presente una vez en cada posición posible. Esta estrategia recibe el nombre de cuadrado latino. Ésta es la estrategia que seguimos en la presentación de las emociones:
Posiciones
1.º
2.º
3.º
Ordenación 1
Ira
Miedo
Alegría
Ordenación 2
Alegría
Ira
Miedo
Ordenación 3
Miedo
Alegría
Ira
Hay otra forma de hacer la presentación en cuadrado latino con estas tres emociones. Si os animáis a intentarlo podéis ver la solución (5) .
(5) Observad que las filas de ordenaciones no importa dónde se coloquen, lo que es importante es que cada expresión aparezca en cada una de las posiciones posibles.
Posiciones
1.º
2.º
3.º
Ordenación 1
Ira
Alegría
Miedo
Ordenación 2
Miedo
Ira
Alegría
Ordenación 3
Alegría
Miedo
Ira
Una de las ventajas adicionales de este diseño en cuadrado latino es que en el análisis de datos posterior puede calcularse la cuantía del efecto debido al orden.
En una investigación en la que cada una de las condiciones consume poco tiempo, como la nuestra, todos los participantes pueden pasar por todas las ordenaciones planeadas. Se dice entonces que el diseño es completo. Cuando no es posible, se divide -al azar- a los participantes en subgrupos, de forma que cada subgrupo responda a los niveles de la variable en una de las ordenaciones planeadas. En nuestro caso, si fuera muy largo, un tercio de los actores haría las tres expresiones en la ordenación "ira-miedo-alegría", otro tercio en la ordenación "alegría-ira-miedo" y el último tercio en la ordenación "miedo-alegría-ira". Se dice entonces que el diseño está incompleto.
Fijaos en que, aunque todos los participantes no responden a las condiciones en todas las posiciones posibles, sí está asegurado que todos los participantes responden a todas las condiciones; cada ordenación contiene, por definición, todos los niveles (de no ser así, el diseño no podría llamarse con los mismos sujetos). Esta misma consideración se hace cuando el diseño es reequilibrado, con dos niveles. Puesto que hay dos ordenaciones posibles, los participantes pueden hacer las dos o, divididos en dos subgrupos, realizar cada subgrupo una ordenación.
Si deseáis leer otro ejemplo de un experimento con los mismos participantes, podéis encontrarlo en el caso 3.2 (3) .

3.Experimentos con un solo sujeto

3.1.Presentación de un caso. El control, la intervención y la retirada. Tipos de diseños con un solo sujeto

En el ámbito de la psicología clínica surge la necesidad de conocer la eficacia de una determinada terapia pero no se dispone de un grupo de pacientes similares con los que plantear una estrategia experimental con distintos o los mismos sujetos. Sólo hay un paciente con el que experimentar... siempre y cuando se consiga el objetivo primordial: ayudarle a cambiar su conducta. En estos entornos se hace necesario un plan de investigación experimental que tenga un solo participante. Empecemos viendo un caso de lo que estamos diciendo.
Ejemplo
Uno de los programas usados en modificación de conducta consiste en premiar -reforzar positivamente- una conducta mediante la entrega de fichas, las cuales tienen un determinado valor acordado. La tesis que subyace es que la conducta reforzada positivamente tenderá a repetirse. Las fichas tienen atractivo para el paciente porque, por ejemplo, pueden cambiarse por productos de la cafetería del hospital. Adicionalmente puede reforzarse negativamente -no entregando fichas- una conducta que se desea eliminar.
Wincze, Leitenberg y Agras (1972) reforzaron, mediante fichas, "no hablar de cosas fantasiosas", en un enfermo crónico de esquizofrenia paranoide. El periodo de aplicación de la terapia de conducta fue durante las entrevistas diarias que el terapeuta tuvo a lo largo de veintiún días con el paciente. Durante los siete primeros días se limitó a anotar los comentarios fantasiosos, sin hacer nada. En los siete días siguientes aplicó el programa de refuerzo mediante fichas. Comprobado que el porcentaje de comentarios fantasiosos había disminuido, en el periodo de los siete días siguientes volvió a una situación similar a la de la línea base. Como podemos observar en la siguiente figura, cuando retiran el sistema de refuerzos al enfermo, éste vuelve a hacer más comentarios fantasiosos.
4/figura3_02.gif
Una vez que comprobaron que el sistema de refuerzos mediante fichas era la causa de la disminución de la conducta indeseada, a partir del día 22, volvieron a la terapia para reducir los comentarios fantasiosos.
En este caso pueden apreciarse los elementos característicos de los experimentos con un solo sujeto: en primer lugar el establecimiento de la línea base, la fase de intervención y la fase de retirada.
En el caso presentado, cuando los investigadores anotan la cantidad de pensamientos fantasiosos que tiene el paciente, lo que están haciendo es establecer un control de su conducta. Veamos por qué. Si tuviéramos un grupo de enfermos, podríamos dividir la mitad al azar para ser tratados y la otra mitad para que sirviera de control. En el grupo de control habrá algunos pacientes con más pensamientos fantasiosos y otros con menos. Al investigador, esto no le preocupa mucho, porque lo que comparará después será la media del grupo. Es algo así como establecer el enfermo prototípico.
Cuando tenemos un solo paciente nos arriesgamos a que la medida de control que tomemos no represente bien su estado. Por ejemplo, si sólo tomamos la medida del día 5 nos encontramos un 75% de ideas fantasiosas, mientras que si lo hubiéramos hecho el día 7 habríamos registrado un 65%. Un investigador alocado podría pensar que se está produciendo una recuperación natural y que no hace falta intervenir. Sin embargo, cuando tenemos todos los registros de la semana -la línea base- nos damos cuenta de que esa disminución forma parte de la variación natural de la conducta.
El investigador necesita saber cómo es la conducta durante un periodo de tiempo antes de ser tratada, para poder interpretar después los posibles cambios de ésta. Si observa ahora los registros durante la fase de intervención, observará que se produce todavía una variación más grande. Sin embargo, viendo todas las puntuaciones, el terapeuta puede deducir que hay una tendencia media a la disminución del porcentaje de pensamientos fantasiosos: se pasa del 60% en el mejor de los días sin terapia a un porcentaje del 20% el último día de la semana con terapia. Viendo el conjunto de la fase de intervención, el experimentador interpreta que ese 20% no se debe a una variación natural, ni a una puntuación extrema, sino que es la evolución natural del paciente sometido a la terapia de modificación de conducta mediante fichas.
Antes de seguir queremos haceros notar cómo, aunque los nombres cambian, la fase de línea base coincide conceptualmente con una condición de control y la fase de intervención con la condición experimental.
En la primera hay un nivel nulo de la variable independiente, y en la segunda, un nivel "terapia X", cuyo efecto queremos comparar con el control. Por lo tanto, estamos dentro de la lógica experimental, aunque tengamos un solo participante.
En la práctica clínica, cuando se observa que un paciente mejora ostensiblemente, la terapia continúa hasta alcanzar un criterio óptimo fijado con anterioridad. Cuando a la práctica clínica se une la exigencia investigadora, es necesario añadir algo más. Es necesario poder contestar a otros colegas preguntas como las siguientes:
  1. ¿Hubo alguna circunstancia personal, en paralelo, que pudiera explicar la mejoría del paciente?

  2. ¿Se dio una especial empatía terapeuta-enfermo que explicara su recuperación?

  3. ¿No coincidiría la mejoría con el final de otoño, época mala para las enfermedades mentales?

  4. Por supuesto, ¿no habría un cambio en la medicación por esas fechas?

Si os fijáis atentamente, todas estas amenazas se enmascaran con la aplicación de la terapia y rivalizan con ella en la explicación de la mejoría. Algunas de ellas podrán ser rechazadas recopilando la información correspondiente. Pero otras no. Para poder rechazarlas todas es necesario ampliar la estrategia del experimento retirando la intervención. Si aparece un deterioro claro, coincidiendo en el tiempo con la retirada de la terapia, entonces podremos estar más seguros de adscribir el cambio de la conducta a la intervención del terapeuta. Si observáis los datos del paciente presentado, hay un deterioro claro que se aproxima a valores de la línea base inicial.
Suponemos que no os imagináis que una vez que se comprobó que la terapia de fichas ayudaba al paciente esquizofrénico la investigación acabó en fase de retirada. Una vez que los investigadores se han cerciorado de su efectividad vuelven al tratamiento hasta alcanzar su objetivo o hasta que la terapia alcanza su límite natural.
En el entorno de los diseños experimentales con un solo participante se ha desarrollado una terminología propia para hablar de forma simplificada de los diseños. Las fases sin tratamiento se designan con la letra A (aunque sea la primera de línea base), y las fases con tratamiento, con la B.
Así, Chudy, Jones y Dickson (1983) utilizaron un diseño AB para tratar una conducta fóbica. Se trataba de un niño de siete años que había sido agredido por un pastor alemán. Como consecuencia desarrolló una conducta fóbica hacia todos los perros, miedo a salir solo de casa y disminución de sus contactos con otros niños. Tras un periodo de veintiún días de línea base, se le entrenó en una desensibilización sistemática -modificada con imaginación emotiva, juego libre y modelado. Al finalizar la terapia, se observó que era capaz de acariciar un perro y que había aumentado el número de veces que salía solo de casa, así como el número de veces que se relacionaba con otros niños.
Este diseño AB seguramente no les pareció mal a los padres del niño, ya que el objetivo de su recuperación se cumplió. Sin embargo, a los investigadores nos parece que presenta amenazas a su validez. El plan recomendado tendría que ser un diseño ABAB. Con esta lógica de las letras, no es difícil entender los diseños que los investigadores de este campo han ido extendiendo. Si deseáis ver claves para ampliar la lógica de los diseños con un solo sujeto, activad el caso 3.3 (6) .
Las claves del control en los diseños con un solo sujeto son las series de medidas y la retirada del tratamiento.

4.Experimentos con más de una variable independiente: diseños factoriales

4.1.Presentación de un caso

En el momento de preparar este apartado nos hallamos sentados frente a la bahía de San José (Almería). Ha caído la noche y las luces del pueblo cercan el negro del mar fundido con el negro de un cielo sin luna. En este "contexto" hemos recordado un experimento de Godden y Baddeley (1975) sobre si se recuerdan mejor las cosas cuando se está en el mismo "contexto" en el que se estudiaron. Los contextos en que investigaron fueron tan sugerentes como "la playa" y "debajo del agua". Con estas ideas vamos a diseñar un experimento factorial que esperamos que os resulte atractivo. Pero vayamos despacio desde el principio. Nuestro objetivo es planear dos experimentos de una variable independiente, como los que hemos presentado hasta ahora. La novedad va a consistir en hacerlos de forma simultánea.
En el primero de ellos se va a poner a prueba la hipótesis siguiente: "si da lo mismo estudiar debajo del agua que en la playa, entonces el recuerdo posterior de lo estudiado será igual". A esta variable independiente la llamamos tipo de "contexto".
En el segundo experimento simultáneo se va a poner a prueba la hipótesis siguiente: "si el paso del tiempo debilita la huella en la memoria, una hora después de haber memorizado se recordará menos que inmediatamente después". A esta segunda variable independiente la llamamos demora.
La variable dependiente será el recuerdo mostrado en un examen, medida como el porcentaje de palabras reconocidas correctamente. Aunque en el texto hablemos de recuerdo para una mayor claridad, tendremos que entender siempre que se trata de reconocimiento; es decir, un par de minutos después (o una hora después) del tiempo dejado para memorizar, se les presentará a los participantes una lista con palabras en las que unas corresponderán a las memorizadas y otros serán de relleno. Lo que tendrán que hacer todos los grupos es marcar con un lápiz las palabras que coincidan con las presentadas inicialmente.
¿Dónde os gustaría preparar el próximo examen? ¿Qué os parece repasar el glosario de esta materia mientras cientos de fosforescentes castañuelas azules pasan a vuestro alrededor? ¿Preferiríais hacerlo al borde del agua mientras tomáis el sol? Veamos cómo distribuiríamos a los participantes para nuestros dos experimentos simultáneos: supongamos que hemos decidido aplicar la lógica del diseño de grupos aleatorios () , con distintos sujetos. Necesitaremos voluntarios para encuadrarlos en cada una de las cuatro condiciones () posibles:
  1. Contexto bajo el agua-recuerdo inmediato.

  2. Contexto bajo el agua-recuerdo demorado.

  3. Contexto en la playa-recuerdo inmediato.

  4. Contexto en la playa-recuerdo demorado.

Si deseamos tener diez personas por grupo necesitaremos un total de cuarenta. Repasando la lógica de los experimentos recordamos que todos ellos deberán estar igualados en las variables extrañas que pudieran afectar a la variable dependiente. ¿Creéis que cualquiera valdría para participar en la condición "bajo el agua"? Para algunas personas es una situación muy estresante. Por otro lado, si el grupo que estudia bajo el agua fuera de "buceadores habituales", y el que estudia en la playa de "no buceadores", alguien podría criticarnos que la variable extraña "buceo habitual" se podría enmascarar con la independiente "lugar de estudio"; la explicación es que como varía al mismo tiempo que la independiente podría explicar resultados favorables para los que estudian en la playa. Los podría explicar porque los que no buceamos habitualmente podríamos tener la memoria afectada por la acumulación de nitrógeno y rendir menos. Por lo tanto, para controlar esta variable, podríamos elegir a todos los participantes entre personas que bucean habitualmente. Suponed que tenemos los ciento cincuenta miembros de un club de buceo de L'Estartit (Gerona) dispuestos a participar. Seguimos controlando variables: dejamos fuera a los que tengan algún problema de salud actual; no discriminamos a nadie por edad; les pasamos un test de memoria verbal y nos quedamos con los que tienen valores en torno al 90% de la media poblacional y, por último, igualamos el número de varones y mujeres. Suponed que este número resulta ser cuarenta y cinco. Para dejarlo en cuarenta, sorteamos qué cinco se quedan fuera.
Ya tenemos a nuestros cuarenta voluntarios dispuestos a memorizar, bien en la playa, bien debajo del agua. A continuación tenemos que hacer la asignación aleatoria de los cuarenta buzos a las cuatro condiciones. En la tabla 3.1 presentamos un esquema con la distribución de los participantes por condiciones.
Tabla 3.1
Variable independiente: Demora
Inmediato
Una hora
Resultados Contexto
Variable
independiente:
Contexto
Bajo el agua
Diez participantes estudiarán bajo el agua y se les preguntará de inmediato.
Diez participantes estudiarán bajo el agua y se les preguntará una hora después.
% de palabras que reconocerán los que estudien bajo el agua.
En la playa
Diez participantes estudiarán en la playa y se les preguntará de inmediato.
Diez participantes estudiarán en la playa y se les preguntará una hora después.
% de palabras que reconocerán los que estudien en la playa.
Resultados
Demora
% de palabras que reconocerán los que sean preguntados de inmediato.
% de palabras que reconocerán los que sean preguntados una hora después.
Preparamos los materiales necesarios para la realización de la tarea, que consistirán, para los dos grupos submarinos, en una lista de treinta palabras escritas en pizarritas con suficiente tamaño y claridad para leerse debajo del agua. A cada buzo se le proporcionará una pizarrita que tendrá guardada en uno de los bolsillos del chaleco hidrostático. Por supuesto, comprobaremos que las botellas tienen la suficiente presión de aire -no queremos perder participantes de forma no aleatoria.
Para los dos grupos que memorizarán en la playa, dispondremos de la misma lista de palabras, pero esta vez escrita en cartones individuales. Para estos segundos grupos se dispondrá de la correspondiente crema para el sol.
También hay que prever una tarea de distracción de una hora para los grupos que realizarán la prueba de reconocimiento con una demora de una hora. Para los que estén en el agua, nada mejor que una placentera inmersión, sin bajar mucho -máximo quince metros-, para evitar que las posibles molestias de la descompresión puedan afectarlos. Para los que se queden en la playa, un partido de balonvolea puede cumplir el mismo objetivo. Observad que los dos grupos de demora deben hacer una actividad parecida, no podemos hacer que unos estén esquivando tiburones y los otros leyendo a Marsé.
Todos los grupos tratarán de memorizar el mayor número de palabras durante un tiempo de dos minutos. Dos minutos después se medirá el reconocimiento en los dos grupos sin demora. Sobre una lista de noventa palabras deberán marcar las treinta que reconozcan de la primera lista. Al cabo de una hora se procederá de la misma manera con los otros dos grupos.
Para situar los resultados utilizamos la planilla que aparece en la tabla 3.2, donde anotamos el porcentaje de palabras correctamente reconocidas, de promedio, por cada uno de los cuatro grupos. Hemos simulado unos resultados que aparecen en la tabla 3.2.
Tabla 3.2
Variable independiente: Demora
Inmediato
Una hora
ResultadosContexto
Variable
independiente:
Contexto
Bajo el agua
60%
En la playa
60%
Resultadosdemora
70%
50%
Vayamos ahora a comentar los resultados de cada experimento. Empecemos con el "contexto" en que se hace la tarea. Los resultados en la columna derecha de la tabla 3.2 nos dicen que da igual dónde se estudie: el grado de recuerdo (reconocimiento) de palabras es exactamente igual en la playa que debajo del agua.
Figura 3.3
Figura 3.3
Para la variable siguiente, "demora", los resultados nos dicen que, claramente, se recuerdan (reconocen) menos palabras cuando ha pasado una hora (datos de la última fila de la tabla 3.2).
Figura 3.4
Figura 3.4
Por lo tanto, si vemos este experimento factorial como dos experimentos de una variable independiente, tenemos que concluir lo siguiente:
  • Primero, el "contexto" donde se memoriza y recuerda no tiene incidencia en el reconocimiento posterior.

  • Segundo, la "demora", como el tiempo transcurrido entre la memorización y el recuerdo, sí es relevante. Son mejores los resultados inmediatos que los obtenidos una hora después.

Sin embargo, en los párrafos que siguen vamos a mostraros lo siguiente:
La mayor ventaja de un experimento factorial de dos variables es que obtenemos más información que la suma de la información de los dos experimentos de una variable implícitos.
¿De dónde se obtiene esta información extra? De las celdas que combinan la información de las dos variables independientes; de saber qué pasó, por ejemplo, con el subgrupo que estudió en la playa y al que, una hora después, se pidió que señalaran las palabras que reconocieran de la lista original. Para estudiar esta información necesitamos obtener las medias de los porcentajes de palabras reconocidas en cada una de las cuatro condiciones que se generaron. Esta información aparece ahora en la tabla 3.3.
Tabla 3.3
Variable independiente: demora
Inmediato
Una hora
ResultadosContexto
Variable
independiente:
Contexto
Bajo el agua
60%
60%
60%
En la playa
80%
40%
60%
Resultadosdemora
70%
50%
Para proceder al estudio de esta información debemos hacer dos representaciones gráficas, una para cada variable independiente.
A continuación disponéis de una herramienta que os enseña paso a paso cómo realizar las gráficas de los resultados factoriales. Para que el aprendizaje se complete, debéis acompañar las explicaciones con la realización de la gráfica con lápiz y en papel cuadriculado. Cuando lo deseéis, podéis activar la actividad 3.3 (7) .
Figura 3.5
Figura 3.5
Observando ahora los resultados de la variable "demora", combinada con "contexto" donde se memoriza, podemos concluir dos cosas:
  • La memoria -en términos de reconocimiento de palabras- se deteriora bastante (de 80% a 40%) al cabo de una hora, cuando se hace en el "contexto" de la playa (línea naranja).

  • La memoria -en términos de reconocimiento de palabras- no se ve afectada (de 60% a 60%) al cabo de una hora, cuando se hace en un "contexto" bajo el agua (línea azul).

Como consecuencia de lo anterior, el promedio (línea discontinua granate) no refleja correctamente lo que ocurrió en el experimento para la variable "demora". El promedio dice que la memoria de palabras reconocidas al cabo de una hora se deteriora, para el conjunto de los contextos; cuando en realidad sólo se produce descenso para los que estaban en la playa; para los que lo hacen todo debajo del agua no hay deterioro de la memoria en el plazo de una hora.
Cuando el promedio no representa adecuadamente a la variable independiente, no se debe interpretar.
Recordad lo de que "si yo me como dos salmones y un amigo mío ninguno, la media dice que cada uno nos hemos comido un salmón de promedio", lo cual es matemáticamente correcto, pero engañoso -sobre todo para mi amigo- y, por lo tanto, no nos sirve para nada. Esto quiere decir que cuando las dos líneas tengan la pendiente de signo diferente (uno hacia arriba y otro hacia abajo) o una sola línea horizontal, el promedio no es un buen resumen de lo que ocurre con ambas variables independientes y, por lo tanto, no se debe interpretar.
Pasemos ahora a representar en la figura 3.6 los datos desde el punto de vista de la otra variable: el "contexto". La situamos en el eje de las abscisas y representamos los valores de las cuatro condiciones, siguiendo todos los pasos explicados en la anterior variable independiente.
Figura 3.6
Figura 3.6
Observando ahora los resultados de la variable "contexto", combinada con "demora", concluimos dos cosas:
  • Si se pregunta inmediatamente después de memorizar, se reconocen más palabras (80% frente a 60%) cuando el "contexto" en que se realiza el reconocimiento es la playa (línea verde).

  • Si se pregunta una hora después de memorizar, se reconocen más palabras (60% frente a 40%) cuando el "contexto" en que se realiza el reconocimiento es bajo el agua (línea naranja).

Como consecuencia de lo anterior, el promedio de resultados del "contexto" (línea discontinua granate) no refleja correctamente lo que ocurrió en el experimento. El promedio indica que se producía el mismo grado de reconocimiento en la playa que debajo del agua. Se estaban compensando resultados opuestos: cuando se pregunta inmediatamente, se recuerda más en la playa, y cuando pasa una hora se recuerda más si se está debajo del agua.
Como comentario final podemos decir que, cuando interpretábamos los resultados correspondientes a dos experimentos de una VI -utilizando los promedios-, nos veíamos obligados a concluir que "en el plazo de una hora se aprecia un deterioro en la memoria" y que "se estudiara y recordara en el contexto que fuera, se recordaba siempre igual".
Estas conclusiones no eran correctas -como acabáis de ver- porque el sentido del promedio contradice el sentido de uno o los dos resultados parciales dentro de cada una de las variables independientes. Cuando se analizan los resultados desde la perspectiva factorial, podemos ver en detalle cómo han sido los resultados de las combinaciones de las variables independientes -además de los resultados promedios.
Por lo tanto, como regla general, cuando estemos ante un experimento factorial de dos (o más) variables independientes, habrá que comprobar si la acción de una variable permanece igual cuando se combina con los niveles de la otra variable independiente.
Cuando pase esto, diremos que no se ha producido interacción. Esto ocurre cuando las líneas son paralelas. Entonces podemos interpretar correctamente la acción de la variable independiente con sus resultados promedios.
Cuando la acción de una variable independiente sobre la dependiente se vea modificada cuando se combina con los niveles de la otra variable independiente, entonces diremos que se ha producido una interacción. Esto es, cuando las líneas no son paralelas.
Cuando se produce interacción, no podemos estar seguros de que el promedio represente bien los resultados parciales. Habrá que comprobarlo. En el caso con que hemos presentado este apartado ninguna de las dos variables independientes podía interpretarse apoyándose en sus valores promedios. Esto ocurría porque el promedio contradecía algún resultado o los dos resultados parciales, al tener las dos líneas pendientes de diferente signo.
Cuando son líneas paralelas no existe interacción y puede interpretarse el promedio. Cuando no son paralelas existe interacción y hay que comprobar si se puede interpretar el promedio: si sus pendientes tienen el mismo signo, sí que se puede hacer.
Por último, si estuviéramos redactando las conclusiones de esta investigación simulada, ahora deberíamos decir que se observa que en la playa se memoriza mejor si la memoria se va a poner a prueba de una forma inmediata. Esto podría explicarse porque es más cómodo, comporta menos estrés, y más familiaridad con los contextos de memorización habituales; descriptores que son las diferencias entre el contexto de la playa y el submarino.
Sin embargo, al cabo de una hora, en la playa se produce mayor olvido; recordar en el mismo contexto en que se estudió no ayuda mucho a los que memorizaron en la arena; para los que estudiaron bajo el agua, recordar en un contexto tan especial como en el que memorizaron, hace que una hora después se recuerde tanto como de forma inmediata. Es como si el entorno tan diferenciado y las condiciones fisiológicas especiales se asociaran a lo que memorizaban y después sirvieran de coadyuvantes en el recuerdo.
Fijaos que extraer conclusiones de modo parcial dentro de una variable independiente no hace perder fuerza a la investigación. Simplemente se concreta qué pasa bajo qué condiciones.
Todo esto lo expondremos de forma general y paso a paso en el subapartado siguiente.

4.2.Los elementos de un diseño factorial: la representación gráfica, los efectos simples, la interacción y los efectos principales

Un diseño factorial es un diseño en el que el investigador estudia simultáneamente dos (o más) variables independientes. En el caso presentado se estudiaban las variables independientes: "contexto" de memorización y tiempo de "demora" en el recuerdo.
En un diseño factorial completo se combinan todos los niveles de una variable con todos los niveles de la otra o las otras. En nuestro caso, los dos contextos de memorización se combinaban con los dos tiempos de demora. Esto se representa mediante la multiplicación del número de niveles de las variables independientes. En nuestro caso, 2 x 2.
Para comprender mejor los resultados de una investigación factorial se deben representar en una gráfica. En realidad, en dos, una para cada variable independiente.
Se empieza realizando una gráfica para cualquiera de las dos variables independientes. La variable independiente elegida la consideramos como "central" a efectos de representación. El carácter de central lo da el hecho de figurar en el eje de las abscisas. La otra variable independiente actúa como "condicionante", ya que la central actúa bajo sus condiciones.
En nuestro caso, si empezamos con la representación de la variable "demora", considerada como central, nos referimos a la figura 3.5. Después se realiza otra gráfica para la segunda variable independiente, considerada ahora como central. En nuestro caso, la gráfica para la variable "contexto", considerada como central, es la figura 3.6.
Una vez que tenemos las gráficas para cada una de las variables independientes, empezamos a estudiar cómo se comporta la variable cuando se combina con la otra.
A estos resultados parciales de la variable independiente, agrupados bajo las condiciones de la otra variable independiente, se les da el nombre de efectos simples.
En nuestro caso, analizamos la variable "demora" combinada con los niveles del "contexto" (figura 3.5).
Veamos: un efecto simple es el resultado representado en cada una de las líneas continuas. Un efecto simple de la demora: cuando se estudió bajo el agua, que está representada por la línea verde. El otro efecto simple de la demora: cuando se estudió en la playa, que está representada por la línea naranja.
Se les llama efectos simples porque es como si dividiéramos el experimento de una variable en dos experimentos simples.
En el primer experimento simple se investiga el efecto de la "demora", condicionado a que todos los participantes estudien bajo el agua.
En el otro experimento simple se investiga el efecto de la "demora", condicionado a que todos los participantes estudien en la playa.
Cuando ya tenemos los dos efectos simples representados y estudiados, el siguiente paso es comparar cómo son entre sí los dos efectos simples.
Una manera operativa de hacerse esta pregunta es reformularla como ¿son paralelas las líneas que representan a los efectos simples?
Cuando las líneas que representan los efectos simples no son paralelas, como es el caso de nuestro experimento, se dice que las dos variables independientes interactúan sobre la dependiente.
Se dice que hay interacción cuando la manera de actuar de una variable independiente cambia dependiendo del nivel de la otra variable independiente con la que se combina.
En nuestro caso, se olvida más al cabo de una hora que cuando se memoriza en la playa. Éste es el primer efecto simple. En el otro caso pasa algo diferente: cuando se hace bajo el agua, se recuerda igual en el momento que al cabo de una hora. En definitiva, los efectos simples de la variable "demora" son distintos. Por lo tanto, decimos que se ha producido interacción.
Si las líneas que representan los efectos simples de una variable independiente no son paralelas, entonces nos indica que existe interacción entre las variables independientes.
¿Tiene alguna repercusión el hecho de que exista interacción entre las variables? Tiene dos repercusiones:
  • Es obligatorio interpretar cada efecto simple por separado, ya que son diferentes.

  • Sólo puede interpretarse el efecto promedio -llamado principal- de la variable independiente si se da la circunstancia de que las dos líneas que representan los efectos simples tengan una pendiente del mismo signo. En nuestro caso, ya está suficientemente dicho que no puede interpretarse el efecto principal.

¿Puede darse un caso donde haya interacción y el efecto principal pueda interpretarse? Sí, puede darse; veámoslo con un ejemplo gráfico en la figura 3.7.
Figura 3.7
Figura 3.7
Para profundizar más sobre los resultados de una investigación factorial representada gráficamente, podéis realizar la actividad 3.4 (8) .
(8) Actividad 3.4

4.3.La interpretación de los resultados factoriales. Generalización a más variables y a los cuasi experimentos

En el subapartado anterior ya hemos expuesto los conceptos de efectos simples, interacción y efecto principal de una variable independiente. Parece intuitivo que al estudiar los resultados de la segunda variable independiente los apliquemos de la misma forma: comenzaremos estudiando cómo son entre sí los efectos simples en la gráfica de la variable "contexto". En nuestro caso, se trata de la figura 3.6.
Como podemos observar, las líneas no son paralelas y, por lo tanto, deducimos que hay interacción.
Si se ha detectado interacción en el análisis de la primera variable independiente, necesariamente se detectará interacción en el análisis de la segunda variable independiente.
Puesto que hay interacción, interpretamos cada uno de los efectos simples por separado. En nuestro caso, para el primer efecto simple -línea verde-, diremos que memorizar en la playa ayuda al recuerdo si el examen se hace de inmediato; respecto al segundo efecto simple -línea naranja vivo- diremos que memorizar en la playa hace que se olvide más al cabo de una hora.
Con esto se termina el estudio de la variable independiente "contexto".
En contra de cómo se presenta en la mayoría de los textos, que empiezan con un caso sin interacción y luego se va complicando hasta que uno deja de leer, nosotros hemos seguido la estrategia opuesta: hemos optado por lanzaros a la piscina primero y, una vez dentro, decir cómo hay que hacer para no hundirse. La razón es que no debéis olvidar que:
Siempre se debe empezar por el estudio de la interacción.
Y cuando os encontréis con que hay interacción porque las líneas de los efectos simples no son paralelas, debéis comprobar si la semejanza de las pendientes permite interpretar el efecto principal, porque:
Cuando los efectos simples de una variable independiente no son del mismo signo no se puede interpretar el efecto principal.
Si habéis llegado hasta aquí, ahora os resultará sencillo entender una gráfica donde se presenta una situación sin interacción. Los casos sin interacción son más simples, ya que las variables se comportan de la misma manera, se combinen como se combinen con los niveles de la otra variable.
Figura 3.8
Figura 3.8
A continuación presentamos una guía resumen para estudiar correctamente todos los resultados obtenidos después de una investigación factorial con dos variables:
1. Obtener las medias de la variable dependiente en cada una de las (2 x 2) condiciones.
1.1. Disponer las medias en una tabla de contingencia de 2 x 2.
2. Realizar una gráfica para cada variable independiente, como variable central (una variable es central cuando se representa en el eje de abscisas).
3. Estudiar la primera variable independiente.
3.1. Comparar las líneas que representan los efectos simples de la variable.
3.1.1. Si son paralelas, no hay interacción.
a) Estudiar directamente el efecto principal de la variable.
3.1.2. Si no son paralelas, hay interacción.
a) Estudiar cada efecto simple por separado.
b) Se podrá estudiar el efecto principal sólo si son iguales los signos de las pendientes de las líneas que representan los efectos simples.
4. Estudiar la segunda variable independiente.
4.1. Comparar las líneas que representan los efectos simples de la variable.
4.1.1. Si son paralelas no hay interacción. Debe dar lo mismo que en la primera.
a) Estudiar directamente el efecto principal de la variable.
4.1.2. Si no son paralelas, hay interacción.
a) Estudiar cada efecto simple por separado.
b) Podrá estudiarse el efecto principal sólo si son iguales los signos de las pendientes de las líneas que representan los efectos simples.
El caso con que iniciábamos este bloque temático, y sobre el que hemos desarrollado los conceptos, es el más simple posible (2 x 2).
Si tuviéramos un caso en que una de las variables independientes tuviera 3 niveles y la otra tuviera 4 niveles (3 x 4), en una gráfica aparecerían 3 líneas con cuatro puntos y en la otra 4 líneas con tres puntos. Estas líneas no tienen por qué ser rectas. Esto significa que el concepto gráfico de pendiente –tan útil para los diseños 2 x 2– deberá sustituirse por el de perfil.
No obstante, lo podemos imaginar tan extenso como queramos, por ejemplo, podríamos tener una investigación con el siguiente esquema:
VI1 (3 niveles); VI2 (2 niveles); VI3 (5 niveles);
La manera de indicarlo sería:
se trata de un diseño factorial 3 x 2 x 5
Los diseños factoriales pueden tener variables independientes con un tratamiento intersujetos, intrasujetos o cualquier combinación posible entre ambas. También podemos encontrarnos con factoriales donde todas las variables sean manipuladas, dando lugar a experimentos; o todas no manipuladas, dando lugar a cuasi experimentos, o las posibles mezclas de ambas.
Cuando lo deseéis, tenéis a vuestra disposición otro experimento factorial, el caso 3.5 (10) .
(10) Caso 3.5
Ejercicio físico y depresión
¿La gente más animada es la que hace ejercicio físico? o ¿la gente que hace ejercicio físico es la más animada? Mediante una metodología de investigación con encuestas sólo podemos constatar que se da una relación alta y positiva entre la práctica de ejercicio físico moderado y el estado de ánimo moderado. No podemos saber qué es la causa de qué. Para contestar a esta pregunta necesitamos una metodología experimental. Necesitamos poder manipular alguna de las dos variables. Esto fue lo que hicieron McCann y Holmes (1984). Eligieron manipular el nivel de ejercicio aeróbico. Para que su posible influencia fuera más notable decidieron trabajar con un grupo de chicas universitarias con una leve depresión. Si el ejercicio aeróbico mejora el estado de ánimo, el indicador de depresión mejorará. Adicionalmente, quisieron probar si un suplemento polivitamínico en la dieta producía elevación del estado de ánimo. Para poner a prueba ambas hipótesis hicieron el diseño experimental siguiente, factorial 2 x 2. La variable "grado de ejercicio aeróbico" fue manipulada intersujetos, en grupos aleatorios. De entre el total de las participantes, distribuidas por asignación al azar, un grupo no haría ejercicio (el control) y el otro lo haría (el experimental). La variable "ingesta de vitaminas" fue manipulada intersujetos, en grupos aleatorios. Por lo tanto, la mitad -al azar- del grupo experimental tomaría vitaminas y la otra mitad no. Del mismo modo, -al azar- la mitad del grupo control tomaría vitaminas y la otra mitad no. En la figura 3.9 presentamos unos datos similares a los encontrados por los investigadores, dos meses después de seguir los distintos planes.
Figura 3.9
Figura 3.9
Resultados del ejercicio aeróbico y la ingesta de vitaminas sobre el nivel de depresión de una muestra de chicas, después de sesenta días. Variable central representada: realización de ejercicio aeróbico
Figura 3.10
Figura 3.10
Resultados del ejercicio aeróbico y la ingesta de vitaminas sobre el nivel de depresión de una muestra de chicas, después de sesenta días. Variable central representada: ingesta de vitaminas.

En la figura 3.9 hemos representado como variable central la realización de ejercicio aeróbico. Como podemos observar, no se produce interacción entre las dos variables: las dos líneas que representan los efectos simples son paralelas. En consecuencia, podemos interpretar el efecto principal de la variable independiente. Podemos concluir que el ejercicio físico aeróbico produce mejora en el estado de ánimo de las participantes, tras sesenta días de realización.
En la figura 3.10 representamos como variable central la ingesta de vitaminas.
Como podemos observar en la figura 3.10, ya se trate del grupo que hace ejercicio o del que no hace, las personas que toman vitaminas no se diferencian de las que no las toman, en cuanto a sus valores de depresión.

Actividades

Las actividades de este módulo didáctico deben realizarse en la versión web del material.