Metodologías descriptivas II: la observación

  • Orfelio G. León García

    Doctor en Psicología. Profesor titular del Área de Metodología de las Ciencias del Comportamiento de la Universidad Autónoma de Madrid.

  • Ignacio Montero García-Celay

    Doctor en Psicología. Profesor titular del Área de Metodología de las Ciencias del Comportamiento de la Universidad Autónoma de Madrid.

PID_00215494

Objetivos

  1. Discernir las características de la observación científica.

  2. Conocer y distinguir diferentes formas de plantear estudios mediante la observación.

  3. Aprender una secuencia de pasos para la elaboración de un código.

  4. Conocer y distinguir los diferentes tipos de medida derivables de la observación.

  5. Conocer diferentes conceptos de fiabilidad y validez.

1.La observación al servicio de la psicología científica

1.1.Presentación de un caso

¿Viajáis mucho en avión? Si no lo hacéis, os podemos asegurar que las terminales de los grandes aeropuertos internacionales son lugares en los que pueden observarse gran cantidad de curiosidades relativas al comportamiento humano. No vamos a hacer una lista de las que más nos llaman la atención. Simplemente os vamos a contar una historia que se desarrolla en la zona de llegadas. Allí se producen las conductas propias de personas que se encuentran después de haber viajado grandes distancias. Turnbull, Stein y Lucas (1995) consideraron que éste era el lugar idóneo para observar el modo en que la gente se abraza cuando tiene un encuentro emotivo.
Para que entendáis las razones que tenían estos investigadores sudafricanos para elegir ese contexto de investigación necesitamos contar más cosas. Estaban interesados en estudiar el modo en que la especialización hemisférica puede llegar a explicar algunos de los comportamientos propios de las relaciones emocionales entre humanos. Por ejemplo, parece constatado que, tanto entre los humanos como entre los primates superiores, las madres -y los padres, cuando se animan a ello- sostienen a sus bebés con el brazo izquierdo. Una primera razón aducida por los estudiosos del tema fue que eso permitiría liberar la mano derecha, cuya predominancia está más extendida. Sin embargo, se ha constatado que no hay una correlación sistemática entre ser diestro y sostener al bebé con la izquierda, y ser zurdo y sostenerlo con la derecha. Otra explicación más reciente aduce que la razón para que el bebé sea sostenido con el brazo izquierdo radica en que es el hemisferio cerebral derecho el encargado de procesar la información de tipo emocional. Así, la madre utilizaría sus receptores visuales y sensoriales del lado izquierdo (que son los que llegan más rápidamente al hemisferio derecho) para la tarea de transmitir cuidado y cariño a su bebé y percibir sus expresiones y necesidades de forma más eficiente y rápida.
Turnbull, Stein y Lucas (1995) hicieron la conjetura siguiente: si es cierto que a los bebés se les sostiene con el brazo izquierdo debido a la especialización hemisférica, toda conducta que implique un procesamiento emocional y necesite una lateralización debería mostrar también una clara predominancia izquierda. ¿Se os ocurre en qué conducta pensaron que cumpliera estos requisitos? Exacto, los abrazos implican procesamiento emocional y suelen conllevar una lateralización. (¿Por qué lado cruzáis la cabeza con vuestra pareja cuando la abrazáis? Si no lo recordáis ya tenéis otra razón más para abrazarla en vuestro próximo encuentro...)
Por eso, se fueron al aeropuerto internacional más próximo a su universidad: para observar cómo se abraza la gente.

1.2.Observación científica: sistemática y replicable

Ahora bien, eso de ir por los aeropuertos espiando el modo de abrazarse de los viajeros no parece una tarea muy propia de investigadores científicos. Suena más cercano al tipo de tareas que llevan a cabo los periodistas de los programas televisivos "del corazón". ¿Qué hace que la observación se convierta en científica? En nuestra opinión, dos son las claves: el contenido y la forma. Por un lado, el propósito de la observación tiene que ver con el incremento del conocimiento dentro de disciplinas científicas y no con la satisfacción de la curiosidad de los telespectadores. Por otro lado, la forma de llevar a cabo la observación en el contexto de la investigación científica conlleva unas garantías que no se dan habitualmente en otros contextos. Como ésta es una asignatura dedicada a las metodologías de investigación, aquí vamos a extendernos sobre la segunda clave.
Desde el punto de vista de la metodología de investigación, una observación científica debe cumplir las condiciones de ser sistemática y replicable. La observación es sistemática cuando se van haciendo explícitos cada uno de los pasos del proceso. Cuando ello es así, se está facilitando que también sea replicable, es decir, que pueda ser reproducida -y, por tanto, contrastada- de forma independiente en todos sus elementos.
En el apartado de "Método" del estudio llevado a cabo por Turnbull, Stein y Lucas, se establece lo siguiente:

"Se observó a adultos abrazándose en la sala de llegadas de un aeropuerto internacional. Los participantes no sabían que se les estaba observando. Se definió abrazo como una interacción en la que un participante A, cuando se encuentra con B, lo abraza poniendo su cabeza en uno de los hombros de B y rodeándolo con los dos brazos. Se excluyeron los casos en los que se utilizaba sólo un brazo o en los que, aunque se cogieran por los hombros, no se daba el apoyo de la cabeza. Los abrazos a niños tampoco se tuvieron en cuenta [...] Se observó un total de 321 abrazos: 114 mujer/mujer, 174 mujer/varón y 33 varón/varón".

O. H. Turnbull, L. Stein, y M. D. Lucas (1995). Lateral preferences in adult embrancing: A test of the "hemispheric asymmetry" theory of infant cradling. The Journal of Genetic Psychology, 156, 18.

Este breve párrafo deja traslucir que las observaciones a que ha dado lugar el estudio que se presenta se han llevado a cabo utilizando un determinado procedimiento que empieza por delimitar el objeto de la observación -los abrazos-, el nivel de análisis de la observación -las díadas adulto adulto-, los lugares de la observación -la sala de llegadas de un aeropuerto internacional-, etc. En la medida en que lo que se esboza se vaya concretando, cualquiera de nosotros, lectores de su trabajo, supuestas las habilidades y formación necesarias, estaríamos en condiciones de repetirlo, es decir, de replicarlo. Desmenuzar ese proceso de investigación es el objetivo de los apartados que siguen. A continuación detallamos los elementos del proceso para posteriormente ir desarrollando cada uno a lo largo de todo el módulo.

1.3.Diferentes elementos del proceso de observación

Algunas palabras sacadas del lenguaje cotidiano sirven para hacerse una idea cabal acerca de los elementos del proceso de observación sobre los que es necesario que el investigador sea lo más sistemático posible: qué observar, cómo observar, a quién, cuándo y dónde hacerlo.
1) Qué observar.
Ya ha quedado claro que, en el ejemplo que nos ocupa, el objetivo es describir el modo en que los adultos se abrazan analizándolo desde la perspectiva de la lateralización del abrazo. Por tanto, "la lateralización del abrazo entre adultos" constituye el qué observar. Para ser sistemáticos respecto a su delimitación, es necesario tener en cuenta dos aspectos: el marco teórico y el nivel de análisis. Dada la importancia que tienen ambos aspectos, se les dedica el próximo apartado. Baste con adelantar que la definición del objeto de observación conlleva una asunción teórica -el marco- y la delimitación de un plano o planos del fenómeno que se quiere observar -el nivel de análisis.
2) Cómo observar.
El elemento del proceso de observación relativo al cómo observar trata de delimitar la modalidad elegida para llevarlo a cabo, así como el tipo de registro que se va a utilizar. Ambos aspectos serán desarrollados con profusión en próximos apartados de este módulo. Podemos anticipar que el primero hace referencia a cómo se sitúa el investigador frente el fenómeno que va a observar y el segundo al modo en que va a dejar constancia de su trabajo. Para ambos aspectos se abren diferentes posibilidades y todo investigador debe conocerlas para poder elegir entre ellas y hacerlas explícitas.
Veamos ahora cómo se delimitan el resto de los elementos señalados: a quién, cuándo y dónde observar. Seguimos con la investigación sobre "la lateralización del abrazo entre adultos".
3) A quién observar.
En el propio título que hemos escogido para referirnos a esta investigación está implícito que se eligió a personas adultas. En el párrafo que hemos transcrito literalmente se especifica algo más: no se consideraron los abrazos en que estaban implicados niños y se eligieron 321 parejas. Todo ello nos informa sobre a quién se observó. Notad que no se nos relata de forma explícita el modo en que fueron elegidos. Por el relato del escenario parece innecesario. ¿Creéis que los autores utilizaron algún procedimiento aleatorio de selección de la muestra al estilo de los presentados en el apartado de encuestas del módulo anterior?
Cuando estudiéis cómo se elabora un informe de investigación, veréis que los sujetos a los que se encuesta, a los que se observa o a los que se aplican las tareas experimentales son un elemento central en el proceso de investigación. Según los objetivos que se persigan y el objeto de la investigación, el modo en que se decide quién participa en la misma puede variar.
La estructura del informe científico: las normas de publicación APA 94
Una buena investigación no publicada es como una partitura genial metida en un cajón. Necesita ser difundida para que se pueda hacer uso de las aportaciones propuestas. Los resultados de las investigaciones se publican en revistas especializadas y deben ajustarse a un formato determinado. Esta forma no es optativa para los investigadores, es una especie de protocolo aceptado para que la comunicación sea más fluida. No hay lugar para la originalidad en la estructura de la comunicación científica en psicología. En los trabajos empíricos la estructura es la siguiente:
Título
Resumen
Introducción
Método
Resultados
Discusión
Referencias
4) Cuándo observar.
Si repasáis el párrafo (1) en que se aludía al método seguido en la observación, notaréis que no hay ninguna alusión al momento en que se observó. A nosotros nos extraña esa omisión. Y vamos a explicar por qué. Si alguna vez habéis hecho un largo viaje en avión, de esos que obligan a cambiar el horario y a pasar una noche dentro de la aeronave, habréis advertido que vuestra capacidad de expresar emociones en la terminal de llegada está seriamente mermada. Muy probablemente, en vez de abrazos, deis cabezadas... Haber especificado el tipo de vuelo y las horas de diferencia con los lugares de procedencia, en caso de haberse podido hacer, ayudaría a replicar mejor la investigación.
En general, cuando un investigador aborda la selección de los momentos para la observación, debe tener en cuenta si es relevante para su objetivo el momento en que ésta se lleva a cabo. Si es relevante, deberá especificar el modo mediante el cual ha decidido observar en unos momentos y no en otros.
Pero hay otra cuestión importante dentro del elemento relativo a cuándo observar. En la actualidad, excepto si resultan muy intrusivos, los sistemas de grabación audiovisual suelen ser el soporte en que se recoge -y se almacena- el producto de la observación. Pero aunque parezca que, de toda la vida, todo el mundo ha manejado el vídeo como maneja el grifo del lavabo, no hace mucho tiempo las observaciones se registraban in vivo en tiempo real. Es decir, el observador tenía que decidir sobre la marcha qué es lo que estaba pasando y dejar constancia de ello. A la hora de decidir si la observación era fiable podían surgir muchos problemas.
Por ejemplo, el observador A capta algo que califica como abrazo y pasa a registrarlo aunque el observador B no lo considere del mismo modo. Para ello necesita fijar su vista en el cuaderno de notas o la hoja de registro. Mientras lo hace, aparece una nueva pareja abrazándose que esta vez sí capta el observador B. El primer observador no puede hacerlo porque estaba ocupado en el registro del abrazo anterior. De ese modo, pueden encontrarse con que, habiendo estado observando a los viajeros que llegan durante los mismos minutos, sus datos parecen pertenecer a dos sesiones diferentes. Ese modo de observar registrando en cada momento lo que acontece se llama registro continuo. El problema que puede generar su uso se aborda haciendo un registro por intervalos. La sesión se divide en fracciones muy cortas de tal modo que se alternan los tiempos para mirar y los tiempos para registrar. Por ejemplo, se establecen intervalos de 2,5 minutos. Durante los dos primeros minutos se observa y el medio minuto restante se dedica a registrar lo observado. Todo esto es innecesario cuando se ha hecho una grabación en vídeo. A la hora de codificar puede volverse al punto de la grabación donde se empezó a registrar.
5) Dónde observar.
En el ejemplo que estamos utilizando no queda ninguna duda de que se observó en la sala de llegadas de un aeropuerto internacional y, como no conocemos sus dimensiones, pensamos que sólo había una. En toda investigación en la que pueda observarse el fenómeno que se estudia en diferentes situaciones, el investigador deberá plantearse la selección de aquellas que más le interesen y presentar el modo de decidirlo.
Hasta aquí, la presentación de algunos de los elementos que configuran el proceso de observación cuando éste trata de cumplir los requisitos de ser sistemático y replicable.

1.4.El objeto de observación: marco teórico y nivel de análisis

Al introducir nuestro ejemplo al principio del módulo, explicamos cuál había sido el objetivo de la investigación: describir la lateralización en los abrazos entre adultos como modo de generalizar la hipótesis de la dominancia hemisférica derecha en el procesamiento de los indicadores emocionales. Podríamos decir que se está abordando el problema del comportamiento en contextos emocionales dentro de un marco teórico sociobiológico. De forma muy breve, eso quiere decir que los autores se sitúan en una tradición de investigación en psicología y ciencias sociales en la que se utilizan como principios explicativos elementos teóricos tomados de la biología evolucionista. La conducta está regulada biológicamente mediante procesos que han ido originándose por la selección natural.
Si sois unos entusiastas de las ciencias de la vida y de las explicaciones evolucionistas, este tipo de marco teórico os parecerá muy adecuado. Pero estaréis con nosotros cuando afirmamos que no es el único desde el cual puede investigarse la conducta del abrazo. Si creéis que toda conducta puede ser explicada mediante la reconstrucción del proceso de aprendizaje que la originó, os situaríais dentro de otro marco teórico: el conductismo.
No queremos ahorraros el trabajo de cursar las asignaturas básicas de contenidos en psicología, lo que queremos es que caigáis en la cuenta de que un sociobiólogo y un conductista mirando a los viajeros que se abrazan en la sala de llegadas de un aeropuerto, aun mirando lo mismo, observarán cosas diferentes, ya que su marco teórico condiciona -orienta- su proceso de observación.
Por cierto, los resultados no apoyaron la hipótesis de la asimetría en el abrazo como extensión de la asimetría del procesamiento emocional a la hora de sostener a los bebés en brazos. Ninguna de las combinaciones de díadas entre varones y mujeres mostró preferencia por la izquierda. Sólo en el caso de los abrazos entre mujeres se dio la preferencia contraria: cruzaban sus cabezas por la derecha. Esto lleva a los autores a concluir que "el abrazo orientado a la derecha puede ser producto de alguna preferencia cultural específica" (Turnbull, Stein y Lucas, 1995, pág. 20). A nosotros se nos ocurre que la extensión de la situación del cuidado del bebé al abrazo entre adultos era bastante arriesgada y, además, resultaba equívoca para predecir el comportamiento de adultos zurdos, ya que, por ser minoría, aprenden a abrazarse por donde lo hace la mayoría diestra.
Además de conocer el marco desde el que vamos a observar, es necesario dar un paso más: establecer el plano, delimitar el zoom. Eso es el de análisis. En el ejemplo de los abrazos en los aeropuertos, el nivel de análisis está circunscrito a la díada adulto-adulto, con las tres combinaciones que se dan al tener en cuenta el sexo de las personas que se abrazan. En un laboratorio se podría, además, haber registrado la actividad cerebral de los dos hemisferios para ver si, además de la lateralización en el cruce de cabezas, se da una activación diferencial, tal como sostienen los autores del trabajo. Ese cambio de la observación de la interacción a la observación de la actividad cerebral podría asemejarse al zoom de una cámara que permite acercar o alejar el plano según los propósitos de la grabación.
Aunque la metáfora del zoom puede haberos llevado a pensar que los niveles de análisis, como los planos de una filmación, pueden ser infinitos, en psicología y otras disciplinas afines nos movemos dentro de un número limitado de ellos. En el cuadro 2.1 (2) encontraréis dos propuestas diferentes de posibles niveles de análisis tomadas de León y Montero (1997) y de Rosa (2000).
Es obligación para todo investigador referirse explícitamente al marco teórico en que se mueve y a los niveles de análisis que elige para que sus investigaciones puedan ser replicadas.

2.Diferentes modos de plantear la observación

2.1.Tipos de observación

En el apartado anterior, cuando se describían los elementos que configuran el proceso de observación, se ha aludido al contenido de este epígrafe. Decíamos que el investigador tiene que elegir entre varias opciones el modo en que se sitúa -mentalmente- frente a lo que va a observar. Aunque diferentes autores abordan la clasificación de estas opciones de diferente modo (León y Montero, 1997; Shaughnessy, Zechmeister y Zechmeister, 2000), dichas opciones están claramente delimitadas. Nosotros vamos a presentar modos diferentes de llevar a cabo la observación. Después de describir las características de cada uno de ellos, os presentaremos los criterios para su posible clasificación.
Recordad cómo se planteó la investigación del estudio descriptivo "la lateralización de los abrazos". Se trataba de observar a las parejas de adultos en la zona de llegadas de un aeropuerto. Hasta aquí, todo estaba claro. Preguntaos ahora en qué grado el investigador creaba el contexto de la observación. Parece que, en nuestro caso, el investigador no aportaba nada más que su presencia al contexto: el trajín de personas en la sala de llegadas se produce sin que el investigador intervenga en modo alguno. Él se limita a registrar aquello que le interesa dentro de un conjunto de cosas que ocurren sin que él intervenga de ninguna forma.
Cuando esto es así, cuando el investigador se limita a observar una situación sin aportar nada a su creación -más allá de su ineludible presencia-, decimos que está haciendo observación natural.
La observación natural tiene la ventaja de permitir el acceso a las situaciones tal y como se producen habitualmente. Pero muchas veces el investigador no puede estar esperando a que, espontáneamente, aparezca el fenómeno que le interesa. Pensad en el fenómeno del habla privada infantil, también conocida como habla egocéntrica. Se ha constatado que, entre los tres y seis años, los niños hablan para sí mismos con mucha más frecuencia de lo que lo harán según vayan creciendo. El origen y funciones de ese hablar para sí ha dado lugar a mucha investigación.
Sin embargo, uno de los mayores riesgos para la investigación de este fenómeno es el de acceder a él: el mero hecho de ponerse a observar lo que hacen niños de esas edades no garantiza que manifiesten habla privada. El que ésta se ponga en funcionamiento depende de muchas cosas: la demanda de la tarea que se realiza, su contenido, el nivel de dificultad, el contexto, la cercanía de otras personas, el modo de interacción con las mismas... y así hasta un largo etcétera. Pues bien, un modo que tenemos los investigadores para, manteniendo el contexto natural de aparición del fenómeno, aumentar la probabilidad de que éste aparezca consiste en introducir algunos elementos en la situación, crear un contexto estructurado que así lo permita. Por ejemplo, introduciendo un juego que sepamos que resulta motivador e implica un reto para los niños que van a ser observados. En esas condiciones (Díaz y Berk, 1992), se sabe que aumenta la probabilidad de que se emita lenguaje autodirigido.
Cuando eso ocurre hay un cierto grado de intervención en la situación, lo que se observa está de algún modo provocado por el investigador. Esta modalidad se denomina observación estructurada.
Pero todavía hay más. Una cosa es provocar un fenómeno para describirlo y otra cosa es provocarlo para saber qué lo causa. Cuándo en el contexto de la metodología de investigación hablamos de experimento nos referimos al contraste de una relación de causa-efecto entre dos variables. En el módulo "Metodología experimental", tendréis ocasión de estudiar todo lo relativo a este asunto. Cuando la observación se estructura para llevar a cabo un proceso de contraste de relaciones causales, hablamos de experimento de campo.
El criterio que nos ha permitido distinguir entre las tres modalidades de observación hasta ahora presentadas ha sido el del grado de intervención del investigador en la situación observada. Pero hay otro criterio que permite distinguir entre formas de observación: llevarla a cabo desde fuera o llevarla a cabo desde dentro. Es decir, el observador puede ser alguien ajeno al objeto de la observación o puede ser parte de lo que se observa. Cuando se elige esta segunda opción, hablamos de observación participante. Cuando no es así, se habla de observación externa.
Si os habéis tomado en serio la respuesta a la pregunta anterior, os habréis dado cuenta de que, en realidad, os hemos presentado dos sistemas de clasificación de los posibles modos de enfocar la observación. El primero de ellos hace referencia al grado de estructuración de la situación que se observa. Da lugar a tres modalidades: observación natural, observación estructurada y experimento de campo. El segundo es relativo al grado de participación del observador en el fenómeno observado. Da lugar a dos posibilidades: observación externa y observación participante. En la tabla 2.1 os presentamos las seis combinaciones resultantes.
Tabla 2.1 Diferentes modalidades de observación
Grado de estructuración
Grado de participación
Natural
Estructurada
Experimento
Externa
Externa natural
Externa estructurada
Externa experimento
Participante
Participante natural
Participante estructurada
Participante experimento
Lo que queremos recalcar ahora es que cualquier estudio hecho mediante observación puede ser clasificado a la vez según los dos criterios. Por ejemplo, una observación natural puede ser participante o mediante observador externo. O visto de otro modo, el hecho de que sepamos que una observación es estructurada no nos dice nada respecto a si el observador era externo o participante.
En la actividad 2.1 (3) tendréis ocasión de practicar acerca de los sistemas de clasificación observando fragmentos de grabaciones pertenecientes a cuatro estudios diferentes. Los dos primeros ya terminados: Español (2000) y Español y Rivière (2000). Los otros dos están todavía en curso: Montero y Pérez del Palacio.

2.2.Tipo de código

Aunque desde hace unos años se utilicen los soportes audiovisuales para dejar constancia de las observaciones realizadas en un estudio, parece claro que un montón de cintas de vídeo, o de discos compactos, no constituyen los hallazgos de una investigación descriptiva llevada a cabo mediante observación. Una investigación se inicia con unos objetivos, dentro de un marco teórico, y delimita un nivel de análisis o varios. De todo lo que puede apreciarse en las grabaciones que habéis presenciado hasta ahora -si habéis hecho las actividades propuestas-, los investigadores sólo se han preocupado de algunas cosas: sus categorías de observación. Éstas se ven reflejadas en los registros que han llevado a cabo. Dichos registros se realizan utilizando códigos previamente establecidos. Cabe apuntar, por tanto, que en principio puede haber tantos códigos como investigaciones. Sin embargo, aquí nos interesa resaltar que todos ellos pueden reducirse a dos tipos: registro narrativo o código arbitrario.
Decimos que un observador utiliza un registro narrativo cuando se limita a utilizar el lenguaje natural como vehículo mediante el cual expresar sus categorías de análisis y dejar constancia de su aparición en los diferentes momentos de la observación. En la actividad 2.1 hemos omitido el tipo de código, pero podréis acceder a él en la próxima actividad que os vamos a proponer en breve. Antes necesitamos explicar en qué consiste el otro tipo de código.
Aunque en sentido estricto el lenguaje natural también lo es, hablamos de código arbitrario cuando el observador crea para la ocasión el conjunto de categorías que va a utilizar para dejar constancia de lo acaecido.
Eso no implica que cada investigador "invente" su propio código. Dentro de una misma área de investigación, se suele compartir un conjunto de categorías para dar cuenta de los fenómenos de interés dentro de la misma. Ése es el caso de la investigación del fenómeno del habla privada dentro del aula. En la actividad 2.2 (8) os enseñaremos a utilizar una versión simplificada del código que se utiliza en ese campo. Recordad que también podréis ver un caso de registro narrativo y notar la diferencia entre ambos tipos de código.
(9) Chico: Pablo. (P)
Tarea: Ficha del árbol genealógico.
Situación: Está haciendo una ficha en la que tiene que poner los nombres de sus familiares: abuelo, padre...

3.Construcción de códigos

3.1.Pasos en la elaboración de un código

Cuando hemos hablado de tipos de registro, al referirnos al uso de códigos arbitrarios, se ha dado a entender que dentro de cada ámbito de investigación se utilizan conjuntos de categorías ya establecidos. En nuestra propia experiencia como investigadores, eso fue lo que encontramos cuando empezamos a investigar sobre el fenómeno del habla privada. Como nosotros, la mayoría de los investigadores utilizan un código ya depurado por Berk (1986).
Pero alguien tiene que ser el primero. Cuando un nuevo fenómeno se empieza a investigar, las categorías todavía están por elaborar. En este apartado queremos mostrar lo cuidadoso que se debe ser cuando tiene que afrontarse la tarea de elaborar un nuevo código de observación. Para ello, vamos a apoyarnos en las recomendaciones que se ofrecen en un libro que puede considerarse un clásico en esta especialidad metodológica. Nos referimos a la obra Bakeman y Gottman (1986).
Bakeman y Gottman recomiendan seguir los consejos siguientes:
  1. Tener, al menos, una pregunta antes de empezar.

  2. Elegir uno o varios niveles de análisis para comenzar a observar.

  3. Hacer una observación previa asistemática.

  4. Elegir categorías con suficiente nivel de detalle.

  5. Elegirlas de modo que sean exhaustivas y excluyentes.

  6. Someterlas a depuración.

A continuación vamos a dedicar un breve espacio a cada uno de estos consejos. Los hemos agrupado en dos grandes conjuntos porque nos parece que las tres primeras recomendaciones pueden configurar un primer paso del proceso, mientras que las otras tres se deberán llevar a cabo en un momento posterior.

3.2.La pregunta, el nivel de análisis y la observación previa

Para hacer vuestra tarea de aprender más relajada, pero no por ello menos eficaz, os invitamos a seguir nuestra explicación dentro de un contexto que no siendo psicológico puede resultar lo suficientemente familiar y cercano.
Ejemplo
¿Conocéis la palabra asistencia? El diccionario de la Real Academia de la Lengua recoge once acepciones de la palabra, pero ninguna de ellas es la que nos interesa. En el diccionario de uso de María Moliner, la palabra aparece también con once acepciones. La novena es la que nos interesa: "En baloncesto, pase que permite conseguir una canasta". Esperemos que no os desagrade este juego deportivo porque vamos a convertirlo en nuestro cómplice didáctico durante un espacio importante de nuestra lección. Lo que vamos a hacer es presentar el código a que pertenece la categoría "asistencia" de tal modo que entendáis que quienes lo diseñaron siguieron los seis consejos reseñados más arriba. Pero empecemos por el principio.
3.2.1.La pregunta
El consejo recogido en primer lugar hace referencia a la necesidad de tener, al menos, una pregunta que responder para empezar a observar algo.
Para quien presencia un partido de baloncesto, una pregunta relevante puede ser quién es el mejor jugador del partido. De hecho nos atrevemos a aventurar que eso se preguntan los ojeadores de los equipos de la liga profesional americana cuando hacen su trabajo para, al final de la temporada, ofrecer informes a los equipos sobre los jugadores que terminan la liga universitaria para contratarlos en la profesional, después del famoso proceso de drafts (rondas de selección). En ese contexto es donde se han elaborado el conjunto de categorías que se usan para establecer la calidad de un jugador, lo que se conoce como sus estadísticas personales. Una curiosidad de ese proceso es que el equipo que primero puede elegir es el que peores resultados obtuvo en la temporada anterior. Eso facilita la máxima igualdad entre los equipos y una incertidumbre y emoción más grande en cada liga.
Probablemente el juego os parezca tan conocido que no podéis imaginar a nadie que, presenciando un partido por primera vez, no capte la importancia de la categoría "asistencia". Seguro que lo imagináis mejor si os situáis en el contexto de un partido de béisbol: ¿cómo hacerse idea de la importancia de los strikes para el equipo que defiende?, pero ¿qué equipo defiende y qué equipo ataca? ¿No creéis que una persona puede dedicar muchas horas a ver partidos de ese deporte y seguir sin ser capaz de entender -observar- nada que tenga sentido? Si no se conoce el objetivo del juego -si no se tiene una pregunta- no pueden elaborarse un conjunto de categorías relevantes para su análisis -para su respuesta.
Imaginar a un aficionado novato aprendiendo las reglas del juego a base de ver partidos nos sirve como alegoría para ilustrar lo que ocurre cuando se está empezando a describir un nuevo fenómeno mediante observación. Ni el aficionado ni el investigador verán nada por mucho que miren. Necesitan una pregunta previa: ¿quién es el mejor jugador?.
3.2.2.El nivel de análisis
Recordaréis que para explicar el concepto de nivel de análisis, introdujimos la idea de diferentes planos para observar el mismo fenómeno.
Pues bien, la conexión con el baloncesto es fácil si os situáis en el papel del realizador de la transmisión de un partido en el que se va a decidir quién es el mejor jugador. La pregunta sería: ¿con qué plano, o planos, se capta la calidad del jugador? O más concretamente, ¿qué plano, o planos, necesitamos mantener para poder observar a un jugador? Pensad que los realizadores no tienen infinitas cámaras, aunque sea posible pensar en un número ilimitado de planos. Es fácil deducir que los primeros planos del rostro de un jugador no serán necesarios para ilustrar su calidad -lo cual no quiere decir que no sirvan para ilustrar otros aspectos tales como el grado de concentración, el dolor tras un golpe, etc. Lo mismo cabe decir de planos aéreos. Pueden venir bien para ilustrar el ambiente entre el público que llena el Palau, pero no la calidad de los jugadores azulgranas. Parece que lo mejor es dedicar una cámara a seguir los pasos del jugador elegido y de sus compañeros manteniendo planos que permitan captar las incidencias: pases, puntos, faltas, etc.
En cualquier caso queda claro que con un único plano no tiene por qué agotarse el modo de ilustrar la calidad de un jugador -si hablamos en general- o el número de asistencias -si nos referimos a un indicador más concreto. Pueden -casi deberíamos decir, deben- utilizarse varios planos para un mismo proceso observacional. Sustituid el contenido deportivo del ejemplo por una dimensión de la conducta humana -la agresividad infantil, por ejemplo- y entenderéis que este consejo acerca del número de planos es relevante para la descripción de cualquier fenómeno accesible a la observación. Para la traducción del concepto de plano filmográfico al de nivel de análisis en psicología os vendrá bien repasar el cuadro 2.1. (2)
3.2.3.La observación previa asistemática
Pensad en el primer ojeador de la historia del baloncesto. Sabe lo que está buscando, el mejor jugador. Sabe que tiene que fijarse en los que destaquen en su contribución al resultado, tanto en un plano estrictamente individual como en su aportación al rendimiento del resto de sus compañeros. Y se pregunta: ¿cuáles son los mejores indicadores de la calidad de un jugador?, ¿qué hace que un jugador destaque en un partido?
Algunos indicadores -como los puntos anotados- debieron aparecer enseguida en la cabeza de este imaginario personaje. Pero otros -quizá el número de asistencias fuera uno de ellos- debieron llevar un poco más de tiempo para emerger ante su mente. Hasta que empezó a utilizar las categorías definitivas, necesitó llevar a cabo observaciones de forma no sistemática. Mientras no tuvo el código arbitrario terminado, debió utilizar el lenguaje natural -el registro narrativo- para expresar lo que había observado. Algo así como un informe después del partido en el que especificara, por ejemplo:
Si nos fijamos, en el relato emergen categorías que pueden empezar a ser útiles y candidatas para formar parte del código definitivo: tiro de cerca, tiro de lejos, rebote ofensivo, rebote defensivo... Teniendo ya una primera versión del código -por ejemplo, la que aparece más adelante, en la tabla 2.2- nuestro observador empezaría a probarlo de forma sistemática.
De igual modo se hace en un proceso de investigación mediante observación. Para que se empiece a consolidar un primer conjunto de categorías como relevantes para el análisis de un nuevo fenómeno, se necesita un periodo de observación que necesariamente será previo a la construcción del código. Asimismo, al no tener otro modo de registro, el lenguaje natural es la forma de recoger lo acontecido.
Siguiendo estos tres consejos, cerramos un primer momento del proceso. Ya hemos delimitado el objetivo y los niveles de análisis. Tenemos también una primera propuesta de código: ¿cómo saber si es adecuada para una observación sistemática y replicable?

3.3.El primer conjunto de categorías exhaustivas, excluyentes y con suficiente nivel de detalle. Su depuración

Lo que hacemos ahora es investigar si el conjunto que hemos pensado como primera propuesta cumple una serie de condiciones, condiciones que se hacen imprescindibles para que el código pueda ser útil para fines científicos. Todas ellas se describen en las tres recomendaciones siguientes:
  • Elegir categorías con suficiente nivel de detalle

  • Elegir categorías de modo que sean exhaustivas y excluyentes

  • Someterlas a depuración

3.3.1.Elegir categorías con suficiente nivel de detalle
Aunque hasta ahora, al seguir el ejemplo del baloncesto, el uso de los medios audiovisuales haya parecido obvio, aquí es necesario hacer la precisión de que esta recomendación es especialmente importante en el caso de hacer observación in vivo. Imaginaos que el primer ojeador de buenos jugadores empezó su labor cuando todavía no se televisaban los partidos. Entonces no tenía registro audiovisual sobre el que resolver dudas o contrastar datos. Resulta que ha encontrado dos jugadores que han hecho el mismo número de anotaciones y ha registrado los puntos de cada uno de ellos. Cuando lleva su información al equipo técnico que decidirá sobre la contratación, surge la duda de cómo decidirse por uno de ellos, ya que el criterio fundamental es la eficacia anotadora. El entrenador no lo duda, propone elegir a aquel que haya anotado más tiros exteriores, ya que es más necesario para la actual composición del equipo. El ojeador se lleva las manos a la cabeza: ¡no ha registrado qué tipo de punto era el que se hacía cada vez! Al no establecer el suficiente nivel de detalle para el objetivo que tenía se ve abocado a una situación muy poco deseable. Deberá repetir todo el proceso. Aun en el caso de haber utilizado medios audiovisuales de grabación, estará obligado a volver a ver todo el partido. ¿Qué hubiera pasado en caso contrario, si el ojeador recoge el detalle del tipo de tiro y el entrenador hace caso omiso de él? Nada. A lo sumo, el ojeador habría sentido que había trabajado más de la cuenta. Pero este inconveniente no tiene parangón con el anterior.
En la observación en otros contextos, más propios de la investigación académica, puede pasar exactamente igual, que necesitamos una información precisa que no hemos detallado suficientemente. ¿Hay manera de preverlo? No. Recordad que estamos en un proceso de elaboración de un código para observar algo que se describe por primera vez.
La recomendación es que, en lo que se refiere al nivel de detalle, más vale pasarse que quedarse corto.
3.3.2.Elegir categorías de modo que sean exhaustivas y excluyentes
Además de cumplir la condición anterior, el grupo de categorías que se han derivado de la fase anterior deben ser exhaustivas y excluyentes.
Que sean exhaustivas quiere decir que, en su conjunto, agoten todos los elementos del fenómeno en observación.
La otra condición, la de ser excluyentes, hace referencia a que un elemento del fenómeno en observación sólo pueda pertenecer a una de las categorías.
Actividad
En nuestro ejemplo, una asistencia no puede ser a la vez un rebote, o un tiro libre, o uno de tres puntos. Esto parece muy evidente. Ahora bien, la categoría "falta personal" ¿es excluyente con respecto al resto del código recogido en la tabla 2.2?
Tabla 2.2. Primera versión para un código de observación de la calidad de un baloncestista
Puntos
de campo
de tiro libre
de tres
Rebotes
defensivos
en ataque
Asistencias
Faltas
personales
técnicas
Balones perdidos
Puntos conseguidos por el jugador contrario al que se defiende
Aunque pueda pareceros que estas dos condiciones son fáciles de conseguir, hay muchos casos en los que no se cumplen. Cuando es así, los análisis de los datos recogidos en la investigación se dificultan mucho. No es el momento de profundizar más en el asunto. La moraleja simplemente va en la línea de enfatizar que cualquier conjunto de categorías que se nos ocurra no cumple per se estas dos condiciones.
3.3.3.Someterlas a depuración
Las condiciones que deben cumplir las categorías no se agotan con las mencionadas en los epígrafes anteriores. Establecer su cumplimiento parece una labor de reflexión, de despacho. Podemos decidir reflexionando que el conjunto de la tabla 2.1 necesita añadir, al menos, la categoría "robo de balón", para que pueda considerarse exhaustivo. Del mismo modo, para que todas las categorías sean excluyentes entre sí, se hace necesario aclarar los límites entre "falta personal" y "pérdida de balón". Por ejemplo, "falta personal en ataque" -sin computar como pérdida de balón- y "falta personal en defensa".
Sin embargo, depurar el código representa preguntarse si cumple algunos requisitos que sólo pueden ser establecidos de forma empírica.
En el último apartado del módulo se desarrolla este aspecto. Para activar vuestra curiosidad, preguntaos si consideráis igual de fácil que dos espectadores de un mismo partido se pongan de acuerdo en que un tiro ha sido de tres puntos o en que un punto haya sido obtenido mediante tiro libre. Por lo tanto, ¿cuál de las dos categorías -tiro de tres o tiro libre- creéis que está más depurada?

4.Tipos de medida en la observación

4.1.Medidas: ocurrencia, frecuencia, latencia, intensidad, duración

Después de tanto baloncesto quizá tengáis cierta sensación de cansancio físico. Si es así, no creáis que el simple hecho de pensar en actividad física os produce fatiga. Si verdaderamente sentís cansancio, se deberá, muy probablemente, al hecho de mantener tanto rato la misma postura en vuestro lugar de estudio. Posiblemente os surjan molestias en las vértebras cervicales, molestias que acaban concentrándose en cierta sensación de dolor entre los dos omóplatos... Además, es muy probable que vuestra circulación sufra dificultades en la zona abdominal y en las extremidades inferiores...
Pensad: ¿tenéis ese dolor cervical ahora? Veamos, durante la última semana, ¿cuántos días estuvisteis trabajando durante un periodo superior a media hora sentados delante del ordenador?, ¿en cuántos de ellos sentisteis molestias cervicales? Probablemente, vuestra respuesta sea: "no me he fijado". Si os hubierais fijado, si lo hubieráis observado y registrado, ahora podríais contestar a nuestras preguntas sin ninguna dificultad.
Con este ejemplo, estamos poniendo de manifiesto que el proceso de observación necesita un último paso: la medida. Hay diversas maneras de dejar constancia de un fenómeno de interés para el observador. Os vamos a presentar cinco modos diferentes de medida en la observación:
  1. Ocurrencia

  2. Frecuencia

  3. Latencia

  4. Duración

  5. Intensidad

La primera de las medidas, la ocurrencia, nos dice simplemente si una categoría ha aparecido durante un periodo de registro. Si retomamos la categoría de observación "tener dolor entre los omóplatos", la pregunta relativa a si lo padecéis ahora es una pregunta sobre vuestra ocurrencia. Fijaos en que simplemente anotamos si algo ha ocurrido en un intervalo determinado. Sólo hay dos posibilidades de respuesta: sí, ha ocurrido (sí, tengo dolor entre los omóplatos); no, no ha ocurrido (no tengo dolor entre los omóplatos).
Imaginemos que sois de las personas que responden que sí a la pregunta sobre el dolor postural. Desde luego, no es agradable sentir esa molestia, pero también está claro que no es lo mismo haberla padecido alguna vez que padecerla a menudo.
La ocurrencia nos informa sobre la aparición de la categoría que observamos, la frecuencia nos dice cuántas veces lo ha hecho. Al incluir la frecuencia como medida de lo que estamos observando, estamos recogiendo más información.
Esta medida puede informarse de dos maneras: frecuencia absoluta y frecuencia relativa. Imaginad que hay dos estudiantes que se quejan de haber padecido el dolor cervical dos veces en las últimas cuatro semanas. Aparentemente, la frecuencia con que padecen el dolor es la misma. Pero imaginad que una de estas dos personas es muy aplicada y todos los días dedica más de dos horas al estudio, mientras que la otra, por las razones que sean, no puede estudiar más que una vez cada dos semanas. ¿Seguís pensando que las dos personas son igual de propensas a padecer dolor postural? Está claro que esas dos veces no significan lo mismo. En un caso implican tener dolor en una de cada catorce ocasiones mientras que en el otro significa tener el dolor cada vez que es posible que aparezca.
Cuando informábamos que dos personas habían respondido tener el dolor dos veces -sin ninguna referencia a las oportunidades de padecerlo- estábamos haciendo referencia a la frecuencia absoluta de aparición de la categoría bajo observación. Cuando hemos informado también de las oportunidades (dos de dos o dos de veintiocho), hemos hecho referencia a su frecuencia relativa.
Pero todavía podemos obtener información más rica sobre el problema de los dolores de espalda de las personas que estudian sentadas durante largos periodos de tiempo. Supongamos ahora que encontramos a dos personas que padecen el dolor con la misma frecuencia relativa, uno de cada tres días de estudio sienten esos pinchazos entre los omóplatos. Sin embargo, la primera de ellas nos dice: "Es sentarme y... ¡empieza a dolerme!". La otra, por el contrario, afirma: "a mí me empieza a doler hacia el final, cuando llevo ya mucho rato trabajando". Ambas informan de la misma frecuencia pero de diferente latencia.
La latencia es el tiempo que tarda en aparecer la conducta que se observa a partir de un determinado punto de referencia.
En este ejemplo, es el momento de empezar a estudiar sentado ante la mesa de trabajo. El informe verbal que hemos recogido ha sido impreciso. Una buena investigación informaría de la latencia en unidades de tiempo. En algunos experimentos de psicología se mide en milésimas de segundo. Ése es el caso de los tiempos de reacción que son el tiempo que tarda un sujeto en responder a la presencia de un estímulo perceptivo.
Como habréis podido notar, cada una de las medidas que hemos ido utilizando para informar sobre la categoría que estamos observando nos ha permitido ir apreciando mejor la naturaleza del fenómeno y, sobre todo, la diferente gravedad del mismo. La siguiente medida casi no tiene ni que explicarse: ¿cuánto tiempo dura el dolor? Como habréis fácilmente adivinado, estamos hablando de duración. Independientemente de cuánto tiempo tarde en aparecer, no cabe duda de que un buen procedimiento para apreciar la gravedad del problema de los dolores de espalda es conocer su duración una vez que han aparecido.
Así pues, técnicamente, hablamos de duración para referirnos al tiempo en que una conducta bajo observación está presente de forma continuada.
Si alguna vez habéis tenido la desgracia de padecer un dolor de espalda durante un periodo considerable de tiempo, os habréis dado cuenta de que, en algunas ocasiones, lo habéis podido sobrellevar, mientras que, por el contrario, en otras habéis tenido que parar e, incluso, tomar alguna medicación. Eso ha ocurrido cuando el dolor ha sido muy intenso.
La última medida de observación que queríamos presentaros era ésta: la intensidad. Con ella informamos sobre el grado en que la conducta bajo observación está presente. Para poder hacerlo necesitamos construir escalas de apreciación de esa intensidad.
Aunque os parezca que es fácil apreciar diferentes grados de intensidad del dolor de espalda, los psicólogos y otros científicos sociales llevamos años dedicando muchos esfuerzos al arte de medir la intensidad de variables que son de apreciación subjetiva.
Haciendo un rápido repaso a las medidas en la observación, recordemos que:
  • La ocurrencia nos informa sobre la aparición de determinada categoría en el periodo de observación.

  • La frecuencia nos indica, además, cuántas veces ha aparecido. Dicha frecuencia puede ser absoluta o relativa dependiendo de que la cantidad de veces en que aparece la categoría sea puesta, o no, en relación con la cantidad de veces que podría haber aparecido.

  • La latencia nos señala el tiempo que transcurre desde un momento concreto -por ejemplo, la aparición de un estímulo o el comienzo de un intervalo- hasta la aparición de la conducta en cuestión.

  • Hablamos de duración para referirnos al tiempo en que la categoría está presente de forma ininterrumpida.

  • Por último, la intensidad nos informa del grado en que la conducta aparece.

Actividad
¿Queréis comprobar lo claro que os ha quedado? Haced clic en la letra inicial que indica el tipo de medida que puede ser cada una de las categorías que se utilizan en las estadísticas del baloncesto. Al final os daremos vuestra propia estadística, esta vez de preguntas acertadas.
Habréis notado que en el deporte de las canastas las medidas a las que da lugar el uso de las categorías que permiten observar el rendimiento individual de un jugador suelen ser del tipo frecuencia. Tened en cuenta, de todos modos, que no hemos puesto absolutamente todas las categorías que pueden utilizarse. Algunas, como las relativas al palmarés -por ejemplo, Epi fue medalla de plata en los Juegos Olímpicos de Los Angeles de 1984-, serían expresiones de ocurrencia. Asimismo, las puntuaciones conseguidas en un concurso de mates, donde unos jueces otorgan una calificación a la calidad del mate realizado por el concursante, serían medidas de intensidad. Algunas de las categorías menos conocidas son medidas de latencia, como el tiempo transcurrido hasta cometer la primera falta personal o hasta anotar la primera canasta.
Otro hecho que no queremos que os pase inadvertido es el de que no toda categoría puede ser expresada en todos los tipos de medida. El ejemplo del dolor de espalda es un caso en el que sí puede hacerse, pero las diferentes categorías sobre el rendimiento individual en baloncesto ilustran el caso contrario. Un tiro de tres puede ser expresado como ocurrencia, como frecuencia -absoluta y relativa- y como latencia, pero no como duración o intensidad.
Es decir, en algunos casos la elección del tipo de medida puede ser determinado por el investigador, pero en otros viene determinado por la naturaleza misma de la categoría.
Una investigación sobre dolores de espalda puede hacerse tomando cualquiera de las medidas o, incluso, todas a la vez; pero una investigación sobre el suicidio es difícil que tome otra medida que no sea la ocurrencia. Este hecho es muy importante a la hora de elegir los mejores indicadores para la observación de un determinado fenómeno.
Cuando sea posible habrá que elegir aquel indicador que mejor información nos reporte en relación con el objetivo de nuestra investigación.

5.La evaluación del proceso de observación

5.1.Introducción

Hemos visto a lo largo de este módulo que para llevar a cabo un proceso de investigación mediante observación, el investigador tiene que ir tomando una serie de decisiones en relación con la definición del problema, el procedimiento para observar, la elección de los participantes, las situaciones, los intervalos temporales. Tiene que decidir el modo de dejar constancia de lo observado. En caso de que lo considere necesario, tiene que construir su propio código de observación. Debe pensar en cuáles pueden ser los mejores indicadores para observar y el tipo de medida al que darán lugar...
Y todo ello de una manera tal que haga posible que cualquier otro investigador pueda replicar su trabajo. Muy probablemente pensaréis que es una "ardua tarea". Ciertamente no es fácil llevar a cabo este proceso sin que surjan problemas que puedan dar al traste con su objetivo. ¿Tiene el investigador alguna forma de saber si el proceso discurre correctamente? ¿Tiene algún modo de evaluarlo?
En toda tradición metodológica se han desarrollado procedimientos que hoy podríamos denominar de control de calidad. Son acciones que inserta el investigador en el proceso para comprobar que se está desarrollando dentro de unos parámetros. Fijaos en que estamos hablando sobre el proceso, no sobre el resultado. Es decir, nos planteamos si el modo en que se están recogiendo los datos de observación es adecuado, no si esos datos refutan o no las hipótesis de la investigación. Si el proceso está mal hecho, nada podremos concluir a partir de los datos que mediante él obtengamos. De los diferentes parámetros de control desarrollados en psicología y disciplinas afines, aquí vamos a presentar dos de los más clásicos: la fiabilidad y la validez.

5.2.Fiabilidad: acuerdo entre observadores

Pensad en algunos de los exámenes que habéis hecho a lo largo de vuestra vida de estudiante. Pensad en un examen de preguntas abiertas para evaluar los conocimientos que hasta ahora habéis trabajado dentro de este módulo y el anterior. Imaginad que uno de nosotros, los autores, el profesor León, es más "blando" a la hora de corregir, mientras que el otro, el profesor Montero, es más "duro". Bien, ¿creéis que vuestro examen obtendría la misma nota independientemente de quién lo calificara? Esperamos que vuestra respuesta haya sido negativa. Pensad ahora en un examen con preguntas cerradas con alternativas donde sólo una es correcta. Con esta modalidad de examen la respuesta a la pregunta anterior pasa a ser positiva: una vez conocida la lista de respuestas correctas, vuestra nota sería la misma fuera quien fuera el corrector. La primera modalidad de examen es menos fiable que la segunda. La medida que nos provee de sus conocimientos merece menos confianza.
La fiabilidad hace referencia al grado en que podemos confiar en una medida.
Nadie confiaría en un procedimiento de observación que diera lugar a diferentes resultados en función de quién fuera el observador. Recordad que estamos hablando de observación científica, no de una estimación política de la coyuntura socioeconómica actual.
En términos que puedan estudiarse, un sistema de observación tiene que producir alto grado de acuerdo entre observadores. Es decir, dos observadores que presencian lo mismo tienen que estar de acuerdo en el producto de su observación.
Por ejemplo, pensad en algunas decisiones polémicas de los árbitros en diferentes modalidades deportivas. Mejor aún, pensad en el caso concreto del deporte de la canasta. El partido está a punto de acabar. El equipo de casa va dos puntos por debajo. Hay tiempo sólo para una posesión de balón. El entrenador pide tiempo muerto. La táctica está clara: preparan un tiro de tres para ganar el partido apurando la posesión al máximo para que no pueda haber réplica por parte de los rivales. Así se hace. Los segundos transcurren y, por fin, el balón llega a manos del especialista que ha conseguido una posición diáfana. Se eleva, lanza y... ¡canasta! ¡El partido está ganado! Pero... ¡la han dado como canasta de dos puntos! ¡El escándalo es monumental!...
Podríamos seguir esta crónica deportiva improvisada. Pero basta con haceros caer en la cuenta de que la categoría "canasta de tres puntos", registrada in vivo, puede producir un cierto grado de desacuerdo entre observadores, mientras que la de "canasta de tiro libre", no. Podemos decir, por tanto, que una categoría es más fiable que otra. ¿Cuánto? Para ello existen índices que permiten dar un valor numérico a la fiabilidad así entendida.
El grado de acuerdo suele calcularse como porcentaje de acuerdo. Es decir, porcentaje de veces que los dos observadores registran lo mismo sobre el total de registros realizados entre ambos.
En el ejemplo baloncestístico, porcentaje de veces que dos árbitros expertos categorizan del mismo modo tiros realizados en el entorno de la línea de 6,25. Este índice de acuerdo no tiene en cuenta que parte del mismo puede deberse al azar. Cohen (1960) resolvió este problema proponiendo el uso de su coeficiente Kappa. Ambos índices -porcentaje de acuerdo y coeficiente Kappa- son fácilmente calculables.

5.3.Validez: de contenido, de constructo y referida al criterio

Volvamos a las dos modalidades de examen. No sabemos cuál es vuestra opinión al respecto, pero muchos de nuestros estudiantes se quejan de que la modalidad de preguntas cerradas con alternativas no recoge bien lo que han aprendido. Piensan que otro tipo de examen reflejaría mejor sus conocimientos de la asignatura. Aunque no lo sepan, están cuestionando la validez del procedimiento de evaluación.
La validez de la observación hace referencia al grado en que se observa lo que se pretendía observar.
En nuestro ejemplo, la validez reclamada refleja el grado en que el examen mide los conocimientos que pretende medir. Lo que nuestros estudiantes reclaman es que el procedimiento para evaluarlos sea más válido. Advertid que achacan falta de validez a un procedimiento que, anteriormente, vimos que era el más fiable. Eso quiere decir que ambos criterios de calidad son independientes, aportan distinta información. Por tanto, deben exigirse ambos.
Todo proceso de observación tiene que ser a la vez fiable y válido.
La validez de un código de observación puede establecerse de diferentes modos. Nosotros nos vamos a referir a tres de ellos: validez de contenido, validez de constructo y validez referida al criterio. (Podéis ampliar las modalidades de validez que se han propuesto consultando el cuadro 2.3 (10) , desarrollado a partir de Cone, 1978.)
Veamos con detenimiento cada una de ellas. Una vez más, el baloncesto será nuestro cómplice.
La validez de contenido de un código de observación hace referencia al grado en que el conjunto de categorías elaborado es una muestra representativa del universo de aspectos potencialmente observables.
¿Representan bien las categorías de "puntos anotados" -con sus tres modalidades-, "asistencias", "rebotes en ataque" y "robos de balón" a todas las posibles aportaciones de un jugador a la capacidad atacante de su equipo? Si os parece que sí, pensad que el conjunto de categorías mencionado tiene una buena validez de contenido. Si creéis que habría que añadir las "pérdidas de balón" y las "faltas en ataque", entonces estáis cuestionando la validez de contenido del conjunto propuesto. Recordad que éste es uno de los modos posibles de expresar que ese código permite observar lo que pretendía: los aspectos relativos a la capacidad ofensiva de un jugador.
En el módulo anterior os presentamos el concepto de constructo. Recordad que un constructo es una variable teórica no directamente observable.
Cuando lo que pretendemos observar mediante un determinado código es un constructo, llegamos a una aparente contradicción: ¿cómo saber si hemos observado lo que pretendíamos cuando no lo podemos observar? No penséis que os estamos gastando una broma. Queremos, simplemente, que os percatéis del adverbio directamente. Es decir, cuando utilizamos un conjunto de indicadores para observar indirectamente un constructo, podemos preguntarnos si ese conjunto nos permite observar lo que pretendíamos. Dicho de otro modo, podemos preguntarnos sobre su validez de constructo.
La validez de constructo es el grado en que un conjunto de indicadores acumulan evidencia a favor de la variable no directamente observable.
Siguiendo con el baloncesto, la estatura de un jugador es algo directamente observable; su rapidez, también. Pero su capacidad ofensiva... La capacidad ofensiva es un constructo. Es algo no directamente observable. Utilizamos una serie de indicadores que sí son directamente accesibles al observador para inferir la capacidad ofensiva de un jugador. Según definamos el constructo, el conjunto de indicadores observables necesarios para inferirlo será mayor o menor. Si consideramos que un jugador es buen atacante cuando anota puntos para su equipo, bastarán las tres categorías de anotación para inferir su calidad. Si pensamos que la capacidad ofensiva de un jugador tiene que ver también con que participe en las jugadas anotadoras, entonces incluiremos "asistencias", "rebotes ofensivos", "robos de balón"... El conjunto de las categorías elegido tendrá una buena validez de constructo si realmente informa sobre lo que la teoría del baloncesto considera que es un buen atacante.
La tercera variante del concepto de validez aplicado a la observación es la validez referida al criterio. Hace referencia al grado en que un código de observación detecta variaciones en aquello que pretende observar.
Cuando hablábamos del nivel de detalle relativo a la modalidad de anotación veíamos que no podríamos distinguir entre dos tipos de jugadores atacantes si no manejábamos un nivel superior de detalle. La categoría gruesa, "puntos anotados", sin más especificaciones, hacía que el código no permitiera recoger variaciones que resultan relevantes para elegir al mejor atacante en situación de tiro exterior a la zona de defensa del equipo contrario. La categoría así formulada resta validez al código cuando se orienta -se usa- para ese criterio: "mejor atacante exterior". Cuando incluimos las tres modalidades de puntos, ganamos sensibilidad, ganamos capacidad de detección de diferencias entre cualidades de atacante; en suma, ganamos validez referida a este criterio.
Todos estos controles de calidad que implican las preguntas sobre la fiabilidad y la validez de un código o de un proceso de observación suelen hacerse empíricamente.
Recordad el último paso en el procedimiento para elaborar un código. Era necesario depurar las categorías. Calcular el grado de acuerdo entre observadores que generan o preguntarse si como conjunto son una muestra representativa es algo que hacemos después de un periodo de observación.
Existen, sin embargo, algunas fuentes potenciales de error que conviene conocer antes de llevar a cabo cualquier proceso observacional.
Presentamos dos que consideramos de gran importancia y de fácil asimilación. Una proviene del observador y la otra del observado.
Cuando un observador se ha tomado la molestia de ir a recoger datos para poner a prueba alguna hipótesis o responder alguna pregunta, lo lógico es que tenga alguna expectativa sobre qué curso de los acontecimientos encajaría mejor con su hipótesis o pregunta. Esta expectativa puede convertirse en una fuente de error al hacer categorizar de forma errónea algún elemento del fenómeno. En los casos dudosos, las canastas de tres puntos se catalogan, o no, en función de qué equipo sea el anotador. En el relato que hacíamos del final del partido, los espectadores y los miembros del equipo atacante han visto canasta de tres. Los árbitros -y seguro que los visitantes- han visto canasta de dos. Las diferentes apreciaciones no son un problema del cinismo del observador. El observador no hace trampa al observar lo que observa, simplemente sus expectativas le llevan a error.
La manera de controlar este posible sesgo es poner a observar alguien que sea ajeno a los objetivos de la investigación. Esto suele hacerse entrenando a estudiantes de últimos años o a investigadores en formación a los que se informa de los objetivos, al final del proceso. Mientras dura la observación decimos que son observadores ciegos. Por eso los árbitros no son de ningún equipo. O, al menos, eso se supone...
La otra fuente de problemas proviene del sujeto al que observamos. Está demostrado que los seres vivos reaccionamos al hecho de ser observados. Cuando notamos la presencia de alguien que observa, dejamos de comportarnos con naturalidad y, por tanto, ya no se nos observa en las condiciones en que se pretendía. Este fenómeno se denomina reactividad. El jugador novato, recién ascendido, que rinde mal al ver tanta gente observándolo en la cancha, sería un ejemplo de reactividad. Hay dos maneras de obviarla: mediante engaño (no descubrir la cámara hasta el final) o mediante habituación. Por supuesto, hay situaciones que pertenecen a la esfera privada de las personas y que no podemos observar ni aunque después les avisemos de que lo hicimos.

Actividades

Las actividades de este módulo didáctico deben realizarse en la versión web del material.