xmlns:xi="http://www.w3.org/2003/XInclude" xmlns:qti="http://www.imsglobal.org/xsd/imsqti_v2p1" Fundamentos de la investigación Fundamentos de la investigación

¿Cómo se ejecuta una investigación?

  • Francesc Salvador i Beltran

    Doctor en Psicología por la Universidad de Barcelona (1986) y catedrático de Psicología Experimental de la misma universidad (2010). Imparte docencia de las asignaturas Etología y evolución de la conducta y Psicometría en la Unidad de Psicología Cuantitativa de la Universidad de Barcelona y es profesor consultor de la Universitat Oberta de Catalunya. Secretario del Comité de Dirección del Instituto de Neurociencias de la Universidad de Barcelona y miembro del Instituto de Investigación Pediátrica Hospital Sant Joan de Déu. Sus intereses de investigación son los fundamentos filogenéticos de la conducta social, que estudia empleando simulación informática y métodos comparados y de observación naturalista. Investiga las estructuras y la organización social de los cercopitécidos y los desplazamientos colectivos coordinados en varias especies. Publica los resultados de la investigación en revistas científicas especializadas y también ha publicado varios manuales sobre métodos experimentales en psicología.

PID_00236030
Ninguna parte de esta publicación, incluido el diseño general y la cubierta, puede ser copiada, reproducida, almacenada o transmitida de ninguna forma, ni por ningún medio, sea éste eléctrico, químico, mecánico, óptico, grabación, fotocopia, o cualquier otro, sin la previa autorización escrita de los titulares del copyright.

1.Hipótesis y variables

El objetivo de la fase de delimitación del problema y establecimiento de objetivos es determinar claramente en qué consistirá nuestra investigación («¿qué queremos saber?» y «¿por qué lo queremos saber?»). Lo conseguimos revisando los conocimientos del tema de la investigación, tanto las elaboraciones teóricas como los hechos empíricos que las respaldan, los cuales pueden tener diferentes niveles de desarrollo según la problemática a la que nos enfrentamos, desde construcciones teóricas bien formalizadas a nivel lógico y matemático hasta elaboraciones teóricas mínimas; o desde gran cantidad de evidencia empírica acumulada hasta unos referentes empíricos pobres o poco consistentes.
El estado de conocimientos determina qué tipo de pregunta de investigación podremos formular. Así, si la construcción teórica es escasa y hay poca evidencia empírica que la respalde, puede resultar muy arriesgado formular preguntas que relacionen causalmente dos o más variables, y seguramente será mucho más productivo formular cuestiones que pregunten por la existencia o la descripción de alguna o algunas variables. Pero si sucede justo lo contrario, será mucho más productivo arriesgarnos a preguntar sobre relaciones minuciosas entre variables. Sea un caso o el otro (o, como siempre, todo un abanico posible de situaciones intermedias), para obtener una respuesta a la pregunta de investigación será necesario recurrir a la observación empírica de las variables a las que hace referencia la pregunta.

1.1.Pregunta de investigación y respuesta tentativa

La pregunta de investigación delimita las variables que hemos de observar y, si es necesario, las relaciones que hay entre ellas. Para observar las variables resulta útil dar una respuesta tentativa a la pregunta. Así, si nos preguntábamos si hay algún insecto que transmita el virus del Zika, habrá que delimitar la investigación a algunos tipos de insectos que pueden ser portadores de virus, por ejemplo los mosquitos. Si disponemos de suficiente información, podemos afinar aún más y limitar la investigación a un determinado género de mosquitos transmisores de enfermedades, como los mosquitos del género Aedes. Así, a la pregunta «¿hay algún insecto que transmita el virus del Zika?» podemos responder: «hay un mosquito del género Aedes que lo transmite». La respuesta es especulativa porque no está comprobada empíricamente, pero razonable porque se hace basándose en la información que proporcionan unos conocimientos previos.
La respuesta tentativa que damos a la pregunta de investigación tiene la utilidad de acotar el conjunto de variables al que hemos de dirigir nuestra observación empírica. La respuesta a la pregunta de si el déficit de atención provoca bajo rendimiento escolar será afirmar que, en efecto, el déficit de atención provoca bajo rendimiento escolar. Para comprobar si la respuesta es correcta, será necesario observar las dos variables y la relación que existe entre ellas. Cuanto más afinada sea la pregunta, más afinada será también la respuesta, y más específica la comprobación empírica, que se dirigirá a un núcleo más reducido de variables.
Si la pregunta se formula a partir de un cuerpo teórico bien estructurado y con una sólida base empírica, esta deberá ser necesariamente muy afinada para que su posible respuesta produzca un incremento de conocimiento; en caso contrario, obtendremos conocimientos redundantes. La redundancia de los conocimientos, si bien refuerza la teoría, también puede ser banal al proporcionar respuestas obvias. Es evidente que cada vez que empujamos el bolígrafo fuera de los límites de la mesa y se cae al suelo reforzamos la teoría de la gravitación universal, pero no per ello decimos que hemos hecho un avance en el conocimiento. Una pregunta afinada proporciona una respuesta tentativa igualmente afinada, que será la consecuencia lógica de una estructura teórica bien consolidada y con buen soporte empírico. En este caso, tal como comentábamos en el módulo didáctico «¿Cómo se planifica una investigación?», decimos que hemos formulado una hipótesis. En otros casos, si bien no hablamos estrictamente de hipótesis, la respuesta tentativa limita el conjunto de variables que deberemos observar (en la investigación del insecto que transmite el virus del Zika, observaremos mosquitos del género Aedes, no cualquier tipo de mosquito).

1.2.Vías deductiva, inductiva e hipotética-deductiva

Una manera de responder tentativamente a las preguntas puede ser a partir de deducciones del cuerpo teórico. Así, si se sabe que uno de los síntomas de las fobias es la ansiedad y se sabe también que determinadas técnicas inducen a la relajación, que es una respuesta incompatible con la ansiedad, fácilmente podremos deducir que una terapia de las fobias que incorpore componentes de relajación se espera que sea más efectiva que otra que no las incorpore.
En este caso, hemos llegado a formular la hipótesis por una vía que podemos denominar deductiva. También puede ser que la estructura del cuerpo teórico sea más débil, pero a cambio disponga de un conjunto de evidencias empíricas consolidadas. Por ejemplo, conocemos que los mosquitos son buenos transmisores de enfermedades virales, que la zona de detección inicial del virus del Zika (un bosque cerca de Entebbe, en Uganda) es compatible con la presencia de mosquitos del género Aedes (como el Aedes aegypti), etc. Así pues, podemos reunir todas las evidencias acumuladas y proponer al mosquito de la especie Aedes aegypti como un transmisor del virus del Zika. En este caso, hemos dado una respuesta por una vía que podemos denominar inductiva.
Nomenclatura binomial
En 1731, Carl von Linné propuso una nomenclatura para denominar, de manera inequívoca, a los seres vivos. Cada especie se denomina con dos palabras en latín (o latinizadas): el género (que se escribe en mayúscula y cursiva) y la especie (en minúscula y cursiva). Así, por ejemplo, se denomina Canis familiaris al perro doméstico, donde Canis hace referencia a características que comparte con otras especies cercanas como el lobo, el coyote o el chacal (Canis lupus, Canis latrans y Canis aureus, respectivamente), y donde familiaris hace referencia a las características propias.
Bien sea por una vía o por otra, el punto clave es proporcionar una respuesta tentativa a la pregunta de investigación, tanto si es en forma de hipótesis derivada formalmente de una teoría o en forma de delimitación de un conjunto de variables. De hecho, entre los dos extremos que hemos ilustrado (vías deductiva e inductiva, respectivamente), suele ser más habitual una especie de combinación de las dos vías, o vía hipotética-deductiva, en la que la respuesta tentativa se apoya en hipótesis (más o menos refinadas) derivadas del cuerpo teórico y hechos empíricos más o menos estructurados.
En definitiva, el investigador utiliza todo el conocimiento previo del que dispone para proponer una posible respuesta a la pregunta de investigación, que será o bien una hipótesis en sentido estricto o bien la delimitación de unas variables o valores de variables de las que se espera la respuesta. Tanto en un caso como en el otro, efectuamos afirmaciones sobre lo que se espera obtener (por ejemplo, «hay un mosquito del género Aedes que transmite el virus del Zika» o «el déficit de atención provoca bajo rendimiento escolar»).
La observación empírica apoyará o no aquello que afirmamos porque aceptando o rehusando la afirmación damos respuesta a la pregunta de investigación. Si aceptamos la afirmación, hemos encontrado la solución al problema planteado en la pregunta de investigación. Si no la aceptamos, no hemos encontrado la solución, pero ya hemos visto que a menudo el rechazo nos proporciona información que sirve para formular nuevas preguntas (y a su vez nuevas hipótesis o variables tentativas para someter a comprobación empírica).

1.3.La medida de las variables

La hipótesis, o cualquier delimitación tentativa de las variables de investigación, nos señala qué variables, valores de variables o relaciones entre ellas deberemos someter a contrastación empírica. Para hacerlo emplearemos las definiciones operacionales de las variables (que ya hemos visto en el apartado «El planteamiento de objetivos: la investigación basada en la evidencia» del módulo didáctico «¿Cómo se planifica una investigación?»). Una manera de hacer la definición operacional de una variable es midiéndola. Introduciremos unas breves nociones de teoría de la medida, veremos cómo podemos medir variables y qué utilidad puede tener la medida de estas en el proceso de investigación.
Medir es representar mediante números propiedades de los objetos empíricos, siguiendo determinadas reglas de representación (Campbell, 1952). Como las propiedades de los objetos empíricos constituyen variables, habrá que representar con números los valores que toman las variables. La representación, sin embargo, no puede ser arbitraria. Supongamos que se puede estar nada, un poco, bastante o muy de acuerdo con una opción política, que son los niveles en los que puede variar la variable concordancia con una opción política. Si usamos los números 1, 2, 3 y 4 para representar cada uno de los posibles niveles de la variable concordancia con una opción política, de modo que a nada de acuerdo asignamos el 1, a un poco de acuerdo el 2 y así sucesivamente, habremos sido consistentes en hacer corresponder cada uno de los números a cada nivel de acuerdo, porque estar nada de acuerdo es estar menos de acuerdo que estar bastante de acuerdo, y el número que hemos asignado a nada de acuerdo es más pequeño (el 1) que el número que hemos asignado a bastante de acuerdo (el 2). El hecho empírico de estar menos de acuerdo queda representado por la propiedad de los números ser más pequeño que (<) porque estar nada de acuerdo es estar menos de acuerdo que estar bastante de acuerdo y 1 < 2 (la relación entre los números refleja la relación entre los elementos empíricos). No podemos asignar de manera arbitraria cualquier número a nada, un poco, bastante o muy de acuerdo, sino que estos deben respetar el orden. Cualquier conjunto de cuatro números que respeten el orden es válido para hacer la representación numérica de la variable concordancia con una opción política (por ejemplo: 45, 56, 109 y 2.324; pero también los números –2, 3,4, 45 y 45,1).
Fijémonos en que en el ejemplo del párrafo anterior la clave se encuentra en respetar el orden. Podemos aprovechar la propiedad de los números ser menor que, tal como hemos hecho en el ejemplo, pero también la propiedad ser mayor que y asignar 4, 3, 2 y 1 (donde a nada asignamos el 4 y a mucho, el 1). Lo mismo hacemos cuando asignamos el 1 al primer corredor que llega a la meta, el 2 al segundo, etc. (al más rápido le asignamos el 1, al siguiente el 2, etc.): una secuencia ordenada de elementos empíricos se puede representar por números progresivamente menores o progresivamente mayores porque en los dos casos respetamos el orden.
Medir las variables, es decir, asignar valores numéricos, permite una mayor manejabilidad de los datos, como tabularlos o hacer operaciones entre los números. En el análisis de los datos, las operaciones entre números permiten sintetizarlos y obtener indicadores que ayuden a tomar con más claridad decisiones sobre la hipótesis o las variables de interés para la investigación. Ahora bien, las operaciones que hacemos en el análisis solo proporcionan una información correcta si la variable ha sido medida de manera correcta. Si los números elegidos para medir la variable concordancia con una opción política no reflejan el orden, entonces la representación será inadecuada (o, lo que es lo mismo, la variable no habrá sido medida de manera correcta). Para determinar si hemos hecho bien la representación numérica, deberemos conocer con qué propiedades empíricas nos podemos encontrar y cómo las podemos representar con números. Cada manera de hacer la asignación numérica proporcionará lo que llamaremos una escala de medida.

1.4.Escalas de medida: taxonomía de Stevens

Las escalas de medida nos permiten poner en correspondencia las propiedades empíricas que definimos en las variables y la manera de hacer la asignación numérica. Básicamente podemos distinguir cuatro escalas de medida, que denominaremos nominal, ordinal, intervalo y razón. Veamos a continuación qué propiedades representamos con cada una.
Hemos visto en el ejemplo de la variable concordancia con una opción política que la propiedad que deben representar los números es el orden. Veamos otro caso. Supongamos que una investigación se dirige a establecer los tipos de mosquito que hay en una determinada zona (es decir, plantearía una pregunta de clasificación) y que lo haremos según la categoría taxonómica género (Anopheles, Bironella, Chagasia, etc. y así hasta unos cuarenta y tres géneros). La variable género de los mosquitos podrá tomar cuarenta y tres valores, que corresponden a cada uno de los cuarenta y tres géneros: un mosquito podrá pertenecer al género Anopheles, o al género Bironella o al género Chagasia, o bien a alguno de los otros cuarenta. Si queremos medir la variable género de los mosquitos, deberemos garantizar que la asignación numérica refleja el hecho de que son géneros diferentes. Lo único que habrá que hacer es asignar números diferentes a cada género. Por ejemplo, al género Anopheles le asignamos el 1, al género Bironella el 2, al género Chagasia el 3, y así sucesivamente. Aprovechamos que 1, 2, ..., 43 son números diferentes para reflejar el hecho empírico de que hay géneros diferentes. La escala de medida corresponde a lo que denominamos escala nominal según la taxonomía de Stevens.
Una escala nominal permite distinguir entre elementos diferentes porque a cada elemento le corresponde un número diferente: números diferentes indican elementos diferentes, mientras que números iguales indican elementos iguales. Pero como la única propiedad que se aprovecha de los números es el hecho de ser números iguales o diferentes, pueden ser reemplazados por cualquier otro código que, de manera consistente, asigne el mismo símbolo a elementos iguales y un símbolo diferente a elementos distintos (por ejemplo, podemos usar las letras del alfabeto latino: A, B, C, etc.). A pesar de su sencillez, una variable medida en una escala nominal permite hacer recuentos de los valores de la variable. Si asignamos el 1 a los niños y el 2 a las niñas de la variable sexo (o bien la A a los niños y la B a las niñas, o efectuamos la asignación según cualquier otra codificación sistemática), el recuento de los 1 y de los 2 proporciona la frecuencia de niños y niñas respectivamente, a partir de las cuales podremos efectuar operaciones matemáticas, por ejemplo de tipo estadístico (como obtener la moda o coeficientes de contingencia entre variables).
El ejemplo que hemos desarrollado más arriba de la variable concordancia con una opción política corresponde a una escala ordinal. La propiedad que deben reflejar los números es el orden. Las propiedades que es capaz de representar una escala ordinal se acumulan a las que es capaz de representar una escala nominal porque para poder establecer un orden hace falta también poder distinguir: si queremos poner a alguien delante de otro, antes hace falta que sepamos quién es cada cual. Para ordenar de menos a más el acuerdo con una opción política, será necesario que diferenciemos primero los grados de acuerdo: diferenciamos los que tienen nada de acuerdo de los que tienen poco de acuerdo, y después podremos poner los que tienen nada de acuerdo delante de los que tienen un poco de acuerdo. Si respetamos la regla según la cual a un nivel de acuerdo más pequeño que otro le asignamos también un número más pequeño que otro, las asignaciones numéricas reflejarán los diferentes tipos de acuerdo posibles y los ordenarán (el 1 y el 2 son números diferentes y, además, 1 < 2).
La tercera escala de medida que propone Stevens es la escala de intervalo, que además de distinguir y ordenar elementos incorpora la proporcionalidad entre los valores de la escala. Por ejemplo, cuando se mide la variable temperatura en grados centígrados y se asigna 35 a una determinada temperatura y 40 a otra, se espera que la diferencia empírica de temperatura entre las temperaturas que representan los números 35 y 40 sea la misma diferencia que hay entre las temperaturas que representan los números 20 y 25. Esta igualdad de diferencias también se espera que se mantenga para cualesquiera cuatro temperaturas que muestran determinada diferencia entre ellas: la diferencia empírica de temperatura entre las temperaturas que representan los números 52 y 53 debe ser la misma que la diferencia empírica de las temperaturas que representan el números 84 y 85, y así sucesivamente para cada tétrada de temperaturas.
Observemos que, si bien la escala para medir la variable temperatura en grados centígrados puede asignar el número cero (y, de hecho, lo asigna a aquella temperatura en la que se congela el agua), el número cero no representa la ausencia de temperatura, es decir, el hecho de que no haya temperatura. En una escala de intervalo se dice que el número cero se asigna de manera arbitraria porque su asignación no representa aquella circunstancia en la que la variable no está presente.
En muchas variables puede darse el caso de que, bien por dificultades de acceso a la variable o bien por la conceptualización que se hace de ella, no se pueda o no tenga sentido determinar empíricamente la ausencia de la variable. Así, podemos aplicar una prueba psicológica de inteligencia a unos individuos y representar numéricamente la inteligencia que hemos observado. Uno de los números que podemos asignar es el 0, pero 0 no indica que no haya inteligencia (igual que asignar 0 a una determinada temperatura no indicaba la ausencia de temperatura).
En una escala de razón, el cuarto tipo de escala de la taxonomía de Stevens, el número cero se reserva para representar la ausencia de la variable. Por ejemplo, si medimos la variable distancia entre dos objetos físicos, como una mesa y una silla, y estos están tocando el uno con el otro, diremos que no hay distancia entre ellos (la variable distancia está ausente entre la mesa y la silla). Para representar la ausencia de la variable, emplearemos el número cero. A diferencia de las escalas de intervalo, las escalas de razón hacen una asignación no arbitraria del número cero. Las escalas de razón acumulan, además, las capacidades de representación de las otras tres escalas: distinguir elementos diferentes, ordenarlos y establecer una proporcionalidad entre ellos. Las cuatro escalas de la taxonomía de Stevens siguen un orden acumulativo según las propiedades de los objetos empíricos que son capaces de representar: nominal < ordinal < intervalo < razón.

1.5.Medidas idemnóticas, vaganóticas y recuentos

Fijémonos en que una escala de razón permite establecer fácilmente un patrón fijo que sirva de unidad para hacer las asignaciones numéricas. Así, podemos tomar de patrón la distancia que va desde no haber ninguna distancia (los objetos están juntos, y lo representamos con el 0) hasta una determinada distancia arbitraria entre los objetos. Entonces, cuando queremos medir la distancia entre dos objetos cualesquiera, tomaremos el patrón que hemos establecido y veremos cuántas veces cabe entre estos objetos. Si, por ejemplo, cabe tres veces, asignaremos el 3 a aquella distancia. Cualquier distancia entre dos objetos la podremos expresar como un múltiplo o un submúltiplo del patrón fijo, que será la unidad de medida. Es lo que se produce cuando medimos una distancia. Si tomamos el metro de patrón fijo, toda distancia se podrá expresar numéricamente como el número de veces que contiene el patrón metro (por ejemplo, 50 si lo contiene cincuenta veces o 0,5 si lo contiene media vez). Siguiendo esta estrategia, obtenemos un tipo de medida que denominamos idemnótica. Todas las asignaciones numéricas que se puedan hacer del mismo modo que lo hemos hecho con la variable distancia serán medidas idemnóticas.
La estrategia de asignar valores numéricos en función de un patrón fijo es posible si se dispone de un punto de anclaje empírico desde donde fijar el patrón que actúa de unidad de medida. Este punto lo tenemos en las variables en las que podemos identificar dónde hay ausencia de propiedad, que se toma de referencia para establecer el patrón desde no haber propiedad hasta un cierto nivel de esta (es lo que se hizo cuando se estableció que determinada distancia será un metro, determinada capacidad un litro o determinada superficie un metro cuadrado, etc.). Ahora bien, hemos visto variables en las que no es posible detectar la ausencia de propiedad (o no tiene sentido por la manera como hemos conceptualizado la variable), por lo que no disponemos de ningún punto de anclaje empírico desde donde establecer el patrón que nos sirva de unidad de medida. La estrategia para obtenerlo deberá ser diferente. Supongamos que aplicamos unas pruebas de inteligencia y observamos qué ejecuciones han hecho los individuos, que serán diferentes de un individuo a otro. Estaremos observando la variabilidad de la variable inteligencia. En función de cuál haya sido esta variabilidad, estableceremos arbitrariamente dos niveles de ejecución, cuya diferencia establecerá la unidad de medida. A cualquier ejecución que un individuo haga de estas pruebas de inteligencia le asignaremos un número comparando la ejecución concreta que ha hecho el individuo con la ejecución que corresponde a la unidad de medida. Esta estrategia nos proporciona medidas que denominaremos vaganóticas.
Podemos obtener un tercer tipo de medida, que consiste en hacer recuentos. Por ejemplo, de la variable género de los mosquitos podemos contar cuántos Anopheles, Bironella, Chagasia, etc., tenemos en una muestra recogida en un trabajo de campo. Si para manejar mejor la información configuramos una tabla en la que indicamos Anopheles = 1, Bironella = 2, Chagasia = 3, etc., de manera que obtenemos una tabla de números, podremos contar el número de 1, de 2, de 3, etc., que hay en la tabla y, por lo tanto, obtener la frecuencia.

1.6.Medidas discretas y continuas

Fijémonos ahora en la escala de medida que hemos utilizado para la variable concordancia con una opción política: nada = 1, un poco = 2, bastante = 3 y mucho = 4. Solo podemos usar unos determinados valores (1, 2, 3 y 4, respectivamente), y no números que representen posiciones intermedias porque se puede ser el tercero o el cuarto, pero no el tercero y medio. Lo mismo sucede con la variable género de los mosquitos, en la que un individuo puede o no pertenecer al género Anopheles, pero no una parte del individuo al género Anopheles y otra al género Bironella. La medida que se obtiene cuando se emplean escalas ordinales o nominales es de tipo discreto.
Veamos ahora la escala de medida que hemos utilizado para la variable distancia entre dos objetos. Podemos representar la distancia por 1, 2 o 50 en función de las veces que encaja el patrón fijo (una, dos o cincuenta veces), pero también la podemos representar por 0,25 si encaja un cuarto de patrón, o por 26,3 si encaja veintiséis veces y un tercio. Podemos usar tantos números como nos permita la precisión de nuestro instrumental. La medida que se obtiene cuando se emplean escalas de razón o de intervalo es de tipo continuo.
Hacer medidas de las variables permite disponer de unas definiciones operacionales que nos pueden ser muy útiles cuando debamos hacer las observaciones empíricas para obtener los datos, y también para hacer los análisis. De la diferente tipología de medidas según las reglas de asignación numérica (escalas de medida), de la estrategia de medida (idemnótica, vaganótica y recuento) o del tipo de valores numéricos (discretas o continuas) dependerá qué información obtendremos de las variables y también, cuando sea necesario, qué estrategia de análisis de los datos usaremos.

1.7.Los errores de medida

Si hemos definido unas reglas de asignación numérica (es decir, disponemos de una escala de medida), podemos representar numéricamente las observaciones empíricas que efectuamos de las variables (es decir, podemos medir). Ahora bien, cuando hacemos la operación de medir, no estamos exentos de cometer errores, que no son otra cosa que una discrepancia entre la asignación numérica que efectuamos en la propiedad empírica que queremos medir y la asignación que realmente deberíamos efectuar. Así, podemos mirar mal el termómetro y registrar una temperatura de 25 grados centígrados, cuando en realidad la temperatura es 25,5 grados porque el termómetro en realidad marca 25,5. Si siempre que consultamos el termómetro cometemos el mismo error (por ejemplo, porque los indicadores están un poco borrosos y siempre nos hacen confundirnos en el mismo sentido), hemos cometido un error sistemático. Por el contrario, si el termómetro que usamos no es bastante preciso y solo es capaz de marcar de medio grado en medio grado, de modo que las diferencias de temperatura menores de medio grado las muestra en medio grado inferior o en medio grado superior según si la temperatura empírica se acerca más a uno o al otro, entonces el error que se produce es de tipo aleatorio. En ambos casos, sin embargo, hay un discrepancia entre el valor empírico de la variable que observamos y la medida que hemos registrado (registramos 25 y deberíamos registrar 25,5; o la temperatura corresponde a 25,3, pero el termómetro nos marca 25,5), es decir, en los dos casos hemos cometido un error de medida.
Los errores de medida sistemáticos son evitables si conocemos su causa (podemos limpiar los indicadores del termómetro para ver más claramente), o los podemos corregir con facilidad si sabemos su magnitud (como sabemos que vemos medio grado menos, cada vez que registramos añadimos medio grado al registro). Pero si se produce un error sistemático y desconocemos que se está produciendo este error, las consecuencias pueden ser muy negativas. Podremos concluir que la temperatura que produce una reacción química es excesiva porque sobrepasa el umbral que establece un protocolo de seguridad, pero en realidad la reacción no ha sobrepasado el umbral, sino que ha sido consecuencia de una mala lectura repetida del termómetro (un error sistemático de medida).
Los errores de medida aleatorios tienen unas consecuencias diferentes de los errores sistemáticos. En nuestro ejemplo, si no cambiamos de termómetro a otro más preciso, no podremos evitarlos; pero unas veces nos proporcionará valores al alza y otras a la baja, según la temperatura real se acerque más o menos a lo que es capaz de detectar. En un número repetido de registros, los valores al alza se compensarán con los valores a la baja, de modo que de media nos acercaremos mucho al valor empírico real. De hecho, como a menudo accedemos a las variables y efectuamos su asignación numérica mediante instrumentos, incluso en los más precisos habrá una discrepancia entre el valor empírico real y el número que nos muestra el instrumento. Si la distribución de los errores de un conjunto de medidas es realmente aleatoria, podemos estimar qué efecto tiene sobre el valor real y evaluar el alcance que este error tiene sobre nuestras observaciones (volveremos sobre este tema en el apartado «Datos, teoría y modelos» del módulo didáctico «¿Cuál es el producto de la investigación?»).
Figura 1. Cuadro resumen de la definición y características de la medida y de los errores de medida.
Figura 1. Cuadro resumen de la definición y características de la medida y de los errores de medida.
En este apartado hemos caracterizado las diferentes maneras de presentar una respuesta tentativa a la pregunta de investigación (y la importancia de hacerlo). También hemos mostrado que al dar la respuesta tentativa fijamos las variables que deberemos observar a nivel empírico, las cuales podremos definir con procesos de medida para ponerlas en situación de ser observadas. Hemos destacado la importancia de la medida y hemos indicado algunas características relevantes de esta y de sus errores (ved la figura 1). En el siguiente apartado, avanzaremos un paso más en las fases de aplicación del método científico y mostraremos las nociones básicas de la planificación y ejecución de las observaciones empíricas.

2.Planificación de las observaciones empíricas

Veíamos que la contrastación empírica nos dará la información sobre la que decidiremos si unos determinados conocimientos son correctos o hay que cambiarlos, o bien si se pueden afinar más. Cuando se ha formulado la pregunta de investigación, se le ha dado una respuesta tentativa y se ha realizado una definición operacional de las variables (a veces con procesos de medida), nos encontramos en condiciones de hacer las observaciones empíricas. El objetivo será obtener unos datos que nos permitan decidir si la respuesta tentativa que habíamos adelantado es adecuada y, en función de la decisión que tomemos, evaluar si hemos sido capaces de responder a la pregunta de investigación.
Incluso en el supuesto de que la pregunta de investigación sea sencilla e implique pocas variables, nunca es recomendable empezar directamente la observación de estas. Siempre es necesaria una planificación previa que indique dónde encontraremos las variables, cómo accederemos a sus valores, durante cuánto tiempo las observaremos y cómo haremos los registros, etc. Todas estas cuestiones deben quedar establecidas en una planificación previa (recordemos que hemos definido los datos como los registros obtenidos de las variables bajo condiciones planificadas). Las observaciones ocasionales o sin una planificación previa proporcionan muy a menudo informaciones anecdóticas o llevan a obtener observaciones contaminadas por otras variables que no corresponden a aquello que buscábamos. La información ocasional o no planificada no será válida para tomar decisiones sobre la hipótesis o las variables sobre las que hemos fijado nuestro interés, por lo que habrá que hacer una planificación que guíe el proceso de observación empírica de las variables. Esto no es obstáculo para que en el decurso de una investigación en ocasiones se puedan obtener algunos datos que llevan a resultados del todo inesperados. Estos descubrimientos por casualidad, que se denominan descubrimientos por serendipity, pueden producirse algunas veces y proporcionar información para abrir nuevas preguntas de investigación (ved, por ejemplo, Honeck, 1986).
Si a pesar de haber efectuado la planificación con cuidado, durante la realización de las observaciones nos damos cuenta de que había elementos o circunstancias que no habíamos previsto (y como, de hecho, no lo podemos prever todo, esta no suele ser una situación infrecuente), hay que parar el proceso de observación de las variables. Detectado cuál era el imprevisto, hay que rehacer la planificación y, solo entonces, volver a la observación. En la mayoría de los casos, los datos obtenidos antes de detectar el imprevisto deberán ser descartados. A pesar del contratiempo que esto pueda suponer, más vale asegurarse de que los datos serán adecuados para tomar decisiones que quedarse con unos datos contaminados que serán inútiles o engañosos, haciéndonos tomar decisiones incorrectas.
Para minimizar el riesgo de vernos obligados a parar las observaciones y perder datos, a veces es recomendable probar el plan. Esto nos permite someter a prueba procedimientos, maneras de acceder a las variables, instrumental, etc., con el objetivo de asegurar que todos los elementos que constituyen el plan son adecuados, o darnos cuenta de las correcciones y mejoras que hay que introducir. Esta prueba-piloto (o pruebas-piloto, si se hacen varias) no tiene el objetivo de proporcionar datos para tomar ninguna decisión, sino comprobar si la planificación de las observaciones es adecuada.
La manera de observar las variables depende mucho del contenido de cada investigación. Ya hemos comentado que existen multitud de técnicas porque las variables de interés pueden ser también muy diversas. Es evidente que la manera de observar y registrar la luminosidad de una estrella no es la misma que la manera de detectar los componentes que resultan de una reacción química o la de obtener la opinión de unas personas sobre un determinado tema. Todas son variables (luminosidad, componentes y opinión) que pueden ser foco de interés en una investigación, pero la manera que tendremos de acceder a ellas es completamente diferente porque los objetos a los que hacen referencia también son diferentes (un astro, unos elementos químicos y unos individuos, respectivamente).

2.1.Variabilidad intraindividual e interindividual

La primera cuestión que habrá que plantear, y que será crucial para decidir cómo procederemos a observar las variables, es qué variabilidad pueden manifestar las variables que registramos. Por ejemplo, inicialmente podemos asumir que un átomo de hidrógeno es esencialmente idéntico a cualquier otro átomo de hidrógeno del universo, de modo que las variables que definen los átomos de hidrógeno se manifestarán por igual en cualquier átomo de hidrógeno que observemos.
Si observamos la variable número atómico en un átomo de hidrógeno (que es el número de protones del núcleo del átomo), siempre contaremos un protón, sin importar en qué átomo de hidrógeno hayamos hecho la observación. O lo que es el mismo, no habrá variabilidad intraindividual (en todos los átomos de hidrógeno contamos el mismo número de protones).
Observemos ahora la variable número atómico en un átomo de helio. Siempre contaremos dos protones (tampoco habrá variabilidad intraindividual). Los átomos de hidrógeno y de helio variarán entre ellos en la variable número atómico, y siempre lo harán del mismo modo (como en un átomo de hidrógeno siempre contaremos un protón y en un átomo de helio siempre contaremos dos, un átomo de hidrógeno siempre variará en un protón respecto a un átomo de helio). La variabilidad interindividual que observamos será siempre la misma.
La situación es diferente si observamos la variable longitud total del cuerpo de un mosquito de la especie Aedes aegypti. Las longitudes del cuerpo de dos mosquitos Aedes aegypti, a pesar de que hayamos tenido cuidado de seleccionarlos en la misma fase de desarrollo, serán muy parecidas pero no exactamente los mismas. A diferencia del número atómico de un átomo de hidrógeno, que será idéntico para cualquier átomo de hidrógeno, las longitudes del cuerpo de los mosquitos Aedes aegypti mostrarán una variabilidad de un individuo a otro. Si comparamos la longitud del cuerpo de un mosquito Aedes aegypti con la de un mosquito Culex pipiens, observaremos que son diferentes entre ellas. Pero si tomamos otro mosquito Aedes aegypti y otro mosquito Culex pipiens, a pesar de encontrar valores diferentes de la variable longitud total del cuerpo entre ellos, la diferencia no será idéntica a la que habíamos encontrado entre los otros dos ejemplares, aunque será muy similar. Observaremos una variabilidad intraindividual (de los mosquitos de la misma especie), aunque muy pequeña; y observaremos también que la variabilidad interindividual (entre mosquitos de especies diferentes) no se mantendrá igual, a pesar de que seguramente se asemejarán mucho entre ellas.
Repitamos una vez más este ejercicio y observemos la variable concordancia con una opción política en un grupo de individuos. El valor que tome la variable puede ser muy diferente de un individuo a otro. Pero también un mismo individuo puede cambiar de opinión, de tal manera que si observamos la variable en momentos distintos (por ejemplo, antes y después de unas elecciones), el valor que tome esta puede ser también muy diferente. Observaremos, por lo tanto, una gran variabilidad intraindividual (el mismo individuo puede mostrar valores diferentes de la variable según cuándo efectuemos la observación) y, consecuencia de esto, la variabilidad interindividual tampoco se mantendrá igual.
La figura 2 muestra los dos extremos de los ejemplos que hemos presentado. Encontramos un caso en el que no hay variabilidad intraindividual, como la variable número atómico del átomo de hidrógeno, y otro en el que sí la hay, como la variable longitud del cuerpo de los mosquitos o la variable concordancia con una opción política de unos individuos. Por otro lado, en la misma figura vemos un caso en el que observaremos siempre la misma variabilidad interindividual y otro en el que no. En el número atómico, siempre observamos la misma diferencia entre el átomo de hidrógeno y el átomo de helio, sin importar qué átomos de hidrógeno o helio tomamos, pero en las variables longitud del cuerpo y concordancia con una opción política, las diferencias entre especies de mosquito y entre individuos dependerá de qué mosquitos o qué individuos elijamos para observar la variable.
Figura 2. Representación esquemática de dos variables que muestran diferente variabilidad intraindividual (nula en la gráfica inferior de la figura) y también variación en la variabilidad interindividual, que mantiene la misma diferencia en la gráfica inferior y cambia en la gráfica superior.
Figura 2. Representación esquemática de dos variables que muestran diferente variabilidad intraindividual (nula en la gráfica inferior de la figura) y también variación en la variabilidad interindividual, que mantiene la misma diferencia en la gráfica inferior y cambia en la gráfica superior.
Obviamente, si cuando hacemos la definición operacional de la variable reducimos el número de valores que puede tomar, reduciremos también la variabilidad que podemos observar. Así, si definimos la variable concordancia con una opción política con los valores nada, un poco, bastante o muy de acuerdo (o sus medidas, por ejemplo: 1, 2, 3 y 4), la variabilidad que podemos observar será mayor que si la definición operacional de la variable se limita a los valores estar o no estar de acuerdo (o sus medidas: 1 y 2). Ahora bien, la información que proporciona la observación de la variable en este último caso es mucho menos minuciosa que en el caso anterior. La simplificación nos permite reducir variabilidad, pero reduce también la información que obtenemos porque también reduce la posibilidad de detectar variaciones entre individuos. Que podamos o no simplificar el número de valores de la variable depende del estado de la cuestión de los conocimientos de nuestro ámbito de investigación. Si realmente se tiene un desconocimiento total de la concordancia con una opción política de una población de individuos, una investigación tentativa en la que la variable se defina de manera operacional como estar o no estar de acuerdo puede aportar información útil. Pero si ya se dispone de información previa, definirla con valores dicotómicos no aportará nada nuevo y habrá que afinar más en la definición para obtener resultados que no sean banales (incluso puede resultar que la opción nada, un poco, bastante o muy de acuerdo sea todavía demasiado simple y haya que introducir más matices).

2.2.Elección de los sujetos de investigación

Si queremos mostrar la diferencia entre los átomos de hidrógeno y de helio en referencia a su número atómico, será indiferente el átomo de hidrógeno y el átomo de helio que elijamos, pero no lo será si queremos mostrar las diferencias entre individuos respecto a la concordancia con una opción política. Imaginémonos que elegimos unos cuantos individuos y observamos cuál es su acuerdo. Si por casualidad los individuos elegidos tienen todos un poco de acuerdo con la opción política, los resultados mostrarán que todo el mundo está solo un poco de acuerdo. Pero si por casualidad todos los individuos elegidos están muy de acuerdo, entonces los resultados mostrarán que todo el mundo está a favor de la opción política. Los resultados a los que lleguemos dependerán de qué individuos elegimos. Si para la variable número atómico es indiferente en qué sujetos de investigación observaremos la variable (qué átomos elegimos), para la variable concordancia con una opción política no lo es.
Una de las preguntas que deberemos responder es «¿qué sujetos elegimos para observar las variables de la investigación?». Si no hay variabilidad intraindividual, como en el ejemplo del hidrógeno y del helio, la preocupación por la elección será nula, pero cuanto más haya, con más cuidado habrá que hacer la elección. Esta deberá garantizar que los sujetos que elegimos pueden ser considerados esencialmente iguales, de modo que se puedan intercambiar por otros. Para responder, una vez más, habrá que fijarse en los objetivos de la investigación.
Volvamos por un momento al ejemplo de los átomos de hidrógeno y de helio. Podemos considerar iguales, y por lo tanto intercambiables, todos los átomos de hidrógeno y todos los átomos de helio si nuestro interés son las propiedades químicas de estos dos elementos. Si nos interesaran las propiedades físicas, dos átomos de hidrógeno cualesquiera ya no serían iguales e intercambiables. Los átomos de hidrógeno (y también los de helio y los de los otros elementos), a pesar de tener el mismo número atómico (un protón en el caso del hidrógeno) que los hace iguales en sus propiedades químicas, muestran propiedades físicas diferentes según la variable número másico (número de protones y neutrones). Un átomo de hidrógeno puede tomar tres valores de la variable número másico. Los átomos con el mismo número atómico pero diferente número másico se denominan isótopos porque ocupan el mismo lugar en la tabla periódica de los elementos. El átomo de hidrógeno puede tener tres números másicos y, por lo tanto, tres isótopos: un protón y ningún neutrón (protio), un protón y un neutrón (deuterio) y un protón y 2 neutrones (tritio). Si el objetivo de la investigación son las propiedades físicas de los átomos de hidrógeno, ya no nos valdrá cualquier átomo, sino que deberemos prestar atención a su número másico porque los resultados podrán ser diferentes en función del valor que tome esta variable (como también eran diferentes cuando solo se escogían individuos un poco de acuerdo con una opción política o solo individuos muy de acuerdo). Es decir, si la pregunta de investigación hace referencia a las propiedades físicas del átomo de hidrógeno, habrá que tener en cuenta esta variabilidad, pero no si se dirige a las propiedades químicas. Las variables implicadas en los objetivos de la investigación determinarán en cada caso cuándo dos sujetos pueden ser considerados esencialmente iguales o debemos tener en cuenta las posibles diferencias.
La concordancia con una opción política está relacionada con otras muchas variables (por ejemplo, como comentábamos, la variable periodo electoral). En otros casos, sin embargo, puede haber menos variables implicadas. Así, si sometemos a un individuo varias veces a una misma tarea que implique tomar decisiones y observamos sus registros electro-encefalográficos, aproximadamente a los 300 milisegundos observaremos una deflexión positiva del voltaje (onda P300), pero con alguna variación en su forma y magnitud cada vez que el individuo haga la tarea. Observaremos, por lo tanto, una variabilidad intraindividual que puede depender de otras variables implicadas mientras se hacía la tarea, como puede ser la fatiga acumulada durante la ejecución de las tareas. No obstante, el número de variables que puede influir será menor que en la investigación sobre la concordancia con una opción política. En general, disminuyen cuando nos acercamos a variables de tipo físico o químico y aumentan cuando nos acercamos a variables biológicas o de conducta, y suele ser máxima en variables de tipo social. Según dónde se sitúen los objetivos de nuestra investigación, será más o menos fácil detectar y elegir sujetos que, en referencia a las variables de interés, podamos considerarlos esencialmente iguales, es decir, intercambiables.
Cuando los conocimientos que se tienen de las variables implicadas en la investigación permiten determinar a qué otras variables pueden afectar, podremos seleccionar los sujetos de manera que se evite la variabilidad producida por estas variables (por ejemplo, pedir a todos los individuos su acuerdo con una opción política fuera del periodo electoral). Cuando no se conocen o no se puede acceder a ellas (lo que sucederá muy a menudo en ámbitos de la conducta y biológicos, y casi siempre en el ámbito social), la alternativa es dejar que actúe el azar. Por ejemplo, hay individuos más sensibles que otros a las noticias que publican los medios. Esto quedará reflejado cuando manifiesten su acuerdo con una opción política, que se verá afectado por las noticias publicadas en la prensa aquel día. Si los individuos a los que preguntaremos por su grado de acuerdo se obtienen de manera aleatoria de toda la población a la que se dirige el objeto de la investigación, el propio azar hace que se hayan elegido individuos más sensibles a las noticias de los medios e individuos que sean menos sensibles.
En resumen, si los conocimientos previos permiten determinar qué otras variables pueden estar implicadas, entonces haremos una selección directa de los sujetos, pero si los conocimientos de los que se disponen no permiten hacer una selección directa, entonces hay que recurrir al azar. O, a menudo, a una combinación de ambas estrategias: directa para aquellas variables que conocemos y a las que podemos acceder, dejando el azar para aquellas variables a las que no podemos acceder de manera directa o sencillamente desconocemos si existen (en cualquier caso, el azar se encargará de controlarlas).
Una segunda pregunta que habrá que formular en referencia a los sujetos de la investigación será «¿cuántos deberemos elegir?». La respuesta también dependerá de las variables implicadas y de los objetivos de la investigación. Según cuáles sean las variables de interés, en algunos casos será suficiente con observar los valores de las variables en un sujeto (para observar la diferencia en número atómico entre el hidrógeno y el helio solo nos hace falta un átomo de hidrógeno y uno de helio). Pero si queremos conocer las diferencias respecto al acuerdo con una opción política de una población de individuos, o bien tomamos a toda la población o bien los individuos que elijamos deberán mostrar proporcionalmente todos los niveles de acuerdo que presenta la población.
Según el objetivo al que se dirija la investigación, será imposible elegir a todos los individuos de una población (imaginémonos que el objetivo es conocer la concordancia con una opción política de los habitantes de todo un país, ¡que pueden ser unos cuantos millones!). En estos casos habrá que seleccionar a una parte de la población, pero de tal manera que los individuos elegidos reflejen la variabilidad del conjunto. Una vez más, los conocimientos previos serán clave. Si estos permiten determinar qué otras variables relacionadas con las variables de la investigación pueden ser relevantes, entonces podemos hacer una selección directa de los sujetos en función de los valores que tomen en estas variables. Pero también, como ya hemos visto, muy a menudo se desconocen o es difícil acceder a ellas, y deberemos recurrir al azar. En este caso, cuanto mayor sea la población a la que queremos referir las conclusiones de la investigación, más sujetos habrá que elegir para mantener la representatividad. Una pregunta que suele obsesionar a los investigadores noveles es cuántos sujetos hacen falta para llevar a cabo una determinada investigación. La pregunta clave, sin embargo, tal como hemos visto, no es tanto cuántos, sino cuáles. La cantidad de sujetos dependerá mucho de las variables implicadas y de los objetivos de la investigación. En el supuesto de que haya que obtener muestras representativas de una población, las técnicas de muestreo que pone a nuestra disposición la estadística son un auxiliar esencial para determinar el número y la manera de acceder a ellas (cualquier texto básico de aplicaciones estadísticas suele incluir una buena introducción al muestreo; por ejemplo, Sierra-Bravo, 1998; o Henry, 1990).

2.3.Procedimientos e instrumentos

Seleccionados los sujetos de la investigación, que nos indican dónde observaremos las variables a las que hace referencia la hipótesis o la delimitación tentativa previa, hay que determinar la secuencia de acciones que hará el investigador para observar las variables (cuánto tiempo las observaremos, cuántas veces las registraremos, cómo accederemos a ellas, etc.). Toda la secuencia de acciones que hay que hacer para observar las variables y registrarlas, es decir para obtener los datos, es lo que denominaremos procedimiento de la investigación.
Como ya podemos suponer, los procedimientos serán muy diferentes según cuáles sean las variables de las que se deban obtener los datos, y muestran una gran variedad de maneras de ejecutar la lógica de investigación del método científico (la variedad de técnicas frente a la unidad del método que mostrábamos en el apartado «La investigación, una actividad para la obtención de conocimiento: supuestos, objetivos y características» del módulo didáctico «¿Qué es y qué no es la investigación?»).
En el caso de investigaciones que implican variables de conducta, cognición, personalidad, etc., los procedimientos incluyen también las tareas que solicitamos a los sujetos. Por ejemplo, para registrar ondas P300, necesitamos que los sujetos hagan alguna tarea de decisión para que el registro muestre la onda P300, que es una consecuencia de su actividad encefálica al realizar la tarea. O para observar el grado de coordinación en los desplazamientos de grupos de peces (por ejemplo de la especie Danio rerio), necesitamos introducir en el acuario donde haremos la observación determinados elementos que induzcan el movimiento (por ejemplo, situar la comida en un lugar determinado). Las tareas que harán los sujetos de la investigación forman parte del procedimiento y hay que planificarlas de antemano.
Muy a menudo las variables de interés no son accesibles directamente a los órganos sensoriales de los investigadores y hay que recurrir a instrumentos que permitan observarlas. Ni los átomos se pueden observar directamente con nuestros órganos sensoriales, ni tampoco el acuerdo con una opción política o la actividad encefálica. En estos casos, los instrumentos nos permitirán acceder a ellas. Así, con un electro-encefalógrafo podremos registrar las ondas P300, o con un cuestionario en lápiz y papel (o de aplicación en línea por internet) podremos registrar el acuerdo hacia una opción política. El uso de determinados instrumentos, como el electro-encefalógrafo, implicará que la observación y el registro de las variables se efectúe en situación de laboratorio, es decir, en un entorno controlado. Otras veces, el material y procedimiento no hacen necesario el control del entorno, pero el investigador puede decidir que esta es la mejor opción para evitar los efectos perniciosos de posibles variables ajenas al objetivo de la investigación. Definiremos laboratorio como un espacio dedicado a la investigación y dotado de ciertas condiciones e instrumentos que permiten un mejor control del proceso de observación y registro de las variables. De acuerdo con la variedad de procedimientos y de instrumentos, también los laboratorios mostrarán aspectos muy diferentes: desde una simple habitación que permita cierta intimidad para entrevistar y pasar cuestionarios a individuos, hasta cámaras altamente aisladas donde se trabaja con material biológico muy contagioso. En todos los casos, sin embargo, el factor común es la introducción de cierto componente de artificialidad en el registro de las variables, que no serán observadas exactamente en el mismo entorno donde se manifiestan de manera natural. Este hecho puede tener más o menos repercusión cuando obtengamos resultados y extraigamos conclusiones. Veamos cuáles pueden ser.
Si el objetivo de la investigación es conocer los componentes de una sustancia, por ejemplo el ácido sulfúrico, el hecho de efectuar las acciones sobre el ácido sulfúrico que indique el procedimiento en una situación de laboratorio no altera los resultados ni las conclusiones que se derivan de ello, sino que son válidas más allá de las paredes del laboratorio (en cualquier situación, el ácido sulfúrico estará formado por una determinada proporción de azufre, hidrógeno y oxígeno). Pero si el objetivo es conocer la coordinación en los desplazamientos de un grupo de peces de la especie Danio rerio, hay que garantizar que la artificialidad que supone la situación de acuario y la tarea de buscar comida producirá la misma coordinación en el desplazamiento que la producida en su entorno natural (los arrozales del Pakistán, India y Bangladesh). En otras investigaciones, la situación de laboratorio es prácticamente incompatible con los objetivos de la investigación. Si queremos conocer la interacción entre el alumno y el maestro en un aula de educación primaria, recrear artificialmente un entorno de aula de escuela no es solo muy difícil, sino que desvirtúa de tal manera las variables implicadas en los objetivos que casi con toda seguridad los resultados obtenidos no permitirán dar ninguna respuesta.
En cada caso, habrá que valorar con cuidado la relación entre el coste y el beneficio que produce introducir elementos de artificialidad en la situación en la cual se realiza la observación y el registro de las variables. Si introducir componentes de artificialidad nos produce el beneficio de obtener unos resultados con garantía de que solo han actuado las variables que son el objetivo de la investigación, pero nos produce el coste de dificultar (o imposibilitar) extraer conclusiones más allá de la situación de laboratorio, es evidente que la situación no es deseable. Pero si el hecho de efectuar la investigación en el entorno natural donde se manifiestan las variables que queremos observar produce el beneficio de poder extraer conclusiones de acuerdo con los objetivos de la investigación, pero produce el coste de garantizar de manera muy precaria (o no garantizar en absoluto) que los registros no han sido contaminados por otras variables presentes en el entorno (y, por lo tanto, pueden llevar fácilmente a conclusiones falsas), la situación tampoco es deseable. El balance entre el coste y el beneficio nos lleva a evaluar la validez de una investigación según dos componentes: asegurar que los resultados corresponden a las variables de la investigación y asegurar que se puedan trasladar de la situación de investigación a cualquier otra situación en la que se manifiesten las variables, tal como desarrollaremos con más detalle en el módulo didáctico «¿Cuál es el producto de la investigación?» (ved el apartado «Datos, teoría y modelos»).

2.4.Observar y experimentar

A pesar de que la evaluación de la validez de una investigación en referencia a los dos componentes que acabamos de mencionar los comentaremos más adelante, tanto los objetivos de la investigación como la posibilidad de acceder de manera más o menos directa a las variables condiciona (y mucho) el modo de observarlas y registrarlas. Si son preguntas de existencia o de descripción y clasificación, habrá que observar unas variables (o valores de variables) en las que la acción del investigador sobre ellas sea mínima, a excepción del posible instrumental que necesitemos para acceder a ellas. Para responder a la pregunta «¿este artrópodo es un insecto?», habrá que contar el número de patas que salen del cuerpo del artrópodo a las que se refiere la pregunta. La única manipulación del investigador para registrar el valor de la variable es tomar el ejemplar (o ejemplares) de artrópodo al que nos referimos, observarlo a simple vista o ayudado de una lupa y anotar cuántas patas ve.
Pero para responder a la pregunta «¿arriesgan más los extravertidos que los introvertidos en los exámenes de preguntas cerradas?», habrá que seleccionar individuos que presenten características propias de los extravertidos e individuos que presenten características propias de los introvertidos y someterlos a un examen de preguntas cerradas. Para acceder a la variable extraversión-introversión, el investigador deberá utilizar cuestionarios de personalidad para saber quién es extravertido y quién introvertido, a pesar de que podrá aprovechar alguna de las pruebas académicas (cualquier examen de preguntas cerradas) que ya hacen habitualmente los sujetos para observar el número de preguntas en blanco que dejan unos y otros. La manipulación de las variables es todavía muy baja.
Ahora bien, si nos enfrentamos a la pregunta «¿es mejor la técnica terapéutica A que la técnica terapéutica B para inducir relajación?», habrá que elegir individuos a los que les aplicaremos una técnica terapéutica e individuos a los que les aplicaremos la otra, y determinar una manera de acceder a la variable relajación, por ejemplo con un registro electromiográfico de la actividad muscular. La manipulación de las variables que hará el investigador es superior a la de los ejemplos anteriores. Aquí habrá que determinar en qué individuos se aplicará una técnica terapéutica y en qué individuos la otra, aplicar la técnica terapéutica que corresponda en cada caso, poner los electrodos para registrar la actividad muscular y activar el registro mientras se aplica la técnica terapéutica que corresponda. Todo esto en una situación controlada que permita aplicar la técnica terapéutica sin interferencias que interrumpan el proceso de relajación y que permitan usar correctamente el electromiógrafo.
En unos casos, el acceso a la variable y su registro implica poca o nula manipulación de esta, y en otras la manipulación puede ser máxima. En unos casos el investigador solo observa cómo varía la variable, en otras interviene para producir las variaciones de esta y poder registrar sus efectos. Para dar respuesta a preguntas de existencia y de descripción y clasificación, el investigador registra cómo actúan las variables, usando, si hace falta, los instrumentos necesarios para observarla (la lupa o los cuestionarios, por ejemplo), pero sin producir cambios en sus valores.
Para dar respuesta a preguntas de relación, si estas son de tipo causal, además de los instrumentos necesarios para observar las variables, es necesario que el investigador produzca cambios en los valores de las variables (ved la figura 3). Así, el investigador aplica una técnica terapéutica o la otra, es decir, cambia los valores de la variable independiente para observar qué efecto produce en la relajación (la variable dependiente). Además, para garantizar que otras variables ajenas a la variable técnicas terapéuticas, es decir variables extrañas, no produzcan cambios en la variable relajación, debe establecer controles (por ejemplo, realizar la investigación en una cámara insonorizada). En resumen, para garantizar resultados que permitan responder a una pregunta de tipo causal, el investigador no se puede limitar a registrar los cambios en las variables, sino que debe cambiar los valores de la variable independiente, observar el efecto de estos cambios en la dependiente y evitar la acción de variables extrañas. En este último caso, la necesidad de control de las variables provoca que se tienda a situaciones cercanas al laboratorio, mientras que en otros casos el laboratorio solo será necesario en función de los instrumentos empleados para acceder a las variables.
Figura 3. Esquema de las relaciones entre las variables cuando se define una relación causal entre ellas y acciones que hay que hacer para someter la causalidad a comprobación empírica.
Figura 3. Esquema de las relaciones entre las variables cuando se define una relación causal entre ellas y acciones que hay que hacer para someter la causalidad a comprobación empírica.
En función de si el procedimiento implica un mayor o menor grado de intervención del investigador sobre las variables, lo podemos situar en un continuo que va desde la nula o escasa manipulación hasta un máximo de manipulación. En el primero de los extremos diremos que el procedimiento tiene un cariz más observacional y en el otro extremo, uno más experimental. En cualquier caso, que un procedimiento se sitúe en un lugar u otro del continuo dependerá de cuál es la pregunta de investigación a la que debemos responder.

2.5.Simulación informática

El desarrollo de la informática ha permitido que muchas de las preguntas de investigación se respondan recreando las variables en un software informático (investigación in silico), sin recurrir a su observación empírica (investigación in vivo). El procedimiento simula con los algoritmos del programa informático las posibles relaciones entre variables, las cuales se someten a prueba introduciendo en el programa los valores de determinadas variables y observando qué efecto ha producido en otras variables en la salida del programa.
Los procedimientos basados en simulación se han introducido en todos los ámbitos de la investigación, desde la física y la química hasta la biología, la psicología y los estudios sociales (y, por supuesto, también en todas las ingenierías y tecnologías). La simulación es una buena opción para proporcionar respuestas a problemas de investigación con una buena economía de recursos. Generalmente resulta mucho más sencillo recrear la acción de unas variables en unos algoritmos que acceder a ellas empíricamente, reduciendo incluso la escala temporal en la que actúan. Así, por ejemplo, un software puede reproducir en horas o minutos los cambios evolutivos que en una determinada especie se producen con miles o millones de años (ved Resnick, 2009; texto introductorio que muestra las diferentes posibilidades que ofrecen los procedimientos de simulación para realizar investigación).
Para elaborar un procedimiento de simulación cuyos resultados respondan a las preguntas de investigación, hay que disponer de un buen conocimiento de las variables implicadas con el fin de que puedan ser implementadas en el software. De hecho, los programas de simulación exigen que cualquier acción o relaciones entre variables que se quieran recrear en un programa se hagan explícitas y sin ambigüedades. Esto obliga al investigador a hacer un ejercicio de clarificación de aquello que quiere estudiar, de cuáles son las variables implicadas y cómo actúan estas. Si una pregunta de investigación y su respuesta tentativa pueden ser sometidas a prueba en un procedimiento de simulación, significa que están expresadas de manera clara y no ambigua.
Un procedimiento basado en la simulación informática puede usarse tanto para probar el efecto de algunas variables en investigaciones con un carácter más bien exploratorio, como también para comprobar unas relaciones muy minuciosas entre variables. Tanto en un caso como en el otro, como sucede con los procedimientos en los que se efectúa una observación empírica de las variables, la información que proporcionan permite dar respuesta a las preguntas de investigación e incrementar el cuerpo de conocimientos. Ahora bien, hay que recordar que el criterio en el que nos basamos para aceptar o no unos determinados conocimientos son los referentes empíricos. Una simulación recrea con más o menos fidelidad la realidad, pero no es la realidad, por eso la información que se obtiene deberá ser sometida a contrastación empírica para ser integrada totalmente en el cuerpo de conocimientos. Los procedimientos de simulación proporcionan resultados que permiten avanzar en la comprensión del mundo, pero sin sustituir la observación empírica de las variables.

Bibliografía

Blanco-Villaseñor, A.; Gómez, J.; Salvador, F. (1997). Estratègies de recollida de dades. Barcelona: UOC
Bernard, C. (1976). Introducción al estudio de la medicina experimental. Barcelona: Fontanella.
Campbell (1952). What is science? Nueva York: Dover.
Christensen, L. B. (1988). Experimental methodology (4.ª edición). Boston: Allyn and Bacon.
Coss, R. (1993). Simulación. Un enfoque práctico (9.ª reimpresión). México: Limusa.
Cumming, G. (2012). Understanding the new statistics. Nueva York: Routledge.
Fàbregues, S.; Meneses, J.; Rodríguez-Gómez, D.; Paré, M. H. (2016). Técnicas de investigación social y educativa. Barcelona: Editorial UOC.
Gambara, H. (1998). Diseño de investigaciones. Cuaderno de prácticas (2.ª edición). Madrid: McGraw-Hill.
Henry, G. T. (1990). Practical Sampling. Newbury Park, CA: Sage.
Hernández-Sampieri, R.; Fernández-Collado, C.; Batista-Lucio, M. P. (2010). Metodología de la investigación (5.ª edición). México: McGraw-Hill.
Honeck, R. P. (1986). A serendipitous finding in face recognition. Bulletin of the Psychonomic Society, 24 (5), 369-371.
Huck, S. W.; Sandler, H. M. (1979). Rival hypotheses. Alternative interpretation of data based conclusions. Nueva York: Harper & Row.
Jañez, L. (1989). Fundamentos de psicología matemática. Madrid: Pirámide.
Jung, J. (1979). El dilema del experimentador. México: Trillas.
Kerlinger, F. N.; Lee, H. B. (2002). Investigación del comportamiento: técnicas y metodologías (4.ª edición). México: McGraw-Hill Interamericana.
Lohr, L. (2000). Muestreo: diseño y análisis. México: International Thomson Editores.
Maxwell, S. E.; Delaney, H. D. (1990). Designing experiments and analyzing data. A model comparison perspective. Belmont, CA: Wadsworth.
Meneses, J.; Barrios, M.; Bonillo, A.; Cosculluela, A.; Lozano, L. M.; Turbany, J.; Valero, S. (2013). Psicometria. Barcelona: Editorial UOC.
Norman, G. R.; Streiner, D. L. (2003). Statistics (3.ª edición). Shelton, CT: People’s Medical Publisher House
Polit, D. F.; Hungler, B. P. (2000). Investigación científica en ciencias de la salud (6.ª edición). México: McGraw-Hill
Resnick, M. (2009). Tortugas, termitas y atascos de tráfico: Exploraciones sobre micromundos masivamente paralelos. Barcelona: Gedisa
Salkind, N. J. (1998). Métodos de investigación (3.ª edición). México: Prentice Hall.
Salvador, F.; Gallifa, J. (1997). Introducció al disseny d’experiments en psicologia. Barcelona: Proa.
Shaffer, J. P. (1995). Multiple hypothesis testing. Annual Review of Psychology, 46, 561-584.
Sierra-Bravo, R. (1998). Técnicas de investigación social. Teoría y ejercicios (12.ª edición). Madrid: Paraninfo.
Stevens, S. S. (1951). Mathematics, measurement, and psychophysics. En S.S. Stevens (Ed.), Handbook of Experimental Psychology (pp. 1-30). Nueva York: Wiley.
Trochim, W.; Donnelly, J. P. (2008). The research methods knowledge base (3.ª edición). Mason, OH: Atomic Dog.