¿Cómo se ejecuta una investigación?
PID_00236030
Ninguna parte de esta publicación, incluido el diseño general y la cubierta,
puede ser copiada,
reproducida, almacenada o transmitida de ninguna forma, ni por ningún medio,
sea éste eléctrico,
químico, mecánico, óptico, grabación, fotocopia, o cualquier otro, sin la
previa autorización escrita
de los titulares del copyright.

1.Hipótesis y variables
El objetivo de la fase de delimitación del problema y establecimiento de objetivos
es determinar claramente en qué consistirá nuestra investigación («¿qué queremos saber?»
y «¿por qué lo queremos saber?»). Lo conseguimos revisando los conocimientos del tema
de la investigación, tanto las elaboraciones teóricas como los hechos empíricos que
las respaldan, los cuales pueden tener diferentes niveles de desarrollo según la problemática
a la que nos enfrentamos, desde construcciones teóricas bien formalizadas a nivel
lógico y matemático hasta elaboraciones teóricas mínimas; o desde gran cantidad de
evidencia empírica acumulada hasta unos referentes empíricos pobres o poco consistentes.
El estado de conocimientos determina qué tipo de pregunta de investigación podremos
formular. Así, si la construcción teórica es escasa y hay poca evidencia empírica
que la respalde, puede resultar muy arriesgado formular preguntas que relacionen causalmente
dos o más variables, y seguramente será mucho más productivo formular cuestiones que
pregunten por la existencia o la descripción de alguna o algunas variables. Pero si
sucede justo lo contrario, será mucho más productivo arriesgarnos a preguntar sobre
relaciones minuciosas entre variables. Sea un caso o el otro (o, como siempre, todo
un abanico posible de situaciones intermedias), para obtener una respuesta a la pregunta
de investigación será necesario recurrir a la observación empírica de las variables
a las que hace referencia la pregunta.
1.1.Pregunta de investigación y respuesta tentativa
La pregunta de investigación delimita las variables que hemos de observar y, si es
necesario, las relaciones que hay entre ellas. Para observar las variables resulta
útil dar una respuesta tentativa a la pregunta. Así, si nos preguntábamos si hay algún
insecto que transmita el virus del Zika, habrá que delimitar la investigación a algunos
tipos de insectos que pueden ser portadores de virus, por ejemplo los mosquitos. Si
disponemos de suficiente información, podemos afinar aún más y limitar la investigación
a un determinado género de mosquitos transmisores de enfermedades, como los mosquitos
del género Aedes. Así, a la pregunta «¿hay algún insecto que transmita el virus del Zika?» podemos
responder: «hay un mosquito del género Aedes que lo transmite». La respuesta es especulativa porque no está comprobada empíricamente,
pero razonable porque se hace basándose en la información que proporcionan unos conocimientos
previos.
La respuesta tentativa que damos a la pregunta de investigación tiene la utilidad
de acotar el conjunto de variables al que hemos de dirigir nuestra observación empírica.
La respuesta a la pregunta de si el déficit de atención provoca bajo rendimiento escolar
será afirmar que, en efecto, el déficit de atención provoca bajo rendimiento escolar.
Para comprobar si la respuesta es correcta, será necesario observar las dos variables
y la relación que existe entre ellas. Cuanto más afinada sea la pregunta, más afinada
será también la respuesta, y más específica la comprobación empírica, que se dirigirá
a un núcleo más reducido de variables.
Si la pregunta se formula a partir de un cuerpo teórico bien estructurado y con una
sólida base empírica, esta deberá ser necesariamente muy afinada para que su posible
respuesta produzca un incremento de conocimiento; en caso contrario, obtendremos conocimientos
redundantes. La redundancia de los conocimientos, si bien refuerza la teoría, también
puede ser banal al proporcionar respuestas obvias. Es evidente que cada vez que empujamos
el bolígrafo fuera de los límites de la mesa y se cae al suelo reforzamos la teoría
de la gravitación universal, pero no per ello decimos que hemos hecho un avance en
el conocimiento. Una pregunta afinada proporciona una respuesta tentativa igualmente
afinada, que será la consecuencia lógica de una estructura teórica bien consolidada
y con buen soporte empírico. En este caso, tal como comentábamos en el módulo didáctico
«¿Cómo se planifica una investigación?», decimos que hemos formulado una hipótesis.
En otros casos, si bien no hablamos estrictamente de hipótesis, la respuesta tentativa
limita el conjunto de variables que deberemos observar (en la investigación del insecto
que transmite el virus del Zika, observaremos mosquitos del género Aedes, no cualquier tipo de mosquito).
1.2.Vías deductiva, inductiva e hipotética-deductiva
Una manera de responder tentativamente a las preguntas puede ser a partir de deducciones
del cuerpo teórico. Así, si se sabe que uno de los síntomas de las fobias es la ansiedad
y se sabe también que determinadas técnicas inducen a la relajación, que es una respuesta
incompatible con la ansiedad, fácilmente podremos deducir que una terapia de las fobias
que incorpore componentes de relajación se espera que sea más efectiva que otra que
no las incorpore.
En este caso, hemos llegado a formular la hipótesis por una vía que podemos denominar
deductiva. También puede ser que la estructura del cuerpo teórico sea más débil, pero a cambio
disponga de un conjunto de evidencias empíricas consolidadas. Por ejemplo, conocemos
que los mosquitos son buenos transmisores de enfermedades virales, que la zona de
detección inicial del virus del Zika (un bosque cerca de Entebbe, en Uganda) es compatible
con la presencia de mosquitos del género Aedes (como el Aedes aegypti), etc. Así pues, podemos reunir todas las evidencias acumuladas y proponer al mosquito
de la especie Aedes aegypti como un transmisor del virus del Zika. En este caso, hemos dado una respuesta por
una vía que podemos denominar inductiva.
Nomenclatura binomial
En 1731, Carl von Linné propuso una nomenclatura para denominar, de manera inequívoca,
a los seres vivos. Cada especie se denomina con dos palabras en latín (o latinizadas):
el género (que se escribe en mayúscula y cursiva) y la especie (en minúscula y cursiva).
Así, por ejemplo, se denomina Canis familiaris al perro doméstico, donde Canis hace referencia a características que comparte con otras especies cercanas como el
lobo, el coyote o el chacal (Canis lupus, Canis latrans y Canis aureus, respectivamente), y donde familiaris hace referencia a las características propias.
Bien sea por una vía o por otra, el punto clave es proporcionar una respuesta tentativa
a la pregunta de investigación, tanto si es en forma de hipótesis derivada formalmente
de una teoría o en forma de delimitación de un conjunto de variables. De hecho, entre
los dos extremos que hemos ilustrado (vías deductiva e inductiva, respectivamente),
suele ser más habitual una especie de combinación de las dos vías, o vía hipotética-deductiva, en la que la respuesta tentativa se apoya en hipótesis (más o menos refinadas) derivadas
del cuerpo teórico y hechos empíricos más o menos estructurados.
En definitiva, el investigador utiliza todo el conocimiento previo del que dispone
para proponer una posible respuesta a la pregunta de investigación, que será o bien
una hipótesis en sentido estricto o bien la delimitación de unas variables o valores
de variables de las que se espera la respuesta. Tanto en un caso como en el otro,
efectuamos afirmaciones sobre lo que se espera obtener (por ejemplo, «hay un mosquito
del género Aedes que transmite el virus del Zika» o «el déficit de atención provoca bajo rendimiento
escolar»).
La observación empírica apoyará o no aquello que afirmamos porque aceptando o rehusando
la afirmación damos respuesta a la pregunta de investigación. Si aceptamos la afirmación,
hemos encontrado la solución al problema planteado en la pregunta de investigación.
Si no la aceptamos, no hemos encontrado la solución, pero ya hemos visto que a menudo
el rechazo nos proporciona información que sirve para formular nuevas preguntas (y
a su vez nuevas hipótesis o variables tentativas para someter a comprobación empírica).
1.3.La medida de las variables
La hipótesis, o cualquier delimitación tentativa de las variables de investigación,
nos señala qué variables, valores de variables o relaciones entre ellas deberemos
someter a contrastación empírica. Para hacerlo emplearemos las definiciones operacionales
de las variables (que ya hemos visto en el apartado «El planteamiento de objetivos:
la investigación basada en la evidencia» del módulo didáctico «¿Cómo se planifica
una investigación?»). Una manera de hacer la definición operacional de una variable
es midiéndola. Introduciremos unas breves nociones de teoría de la medida, veremos
cómo podemos medir variables y qué utilidad puede tener la medida de estas en el proceso
de investigación.
Medir es representar mediante números propiedades de los objetos empíricos, siguiendo determinadas
reglas de representación (Campbell, 1952). Como las propiedades de los objetos empíricos
constituyen variables, habrá que representar con números los valores que toman las
variables. La representación, sin embargo, no puede ser arbitraria. Supongamos que
se puede estar nada, un poco, bastante o muy de acuerdo con una opción política, que
son los niveles en los que puede variar la variable concordancia con una opción política.
Si usamos los números 1, 2, 3 y 4 para representar cada uno de los posibles niveles
de la variable concordancia con una opción política, de modo que a nada de acuerdo
asignamos el 1, a un poco de acuerdo el 2 y así sucesivamente, habremos sido consistentes
en hacer corresponder cada uno de los números a cada nivel de acuerdo, porque estar
nada de acuerdo es estar menos de acuerdo que estar bastante de acuerdo, y el número
que hemos asignado a nada de acuerdo es más pequeño (el 1) que el número que hemos
asignado a bastante de acuerdo (el 2). El hecho empírico de estar menos de acuerdo
queda representado por la propiedad de los números ser más pequeño que (<) porque
estar nada de acuerdo es estar menos de acuerdo que estar bastante de acuerdo y 1
< 2 (la relación entre los números refleja la relación entre los elementos empíricos).
No podemos asignar de manera arbitraria cualquier número a nada, un poco, bastante
o muy de acuerdo, sino que estos deben respetar el orden. Cualquier conjunto de cuatro
números que respeten el orden es válido para hacer la representación numérica de la
variable concordancia con una opción política (por ejemplo: 45, 56, 109 y 2.324; pero
también los números –2, 3,4, 45 y 45,1).
Fijémonos en que en el ejemplo del párrafo anterior la clave se encuentra en respetar
el orden. Podemos aprovechar la propiedad de los números ser menor que, tal como hemos
hecho en el ejemplo, pero también la propiedad ser mayor que y asignar 4, 3, 2 y 1
(donde a nada asignamos el 4 y a mucho, el 1). Lo mismo hacemos cuando asignamos el
1 al primer corredor que llega a la meta, el 2 al segundo, etc. (al más rápido le
asignamos el 1, al siguiente el 2, etc.): una secuencia ordenada de elementos empíricos
se puede representar por números progresivamente menores o progresivamente mayores
porque en los dos casos respetamos el orden.
Medir las variables, es decir, asignar valores numéricos, permite una mayor manejabilidad
de los datos, como tabularlos o hacer operaciones entre los números. En el análisis
de los datos, las operaciones entre números permiten sintetizarlos y obtener indicadores
que ayuden a tomar con más claridad decisiones sobre la hipótesis o las variables
de interés para la investigación. Ahora bien, las operaciones que hacemos en el análisis
solo proporcionan una información correcta si la variable ha sido medida de manera
correcta. Si los números elegidos para medir la variable concordancia con una opción
política no reflejan el orden, entonces la representación será inadecuada (o, lo que
es lo mismo, la variable no habrá sido medida de manera correcta). Para determinar
si hemos hecho bien la representación numérica, deberemos conocer con qué propiedades
empíricas nos podemos encontrar y cómo las podemos representar con números. Cada manera
de hacer la asignación numérica proporcionará lo que llamaremos una escala de medida.
1.4.Escalas de medida: taxonomía de Stevens
Las escalas de medida nos permiten poner en correspondencia las propiedades empíricas que definimos en
las variables y la manera de hacer la asignación numérica. Básicamente podemos distinguir
cuatro escalas de medida, que denominaremos nominal, ordinal, intervalo y razón. Veamos
a continuación qué propiedades representamos con cada una.
Hemos visto en el ejemplo de la variable concordancia con una opción política que
la propiedad que deben representar los números es el orden. Veamos otro caso. Supongamos
que una investigación se dirige a establecer los tipos de mosquito que hay en una
determinada zona (es decir, plantearía una pregunta de clasificación) y que lo haremos
según la categoría taxonómica género (Anopheles, Bironella, Chagasia, etc. y así hasta unos cuarenta y tres géneros). La variable género de los mosquitos
podrá tomar cuarenta y tres valores, que corresponden a cada uno de los cuarenta y
tres géneros: un mosquito podrá pertenecer al género Anopheles, o al género Bironella o al género Chagasia, o bien a alguno de los otros cuarenta. Si queremos medir la variable género de los
mosquitos, deberemos garantizar que la asignación numérica refleja el hecho de que
son géneros diferentes. Lo único que habrá que hacer es asignar números diferentes
a cada género. Por ejemplo, al género Anopheles le asignamos el 1, al género Bironella el 2, al género Chagasia el 3, y así sucesivamente. Aprovechamos que 1, 2, ..., 43 son números diferentes
para reflejar el hecho empírico de que hay géneros diferentes. La escala de medida
corresponde a lo que denominamos escala nominal según la taxonomía de Stevens.
Una escala nominal permite distinguir entre elementos diferentes porque a cada elemento
le corresponde un número diferente: números diferentes indican elementos diferentes,
mientras que números iguales indican elementos iguales. Pero como la única propiedad
que se aprovecha de los números es el hecho de ser números iguales o diferentes, pueden
ser reemplazados por cualquier otro código que, de manera consistente, asigne el mismo
símbolo a elementos iguales y un símbolo diferente a elementos distintos (por ejemplo,
podemos usar las letras del alfabeto latino: A, B, C, etc.). A pesar de su sencillez,
una variable medida en una escala nominal permite hacer recuentos de los valores de
la variable. Si asignamos el 1 a los niños y el 2 a las niñas de la variable sexo
(o bien la A a los niños y la B a las niñas, o efectuamos la asignación según cualquier
otra codificación sistemática), el recuento de los 1 y de los 2 proporciona la frecuencia
de niños y niñas respectivamente, a partir de las cuales podremos efectuar operaciones
matemáticas, por ejemplo de tipo estadístico (como obtener la moda o coeficientes
de contingencia entre variables).
El ejemplo que hemos desarrollado más arriba de la variable concordancia con una opción
política corresponde a una escala ordinal. La propiedad que deben reflejar los números es el orden. Las propiedades que es
capaz de representar una escala ordinal se acumulan a las que es capaz de representar
una escala nominal porque para poder establecer un orden hace falta también poder
distinguir: si queremos poner a alguien delante de otro, antes hace falta que sepamos
quién es cada cual. Para ordenar de menos a más el acuerdo con una opción política,
será necesario que diferenciemos primero los grados de acuerdo: diferenciamos los
que tienen nada de acuerdo de los que tienen poco de acuerdo, y después podremos poner
los que tienen nada de acuerdo delante de los que tienen un poco de acuerdo. Si respetamos
la regla según la cual a un nivel de acuerdo más pequeño que otro le asignamos también
un número más pequeño que otro, las asignaciones numéricas reflejarán los diferentes
tipos de acuerdo posibles y los ordenarán (el 1 y el 2 son números diferentes y, además,
1 < 2).
La tercera escala de medida que propone Stevens es la escala de intervalo, que además de distinguir y ordenar elementos incorpora la proporcionalidad entre
los valores de la escala. Por ejemplo, cuando se mide la variable temperatura en grados
centígrados y se asigna 35 a una determinada temperatura y 40 a otra, se espera que
la diferencia empírica de temperatura entre las temperaturas que representan los números
35 y 40 sea la misma diferencia que hay entre las temperaturas que representan los
números 20 y 25. Esta igualdad de diferencias también se espera que se mantenga para
cualesquiera cuatro temperaturas que muestran determinada diferencia entre ellas:
la diferencia empírica de temperatura entre las temperaturas que representan los números
52 y 53 debe ser la misma que la diferencia empírica de las temperaturas que representan
el números 84 y 85, y así sucesivamente para cada tétrada de temperaturas.
Observemos que, si bien la escala para medir la variable temperatura en grados centígrados
puede asignar el número cero (y, de hecho, lo asigna a aquella temperatura en la que
se congela el agua), el número cero no representa la ausencia de temperatura, es decir,
el hecho de que no haya temperatura. En una escala de intervalo se dice que el número
cero se asigna de manera arbitraria porque su asignación no representa aquella circunstancia
en la que la variable no está presente.
En muchas variables puede darse el caso de que, bien por dificultades de acceso a
la variable o bien por la conceptualización que se hace de ella, no se pueda o no
tenga sentido determinar empíricamente la ausencia de la variable. Así, podemos aplicar
una prueba psicológica de inteligencia a unos individuos y representar numéricamente
la inteligencia que hemos observado. Uno de los números que podemos asignar es el
0, pero 0 no indica que no haya inteligencia (igual que asignar 0 a una determinada
temperatura no indicaba la ausencia de temperatura).
En una escala de razón, el cuarto tipo de escala de la taxonomía de Stevens, el número cero se reserva para
representar la ausencia de la variable. Por ejemplo, si medimos la variable distancia
entre dos objetos físicos, como una mesa y una silla, y estos están tocando el uno
con el otro, diremos que no hay distancia entre ellos (la variable distancia está
ausente entre la mesa y la silla). Para representar la ausencia de la variable, emplearemos
el número cero. A diferencia de las escalas de intervalo, las escalas de razón hacen
una asignación no arbitraria del número cero. Las escalas de razón acumulan, además,
las capacidades de representación de las otras tres escalas: distinguir elementos
diferentes, ordenarlos y establecer una proporcionalidad entre ellos. Las cuatro escalas
de la taxonomía de Stevens siguen un orden acumulativo según las propiedades de los
objetos empíricos que son capaces de representar: nominal < ordinal < intervalo <
razón.
1.5.Medidas idemnóticas, vaganóticas y recuentos
Fijémonos en que una escala de razón permite establecer fácilmente un patrón fijo
que sirva de unidad para hacer las asignaciones numéricas. Así, podemos tomar de patrón
la distancia que va desde no haber ninguna distancia (los objetos están juntos, y
lo representamos con el 0) hasta una determinada distancia arbitraria entre los objetos.
Entonces, cuando queremos medir la distancia entre dos objetos cualesquiera, tomaremos
el patrón que hemos establecido y veremos cuántas veces cabe entre estos objetos.
Si, por ejemplo, cabe tres veces, asignaremos el 3 a aquella distancia. Cualquier
distancia entre dos objetos la podremos expresar como un múltiplo o un submúltiplo
del patrón fijo, que será la unidad de medida. Es lo que se produce cuando medimos
una distancia. Si tomamos el metro de patrón fijo, toda distancia se podrá expresar
numéricamente como el número de veces que contiene el patrón metro (por ejemplo, 50
si lo contiene cincuenta veces o 0,5 si lo contiene media vez). Siguiendo esta estrategia,
obtenemos un tipo de medida que denominamos idemnótica. Todas las asignaciones numéricas que se puedan hacer del mismo modo que lo hemos
hecho con la variable distancia serán medidas idemnóticas.
La estrategia de asignar valores numéricos en función de un patrón fijo es posible
si se dispone de un punto de anclaje empírico desde donde fijar el patrón que actúa
de unidad de medida. Este punto lo tenemos en las variables en las que podemos identificar
dónde hay ausencia de propiedad, que se toma de referencia para establecer el patrón
desde no haber propiedad hasta un cierto nivel de esta (es lo que se hizo cuando se
estableció que determinada distancia será un metro, determinada capacidad un litro
o determinada superficie un metro cuadrado, etc.). Ahora bien, hemos visto variables
en las que no es posible detectar la ausencia de propiedad (o no tiene sentido por
la manera como hemos conceptualizado la variable), por lo que no disponemos de ningún
punto de anclaje empírico desde donde establecer el patrón que nos sirva de unidad
de medida. La estrategia para obtenerlo deberá ser diferente. Supongamos que aplicamos
unas pruebas de inteligencia y observamos qué ejecuciones han hecho los individuos,
que serán diferentes de un individuo a otro. Estaremos observando la variabilidad
de la variable inteligencia. En función de cuál haya sido esta variabilidad, estableceremos
arbitrariamente dos niveles de ejecución, cuya diferencia establecerá la unidad de
medida. A cualquier ejecución que un individuo haga de estas pruebas de inteligencia
le asignaremos un número comparando la ejecución concreta que ha hecho el individuo
con la ejecución que corresponde a la unidad de medida. Esta estrategia nos proporciona
medidas que denominaremos vaganóticas.
Podemos obtener un tercer tipo de medida, que consiste en hacer recuentos. Por ejemplo, de la variable género de los mosquitos podemos contar cuántos Anopheles, Bironella, Chagasia, etc., tenemos en una muestra recogida en un trabajo de campo. Si para manejar mejor
la información configuramos una tabla en la que indicamos Anopheles = 1, Bironella = 2, Chagasia = 3, etc., de manera que obtenemos una tabla de números, podremos contar el número
de 1, de 2, de 3, etc., que hay en la tabla y, por lo tanto, obtener la frecuencia.
1.6.Medidas discretas y continuas
Fijémonos ahora en la escala de medida que hemos utilizado para la variable concordancia
con una opción política: nada = 1, un poco = 2, bastante = 3 y mucho = 4. Solo podemos
usar unos determinados valores (1, 2, 3 y 4, respectivamente), y no números que representen
posiciones intermedias porque se puede ser el tercero o el cuarto, pero no el tercero
y medio. Lo mismo sucede con la variable género de los mosquitos, en la que un individuo
puede o no pertenecer al género Anopheles, pero no una parte del individuo al género Anopheles y otra al género Bironella. La medida que se obtiene cuando se emplean escalas ordinales o nominales es de tipo
discreto.
Veamos ahora la escala de medida que hemos utilizado para la variable distancia entre
dos objetos. Podemos representar la distancia por 1, 2 o 50 en función de las veces
que encaja el patrón fijo (una, dos o cincuenta veces), pero también la podemos representar
por 0,25 si encaja un cuarto de patrón, o por 26,3 si encaja veintiséis veces y un
tercio. Podemos usar tantos números como nos permita la precisión de nuestro instrumental.
La medida que se obtiene cuando se emplean escalas de razón o de intervalo es de tipo
continuo.
Hacer medidas de las variables permite disponer de unas definiciones operacionales
que nos pueden ser muy útiles cuando debamos hacer las observaciones empíricas para
obtener los datos, y también para hacer los análisis. De la diferente tipología de
medidas según las reglas de asignación numérica (escalas de medida), de la estrategia
de medida (idemnótica, vaganótica y recuento) o del tipo de valores numéricos (discretas
o continuas) dependerá qué información obtendremos de las variables y también, cuando
sea necesario, qué estrategia de análisis de los datos usaremos.
1.7.Los errores de medida
Si hemos definido unas reglas de asignación numérica (es decir, disponemos de una
escala de medida), podemos representar numéricamente las observaciones empíricas que
efectuamos de las variables (es decir, podemos medir). Ahora bien, cuando hacemos
la operación de medir, no estamos exentos de cometer errores, que no son otra cosa
que una discrepancia entre la asignación numérica que efectuamos en la propiedad empírica
que queremos medir y la asignación que realmente deberíamos efectuar. Así, podemos
mirar mal el termómetro y registrar una temperatura de 25 grados centígrados, cuando
en realidad la temperatura es 25,5 grados porque el termómetro en realidad marca 25,5.
Si siempre que consultamos el termómetro cometemos el mismo error (por ejemplo, porque
los indicadores están un poco borrosos y siempre nos hacen confundirnos en el mismo
sentido), hemos cometido un error sistemático. Por el contrario, si el termómetro que usamos no es bastante preciso y solo es capaz
de marcar de medio grado en medio grado, de modo que las diferencias de temperatura
menores de medio grado las muestra en medio grado inferior o en medio grado superior
según si la temperatura empírica se acerca más a uno o al otro, entonces el error
que se produce es de tipo aleatorio. En ambos casos, sin embargo, hay un discrepancia entre el valor empírico de la variable
que observamos y la medida que hemos registrado (registramos 25 y deberíamos registrar
25,5; o la temperatura corresponde a 25,3, pero el termómetro nos marca 25,5), es
decir, en los dos casos hemos cometido un error de medida.
Los errores de medida sistemáticos son evitables si conocemos su causa (podemos limpiar
los indicadores del termómetro para ver más claramente), o los podemos corregir con
facilidad si sabemos su magnitud (como sabemos que vemos medio grado menos, cada vez
que registramos añadimos medio grado al registro). Pero si se produce un error sistemático
y desconocemos que se está produciendo este error, las consecuencias pueden ser muy
negativas. Podremos concluir que la temperatura que produce una reacción química es
excesiva porque sobrepasa el umbral que establece un protocolo de seguridad, pero
en realidad la reacción no ha sobrepasado el umbral, sino que ha sido consecuencia
de una mala lectura repetida del termómetro (un error sistemático de medida).
Los errores de medida aleatorios tienen unas consecuencias diferentes de los errores
sistemáticos. En nuestro ejemplo, si no cambiamos de termómetro a otro más preciso,
no podremos evitarlos; pero unas veces nos proporcionará valores al alza y otras a
la baja, según la temperatura real se acerque más o menos a lo que es capaz de detectar.
En un número repetido de registros, los valores al alza se compensarán con los valores
a la baja, de modo que de media nos acercaremos mucho al valor empírico real. De hecho,
como a menudo accedemos a las variables y efectuamos su asignación numérica mediante
instrumentos, incluso en los más precisos habrá una discrepancia entre el valor empírico
real y el número que nos muestra el instrumento. Si la distribución de los errores
de un conjunto de medidas es realmente aleatoria, podemos estimar qué efecto tiene
sobre el valor real y evaluar el alcance que este error tiene sobre nuestras observaciones
(volveremos sobre este tema en el apartado «Datos, teoría y modelos» del módulo didáctico
«¿Cuál es el producto de la investigación?»).
Figura 1. Cuadro resumen de la definición y características de la medida y de los errores de
medida.

En este apartado hemos caracterizado las diferentes maneras de presentar una respuesta
tentativa a la pregunta de investigación (y la importancia de hacerlo). También hemos
mostrado que al dar la respuesta tentativa fijamos las variables que deberemos observar
a nivel empírico, las cuales podremos definir con procesos de medida para ponerlas
en situación de ser observadas. Hemos destacado la importancia de la medida y hemos
indicado algunas características relevantes de esta y de sus errores (ved la figura
1). En el siguiente apartado, avanzaremos un paso más en las fases de aplicación del
método científico y mostraremos las nociones básicas de la planificación y ejecución
de las observaciones empíricas.
2.Planificación de las observaciones empíricas
Veíamos que la contrastación empírica nos dará la información sobre la que decidiremos
si unos determinados conocimientos son correctos o hay que cambiarlos, o bien si se
pueden afinar más. Cuando se ha formulado la pregunta de investigación, se le ha dado
una respuesta tentativa y se ha realizado una definición operacional de las variables
(a veces con procesos de medida), nos encontramos en condiciones de hacer las observaciones
empíricas. El objetivo será obtener unos datos que nos permitan decidir si la respuesta
tentativa que habíamos adelantado es adecuada y, en función de la decisión que tomemos,
evaluar si hemos sido capaces de responder a la pregunta de investigación.
Incluso en el supuesto de que la pregunta de investigación sea sencilla e implique
pocas variables, nunca es recomendable empezar directamente la observación de estas.
Siempre es necesaria una planificación previa que indique dónde encontraremos las
variables, cómo accederemos a sus valores, durante cuánto tiempo las observaremos
y cómo haremos los registros, etc. Todas estas cuestiones deben quedar establecidas
en una planificación previa (recordemos que hemos definido los datos como los registros
obtenidos de las variables bajo condiciones planificadas). Las observaciones ocasionales
o sin una planificación previa proporcionan muy a menudo informaciones anecdóticas
o llevan a obtener observaciones contaminadas por otras variables que no corresponden
a aquello que buscábamos. La información ocasional o no planificada no será válida
para tomar decisiones sobre la hipótesis o las variables sobre las que hemos fijado
nuestro interés, por lo que habrá que hacer una planificación que guíe el proceso
de observación empírica de las variables. Esto no es obstáculo para que en el decurso
de una investigación en ocasiones se puedan obtener algunos datos que llevan a resultados
del todo inesperados. Estos descubrimientos por casualidad, que se denominan descubrimientos
por serendipity, pueden producirse algunas veces y proporcionar información para abrir nuevas preguntas
de investigación (ved, por ejemplo, Honeck, 1986).
Si a pesar de haber efectuado la planificación con cuidado, durante la realización
de las observaciones nos damos cuenta de que había elementos o circunstancias que
no habíamos previsto (y como, de hecho, no lo podemos prever todo, esta no suele ser
una situación infrecuente), hay que parar el proceso de observación de las variables.
Detectado cuál era el imprevisto, hay que rehacer la planificación y, solo entonces,
volver a la observación. En la mayoría de los casos, los datos obtenidos antes de
detectar el imprevisto deberán ser descartados. A pesar del contratiempo que esto
pueda suponer, más vale asegurarse de que los datos serán adecuados para tomar decisiones
que quedarse con unos datos contaminados que serán inútiles o engañosos, haciéndonos
tomar decisiones incorrectas.
Para minimizar el riesgo de vernos obligados a parar las observaciones y perder datos,
a veces es recomendable probar el plan. Esto nos permite someter a prueba procedimientos,
maneras de acceder a las variables, instrumental, etc., con el objetivo de asegurar
que todos los elementos que constituyen el plan son adecuados, o darnos cuenta de
las correcciones y mejoras que hay que introducir. Esta prueba-piloto (o pruebas-piloto, si se hacen varias) no tiene el objetivo de proporcionar datos
para tomar ninguna decisión, sino comprobar si la planificación de las observaciones
es adecuada.
La manera de observar las variables depende mucho del contenido de cada investigación.
Ya hemos comentado que existen multitud de técnicas porque las variables de interés
pueden ser también muy diversas. Es evidente que la manera de observar y registrar
la luminosidad de una estrella no es la misma que la manera de detectar los componentes
que resultan de una reacción química o la de obtener la opinión de unas personas sobre
un determinado tema. Todas son variables (luminosidad, componentes y opinión) que
pueden ser foco de interés en una investigación, pero la manera que tendremos de acceder
a ellas es completamente diferente porque los objetos a los que hacen referencia también
son diferentes (un astro, unos elementos químicos y unos individuos, respectivamente).
2.1.Variabilidad intraindividual e interindividual
La primera cuestión que habrá que plantear, y que será crucial para decidir cómo procederemos
a observar las variables, es qué variabilidad pueden manifestar las variables que
registramos. Por ejemplo, inicialmente podemos asumir que un átomo de hidrógeno es
esencialmente idéntico a cualquier otro átomo de hidrógeno del universo, de modo que
las variables que definen los átomos de hidrógeno se manifestarán por igual en cualquier
átomo de hidrógeno que observemos.
Si observamos la variable número atómico en un átomo de hidrógeno (que es el número
de protones del núcleo del átomo), siempre contaremos un protón, sin importar en qué
átomo de hidrógeno hayamos hecho la observación. O lo que es el mismo, no habrá variabilidad intraindividual (en todos los átomos de hidrógeno contamos el mismo número de protones).
Observemos ahora la variable número atómico en un átomo de helio. Siempre contaremos
dos protones (tampoco habrá variabilidad intraindividual). Los átomos de hidrógeno
y de helio variarán entre ellos en la variable número atómico, y siempre lo harán
del mismo modo (como en un átomo de hidrógeno siempre contaremos un protón y en un
átomo de helio siempre contaremos dos, un átomo de hidrógeno siempre variará en un
protón respecto a un átomo de helio). La variabilidad interindividual que observamos será siempre la misma.
La situación es diferente si observamos la variable longitud total del cuerpo de un
mosquito de la especie Aedes aegypti. Las longitudes del cuerpo de dos mosquitos Aedes aegypti, a pesar de que hayamos tenido cuidado de seleccionarlos en la misma fase de desarrollo,
serán muy parecidas pero no exactamente los mismas. A diferencia del número atómico
de un átomo de hidrógeno, que será idéntico para cualquier átomo de hidrógeno, las
longitudes del cuerpo de los mosquitos Aedes aegypti mostrarán una variabilidad de un individuo a otro. Si comparamos la longitud del
cuerpo de un mosquito Aedes aegypti con la de un mosquito Culex pipiens, observaremos que son diferentes entre ellas. Pero si tomamos otro mosquito Aedes aegypti y otro mosquito Culex pipiens, a pesar de encontrar valores diferentes de la variable longitud total del cuerpo
entre ellos, la diferencia no será idéntica a la que habíamos encontrado entre los
otros dos ejemplares, aunque será muy similar. Observaremos una variabilidad intraindividual
(de los mosquitos de la misma especie), aunque muy pequeña; y observaremos también
que la variabilidad interindividual (entre mosquitos de especies diferentes) no se
mantendrá igual, a pesar de que seguramente se asemejarán mucho entre ellas.
Repitamos una vez más este ejercicio y observemos la variable concordancia con una
opción política en un grupo de individuos. El valor que tome la variable puede ser
muy diferente de un individuo a otro. Pero también un mismo individuo puede cambiar
de opinión, de tal manera que si observamos la variable en momentos distintos (por
ejemplo, antes y después de unas elecciones), el valor que tome esta puede ser también
muy diferente. Observaremos, por lo tanto, una gran variabilidad intraindividual (el
mismo individuo puede mostrar valores diferentes de la variable según cuándo efectuemos
la observación) y, consecuencia de esto, la variabilidad interindividual tampoco se
mantendrá igual.
La figura 2 muestra los dos extremos de los ejemplos que hemos presentado. Encontramos
un caso en el que no hay variabilidad intraindividual, como la variable número atómico
del átomo de hidrógeno, y otro en el que sí la hay, como la variable longitud del
cuerpo de los mosquitos o la variable concordancia con una opción política de unos
individuos. Por otro lado, en la misma figura vemos un caso en el que observaremos
siempre la misma variabilidad interindividual y otro en el que no. En el número atómico,
siempre observamos la misma diferencia entre el átomo de hidrógeno y el átomo de helio,
sin importar qué átomos de hidrógeno o helio tomamos, pero en las variables longitud
del cuerpo y concordancia con una opción política, las diferencias entre especies
de mosquito y entre individuos dependerá de qué mosquitos o qué individuos elijamos
para observar la variable.
Figura 2. Representación esquemática de dos variables que muestran diferente variabilidad intraindividual
(nula en la gráfica inferior de la figura) y también variación en la variabilidad
interindividual, que mantiene la misma diferencia en la gráfica inferior y cambia
en la gráfica superior.

Obviamente, si cuando hacemos la definición operacional de la variable reducimos el
número de valores que puede tomar, reduciremos también la variabilidad que podemos
observar. Así, si definimos la variable concordancia con una opción política con los
valores nada, un poco, bastante o muy de acuerdo (o sus medidas, por ejemplo: 1, 2,
3 y 4), la variabilidad que podemos observar será mayor que si la definición operacional
de la variable se limita a los valores estar o no estar de acuerdo (o sus medidas:
1 y 2). Ahora bien, la información que proporciona la observación de la variable en
este último caso es mucho menos minuciosa que en el caso anterior. La simplificación
nos permite reducir variabilidad, pero reduce también la información que obtenemos
porque también reduce la posibilidad de detectar variaciones entre individuos. Que
podamos o no simplificar el número de valores de la variable depende del estado de
la cuestión de los conocimientos de nuestro ámbito de investigación. Si realmente
se tiene un desconocimiento total de la concordancia con una opción política de una
población de individuos, una investigación tentativa en la que la variable se defina
de manera operacional como estar o no estar de acuerdo puede aportar información útil.
Pero si ya se dispone de información previa, definirla con valores dicotómicos no
aportará nada nuevo y habrá que afinar más en la definición para obtener resultados
que no sean banales (incluso puede resultar que la opción nada, un poco, bastante
o muy de acuerdo sea todavía demasiado simple y haya que introducir más matices).
2.2.Elección de los sujetos de investigación
Si queremos mostrar la diferencia entre los átomos de hidrógeno y de helio en referencia
a su número atómico, será indiferente el átomo de hidrógeno y el átomo de helio que
elijamos, pero no lo será si queremos mostrar las diferencias entre individuos respecto
a la concordancia con una opción política. Imaginémonos que elegimos unos cuantos
individuos y observamos cuál es su acuerdo. Si por casualidad los individuos elegidos
tienen todos un poco de acuerdo con la opción política, los resultados mostrarán que
todo el mundo está solo un poco de acuerdo. Pero si por casualidad todos los individuos
elegidos están muy de acuerdo, entonces los resultados mostrarán que todo el mundo
está a favor de la opción política. Los resultados a los que lleguemos dependerán
de qué individuos elegimos. Si para la variable número atómico es indiferente en qué
sujetos de investigación observaremos la variable (qué átomos elegimos), para la variable
concordancia con una opción política no lo es.
Una de las preguntas que deberemos responder es «¿qué sujetos elegimos para observar
las variables de la investigación?». Si no hay variabilidad intraindividual, como
en el ejemplo del hidrógeno y del helio, la preocupación por la elección será nula,
pero cuanto más haya, con más cuidado habrá que hacer la elección. Esta deberá garantizar
que los sujetos que elegimos pueden ser considerados esencialmente iguales, de modo
que se puedan intercambiar por otros. Para responder, una vez más, habrá que fijarse
en los objetivos de la investigación.
Volvamos por un momento al ejemplo de los átomos de hidrógeno y de helio. Podemos
considerar iguales, y por lo tanto intercambiables, todos los átomos de hidrógeno
y todos los átomos de helio si nuestro interés son las propiedades químicas de estos
dos elementos. Si nos interesaran las propiedades físicas, dos átomos de hidrógeno
cualesquiera ya no serían iguales e intercambiables. Los átomos de hidrógeno (y también
los de helio y los de los otros elementos), a pesar de tener el mismo número atómico
(un protón en el caso del hidrógeno) que los hace iguales en sus propiedades químicas,
muestran propiedades físicas diferentes según la variable número másico (número de
protones y neutrones). Un átomo de hidrógeno puede tomar tres valores de la variable
número másico. Los átomos con el mismo número atómico pero diferente número másico
se denominan isótopos porque ocupan el mismo lugar en la tabla periódica de los elementos.
El átomo de hidrógeno puede tener tres números másicos y, por lo tanto, tres isótopos:
un protón y ningún neutrón (protio), un protón y un neutrón (deuterio) y un protón
y 2 neutrones (tritio). Si el objetivo de la investigación son las propiedades físicas
de los átomos de hidrógeno, ya no nos valdrá cualquier átomo, sino que deberemos prestar
atención a su número másico porque los resultados podrán ser diferentes en función
del valor que tome esta variable (como también eran diferentes cuando solo se escogían
individuos un poco de acuerdo con una opción política o solo individuos muy de acuerdo).
Es decir, si la pregunta de investigación hace referencia a las propiedades físicas
del átomo de hidrógeno, habrá que tener en cuenta esta variabilidad, pero no si se
dirige a las propiedades químicas. Las variables implicadas en los objetivos de la
investigación determinarán en cada caso cuándo dos sujetos pueden ser considerados
esencialmente iguales o debemos tener en cuenta las posibles diferencias.
La concordancia con una opción política está relacionada con otras muchas variables
(por ejemplo, como comentábamos, la variable periodo electoral). En otros casos, sin
embargo, puede haber menos variables implicadas. Así, si sometemos a un individuo
varias veces a una misma tarea que implique tomar decisiones y observamos sus registros
electro-encefalográficos, aproximadamente a los 300 milisegundos observaremos una
deflexión positiva del voltaje (onda P300), pero con alguna variación en su forma
y magnitud cada vez que el individuo haga la tarea. Observaremos, por lo tanto, una
variabilidad intraindividual que puede depender de otras variables implicadas mientras
se hacía la tarea, como puede ser la fatiga acumulada durante la ejecución de las
tareas. No obstante, el número de variables que puede influir será menor que en la
investigación sobre la concordancia con una opción política. En general, disminuyen
cuando nos acercamos a variables de tipo físico o químico y aumentan cuando nos acercamos
a variables biológicas o de conducta, y suele ser máxima en variables de tipo social.
Según dónde se sitúen los objetivos de nuestra investigación, será más o menos fácil
detectar y elegir sujetos que, en referencia a las variables de interés, podamos considerarlos
esencialmente iguales, es decir, intercambiables.
Cuando los conocimientos que se tienen de las variables implicadas en la investigación
permiten determinar a qué otras variables pueden afectar, podremos seleccionar los
sujetos de manera que se evite la variabilidad producida por estas variables (por
ejemplo, pedir a todos los individuos su acuerdo con una opción política fuera del
periodo electoral). Cuando no se conocen o no se puede acceder a ellas (lo que sucederá
muy a menudo en ámbitos de la conducta y biológicos, y casi siempre en el ámbito social),
la alternativa es dejar que actúe el azar. Por ejemplo, hay individuos más sensibles
que otros a las noticias que publican los medios. Esto quedará reflejado cuando manifiesten
su acuerdo con una opción política, que se verá afectado por las noticias publicadas
en la prensa aquel día. Si los individuos a los que preguntaremos por su grado de
acuerdo se obtienen de manera aleatoria de toda la población a la que se dirige el
objeto de la investigación, el propio azar hace que se hayan elegido individuos más
sensibles a las noticias de los medios e individuos que sean menos sensibles.
En resumen, si los conocimientos previos permiten determinar qué otras variables pueden
estar implicadas, entonces haremos una selección directa de los sujetos, pero si los
conocimientos de los que se disponen no permiten hacer una selección directa, entonces
hay que recurrir al azar. O, a menudo, a una combinación de ambas estrategias: directa
para aquellas variables que conocemos y a las que podemos acceder, dejando el azar
para aquellas variables a las que no podemos acceder de manera directa o sencillamente
desconocemos si existen (en cualquier caso, el azar se encargará de controlarlas).
Una segunda pregunta que habrá que formular en referencia a los sujetos de la investigación
será «¿cuántos deberemos elegir?». La respuesta también dependerá de las variables
implicadas y de los objetivos de la investigación. Según cuáles sean las variables
de interés, en algunos casos será suficiente con observar los valores de las variables
en un sujeto (para observar la diferencia en número atómico entre el hidrógeno y el
helio solo nos hace falta un átomo de hidrógeno y uno de helio). Pero si queremos
conocer las diferencias respecto al acuerdo con una opción política de una población
de individuos, o bien tomamos a toda la población o bien los individuos que elijamos
deberán mostrar proporcionalmente todos los niveles de acuerdo que presenta la población.
Según el objetivo al que se dirija la investigación, será imposible elegir a todos
los individuos de una población (imaginémonos que el objetivo es conocer la concordancia
con una opción política de los habitantes de todo un país, ¡que pueden ser unos cuantos
millones!). En estos casos habrá que seleccionar a una parte de la población, pero
de tal manera que los individuos elegidos reflejen la variabilidad del conjunto. Una
vez más, los conocimientos previos serán clave. Si estos permiten determinar qué otras
variables relacionadas con las variables de la investigación pueden ser relevantes,
entonces podemos hacer una selección directa de los sujetos en función de los valores
que tomen en estas variables. Pero también, como ya hemos visto, muy a menudo se desconocen
o es difícil acceder a ellas, y deberemos recurrir al azar. En este caso, cuanto mayor
sea la población a la que queremos referir las conclusiones de la investigación, más
sujetos habrá que elegir para mantener la representatividad. Una pregunta que suele
obsesionar a los investigadores noveles es cuántos sujetos hacen falta para llevar
a cabo una determinada investigación. La pregunta clave, sin embargo, tal como hemos
visto, no es tanto cuántos, sino cuáles. La cantidad de sujetos dependerá mucho de
las variables implicadas y de los objetivos de la investigación. En el supuesto de
que haya que obtener muestras representativas de una población, las técnicas de muestreo
que pone a nuestra disposición la estadística son un auxiliar esencial para determinar
el número y la manera de acceder a ellas (cualquier texto básico de aplicaciones estadísticas
suele incluir una buena introducción al muestreo; por ejemplo, Sierra-Bravo, 1998;
o Henry, 1990).
2.3.Procedimientos e instrumentos
Seleccionados los sujetos de la investigación, que nos indican dónde observaremos
las variables a las que hace referencia la hipótesis o la delimitación tentativa previa,
hay que determinar la secuencia de acciones que hará el investigador para observar
las variables (cuánto tiempo las observaremos, cuántas veces las registraremos, cómo
accederemos a ellas, etc.). Toda la secuencia de acciones que hay que hacer para observar
las variables y registrarlas, es decir para obtener los datos, es lo que denominaremos
procedimiento de la investigación.
Como ya podemos suponer, los procedimientos serán muy diferentes según cuáles sean
las variables de las que se deban obtener los datos, y muestran una gran variedad
de maneras de ejecutar la lógica de investigación del método científico (la variedad
de técnicas frente a la unidad del método que mostrábamos en el apartado «La investigación,
una actividad para la obtención de conocimiento: supuestos, objetivos y características»
del módulo didáctico «¿Qué es y qué no es la investigación?»).
En el caso de investigaciones que implican variables de conducta, cognición, personalidad,
etc., los procedimientos incluyen también las tareas que solicitamos a los sujetos. Por ejemplo, para registrar ondas P300, necesitamos
que los sujetos hagan alguna tarea de decisión para que el registro muestre la onda
P300, que es una consecuencia de su actividad encefálica al realizar la tarea. O para
observar el grado de coordinación en los desplazamientos de grupos de peces (por ejemplo
de la especie Danio rerio), necesitamos introducir en el acuario donde haremos la observación determinados
elementos que induzcan el movimiento (por ejemplo, situar la comida en un lugar determinado).
Las tareas que harán los sujetos de la investigación forman parte del procedimiento
y hay que planificarlas de antemano.
Muy a menudo las variables de interés no son accesibles directamente a los órganos
sensoriales de los investigadores y hay que recurrir a instrumentos que permitan observarlas.
Ni los átomos se pueden observar directamente con nuestros órganos sensoriales, ni
tampoco el acuerdo con una opción política o la actividad encefálica. En estos casos,
los instrumentos nos permitirán acceder a ellas. Así, con un electro-encefalógrafo podremos registrar
las ondas P300, o con un cuestionario en lápiz y papel (o de aplicación en línea por
internet) podremos registrar el acuerdo hacia una opción política. El uso de determinados
instrumentos, como el electro-encefalógrafo, implicará que la observación y el registro
de las variables se efectúe en situación de laboratorio, es decir, en un entorno controlado.
Otras veces, el material y procedimiento no hacen necesario el control del entorno,
pero el investigador puede decidir que esta es la mejor opción para evitar los efectos
perniciosos de posibles variables ajenas al objetivo de la investigación. Definiremos
laboratorio como un espacio dedicado a la investigación y dotado de ciertas condiciones e instrumentos
que permiten un mejor control del proceso de observación y registro de las variables.
De acuerdo con la variedad de procedimientos y de instrumentos, también los laboratorios
mostrarán aspectos muy diferentes: desde una simple habitación que permita cierta
intimidad para entrevistar y pasar cuestionarios a individuos, hasta cámaras altamente
aisladas donde se trabaja con material biológico muy contagioso. En todos los casos,
sin embargo, el factor común es la introducción de cierto componente de artificialidad
en el registro de las variables, que no serán observadas exactamente en el mismo entorno
donde se manifiestan de manera natural. Este hecho puede tener más o menos repercusión
cuando obtengamos resultados y extraigamos conclusiones. Veamos cuáles pueden ser.
Si el objetivo de la investigación es conocer los componentes de una sustancia, por
ejemplo el ácido sulfúrico, el hecho de efectuar las acciones sobre el ácido sulfúrico
que indique el procedimiento en una situación de laboratorio no altera los resultados
ni las conclusiones que se derivan de ello, sino que son válidas más allá de las paredes
del laboratorio (en cualquier situación, el ácido sulfúrico estará formado por una
determinada proporción de azufre, hidrógeno y oxígeno). Pero si el objetivo es conocer
la coordinación en los desplazamientos de un grupo de peces de la especie Danio rerio, hay que garantizar que la artificialidad que supone la situación de acuario y la
tarea de buscar comida producirá la misma coordinación en el desplazamiento que la
producida en su entorno natural (los arrozales del Pakistán, India y Bangladesh).
En otras investigaciones, la situación de laboratorio es prácticamente incompatible
con los objetivos de la investigación. Si queremos conocer la interacción entre el
alumno y el maestro en un aula de educación primaria, recrear artificialmente un entorno
de aula de escuela no es solo muy difícil, sino que desvirtúa de tal manera las variables
implicadas en los objetivos que casi con toda seguridad los resultados obtenidos no
permitirán dar ninguna respuesta.
En cada caso, habrá que valorar con cuidado la relación entre el coste y el beneficio
que produce introducir elementos de artificialidad en la situación en la cual se realiza
la observación y el registro de las variables. Si introducir componentes de artificialidad
nos produce el beneficio de obtener unos resultados con garantía de que solo han actuado
las variables que son el objetivo de la investigación, pero nos produce el coste de
dificultar (o imposibilitar) extraer conclusiones más allá de la situación de laboratorio,
es evidente que la situación no es deseable. Pero si el hecho de efectuar la investigación
en el entorno natural donde se manifiestan las variables que queremos observar produce
el beneficio de poder extraer conclusiones de acuerdo con los objetivos de la investigación,
pero produce el coste de garantizar de manera muy precaria (o no garantizar en absoluto)
que los registros no han sido contaminados por otras variables presentes en el entorno
(y, por lo tanto, pueden llevar fácilmente a conclusiones falsas), la situación tampoco
es deseable. El balance entre el coste y el beneficio nos lleva a evaluar la validez
de una investigación según dos componentes: asegurar que los resultados corresponden
a las variables de la investigación y asegurar que se puedan trasladar de la situación
de investigación a cualquier otra situación en la que se manifiesten las variables,
tal como desarrollaremos con más detalle en el módulo didáctico «¿Cuál es el producto
de la investigación?» (ved el apartado «Datos, teoría y modelos»).
2.4.Observar y experimentar
A pesar de que la evaluación de la validez de una investigación en referencia a los
dos componentes que acabamos de mencionar los comentaremos más adelante, tanto los
objetivos de la investigación como la posibilidad de acceder de manera más o menos
directa a las variables condiciona (y mucho) el modo de observarlas y registrarlas.
Si son preguntas de existencia o de descripción y clasificación, habrá que observar
unas variables (o valores de variables) en las que la acción del investigador sobre
ellas sea mínima, a excepción del posible instrumental que necesitemos para acceder
a ellas. Para responder a la pregunta «¿este artrópodo es un insecto?», habrá que
contar el número de patas que salen del cuerpo del artrópodo a las que se refiere
la pregunta. La única manipulación del investigador para registrar el valor de la
variable es tomar el ejemplar (o ejemplares) de artrópodo al que nos referimos, observarlo
a simple vista o ayudado de una lupa y anotar cuántas patas ve.
Pero para responder a la pregunta «¿arriesgan más los extravertidos que los introvertidos
en los exámenes de preguntas cerradas?», habrá que seleccionar individuos que presenten
características propias de los extravertidos e individuos que presenten características
propias de los introvertidos y someterlos a un examen de preguntas cerradas. Para
acceder a la variable extraversión-introversión, el investigador deberá utilizar cuestionarios
de personalidad para saber quién es extravertido y quién introvertido, a pesar de
que podrá aprovechar alguna de las pruebas académicas (cualquier examen de preguntas
cerradas) que ya hacen habitualmente los sujetos para observar el número de preguntas
en blanco que dejan unos y otros. La manipulación de las variables es todavía muy
baja.
Ahora bien, si nos enfrentamos a la pregunta «¿es mejor la técnica terapéutica A que
la técnica terapéutica B para inducir relajación?», habrá que elegir individuos a
los que les aplicaremos una técnica terapéutica e individuos a los que les aplicaremos
la otra, y determinar una manera de acceder a la variable relajación, por ejemplo
con un registro electromiográfico de la actividad muscular. La manipulación de las
variables que hará el investigador es superior a la de los ejemplos anteriores. Aquí
habrá que determinar en qué individuos se aplicará una técnica terapéutica y en qué
individuos la otra, aplicar la técnica terapéutica que corresponda en cada caso, poner
los electrodos para registrar la actividad muscular y activar el registro mientras
se aplica la técnica terapéutica que corresponda. Todo esto en una situación controlada
que permita aplicar la técnica terapéutica sin interferencias que interrumpan el proceso
de relajación y que permitan usar correctamente el electromiógrafo.
En unos casos, el acceso a la variable y su registro implica poca o nula manipulación
de esta, y en otras la manipulación puede ser máxima. En unos casos el investigador
solo observa cómo varía la variable, en otras interviene para producir las variaciones
de esta y poder registrar sus efectos. Para dar respuesta a preguntas de existencia
y de descripción y clasificación, el investigador registra cómo actúan las variables,
usando, si hace falta, los instrumentos necesarios para observarla (la lupa o los
cuestionarios, por ejemplo), pero sin producir cambios en sus valores.
Para dar respuesta a preguntas de relación, si estas son de tipo causal, además de
los instrumentos necesarios para observar las variables, es necesario que el investigador
produzca cambios en los valores de las variables (ved la figura 3). Así, el investigador
aplica una técnica terapéutica o la otra, es decir, cambia los valores de la variable
independiente para observar qué efecto produce en la relajación (la variable dependiente).
Además, para garantizar que otras variables ajenas a la variable técnicas terapéuticas,
es decir variables extrañas, no produzcan cambios en la variable relajación, debe
establecer controles (por ejemplo, realizar la investigación en una cámara insonorizada).
En resumen, para garantizar resultados que permitan responder a una pregunta de tipo
causal, el investigador no se puede limitar a registrar los cambios en las variables,
sino que debe cambiar los valores de la variable independiente, observar el efecto
de estos cambios en la dependiente y evitar la acción de variables extrañas. En este
último caso, la necesidad de control de las variables provoca que se tienda a situaciones
cercanas al laboratorio, mientras que en otros casos el laboratorio solo será necesario
en función de los instrumentos empleados para acceder a las variables.
Figura 3. Esquema de las relaciones entre las variables cuando se define una relación causal
entre ellas y acciones que hay que hacer para someter la causalidad a comprobación
empírica.

En función de si el procedimiento implica un mayor o menor grado de intervención del
investigador sobre las variables, lo podemos situar en un continuo que va desde la
nula o escasa manipulación hasta un máximo de manipulación. En el primero de los extremos
diremos que el procedimiento tiene un cariz más observacional y en el otro extremo, uno más experimental. En cualquier caso, que un procedimiento se sitúe en un lugar u otro del continuo
dependerá de cuál es la pregunta de investigación a la que debemos responder.
2.5.Simulación informática
El desarrollo de la informática ha permitido que muchas de las preguntas de investigación
se respondan recreando las variables en un software informático (investigación in silico), sin recurrir a su observación empírica (investigación in vivo). El procedimiento simula con los algoritmos del programa informático las posibles
relaciones entre variables, las cuales se someten a prueba introduciendo en el programa
los valores de determinadas variables y observando qué efecto ha producido en otras
variables en la salida del programa.
Los procedimientos basados en simulación se han introducido en todos los ámbitos de
la investigación, desde la física y la química hasta la biología, la psicología y
los estudios sociales (y, por supuesto, también en todas las ingenierías y tecnologías).
La simulación es una buena opción para proporcionar respuestas a problemas de investigación
con una buena economía de recursos. Generalmente resulta mucho más sencillo recrear
la acción de unas variables en unos algoritmos que acceder a ellas empíricamente,
reduciendo incluso la escala temporal en la que actúan. Así, por ejemplo, un software
puede reproducir en horas o minutos los cambios evolutivos que en una determinada
especie se producen con miles o millones de años (ved Resnick, 2009; texto introductorio
que muestra las diferentes posibilidades que ofrecen los procedimientos de simulación
para realizar investigación).
Para elaborar un procedimiento de simulación cuyos resultados respondan a las preguntas
de investigación, hay que disponer de un buen conocimiento de las variables implicadas
con el fin de que puedan ser implementadas en el software. De hecho, los programas
de simulación exigen que cualquier acción o relaciones entre variables que se quieran
recrear en un programa se hagan explícitas y sin ambigüedades. Esto obliga al investigador
a hacer un ejercicio de clarificación de aquello que quiere estudiar, de cuáles son
las variables implicadas y cómo actúan estas. Si una pregunta de investigación y su
respuesta tentativa pueden ser sometidas a prueba en un procedimiento de simulación,
significa que están expresadas de manera clara y no ambigua.
Un procedimiento basado en la simulación informática puede usarse tanto para probar
el efecto de algunas variables en investigaciones con un carácter más bien exploratorio,
como también para comprobar unas relaciones muy minuciosas entre variables. Tanto
en un caso como en el otro, como sucede con los procedimientos en los que se efectúa
una observación empírica de las variables, la información que proporcionan permite
dar respuesta a las preguntas de investigación e incrementar el cuerpo de conocimientos.
Ahora bien, hay que recordar que el criterio en el que nos basamos para aceptar o
no unos determinados conocimientos son los referentes empíricos. Una simulación recrea
con más o menos fidelidad la realidad, pero no es la realidad, por eso la información
que se obtiene deberá ser sometida a contrastación empírica para ser integrada totalmente
en el cuerpo de conocimientos. Los procedimientos de simulación proporcionan resultados
que permiten avanzar en la comprensión del mundo, pero sin sustituir la observación
empírica de las variables.
Bibliografía
Blanco-Villaseñor, A.; Gómez, J.; Salvador, F. (1997). Estratègies de recollida de dades. Barcelona: UOC
Bernard, C. (1976). Introducción al estudio de la medicina experimental. Barcelona: Fontanella.
Campbell (1952). What is science? Nueva York: Dover.
Christensen, L. B. (1988). Experimental methodology (4.ª edición). Boston: Allyn and Bacon.
Coss, R. (1993). Simulación. Un enfoque práctico (9.ª reimpresión). México: Limusa.
Cumming, G. (2012). Understanding the new statistics. Nueva York: Routledge.
Fàbregues, S.; Meneses, J.; Rodríguez-Gómez, D.; Paré, M. H. (2016). Técnicas de investigación social y educativa. Barcelona: Editorial UOC.
Gambara, H. (1998). Diseño de investigaciones. Cuaderno de prácticas (2.ª edición). Madrid: McGraw-Hill.
Henry, G. T. (1990). Practical Sampling. Newbury Park, CA: Sage.
Hernández-Sampieri, R.; Fernández-Collado, C.; Batista-Lucio, M. P. (2010). Metodología de la investigación (5.ª edición). México: McGraw-Hill.
Honeck, R. P. (1986). A serendipitous finding in face recognition. Bulletin of the Psychonomic Society, 24 (5), 369-371.
Huck, S. W.; Sandler, H. M. (1979). Rival hypotheses. Alternative interpretation of data based conclusions. Nueva York: Harper & Row.
Jañez, L. (1989). Fundamentos de psicología matemática. Madrid: Pirámide.
Jung, J. (1979). El dilema del experimentador. México: Trillas.
Kerlinger, F. N.; Lee, H. B. (2002). Investigación del comportamiento: técnicas y metodologías (4.ª edición). México: McGraw-Hill Interamericana.
Lohr, L. (2000). Muestreo: diseño y análisis. México: International Thomson Editores.
Maxwell, S. E.; Delaney, H. D. (1990). Designing experiments and analyzing data. A model comparison perspective. Belmont, CA: Wadsworth.
Meneses, J.; Barrios, M.; Bonillo, A.; Cosculluela, A.; Lozano, L. M.; Turbany, J.;
Valero, S. (2013). Psicometria. Barcelona: Editorial UOC.
Norman, G. R.; Streiner, D. L. (2003). Statistics (3.ª edición). Shelton, CT: People’s Medical Publisher House
Polit, D. F.; Hungler, B. P. (2000). Investigación científica en ciencias de la salud (6.ª edición). México: McGraw-Hill
Resnick, M. (2009). Tortugas, termitas y atascos de tráfico: Exploraciones sobre micromundos masivamente
paralelos. Barcelona: Gedisa
Salkind, N. J. (1998). Métodos de investigación (3.ª edición). México: Prentice Hall.
Salvador, F.; Gallifa, J. (1997). Introducció al disseny d’experiments en psicologia. Barcelona: Proa.
Shaffer, J. P. (1995). Multiple hypothesis testing. Annual Review of Psychology, 46, 561-584.
Sierra-Bravo, R. (1998). Técnicas de investigación social. Teoría y ejercicios (12.ª edición). Madrid: Paraninfo.
Stevens, S. S. (1951). Mathematics, measurement, and psychophysics. En S.S. Stevens (Ed.), Handbook of Experimental Psychology (pp. 1-30). Nueva York: Wiley.
Trochim, W.; Donnelly, J. P. (2008). The research methods knowledge base (3.ª edición). Mason, OH: Atomic Dog.