Clases de pruebas estadísticas

Atrás

¿Qué clase de pruebas estadísticas se usan comúnmente en los estudios epidemiológicos?

Aunque hay un gran número de pruebas estadísticas de importancia, su selección depende del tipo de hipótesis y del tipo de medición que va a ser utilizada (si representan escalas nominales, ordinales, de intervalo o escalas de razón). En los estudios epidemiológicos, una de las pruebas estadísticas más ampliamente usada que ilustra el uso de recuentos (datos nominales) en las tablas de 2x2 o de contingencia es la prueba de c2(chi cuadrado). La prueba de c2 se utiliza para evaluar si la distribución de frecuencias observada de una exposición o factor de riesgo y de un resultado o evento de salud se ubica dentro de una distribución "esperada". Este concepto implica que, si se tiene el mismo número de personas expuestas y no expuestas con y sin el suceso, bajo la hipótesis nula (de ninguna diferencia), todos los recuentos en las celdas en una tabla de 2 x 2 deben ser similares.

La fórmula general (y conceptual) para la prueba de c2 para probar una hipótesis es la siguiente:

c2= S (o - e)2/ e = Sumatoria (o - e)2/ e

donde o es el recuento observado para cada celda, e es el número esperado para cada celda y S se refiere a la suma de las diferencias al cuadrado para cada celda.

Con base en el ejemplo anterior del cáncer de pulmón y hábito de fumar, los valores observados del estudio de cohortes fueron:

Cáncer de pulmón y hábito de fumar entre una muestra de profesionales médicos entre 40 a 74 años de edad de varias instituciones en el pueblo de Rioblanco

Tabaquismo

Cáncer del pulmón

No cáncer del pulmón

Total

Sí * 90 (a) 710 (b) 800
Ningún 10 (c) 1190 (d) 1200
Total 100 1900 2000

(*) El tabaquismo fue considerado por el consumo de paquetes/año como una medida de la duración e intensidad del tabaquismo durante la vida.

Cuando el número de las personas enfermas y no enfermas y expuestas y no expuestas son iguales (totales marginales) en un cuadro, es fácil calcular el número esperado de individuos para cada celda. En caso de que no lo sean, como ocurre a menudo, todavía es posible determinar los valores esperados de los totales marginales. Por ejemplo, el valor esperado para la celda a puede calcularse al multiplicar los valores marginales para cada celda y luego dividirlo por el número total en el cuadro, así:

esperado en a = (a + b)*(a + c)/(a + b + c + d)

De igual manera, el valor esperado para la celda "b" se obtendría del siguiente modo:

esperado en b = (a + b)*(b + d)/ (a + b + c + d)

Por lo tanto, en el ejemplo, el c2 contendría los siguientes valores observados y esperados para cada celda:

 

Observado

Esperado

Celda a

90 100 · 800/2000 = 40

Celda b

710 1900 · 800/2000 = 760

Celda c

10 100 · 1200/2000 = 60

Celda d

1190 1900 · 1200/2000 = 1140

c2= [(90 - 40)2/40] + [(710 - 760)2/760] + [(10 - 60)2/60] + [(1190 - 1140)2/1140]

c2= 62,5 + 3,29 + 41,67 + 2,19 = 109,65

La comparación del valor de la prueba con los de un cuadro estadístico para un grado de libertad indicará el nivel de significancia o Valor-P de los resultados observados. Los grados de libertad (g.l.) se calculan por el número de filas en el cuadro - 1 por (·) el número de las columnas en el cuadro - 1. Por lo tanto, en un 2 x 2 cuadro (filas = 2, las columnas = 2), los g.l. son
(2 - 1)·(2 - 1) = 1.

Los siguientes son un resumen de los valores de c2 y su nivel de significancia para los resultados de una tabla de 2 x 2:

Valores del nivel de significación estadística para la prueba c2

Valor c2

Nivel de significancia (Valor-P)

1,64

0,20

2,71

0,10

3,84

0,05

6,63

0,01

10,83

0,001

Un Valor-P de 0,05 es el límite más comúnmente usado para decidir la significación estadística de un resultado. Si el valor del c2 es mayor que 3,84, luego el Valor-P será menos de 0,05 y la hipótesis nula se rechazará. En el ejemplo anterior, el c2 observado (109,65) es mucho mayor que 3,84 e incluso que 10,83; por lo tanto, el Valor-P sería menos de 0,001. En otras palabras, esto significaría que la asociación que se observó entre el factor de riesgo y el resultado de salud es improbable que sea debida al azar. Esto también indica que un resultado, como el observado en el estudio, ocurrirá por casualidad en menos de 1 de 1.000 veces que un estudio que se llevara a cabo en una muestra de esta población. Dicho en otras palabras, la probabilidad de rechazar incorrectamente la hipótesis nula es menos de 1 por 1.000.

Arriba