¿Qué clase de pruebas estadísticas se usan comúnmente en los estudios epidemiológicos?
Aunque hay un gran número de pruebas estadísticas de importancia, su selección depende del tipo de hipótesis y del tipo de medición que va a ser utilizada (si representan escalas nominales, ordinales, de intervalo o escalas de razón). En los estudios epidemiológicos, una de las pruebas estadísticas más ampliamente usada que ilustra el uso de recuentos (datos nominales) en las tablas de 2x2 o de contingencia es la prueba de c2(chi cuadrado). La prueba de c2 se utiliza para evaluar si la distribución de frecuencias observada de una exposición o factor de riesgo y de un resultado o evento de salud se ubica dentro de una distribución "esperada". Este concepto implica que, si se tiene el mismo número de personas expuestas y no expuestas con y sin el suceso, bajo la hipótesis nula (de ninguna diferencia), todos los recuentos en las celdas en una tabla de 2 x 2 deben ser similares.
La fórmula general (y conceptual) para la prueba de c2 para probar una hipótesis es la siguiente:
c2= S
(o - e)2/ e = Sumatoria (o - e)2/ e
donde o es el recuento observado para cada celda, e es el número esperado para cada celda y S
se refiere a la suma de las diferencias al cuadrado para cada celda.
Con base en el ejemplo anterior del cáncer de pulmón y hábito de fumar, los valores observados del estudio de cohortes fueron:
Cáncer de pulmón y hábito de fumar entre una muestra de profesionales médicos entre 40 a 74 años de edad de varias instituciones en el pueblo de Rioblanco
Tabaquismo |
Cáncer del pulmón |
No cáncer del pulmón |
Total |
Sí * |
90 (a) |
710 (b) |
800 |
Ningún |
10 (c) |
1190 (d) |
1200 |
Total |
100 |
1900 |
2000 |
(*) El tabaquismo fue considerado por el consumo de paquetes/año como una medida de la duración e intensidad del tabaquismo durante la vida.
Cuando el número de las personas enfermas y no enfermas y expuestas y no expuestas son iguales (totales marginales) en un cuadro, es fácil calcular el número esperado de individuos para cada celda. En caso de que no lo sean, como ocurre a menudo, todavía es posible determinar los valores esperados de los totales marginales. Por ejemplo, el valor esperado para la celda a puede calcularse al multiplicar los valores marginales para cada celda y luego dividirlo por el número total en el cuadro, así:
esperado en a = (a + b)*(a + c)/(a + b + c + d)
De igual manera, el valor esperado para la celda "b" se obtendría del siguiente modo:
esperado en b = (a + b)*(b + d)/ (a + b + c + d)
Por lo tanto, en el ejemplo, el c2 contendría los siguientes valores observados y esperados para cada celda:
|
Observado |
Esperado |
Celda a |
90 |
100 · 800/2000 = 40 |
Celda b |
710 |
1900 · 800/2000 = 760 |
Celda c |
10 |
100 · 1200/2000 = 60 |
Celda d |
1190 |
1900 · 1200/2000 = 1140 |
c2= [(90 - 40)2/40] + [(710 - 760)2/760] + [(10 - 60)2/60] + [(1190 - 1140)2/1140]
c2= 62,5 + 3,29 + 41,67 + 2,19 = 109,65
La comparación del valor de la prueba con los de un cuadro estadístico para un grado de libertad indicará el nivel de significancia o Valor-P de los resultados observados. Los grados de libertad (g.l.) se calculan por el número de filas en el cuadro - 1 por (·) el número de las columnas en el cuadro - 1. Por lo tanto, en un 2 x 2 cuadro (filas = 2, las columnas = 2), los g.l. son
(2 - 1)·(2 - 1) = 1.
Los siguientes son un resumen de los valores de c2 y su nivel de significancia para los resultados de una tabla de 2 x 2:
Valores del nivel de significación estadística para la prueba c2
Un Valor-P de 0,05 es el límite más comúnmente usado para decidir la significación estadística de un resultado. Si el valor del c2 es mayor que 3,84, luego el Valor-P será menos de 0,05 y la hipótesis nula se rechazará. En el ejemplo anterior, el c2 observado (109,65) es mucho mayor que 3,84 e incluso que 10,83; por lo tanto, el Valor-P sería menos de 0,001. En otras palabras, esto significaría que la asociación que se observó entre el factor de riesgo y el resultado de salud es improbable que sea debida al azar. Esto también indica que un resultado, como el observado en el estudio, ocurrirá por casualidad en menos de 1 de 1.000 veces que un estudio que se llevara a cabo en una muestra de esta población. Dicho en otras palabras, la probabilidad de rechazar incorrectamente la hipótesis nula es menos de 1 por 1.000.