Aspectos metodológicos y etapas en la elaboración de un metaanálisis
 
 
Los MA son proyectos de investigación por sí mismos, en los que las unidades de observación son los estudios originales.

Los MA requieren, por tanto, una adecuada planificación y una dedicación considerable de recursos humanos (principalmente tiempo de los investigadores) y materiales. Los primeros aspectos a concretar en un MA deberían ser, por tanto, la constitución del equipo investigador y la elaboración de un protocolo donde se detallarán, entre otros, los aspectos metodológicos que se exponen a continuación y se planificará el estudio.

Una vez se dispone de equipo y de un protocolo, las etapas en la realización de un MA son, de forma esquemática, las siguientes:

1. Formulación de los objetivos

Concreción de las preguntas de investigación, así como de las hipótesis de trabajo.

2. Búsqueda y recuperación de los estudios originales

El paso inicial de un trabajo de revisión consiste en la localización de todos los trabajos originales relevantes, de acuerdo con los objetivos establecidos y los criterios de selección especificados.

3. Selección de los estudios a incluir en el metaanálisis

Deberá determinarse qué estudios van a combinarse en el MA formal, es decir, se establecerán a priori criterios de inclusión y exclusión específicos. Así, por ejemplo, es habitual la exclusión de estudios no aleatorizados de los MA de la eficacia de las intervenciones farmacológicas. El principal problema en la selección de estudios a incluir es que la mayor parte de decisiones se basan en criterios hasta cierto punto arbitrarios. Unos criterios explícitos, claros, precisos e independientes de los resultados de los estudios permiten paliar este problema.

 


Comentario del autor

4. Extracción de los datos de los estudios

En general, interesa recoger todos aquellos aspectos de los que puedan depender los resultados (como tipo de diseño, número de participantes y sus características, fuente de financiación, etc.), así como medidas de los efectos estudiados (resultados), indicadores de la variabilidad de las mismas (por ejemplo, intervalo de confianza) y la calidad metodológica del estudio.

Toda esta información relevante debe permitir valorar la heterogeneidad de los estudios, tanto en lo que se refiere a sus resultados, como en lo referente a sus características (ver etapa siguiente).

Es recomendable, en esta etapa, introducir controles de calidad rigurosos para evitar sesgos y errores por parte de los revisores.

 


Comentario del autor

5. Evaluación del grado de heterogeneidad entre los estudios (o análisis de la homogeneidad)

Su objetivo es determinar si existe o no variabilidad tanto "estadística" (a partir de pruebas estadísticos) como "clínica" o "de diseño" entre los estudios incluidos (a partir de la inspección y comparación de las características de éstos) y, por lo tanto, sea adecuado el cálculo de una medida resumen a partir de los resultados de los diferentes estudios.

La realización de una prueba estadística permitirá comprobar si la heterogeneidad en los resultados entre los diferentes estudios que vamos a combinar se debe al azar o, por el contrario, a factores no aleatorios. Si el resultado de la prueba es que las diferencias observadas no pueden ser explicadas por el azar, se concluye que hay heterogeneidad. En ese caso es importante explorar y explicar en la medida de lo posible los motivos de heterogeneidad.

 
Comentario del autor

Debido a la baja potencia de las pruebas estadísticas de heterogeneidad (también conocidas como pruebas de homogeneidad), éstas deben complementarse con la representación gráfica conjunta de los resultados de los estudios (que permitirá la inspección visual de la magnitud de estas diferencias) y con el análisis de subgrupos (ver más adelante).

6. Obtención de estimadores combinados de efecto

Se trata del análisis estadístico mediante el cual se obtiene una única medida del efecto que sintetiza los resultados de los estudios seleccionados (medida resumen o estimador combinado y su intervalo de confianza).

Los MA permiten, bajo ciertas asunciones, la obtención de estimadores combinados de efecto de las exposiciones o intervenciones en estudio, sintetizando de forma cuantitativa la información aportada por los estudios originales. Antes de realizar el MA se debe establecer la medida de resultado (o del efecto) que se utilizará para describir y representar los efectos y agregarlos.

 
Contenido complementario

Para la obtención de la medida resumen, los resultados de los estudios son ponderados, generalmente por la inversa de su varianza o por el tamaño muestral, aunque también pueden aplicarse otros criterios como la calidad del estudio o la validez de los datos. La heterogeneidad entre los estudios puede tenerse en cuenta en el análisis, a través de los "modelos de efectos aleatorios", o no ser incluida, si se utiliza un "modelo de efectos fijos".

Existen varias técnicas estadísticas para la realización de MA. La elección del método depende fundamentalmente del tipo de medida de resultado/efecto utilizada y de la valoración del grado de heterogeneidad de los resultados de los estudios (tabla 1).

Tabla 1. Métodos estadísticos para metaanálisis

Tipo de variable

Medida de efecto

Modelo

Método

Dicotómica

Razón de Odds

Efectos fijos

Peto
Mantel-Haenszel
Woolf

Efectos aleatorios

Dersimonian-Laird

Riesgo relativo

Efectos fijos

Mantel-Haenszel
Woolf

Efectos aleatorios

Dersimonian-Laird

Diferencia de riesgos

Efectos fijos

Mantel-Haenszel
Woolf

Efectos aleatorios

Dersimonian-Laird

Continua

Diferencia de medias

Efectos fijos

Woolf

Efectos aleatorios

Dersimonian-Laird

Diferencia estandarizada de medias

Efectos fijos

Woolf

Efectos aleatorios

Dersimonian-Laird

Fuente: adaptado de Clarke M y Oxman AD, 2003

Modelos de efectos fijos (fixed effects model)


Los modelos de efectos fijos asumen que existe un único efecto en la población y no tienen en cuenta la heterogeneidad (varianza) de los resultados entre los distintos estudios (se asume homogeneidad del efecto en los diferentes estudios que se combinan). Así, el tamaño del estudio y su propia varianza (variabilidad intra-estudio) son los únicos determinantes de su peso ponderado en el MA.

El modelo de efectos fijos es válido para comprobar la hipótesis nula global, la cual defiende que ningún estudio tiene efecto. Un resultado que permita rechazar estadísticamente la hipótesis nula global indica que existe efecto en al menos uno de los estudios.

 
Comentario del autor

Tabla 2. Tabla de contingencia o 2x2 de una variable dicotómica

 

Evento

No evento

Total

Grupo intervención estudio

ai

bi

ai+bi

Grupo control (placebo)

ci

di

ci+di

Total

ai+ci

bi+di

Ni

  1. El método de Mantel-Haenszel (MH) es uno de los más utilizados en los MA de ensayos clínicos aleatorizados con medidas principales del resultado dicotómicas. El estimador global o combinado de Mantel-Haenszel es consistente incluso si los estudios individuales tienen pocos sujetos. Este estimador no es más que una media ponderada de los efectos de los estudios individuales con factores de ponderación peso MH.

  2. El método de Peto es una modificación del de Mantel-Haenszel. Tiene importantes limitaciones si hay un desequilibrio importante entre los grupos de tratamiento que se comparan y si el valor de las OR se alejan del valor nulo (OR=1).

  3. Modelo de efectos fijos basado en varianzas (método de Woolf)
    Este modelo es aplicable a odds ratio (OR), riesgos relativos (RR), riesgos atribuibles (RA) y, en caso de medidas cuantitativas, a diferencia de medias.

 
Ejemplo

Modelo de efectos aleatorios (random effects model)


Método de combinación de magnitudes de efecto individuales en los que se tiene en cuenta la heterogeneidad entre los estudios al considerar que los efectos de la intervención en la población son diferentes y que los estudios incluidos en la revisión son sólo una muestra aleatoria de todos los posibles efectos. La ponderación de los estudios se realiza, además de por la varianza o tamaño de éstos (variabilidad intra-estudio), también por la varianza entre los estudios (variabilidad entre-estudios).

 


Ejemplo

Los resultados de este método tienden a ser más conservadores, con mayores intervalos de confianza, y generalizables al posible universo de estudios. Deben utilizarse, siempre que se determine tras una prueba de homogeneidad, que los estudios son heterogéneos y no puedan identificarse claramente las causas, lo cual es muy habitual.

7. Representación gráfica de los resultados

 

Contenido complementario
Comentario del autor

Se han usado varios métodos gráficos, pero en el clásico se representa la medida de efecto y su intervalo de confianza en el eje de abcisas (eje x) y a lo largo del eje de coordenadas (eje y) se sitúan los diferentes estudios, generalmente ordenados por el año de publicación, o por el peso que se les haya dado.

8. Análisis de subgrupos

Este tipo de análisis pretende averiguar posibles causas de heterogeneidad entre los estudios al realizar MA separados en función de determinadas características, por ejemplo en mujeres, o en una determinada franja de edad. La utilización o interpretación de un análisis de subgrupos debe hacerse con mucha cautela, ya que puede haber muchos factores que pueden explicar las diferencias entre estudios.

 


Contenido complementario
Comentario del autor

9. Análisis de sensibilidad

Tiene como objetivo conocer la influencia de cada uno de los estudios en la estimación global del efecto, para así comprobar la robustez o estabilidad de la medida final obtenida. Se utiliza cuando hay incertidumbre en aspectos importantes que condicionen la validez de los estudios.

Se lleva a cabo repitiendo el MA sacando en cada caso uno de los estudios y combinando los restantes. Si los resultados no se modifican podemos decir que el estimador global o combinado del efecto es robusto y estable. En caso contrario no tendríamos un estimador robusto, lo cual conllevaría cierta precaución en la interpretación de los resultados o podría ser motivo para generar nuevas hipótesis.

10. Interpretación de los resultados

Al igual que en todo trabajo de investigación, los resultados del MA deben interpretarse en función de la validez interna del estudio (su calidad metodológica), sus limitaciones, la plausibilidad biológica de las asociaciones y de información adicional que no puede ser incorporada fácilmente en un MA (como, por ejemplo, los resultados de estudios experimentales en animales). También deberán tenerse en cuenta los resultados obtenidos a partir de los análisis de subgrupos y de sensibilidad, y la existencia de posibles sesgos de publicación (ver siguiente apartado).


Es muy importante valorar siempre la existencia de un posible sesgo de selección de los estudios incluidos, lo cual podría sesgar, asimismo, los resultados del MA.

11. Identificación del sesgo de publicación en los metaanálisis

De las posibles aproximaciones, la más difundida es la realización de gráficos de embudo (funnel plots). En éstos se presentan los estimadores de efecto de los estudios en el eje de abcisas, frente a alguna medida de variabilidad de los mismos (por ejemplo, el tamaño muestral o el inverso de la varianza de los estimadores de efecto) en el eje de ordenadas, generando un gráfico en forma de pirámide o embudo al situarse en la parte inferior del gráfico aquellos estudios con mayor varianza y, por tanto, mayor intervalo de confianza.

 


Comentario del autor

Si no existe sesgo de publicación, la nube de puntos tendrá forma de embudo, ya que los estudios con mayor tamaño muestral serán más precisos y se situarán en la parte superior, pero todos ellos estarán centrados en torno al efecto estimado. Si existe sesgo de publicación, la zona correspondiente al valor nulo (no efecto) presentará menos estudios, con lo que el embudo aparecerá truncado. Entre las limitaciones de estos gráficos destaca el hecho de tratarse de un técnica visual, y por lo tanto subjetiva hasta cierto punto, y de difícil interpretación en el caso de que existan pocos estudios, que es la circunstancia más habitual (gráfico 3).

Gráfico 3. Gráfico de embudo

Otras técnicas estadísticas empleadas para estudiar el sesgo de publicación son el egger test o el begg test.

 
    Inicio