Organización y presentación de datos epidemiológicos

Atrás

Cuando recogemos más registros de los que podemos examinar individualmente, podemos usar los cuadros (o tablas), los gráficos, y los esquemas para organizar, resumir y mostrar los datos de manera clara y eficiente. Con estos cuadros, gráficos, y esquemas, es posible analizar los conjuntos de datos de unas pocas docenas o de unos pocos millones. Estas herramientas permiten identificar, explorar, comprender y presentar las distribuciones, las tendencias y las relaciones en los datos. Por lo tanto, los cuadros, los gráficos y los esquemas son herramientas críticas, no sólo cuando se realiza la epidemiología descriptiva y analítica, sino también cuando necesitamos comunicar los resultados epidemiológicos.

Cuadros o tablas

Un cuadro o tabla es una colección de datos organizados en filas y columnas. Casi cualquier información cuantitativa puede organizarse en un cuadro. Los cuadros son útiles para demostrar los modelos, las excepciones, las diferencias y otras relaciones. Además, sirven de base para preparar muestras visuales, como gráficos o esquemas, donde puede perderse algún detalle.

Los cuadros o tablas pueden incluir distribuciones de frecuencia de una o varias variables a la vez, pero deben mantenerse tan sencillos como sea posible y deben explicarse por sí mismos, o sea, deben transmitir la información del contexto original, aun cuando partan de él. Por consiguiente, los cuadros deben incluir un título claro y conciso que describa el qué, el cuándo y el dónde de los datos del cuadro; se deben marcar con claridad y precisión cada una de las filas y columnas, incluidas las unidades de la medición; se deben totalizar las filas y columnas; si los porcentajes se consideran, se deben mostrar un punto decimal y las explicaciones de los totales de los códigos, las abreviaturas, o los símbolos, en una nota a pie de página, así como la fuente de los datos, en particular si los datos no son originales.

Ver tabla

Cuando se describe una distribución de frecuencias de una única variable, un cuadro –generalmente– mostrará en la primera columna los valores o las categorías de la variable representadas por los datos, por ejemplo, la edad, el sexo, el nivel educacional, etc. Las segunda y la tercera columna mostrarán el número de personas o sucesos que pertenecen a cada categoría.

Ver tabla

Los datos también pueden tabularse de forma cruzada para mostrar los recuentos de una segunda variable. Se conoce como tablas cruzadas o de contingencia. Los epidemiólogos utilizan con frecuencia las tablas de dos-por-dos (2 x 2), que son cuadros que incluyen variables de dos categorías cada una, variables dicotómicas, al estudiar la relación entre una exposición –o tratamiento– y una enfermedad –u otro resultado.

Algunas variables como el sexo o "comer carne de cerdo" tienen un número limitado de alternativas de respuestas o categorías. Estas categorías proporcionan una forma conveniente de presentar datos en un cuadro. Sin embargo, al estudiar una variable con un mayor número de posibilidades, como la edad, la presión arterial sistólica, o el peso, deberemos agrupar las respuestas en un número manejable de categorías (o intervalos de clase). Aunque existe la necesidad de saber y comprender las categorías incluidas en un análisis, al crear los intervalos de clase hay un número de aspectos que debemos recordar. Cread intervalos de clase que sean mutuamente excluyentes y que incluyan todos los datos. Para crear los intervalos, podéis usar diferentes enfoques como dividir los datos en grupos de tamaño similar, basándose en los rangos, en la media y en la desviación estándar, o dividiendo el rango en intervalos del mismo tamaño. Usad un número relativamente estrecho de categorías (de 4 a 8), los intervalos de uso naturales, biológicamente significativos o de la norma, cuando sea posible o estén disponibles. Cread una categoría para incluir "sin dato o respuesta, no disponibles o desconocidos".

Gráficos

Un gráfico es una forma de mostrar los datos cuantitativos visualmente, mediante el uso de un sistema de las coordenadas. Los gráficos ayudan a ver los patrones, las tendencias, las distorsiones, las semejanzas y las diferencias en los datos continuos o numéricos. Son también los mejores medios para mostrar los datos a otros.

Los gráficos más comunes usan las coordenadas rectangulares, con dos líneas, una horizontal y una vertical, que se interceptan en un ángulo recto. Estas líneas se refieren al eje horizontal (o eje x) y al eje vertical (o eje y). Es una práctica común usar el eje horizontal para mostrar los valores de la variable independiente (o explicatoria), por ejemplo, para reflejar el tiempo en años. El eje vertical se usa para mostrar la frecuencia de la variable dependiente (resultado), por ejemplo, los recuentos, las proporciones, y las tasas de los casos de un suceso relacionado con salud en una población. Del mismo modo que los cuadros, los gráficos deben ser sencillos y se deben explicar por sí mismos. Es necesario que sean proporcionales para evitar distorsiones de apariencia.

Existen diferentes tipos de gráficos:

  • gráficos de línea
  • histogramas
  • polígonos de frecuencia
  • diagramas de dispersión

Gráficos de línea

Ver esquema

Los gráficos de línea muestran los patrones o las tendencias sobre una variable numérica, como, por ejemplo, el tiempo. Estos tipos de gráficos se usan en epidemiología para mostrar una larga serie de datos o para comparar varias.

Histogramas

Los histogramas son gráficos de la frecuencia de distribución de una variable continua. Usad las columnas adyacentes para representar el número de observaciones para cada intervalo de clase de la distribución.

Ver esquema

Cuando hagáis un gráfico de un histograma, el área de cada columna debe ser proporcional al número de observaciones en ese intervalo. Las curvas epidémicas que presentan un brote de enfermedades se suelen mostrar con histogramas. Cuando se trazan las curvas epidémicas, es una práctica común utilizar intervalos de clase iguales. Cuando el agente de la epidemia se conoce o sospecha, los intervalos de clase se definen –como regla general– al menos en una cuarta parte del periodo de incubación de la enfermedad de interés. La variable más común en el eje x es el tiempo, pero otras variables continuas, como el colesterol, o la presión arterial, pueden usarse también. A veces, puede incluirse una segunda variable para distinguir, por ejemplo, los casos de una enfermedad a causa del lugar de residencia o por algún otro factor que pueda ayudar a identificar otros patrones en la aparición de enfermedades.

Polígonos de frecuencia

Ver esquema

Un polígono de frecuencia, como un histograma, es el gráfico de una distribución de frecuencias. El número de observaciones de un intervalo se marca con un único punto colocado en la mitad del intervalo (o marca de clase), y luego los conjuntos de puntos se conectan con una línea recta para completar el polígono. En el ejemplo se muestra un polígono de frecuencia, situado sobre el esquema de un histograma con los mismos datos. Esto sólo se muestra como una comparación, ya que no es lo que vosotros haríais en la práctica.

Es importante que notéis que la línea del polígono de frecuencia y del histograma, según se mueva de punto medio a punto medio, crea una serie de pares de triángulos del mismo tamaño que el interior y el exterior del histograma. Éste es un aspecto necesario de los polígonos de frecuencia: indican que el área del histograma y el área del polígono de frecuencia son del mismo tamaño. Para mantener un área total igual, deberéis prestar atención a cómo el polígono de frecuencia se "cierra" en ambos extremos. El método correcto sería comenzar el polígono de frecuencia en la mitad del intervalo que precede al primero que contiene los datos, o sea, al polígono externo del histograma. A continuación, el punto de partida conecta una línea al punto medio del intervalo, que contiene las primeras observaciones. El final del polígono estaría cerrado de un modo parecido.

Diagramas de dispersión

Ver esquema

Un diagrama de dispersión (también conocido como nube de puntos) se utiliza para hacer un gráfico de la relación entre dos variables continuas, con un eje x que representa los valores de una variable, y un eje y que representa los valores de la otra. Para crear este tipo de gráfico, es necesario tener un par de valores para cada persona, grupo, o para otra entidad en el conjunto de datos. Cada par de puntos se trazan en un punto donde ambos valores se interceptan. El modelo general de la "nube de puntos" en el diagrama de dispersión se usa para interpretar la relación entre dos variables. Un modelo lineal bastante compacto indica una correlación alta, mientras que un modelo más disperso indica una correlación baja.

Existen otros tipos de gráficas que ilustran la información estadística sobre la frecuencia de un suceso, que utilizan sólo una coordenada. Son sumamente apropiados para comparar datos categóricos u otros datos agrupados que no son el lugar. Existen muchos tipos de gráficas, pero nos referiremos sólo a aquellas más comunes: las gráficas de barra, las gráficas de barra agrupadas, las gráficas de pastel y los mapas.

Gráficas de barra

Ver esquema

Las gráficas de barra son la forma más sencilla que tenemos para mostrar los datos de un cuadro o una variable. Cada valor o categoría de la variable se representa con una barra. La longitud de la barra es proporcional al número de personas o sucesos en esa categoría. Esta presentación de los datos facilita la comparación del tamaño relativo de cada categoría. La presentación de las barras puede ser vertical u horizontal.

  1. Gráficas de barra agrupada


Ver esquema

    Una gráfica de barra agrupada se usa para ilustrar los datos de un cuadro de dos o tres variables, en particular cuando una variable tiene sólo dos categorías. Las barras dentro de un grupo se encuentran generalmente contiguas entre sí. El patrón que ilustra la barra agrupada debe ser diferente y debe describirse en una leyenda. Es difícil interpretar cuándo se incluye un gran número de barras en la gráfica.

  1. Gráficas de barra compuesta
  2. Las gráficas de barra compuesta se usan para mostrar las categorías de una segunda variable como componentes de las barras que representan la primera variable. Pueden ser más difíciles de interpretar porque, salvo el componente del fondo de la barra, los demás componentes no descansan en el mismo punto de partida.

Ver esquema

    En general, deberéis tener en cuenta las siguientes recomendaciones para construir una gráfica de barra: organizad las categorías que definen las barras o los grupos de barras en un orden natural, como el orden alfabético o ascendente; dibujad todas las barras con el mismo ancho; la longitud de las barras debe ser proporcional a la frecuencia del suceso; no mostréis más de tres barras dentro de un grupo de barras; dejad un espacio entre grupos adyacentes de barras, pero no entre barras dentro de un mismo grupo; codificad las variables de forma diferente; e incluid una leyenda que interprete los códigos utilizados.

  1. Gráficas de barra compuesta del 100%


Ver esquema

    Es una variante de las gráficas de barra compuesta; todas las barras tienen la misma altura y muestran los componentes como porcentajes del total, en lugar de valores absolutos. Este tipo de gráfica de barra se usa para comparar la contribución de diferentes componentes con cada una de las categorías de la variable principal. En este tipo de gráfica de barra no es útil comparar los tamaños relativos de las categorías de la variable principal.

Gráficas de pastel

Ver esquema

Una gráfica de pastel es sencilla, fácil de comprender, ya que el tamaño de cada "porción de pastel" representa la contribución proporcional de cada componente de una variable. Estas gráficas son útiles para mostrar los componentes de un único grupo o variable. Del mismo modo que las gráficas de barra agrupada, cada una de las porciones debe mostrar una convención diferente, que debe estar anotada en una leyenda.

Mapas

Ver esquema

Los mapas o las gráficas de coordenada geográfica se usan para mostrar la ubicación de los casos o los atributos. Los mapas que se usan más frecuentemente son la mancha o mapas de punto y los mapas de área. Los mapas de punto utilizan puntos u otros símbolos para mostrar dónde tuvo lugar un suceso. Este tipo de mapa mostrará los patrones de distribución de las enfermedades, pero no el riesgo de la enfermedad, ya que no considera el tamaño de la población expuesta.

Ver esquema

Los mapas de área pueden usarse para mostrar números o tasas. Al mostrar este tipo de datos en cada unidad geográfica, podemos ilustrar las diferencias de riesgo de un evento en aquellas áreas.

Arriba