Las distribuciones de frecuencia muestran los valores que una variable puede tomar y el número de personas o registros con cada valor. Para construir una distribución de frecuencias, enumeramos en primer lugar, todos los valores –de menor a mayor– que una variable dada puede tomar. Luego, se incluye el número de veces (frecuencia) que aparece cada valor en la lista de registros. Esto permite determinar qué valores aparecen más a menudo. Las distribuciones de frecuencia se pueden presentar en forma tabular o gráfica.
¿Qué rango de valores puede tomar una variable?
Según el valor (o escala) que una variable puede tomar, puede clasificarse como:
- dicotómica
, cuando los valores pueden organizarse en cualquiera de las dos categorías mutuamente excluyentes;
- nominal
, cuando se pueden organizar en categorías cualitativas o por nombres no ordenados;
- ordinal
, si los valores siguen un rango en una escala cualitativa, pero no existe ninguna distancia natural entre los valores; o,
- intervalo
, si incluye un intervalo igual con una distancia natural entre los valores, así la distancia en una región de la escala representa la misma distancia en otra región de esa escala y el valor cero que asume es arbitrario; y
- de razón o continua
, cuando existe un valor de cero real, así las razones entre los valores son más significativas.
¿Qué clase de medidas de frecuencia pueden usarse para describir o resumir los datos dicotómicos o categóricos?
En Epidemiología, es útil tener formas alternativas para describir las variables dicotómicas más allá de la presentación de las distribuciones de frecuencia. Estas variables tienen sólo dos categorías posibles que son mutuamente excluyentes. Por ejemplo, vivo o muerto, caso o control, expuesto o no expuesto, etc. Las medidas de frecuencia que pueden usarse con variables dicotómicas son recuentos, razones, proporciones y tasas.
Los recuentos permiten determinar la magnitud absoluta o la frecuencia de una característica en una población. Por ejemplo, el número de mujeres, el número de fumadores o el número de niños con sarampión en un grupo de población. Los indicadores basados en recuentos proporcionan información sobre la magnitud absoluta de una medición en un grupo. Esta información puede ser útil para hacer planes con una finalidad de programación, pero puede ser limitada para las comparaciones. Por ejemplo, al comparar la mortalidad infantil entre Colombia y Estados Unidos, basándonos sólo en el número de defunciones, podríamos concluir erróneamente que existe un mayor problema en Estados Unidos, si no hemos considerado antes que la población en Estados Unidos es mayor en dicha comparación.
Las razones se usan para evaluar la frecuencia de una característica en un grupo que no presenta tal característica; en esta comparación, el denominador no incluye numerador. Las razones, generalmente, expresan varias observaciones en una categoría respecto a otra. La razón urbana de población en relación con la rural en Colombia es 3:1, lo que indica que para cada persona en las áreas rurales, hay tres en las áreas urbanas.
Una proporción es un tipo especial de razón donde el numerador forma parte del denominador. A veces, se expresa como porcentajes, que se obtienen al multiplicar la proporción por una constante (100). Por ejemplo, la proporción de mujeres analfabetas, como porcentaje de la población total de Colombia es de un 22% en el periodo comprendido entre 1992 y 1994.
Las tasas son similares a las proporciones –en las primeras el numerador forma parte del denominador–; sin embargo, difieren conceptualmente porque, en las tasas, el denominador incluye una dimensión dinámica de cambio en el tiempo. Para hacerlas más significativas, tienden a ser multiplicadas por un factor constante. Por ejemplo, la tasa de mortalidad por enfermedades transmisibles en Colombia durante el periodo 1992-1994 en mujeres fue de 61 por 100.000 personas.
Los indicadores que se basan en las razones, las proporciones, y las tasas, son más informativos y más útiles para identificar las diferencias entre grupos, ya que son indicadores de la magnitud relativa.
¿Qué clase de mediciones de frecuencia pueden aplicarse para resumir y describir los datos numéricos?
Cuando describimos los datos numéricos (continuos), podemos usar las medidas de tendencia central y las medidas de dispersión.
Propiedades de las distribuciones de frecuencia. Las distribuciones de frecuencia también pueden ilustrarse como gráficos, que muestran diferentes propiedades: la ubicación central, la dispersión o variación, y la curtosis o inclinación.