De los diferentes coeficientes de correlación que hay, en este módulo estudiamos el de Pearson, que es, posiblemente, el que más se utilza en estudios superiores.
El coeficiente de correlación de Pearson mide numéricamente la tendencia a una asociación entre las dos variables que pueda ser explicada mediante una relación lineal. Esto se constatará sobre la nube de puntos por el agrupamiento de los puntos muy cerca de una línea recta.
Ya sabemos cuál es el rango de valores posibles de este coeficiente; los valores extremos, +1 y –1, indican el tipo de asociación perfectamente definidos por una línea recta (creciente o decreciente, respectivamente). Entre estos dos valores extremos, el coeficiente de correlación mide si los puntos representados en la nube tienden a agruparse alrededor de una línea recta de manera muy estricta o con mucha variabilidad.
Se puede observar que coinciden el signo del coeficiente de correlación lineal y la pendiente de la recta, alrededor de la que se pueden considerar agrupados los puntos de la distribución. Pero, la coincidencia no se extiende a los valores absolutos de la pendiente de la recta y del coeficiente de correlación.
Para calcular el coeficiente de correlación correspondiente a un conjunto de bivariante de n datos aparejados, (x1, y1),(x2, y2),... , (xn, yn) se empiezan a calcular las medias y desviaciones tipo, considerando de manera independiente cada una de las dos variables:
x ÿ σx σy.