Una vez establecido el modelo, en este caso lo que nos da la recta de regresión, podremos hacer predicciones del valor que puede tener la variable de respuesta: el valor nos da la función "modelo", para cierto valor x0, es decir, lo que hemos definido como ajuste, será el valor que estimaremos.
Puesto que el coeficiente de correlación mide cuán estricto es "el acercamiento de la nube de puntos a una línea recta", es intuitivo que cuanto más grande sea el valor absoluto de coeficiente, más fiabilidad tendrán las predicciones que se puedan hacer y más pequeño será el margen de error con que se deberán enunciar.
Imaginemos que se quiere hacer un estudio para buscar relaciones entre el rendimiento respecto a la lengua catalana y a la lengua castellana.
Se deberán recoger las notas del grupo de alumnos objeto de estudio. Nos dan las tablas siguientes, recogidas en un conjunto de 339 alumnos:
Nota de catalán |
ni |
|
Nota de castellano |
ni |
Insuf. |
120 |
|
Insuf. |
158 |
Aprobado |
168 |
|
Aprobado |
139 |
Not./Ex. |
51 |
|
Not./Ex. |
42 |
No se podría decir, de ninguna manera, que queremos hacer una estadística bivariante, lo único que podríamos hacer es una descripción global de cada variable.
Con las tablas anteriores no podríamos relacionar las variables; para hacerlo necesitaríamos saber, por ejemplo, si los alumnos que han obtenido "buenas notas" de catalán corresponden, en buena parte, a los que han obtenido los excelentes de castellano, o no; si el conjunto de insuficientes en una materia y la otra tiene una intersección muy gande o no; y todo esto no se puede deducir de las tablas anteriores.
A continuación, empezamos el estudio práctico de presentación de datos de la estadística bivariante.
Veamos una tabla cruzada que se corresponde con las tablas anteriores:
Nota de catalán |
Nota de castellano |
Total |
|
Insuf. |
Aprob. |
Not./Ex. |
|
Insuf. |
98 |
22 |
0 |
120 |
Aprob. |
59 |
97 |
12 |
168 |
Not/Exc. |
1 |
20 |
30 |
51 |
Total |
158 |
139 |
42 |
339 |
En una tabla cruzada se incluye siempre una fila y una columna de totales; estas distribuciones de totales reciben el nombre distribuciones marginales.

A partir de los datos se pueden construir las distribuciones marginales, pero no al revés.
Ahora ya se pueden contestar las preguntas que nos formulábamos antes. Ya podemos estudiar las relaciones entre las dos variables.