Análisis cluster

E N U N C I A D O :

Disponemos de datos referentes a aspectos relacionados con el desarrollo de la sociedad del conocimiento para el año 1999 de los siguientes países: Alemania, Bélgica, España, Estados Unidos, Finlandia, Francia, Noruega, Portugal y Reino Unido:

A1: ordenadores personales (PC por cien habitantes).

A2: estimación de usuarios de Internet (número de usuarios por mil habitantes).

A3: evolución de los hosts de Internet (número de hosts por mil habitantes).

A4: líneas telefónicas principales (número de líneas por cien habitantes).

  A1 A2 A3 A4
Alemania 29,7 175,3 20,0 59,0
Bélgica 31,5 118,2 33,5 50,2
España 11,9 70,4 12,0 41,0
Estados Unidos 51,7 271,7 202,2 67,3
Finlandia 36,0 323,9 8,0 55,2
Francia 26,7 91,6 238,2 58,2
Noruega 44,7 446,6 100,4 70,9
Portugal 9,3 70,0 7,8 42,3
Reino Unido 30,3 210,1 29,7 56,7

A partir de estos datos, queremos formar tres grupos homogéneos en los que queden enmarcados los diferentes países y extraer alguna conclusión.

Nota: encontraréis los datos en el fichero adjunto

S O L U C I Ó N :

Para realizar el análisis cluster de estos datos con Minitab hay que hacer lo siguiente:

Stat / Multivariate / Cluster Observations...

A continuación os aparecerá el siguiente cuadro, en el que deberéis poner las columnas en las que se encuentren las diferentes variables (en este caso C2, C3, C4 y C5), después marcar la opción Standardize variables (dado que las diferentes variables están en unidades diferentes), poner el número de clusters y, finalmente, marcar la opción Show dendrogram.

De esta manera y haciendo OK, se obtiene la siguiente salida:

Final Partition

Number of clusters:   3

         Number of    Within cluster Average distance  Maximum dist.
        observations  sum of squares  from centroid    from centroid  
Cluster1     6             9,160          1,170            1,581  
Cluster2     2             1,764          0,939            0,939  
Cluster3     1             0,000          0,000            0,000  

y el siguiente gráfico (dendrograma):

en el que se puede observar la ubicación de cada país. Dado que hemos marcado tres grupos, tenemos que los países se agrupan de la siguiente manera:

1.er grupo: Alemania, Reino Unido, Bélgica, Finlandia, España y Portugal

2.º grupo: Estados Unidos y Noruega

3.er grupo: Francia

Si analizamos esta agrupación teniendo en cuenta los datos iniciales, podemos llegar a las siguientes conclusiones: la particularidad del tercer grupo está en el hecho de que si bien Francia tiene un gran número de hosts por cada mil habitantes, no tiene una gran proporción de usuarios de Internet ni de PC. Por tanto, para este grupo podemos hablar de un desarrollo parcial de la llamada sociedad del conocimiento.

Por lo que respecta al segundo grupo, los rasgos más importantes son que tienen muchos hosts, al tiempo que un elevado porcentaje de usuarios y de PC. Siguiendo con el mismo razonamiento que antes, podríamos decir que Estados Unidos y Noruega son los países que han conseguido un desarrollo más equilibrado en el seno de la sociedad del conocimiento.

Finalmente, para los países del tercer grupo, podríamos relacionarlos diciendo que son países que están en un fase todavía preliminar por lo que respecta al crecimiento de los indicadores que marcan la plena entrada en el uso de las tecnologías de la información y la comunicación en la sociedad.

Como se puede observar en el dendrograma, en el mayor grupo, se aprecia que se podrían formar subgrupos. Así, de esta manera podemos ver una afinidad entre España y Portugal, entre Bélgica y Finlandia y entre Alemania y el Reino Unido.

De la salida de Minitab también se obtiene más información, referente a la "distancia" entre grupos (es decir, entre sus centros o centroids). Así, tenemos lo siguiente:

Distances Between Cluster Centroids

            Cluster1     Cluster2     Cluster3  
Cluster1     0,0000       3,2925       2,6406
Cluster2     3,2925       0,0000       2,9797
Cluster3     2,6406       2,9797       0,0000

Gracias a estos datos, se puede apreciar que los tres grupos son equidistantes.

Arriba
Cerrar