Elementos en un esquema de almacén de datos

Anterior Anterior Anterior Anterior Anterior Anterior Anterior

Adquisición de datos. Fuentes de información

Hay muchos tipos diferentes de fuentes de información, aunque las podemos dividir en: fuentes de información interna y fuentes de información externa. Las fuentes de información interna son aquellas que se derivan del sistema de información operacional y se generan en las transacciones de la organización. Por norma general, ocupan bases de datos relacionales. También podemos obtener información interna a partir de sistemas heredados que carecen de una estructura relacional.

Las fuentes de información externa provienen del exterior de la empresa y tienen que ver con la información que se genera fuera de la organización y que le afecta. Acostumbramos a obtener esta información a partir de publicaciones periódicas mediante brokers de información (en formato CD-ROM) o bien a partir de datos accesibles con conexión. Los contenidos se encuentran alojados en bases de datos documentales.

Arriba

Etapas para el almacenamiento de los datos

Para poder contar con información disponible, antes tenemos que asegurarnos bien de que podemos obtenerla, que tiene valor y que responde a nuestras necesidades. Las etapas por las que tenemos que pasar para tener disponible la información son:

Carga. Se trata de pasar la información del formato en que se encuentra al formato que queremos que tenga en nuestro almacén. Este hecho es importante cuando la información proviene de muchos sistemas diferentes, distintos sistemas heredados o sistemas externos no homogeneizados. La carga del almacén de datos se producirá con una periocidad que dependerá del tipo de información de que dispongamos.

Arriba

Conversión. Tenemos que convertir la información de las convenciones en que estaba a las convenciones que hemos establecido en nuestro almacén. Es probable que los códigos que se utilizaban antes no coincidan entre sí; entonces, habrá que buscar una codificación común y aplicársela a todas las fuentes. Un ejemplo muy sencillo es la forma en la que podemos haber codificado el sexo de las personas: unos ficheros pueden haber utilizado una codificación del tipo macho y hembra, otros, hombre y mujer o, incluso, 1 y 2.

Arriba

Limpieza. Limpiar la base de datos quiere decir rechazar toda aquella información que no es útil. La utilidad no depende sólo de si la utilizaremos o no para nuestra toma de decisiones, sino también de si es útil en función de su contenido. Puede haber información incompleta, que no ha sido bien registrada. En tal caso, habrá que rechazar estos registros para que no influyan en las decisiones que podamos tomar en el futuro.

Arriba

Transformación. Transformar la información quiere decir ponerla de acuerdo con el modelo de datos de nuestro almacén. Tenemos que identificar cada una de las dimensiones, las jerarquías y las categorías de cada una de las métricas.

Arriba

Datamart

El almacén de datos contendrá la información que corresponde al modelo de datos de la organización. En algunos casos, puede ser interesante que dispongamos de una parte de la información para dar respuesta a las necesidades de un departamento o área concreta de la organización. Este subconjunto del modelo de datos se llamará Datamart y se extraerá del almacén global para responder a las necesidades particulares.

Herramienta de acceso - OLAP

La herramienta de acceso es el instrumento que nos permite extraer información del almacen para poder satisfacer las necesidades de información. En las bases de datos relacionales se trata de la herramienta de query; en los almacenes de datos tiene que ser una herramienta más elaborada, puesto que tiene que saber manejar un modelo más complejo de información.

Arriba
Cerrar