Data Warehouse
Atrás

Siguiendo con la tecnología que nos permite almacenar y acceder a los datos y la información de una manera rápida y relevante, describiremos en este apartado el concepto de Data Warehouse. Para hacerlo distinguiremos dos tipos de sistemas de información dentro de las organizaciones:

El Data Warehouse se encuentra en medio de estos dos sistemas. ¿Por qué? Porque, normalmente, los datos operativos de una organización se encuentran dispersos en varios sistemas de gestión de bases de datos, que emplean diferentes formatos de datos y plataformas de hardware distintas. El Data Warehouse permite la extracción de datos de estos sistemas de forma más fácil y rápida, además de asegurar la consistencia de los datos. Además, para no perder la información de la procedencia de los datos y para tener información sobre lo que hay en el Data Warehouse y cómo acceder a él para obtener lo que se desea, el Data Warehouse almacena información sobre las fuentes de los datos, cómo se han transformado para incluirlos en el DW, quién accede a los datos, con qué frecuencia, qué procesos de negocios soporta y qué factores críticos de éxito soporta en un repositorio de metadatos.


El Data Warehouse es un conjunto de datos integrados y de carácter temático, extraídos de uno o más sistemas operacionales y de uno o más proveedores de información externos que son volcados en una base de datos separada. Los datos que son incluidos en el Data Warehouse son transformados o integrados en una estructura consistente.


Ejemplo

Para terminar esta pequeña introducción al concepto de Data Warehouse expondremos las aracterísticas principales:

Gráfico
  • Conjunto de datos integrados: los datos, provengan de la base de datos que provengan, son consistentes, es decir, comparten el nombre de las variables, el formato de los distintos campos, las medidas de los atributos, la codificación, etcétera.
  • Bases de datos temáticas: las bases de datos que componen el Data Warehouse son temáticas, independientemente de que los datos los extraigan de bases de datos, como las operacionales, que se organizan teniendo en cuenta los procesos administrativos, con una organización diferente.
  • Marcación temporal: cada registro del Data Warehouse llevará información sobre el momento en el que se ha producido dicho valor. De esta forma contaremos con datos de diferentes periodos y podremos, por ejemplo, identificar tendencias.
  • Datos no volátiles: una vez que se introduce un dato en el Data Warehouse, ni se modifica ni se actualiza. Cualquiera de estas dos operaciones crea un nuevo registro. De esta forma, disponemos de información histórica con su referencia temporal junto con los datos actualizados.

Cuando se construye un Data Warehouse hay que tener presente las aplicaciones específicas a las que debe apoyar, el uso que se le va a dar.


Arriba