Introducción

Atrás Adelante 2/3

La información de una organización es uno de los puntales de su sistema de información. En el lenguaje coloquial se utilizan los términos datos e información, en muchos casos, de forma indistinta. Para ser más formales, sería preciso utilizar el término dato para hacer referencia al valor abstracto, y el término información cuando un dato ha adquirido sentido para nosotros. Así, podríamos decir que los ficheros de información están llenos de datos y que cuando confeccionamos un resumen o realizamos un informe los convertimos en información, ya que les añadimos el contexto que servirá para que tengan un sentido para nosotros.

En el entorno de este curso, no es demasiado importante ser formales en el significado de los dos términos. En muchos casos, se utiliza en ambos sentidos, pero conviene separar el significado de cada uno de ellos si queremos ser formales.

El tratamiento automatizado o mecanizado de la información en las organizaciones requiere el uso de sistemas de gestión de bases de datos, que son sistemas informáticos que están especializados en tratar datos para satisfacer las necesidades de la mecanización de los sistemas de información. Aunque están orientados a satisfacer necesidades transaccionales u operacionales, fueron los primeros que se utilizaron para satisfacer las necesidades informacionales.

La evolución que las tecnologías de la información han experimentado ha permitido contar con instrumentos mucho más apropiados para apoyar de forma adecuada las necesidades informacionales. A continuación, observaréis la evolución que han seguido los sistemas informáticos de almacenamiento de información desde la óptica de satisfacer las necesidades informacionales.

Sistemas de gestión de bases de datos

Los sistemas de gestión de bases de datos fueron los primeros instrumentos informáticos que permitieron realizar un tratamiento de los datos de una organización de una forma integrada y adecuada a sus características. Hasta entonces, los datos se trabajaban de forma totalmente relacionada con las actividades que los trataban sin reconocer que existían de forma independiente al tratamiento que recibían. Y esto era así debido a la capacidad de la tecnología con que se contaba, puesto que ni con la tecnología del papel ni con las primeras herramientas de las tecnologías de la información era viable realizar un tratamiento de los datos de forma integrada y propia.

Los sistemas de gestión de bases de datos que se centran en el modelo relacional han sido los que han hecho posible esta realidad. Hablar de un modelo quiere decir saber las reglas en las que éste se basa para poderlo utilizar con propiedad.

Conceptos

Contenido complementario

Estudiaremos el modelo relacional de base de datos por medio de los componentes de una base de datos y de la funcionalidad que podemos encontrarle.

Si conocéis estos conceptos no es preciso que hagáis nada más, pero, en caso contrario, podéis consultar los capítulos 1 y 2 de la parte II del libro de Miralles (1995). Si vais al capítulo 3 de esta misma referencia, podréis adelantar un paso más en el conocimiento de las bases de datos relacionales.

También podéis acudir a las páginas 206-213, del libro de Laudon (2002), con el fin de acabar de entender el concepto de base de datos y de sistema de gestión de base de datos.

Sistemas de data warehousing

Actividad

Los sistemas de data warehousing son la tecnología de la información que apareció para servir de apoyo al sistema informacional de una organización. Sus predecesores, los sistemas de gestión de base de datos, sólo podían ofrecer una satisfacción parcial a las necesidades del sistema informacional.

Origen de la información

La información interna de la organización que forma parte de un almacén de datos (utilizaremos esta terminología como sustituta de la anglosajona data warehouse) proviene únicamente de los sistemas operacionales de la organización. Con esto queremos decir que el almacén de datos no tiene una entrada propia de información interna. De hecho, no está pensado para que se introduzca en él información interna que no haya pasado por el sistema operacional.

La información interna de la organización que forma parte de un almacén de datos proviene de los sistemas operacionales.

Pero ésta no es la única información que puede formar parte de un almacén de datos. Los almacenes de datos, y esto los diferencia de los sistemas operacionales, pueden incorporar, en caso de que sea necesario, información de fuentes externas a la organización. La necesidad de este tipo de información se tendrá que considerar en función de las necesidades de información que tengan los decisores de la organización (recordemos que el sistema informacional está pensado -o tiene que estar pensado- para satisfacer las necesidades de estos últimos).

El almacén de datos tiene que contener la información de fuentes externas que sea necesaria en el proceso de toma de decisiones en la organización.

Estructura de los datos

Si el sistema operacional está basado en un modelo relacional que guarda los datos en tablas (recordad los conceptos de un SBGD basado en el modelo relacional), a los almacenes de datos del sistema informacional les conviene un modelo en estrella.

Esquema

En el centro de la estrella tiene que estar siempre el dato del que queremos obtener información. Este dato o valor se llama métrica. Así pues, deberemos tener una estrella para cada métrica.

En los brazos de la estrella representamos las dimensiones a partir de las cuales queremos analizar la métrica.

Cada dimensión presenta diferentes caminos alternativos en el análisis. Cada uno de estos caminos se llama jerarquía, y cada jerarquía representa una duplicación -dicotomización- del brazo de la estrella.

Ejemplo

Las jerarquías pueden presentar niveles de análisis de diferente finura. Cada nivel configura una categoría, aunque éstas no aparecen representadas en el modelo de la estrella.

El metadato

Éste no es un concepto demasiado importante en esta asignatura, y si lo mencionamos aquí es porque creemos conveniente que lo conozcáis, ya que aparece en alguna de las referencias que hemos utilizado.

El metadato es una herramienta muy útil para el sistema informático que tiene que hacer funcionar el almacén de datos. El metadato establece cómo es el modelo del almacén de datos, describe las métricas y sus familias de valores, dimensiones, jerarquías y categorías, e incluye, también, las características descriptivas de cada dato que forma parte del modelo. En definitiva, es el diccionario de los componentes del almacén de datos.

Asimismo, es una herramienta útil para quienes tienen que definir el sistema informacional, dado que les permite tener referenciados todos los componentes de este sistema.

Construcción del sistema data warehouse

Esquema
Actividad

En el esquema veréis el ciclo de vida de un almacén de datos. Podéis distinguir las fuentes a partir de las que podréis extraer la información interna y externa; el proceso de adquisición de la información con el fin de pasar de las fuentes al almacén de datos; la distribución del almacén en diferentes datamarts y, por último, el acceso a la información mediante una herramienta adecuada.

  Arriba