Tesauros

El tesauro es la herramienta que utilizan las bases de datos más complejas para incorporar información y, a la vez, para ayudar a su recuperación.

Un tesauro es un diccionario de reenvíos destinado a ayudar al usuario a establecer sus necesidades de información de lenguaje de descriptores, proporcionar una indización fina y detallada de los documentos y solicitar la información por estos términos.

Formalmente, un tesauro es un diccionario que muestra la equivalencia entre términos del lenguaje natural y términos normalizados (descriptores) y preferentes del lenguaje documental, así como las relaciones semánticas que existen entre otros términos.

Un tesauro provee al campo científico en que se desarrolla de una estructura conceptual completa. Todo el campo está representado conceptualmente en los términos recogidos en el tesauro.

El objetivo de un tesauro es convertirse en una herramienta de lenguaje que tiene una serie de características propias:

  • Es una herramienta pactada: tanto quien lo introduce como quien lo recupera lo conocen o tienen posibilidad de conocerlo.

  • Es una herramienta estructurada: los descriptores que aparecen tienen establecidas relaciones entre sí.

  • Es una herramienta consistente: ante un determinado concepto siempre se puede utilizar el mismo descriptor.

  • Es una herramienta exhaustiva: prevé todas las posibilidades conceptuales.

  • Es una herramienta concisa: el descriptor tiene que estar compuesto de la manera más simple y precisa posible.

Rasgos principales de los tesauros asociados a las bases de datos:

 
Ejemplo
  • Admiten un único término para designar un único concepto (no se admiten accidentes gramaticales como la sinonimia o la polisemia).

 
Ejemplo
  • El resto de los posibles términos de lenguaje natural no aceptados en el tesauro mantienen con el aceptado una relación semántica de sinonimia que permite a la base de datos reenviar desde el término no aceptado al descriptor.

 
Ejemplo
  • Cada descriptor mantiene relaciones con otros descriptores dentro del tesauro. Estas relaciones son jerárquicas, de término más genérico (broader term) o término más específico (narrow term), y de términos relacionados (related term). De manera que al final se establece un sistema complejo, pero útil, para ayudar a la recuperación de la información.

 
  Arriba