Los índices y los ficheros invertidos en la búsqueda de información
Otra de las características de estos sistemas de recuperación de la información es el uso de los operadores booleanos, los truncamientos o la búsqueda por la raíz de las palabras y los operadores de proximidad. En el apartado siguiente trataremos más detalladamente estos conceptos.
Generalmente, estas herramientas de recuperación de la información se han aplicado a conjuntos de información estructurada y tratada previamente por documentalistas y han dado como resultado las bases de datos comerciales, descritas en el módulo 2 ("Características de las fuentes y los recursos de información, según su formato o soporte. Fuentes digitales. Bases de datos comerciales").
La aparición de Internet y de la web ha puesto al alcance de los usuarios un gran volumen de información (billones de ítems), en gran parte desestructurada, y ha obligado al desarrollo de herramientas que hagan posible la recuperación (Mahon, 2001).
A mediados de los años noventa del siglo XX aparecieron los primeros motores de búsqueda de Internet. Utilizaban algún tipo de base de datos documental y unas herramientas denominadas robots o arañas (spiders) que automatizaban el proceso de navegación por la Red, visitaban continuamente millones de páginas y almacenaban el contenido.
En aquellos momentos AltaVista se constituyó como el motor de búsqueda más popular. Altavista y sus seguidores, Yahoo, Lycos, Inktomi, etc., utilizaban esencialmente los operadores booleanos, de proximidad y los truncamientos.
Hay que reconocer que Yahoo ha utilizado desde el inicio documentalistas que filtran y tratan la información, para clasificarla en categorías, y ha dado paso a la configuración de los directorios, estructurados por materias y temas y que facilitan el acceso a la información mediante la navegación, por la clasificación establecida previamente.
La aparición del buscador Google representó un avance significativo en los sistemas de recuperación de la información presente en Internet, al introducir un criterio de calidad para la selección basado en el número de conexiones entre los sitios y las páginas web. Últimamente este motor ha incrementado su cobertura al facilitar la recuperación de la información de documentos diferentes de las páginas HTML, como los documentos PDF.
Paralelamente a la evolución de los motores de búsqueda y los directorios, han ido surgiendo herramientas que actúan sobre múltiples motores de búsqueda al mismo tiempo; son los metabuscadores.
En la estantería virtual podréis encontrar más información sobre los motores de búsqueda, los directorios y los metabuscadores (direcciones de los principales y tablas comparativas).
Finalmente, tenemos que hablar de una última generación de herramientas de búsqueda y recuperación de la información: son los denominados agentes inteligentes. Aunque estas herramientas son muy nuevas, no significa que sean totalmente innovadoras (Revelli, 2000). El precedente es un sistema llamado Eliza, desarrollado en el año 1966 en el Massachusetts Institute of Technology (MIT).
Durante los años setenta del siglo XX, la evolución de los agentes inteligentes estuvo estrechamente vinculada al progreso de la inteligencia artificial (IA), pero hasta el pleno desarrollo de Internet y de la Web estas herramientas no se han introducido finalmente.
Veamos a continuación la definición del concepto agente inteligente, sus características y la tipología que hay.
Los agentes inteligentes
La definición de agente inteligente ha sido objeto de controversia. Simplificando al máximo, podemos encontrar a autores que consideran los agentes inteligentes casi como seres humanos y, por otra parte, a otros que los asimilan al software avanzado (Revelli, 2000). Según este último autor:
| 
| "Un agente inteligente es una entidad de software que posee atributos propios y que tiene como objetivo desarrollar un conjunto de tareas en nombre de otra entidad (otro agente o una persona)."
C. Revelli (2000). Intelligence stratégique sur Internet. París: Dunod. | |
|
El problema es definir cuáles son los atributos propios de un agente. Según O. Erzioni y D. Weld (1995), se pueden considerar los atributos siguientes:
| 
| Autonomía. Un agente es capaz de tomar iniciativas de una manera autónoma y ejercer un control sobre sus acciones. |
| 
| Capacidad de colaboración. Un agente es capaz de cooperar con otros agentes o con personas para llevar a cabo sus tareas. |
| 
| Capacidad de aprendizaje. Un agente es capaz de adaptarse a las necesidades del usuario analizando las acciones efectuadas. |
| 
| Orientado a los resultados. Un agente acepta las demandas humanas precisas y decide de qué manera las resuelve. |
| 
| Flexibilidad. Las acciones de un agente no se pueden establecer por completo previamente. |
| 
| Self-starting. A diferencia del software tradicional, un agente puede decidir, según las condiciones externas, el momento adecuado para efectuar una acción. |
| 
| Carácter propio. Un agente posee una personalidad propia y definida. |
| 
| Movilidad. Un agente es capaz de desplazarse de una máquina a otra y a través de diferentes plataformas y arquitecturas. |
Los agentes inteligentes que hay no poseen el conjunto de estos atributos, sino que tienen una parte de los mismos, según su finalidad o especialización. Veamos a continuación las diferentes clases de agentes, según sus atributos y según sus objetivos o tareas principales que tienen que desarrollar:
Atributos
Agentes móviles. Su característica principal es la capacidad de desplazarse por las redes informáticas para llevar a cabo tareas concretas independientemente de los usuarios.
Interfaces inteligentes. Se definen como asistentes personales capaces de colaborar con el usuario en un mismo espacio de trabajo. Tienen capacidad de aprendizaje y a partir de la observación del comportamiento de los usuarios pueden sugerir alternativas.
Agentes de gestión de perfiles. Sus tareas principales son la búsqueda y la recuperación de información procedente de distintas fuentes. Tienen capacidad de aprendizaje y de colaboración.
Tareas
Agentes para la búsqueda de información: el objetivo es optimizar la búsqueda de información por Internet. Los principales son los siguientes:
| 
| Metabuscadores en línea. No se pueden considerar agentes propiamente dichos, pero tienen parte de sus atributos. |
| 
| Metabuscadores fuera de línea. Son metabuscadores que se instalan en los ordenadores personales y su principio de funcionamiento es el mismo que el de los metabuscadores en línea. La diferencia es que el usuario programa la estrategia de búsqueda y las direcciones que hay que rastrear y, cuando es el momento, el agente se activa por sí solo, se conecta a Internet y efectúa la búsqueda. |
| 
| Agentes de búsqueda avanzados. Estos agentes han incorporado funciones adicionales en los agentes para la búsqueda citados. Son los siguientes:

| personalización por sector de actividad |

| vigilancia, filtro y almacenamiento de los resultados |

| análisis lingüístico de las demandas de información |

| análisis de los resultados |
|
Agentes para la vigilancia. Su objetivo principal es el seguimiento de novedades y cambios en los sitios y páginas web para alertar al usuario. Podemos encontrar dos tipos: por una parte, los denominados pull (que literalmente significa 'estirar'), es decir, que el usuario o el agente tiene que actuar activamente para recuperar la información; y por otra, los denominados push ('empujar'). En este último caso el usuario es menos activo, y es el sistema el que le envía la información.
Agentes para el comercio. Los agentes inteligentes dedicados al comercio están en plena expansión. Su objetivo o tarea principal es facilitar al consumidor la selección de tiendas, marcas y productos ofrecidos presentes en Internet. Pueden ser de dos tipos:
| 
| Agentes controlados por los clientes o consumidores, denominados shopping agents. Estos agentes son utilizados por los consumidores para localizar las ofertas óptimas de productos y marcas. |
| 
| Agentes controlados por los productores, también denominados interfaces inteligentes. Estos agentes son utilizados por los productores o distribuidores de productos o servicios y funcionan a partir del tratamiento de la información de los clientes o visitantes de la web. De este modo, permiten al productor hacer un marketing individualizado y prever su comportamiento. |
Agentes asistentes. Hay numerosos agentes asistentes por Internet que tienen distintos objetivos. Unos son los agentes guía, los cuales, a partir del comportamiento del usuario, le sugieren sitios web que le pueden interesar. Otros son los agentes de oficina, como por ejemplo los que gestionan los correos electrónicos y facilitan el filtro, la eliminación y la respuesta automática de los mensajes.
Las expectativas creadas por la aparición de todos estos agentes en los usuarios de la Red se pueden haber visto decepcionadas, sobre todo con respecto a su "inteligencia", porque sus prestaciones pueden no estar todavía a la altura de las necesidades de recuperación, selección y filtro de la información. Sin embargo, sin duda, son un elemento imprescindible para acceder a la información presente en Internet. Hoy en día nadie se puede plantear la posibilidad de analizar, tratar y recuperar la información exclusivamente mediante operadores humanos.
Veamos la opinión sobre el futuro de los agentes inteligentes y el rol de los documentalistas de Nicholas Negroponte (fundador y director del célebre Media Lab-MIT), mediante una entrevista por correo electrónico publicada en la obra de Carlo Revelli (2000), Intelligence stratégique sur Internet.
|