El lenguaje HTML nos permite especificar un tipo de información más allá del propio contenido del documento mediante diferentes aspectos. Estas propiedades, sin embargo, las establecemos con las especificaciones META,
que no definen todavía un juego estándar de propiedades.
Son especialmente relevantes, aparte de los documentos "normales", en casos en los que una página no contenga texto y esté configurada sólo mediante imágenes, o cuando una página principal de una sede web, o páginas sucesivas, están formadas mediante marcos (frames).
Los elementos META se deben situar siempre en la cabecera del documento para que tengan efecto, concretamente entre <HEAD> y </HEAD>. Una vez que están definidos en los documentos, el aspecto físico de su visualización no cambia; de este modo, el usuario que visualiza una página web no sabe si tiene o no meta-tags, ya que están definidas para actuar entre los navegadores, los servidores y los motores de búsqueda, y son totalmente transparentes al usuario.
La información que incorporamos en estas etiquetas no se puede definir de momento por ningún otro método o etiqueta de HTML; por lo tanto, se trata de una fuente de información bastante importante, ya que podremos definir e identificar diferentes propiedades asignadas a nuestros documentos, como por ejemplo la autoría, la descripción del contenido, las palabras clave más relevantes y otras acciones que veremos a continuación.
Antes, sin embargo, es necesario ver los diferentes elementos básicos que configuran las meta-tags:
HTTP-EQUIV: este elemento es el equivalente a las cabeceras
HTTP, de modo que cuando el cliente solicita una página a un servidor HTTP, el
servidor confirma que aquella página está indexada en su estructura, y envía una respuesta HTTP que proporciona al cliente una información muy importante para la visualización correcta de la página o el documento. Podríamos decir que el elemento HTTP-EQUIV tiene un tipo de control sobre los clientes web y las utiliza para interpretar más cuidadosamente la información, del mismo modo que haría con las cabeceras HTTP normales.
CONTENT: este elemento especifica el valor o contenido concreto asignado por una meta-tag.
NAME: este elemento se asocia al atributo NAME y es utilizado por el tipo META que corresponde a una cabecera HTTP normal,
identificando un nombre de propiedad. Este elemento todavía comporta problemas, ya que sus valores no han sido estandarizados por las especificaciones del W3 Consortium al respecto.
A
continuación, definiremos una serie de etiquetas que se deberían tener en cuenta como mínimo para establecer una correcta utilización dentro de las páginas web:
<META
http-equiv="Content-Type" content="text/html; charset=ISO-8859-5">
Esta
etiqueta sirve para definir el código ISO de los caracteres de las páginas web escritas en lenguaje occidental. Se utiliza esta etiqueta para superar los problemas que puede comportar el juego de caracteres ASCII dentro del entorno web. Para otros tipos de escrituras, con símbolos diferentes a los occidentales, se pueden definir con la norma ISO que corresponda.
<META
name="Author" content="el nombre del/los autor/es">
Esta etiqueta define la autoría del documento creado, ya sea a título particular o corporativo.
<META
name="Description" content="descripción de la página">
Esta etiqueta contiene una pequeña descripción de la página. Conviene no hacer una descripción exhaustiva y demasiado detallada, ya que algunos motores de búsqueda discriminan la extensión de caracteres de búsqueda dentro de esta etiqueta a un total de 250. La información que aquí se detalle será la que el usuario que lleve a cabo una búsqueda en un motor leerá acompañada del recurso encontrado; se trata de una buena posibilidad de definir claramente el objetivo o propósito del contenido de la página.
<META
name="Keywords" content="palabras clave que definan el contenido de la página">
Esta
etiqueta, junto con la anterior, permite a los motores de búsqueda hacer su trabajo de forma más rápida y eficaz. Los términos aquí incorporados deben ir separados por comas, y se pueden escribir con letras mayúsculas si se quiere, a pesar de que es más recomendable hacerlo en minúsculas. Estas palabras clave se pueden definir como conceptos que describan el contenido de la página, pero pensando qué términos puede utilizar el usuario para buscar información relativa. Un punto importante consiste en que algunos motores de búsqueda sólo interpretan o indexan las siete primeras palabras clave, y si hay más, las obviarán todas. Por suerte, no todos los motores hacen esta discriminación. Sin embargo, es importante tener en cuenta que algunos motores no aceptan palabras repetidas muchas veces, y pueden llegar a ignorar este campo sin indexarlo. Las palabras clave se pueden poner en diferentes idiomas para garantizar una indexación en un ámbito mundial, y esto quiere decir que si añadimos un término que sea "biblioteca", también podemos añadir "library",
"bibliothèque", etc. En este sentido, también es posible aprovechar un atributo dentro de la etiqueta name="Keywords" que sea "lang=en, fr...", repitiendo la misma etiqueta tantas veces como idiomas se quieran reflejar, aunque es más pesado llevarlo a cabo de esta forma:
<META name="Keywords"
content="biblioteca,..."> |
<META name="Keywords" lang="en"
content="library,..."> |
<META name="Keywords" lang="fr"
content="bibliothèque,..."> |
<META
name="Copyright" content="© xxxxxxxx">
Se trata de una etiqueta que aporta una información de valor añadido, como ocurre en el caso de los derechos de autor del creador del contenido o del diseño. Algunos motores de búsqueda como Altavista, Infoseek y Hobot empiezan a tenerla muy en cuenta porque podrían permitir el hecho de tener garantías sobre los contenidos de las páginas.
<META
http-equiv="Expires" content="Sun, 25 Apr 1990 14:54:23 GTM">
Esta etiqueta permite "avisar" al navegador cuando expira la vigencia de la página o incluso cuando su información, a priori, es válida. La fecha necesariamente debe tener el formato RFC850 (GTM).
<META
http-equiv="Pragma" content="no-cache">
Esta etiqueta también va asociada al uso de la memoria caché del navegador, y lo que permite es que no se quede en esta memoria residente la página. En navegadores como Netscape Communicator u Opera, esta etiqueta funciona, pero tanto Internet Explorer como NeoPlanet la ignoran y continúan almacenando las páginas en esta memoria, que tiene como función principal verificar que la página que se solicita no ha sido previamente visitada. Si es así, y la tiene dentro de la memoria caché, lo que hace es simplemente cargarla desde aquí si el contenido no ha cambiado, de modo que agilita la navegación.
<META
http-equiv="Refresh" content="segundos de espera; url=http://dirección redireccionada">
Esta etiqueta permite redireccionar a otra página pasados unos segundos determinados por su creador, o bien refrescarla después de x segundos.
<META
name="Robots" content="all | none | index | noindex | follow |
nofollow">
Esta etiqueta permite definir unas pautas con relación a los indexadores de los diferentes motores de búsqueda, en distintos sentidos. Puede ocurrir que no se quiera que la página web quede indexada por los motores de búsqueda. En este caso, se debe indicar con el atributo "noindex", lo contrario de "index", que especifica que lo hagan. De todas formas, también podemos definir hasta qué nivel de indexación queremos que lleguen los motores de búsqueda. De este modo, el atributo "all" permite una indexación completa de todos los ficheros de la página o las páginas, mientras que "none" quiere decir que no los indexe, pero que sí lo haga con el resto de la información. Por otro lado, también podemos especificar los motores que indexen los vínculos de la página a otras páginas con "follow", mientras que
"nofollow" deshabilita esta opción. Como puede verse, podemos proporcionar a los indexadores de los motores de búsqueda mucha información que facilite su tarea, pero también se pueden rechazar si no queremos que "busquen" para indexar unas páginas concretas. También tenemos la posibilidad de crear un fichero denominado "robots.txt"
que, colocado en la raíz de un servidor web, indica mediante su sintaxis que las páginas de aquella máquina no están indexadas, por lo que deshabilita sus opciones de indexación hacia un servidor web concreto.
<META
name="Revisit" content="X days">