Desde la aparición del lenguaje HTML hemos visto su evolución, pero también han podido verse sus carencias y sus límites. La flexibilidad relativa del W3C, a la hora de aceptar nuevas propuestas de etiquetas que hagan acciones determinadas, acabó desembocando en una nueva especificación de lenguaje SGML, el subconjunto XML. Un paso previo a este nuevo lenguaje ha sido la aparición del lenguaje XHTML, lenguaje de HTML extensible que se presenta como un intento de reescribir HTML 4 en XML. En el mes de febrero de 1999, el World Wide Web Consortium (W3C) aprobó de manera definitiva la especificación XML 1.0 (extensible Markup Language), el nuevo lenguaje que se integra como una evolución más, y necesaria, al conocido lenguaje HTML, de modo que cubre gran parte de sus carencias y agiliza mucho el trabajo de almacenamiento y distribución de información. | |||||||||||||
![]() |
El gran problema que plantea hasta ahora el lenguaje HTML es que sólo permite la difusión de texto e imagen, y una de las grandes novedades que aporta el lenguaje XML es que rompe precisamente esta barrera al permitir el intercambio de cualquier tipo de datos o información, sea cual sea su orígen. Eso nos hace pensar que el XML puede solucionar o paliar gran parte de los problemas que provoca la coexistencia de diferentes formatos de almacenamiento de datos. De todos modos, el XML no pretende ser el sustituto del HTML, sino más bien una herramienta complementaria que potencie al máximo el rendimiento de la información que vehicula por la red. Tampoco se trata de una versión evolucionada de HTML, ya que mientras éste describe la presentación de información, XML describe su contenido. XML se presenta, pues, como un subconjunto del SGML que por su "extensibilidad" para generar nuevas etiquetas, partiendo de una norma de sintaxis que garantiza la consistencia de éstas, puede considerarse un metalenguaje. | ||||||||||||
![]() |
El origen es común para los dos (HTML y XML), que se originan en las especificaciones del estándar SGML (Standard Generalized Markup Language), que permitió definir de manera conjunta para los documentos electrónicos tanto su estructura como el contenido. De hecho, el XML es una acotación de SGML que se ha tenido en cuenta específicamente para su uso dentro de la red Internet, con una flexibilidad que permite definir libremente las etiquetas específicas de su formato,lo cual se diferencia mucho del "rígido" HTML con etiquetas predefinidas y fijas. Esto permite definir de manera clara dentro del mismo documento qué información contiene, y estructurar unos contenidos fáciles de entender e interpretar por parte de cualquier programador. En lo que concierne al usuario, éste no tendrá que preocuparse porque no comportará un cambio visual efectivo, ya que serán los diferentes programas los que se encargarán de proporcionar la información del documento de manera legible. | ||||||||||||
![]() |
La gran característica que hace que este lenguaje tenga un gran atractivo para desarrollar líneas de trabajo diferentes como por ejemplo el comercio electrónico, banca por Internet o gestión de cualquier tipo, es que puede almacenar y distribuir datos de origen muy distinto, como bases de datos, hojas de cálculo, etc., si tenemos en cuenta que puede interactuar perfectamente con applets y servlets de Java, lo cual permitirá una gran facilidad de acceso a información de bases de datos y una mayor flexibilidad en la publicación de estos y muchos otros datos en Internet. | ||||||||||||
![]() |
Por otra parte, no se verán solamente afectados (en el buen sentido del término) los procesos para publicar y distribuir información electrónica, sino que también se verá una notable diferencia en la eficacia de los motores de búsqueda de Internet. Hasta ahora éstos se basan en las diferentes palabras "indizadas", ya sean las correspondientes a las meta-tags o las veinticinco primeras de cada página, y no en su significado, de manera que siempre aparecen páginas con información poco o nada adecuada a nuestra búsqueda. Con el XML las cosas cambian, porque permite definir el contenido de cada página de manera específica, sin desvirtuarlo. EL XML, mucho más sencillo que el SGML, nos ayuda a reorganizar el caos de las actuales incompatibilidades de las etiquetas de HTML entre navegadores, gracias al hecho de que el DTD (Document Type Definition), no está definido en XML, y así cada autor independiente puede definir su propio DTD. Pensad que el lenguaje HTML tiene predefinido su DTD y que no se puede modificar. El XML rompe este muro, ya que sólo dicta las pautas para definir un nuevo código, y será cada autor concreto el único responsable de su contenido y su estructuración. Esta libertad es precisamente la que proporciona la facilidad de transporte e intercambio de información, e interviene en otros factores como por ejemplo el formato de exportación o de impresión de un documento. Gracias al hecho de que nosotros podemos definir las propias etiquetas personalizadas, es posible asignar un sentido a la información que tiene que incorporarse a una sede web. Por ejemplo, si nos dedicamos a diseñar las etiquetas que tienen que formar parte de los contenidos de un servicio de noticias en línea, debemos procurar que nuestra información se presente de manera organizada y homogénea. Nosotros definiremos un DTD que especifique cómo querremos presentar la información para cada artículo o noticia. De este modo destinaremos una etiqueta al encabezamiento de la noticia, otra para el autor, otra para el grueso de la noticia, otra para la dirección de contacto, y así todas las que se nos ocurran, con lo que formaremos todo un árbol jerárquico de los diferentes elementos. A partir de aquí, con un editor XML transportaremos el cuerpo de las diferentes noticias, con etiquetas personalizadas, que facilitarán la tarea a otras personas que no conozcan nada del lenguaje XML, porque indicarán qué tienen que incluir y dónde de la manera simple que nosotros hayamos designado. Por ejemplo, en las etiquetas personalizadas <título noticia> XXX </título noticia>, <autor> XXX </autor>, <cuerpo texto> XXX </cuerpo texto>, se incluirá la información que corresponda, y como las etiquetas son personalizadas, la facilidad de uso es extraordinaria. | ||||||||||||
Ahora bien, nos preguntaremos rápidamente: ¿si definimos así los contenidos y les conferimos una estructura, cómo asignaremos el estilo? La solución la tiene el XSL (eXtensible Stylesheet Language). Es un lenguaje similar a los Style Sheets del HTML 4.0, de manera que una vez definido el estilo que queremos aportar, la tipografía, las alineaciones, y todo tipo de formato físico del documento, sólo hará falta especificar todo ello dentro del documento o referenciarlo de manera externa en un fichero, tal y como se hace con los CSS (Cascade Style Sheets). | |||||||||||||
![]() |
El XML tiene todas las características que hicieron del HTML un lenguaje ideal y otras innovadoras:
Hace falta diferenciar en XML los dos tipos de documentos que podemos tener; los bien formados y los válidos:
| ||||||||||||
![]() |
En lo que respecta a la sintaxis del documento hay que remarcar algunos detalles inportantes:
| ||||||||||||
Podemos decir efectivamente que XML es hoy por hoy la mejor opción para el intercambio de información, por su flexibilidad y compatibilidad entre diferentes sistemas gestores de datos. La compatibilidad es la palabra clave para hacer que este lenguaje se esté convirtiendo en la alternativa más potente para exportar, presentar e intercambiar datos. |
|||||||||||||
![]() |