Producción de texto digital – Conceptos previos – Formatos
 
 

En la mayoría de nuestros proyectos nos veremos obligados a utilizar textos, creados con programas y ordenadores diferentes a veces incluso para soportes diferentes. Por esta razón es importante conocer los principales formatos de archivo que se utilizan en la industria:

TXT: Los documentos de texto puro reciben esta sigla junto a su nombre. Tienen la ventaja de que se pueden intercambiar fácilmente, aunque no incluyen ningún tipo de información sobre la presentación de su contenido. Los documentos TXT pueden crearse y leerse con el Bloc de notas del propio sistema operativo o con cualquier procesador de texto.

Los siguientes formatos se basan en archivos de texto ASCII, de manera que el contenido va acompañado de marcas que refieren aspectos de presentación como el estilo del texto, la alineación, el color del fondo, el tamaño de letra… o incluso del propio contenido.

RTF: El Rich Text Format (Formato de texto rico) es un formato de marcado de textos pensado esencialmente para la edición en soporte papel. Definido por Microsoft, tiene la ventaja de que permite el intercambio de archivos de texto entre diferentes procesadores de texto (la mayoría lo soportan) y entre diferentes sistemas operativos.

HTML: El HyperText Markup Language es el lenguaje de la web; se basa en una serie de marcas que definen la apariencia de los distintos elementos que componen un documento. Fue diseñado para la publicación on-line y para poder visualizarlo se necesita un navegador. La ventaja de trabajar en este formato es que los textos son directamente publicables en Internet.

XML: El Extensible Markup Language es un lenguaje de marcas, cuya particularidad es que se centra en la estructuración y descripción del contenido, con independencia de sus características de presentación. Esta característica lo ha convertido en una tecnología clave en la edición digital, ya que da muchas posibilidades al archivo, clasificación y reutilización de contenidos.

Los formatos que siguen, fueron ideados para la edición de documentos impresos:

DOC: Permite el uso de estilos tipográficos, insertar imágenes, tablas, anotaciones, etc. Los documentos se crean y se visualizan con Microsoft Word, una herramienta que dispone de unas opciones muy potentes, por ello se ha convertido en el formato más popular para la edición de documentos de texto.

QXD: El formato QXD suele aparecer en los proyectos de edición digital cuando se trata de reutilizar contenidos que fueron inicialmente preparados para su impresión en papel. El software que se utiliza para crearlos y editarlos es el QuarkXPress, una de las principales herramientas profesionales para la maquetación de documentos impresos.

Si bien los formatos DOC o QXD permiten presentar textos con gran riqueza visual, tienen el inconveniente de que dependen de ciertos recursos externos . Podemos prever que nuestro texto se presente en una elegante tipografía Garamond y, sin embargo, si el destinatario del documento no dispone de esta fuente instalada en su ordenador no podrá visualizar el texto tal como fue concebido. Debido a esta limitación, nacieron otros formatos de documento muy aptos para la publicación, puesto que garantizan una presentación fiel al original:

PDF: Portable Document Format. Es un formato desarrollado por Adobe para el intercambio de documentos electrónicos. Además de garantizar las características de presentación del texto original, dispone de otras ventajas como hipertexto, búsquedas y una impresión de calidad. Es un formato perfecto para la publicación pero muy poco útil para la edición.

Con frecuencia nos encontraremos ante la imposibilidad de disponer de los contenidos en un formato útil para la edición, por lo que deberemos investigar las opciones de convertir los documentos mediante procesos informáticos. En ocasiones puede resultar más conveniente copiar de nuevo el texto que asumir el trabajo de la conversión de archivos.

Otras veces nos veremos obligados a recurrir a los originales en papel, en estos casos existe la posibilidad de escanear hoja por hoja los documentos y procesar las imágenes utilizando un software de reconocimiento de texto (Optical Character Recognition – OCR). Sin embargo, a menos que se trate de textos muy simples y esquemáticos (por ejemplo un listado de teléfonos) los resultados no acostumbran a ser útiles, por lo que resulta más efectivo teclear de nuevo los textos.


¿Qué formato escoger?

Cuando tengamos que escoger un formato para el contenido textual de nuestro producto, deberemos considerar los siguientes aspectos:

  • Versatilidad del formato (¿desde este formato se podrá adaptar fácilmente a otros formatos?).

  • Posibilidades de presentación del contenido.

  • Facilidad de actualización.

  • Nivel de seguridad.

  • Grado de estructuración del contenido (contenido tipo fichas vs. contenido artículos).


 
    Inicio