7.1 Lenguajes De Marcado
Un “Lenguaje de marcado” o “lenguaje de marcas” se
puede definir como una forma de codificar un documento donde, junto con el
texto, se incorporan etiquetas, marcas o anotaciones con información adicional relativa
a la estructura del texto, su presentación, etc.
Los
lenguajes de marcado suelen
confundirse con lenguajes de
programación. Sin embargo, no son lo mismo, ya que el lenguaje
de marcado no
tiene funciones aritméticas o variables,
como sí poseen los lenguajes de programación. Históricamente, el marcado se
usaba y se usa en la industria editorial y de la comunicación, así como entre autores, editores e impresores.
Para cada
lenguaje de marcado, los desarrolladores de software
pueden construir una aplicación para leer los documentos escritos en ese
lenguaje. Los navegadores de Web leerán los documentos HTML y Microsoft Office leerá los documentos de Office. Los
documentos escritos en XML pueden leerse por medio de
aplicaciones personalizadas utilizando diferentes objetos de análisis
gramatical o pueden combinarse con el lenguaje de estilo extensible (XLS-
Extensible Stylesheet Language) para poder mostrarse en un navegador.
7.1.1. SGML: Lenguaje De Marcado Base
SGML (Standard Generalized Mark-up Language), es
un lenguaje generalizado estándar para el formato de documentos. Es un estándar
internacional que permite definir lenguajes para dar formato a documentos. Por
ejemplo, el HTML, es un lenguaje de formato de documentos definido de acuerdo
con SGML, es decir, una aplicación de SGML para dar formato a documentos de
hipertexto.
SGML es
utilizado desde mitad de los 80 y ha permanecido bastante estable. Gran parte
de su estabilidad se la debe al hecho de que el lenguaje es a la vez flexible y
rico en posibilidades. Sin embargo, esta estabilidad tiene un inconveniente, el
nivel de complejidad que ha producido su uso en diversos ámbitos como la World
Wide Web.
SGML fue
diseñado para permitir el intercambio de información entre distintas
plataformas, soportes físicos, lógicos y diferentes sistemas de almacenamiento
y presentación, independientemente de su grado de complejidad.
SGML debe
utilizarse cuando existe alguna de las siguientes condiciones:
·
Cuando existe la necesidad de intercambiar
documentos entre diferentes sistemas de cómputo o de publicación.
·
Cuando los documentos tendrán una vida de uso
larga.
·
Cuando la estructura de un documento es
fundamental.
·
Cuando se utiliza una base de datos para el
almacenamiento y recuperación de elementos del documento.
En SGML,
las etiquetas se distinguen del resto del texto mediante caracteres de
delimitación. Estos delimitadores permiten que el software reconozca qué
caracteres deben ser leídos en modo de ETIQUETA, y deben por ello
traducirse al lenguaje concreto de composición o tratarse de manera específica,
y qué otros caracteres de CONTENIDO deberán ser transferidos
posteriormente a la aplicación para su procesamiento.
Delimitadores: Los caracteres
utilizados como delimitadores deben elegirse cuidadosamente, ya que no han de
aparecer con demasiada frecuencia como parte del contenido de un documento. El
ISO 8879 describe un conjunto de caracteres básicos entre los que se incluyen
el paréntesis angular de apertura y de cierre para destacar las etiquetas de
inicio (los caracteres < > con el nombre de un elemento en su
interior) y el signo & seguido por un nombre, y éste a su vez seguido de un
punto y coma para representar entidades tales como imágenes gráficas o
caracteres especiales.
7.1.2. HTML
HTML no es un lenguaje de programación. Es un
lenguaje que se utiliza para describir la disposición y el formato del
contenido, escrito como texto simple.
Una página
HTML es un archivo de texto básico que contiene etiquetas(a veces denominado marcador,
o tags en inglés) para formatos específicos de texto, imágenes, etc. La
utilización de estas etiquetas se llama lenguaje
de marcado.
Una
etiqueta es un elemento de texto (un nombre) flanqueado por el símbolo menor
que (<) y el símbolo mayor que (>). Por ejemplo, "<H1>".
Las
etiquetas HTML operan en parejas y afectan el elemento al que enmarcan. La
primera se llama etiqueta de apertura y la segunda, etiqueta de
cierre. La etiqueta de cierre comienza con una barra inversa ( / ): <etiqueta>
Su texto formateado; </etiqueta>
Por
ejemplo, las etiquetas <b> y </b> se usan para poner el texto entre
ellas en negrilla:
<b> Este texto está en negrilla </b>
Algunas
etiquetas HTML se utilizan solas: la etiqueta <br>, por ejemplo,
representa un salto de línea. Las etiquetas HTML pueden anidarse
jerárquicamente una dentro de otra para permitir que se apliquen múltiples
propiedades al mismo texto. Pero el estándar HTML no tolera las superposiciones
de etiquetas. Este es un ejemplo de texto formateado con etiquetas anidadas:
<i><u>Comment ça
Marche</u>, the free IT encyclopedia</i>
7.1.3. XML
XML es un
lenguaje de marcas que se ha estandarizado y se ha convertido en uno de los
formatos más populares para intercambiar información.
Se trata de
un formato de archivos de texto con marcado que deriva del original SGML, pero
que le ha superado añadiendo otro tipo de reglas y de forma de trabajar. La realidad es que XML siempre ha estado muy
ligado al éxito de HTML. Se planteó por
los problemas crecientes que se fueron observando en las páginas web.
HTML tiene
estos problemas como formato de intercambio de información: La mayoría de
etiquetas HTML no son semánticas; es decir, no sirven para decir el tipo de
contenido que tenemos sino para indicar el formato. Por ejemplo la etiqueta H1
sí es semántica ya que indica que el texto que contiene es un encabezado de
nivel principal. Mientras que la etiqueta HTML clásica font sirve para colorear
o cambiar el tipo de letra, sin indicar qué tipo de texto tenemos (se aplica a
cualquiera) HTML es un lenguaje rígido,
no es extensible. Es decir no podemos añadir etiquetas ya que ningún navegador
las reconocerá. Cada vez que se decide añadir hay que cambiar el estándar y los
navegadores se deben de adaptar a los cambios.
Requiere de arreglos “extraños” para añadir potencia y funcionalidad,
por lo que los diseñadores tienden a incrustar dentro del código HTML código de
lenguajes como PHP o Javascript que dificultan su legibilidad y comprensión.
Por ello al
crear XML se plantearon estos objetivos:
(1) Debía
de ser similar a HTML (de hecho se basa en el lenguaje SGML base para el
formato HTML)
(2) Debía
de ser extensible, es decir que sea posible añadir nuevas etiquetas sin
problemas. Esa es la base del lenguaje XML.
(3) Debía
de tener unas reglas concisas y fáciles, además de estrictas.
(4) Debía
de ser fácil de implantar en todo tipo de sistemas. XML nace con una vocación
multiplataforma, como base de intercambio de información entre sistemas de toda
índole.
(5) Debía
ser fácil de leer por los humanos y fácil crear procesadores XML software
(llamados parsers)
Video complementario
Conclusión:
En
conclusión se puede entender que este tipo de lenguajes solamente sirven para
darle forma a la manera en que se visualizara una página ayudando a crea su
estructura por medio de etiquetas.
Bibliografía
No hay comentarios:
Publicar un comentario