lunes, 11 de noviembre de 2013

U7 Lenguajes De Marcado

7.1 Lenguajes De Marcado

                Un “Lenguaje de marcado” o “lenguaje de marcas” se puede definir como una forma de codificar un documento donde, junto con el texto, se incorporan etiquetas, marcas o anotaciones con información adicional relativa a la estructura del texto, su presentación, etc.

Los lenguajes de marcado suelen confundirse con lenguajes de programación. Sin embargo, no son lo mismo, ya que el lenguaje de marcado no tiene funciones aritméticas o variables, como sí poseen los lenguajes de programación. Históricamente, el marcado se usaba y se usa en la industria editorial y de la comunicación, así como entre autores, editores e impresores.

Para cada lenguaje de marcado, los desarrolladores de software pueden construir una aplicación para leer los documentos escritos en ese lenguaje. Los navegadores de Web leerán los documentos HTML y Microsoft Office leerá los documentos de Office. Los documentos escritos en XML pueden leerse por medio de aplicaciones personalizadas utilizando diferentes objetos de análisis gramatical o pueden combinarse con el lenguaje de estilo extensible (XLS- Extensible Stylesheet Language) para poder mostrarse en un navegador.

7.1.1. SGML: Lenguaje De Marcado Base

                SGML (Standard Generalized Mark-up Language), es un lenguaje generalizado estándar para el formato de documentos. Es un estándar internacional que permite definir lenguajes para dar formato a documentos. Por ejemplo, el HTML, es un lenguaje de formato de documentos definido de acuerdo con SGML, es decir, una aplicación de SGML para dar formato a documentos de hipertexto.

SGML es utilizado desde mitad de los 80 y ha permanecido bastante estable. Gran parte de su estabilidad se la debe al hecho de que el lenguaje es a la vez flexible y rico en posibilidades. Sin embargo, esta estabilidad tiene un inconveniente, el nivel de complejidad que ha producido su uso en diversos ámbitos como la World Wide Web.

SGML fue diseñado para permitir el intercambio de información entre distintas plataformas, soportes físicos, lógicos y diferentes sistemas de almacenamiento y presentación, independientemente de su grado de complejidad.

SGML debe utilizarse cuando existe alguna de las siguientes condiciones:

·         Cuando existe la necesidad de intercambiar documentos entre diferentes sistemas de cómputo o de publicación.
·         Cuando los documentos tendrán una vida de uso larga.
·         Cuando la estructura de un documento es fundamental.
·         Cuando se utiliza una base de datos para el almacenamiento y recuperación de elementos del documento.

En SGML, las etiquetas se distinguen del resto del texto mediante caracteres de delimitación. Estos delimitadores permiten que el software reconozca qué caracteres deben ser leídos en modo de ETIQUETA, y deben por ello traducirse al lenguaje concreto de composición o tratarse de manera específica, y qué otros caracteres de CONTENIDO deberán ser transferidos posteriormente a la aplicación para su procesamiento.

Delimitadores: Los caracteres utilizados como delimitadores deben elegirse cuidadosamente, ya que no han de aparecer con demasiada frecuencia como parte del contenido de un documento. El ISO 8879 describe un conjunto de caracteres básicos entre los que se incluyen el paréntesis angular de apertura y de cierre para destacar las etiquetas de inicio (los caracteres < > con el nombre de un elemento en su interior) y el signo & seguido por un nombre, y éste a su vez seguido de un punto y coma para representar entidades tales como imágenes gráficas o caracteres especiales.

7.1.2. HTML

                HTML no es un lenguaje de programación. Es un lenguaje que se utiliza para describir la disposición y el formato del contenido, escrito como texto simple.

Una página HTML es un archivo de texto básico que contiene etiquetas(a veces denominado marcador, o tags en inglés) para formatos específicos de texto, imágenes, etc. La utilización de estas etiquetas se llama lenguaje de marcado.

Una etiqueta es un elemento de texto (un nombre) flanqueado por el símbolo menor que (<) y el símbolo mayor que (>). Por ejemplo, "<H1>".

Las etiquetas HTML operan en parejas y afectan el elemento al que enmarcan. La primera se llama etiqueta de apertura y la segunda, etiqueta de cierre. La etiqueta de cierre comienza con una barra inversa ( / ): <etiqueta> Su texto formateado; </etiqueta>

Por ejemplo, las etiquetas <b> y </b> se usan para poner el texto entre ellas en negrilla:

<b> Este texto está en negrilla </b>

Algunas etiquetas HTML se utilizan solas: la etiqueta <br>, por ejemplo, representa un salto de línea. Las etiquetas HTML pueden anidarse jerárquicamente una dentro de otra para permitir que se apliquen múltiples propiedades al mismo texto. Pero el estándar HTML no tolera las superposiciones de etiquetas. Este es un ejemplo de texto formateado con etiquetas anidadas:

<i><u>Comment ça Marche</u>, the free IT encyclopedia</i>

7.1.3. XML

XML es un lenguaje de marcas que se ha estandarizado y se ha convertido en uno de los formatos más populares para intercambiar información.
Se trata de un formato de archivos de texto con marcado que deriva del original SGML, pero que le ha superado añadiendo otro tipo de reglas y de forma de trabajar.  La realidad es que XML siempre ha estado muy ligado al éxito de HTML. Se planteó  por los problemas crecientes que se fueron observando en las páginas web.

HTML tiene estos problemas como formato de intercambio de información: La mayoría de etiquetas HTML no son semánticas; es decir, no sirven para decir el tipo de contenido que tenemos sino para indicar el formato. Por ejemplo la etiqueta H1 sí es semántica ya que indica que el texto que contiene es un encabezado de nivel principal. Mientras que la etiqueta HTML clásica font sirve para colorear o cambiar el tipo de letra, sin indicar qué tipo de texto tenemos (se aplica a cualquiera)  HTML es un lenguaje rígido, no es extensible. Es decir no podemos añadir etiquetas ya que ningún navegador las reconocerá. Cada vez que se decide añadir hay que cambiar el estándar y los navegadores se deben de adaptar a los cambios.  Requiere de arreglos “extraños” para añadir potencia y funcionalidad, por lo que los diseñadores tienden a incrustar dentro del código HTML código de lenguajes como PHP o Javascript que dificultan su legibilidad y comprensión.

Por ello al crear XML se plantearon estos objetivos:

(1) Debía de ser similar a HTML (de hecho se basa en el lenguaje SGML base para el formato HTML)
(2) Debía de ser extensible, es decir que sea posible añadir nuevas etiquetas sin problemas. Esa es la base del lenguaje XML.
(3) Debía de tener unas reglas concisas y fáciles, además de estrictas.
(4) Debía de ser fácil de implantar en todo tipo de sistemas. XML nace con una vocación multiplataforma, como base de intercambio de información entre sistemas de toda índole.
(5) Debía ser fácil de leer por los humanos y fácil crear procesadores XML software (llamados parsers)

Video complementario



Conclusión:

                En conclusión se puede entender que este tipo de lenguajes solamente sirven para darle forma a la manera en que se visualizara una página ayudando a crea su estructura por medio de etiquetas.

Bibliografía

                

No hay comentarios:

Publicar un comentario