| :: Tutorial: Introducción a XML |
Tabla de Contenidos
¿Qué es XML?
Historia
Diferencias con HTML
Estructura de un archivo XML
Reglas
Elementos ¿Que es XML?
En general se define a XML como una especificación o lenguaje modelador de datos que permite crear nuevas implementaciones y lenguajes de etiquetas a la vez que contiene y manipula grandes volúmenes de información.
XML suele ser definido como un metalenguaje, es decir, un dialecto raíz con un conjunto de reglas que permiten determinar una sintaxis utilizada determinada para que a su vez se puedan definir otros sublenguajes de etiquetas igualmente estructurados y dotados de las características iniciales.
De esta manera cada sublenguaje, basado en XML, define su propia gramática y su propio grupo de reglas, las cuales gobiernan la estructura de documentos escritos en ese nuevo lenguaje.
Es más, ya son muchos los vocabularios desarrollados en XML nacidos con el fin de ampliar sus propias posiblidades. Entre ellos podemos considerar fundamentales: XHTML, XSL-FO y XSLT, XLink, XPointer y Schema.
Siendo que cada lenguaje debe satisfacer estos requisitos gramaticales, XML proporciona facilidades para manejar correctamente la gramática específica de cualquier lenguaje derivado.
En general hoy en día XML está presente de alguna u otra forma en todas las plataformas tecnológicas como lenguaje común para el intercambio de información proveyéndolas de facilidades ampliamente reconocidas. Estas cualidades lo distinguen como un estándar global que crece día a día y actúa como nexo de dichas implementaciones.
En ese sentido es bueno destacar que cuando surgió XML se estableció un conjunto de objetivos a ser tenidos en cuenta a fin de apuntalar su crecimiento y expansión. Los mismo son:
- Que XML debe ser directamente utilizable sobre Internet.
- Que XML debería soportar una amplia variedad de aplicaciones.
- Que XML debía ser compatible con SGML.
- Debe ser fácil la escritura de programas que procesen documentos XML.
El número de características opcionales en XML debe ser absolutamente mínima, idealmente cero.
- Los documentos XML deben ser legibles por humanos y razonablemente claros.
- El diseño de XML debe ser preparado rápidamente.
- El diseño de XML debe ser formal y conciso.
- Los documentos XML deben ser fácilmente creables.
- La concisión en las marcas XML es de mínima importancia.
Historia
El ente regulador W3C (World Wide Web Consortium) creó oficialmente XML en febrero de 1998. Sin embargo la historia se remonta y relaciona con el desarrollo de SGML, nacido en 1986 como un estándar internacional que permite definir la estructura y el contenido de diferentes tipos de documentos electrónicos de diverso tipo e índole en múltiples ramas de la vida cotidiana.
XML nació con la intención de simplificar a SGML y gradualmente evolucionó como una versión más simplificada, optimizada y abreviada del mismo. Esto esta basado en el hecho de contar con una genuina flexibilidad como lenguaje modelador de datos potenciada aún más con el auge de Internet.
Pero es bueno aclarar que además de simplificar los niveles de opcionalidad de SGML, XML toma las principales virtudes en la estructura de SGML creando nuevos sublenguajes mucho más cercanos al desarrollador web. De esta forma logra que diferentes comunidades configuren sus propios lenguajes de etiquetas para intercambiar información en su disciplina.
Diferencias con HTML
Debemos recordar siempre que mientras HTML se centra en la forma en que vamos a mostrar una información, es decir, específicamente en el formateo o la presentación, XML hace mucho más hincapié en la estructura misma de ese dato, es decir, en la información en si misma.
Podemos decir entonces que XML fue diseñado para describir diferentes niveles de estructuras de datos y se concentra en que tipos de datos manejan esos “árboles” o nodos de información. HTML fue diseñado para mostrar adecuadamente esa estructura de información, y se concentra más bien en la forma en la que la información se va a visualizar.
Además, XML permite ordenar los datos de una manera lógica, cualidad a la que HTML nunca podría llegar al estar mucho mas embebido y bloqueado por etiquetas y estilos específicos.
Por ultimo y como nexo incontrastable entre ambas tecnologías no podemos dejar de nombrar a XHML, una nueva definición de HTML 4.0 pero basada en XML 1.0.
Esta reformulación esta llamada a ser el reemplazo natural de HTML es mas poderosa , estricta y menos permisiva que HTML puesto que conlleva en su estructura toda la rigidez y el orden de XML.
Estructura de un archivo XML
Un documento XML consiste básicamente en un conjunto de entidades, generalmente conformadas por textos y etiquetas. Un archivo XML incluye declaraciones, comentarios, referencias a caracteres e instrucciones de procesos que lo auto definen, por lo cual suele ser usualmente referenciado como un lenguaje de características auto descriptivas.
Por ello veremos siempre que un xml contiene un área de prologo o descripción del documento y el cuerpo con etiquetas que definen el contenido de los elementos.
A continuación analizaremos un pequeño ejemplo de un archivo xml pero sin esa área o cabecera descriptiva. Iniciamos el documento con una etiqueta que representa la cabecera obligatoria que determina que es una archivo xml asi como el numero de versión que usaremos:
| Código: |
| < ?xml version="1.0"?> |
No confundamos esta con la cabecera descriptiva de elementos de la que hablamos antes. A continuación iremos viendo las distintas etiquetas que conforman el cuerpo del archivo, el cual puede ser visto como un árbol que se ramifica en incontables ramas o nodos anidados, unos dentro de otros.
| Código: |
<libreria >
<libro id=”1”>
<titulo >The Da Vinci Code</titulo>
<autor >Brown, Dan</autor>
</libro>
< libro id=”2”>
<titulo>State of Fear</titulo>
<autor>Crichton, Michael</autor>
</libro >
</libreria> |
Como ven (y de ahí el nombre de lenguaje Extendido) no estamos sujetos como en HTML a un conjunto limitado de etiquetas sino que podemos crear nuestros propios sublenguajes.
Desglosemos el archivo con más detalle aprendiendo nuevos conceptos:
<libreria> es el elemento base y por ello es llamado el elemento raíz o root
Los nodos internos son elementos. En nuestro caso podríamos citar a <libro >
Las propiedades de esos nodos o elementos son llamadas atributos. En este caso seria la propiedad id dentro de <libro id=”n”>
Otro aspecto a destacar esta relacionado al orden de los hijos de un nodo. Esto es muy importante y debe ser conservado tal como se ve en el ejemplo anterior.
Reglas
Es muy importante poder seguir correctamente la serie de reglas gramaticales propias de XML. Normalmente decimos que un documento esta considerado “bien formado” si se atiene en forma positiva a dichas reglas. Podemos repasar brevemente algunas de ellas a fin de poder determinar en un futuro este tipo de evaluación:
• Todos los elementos que contengan datos (de tipo carácter) deben tener etiquetas de principio y fin (salvo en elementos vacíos no se permite su omisión);
• Todos los valores de los atributos deben ir entre comillas. Más adelante veremos diferentes posibilidades de plantear este item.
• Los elementos “vacios” (por ejemplo los que no tienen etiqueta final como <IMG>, <HR>, y <BR>) deben terminar con '/>'. También podemos hacerlos “no vacios“ añadiéndoles una etiqueta de fin.
• No deben quedar etiquetas aisladas (< ó &) en el texto.
• Los elementos deben anidar dentro de sí sus propiedades.
Elementos
Es interesante que podamos analizar un poco más sobre los elementos que componen un documento xml. Por ejemplo, es bueno destacar que un elemento puede tener un buen número de atributos:
| Código: |
| < libro id=”2” isbn=”xxxx” tapa=”azul” paginas=”180” > |
Los atributos deberán estar separados por espacios y seguir el nombre del elemento pero en cualquier orden y se podrán usar comillas simples o dobles.
En ese sentido anteriormente hablamos del encomillado obligatorio en los atributos. Bien, podemos comentar además que si el atributo contiene comillas es destacable resaltar la posibilidad de poder incluirlas dentro de la misma descripción encerrándolas con el tipo de comilla opuesto.
Vale decir, por ejemplo:
| Código: |
| < libro id=”2” isbn=”indice=’xxxx’” > |
O bien
| Código: |
| < libro id=’2’ isbn=’indice=”xxxx”’ > |
E incluso también podemos hacer uso de entidades para representar ciertos caracteres. Por ejemplo:
| Código: |
| < ejemplo texto='mensaje="hola"'/> |
Por otro lado un elemento solo puede contener una sola ocurrencia de cada atributo. De todos modos tenemos otras posibilidades de agrupación que pueden salvar el problema. Con ello nunca podríamos hacer algo así:
| Código: |
| < equipo jugador=”Ojeda” jugador=”Sorin” jugador=”Heinze” > |
Pero si estaríamos habilitados para:
a) Usar un atributo que incluya todos los valores:
| Código: |
| < equipo jugadores=”Ojeda Soria Heinze” > |
b) Usar múltiples atributos:
| Código: |
| < equipo jugador1=”Ojeda” jugador2=”Sorin” jugador3=”Heinze” > |
c) O quizás la forma más usual, enfocar dichos datos como elementos:
| Código: |
<equipo>
<jugador>Ojeda</jugador>
<jugador>Sorin</jugador>
<jugador>Heinze</jugador>
<equipo> |
Como vemos si bien XML es mucho más estricto que HTML ofrece también diversas posibilidades y resoluciones sujetándonos siempre dentro de su conjunto de reglas. En nuestro próximo seminario exploraremos más en profundidad acerca de las infinitas posibilidades que nos brinda este abarcativo metalenguaje.
Fuente: seminarios.dattatec.com
|
|
|
|
| |
Agregar a favoritos
Versión Imprimible Enviar a un Amigo
Compartir:

Zips Populares - Reglas para el talento - Creación e inserción de un botón Flash - Logran registrar cómo el cerebro almacena nuevos recuerdos - Windows Vista: el uso del puntero - Exceso relacionado con el cáncer - Identifican gen implicado en el origen del Autismo - Descubren interruptor químico para los ritmos circadianos
|