Producción de páginas web con lenguaje de programación HTML

Desde un principio las grandes empresas involucradas en el desarrollo de aplicaciones basadas en el intercambio de datos por red buscaban un sistema de organización estructurada de documentos. IBM creó GML (Lenguaje de Marcado Generalizado) para las necesidades de sus sistemas internos de edición, aunque no pasó de ser un lenguaje de uso interno.

La primera tecnología de información estandarizada y estructurada fue SGML (Lenguaje de Marcado Generalizado Estándar). SGML, que también fue creado por IBM, comenzó a ser utilizado por un amplio número de sectores como estándar de información de propósito general. En 1986 SGML surge como estándar ISO, pero debido a su elevada complejidad y coste no pasó a convertirse en un estándar de hecho.

En 1989, Tim Berners – Lee y Anders Berglund, dos investigadores del Laboratorio Europea de Física de Partículas (CERN), crearon un lenguaje basado en etiquetas e hipertexto para marcar documentos técnicos con el fin de compartirlos en Internet. Así surgió una aplicación simplificada del SGML llamado HTML (Lenguaje de Marcas de Hipertexto), que se convirtió en el primer formato de información estándar en la Web.

En sus diferentes versiones, el lenguaje HTML ha ido sufriendo modificaciones que han ido adaptándolo a las necesidades y características de la INTERNET de cada momento. De esta forma, etiquetas que inicialmente se implementaron se han ido suprimiendo luego, mientras que han ido introduciéndose etiquetas nuevas en cada versión.

Y no sólo eso, si no que cada empresa fabricante de navegadores ha ido implementando etiquetas y extensiones propias al lenguaje, de tal forma que llegó un momento en el que reinó un caos casi total, resultando muy difícil la creación de páginas Web que se visualizaran igual en los diferentes navegadores.

Para poner un poco de orden en esta situación, diversas empresas del sector (Nestcape, Microsoft, etc.) y diferentes organismos interesados crearon en 1996 y a instancias de Tim Berners-Lee, el World Wide Web Consortium, más conocido como W3C, que ha tomado bajo su responsabilidad la evolución de los protocolos y estándares asociados con la Web.

Al Consorcio de la WWW les pertenecen un gran número de empresas y organizaciones relacionadas con la Web, incluyendo AT&T, Adobe Systems, Inc.,Microsoft Corporation y Sun Microsystems, Inc. Su propósito es promover el crecimiento de la Web desarrollando especificaciones y software de referencia.

El Consorcio es administrado por el MIT y el INRIA, en colaboración con el CERN, siendo su tarea principal la de recomendar a las empresas y desarrolladores interesados en la Web una serie de pautas sobre cómo deben implementarse los diferentes lenguajes (HTML, CSS, XML, etc.) y tecnologías implicados.

En cada versión del lenguaje HTML las empresas van siguiendo cada vez más las recomendaciones del consorcio, de tal forma que los navegadores Web de última generación (Internet Explorer 7.0 y Netscape Browser 8.1.2) poseen una mecánica de interpretación de código muy parecida, por lo que se espera que en futuras versiones se pudiera escribir un mismo código compatible con ambos. En caso contrario el desarrollo del lenguaje XML sería la solución ideal para dejar atrás el lenguaje HTML, apostando por un lenguaje más completo, extensible y compatible, elaborado desde cero en busca de la compatibilidad y la estandarización.

A la hora de diseñar y construir las páginas Web, una de las principales tareas de todo diseñador va a ser escribir un código HTML compatible con Internet Explorer y con Nestcape Navigator, ya que ambos navegadores renderizan las etiquetas de forma diferente en muchos casos, y en otros poseen etiquetas propias, que no son soportadas por el otro. Como norma general, hay que construir páginas que se visualicen de forma análoga en ambos navegadores, y si la analogía no puede ser perfecta, por lo menos que se visualicen de forma correcta en ambos.

Al margen de estas consideraciones, como lenguaje de marcas que es, el lenguaje HTML se basa en la introducción en el texto del documento de una serie de etiquetas especiales, que generalmente van en pareja de apertura-cierre, que van a definir el aspecto con que se presentarán los textos, imágenes u otros elementos incluidos entre ambas. Es decir, mediante HTML se estructuran los documentos de una forma lógica para su presentación en los navegadores cliente.

Su sintaxis general es del tipo:

< etiqueta >contenido entre etiquetas< /etiqueta >

Donde podemos apreciar cómo las etiquetas se delimitan mediante los símbolos <>, y cómo la etiqueta de cierre lleva al principio el símbolo /.

Ejemplo:

< b >Este texto va en negrita< /b >

Además, cada etiqueta puede poseer una serie de atributos que modifiquen o amplíen su funcionalidad, atributos que pueden ser obligatorios u opcionales. La sintaxis general de una etiqueta con atributos es:

< etiqueta atributo1=”valor” atributo2=”valor” > Contenido entre etiquetas < /etiqueta >

Donde puede haber tantos atributos como sea necesario, ejemplo:

< h2 align=”center”>Cabecero

No es necesario, pero si conveniente encerrar los valores de los atributos entre comillas dobles.

Aunque la mayoría de las etiquetas llevan pareja de cierre, existen algunas que no siguen esta norma, generalmente etiquetas útiles para definir elementos vacíos, sin contenido interno. Este es el caso de la etiqueta usada para incluir una imagen o de la etiqueta definitoria de un salto de línea:

Hola< br >amigo

En cuanto a usar mayúsculas o minúsculas en la definición de etiquetas y atributos, HTML no distingue entre unas y otras, por lo que podemos usar el sistema que más nos guste. Eso si, o ponemos todas las etiquetas en mayúsculas, o las ponemos todas en minúsculas, per o nunca mezcladas. Lo mismo podemos decir respecto a los atributos, aunque generalmente los valores de estos de escriben en minúsculas (salvo los códigos de colores en hexadecimal, que se suelen poner en mayúsculas).

Fuente: Apuntes Desarrollo de Páginas Web de la U de Londres