Acentos y otros caracteres especiales

Algunos caracteres distintos de los habituales en los lenguajes anglosajones son considerados en el mundo de la informática como caracteres especiales. Dentro de estos se incluyen las letras acentuadas ni la letra eñe.

En los últimos años se ha avanzado mucho en conseguir que cualquier ordenador pueda leer todos los caracteres de todos los idiomas. En concreto es ya poco habitual que no se soporten los caracteres latinos. En cualquier caso es interesante saber que HTML ofrece mecanismos para insertar estos y otros caracteres especiales en aquellos sistemas donde no están soportados.

Una regla mnemotécnica para recordar qué caracteres son considerados especiales por HTML es la siguiente : » Si se puede escribir un carácter pulsando sobre una sola tecla del teclado o usando como ayuda las teclas MAYÚSCULAS o ALT-GR entonces ese carácter es válido». En el teclado español hay que hacer tres excepciones: la letra ‘ñ’ y los símbolos ‘¿’ y ‘¡’ que no son válidas.

El mecanismo ofrecido por HTML consiste en unos códigos especiales que todos los navegadores pueden entender. A estos códigos se les llama entidades de caracteres o con el nombre inglés: character entities. Todos estos códigos comienzan por el símbolo ‘&’ (ampersand) y terminan con el símbolo ‘;’ (punto y coma). Puede distinguirse entre dos tipos:

  • Entidades de caracteres con nombre: son aquellas en las que los símbolos ‘&’ y ‘;’ se pone el nombre (o abreviatura) asignado a ese carácter. Sólo existen para los caracteres especiales más usados. En la figura 3.12 se puede ver un ejemplo de este tipo de entidades en el que vemos la estructura general que todas tienen.

Figura 3.12. Una entidad de caracter con nombre tiene tres partes: ‘& ‘ + ‘nombre’ + ‘;’

Acentos y otros caracteres especiales

Entidades de caracteres numéricas: en este tipo de entidades entre ‘&’ y ‘;’ se escribe el número asignado a ese carácter en el estándar ISO-Latin-1 precedido de una almohadilla: ‘#’. Este tipo de entidades son menos usadas que las anteriores aunque tienen la ventaja de abarcar cualquier letra posible en cualquier idioma. En la figura 3.13 se muestra la estructura de este tipo de entidades usando de nuevo como ejemplo la letra A mayúscula y acentuada.

Figura 3.13. Una entidad de caracter numérica tiene cuatro partes: ‘ &’ + ‘#’ + ‘número’ + ‘;’

Acentos y otros caracteres especiales

Fuente: Copyright Jorge Ferrer, Rodrigo Garcia y Victor García, licencia Documentación Libre GNU, Versión 1.1