¿Deberían todos los caracteres acentuados usar entidades html?

Estoy trabajando con una gran cantidad de archivos HTML que en su mayoría están codificados como utf-8. Hay personajes acentuados en abundancia, muchos están en francés. Los he ido convirtiendo en entidades HTML a medida que avanzo, pero noté que incluso en IE5.5 (según el comprobador de IE), los caracteres acentuados no convertidos se muestran correctamente.

¿Debería preocuparme por la visualización de caracteres y convertirlos a entidades HTML para estar seguros?

Si los archivos están codificados en UTF-8, debe configurar el encabezado Content-Type para que sea text/html; charset=UTF-8 text/html; charset=UTF-8 y tiene una metaetiqueta equivalente en la página:

  

Esto proporciona al navegador toda la información para mostrar correctamente los caracteres UTF-8. No hay necesidad de codificar caracteres acentuados.

Normalmente no hay razón para usar entidades para caracteres como letras acentuadas. Usarlos es válido, pero tiende a ofuscar el código fuente y, por lo tanto, puede causar errores.

Sin embargo, en algunos casos las entidades son necesarias. Las razones no están relacionadas con los navegadores sino con el lado de la creación. En particular, si necesita editar los archivos usando un editor o un progtwig de autoría que no maneja bien las letras acentuadas, puede encontrar entidades útiles. Lo mismo se aplica si los datos tienen que pasar por algún software que tenga problemas similares. Y en algunos casos, debe trabajar en un entorno donde no tenga control sobre los encabezados HTTP y los encabezados especifiquen una encoding que no le permita ingresar todos los caracteres directamente.

Lo que debe recordar es que el francés es parte de la familia UTF-8 junto con el portugués, el español, etc., por lo que se mostrarán correctamente con una etiqueta UTF-8 en su lugar y siempre que el navegador también use UTF-8 para la página .

El problema es cuando una persona que usa un navegador que está forzando otro juego de caracteres llega a la página, esto romperá los caracteres no codificados. Esto sucede un poco aquí en Brasil, donde muchos buscadores no están configurados para la detección automática del juego de caracteres y están configurados en ISO-8859-1, que es común aquí.

De ser posible, codifique todos sus caracteres “especiales” para obtener el acceso más universal posible.

¡Espero que eso ayude!

Intereting Posts