HTML5: ¿qué es mejor, usar una entidad de personaje vs usar un personaje directamente?

Recientemente he notado una gran cantidad de sitios de alto perfil que usan caracteres directamente en su fuente, por ejemplo:

“Hi there” 

Más bien que:

 “Hi there” 

¿Cuál de estos es el preferido? Siempre he usado entidades en el pasado, pero el uso del personaje directamente parece más legible y parece estar bien en un documento Unicode.

Si la encoding es UTF-8, los caracteres normales funcionarán bien, y no hay razón para no usarlos. Los navegadores que no son compatibles con UTF-8 tendrán muchos otros problemas al mostrar una página web moderna, así que no se preocupe.

Por lo tanto, es más fácil y más legible usar los personajes y yo preferiría hacerlo.

También ahorra un par de bytes, lo que es bueno, aunque hay mucho más que ganar al usar compresión y minificación.

La principal ventaja que puedo ver con la encoding de caracteres es que se verán bien, incluso si la página se interpreta como ASCII.

Por ejemplo, si su página es solo un archivo HTML sin formato, la configuración predeterminada en algunos servidores sería servirlo como text/html; charset=ISO-8859-1 text/html; charset=ISO-8859-1 (el predeterminado en HTTP 1.1 ). Incluso si establece la metaetiqueta para el tipo de contenido, el encabezado HTTP tiene una prioridad más alta.

Si esto es importante depende de la probabilidad de que un servidor mal configurado sirva la página.

Usando caracteres directamente. Son más fáciles de leer en la fuente (¡lo cual es importante ya que la gente tiene que editarlos!) Y requieren menos ancho de banda.

El ejemplo dado es definitivamente incorrecto, tanto en teoría como en la práctica, en HTML5 y en HTML 4. Por ejemplo, las discusiones HTML5 de marcado q dicen: “Puntuación de puntuación (como comillas) que está citando el contenido del elemento no debe aparecer inmediatamente antes, después o dentro de q elementos; el agente de usuario los insertará en la representación “.

Es decir, use el marcado’q ‘o los signos de puntuación, no ambos. Este último es mejor en todas las cuentas prácticas.

En cuanto al tema de las referencias de caracteres frente a entidades, las primeras son preferibles para la legibilidad, pero luego debe saber cómo guardar los datos como UTF-8 y declarar la encoding correctamente. No es ciencia espacial, y generalmente es mejor. Pero si su entorno de autor es UTF-8 hostil, no debe avergonzarse de utilizar referencias de entidades.