Cambiar el juego de caracteres no es sólo cambiar la declaración

Muy buena la aclaración que aparece en Using character escapes in markup and CSS:

Changing to UTF-8 means re-saving your file. Using the character encoding UTF-8 for your page means that you can avoid the need for most escapes and just work with characters. Note, however, that to change the encoding of your document, it is not enough to just change the encoding declaration at the top of the page or on the server. You need to re-save your document in that encoding. For help understanding how to do that with your application read Setting encoding in web authoring applications.

Los caracteres que se tienen que escapar en HTML y CSS

El artículo Using character escapes in markup and CSS del W3C explica los caracteres que se deben escapar en las páginas web:

Syntax characters. There are three characters that should always appear in content as escapes, so that they do not interact with the syntax of the markup. These are part of the language for all documents based on HTML and for XML.

&lt; (<)

&gt; (>)

&amp; (&)

You may also want to represent the double-quote (“) as &quot; and the single quote (‘) as &apos;. This would certainly be the case in attribute text when you need to use the same type of quotes as those that surround the attribute value.

Juego de caracteres erróneo ¡en un mapa!

El juego de caracteres, la pesallida de los informáticos, me fascina. Claro, yo no nací sabiendo lo que era, pero una tarde, hace ya muchos años, después de haber sufrido esta pesadilla yo mismo tomé una decisión:

A Dios pongo por testigo… A Dios pongo por testigo de que no lograrán aplastarme. Viviré por encima de todo esto y cuando haya terminado nunca volveré a saber lo que es tener pesadillas por el juego de caracteres. No, ni yo ni ninguno de los míos, aunque tenga que estafar, que ser ladrona o asesina. A Dios pongo por testigo de que jamás volveré a tener pesadillas por el juego de caracteres.

Dicho y hecho, esa tarde me puse a buscar información sobre el juego de caracteres, me la estudié y… problema resuelto. Desde entonces me fascina descubrir que otros sigan sufriendo este problema.

Un amigo me ha mandado el plano de pistas de la estación de esquí de Sierra Nevada:

sierra-nevada-plano-01

El mapa pequeño de la esquina inferior derecha:

sierra-nevada-plano-02

Un detalle del mapa pequeño:

sierra-nevada-plano-03

“Piñata 1, Piñata 2, Panorámica 2, Peñones, La Peña”, todo mal escrito por culpa de un juego de caracteres erróneo.

Y así en miles de planos impresos que deben haber costado unos cuantos miles de euros.

Y bueno, del cotejamiento en la bases de datos, mejor ni preguntar.

En McDonald’s no conocen el juego de caracteres

Visto en los tickets de un McDonald’s, podemos ver que palabras como “Rapidos” o “Despues” las escriben sin tilde:

img_20161208_161928

Las escriben sin tilde porque seguramente les saldrían mal impresas. Eso lo podemos comprobar en otro ticket de la misma máquina, donde palabras como “más”, “Válido” o “sólo” aparecen escritas como “m?s”, “V?lido” o “s?lo”:

img_20161208_161959

McDonald’s es una gran multinacional que sufre la pesadilla de los informáticos.

El mejor artículo sobre caracteres, juegos de caracteres, codificaciones, emojis y todo lo demás

El juego de caracteres es la “peor de las pesadillas” de los informáticos. En cuanto te despistas, el juego de caracteres aparece y te fastidia todo tu sistema.

El artículo You, Me And The Emoji: Character Sets, Encoding And Emoji es de lo mejor que he leído para comprender perfectamente el juego de caracteres.

Es un tema muy largo, pero el tema es muy complejo y requiere una explicación tan larga.