¿Qué esconde la web del Congreso?
Hace unos días, al intentar validar el HTML de la web del Congreso de España, me encontré con este error:
El error decía:
Sorry, I am unable to validate this document because on line 34 it contained one or more bytes that I cannot interpret as
utf-8
(in other words, the bytes found are not valid values in the specified Character Encoding). Please check both the content of the file and the character encoding indication.The error was: utf8 “\xF3” does not map to Unicode
¡Qué error más extraño, nunca había visto nada parecido!
Me pongo a analizar el tráfico HTTP y no consigo ver qué está pasando: hay una redirección, de http://www.congreso.es cambia a http://www.congreso.es/portal/page/portal/Congreso/Congreso, pero no aparece ninguna cabecera HTTP que haga la redirección. Además, en el validador del W3C la primera página es incapaz de validarla, la segunda sí que la valida, aunque tiene un montón de errores.
¿Qué está pasando?
Me hago un pequeño programa con la librería CURL para descubrir el misterio, lo primero que devuelve la web del Congreso es esto:
<!DOCTYPE html PUBLIC “-//W3C//DTD XHTML 1.0 Transitional//EN” “http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd”>
<html xmlns=”http://www.w3.org/1999/xhtml”>
<head>
<meta http-equiv=”content-type” content=”text/html; charset=UTF-8″>
<title>Congreso de los Diputados</title>
<link href=”css/congreso.css” rel=”stylesheet” type=”text/css”>
<!– link href=”css/portada.css” rel=”stylesheet” type=”text/css” –>
</head>
<body>
<script type=”text/javascript”>
window.location=”/portal/page/portal/Congreso/Congreso”
</script>
<noscript>
<div id=”CONGRESO”>
<div id=”CABECERA”>
<h1><a href=”/portal/page/portal/Congreso/Congreso”><img src=”img/logo.gif” alt=”Congreso de los Diputados” border=”0″></a></h1>
<div class=”separador”></div>
<div class=”fincabecera”> </div>
</div>
<div id=”noscript_portada”>
<p>Estamos trabajando en la accesibilidad del sitio Web del Congreso. Actualmente es necesario tener activado javascript para poder acceder a alguno de nuestros contenidos.</p>
<p>Disculpe las molestias. </p>
<p><a href=”/portal/page/portal/Congreso/Congreso”>Entrar en congreso.es </a></p>
</div>
<div id=”PIE”>
<div class=”infoPie”>
<div class=”direccion”>
<p class=”txt_direccion”> <span lang=”es”>Congreso de los Diputados</span><br/>
C/Floridablanca s/n – 28071 – MADRID<br/>
Copyright 2007. Todos los derechos reservados </p>
</div>
<div class=”telefono”>
<p class=”sin_ico”>Información general:</p>
<p class=”ico_tel”>Tel: 91 390 60 00</p>
<p class=”ico_fax”>Fax: 91 429 87 07</p>
</div>
<div class=”visitas”>
<p class=”sin_ico”>Visitas guiadas de grupos:</p>
<p class=”ico_tel”>Tel: 91 390 65 25 / 26</p>
<p class=”ico_fax”>Fax: 91 390 64 35</p>
</div>
</div>
</div>
</div>
</noscript>
</body>
</html>
¿Qué es esto? Es la siguiente página:
Esta página aparece sólo si tienes JavaScript desactivado, si lo tienes activado, entonces se ejecuta lo siguiente, que es lo que realiza la redirección:
<script type=”text/javascript”>
window.location=”/portal/page/portal/Congreso/Congreso”
</script>
¡Qué locura!
Y por cierto, la línea 34, la línea que el validador dice que tiene un carácter erróneo, es esta:
<p>Información general:</p>
¿Cuál es el problema? El problema es que en el “meta charset” pone UTF-8, ¡pero el fichero no está codificado en UTF-8!
Deja un comentario