R y R-Commander

Aunque generalmente utilizaremos el SPSS, también se irán introduciendo algunos procedimientos estadísticos con el software R.

R es un lenguaje de programación y un entorno para análisis estadístico y la realización de gráficos. Debido a su naturaleza es fácilmente adaptable a una gran variedad de tareas. Fue inicialmente escrito por Robert Gentleman y Ross Ihaka del Departamento de Estadística de la Universidad de Auckland en Nueva Zelanda. R actualmente es el resultado de un esfuerzo de colaboración de personas del todo el mundo. Desde mediados de 1997 se formó lo que se conoce como núcleo de desarrollo de R, que actualmente es el que tiene la posibilidad de modificación directa del código fuente.  R abarca una amplia gama de técnicas estadísticas que van desde los modelos lineales a las más modernas técnicas de clasificación pasando por los test clásicos. El código de R está disponible como software libre bajo las condiciones de la licencia GNU-GPL. Además está disponible precompilado para una multitud de plataformas. La página principal del proyecto es http://www.r-project.org.

El  software  libre  R  con  el  entorno  gráfico  R-Commander  (Rcmdr)   se  puede  obtener  en  la  siguiente  dirección  (para  windows): http://cran.es.r-project.org/bin/windows/base/release.htm

Luego  se  procede  con  la  ejecución,  siguiendo  las  instrucciones.  Para  la  instalación  de  Rcmdr,  se  arranca  R  desde  Inicio → Todos  los  programas → R.  A  continuación,  Paquetes → Instalar  Paquete(s)  y  elegido  el  mirror  desde  el  cual  se  quiere  instalar  el  paquete,  por  ejemplo  Spain  (Madrid),  se  selecciona  Rcmdr.

Harán  falta  más  paquetes  para  la  instalación  completa  de  Rcmdr,  pero  se  instalarán  automáticamente  la  primera  vez  que  se  ejecute.

Si  se  cierra  Rcmdr  (sin  cerrar  R),  para  volver  a  cargarlo  se  debe  ejecutar  la  instrucción  Commander().

Instrucciones más detalladas y actualizadas pueden encontrarse en http://knuth.uca.es/R en la sección R Wiki. Además, existen multitud de documentos que ilustran sobre el manejo de R. En particular, el siguiente libro, accesible on-line explica como utilizar R y R-Commander en Estadística básica y la forma de instalarlo tanto sobre Windows como sobre GNU/LINUX: http://knuth.uca.es/moodle/course/view.php?id=37

PSPP una alternativa libre al SPSS

PSPP es un una aplicación de software libre para el análisis de datos. Se presenta en modo gráfico y está escrita en el lenguaje de programación C.  Su apariencia es similar al software propietario SPSS, de hecho pretende ser su sustitución en versión libre, aunque por el momento dispone de menos funcionalidades que el SPSS. Con PSPP se pueden tratar ficheros de datos creados con SPSS sin ningún problema.

En el siguiente enlace podéis acceder a la web del producto: http://www.gnu.org/software/pspp/ y descargarlo.

¿Qué es un audímetro? ¿Has visto alguna vez uno?

Si quieres saber algo más sobre los sistemas de medición de audiencias en televisión y esos aparatitos que se llaman audímetros que explicamos en clase puedes ver el siguiente  reportaje: como verás alrededor de 4.500 familias (4.625 hogares, a día de hoy, según la información disponible en la página web de Kantar Media) en España deciden lo que vemos todos por la tele. Y nadie sabe quiénes son.

La llegada de la tecnología digital supuso un serio problema para los audímetros tradicionales. Se ponía en cuestión su principal capacidad: el reconocimiento preciso de la cadena sintonizada. Tal reconocimiento se hacía a través de la detección de la frecuencia de sintonía o del canal radioeléctrico. La correspondencia entre canal radioléctrico y cadena era biunívoca para un dispositivo determinado, con lo que la base para la determinación de la cadena estaba establecida. El problema es que en un entorno digital, dentro de un mismo canal radioeléctrico se concentran las señales de un número diverso de cadenas diferentes. Una de las soluciones para este problema ha sido utilizar un enfoque basado en el  reconocimiento de la señal de vídeo. Es la línea que sigue, entre otros, el Picture Matching System que actualmente utiliza Sofres AM (actualmente Kantar Media) para la identificación de las cadenas emitidas por las plataformas digitales en España.

El audímetro Picture Matching basa su funcionamiento en el contenido de la emisión en sí, más concretamente en la señal de vídeo, es decir, en la imagen que se está viendo en el televisor sondado. La filosofía general consiste en el almacenamiento de muestras de la señal de vídeo en los televisores de los hogares que, tras su comparación (matching) con las muestras tomadas para cada una de las cadenas, permitirá determinar cual es la cadena vista en un televisor en cada momento.

Lo que realmente recoge el audímetro no son muestras de la imagen, sino el resultado de múltiples comparaciones de luminosidad entre pares de parcelas o celdas de la pantalla. Para el Picture Matching, la imagen se reduce a la luminosidad media de 32 pequeñas celdas que se encuentran fijadas de forma pseudo-aleatoria en la pantalla.

Estas 32 celdas están organizadas en 16 parejas, de cada una de las cuales se pueden obtener dos posibles resultados dependiendo de cual de las dos parcelas que forman dicha pareja sea más oscura. Tendremos por tanto 16 bits de información posible por cada imagen en la pantalla, (un bit por pareja, si la celda de la izquierda es más oscura que la de la derecha, le asignará el valor “1”, en caso contrario le asignara el valor “0”). La superficie de la imagen con la que el audímetro opera supone aproximadamente un 5 % de la superficie total de la pantalla.

El sistema sigue un algoritmo de eliminación, es decir, determina la cadena correspondiente por eliminación de aquellas que no lo son. Al comenzar el proceso, se contemplan todas las cadenas controladas y se van comparando las muestras (bits) recogidas en el hogar con las obtenidas en la Central para cada una de las cadenas. A medida que se producen discordancias entre la información de una cadena y la obtenida en el hogar, esta cadena es eliminada, y se continúa la comparación con las cadenas restantes. Cuando, durante el proceso, solo quede una cadena para la cual los datos de la Central y del hogar sean coincidentes, ésta será la cadena vista en dicho televisor. Cuando estos datos dejan de coincidir es señal de que se ha producido un cambio de cadena, incluyéndose de nuevo todas las cadenas para realizar una vez más el proceso de eliminación.

Bienvenid@s al blog de Estadística de Ingeniería Multimedia

Bienvenid@s al blog de la asignatura Estadística del Grado en Ingeniería Multimedia. Un blog que construiremos poco a poco a lo largo del curso entre tod@s. Para participar en él debes ser estudiante de la asignatura y solicitar en clase de prácticas registrarte en el mismo.

No lo olvidéis el martes 8 de febrero a las 9:00 de 2011 empiezan las clases de Estadística en esta nueva titulación. Ese día explicaremos el funcionamiento de la asignatura. Pero si os pica la curiosidad, podéis ir al Campus Virtual y leer la sesión 1: Presentación y normas de Estadística de Ingeniería Multimedia.