Estadística + Ingeniería Multimedia

Blog sobre la asignatura Estadística de Ingeniería Multimedia

Estadística + Ingeniería Multimedia - Blog sobre la asignatura  Estadística de Ingeniería Multimedia

GRP: un corto de Vicente Bonet

Aquí os dejo un cortometraje  del director castellonense Vicente Bonet “GRP” con el que participó en la octava edición del festival JamesonNotodofilmfest. Este festival de cine que ya va por la XII edición sirve de escaparate a  jóvenes creadores audiovisuales a través de Internet.  El corto cuenta la historia de una familia a la que le han instalado un audímetro.

Introducción al muestreo y sistemas de medición de audiencias (guión para teoría)

Hoy he estado probando SlideShare con el fin de compartir en el blog parte del material de la asignatura que el alumnado tiene disponible en el Campus Virtual. Aquí os dejo el guión que se utiliza en clase para explicar el tema 2 de la asignatura. Este guión se complementa con la explicación en el aula de la profesora y la realización de ejercicios complementarios así como con el libro on-line de la asignatura. Recordad que un guión  no son unos apuntes.

 

Unos cuantos ejercicios para practicar el tema 2

INTRODUCCIÓN AL MUESTREO Y SISTEMAS DE MEDICIÓN DE AUDIENCIAS 

Ejercicio 2.1: Clasifica las siguientes variables.

  • Número de visitas a un sitio Web en un periodo de tiempo
  • Tiempo dedicado a jugar con la consola a la semana
  • Vida útil de una batería
  • Sistema operativo preferido
  • Sueldo de las personas mayores de 40 años
  • Comprensión lectora (baja, media o alta)
  • Marca de diferentes ordenadores
  • Número de conexiones a internet en un periodo de tiempo
  • Estado de conservación de diferentes ordenadores (malo, bueno, regular)
  • Velocidad en Hz. de un microprocesador
  • Nivel educativo (primario, secundario, superior)
  • Tiempo de respuesta de un tipo de pantalla LCD
  • La variable sexo codificada con 1 para chicos y 2 para chicas
  • Preferencias musicales
  • Número de dispositivos electrónicos defectuosos en la producción diaria de una empresa

Ejercicio 2.2: Una gran multinacional ha solicitado a su departamento de informática que realice una aplicación que permita gestionar on-line las ventas de sus comerciales. Para hacer las primeras comprobaciones deciden elegir 5 comerciales mediante un muestreo aleatorio. Para ello disponen de un fichero con 750 filas donde en la primera fila aparecen los campos que definen cada uno de los datos tomados a los comerciales (DNI, apellidos, nombre, etc.) seguido del resto de filas con los datos concretos de cada uno de los comerciales.

  • Obtén a través de un muestreo aleatorio simple, la muestra de comerciales requerida, indicando en qué filas aparecerán los datos de los comerciales que van a formar parte de la muestra. Explica los pasos seguidos y qué generador de números aleatorios has utilizado.
  • Obtén a través de un muestreo sistemático, la muestra de comerciales requerida en este caso, indicando en qué filas aparecerán los datos de los comerciales que van a formar parte de la muestra. Explica los pasos seguidos.

Ejercicio 2.3: En una de las líneas de producción de una empresa se producen piezas electrónicas que luego se empaquetan en bolsas que contienen cada una de ellas 500 piezas. Posteriormente las bolsas se introducen en contenedores con capacidad para 50 bolsas. El inspector del control de calidad de la empresa quiere analizar el funcionamiento de dicha línea de producción. Esto es importante para la empresa porque cualquier desviación en las medidas de las piezas producidas supondría grandes pérdidas para la empresa. Explica cuál es el muestreo aleatorio más apropiado para realizar este control de calidad una vez llenados los contenedores y explica qué pasos podría seguir para realizar dicho muestreo si se desea extraer una muestra de 1000 piezas.

Ejercicio 2.4: Una gran multinacional ha solicitado a su departamento de informática que realice una aplicación que permita gestionar on-line las ventas de sus comerciales. Para hacer las primeras comprobaciones deciden elegir una muestra aleatoria de 9 comerciales. Para ello disponen de un fichero con 965 filas en el que en las ocho primeras filas aparece una cabecera, en la novena los campos que definen cada uno de los datos tomados a los comerciales (Zona, DNI, apellidos, nombre, etc.) seguido del resto de filas con los datos concretos de cada uno de los comerciales. Estos datos se han ordenado por Zona (zona A, zona B) y las 340 últimas filas muestran los datos de los comerciales de la zona B. Si se realiza un muestreo estratificado, indica el número de comerciales que debe coger de cada zona. Posteriormente simula un muestreo sistemático en cada zona e índica en qué filas aparecerán los datos de los comerciales que van a formar parte de la muestra.

Ejercicio 2.5: Se sabe que en cierta ciudad hay 1761 hoteles distribuidos de la siguiente forma atendiendo a la categoría: 225 de 5 estrellas, 356 de 4 estrellas, 329 de 3 estrellas, 404 de 2 estrellas y 447 de una estrella. Se desea extraer una muestra aleatoria de tamaño 430 para analizar la política de los hoteles respecto al servicio de acceso a Internet. Explica qué tipo de muestreo es el más apropiado y explica todo el proceso a realizar dando los tamaños muestrales correspondientes.

Ejercicio 2.6: Un centro comercial acaba de recibir dos pedidos de sintonizadores TDT para ponerlos a la venta entre sus clientes, uno de la empresa A y otro de la empresa B. Los sintonizadores de la empresa A vienen numerados con códigos desde el 2324 al 4500 y los de la empresa B del 995 al 3416. El gerente de dicho centro está preocupado por la calidad de dichos sintonizadores y decide obtener una muestra de 7 aparatos y someterlos a varias pruebas. Simula, paso por paso y de forma razonada, un muestreo estratificado para obtener dicha muestra, utilizando en cada uno de los estratos un muestreo aleatorio sistemático. Indica para cada elemento obtenido en la muestra, qué código tiene y de qué empresa es.

Ejercicio 2.7: Se desea conocer la política de las tiendas de informática de una gran ciudad respecto al uso de software pirata. Para ello una cadena de televisión pretende hacer un estudio exhaustivo con cámara oculta en una muestra aleatoria de dichas tiendas. Se dispone de un fichero con todas las tiendas de la ciudad por localización geográfica. Propón de forma razonada un método de muestreo apropiado.

Ejercicio 2.8: Haz una pequeña investigación para ampliar los tipos de muestreo dados en clase y explica en qué consiste y de qué tipo es el muestreo bola de nieve. Explica algunos de los motivos por los que se usa este muestreo y si los resultados obtenidos a través del mismo son extrapolables a la población total. Incluye las referencias utilizadas en el desarrollo de este ejercicio.

Ejercicio 2.9: Haz una pequeña investigación para ampliar la información dada en clase y explica en qué consisten los sistemas de medición de audiencias en Internet mediante análisis de logs y mediante análisis de tags, indicando algunas de las ventajas e inconvenientes de los mismos. Incluye las referencias utilizadas en el desarrollo de este ejercicio.

Ejercicio 2.10: Realiza las siguientes cuestiones.

  • Explica los conceptos de muestreo aleatorio estratificado y muestreo por conglomerado. Indica cuándo debe utilizarse cada uno de ellos y pon ejemplos que ilustren tu explicación.
  • Explica, en el contexto de la estadística, qué es un grupo de interés y qué características debe tener. Pon algún ejemplo que ilustre tu explicación.

Ejercicio 2.11: En un municipio  de 397 personas se desea obtener una muestra de 17 personas mediante muestreo aleatorio sistemático. Describe el proceso y simula dicha muestra sistemática.

Ejercicio 2.12: Una gran empresa ha solicitado a su departamento de informática que realice una aplicación que permita gestionar on-line las ventas en todas sus tiendas. Para hacer las primeras comprobaciones deciden elegir 7 tiendas. Para ello disponen de un fichero con 1520 filas en el que en las 3 primeras filas aparece una cabecera y en la cuarta los campos que definen cada uno de los datos tomados de cada tienda (Dirección postal, Nombre del gerente, etc.). A continuación están el resto de filas con los datos concretos de cada una de las tiendas. Simula de forma razonada un muestreo sistemático e indica en qué filas aparecerán los datos de las tiendas que van a formar parte de la muestra.

Ejercicio 2.13: Explica los siguientes conceptos indicando además en qué contexto aparecen y poniendo un ejemplo ilustrativo en cada caso: Difusión, tirada, rating, share, metodología user centric.

Ejercicio 2.14: Una gran empresa ha solicitado a su departamento de informática que realice una aplicación que permita gestionar on-line las ventas en todas sus tiendas. Para hacer las primeras comprobaciones deciden elegir 4 tiendas. Para ello disponen de un fichero con 1230 filas en el que en las seis primeras filas aparece una cabecera y en la séptima los campos que definen cada uno de los datos tomados de cada tienda (Dirección postal, nombre del gerente, etc.). A continuación están el resto de filas con los datos concretos de cada una de las tiendas. Simula de forma razonada un muestreo aleatorio simple e indica en qué filas aparecerán los datos de las tiendas que van a formar parte de la muestra.

Ejercicio 2.15: Un centro comercial acaba de recibir un pedido de sintonizadores TDT para ponerlos a la venta entre sus clientes. Dichos sintonizadores vienen numerados con códigos desde el 3456 al 4795. El gerente de dicho centro está preocupado por la calidad de dichos sintonizadores y decide obtener una muestra sistemática de 6 aparatos y someterlos a varias pruebas. Ayúdale a obtener la muestra.

Ejercicio 2.16: Una compañía de alquiler de automóviles desea estimar el kilometraje promedio de su flota. Cuenta con 10000 automóviles. De estos, 2000 son automóviles grandes, 3500 medianos, 2000 pequeños y 2500 compactos. Después de analizar los errores potenciales involucrados en el muestreo, la compañía decidió que el tamaño de la muestra fuera de 1200. También decidió hacer una estratificación según los tamaños de los automóviles. Explica cuántos automóviles se deben muestrear en cada categoría.

Ejercicio 2.17: Una gran compañía ha hecho una compra de 31800 ordenadores portátiles, para sus trabajadores, a dos empresas (A y B). De la empresa A compró 12300 portátiles y de la empresa B compró el resto. El director de la compañía desea realizar un control de calidad sobre 300 de esos portátiles. Explica qué tipo de muestreo es el más apropiado y explica todo el proceso a realizar dando los tamaños muestrales correspondientes.

Ejercicio 2.18: Explica en qué consiste la recogida de datos por registros. Indica algún ejemplo que ilustre tu explicación.

Ejercicio 2.19: Explica en qué consiste la recogida de datos por observación. Indica varios ejemplos que ilustre tu explicación.

Ejercicio 2.20: Explica, según lo tratado en teoría, las posibles ventajas de estudiar una población a partir de muestras. Da además para cada una de dichas ventajas un ejemplo explicativo.

Ejercicio 2.21: Comprueba que tienes claros algunos conceptos básicos del tema con el siguiente juego y anota tu puntuación: https://blogs.ua.es/violeta/2011/11/02/sencillo-videojuego-estadisticaim-introduccion-al-muestreo/

Ahora le toca el turno a la medición de audiencias en televisión

En el siguiente vídeo de la asignatura seguimos tratando  la  medición de audiencias. En este caso tratamos los parámetros básicos de interés en la medición de audiencias en televisión.

En el vídeo se habla muy de pasada  de los audímetros, si quieres saber algo más sobre ellos  y cómo funcionan te recomiendo que vayas a la siguiente entrada del blog: ¿Qué es un audímetro? ¿Has visto alguna vez uno?

 

¿Qué es un audímetro? ¿Has visto alguna vez uno?

Si quieres saber algo más sobre los sistemas de medición de audiencias en televisión y esos aparatitos que se llaman audímetros que explicamos en clase puedes ver el siguiente  reportaje: como verás alrededor de 4.500 familias (4.625 hogares, a día de hoy, según la información disponible en la página web de Kantar Media) en España deciden lo que vemos todos por la tele. Y nadie sabe quiénes son.

La llegada de la tecnología digital supuso un serio problema para los audímetros tradicionales. Se ponía en cuestión su principal capacidad: el reconocimiento preciso de la cadena sintonizada. Tal reconocimiento se hacía a través de la detección de la frecuencia de sintonía o del canal radioeléctrico. La correspondencia entre canal radioléctrico y cadena era biunívoca para un dispositivo determinado, con lo que la base para la determinación de la cadena estaba establecida. El problema es que en un entorno digital, dentro de un mismo canal radioeléctrico se concentran las señales de un número diverso de cadenas diferentes. Una de las soluciones para este problema ha sido utilizar un enfoque basado en el  reconocimiento de la señal de vídeo. Es la línea que sigue, entre otros, el Picture Matching System que actualmente utiliza Sofres AM (actualmente Kantar Media) para la identificación de las cadenas emitidas por las plataformas digitales en España.

El audímetro Picture Matching basa su funcionamiento en el contenido de la emisión en sí, más concretamente en la señal de vídeo, es decir, en la imagen que se está viendo en el televisor sondado. La filosofía general consiste en el almacenamiento de muestras de la señal de vídeo en los televisores de los hogares que, tras su comparación (matching) con las muestras tomadas para cada una de las cadenas, permitirá determinar cual es la cadena vista en un televisor en cada momento.

Lo que realmente recoge el audímetro no son muestras de la imagen, sino el resultado de múltiples comparaciones de luminosidad entre pares de parcelas o celdas de la pantalla. Para el Picture Matching, la imagen se reduce a la luminosidad media de 32 pequeñas celdas que se encuentran fijadas de forma pseudo-aleatoria en la pantalla.

Estas 32 celdas están organizadas en 16 parejas, de cada una de las cuales se pueden obtener dos posibles resultados dependiendo de cual de las dos parcelas que forman dicha pareja sea más oscura. Tendremos por tanto 16 bits de información posible por cada imagen en la pantalla, (un bit por pareja, si la celda de la izquierda es más oscura que la de la derecha, le asignará el valor “1”, en caso contrario le asignara el valor “0”). La superficie de la imagen con la que el audímetro opera supone aproximadamente un 5 % de la superficie total de la pantalla.

El sistema sigue un algoritmo de eliminación, es decir, determina la cadena correspondiente por eliminación de aquellas que no lo son. Al comenzar el proceso, se contemplan todas las cadenas controladas y se van comparando las muestras (bits) recogidas en el hogar con las obtenidas en la Central para cada una de las cadenas. A medida que se producen discordancias entre la información de una cadena y la obtenida en el hogar, esta cadena es eliminada, y se continúa la comparación con las cadenas restantes. Cuando, durante el proceso, solo quede una cadena para la cual los datos de la Central y del hogar sean coincidentes, ésta será la cadena vista en dicho televisor. Cuando estos datos dejan de coincidir es señal de que se ha producido un cambio de cadena, incluyéndose de nuevo todas las cadenas para realizar una vez más el proceso de eliminación.

Medición de audiencias en Internet: Google Analytics.

En el siguiente vídeo se muestran algunos de los parámetros que interesan estudiar a la hora de medir las audiencias de un sitio web para la toma de decisiones. Concretamente, Google Analytics es un ejemplo de metodología site-centric (orientada al sitio) basada en análisis de tags que se explicó en clase. Si queréis profundizar podéis ver el siguiente vídeo.