Una aplicación on-line sobre muestreo sistemático

Con el fin de ayudar a entender los pasos de los problemas propuestos sobre muestreos sistemáticos, os dejo una aplicación on-line para que se pueda simular dicho muestreo paso por paso tal y como lo planteamos al hacer los problemas a mano.  Si quieres ver todas las aplicaciones on-line publicadas hasta el momento puedes hacerlo desde aquí.

El diseño de la página ha sido realizado por Fernando Meneses, estudiante de Ingeniería Multimedia que ha participado también en la realización de alguna  de dichas aplicaciones y que amablemente me ha permitido usar dicho diseño para publicarlas. Pincha en la imagen de la entrada o en el siguiente  enlace  si quieres acceder a ella:

Aplicación sobre muestreo sistemático

Introducción al muestreo y sistemas de medición de audiencias (guión para teoría)

Hoy he estado probando SlideShare con el fin de compartir en el blog parte del material de la asignatura que el alumnado tiene disponible en el Campus Virtual. Aquí os dejo el guión que se utiliza en clase para explicar el tema 2 de la asignatura. Este guión se complementa con la explicación en el aula de la profesora y la realización de ejercicios complementarios así como con el libro on-line de la asignatura. Recordad que un guión  no son unos apuntes.

 

Unos cuantos ejercicios para practicar el tema 2

INTRODUCCIÓN AL MUESTREO Y SISTEMAS DE MEDICIÓN DE AUDIENCIAS 

Ejercicio 2.1: Clasifica las siguientes variables.

  • Número de visitas a un sitio Web en un periodo de tiempo
  • Tiempo dedicado a jugar con la consola a la semana
  • Vida útil de una batería
  • Sistema operativo preferido
  • Sueldo de las personas mayores de 40 años
  • Comprensión lectora (baja, media o alta)
  • Marca de diferentes ordenadores
  • Número de conexiones a internet en un periodo de tiempo
  • Estado de conservación de diferentes ordenadores (malo, bueno, regular)
  • Velocidad en Hz. de un microprocesador
  • Nivel educativo (primario, secundario, superior)
  • Tiempo de respuesta de un tipo de pantalla LCD
  • La variable sexo codificada con 1 para chicos y 2 para chicas
  • Preferencias musicales
  • Número de dispositivos electrónicos defectuosos en la producción diaria de una empresa

Ejercicio 2.2: Una gran multinacional ha solicitado a su departamento de informática que realice una aplicación que permita gestionar on-line las ventas de sus comerciales. Para hacer las primeras comprobaciones deciden elegir 5 comerciales mediante un muestreo aleatorio. Para ello disponen de un fichero con 750 filas donde en la primera fila aparecen los campos que definen cada uno de los datos tomados a los comerciales (DNI, apellidos, nombre, etc.) seguido del resto de filas con los datos concretos de cada uno de los comerciales.

  • Obtén a través de un muestreo aleatorio simple, la muestra de comerciales requerida, indicando en qué filas aparecerán los datos de los comerciales que van a formar parte de la muestra. Explica los pasos seguidos y qué generador de números aleatorios has utilizado.
  • Obtén a través de un muestreo sistemático, la muestra de comerciales requerida en este caso, indicando en qué filas aparecerán los datos de los comerciales que van a formar parte de la muestra. Explica los pasos seguidos.

Ejercicio 2.3: En una de las líneas de producción de una empresa se producen piezas electrónicas que luego se empaquetan en bolsas que contienen cada una de ellas 500 piezas. Posteriormente las bolsas se introducen en contenedores con capacidad para 50 bolsas. El inspector del control de calidad de la empresa quiere analizar el funcionamiento de dicha línea de producción. Esto es importante para la empresa porque cualquier desviación en las medidas de las piezas producidas supondría grandes pérdidas para la empresa. Explica cuál es el muestreo aleatorio más apropiado para realizar este control de calidad una vez llenados los contenedores y explica qué pasos podría seguir para realizar dicho muestreo si se desea extraer una muestra de 1000 piezas.

Ejercicio 2.4: Una gran multinacional ha solicitado a su departamento de informática que realice una aplicación que permita gestionar on-line las ventas de sus comerciales. Para hacer las primeras comprobaciones deciden elegir una muestra aleatoria de 9 comerciales. Para ello disponen de un fichero con 965 filas en el que en las ocho primeras filas aparece una cabecera, en la novena los campos que definen cada uno de los datos tomados a los comerciales (Zona, DNI, apellidos, nombre, etc.) seguido del resto de filas con los datos concretos de cada uno de los comerciales. Estos datos se han ordenado por Zona (zona A, zona B) y las 340 últimas filas muestran los datos de los comerciales de la zona B. Si se realiza un muestreo estratificado, indica el número de comerciales que debe coger de cada zona. Posteriormente simula un muestreo sistemático en cada zona e índica en qué filas aparecerán los datos de los comerciales que van a formar parte de la muestra.

Ejercicio 2.5: Se sabe que en cierta ciudad hay 1761 hoteles distribuidos de la siguiente forma atendiendo a la categoría: 225 de 5 estrellas, 356 de 4 estrellas, 329 de 3 estrellas, 404 de 2 estrellas y 447 de una estrella. Se desea extraer una muestra aleatoria de tamaño 430 para analizar la política de los hoteles respecto al servicio de acceso a Internet. Explica qué tipo de muestreo es el más apropiado y explica todo el proceso a realizar dando los tamaños muestrales correspondientes.

Ejercicio 2.6: Un centro comercial acaba de recibir dos pedidos de sintonizadores TDT para ponerlos a la venta entre sus clientes, uno de la empresa A y otro de la empresa B. Los sintonizadores de la empresa A vienen numerados con códigos desde el 2324 al 4500 y los de la empresa B del 995 al 3416. El gerente de dicho centro está preocupado por la calidad de dichos sintonizadores y decide obtener una muestra de 7 aparatos y someterlos a varias pruebas. Simula, paso por paso y de forma razonada, un muestreo estratificado para obtener dicha muestra, utilizando en cada uno de los estratos un muestreo aleatorio sistemático. Indica para cada elemento obtenido en la muestra, qué código tiene y de qué empresa es.

Ejercicio 2.7: Se desea conocer la política de las tiendas de informática de una gran ciudad respecto al uso de software pirata. Para ello una cadena de televisión pretende hacer un estudio exhaustivo con cámara oculta en una muestra aleatoria de dichas tiendas. Se dispone de un fichero con todas las tiendas de la ciudad por localización geográfica. Propón de forma razonada un método de muestreo apropiado.

Ejercicio 2.8: Haz una pequeña investigación para ampliar los tipos de muestreo dados en clase y explica en qué consiste y de qué tipo es el muestreo bola de nieve. Explica algunos de los motivos por los que se usa este muestreo y si los resultados obtenidos a través del mismo son extrapolables a la población total. Incluye las referencias utilizadas en el desarrollo de este ejercicio.

Ejercicio 2.9: Haz una pequeña investigación para ampliar la información dada en clase y explica en qué consisten los sistemas de medición de audiencias en Internet mediante análisis de logs y mediante análisis de tags, indicando algunas de las ventajas e inconvenientes de los mismos. Incluye las referencias utilizadas en el desarrollo de este ejercicio.

Ejercicio 2.10: Realiza las siguientes cuestiones.

  • Explica los conceptos de muestreo aleatorio estratificado y muestreo por conglomerado. Indica cuándo debe utilizarse cada uno de ellos y pon ejemplos que ilustren tu explicación.
  • Explica, en el contexto de la estadística, qué es un grupo de interés y qué características debe tener. Pon algún ejemplo que ilustre tu explicación.

Ejercicio 2.11: En un municipio  de 397 personas se desea obtener una muestra de 17 personas mediante muestreo aleatorio sistemático. Describe el proceso y simula dicha muestra sistemática.

Ejercicio 2.12: Una gran empresa ha solicitado a su departamento de informática que realice una aplicación que permita gestionar on-line las ventas en todas sus tiendas. Para hacer las primeras comprobaciones deciden elegir 7 tiendas. Para ello disponen de un fichero con 1520 filas en el que en las 3 primeras filas aparece una cabecera y en la cuarta los campos que definen cada uno de los datos tomados de cada tienda (Dirección postal, Nombre del gerente, etc.). A continuación están el resto de filas con los datos concretos de cada una de las tiendas. Simula de forma razonada un muestreo sistemático e indica en qué filas aparecerán los datos de las tiendas que van a formar parte de la muestra.

Ejercicio 2.13: Explica los siguientes conceptos indicando además en qué contexto aparecen y poniendo un ejemplo ilustrativo en cada caso: Difusión, tirada, rating, share, metodología user centric.

Ejercicio 2.14: Una gran empresa ha solicitado a su departamento de informática que realice una aplicación que permita gestionar on-line las ventas en todas sus tiendas. Para hacer las primeras comprobaciones deciden elegir 4 tiendas. Para ello disponen de un fichero con 1230 filas en el que en las seis primeras filas aparece una cabecera y en la séptima los campos que definen cada uno de los datos tomados de cada tienda (Dirección postal, nombre del gerente, etc.). A continuación están el resto de filas con los datos concretos de cada una de las tiendas. Simula de forma razonada un muestreo aleatorio simple e indica en qué filas aparecerán los datos de las tiendas que van a formar parte de la muestra.

Ejercicio 2.15: Un centro comercial acaba de recibir un pedido de sintonizadores TDT para ponerlos a la venta entre sus clientes. Dichos sintonizadores vienen numerados con códigos desde el 3456 al 4795. El gerente de dicho centro está preocupado por la calidad de dichos sintonizadores y decide obtener una muestra sistemática de 6 aparatos y someterlos a varias pruebas. Ayúdale a obtener la muestra.

Ejercicio 2.16: Una compañía de alquiler de automóviles desea estimar el kilometraje promedio de su flota. Cuenta con 10000 automóviles. De estos, 2000 son automóviles grandes, 3500 medianos, 2000 pequeños y 2500 compactos. Después de analizar los errores potenciales involucrados en el muestreo, la compañía decidió que el tamaño de la muestra fuera de 1200. También decidió hacer una estratificación según los tamaños de los automóviles. Explica cuántos automóviles se deben muestrear en cada categoría.

Ejercicio 2.17: Una gran compañía ha hecho una compra de 31800 ordenadores portátiles, para sus trabajadores, a dos empresas (A y B). De la empresa A compró 12300 portátiles y de la empresa B compró el resto. El director de la compañía desea realizar un control de calidad sobre 300 de esos portátiles. Explica qué tipo de muestreo es el más apropiado y explica todo el proceso a realizar dando los tamaños muestrales correspondientes.

Ejercicio 2.18: Explica en qué consiste la recogida de datos por registros. Indica algún ejemplo que ilustre tu explicación.

Ejercicio 2.19: Explica en qué consiste la recogida de datos por observación. Indica varios ejemplos que ilustre tu explicación.

Ejercicio 2.20: Explica, según lo tratado en teoría, las posibles ventajas de estudiar una población a partir de muestras. Da además para cada una de dichas ventajas un ejemplo explicativo.

Ejercicio 2.21: Comprueba que tienes claros algunos conceptos básicos del tema con el siguiente juego y anota tu puntuación: https://blogs.ua.es/violeta/2011/11/02/sencillo-videojuego-estadisticaim-introduccion-al-muestreo/

¿Por qué usar muestras?

Llamamos muestreo a la técnica con la que se determina el tamaño y los elementos que integrarán la muestra, a fin de que cumpla la condición de ser representativa de toda la población. En el siguiente vídeo se introducen algunas de las ventajas de trabajar con muestras, en lugar de con toda la población, para realizar los estudios estadísticos. Tengamos en cuenta que, para que los resultados obtenidos en la muestra reflejen la realidad de la población, dicha muestra   debe obtenerse mediante un muestreo aleatorio. Una vez elegido el método de muestreo, se estudia el tamaño de muestra necesario para que los resultados sean extrapolables a la población. Los aspectos relativos al tamaño de muestra a utilizar se estudiará en la asignatura en el tema 6,  una vez que se tenga la base estadística necesaria.

Muestreo aleatorio simple

Un muestreo aleatorio simple consiste en escoger una muestra de n elementos de la población, de manera que todas las combinaciones posibles de n elementos de la población tengan la misma probabilidad de ser seleccionadas. Es el azar el que decide. Este muestreo tal y como se ha definido aquí es un muestreo sin reemplazamiento y nosotros nos restringiremos únicamente a este caso.

Las muestras obtenidas mediante este muestreo se denominan muestras aleatorias simples (m.a.s.). Notamos que se puede pensar en un muestreo aleatorio simple como en algo similar a sacar nombres o números de una urna. En el siguiente vídeo se ilustra dicho muestreo.

Para simular una muestra aleatoria simple, a la hora de hacer los ejercicios de la asignatura, podemos utilizar el siguiente generador on-line del que se habla en el vídeo: nosetup.org.


Grupos de interés en Estadística

En este vídeo se explica qué es un grupo de interés dentro del ámbito de la Estadística:


El tamaño de cada uno de estos  grupos de interés es reducido (entre 6 y 10 personas, aproximadamente) y las sesiones de estos grupos suelen durar entre una o dos horas.