Estadística + Ingeniería Multimedia

Blog sobre la asignatura Estadística de Ingeniería Multimedia

Estadística + Ingeniería Multimedia - Blog sobre la asignatura  Estadística de Ingeniería Multimedia

Calculadora de análisis combinatorio

En el tema 4 usamos el análisis combinatorio para resolver  ejercicios algo más complejos sobre  probabilidades. Así que os dejo aquí esta sencilla calculadora  combinatoria on-line que os puede ser de utilidad.

calculadoracombinatoria

Puedes practicar con ella resolviendo estos sencillos ejercicios antes de pasar a problemas más complicados.

  • ¿Cuántas cadenas de 8 bits se pueden formar? (Sol.: 256)
  • Un alfabeto consta de 5 vocales y 21 consonantes ¿Cuántas claves de 5 letras distintas de dicho alfabeto pueden formarse? (Sol.: 7893600)
  • ¿Cuántas números de cuatro cifras se pueden formar? (Sol: 9000)
  • ¿Cuántos números de cuatro cifras distintas se pueden formar? (Sol.:4536)
  • ¿Cuántos números de cuatro cifras distintas se pueden formar, si el último debe ser cero? (Sol.: 504)
  • ¿Cuántas muestras aleatorias simples de tamaño 10 pueden extraerse de una población de tamaño 50? (Sol.: 10272278170)
  • ¿Cuántas cadenas de 12 bits tienen 8 unos y 4 ceros? (Sol: 495)
  • Una tienda de informática tiene 7 marcas diferentes de ordenadores. Calcula el número de formas posibles de seleccionar 10 ordenadores atendiendo sólo a la marca. (Sol.: 8008)
  • ¿Cuántas palabras con o sin sentido pueden formarse con todas las letras de la palabra MULTIMEDIA? (Sol.: 907200)

Teorema de Bayes y probabilidad total con Geogebra

El siguiente Geogebra está pensado para intentar que el alumnado de Estadística de Ingeniería Multimedia, entienda los teoremas de Bayes y probabilidad total a la hora de explicarlos en clase, utilizando el caso particular de una partición del espacio muestral en dos sucesos. Pincha en la imagen para acceder a él.

 

Una vez que hayas visto cómo funciona el geogebra, te propongo que lo utilices para resolver los siguientes ejercicios. Pero no olvides hacerlos antes a mano, definiendo los distintos sucesos e indicando las distintas probabilidades  que se nos dan en el problema y las que nos piden que calculemos.

Ejercicio 1: En dos plantas, A1 y A2 se fabrican el total de los componentes electrónicos de una empresa. Concretamente en la planta A2 se fabrica el triple de componentes  que en la planta A1.  Los porcentajes de producción defectuosa de estas plantas son, respectivamente, el 5 % y el 2 %.

(1) Si se selecciona un componente al azar cuál es la probabilidad de que sea defectuoso.

(2) Si se selecciona un componente al azar y resulta ser defectuoso, calcula  la probabilidad de que se haya producido en la planta A1.

(3) Si se selecciona un componente al azar y resulta ser correcto, calcula  la probabilidad de que se haya producido en la planta A1.

Ejercicio 2: Una empresa dispone de un software para analizar el buen funcionamiento de los videojuegos que vende. Se sabe que la  probabilidad  de que dicho software indique que el videojuego está defectuoso cuando efectivamente lo está, es 0.97 y la probabilidad de que el programa indique que el videojuego funciona correctamente cuando efectivamente su funcionamiento es correcto es 0.90. Sabiendo que el 2% de los videojuegos que vende no funcionan correctamente y son devueltos, calcula la probabilidad de que un videojuego  funcione correctamente habiendo el programa indicado que estaba defectuoso.

Comprueba tus resultados (solución final de algunos ejercicios del tema 7)

Os adjunto aquí la solución final de algunos ejercicios de la práctica del  tema 7 (con algunos resultados intermedios, que os pueden variar algo atendiendo a  errores de redondeo) para que podáis comprobar vuestros resultados.

Ejercicio 7.1: Zo=-3.3333, P-valor=0.000429. Se rechaza Ho, lo que implica que las sospechas del control de calidad son ciertas y la duración de este modelo de batería ha bajado. Véase el dragón de la guarida.

Ejercicio 7.2: to=-4.832846, P-valor=0.000004. Rechazamos Ho, lo que implica que el promedio de horas de televisión por hogar al día en esa zona no es igual al de todo el territorio.

Ejercicio 7.3: to=-4.035, P-valor=0.0018. Rechazamos la hipótesis nula por lo que podemos afirmar que el nuevo método tiene menor tasa media de error.

Ejercicio 7.4: Zo=-111.803399. P-valor=0. Rechazamos Ho, lo que implica que  los datos obtenidos con el uso de la Wii mejoran los datos estimados previamente.

Ejercicio 7.5: Zo=2.357023. P-valor=0.009211. Rechazamos Ho y por  tanto los datos obtenidos con el sistema experto necesita un reajuste ya que la cifra de ingresos hospitalarios que propone está  por encima de lo indicado por el servicio médico. Véase hundir la flota.

Ejercicio 7.6: to=-2.335. P-valor=0.0224. Rechazamos Ho y por tanto el nuevo algoritmo B es mejor ya que tiene mayor tasa media de acierto, por lo que se debería utilizar el algoritmo B para la detección de obstáculos en la aplicación para la automatización de vehículos.

Ejercicio 7.7: to=-3.100578. P-valor=0.001028. Rechazamos Ho y por tanto es más lenta la nueva red de tipo Wireless como indicó el técnico.

Ejercicio 7.8: Zo=-9.361468. P-valor=0. Rechazamos Ho y por lo tanto se puede dar por cierta la afirmación del periódico.

Ejercicio 7.9: Zo=2.947145. Realizando un contraste bilateral obtenemos P-valor=0.003207. Rechazamos Ho y por tanto la proporción de tarjetas defectuosos de los modelos A y B son distintas. Para saber en  cuál  de los modelos se obtiene más proporción de defectuosos realizaríamos los correspondientes contrastes unilaterales y obtendremos que debería quedarse con las tarjetas de red del modelo B.

Ejercicio 7.10: Zo=-19.814848. P-valor=0. Rechazamos Ho y por tanto se puede dar por cierta la afirmación de que la tasa de rebote del sitio web ha disminuido después de dicho asesoramiento técnico.

Análisis inferencial de datos categóricos (guiones de teoría y práctica)

El tema de Análisis inferencial de datos categóricos se imparte tanto en las clases de teoría como en las de prácticas.  El alumnado dispone en el Campus Virtual de  un guión de teoría, unas diapositivas para la parte práctica del laboratorio  y el correspondiente tema on-line de la asignatura para su consulta a la hora de hacer la práctica propuesta. Aquí os dejo el guión que se utiliza en clase de teoría  para explicar el tema 8.

Recordad que un guión  no son unos apuntes.

Si quieres consultar  las diapositivas  prácticas, puedes acceder aquí para ver el vídeo. Y si deseas ver más entradas del blog sobre este tema puedes hacerlo desde aquí.

 

Intervalos de confianza para una proporción (comprueba tus resultados)

Aquí os incluyo una sencilla calculadora realizada con Excel Web App que os permitirá comprobar vuestros  resultados en los ejercicios sobre intervalos de confianza para una proporción. Es una versión simplificada de mi hoja de cálculo ya que Excel Web App no tiene ciertas funcionalidades como la validación de datos y la protección de algunas celdas … Si trabajas con ella y quieres volver a tener la hoja como al principio sólo tienes que recargar la página. Por defecto aparece la solución de los intervalos de confianza  correspondientes a los ejercicios 6.8 y 6.6 (en ese orden) propuestos en la práctica del curso 2012-2013 sobre el  tema 6. Accede a ella pinchando en la imagen o en el siguiente enlace:

Intervalos de confianza para una proporción

Os dejo aquí también los enunciados de dichos ejercicios y la solución final:

Ejercicio 6.6 Un centro de investigación ha diseñado un programa de fisioterapia con la Wii, para que los pacientes de rehabilitación puedan hacer los ejercicios en casa.  El centro desea saber si con el uso de dicho programa el tiempo de recuperación es menor. Para ello utilizaron el programa sobre 2350 pacientes y se obtuvo que 650 pacientes necesitaron más de dos semanas de rehabilitación. Los datos estimados hasta el momento sobre este tipo de rehabilitaciones indicaban que en el 40 por ciento de los casos la rehabilitación era superior a dos semanas. Calculando un intervalo de confianza al 95 por ciento explica si  los datos obtenidos con el uso de la Wii mejoran  los datos estimados previamente.

Solución: Sea p=proporción de gente que necesita más de dos semanas de rehabilitación con la Wii.

Aplicando la fórmula para muestras grandes se obtiene:

Ip95%=[0.2585, 0.2947]

Con una confianza del 95% podemos decir que los datos obtenidos con la Wii mejoran los datos estimados previamente ya que los datos estimados previamente indicaban que el 40% necesitaban más de 2 semanas de rehabilitación mientras que con la Wii el porcentaje de gente que necesitaría más  de dos semanas para la rehabilitación estaría entre el 25.85% y el 29.47%, mucho inferior al 40%.

Ejercicio 6.8 Una empresa de desarrollo de videojuegos desea conocer  la aceptación que está teniendo un videojuego que acaba de lanzar al mercado. Se ofrece a un grupo de 20 personas elegidas aleatoriamente que jueguen con él durante un mes y se les pide que indiquen si les ha gustado. A 15 de dichas personas les ha gustado y al resto no. Obtén un intervalo de confianza al 96.8 por ciento para el porcentaje de gente que le ha gustado el videojuego. A la vista de los resultados qué conclusiones se pueden sacar. ¿Le harías alguna recomendación a la empresa sobre la forma de hacer este estudio?

Solución: Sea p=proporción de gente que le gusta el videojuego y P=porcentaje de gente que le gusta el videojuego.

Entonces aplicando la fórmula para muestras pequeñas se obtiene Ip96.8%=[0.125,1] y por tanto IP96.8%=[12,5%,100%].

Recomendación para la empresa: Este intervalo es muy pobre (con una confianza del 96.8% sabemos que el porcentaje de gente a la que le gusta el videojuego está  entre 12.5% y 100%) y no da información relevante a la empresa, así que habría que utilizar una muestra grande y aplicar la fórmula correspondiente.

Contrastes de hipótesis (guiones de teoría y práctica)

El tema de Contrastes de hipótesis para parámetros poblacionales se imparte tanto en las clases de teoría como en las de prácticas.  El alumnado dispone en el Campus Virtual de  un guión de teoría, unas diapositivas para la parte práctica del laboratorio  y el correspondiente tema on-line de la asignatura para su consulta a la hora de hacer la práctica propuesta. Aquí os dejo el guión que se utiliza en clase de teoría  para explicar el tema 7.

Recordad que un guión  no son unos apuntes.

Si quieres consultar  las diapositivas  prácticas, puedes acceder aquí para ver el vídeo. Y si deseas ver más entradas del blog sobre este tema puedes hacerlo desde aquí.

 

Estimación de parámetros poblacionales (guiones de teoría y prácticas)

El tema de Estimación de parámetros poblacionales (intervalos de confianza) se imparte tanto en las clases de teoría como en las de prácticas.  El alumnado dispone en el Campus Virtual de  un guión de teoría, unas diapositivas para la parte práctica del laboratorio  y el correspondiente tema on-line de la asignatura para su consulta a la hora de hacer la práctica propuesta. Aquí os dejo el guión que se utiliza en clase de teoría  para explicar el tema 6.

Recordad que un guión  no son unos apuntes.

Si quieres consultar  las diapositivas  prácticas, puedes acceder aquí para ver el vídeo. Y si deseas ver más entradas del blog sobre este tema puedes hacerlo desde aquí.

 

Modelos de distribución discretos y continuos (guiones de teoría y práctica)

El tema de Modelos de distribución discretos y continuos  se imparte tanto en las clases de teoría como en las de prácticas.  El alumnado dispone en el Campus Virtual de  un guión de teoría, unas diapositivas para la parte práctica del laboratorio  y el correspondiente tema on-line de la asignatura para su consulta a la hora de hacer la práctica propuesta. Aquí os dejo el guión que se utiliza en clase de teoría  para explicar el tema 5.

Recordad que un guión  no son unos apuntes.

 

Si quieres consultar  las diapositivas  prácticas, puedes acceder aquí para ver el vídeo. Y si deseas ver más entradas del blog sobre este tema puedes hacerlo desde aquí.

 

Una aplicación on-line sobre probabilidad total

Con el fin de ayudar a entender cómo aplicar el teorema de la probabilidad total, os dejo una de las aplicaciones on-line  realizadas  en la asignatura de Ingeniería Multimedia. Forma parte del  trabajo realizado el curso pasado en la asignatura por Fernando Meneses (estudiante de  Ingeniería Multimedia). Pincha en la imagen de la entrada o en el siguiente  enlace  si quieres acceder a ella:

Aplicación sobre el teorema de la probabilidad total

 

Una aplicación on-line sobre muestreo sistemático

Con el fin de ayudar a entender los pasos de los problemas propuestos sobre muestreos sistemáticos, os dejo una aplicación on-line para que se pueda simular dicho muestreo paso por paso tal y como lo planteamos al hacer los problemas a mano.  Si quieres ver todas las aplicaciones on-line publicadas hasta el momento puedes hacerlo desde aquí.

El diseño de la página ha sido realizado por Fernando Meneses, estudiante de Ingeniería Multimedia que ha participado también en la realización de alguna  de dichas aplicaciones y que amablemente me ha permitido usar dicho diseño para publicarlas. Pincha en la imagen de la entrada o en el siguiente  enlace  si quieres acceder a ella:

Aplicación sobre muestreo sistemático

Estadística descriptiva (guión de teoría)

El tema se estadística descriptiva se da totalmente en el laboratorio de prácticas de forma interactiva usando, entre otros recurso estadísticos,  el SPSS. El alumnado dispone de  un guión de teoría, unas diapositivas para la parte práctica con el SPSS  y el correspondiente tema on-line de la asignatura para su consulta a la hora de hacer la práctica propuesta. Aquí os dejo el guión que se utiliza en clase de prácticas  para explicar la parte teórica  del tema 3 de la asignatura.

Recordad que un guión  no son unos apuntes.

Y si lo que quieres consultar son las diapositivas  prácticas accede aquí para ver el vídeo.

Diagramas de Venn para el cálculo de probabilidades con Geogebra

Con ayuda de los diagramas de Venn podemos dar los primeros pasos para la comprensión del cálculo de probabilidades de distintos  sucesos de un espacio muestral. El siguiente geogebra se ha realizado con dicho propósito. En él trabajaremos en términos de porcentajes y en caso de querer calcular probabilidades sólo habrá que dividir entre cien los resultados obtenidos. Para trabajar estos conceptos se puede proponer un ejercicio similar al siguiente.

En una ciudad se publican 3 revistas sobre tecnología y videojuegos A, B y C. Mediante una encuesta se estima que el 30% lee la revista A el 20% la revista  B, el 15% lee la C, el 10% lee A y B, el 6% lee A y C, el 5% lee B y C, y el 3% lee las tres revistas.

  • ¿Qué porcentaje lee al menos dos revistas?
  • ¿Qué porcentaje lee solo una revista?
  •  ¿Qué porcentaje no lee ninguna revista?
  • ¿Qué porcentaje lee A pero no B?

En primer lugar introduciremos los datos que nos dan en el ejercicio tal y como aparece en el Geogebra al que puedes acceder pinchando en la imagen y obtendremos interactivamente los distintos valores del diagrama de Venn:

 Una vez se tienen los datos en el diagrama de Venn y se entiende su significado será muy fácil contestar las preguntas propuestas:

a) ¿Qué porcentaje lee al menos dos revistas? 7+3+3+2=15%

b) ¿Qué porcentaje lee solo una revista? 17+8+7=32%

c) ¿Qué porcentaje no lee ninguna revista? 53%

d) ¿Qué porcentaje lee A pero no B? 17+3=20%

Con ayuda de dicho geogebra puedes  realizar ejercicios similares al anterior. Os  propongo aquí uno para practicar, recuerda que cuando hablamos de probabilidades habrá que pasar los resultados  obtenidos con el Geogebra a tanto por uno dividiendo entre 100.

Mediante una encuesta realizada a jovenes para analizar sus preferencias en juegos  on-line se ha estimado  que el 80% juega al League of Legends (LOL), el 55% juega al World of Warcraft  (WoW) y  el 35% juega a Minecraft (Min), el 45 % juega  al LOL y al WoW, el 30 % juega al LOL y al Min, el 18% juega  al WoW y al Min, y el 15% juega a los tres.

Extrapolando los resultados a la población, si se elige  un joven al azar calcula:

  • ¿Cuál es la probabilidad de que juegue  al menos a dos de estos  juegos on-line?
  • ¿Cuál es la probabilidad de que juegue al menos a uno de estos  juegos on-line?
  • ¿Cuál es la probabilidad de que no juegue a ninguno de estos juegos on-line?

¿Qué porcentaje de jóvenes juega al  LOL pero no al  Minecraft?

¿Qué porcentaje de jóvenes juega al  Minecraft  pero no a al  LOL?

Si quieres ver los geogebras que se van publicando en el blog pincha aquí.

 

Introducción al muestreo y sistemas de medición de audiencias (guión para teoría)

Hoy he estado probando SlideShare con el fin de compartir en el blog parte del material de la asignatura que el alumnado tiene disponible en el Campus Virtual. Aquí os dejo el guión que se utiliza en clase para explicar el tema 2 de la asignatura. Este guión se complementa con la explicación en el aula de la profesora y la realización de ejercicios complementarios así como con el libro on-line de la asignatura. Recordad que un guión  no son unos apuntes.

 

Tipos de variables con educaplay

Aquí os dejo un ejercicio   para comprobar si tenéis claros los distintos tipos de variables. Se ha utilizado la plataforma educaplay. ¿Quieres ver más actividades planteadas con educaplay? Accede aquí.

 

¿Cuántos números de 6 cifras …?

¿Te atreves con el siguiente ejercicio?:

¿Cuántos números no negativos de seis cifras tienen al menos una cifra par?

Ayúdate de la siguiente actividad tipo test para ver si sabes plantear este tipo de problemas.

Hay preguntas de respuesta única y de respuesta múltiple:

 

Unos cuantos ejercicios para practicar el tema 2

INTRODUCCIÓN AL MUESTREO Y SISTEMAS DE MEDICIÓN DE AUDIENCIAS 

Ejercicio 2.1: Clasifica las siguientes variables.

  • Número de visitas a un sitio Web en un periodo de tiempo
  • Tiempo dedicado a jugar con la consola a la semana
  • Vida útil de una batería
  • Sistema operativo preferido
  • Sueldo de las personas mayores de 40 años
  • Comprensión lectora (baja, media o alta)
  • Marca de diferentes ordenadores
  • Número de conexiones a internet en un periodo de tiempo
  • Estado de conservación de diferentes ordenadores (malo, bueno, regular)
  • Velocidad en Hz. de un microprocesador
  • Nivel educativo (primario, secundario, superior)
  • Tiempo de respuesta de un tipo de pantalla LCD
  • La variable sexo codificada con 1 para chicos y 2 para chicas
  • Preferencias musicales
  • Número de dispositivos electrónicos defectuosos en la producción diaria de una empresa

Ejercicio 2.2: Una gran multinacional ha solicitado a su departamento de informática que realice una aplicación que permita gestionar on-line las ventas de sus comerciales. Para hacer las primeras comprobaciones deciden elegir 5 comerciales mediante un muestreo aleatorio. Para ello disponen de un fichero con 750 filas donde en la primera fila aparecen los campos que definen cada uno de los datos tomados a los comerciales (DNI, apellidos, nombre, etc.) seguido del resto de filas con los datos concretos de cada uno de los comerciales.

  • Obtén a través de un muestreo aleatorio simple, la muestra de comerciales requerida, indicando en qué filas aparecerán los datos de los comerciales que van a formar parte de la muestra. Explica los pasos seguidos y qué generador de números aleatorios has utilizado.
  • Obtén a través de un muestreo sistemático, la muestra de comerciales requerida en este caso, indicando en qué filas aparecerán los datos de los comerciales que van a formar parte de la muestra. Explica los pasos seguidos.

Ejercicio 2.3: En una de las líneas de producción de una empresa se producen piezas electrónicas que luego se empaquetan en bolsas que contienen cada una de ellas 500 piezas. Posteriormente las bolsas se introducen en contenedores con capacidad para 50 bolsas. El inspector del control de calidad de la empresa quiere analizar el funcionamiento de dicha línea de producción. Esto es importante para la empresa porque cualquier desviación en las medidas de las piezas producidas supondría grandes pérdidas para la empresa. Explica cuál es el muestreo aleatorio más apropiado para realizar este control de calidad una vez llenados los contenedores y explica qué pasos podría seguir para realizar dicho muestreo si se desea extraer una muestra de 1000 piezas.

Ejercicio 2.4: Una gran multinacional ha solicitado a su departamento de informática que realice una aplicación que permita gestionar on-line las ventas de sus comerciales. Para hacer las primeras comprobaciones deciden elegir una muestra aleatoria de 9 comerciales. Para ello disponen de un fichero con 965 filas en el que en las ocho primeras filas aparece una cabecera, en la novena los campos que definen cada uno de los datos tomados a los comerciales (Zona, DNI, apellidos, nombre, etc.) seguido del resto de filas con los datos concretos de cada uno de los comerciales. Estos datos se han ordenado por Zona (zona A, zona B) y las 340 últimas filas muestran los datos de los comerciales de la zona B. Si se realiza un muestreo estratificado, indica el número de comerciales que debe coger de cada zona. Posteriormente simula un muestreo sistemático en cada zona e índica en qué filas aparecerán los datos de los comerciales que van a formar parte de la muestra.

Ejercicio 2.5: Se sabe que en cierta ciudad hay 1761 hoteles distribuidos de la siguiente forma atendiendo a la categoría: 225 de 5 estrellas, 356 de 4 estrellas, 329 de 3 estrellas, 404 de 2 estrellas y 447 de una estrella. Se desea extraer una muestra aleatoria de tamaño 430 para analizar la política de los hoteles respecto al servicio de acceso a Internet. Explica qué tipo de muestreo es el más apropiado y explica todo el proceso a realizar dando los tamaños muestrales correspondientes.

Ejercicio 2.6: Un centro comercial acaba de recibir dos pedidos de sintonizadores TDT para ponerlos a la venta entre sus clientes, uno de la empresa A y otro de la empresa B. Los sintonizadores de la empresa A vienen numerados con códigos desde el 2324 al 4500 y los de la empresa B del 995 al 3416. El gerente de dicho centro está preocupado por la calidad de dichos sintonizadores y decide obtener una muestra de 7 aparatos y someterlos a varias pruebas. Simula, paso por paso y de forma razonada, un muestreo estratificado para obtener dicha muestra, utilizando en cada uno de los estratos un muestreo aleatorio sistemático. Indica para cada elemento obtenido en la muestra, qué código tiene y de qué empresa es.

Ejercicio 2.7: Se desea conocer la política de las tiendas de informática de una gran ciudad respecto al uso de software pirata. Para ello una cadena de televisión pretende hacer un estudio exhaustivo con cámara oculta en una muestra aleatoria de dichas tiendas. Se dispone de un fichero con todas las tiendas de la ciudad por localización geográfica. Propón de forma razonada un método de muestreo apropiado.

Ejercicio 2.8: Haz una pequeña investigación para ampliar los tipos de muestreo dados en clase y explica en qué consiste y de qué tipo es el muestreo bola de nieve. Explica algunos de los motivos por los que se usa este muestreo y si los resultados obtenidos a través del mismo son extrapolables a la población total. Incluye las referencias utilizadas en el desarrollo de este ejercicio.

Ejercicio 2.9: Haz una pequeña investigación para ampliar la información dada en clase y explica en qué consisten los sistemas de medición de audiencias en Internet mediante análisis de logs y mediante análisis de tags, indicando algunas de las ventajas e inconvenientes de los mismos. Incluye las referencias utilizadas en el desarrollo de este ejercicio.

Ejercicio 2.10: Realiza las siguientes cuestiones.

  • Explica los conceptos de muestreo aleatorio estratificado y muestreo por conglomerado. Indica cuándo debe utilizarse cada uno de ellos y pon ejemplos que ilustren tu explicación.
  • Explica, en el contexto de la estadística, qué es un grupo de interés y qué características debe tener. Pon algún ejemplo que ilustre tu explicación.

Ejercicio 2.11: En un municipio  de 397 personas se desea obtener una muestra de 17 personas mediante muestreo aleatorio sistemático. Describe el proceso y simula dicha muestra sistemática.

Ejercicio 2.12: Una gran empresa ha solicitado a su departamento de informática que realice una aplicación que permita gestionar on-line las ventas en todas sus tiendas. Para hacer las primeras comprobaciones deciden elegir 7 tiendas. Para ello disponen de un fichero con 1520 filas en el que en las 3 primeras filas aparece una cabecera y en la cuarta los campos que definen cada uno de los datos tomados de cada tienda (Dirección postal, Nombre del gerente, etc.). A continuación están el resto de filas con los datos concretos de cada una de las tiendas. Simula de forma razonada un muestreo sistemático e indica en qué filas aparecerán los datos de las tiendas que van a formar parte de la muestra.

Ejercicio 2.13: Explica los siguientes conceptos indicando además en qué contexto aparecen y poniendo un ejemplo ilustrativo en cada caso: Difusión, tirada, rating, share, metodología user centric.

Ejercicio 2.14: Una gran empresa ha solicitado a su departamento de informática que realice una aplicación que permita gestionar on-line las ventas en todas sus tiendas. Para hacer las primeras comprobaciones deciden elegir 4 tiendas. Para ello disponen de un fichero con 1230 filas en el que en las seis primeras filas aparece una cabecera y en la séptima los campos que definen cada uno de los datos tomados de cada tienda (Dirección postal, nombre del gerente, etc.). A continuación están el resto de filas con los datos concretos de cada una de las tiendas. Simula de forma razonada un muestreo aleatorio simple e indica en qué filas aparecerán los datos de las tiendas que van a formar parte de la muestra.

Ejercicio 2.15: Un centro comercial acaba de recibir un pedido de sintonizadores TDT para ponerlos a la venta entre sus clientes. Dichos sintonizadores vienen numerados con códigos desde el 3456 al 4795. El gerente de dicho centro está preocupado por la calidad de dichos sintonizadores y decide obtener una muestra sistemática de 6 aparatos y someterlos a varias pruebas. Ayúdale a obtener la muestra.

Ejercicio 2.16: Una compañía de alquiler de automóviles desea estimar el kilometraje promedio de su flota. Cuenta con 10000 automóviles. De estos, 2000 son automóviles grandes, 3500 medianos, 2000 pequeños y 2500 compactos. Después de analizar los errores potenciales involucrados en el muestreo, la compañía decidió que el tamaño de la muestra fuera de 1200. También decidió hacer una estratificación según los tamaños de los automóviles. Explica cuántos automóviles se deben muestrear en cada categoría.

Ejercicio 2.17: Una gran compañía ha hecho una compra de 31800 ordenadores portátiles, para sus trabajadores, a dos empresas (A y B). De la empresa A compró 12300 portátiles y de la empresa B compró el resto. El director de la compañía desea realizar un control de calidad sobre 300 de esos portátiles. Explica qué tipo de muestreo es el más apropiado y explica todo el proceso a realizar dando los tamaños muestrales correspondientes.

Ejercicio 2.18: Explica en qué consiste la recogida de datos por registros. Indica algún ejemplo que ilustre tu explicación.

Ejercicio 2.19: Explica en qué consiste la recogida de datos por observación. Indica varios ejemplos que ilustre tu explicación.

Ejercicio 2.20: Explica, según lo tratado en teoría, las posibles ventajas de estudiar una población a partir de muestras. Da además para cada una de dichas ventajas un ejemplo explicativo.

Ejercicio 2.21: Comprueba que tienes claros algunos conceptos básicos del tema con el siguiente juego y anota tu puntuación: https://blogs.ua.es/violeta/2011/11/02/sencillo-videojuego-estadisticaim-introduccion-al-muestreo/

Necesitas ayuda con las distribuciones, pues hazle volar

Siéntete de nuevo en tu infancia y haz volar lo más lejos posible al profe (que no a la profe) y las veces que quieras con Fling the teacher, un minijuego infantil. Siempre que contestes bien a las preguntas correspondientes del juego,  claro. Son preguntas relacionadas con la práctica del tema 5 que también te pueden ayudar a realizarla o comprobar que vas por el buen camino.

Pincha aquí si prefieres jugar en pantalla ampliada y si lo que quieres es ver más juegos del blog accede aquí.

Dos ejercicios sobre distribuciones con Hot Potatoes

Los siguientes dos ejercicios te pueden ayudar a plantear y resolver problemas sobre distribuciones en los que se tengan que combinar varias distribuciones, discretas y/o continuas, para llegar al resultado (son ejercicios  del mismo tipo que   el  5.7 y 5.8 de la práctica del tema):

Si quieres ver más actividades del blog planteadas con  Hot Potatoes puedes acceder desde  aquí.

Enunciados de ejercicios relacionados con las distribuciones continuas

Ejercicio 1. Sea X una variable aleatoria continua tal que:

f(x)=1/x2, x>1

f(x)=0, en el resto

Comprueba que f cumple las propiedades para ser una función de densidad. Calcula la   función de distribución de X. Obtén k tal que F(k)=1/2.

Ejercicio 2. Sea X una variable aleatoria continua cuya función de densidad es

f(x)=x, 0≤x≤1

f(x)=2-x, 1<x≤2

f(x)=0, en el resto

Calcula su  función de distribución.

Ejercicio 3. Calcula el valor de k para que la siguiente función sea la función de densidad de una variable aleatoria continua X.

f(x)=k(1-x)2, 0<x<1

f(x)=0, en el resto

Una vez obtenido k, calcula la función de distribución de X.

Ejercicio 4. Sea X una variable aleatoria continua cuya función de densidad es

f(x)=1/3, 0<x<3

f(x)=0, en el resto

Calcula E(X) y Var(X).

Ejercicio 5. Calcula el valor de k para que la siguiente función sea la función de densidad de una variable aleatoria continua X.

f(x)=ke-x/2, x>0

f(x)=0, en el resto

Ejercicio 6. Sea X una variable aleatoria continua cuya función de densidad es

f(x)=1-|x|, |x|<1

f(x)=0, en el resto

Calcula su  función de distribución.

Ejercicio 7. Calcula el valor de k para que la siguiente función sea la función de densidad de una variable aleatoria continua X.

f(x)=kx2, -3<x<6

f(x)=0, en el resto

Una vez obtenido k, calcula P(X>2), sin calcular previamente la función de distribución.

Ejercicio 8. Calcula el valor de k para que la siguiente función sea la función de densidad de una variable aleatoria continua X.

f(x)=kx(1-x), 0<x<1

f(x)=0, en el resto

Una vez obtenido k, calcula P(X>0.5), sin calcular previamente la función de distribución.

Ejercicio 9. Sea X una variable aleatoria continua cuya función de densidad es

f(x)=2/3, 0<x<1

f(x)=1/3, 1≤x<2

f(x)=0, en el resto

Calcula E(X) y Var(X).

Ejercicio 10. Calcula el valor de k para que la siguiente función sea la función de densidad de una variable aleatoria continua X.

f(x)=k(1-x), 0≤x≤1

f(x)=0, en el resto

Una vez obtenido k, obtén la función de distribución. Calcula P(X<1/2), P(X>0.8) y  P(X>1/4| X<1/2). Calcula E(X) y Var(X).