Estadística + Ingeniería Multimedia

Blog sobre la asignatura Estadística de Ingeniería Multimedia

Estadística + Ingeniería Multimedia - Blog sobre la asignatura  Estadística de Ingeniería Multimedia

Calculadora de análisis combinatorio

En el tema 4 usamos el análisis combinatorio para resolver  ejercicios algo más complejos sobre  probabilidades. Así que os dejo aquí esta sencilla calculadora  combinatoria on-line que os puede ser de utilidad.

calculadoracombinatoria

Puedes practicar con ella resolviendo estos sencillos ejercicios antes de pasar a problemas más complicados.

  • ¿Cuántas cadenas de 8 bits se pueden formar? (Sol.: 256)
  • Un alfabeto consta de 5 vocales y 21 consonantes ¿Cuántas claves de 5 letras distintas de dicho alfabeto pueden formarse? (Sol.: 7893600)
  • ¿Cuántas números de cuatro cifras se pueden formar? (Sol: 9000)
  • ¿Cuántos números de cuatro cifras distintas se pueden formar? (Sol.:4536)
  • ¿Cuántos números de cuatro cifras distintas se pueden formar, si el último debe ser cero? (Sol.: 504)
  • ¿Cuántas muestras aleatorias simples de tamaño 10 pueden extraerse de una población de tamaño 50? (Sol.: 10272278170)
  • ¿Cuántas cadenas de 12 bits tienen 8 unos y 4 ceros? (Sol: 495)
  • Una tienda de informática tiene 7 marcas diferentes de ordenadores. Calcula el número de formas posibles de seleccionar 10 ordenadores atendiendo sólo a la marca. (Sol.: 8008)
  • ¿Cuántas palabras con o sin sentido pueden formarse con todas las letras de la palabra MULTIMEDIA? (Sol.: 907200)

Teorema de Bayes y probabilidad total con Geogebra

El siguiente Geogebra está pensado para intentar que el alumnado de Estadística de Ingeniería Multimedia, entienda los teoremas de Bayes y probabilidad total a la hora de explicarlos en clase, utilizando el caso particular de una partición del espacio muestral en dos sucesos. Pincha en la imagen para acceder a él.

 

Una vez que hayas visto cómo funciona el geogebra, te propongo que lo utilices para resolver los siguientes ejercicios. Pero no olvides hacerlos antes a mano, definiendo los distintos sucesos e indicando las distintas probabilidades  que se nos dan en el problema y las que nos piden que calculemos.

Ejercicio 1: En dos plantas, A1 y A2 se fabrican el total de los componentes electrónicos de una empresa. Concretamente en la planta A2 se fabrica el triple de componentes  que en la planta A1.  Los porcentajes de producción defectuosa de estas plantas son, respectivamente, el 5 % y el 2 %.

(1) Si se selecciona un componente al azar cuál es la probabilidad de que sea defectuoso.

(2) Si se selecciona un componente al azar y resulta ser defectuoso, calcula  la probabilidad de que se haya producido en la planta A1.

(3) Si se selecciona un componente al azar y resulta ser correcto, calcula  la probabilidad de que se haya producido en la planta A1.

Ejercicio 2: Una empresa dispone de un software para analizar el buen funcionamiento de los videojuegos que vende. Se sabe que la  probabilidad  de que dicho software indique que el videojuego está defectuoso cuando efectivamente lo está, es 0.97 y la probabilidad de que el programa indique que el videojuego funciona correctamente cuando efectivamente su funcionamiento es correcto es 0.90. Sabiendo que el 2% de los videojuegos que vende no funcionan correctamente y son devueltos, calcula la probabilidad de que un videojuego  funcione correctamente habiendo el programa indicado que estaba defectuoso.

Comprueba tus resultados (solución final de algunos ejercicios del tema 7)

Os adjunto aquí la solución final de algunos ejercicios de la práctica del  tema 7 (con algunos resultados intermedios, que os pueden variar algo atendiendo a  errores de redondeo) para que podáis comprobar vuestros resultados.

Ejercicio 7.1: Zo=-3.3333, P-valor=0.000429. Se rechaza Ho, lo que implica que las sospechas del control de calidad son ciertas y la duración de este modelo de batería ha bajado. Véase el dragón de la guarida.

Ejercicio 7.2: to=-4.832846, P-valor=0.000004. Rechazamos Ho, lo que implica que el promedio de horas de televisión por hogar al día en esa zona no es igual al de todo el territorio.

Ejercicio 7.3: to=-4.035, P-valor=0.0018. Rechazamos la hipótesis nula por lo que podemos afirmar que el nuevo método tiene menor tasa media de error.

Ejercicio 7.4: Zo=-111.803399. P-valor=0. Rechazamos Ho, lo que implica que  los datos obtenidos con el uso de la Wii mejoran los datos estimados previamente.

Ejercicio 7.5: Zo=2.357023. P-valor=0.009211. Rechazamos Ho y por  tanto los datos obtenidos con el sistema experto necesita un reajuste ya que la cifra de ingresos hospitalarios que propone está  por encima de lo indicado por el servicio médico. Véase hundir la flota.

Ejercicio 7.6: to=-2.335. P-valor=0.0224. Rechazamos Ho y por tanto el nuevo algoritmo B es mejor ya que tiene mayor tasa media de acierto, por lo que se debería utilizar el algoritmo B para la detección de obstáculos en la aplicación para la automatización de vehículos.

Ejercicio 7.7: to=-3.100578. P-valor=0.001028. Rechazamos Ho y por tanto es más lenta la nueva red de tipo Wireless como indicó el técnico.

Ejercicio 7.8: Zo=-9.361468. P-valor=0. Rechazamos Ho y por lo tanto se puede dar por cierta la afirmación del periódico.

Ejercicio 7.9: Zo=2.947145. Realizando un contraste bilateral obtenemos P-valor=0.003207. Rechazamos Ho y por tanto la proporción de tarjetas defectuosos de los modelos A y B son distintas. Para saber en  cuál  de los modelos se obtiene más proporción de defectuosos realizaríamos los correspondientes contrastes unilaterales y obtendremos que debería quedarse con las tarjetas de red del modelo B.

Ejercicio 7.10: Zo=-19.814848. P-valor=0. Rechazamos Ho y por tanto se puede dar por cierta la afirmación de que la tasa de rebote del sitio web ha disminuido después de dicho asesoramiento técnico.

Análisis inferencial de datos categóricos (guiones de teoría y práctica)

El tema de Análisis inferencial de datos categóricos se imparte tanto en las clases de teoría como en las de prácticas.  El alumnado dispone en el Campus Virtual de  un guión de teoría, unas diapositivas para la parte práctica del laboratorio  y el correspondiente tema on-line de la asignatura para su consulta a la hora de hacer la práctica propuesta. Aquí os dejo el guión que se utiliza en clase de teoría  para explicar el tema 8.

Recordad que un guión  no son unos apuntes.

Si quieres consultar  las diapositivas  prácticas, puedes acceder aquí para ver el vídeo. Y si deseas ver más entradas del blog sobre este tema puedes hacerlo desde aquí.

 

Intervalos de confianza para una proporción (comprueba tus resultados)

Aquí os incluyo una sencilla calculadora realizada con Excel Web App que os permitirá comprobar vuestros  resultados en los ejercicios sobre intervalos de confianza para una proporción. Es una versión simplificada de mi hoja de cálculo ya que Excel Web App no tiene ciertas funcionalidades como la validación de datos y la protección de algunas celdas … Si trabajas con ella y quieres volver a tener la hoja como al principio sólo tienes que recargar la página. Por defecto aparece la solución de los intervalos de confianza  correspondientes a los ejercicios 6.8 y 6.6 (en ese orden) propuestos en la práctica del curso 2012-2013 sobre el  tema 6. Accede a ella pinchando en la imagen o en el siguiente enlace:

Intervalos de confianza para una proporción

Os dejo aquí también los enunciados de dichos ejercicios y la solución final:

Ejercicio 6.6 Un centro de investigación ha diseñado un programa de fisioterapia con la Wii, para que los pacientes de rehabilitación puedan hacer los ejercicios en casa.  El centro desea saber si con el uso de dicho programa el tiempo de recuperación es menor. Para ello utilizaron el programa sobre 2350 pacientes y se obtuvo que 650 pacientes necesitaron más de dos semanas de rehabilitación. Los datos estimados hasta el momento sobre este tipo de rehabilitaciones indicaban que en el 40 por ciento de los casos la rehabilitación era superior a dos semanas. Calculando un intervalo de confianza al 95 por ciento explica si  los datos obtenidos con el uso de la Wii mejoran  los datos estimados previamente.

Solución: Sea p=proporción de gente que necesita más de dos semanas de rehabilitación con la Wii.

Aplicando la fórmula para muestras grandes se obtiene:

Ip95%=[0.2585, 0.2947]

Con una confianza del 95% podemos decir que los datos obtenidos con la Wii mejoran los datos estimados previamente ya que los datos estimados previamente indicaban que el 40% necesitaban más de 2 semanas de rehabilitación mientras que con la Wii el porcentaje de gente que necesitaría más  de dos semanas para la rehabilitación estaría entre el 25.85% y el 29.47%, mucho inferior al 40%.

Ejercicio 6.8 Una empresa de desarrollo de videojuegos desea conocer  la aceptación que está teniendo un videojuego que acaba de lanzar al mercado. Se ofrece a un grupo de 20 personas elegidas aleatoriamente que jueguen con él durante un mes y se les pide que indiquen si les ha gustado. A 15 de dichas personas les ha gustado y al resto no. Obtén un intervalo de confianza al 96.8 por ciento para el porcentaje de gente que le ha gustado el videojuego. A la vista de los resultados qué conclusiones se pueden sacar. ¿Le harías alguna recomendación a la empresa sobre la forma de hacer este estudio?

Solución: Sea p=proporción de gente que le gusta el videojuego y P=porcentaje de gente que le gusta el videojuego.

Entonces aplicando la fórmula para muestras pequeñas se obtiene Ip96.8%=[0.125,1] y por tanto IP96.8%=[12,5%,100%].

Recomendación para la empresa: Este intervalo es muy pobre (con una confianza del 96.8% sabemos que el porcentaje de gente a la que le gusta el videojuego está  entre 12.5% y 100%) y no da información relevante a la empresa, así que habría que utilizar una muestra grande y aplicar la fórmula correspondiente.

Contrastes de hipótesis (guiones de teoría y práctica)

El tema de Contrastes de hipótesis para parámetros poblacionales se imparte tanto en las clases de teoría como en las de prácticas.  El alumnado dispone en el Campus Virtual de  un guión de teoría, unas diapositivas para la parte práctica del laboratorio  y el correspondiente tema on-line de la asignatura para su consulta a la hora de hacer la práctica propuesta. Aquí os dejo el guión que se utiliza en clase de teoría  para explicar el tema 7.

Recordad que un guión  no son unos apuntes.

Si quieres consultar  las diapositivas  prácticas, puedes acceder aquí para ver el vídeo. Y si deseas ver más entradas del blog sobre este tema puedes hacerlo desde aquí.

 

Estimación de parámetros poblacionales (guiones de teoría y prácticas)

El tema de Estimación de parámetros poblacionales (intervalos de confianza) se imparte tanto en las clases de teoría como en las de prácticas.  El alumnado dispone en el Campus Virtual de  un guión de teoría, unas diapositivas para la parte práctica del laboratorio  y el correspondiente tema on-line de la asignatura para su consulta a la hora de hacer la práctica propuesta. Aquí os dejo el guión que se utiliza en clase de teoría  para explicar el tema 6.

Recordad que un guión  no son unos apuntes.

Si quieres consultar  las diapositivas  prácticas, puedes acceder aquí para ver el vídeo. Y si deseas ver más entradas del blog sobre este tema puedes hacerlo desde aquí.

 

Modelos de distribución discretos y continuos (guiones de teoría y práctica)

El tema de Modelos de distribución discretos y continuos  se imparte tanto en las clases de teoría como en las de prácticas.  El alumnado dispone en el Campus Virtual de  un guión de teoría, unas diapositivas para la parte práctica del laboratorio  y el correspondiente tema on-line de la asignatura para su consulta a la hora de hacer la práctica propuesta. Aquí os dejo el guión que se utiliza en clase de teoría  para explicar el tema 5.

Recordad que un guión  no son unos apuntes.

 

Si quieres consultar  las diapositivas  prácticas, puedes acceder aquí para ver el vídeo. Y si deseas ver más entradas del blog sobre este tema puedes hacerlo desde aquí.

 

Una aplicación on-line sobre probabilidad total

Con el fin de ayudar a entender cómo aplicar el teorema de la probabilidad total, os dejo una de las aplicaciones on-line  realizadas  en la asignatura de Ingeniería Multimedia. Forma parte del  trabajo realizado el curso pasado en la asignatura por Fernando Meneses (estudiante de  Ingeniería Multimedia). Pincha en la imagen de la entrada o en el siguiente  enlace  si quieres acceder a ella:

Aplicación sobre el teorema de la probabilidad total

 

Una aplicación on-line sobre muestreo sistemático

Con el fin de ayudar a entender los pasos de los problemas propuestos sobre muestreos sistemáticos, os dejo una aplicación on-line para que se pueda simular dicho muestreo paso por paso tal y como lo planteamos al hacer los problemas a mano.  Si quieres ver todas las aplicaciones on-line publicadas hasta el momento puedes hacerlo desde aquí.

El diseño de la página ha sido realizado por Fernando Meneses, estudiante de Ingeniería Multimedia que ha participado también en la realización de alguna  de dichas aplicaciones y que amablemente me ha permitido usar dicho diseño para publicarlas. Pincha en la imagen de la entrada o en el siguiente  enlace  si quieres acceder a ella:

Aplicación sobre muestreo sistemático

Estadística descriptiva (guión de teoría)

El tema se estadística descriptiva se da totalmente en el laboratorio de prácticas de forma interactiva usando, entre otros recurso estadísticos,  el SPSS. El alumnado dispone de  un guión de teoría, unas diapositivas para la parte práctica con el SPSS  y el correspondiente tema on-line de la asignatura para su consulta a la hora de hacer la práctica propuesta. Aquí os dejo el guión que se utiliza en clase de prácticas  para explicar la parte teórica  del tema 3 de la asignatura.

Recordad que un guión  no son unos apuntes.

Y si lo que quieres consultar son las diapositivas  prácticas accede aquí para ver el vídeo.

Diagramas de Venn para el cálculo de probabilidades con Geogebra

Con ayuda de los diagramas de Venn podemos dar los primeros pasos para la comprensión del cálculo de probabilidades de distintos  sucesos de un espacio muestral. El siguiente geogebra se ha realizado con dicho propósito. En él trabajaremos en términos de porcentajes y en caso de querer calcular probabilidades sólo habrá que dividir entre cien los resultados obtenidos. Para trabajar estos conceptos se puede proponer un ejercicio similar al siguiente.

En una ciudad se publican 3 revistas sobre tecnología y videojuegos A, B y C. Mediante una encuesta se estima que el 30% lee la revista A el 20% la revista  B, el 15% lee la C, el 10% lee A y B, el 6% lee A y C, el 5% lee B y C, y el 3% lee las tres revistas.

  • ¿Qué porcentaje lee al menos dos revistas?
  • ¿Qué porcentaje lee solo una revista?
  •  ¿Qué porcentaje no lee ninguna revista?
  • ¿Qué porcentaje lee A pero no B?

En primer lugar introduciremos los datos que nos dan en el ejercicio tal y como aparece en el Geogebra al que puedes acceder pinchando en la imagen y obtendremos interactivamente los distintos valores del diagrama de Venn:

 Una vez se tienen los datos en el diagrama de Venn y se entiende su significado será muy fácil contestar las preguntas propuestas:

a) ¿Qué porcentaje lee al menos dos revistas? 7+3+3+2=15%

b) ¿Qué porcentaje lee solo una revista? 17+8+7=32%

c) ¿Qué porcentaje no lee ninguna revista? 53%

d) ¿Qué porcentaje lee A pero no B? 17+3=20%

Con ayuda de dicho geogebra puedes  realizar ejercicios similares al anterior. Os  propongo aquí uno para practicar, recuerda que cuando hablamos de probabilidades habrá que pasar los resultados  obtenidos con el Geogebra a tanto por uno dividiendo entre 100.

Mediante una encuesta realizada a jovenes para analizar sus preferencias en juegos  on-line se ha estimado  que el 80% juega al League of Legends (LOL), el 55% juega al World of Warcraft  (WoW) y  el 35% juega a Minecraft (Min), el 45 % juega  al LOL y al WoW, el 30 % juega al LOL y al Min, el 18% juega  al WoW y al Min, y el 15% juega a los tres.

Extrapolando los resultados a la población, si se elige  un joven al azar calcula:

  • ¿Cuál es la probabilidad de que juegue  al menos a dos de estos  juegos on-line?
  • ¿Cuál es la probabilidad de que juegue al menos a uno de estos  juegos on-line?
  • ¿Cuál es la probabilidad de que no juegue a ninguno de estos juegos on-line?

¿Qué porcentaje de jóvenes juega al  LOL pero no al  Minecraft?

¿Qué porcentaje de jóvenes juega al  Minecraft  pero no a al  LOL?

Si quieres ver los geogebras que se van publicando en el blog pincha aquí.