Estadística + Ingeniería Multimedia

Blog sobre la asignatura Estadística de Ingeniería Multimedia

Estadística + Ingeniería Multimedia - Blog sobre la asignatura  Estadística de Ingeniería Multimedia

Calculadora de análisis combinatorio

En el tema 4 usamos el análisis combinatorio para resolver  ejercicios algo más complejos sobre  probabilidades. Así que os dejo aquí esta sencilla calculadora  combinatoria on-line que os puede ser de utilidad.

calculadoracombinatoria

Puedes practicar con ella resolviendo estos sencillos ejercicios antes de pasar a problemas más complicados.

  • ¿Cuántas cadenas de 8 bits se pueden formar? (Sol.: 256)
  • Un alfabeto consta de 5 vocales y 21 consonantes ¿Cuántas claves de 5 letras distintas de dicho alfabeto pueden formarse? (Sol.: 7893600)
  • ¿Cuántas números de cuatro cifras se pueden formar? (Sol: 9000)
  • ¿Cuántos números de cuatro cifras distintas se pueden formar? (Sol.:4536)
  • ¿Cuántos números de cuatro cifras distintas se pueden formar, si el último debe ser cero? (Sol.: 504)
  • ¿Cuántas muestras aleatorias simples de tamaño 10 pueden extraerse de una población de tamaño 50? (Sol.: 10272278170)
  • ¿Cuántas cadenas de 12 bits tienen 8 unos y 4 ceros? (Sol: 495)
  • Una tienda de informática tiene 7 marcas diferentes de ordenadores. Calcula el número de formas posibles de seleccionar 10 ordenadores atendiendo sólo a la marca. (Sol.: 8008)
  • ¿Cuántas palabras con o sin sentido pueden formarse con todas las letras de la palabra MULTIMEDIA? (Sol.: 907200)

Teorema de Bayes y probabilidad total con Geogebra

El siguiente Geogebra está pensado para intentar que el alumnado de Estadística de Ingeniería Multimedia, entienda los teoremas de Bayes y probabilidad total a la hora de explicarlos en clase, utilizando el caso particular de una partición del espacio muestral en dos sucesos. Pincha en la imagen para acceder a él.

 

Una vez que hayas visto cómo funciona el geogebra, te propongo que lo utilices para resolver los siguientes ejercicios. Pero no olvides hacerlos antes a mano, definiendo los distintos sucesos e indicando las distintas probabilidades  que se nos dan en el problema y las que nos piden que calculemos.

Ejercicio 1: En dos plantas, A1 y A2 se fabrican el total de los componentes electrónicos de una empresa. Concretamente en la planta A2 se fabrica el triple de componentes  que en la planta A1.  Los porcentajes de producción defectuosa de estas plantas son, respectivamente, el 5 % y el 2 %.

(1) Si se selecciona un componente al azar cuál es la probabilidad de que sea defectuoso.

(2) Si se selecciona un componente al azar y resulta ser defectuoso, calcula  la probabilidad de que se haya producido en la planta A1.

(3) Si se selecciona un componente al azar y resulta ser correcto, calcula  la probabilidad de que se haya producido en la planta A1.

Ejercicio 2: Una empresa dispone de un software para analizar el buen funcionamiento de los videojuegos que vende. Se sabe que la  probabilidad  de que dicho software indique que el videojuego está defectuoso cuando efectivamente lo está, es 0.97 y la probabilidad de que el programa indique que el videojuego funciona correctamente cuando efectivamente su funcionamiento es correcto es 0.90. Sabiendo que el 2% de los videojuegos que vende no funcionan correctamente y son devueltos, calcula la probabilidad de que un videojuego  funcione correctamente habiendo el programa indicado que estaba defectuoso.

Una aplicación on-line sobre probabilidad total

Con el fin de ayudar a entender cómo aplicar el teorema de la probabilidad total, os dejo una de las aplicaciones on-line  realizadas  en la asignatura de Ingeniería Multimedia. Forma parte del  trabajo realizado el curso pasado en la asignatura por Fernando Meneses (estudiante de  Ingeniería Multimedia). Pincha en la imagen de la entrada o en el siguiente  enlace  si quieres acceder a ella:

Aplicación sobre el teorema de la probabilidad total

 

Diagramas de Venn para el cálculo de probabilidades con Geogebra

Con ayuda de los diagramas de Venn podemos dar los primeros pasos para la comprensión del cálculo de probabilidades de distintos  sucesos de un espacio muestral. El siguiente geogebra se ha realizado con dicho propósito. En él trabajaremos en términos de porcentajes y en caso de querer calcular probabilidades sólo habrá que dividir entre cien los resultados obtenidos. Para trabajar estos conceptos se puede proponer un ejercicio similar al siguiente.

En una ciudad se publican 3 revistas sobre tecnología y videojuegos A, B y C. Mediante una encuesta se estima que el 30% lee la revista A el 20% la revista  B, el 15% lee la C, el 10% lee A y B, el 6% lee A y C, el 5% lee B y C, y el 3% lee las tres revistas.

  • ¿Qué porcentaje lee al menos dos revistas?
  • ¿Qué porcentaje lee solo una revista?
  •  ¿Qué porcentaje no lee ninguna revista?
  • ¿Qué porcentaje lee A pero no B?

En primer lugar introduciremos los datos que nos dan en el ejercicio tal y como aparece en el Geogebra al que puedes acceder pinchando en la imagen y obtendremos interactivamente los distintos valores del diagrama de Venn:

 Una vez se tienen los datos en el diagrama de Venn y se entiende su significado será muy fácil contestar las preguntas propuestas:

a) ¿Qué porcentaje lee al menos dos revistas? 7+3+3+2=15%

b) ¿Qué porcentaje lee solo una revista? 17+8+7=32%

c) ¿Qué porcentaje no lee ninguna revista? 53%

d) ¿Qué porcentaje lee A pero no B? 17+3=20%

Con ayuda de dicho geogebra puedes  realizar ejercicios similares al anterior. Os  propongo aquí uno para practicar, recuerda que cuando hablamos de probabilidades habrá que pasar los resultados  obtenidos con el Geogebra a tanto por uno dividiendo entre 100.

Mediante una encuesta realizada a jovenes para analizar sus preferencias en juegos  on-line se ha estimado  que el 80% juega al League of Legends (LOL), el 55% juega al World of Warcraft  (WoW) y  el 35% juega a Minecraft (Min), el 45 % juega  al LOL y al WoW, el 30 % juega al LOL y al Min, el 18% juega  al WoW y al Min, y el 15% juega a los tres.

Extrapolando los resultados a la población, si se elige  un joven al azar calcula:

  • ¿Cuál es la probabilidad de que juegue  al menos a dos de estos  juegos on-line?
  • ¿Cuál es la probabilidad de que juegue al menos a uno de estos  juegos on-line?
  • ¿Cuál es la probabilidad de que no juegue a ninguno de estos juegos on-line?

¿Qué porcentaje de jóvenes juega al  LOL pero no al  Minecraft?

¿Qué porcentaje de jóvenes juega al  Minecraft  pero no a al  LOL?

Si quieres ver los geogebras que se van publicando en el blog pincha aquí.

 

¿Cuántos números de 6 cifras …?

¿Te atreves con el siguiente ejercicio?:

¿Cuántos números no negativos de seis cifras tienen al menos una cifra par?

Ayúdate de la siguiente actividad tipo test para ver si sabes plantear este tipo de problemas.

Hay preguntas de respuesta única y de respuesta múltiple:

 

¿Qué es Stat Trek?

Stat Trek es un  sitio web que proporciona herramientas on-line para ayudar a resolver problemas de  estadística.  Está bastante bien y ayuda a entender los conceptos. En esta asignatura lo utilizaremos especialmente en el tema de probabilidad y análisis combinatorio, pero puede servir para el cálculo de probabilidades en  el tema de modelos de distribuciones discretos y continuos o incluso para simular muestreos aleatorios.

 

La importancia de transmitir y analizar bien los datos estadísticos, un ejemplo sobre política

Estos últimos días he leído estas dos afirmaciones  en distintos medios de comunicación y blogs atribuidas al ministro de Educación Wert. No he podido contrastar qué dijo exactamente ya que no he encontrado el vídeo con las palabras exactas pero todo parece apuntar  que fue la segunda. Lo que sí he constatado es que el ministro suele basarse mucho en datos estadísticos para justificar reformas, comisiones de expertos y recortes. Pero hay que tener cuidado a la hora de transmitir datos estadísticos  ya que si el análisis previo  no es exhaustivo  la información que nos llega puede llenar titulares y darnos a entender a la sociedad cosas (en este caso ha sido sobre el sistema universitario) que realmente no son las que concluyen los datos estadísticos.

Las afirmaciones leídas  son:

(1)        Hay un 21% de desempleo entre los universitarios de 25 a 29 años.

(2)        Entre los parados de 25 a 29 años, el 21% son universitarios.

Muchas personas tienden a pensar que se está diciendo lo mismo en ambos casos pero ni mucho menos. Veámoslo:

(1)        Si se indica que hay un 21% de desempleo entre los universitarios de 25 a 29 años nos están diciendo que el porcentaje de parados en el conjunto de los universitarios entre 25 y 29 años es del 21%.

Vamos a plantearlo en forma de probabilidades condicionadas tal y como vimos en las clases de estadística:

P(estar parado| ser universitario entre 25 y 29 años)=0.21.

Si esto fuera cierto, es un dato muy  alarmante pero en un análisis estadístico serio que permitiera analizar realmente la situación se deberían haber incluido datos adicionales tales como el porcentaje de parados en  el conjunto de personas  no universitarias de 25 a 29 años o el porcentaje de parados en el conjunto de jóvenes en general de 25 a 29 años.

Estos porcentajes tratados como probabilidades (tanto por uno) corresponderían   con calcular las siguientes probabilidades condicionadas, respectivamente:

P(estar parado| no ser universitario y tener entre 25 y 29 años)

P(estar parado| tener entre 25 y 29 años)

Estas probabilidades no se pueden obtener del dato inicial (21%) ya que los conjuntos de referencia para los que se calcula la cantidad de parados son diferentes en cada uno de los tres casos.

Ya puestos, si se quiere hacer un estudio estadístico serio, se podrían realizar contrastes de hipótesis sobre proporciones y análisis ji-cuadrado para obtener unas primeras aproximaciones para el  total de la población que permitiera analizar el panorama actual de forma más fiable. No olvidemos que la mayoría de estas estimaciones estadísticas se obtienen a partir de muestras aleatorias, es decir con subconjuntos aleatorios de la población y no con toda la población. La inferencia estadística es la que permite extraer conclusiones para la población a partir de los datos muestrales.

(2)        En el segundo caso se dice: entre los parados de 25 a 29 años, el 21%  son universitarios.  La comprensión de esta afirmación es sencilla: concretamente nos están diciendo  que la población parada entre 25 y 29 años está distribuida de la siguiente forma: un 21% son universitarios y por tanto un 79% son no universitarios.  Si lo tratamos en términos de probabilidades diríamos:

P(ser universitario| ser parado con edad entre 25 y 29 años)=0.21.

Y como la probabilidad de un suceso es igual a uno menos la de su complementario obtenemos:

P(no ser universitario| ser parado con edad entre 25 y 29 años)=1-P( ser universitario| ser parado con edad entre 25 y 29 años)=1-0.21=0.79

Aunque a priori parezca dar mucha información, no es así,  y no son las probabilidades condicionadas más útiles para estudiar el problema del paro que nos ocupa. Para intentar analizar estadísticamente dicha afirmación deberíamos además  saber al menos qué porcentaje de universitarios y no universitarios hay en el conjunto de todos los jóvenes de 25 a 29 años y qué porcentaje de universitarios y no universitarios hay en el conjunto de todos los jóvenes de  25 a 29 años no parados.

En Facebook he compartido también un enlace a un artículo de José Antonio Pérez y Juan Hernández en el que los autores  muestran cómo el planteamiento que hace  Wert para justificar la reforma universitaria tiene datos estadísticos tratados  erróneamente.

No lo olvidéis, para hablar de estadística se ha de hacer con rigurosidad, no sirve con utilizar sólo aquellos datos estadísticos que van a ser favorables o convenientes  a unos propósitos  obviando otros que realmente permitirían radiografiar de forma más completa y real el sistema universitario español.

Otra actividad sobre teorema de Bayes y probabilidad total

Esta actividad corresponde con uno de los ejercicios propuestos en las actividades voluntarias del curso 2011-2012. Cayó también en un control del curso anterior.

  Pincha en la imagen  de la entrada si deseas realizar la actividad desde la web de educaplay.

 

 

 

¿Sabes resolver los ejercicios de análisis combinatorio de las actividades del tema 4? Compruébalo con la siguiente actividad

Con la realización de las siguientes actividades podréis analizar si sabéis resolver   ejercicios sencillos de análisis combinatorio.

 

Pincha en la imagen  de la entrada si deseas realizar la actividad desde la web de educaplay o  imprimir los enunciados de los ejercicios.

 

El juego de serpientes y escaleras de Estadística+IM para repasar los temas 2 y 4

Con el  siguiente juego Snakes & Ladders (serpientes y escaleras)   podréis  profundizar en  parte de los conceptos tratados en los temas 2 (Introducción al muestreo y sistemas de medición de audiencias) y 4 (Cálculo de probabilidades y análisis combinatorio). Este juego ha sido adaptado a la asignatura a partir de  la plantilla Javascript de Birgit Ferran y permite entre 1 y 4 jugadores.

 

Conceptos básicos de probabilidad y análisis combinatorio para Estadística+IM con Teacher Invaders

Comprueba que tienes claros los conceptos básicos de probabilidad y análisis combinatorio jugando al mismo tiempo a Teacher Invaders.

Pincha aquí si prefieres jugar en pantalla ampliada.

 

Soluciones de las actividades propuestas en el libro on line sobre probabilidad y análisis combinatorio

Se adjuntan aquí las soluciones de las actividades propuestas en el tema 4 del libro on line disponible en las sesiones del Campus Virtual (véase sesión 4 del Campus Virtual).

Ejercicio 4.1. 81.000.000.000

Ejercicio 4.2. 2.432.902.008.176.640.000

Ejercicio 4.3. 5.755.750

Ejercicio 4.4. 8.618.400

Ejercicio 4.5. 56, 0,21875, 1/2

Ejercicio 4.6. 0,03125, 0,65

Ejercicio 4.7. 0,22131148, 0,005, 0,005694761

Ejercicio 4.8. 0,52795031

Ejercicio 4.9. 0,000976563

Ejercicio 4.10. 0,4

El problema de Monty Hall

El Problema de Monty Hall es un problema de probabilidad que está inspirado por el concurso televisivo estadounidense Let’s Make a Deal. Su nombre proviene del nombre del presentador, Monty Hall. El enunciado del problema puede verse en el siguiente vídeo.

Trataremos los conceptos relacionados con este problema  en el tema 4 pero, mientras tanto qué pensáis, ¿Está el protagonista en lo cierto?