Una aplicación para el cálculo de probabilidades para distribuciones discretas y continuas.

Ahora no tienes excusa. Con la siguientes applets de estadística es bastante fácil entender el cálculo de probabilidades en distribuciones discretas: Poisson, Binomial, …, y distribuciones continuas: Normal, Chi-cuadrado, F, t de Student, … Estas applets han sido realizadas por Matt Bognar, profesor de la Universidad de Iowa. Se puede acceder a ellas desde la web, a través de su página personal. Pero además incluye la aplicación para IOS (iOS 7.1 o superior) y la aplicación  para Android para que podáis trabajar con más comodidad desde el móvil o tableta. Aquí os muestro un ejemplo para el caso de la Binomial:

binombognar

Diagramas de Venn para el cálculo de probabilidades con Geogebra

Con ayuda de los diagramas de Venn podemos dar los primeros pasos para la comprensión del cálculo de probabilidades de distintos  sucesos de un espacio muestral. El siguiente geogebra se ha realizado con dicho propósito. En él trabajaremos en términos de porcentajes y en caso de querer calcular probabilidades sólo habrá que dividir entre cien los resultados obtenidos. Para trabajar estos conceptos se puede proponer un ejercicio similar al siguiente.

En una ciudad se publican 3 revistas sobre tecnología y videojuegos A, B y C. Mediante una encuesta se estima que el 30% lee la revista A el 20% la revista  B, el 15% lee la C, el 10% lee A y B, el 6% lee A y C, el 5% lee B y C, y el 3% lee las tres revistas.

  • ¿Qué porcentaje lee al menos dos revistas?
  • ¿Qué porcentaje lee solo una revista?
  •  ¿Qué porcentaje no lee ninguna revista?
  • ¿Qué porcentaje lee A pero no B?

En primer lugar introduciremos los datos que nos dan en el ejercicio tal y como aparece en el Geogebra al que puedes acceder pinchando en la imagen y obtendremos interactivamente los distintos valores del diagrama de Venn:

 Una vez se tienen los datos en el diagrama de Venn y se entiende su significado será muy fácil contestar las preguntas propuestas:

a) ¿Qué porcentaje lee al menos dos revistas? 7+3+3+2=15%

b) ¿Qué porcentaje lee solo una revista? 17+8+7=32%

c) ¿Qué porcentaje no lee ninguna revista? 53%

d) ¿Qué porcentaje lee A pero no B? 17+3=20%

Con ayuda de dicho geogebra puedes  realizar ejercicios similares al anterior. Os  propongo aquí uno para practicar, recuerda que cuando hablamos de probabilidades habrá que pasar los resultados  obtenidos con el Geogebra a tanto por uno dividiendo entre 100.

Mediante una encuesta realizada a jovenes para analizar sus preferencias en juegos  on-line se ha estimado  que el 80% juega al League of Legends (LOL), el 55% juega al World of Warcraft  (WoW) y  el 35% juega a Minecraft (Min), el 45 % juega  al LOL y al WoW, el 30 % juega al LOL y al Min, el 18% juega  al WoW y al Min, y el 15% juega a los tres.

Extrapolando los resultados a la población, si se elige  un joven al azar calcula:

  • ¿Cuál es la probabilidad de que juegue  al menos a dos de estos  juegos on-line?
  • ¿Cuál es la probabilidad de que juegue al menos a uno de estos  juegos on-line?
  • ¿Cuál es la probabilidad de que no juegue a ninguno de estos juegos on-line?

¿Qué porcentaje de jóvenes juega al  LOL pero no al  Minecraft?

¿Qué porcentaje de jóvenes juega al  Minecraft  pero no a al  LOL?

Si quieres ver los geogebras que se van publicando en el blog pincha aquí.

 

Web Equation y WolframAlpha

Con Web Equation podemos escribir una expresión matemática a mano (con el ratón si estamos en un ordenador o simplemente con el dedo en una tablet) y te la reconoce dando el código latex y MathML, además a través de “compute with WolframAlpha” podremos resolver esa integral, derivada, ecuación, etc. que habíamos escrito previamente a mano.

Os muestro aquí un ejemplo con una integral definida.

Y a continuación los cálculos que realiza WolframAlpha.

¿Qué es Stat Trek?

Stat Trek es un  sitio web que proporciona herramientas on-line para ayudar a resolver problemas de  estadística.  Está bastante bien y ayuda a entender los conceptos. En esta asignatura lo utilizaremos especialmente en el tema de probabilidad y análisis combinatorio, pero puede servir para el cálculo de probabilidades en  el tema de modelos de distribuciones discretos y continuos o incluso para simular muestreos aleatorios.

 

Distribución Normal con Geogebra

En los siguientes enlaces se puede acceder a varios geogebras realizados por Manuel Sada que nos permiten entender mejor en qué consiste la distribución Normal y el cálculo de probabilidades en la misma. Como ya sabéis, GeoGebra es un software libre de matemáticas, escrito en Java,  para educación en todos sus niveles disponible en múltiples plataformas. Reúne dinámicamente, aritmética, geometría, álgebra y cálculo en un único conjunto tan sencillo a nivel operativo como potente. Ofrece representaciones diversas de los objetos desde cada una de sus posibles perspectivas: vistas gráficas, algebraicas, estadísticas y de organización en organización en tablas y planillas y hojas de datos dinámicamente vinculadas.

Distribución Normal

Cálculo de probabilidades en una N(0,1) del tipo  P(Z<k)=P(Z≤k)

Cálculo de probabilidades en una N(μ,σ) del tipo  P(X<k)=P(X≤k)

Cálculo de probabilidades en una N(0,1) del tipo P(a<Z<b)

Uno de los aspectos que serán de especial relevancia  para la comprensión del resto de temas de la asignatura es saber calcular percentiles en distintas distribuciones y entender su significado. El siguiente geogebra realizado por José Álvarez nos lo muestra gráficamente para el caso de la N(0,1).

Valores críticos de una N(0,1)

Modelos de distribución discretos y continuos con R y SPSS

El siguiente vídeo resume  algunas de las opciones del SPSS y de R que se van a utilizar en el  tema de Modelos de distribuciones discretos y continuos para  realizar la correspondiente práctica en el laboratorio.

A la hora de entender el cálculo de probabilidades en variables aleatorias continuas, es útil conocer la forma que tiene la función de densidad.  Tal y como  se desprende del vídeo,  con R podemos ver la forma de dicha función para variables aleatorias continuas tales como la Normal, t de Student, F de Snedecor, Ji-cuadrado, etc.  Para otras funciones de densidad relativas a los ejercicios  iniciales sobre variables aleatorias continuas podemos usar, por ejemplo, fooplot, una herramienta  on-line que permite  representar gráficamente funciones.

R y R-Commander

Aunque generalmente utilizaremos el SPSS, también se irán introduciendo algunos procedimientos estadísticos con el software R.

R es un lenguaje de programación y un entorno para análisis estadístico y la realización de gráficos. Debido a su naturaleza es fácilmente adaptable a una gran variedad de tareas. Fue inicialmente escrito por Robert Gentleman y Ross Ihaka del Departamento de Estadística de la Universidad de Auckland en Nueva Zelanda. R actualmente es el resultado de un esfuerzo de colaboración de personas del todo el mundo. Desde mediados de 1997 se formó lo que se conoce como núcleo de desarrollo de R, que actualmente es el que tiene la posibilidad de modificación directa del código fuente.  R abarca una amplia gama de técnicas estadísticas que van desde los modelos lineales a las más modernas técnicas de clasificación pasando por los test clásicos. El código de R está disponible como software libre bajo las condiciones de la licencia GNU-GPL. Además está disponible precompilado para una multitud de plataformas. La página principal del proyecto es http://www.r-project.org.

El  software  libre  R  con  el  entorno  gráfico  R-Commander  (Rcmdr)   se  puede  obtener  en  la  siguiente  dirección  (para  windows): http://cran.es.r-project.org/bin/windows/base/release.htm

Luego  se  procede  con  la  ejecución,  siguiendo  las  instrucciones.  Para  la  instalación  de  Rcmdr,  se  arranca  R  desde  Inicio → Todos  los  programas → R.  A  continuación,  Paquetes → Instalar  Paquete(s)  y  elegido  el  mirror  desde  el  cual  se  quiere  instalar  el  paquete,  por  ejemplo  Spain  (Madrid),  se  selecciona  Rcmdr.

Harán  falta  más  paquetes  para  la  instalación  completa  de  Rcmdr,  pero  se  instalarán  automáticamente  la  primera  vez  que  se  ejecute.

Si  se  cierra  Rcmdr  (sin  cerrar  R),  para  volver  a  cargarlo  se  debe  ejecutar  la  instrucción  Commander().

Instrucciones más detalladas y actualizadas pueden encontrarse en http://knuth.uca.es/R en la sección R Wiki. Además, existen multitud de documentos que ilustran sobre el manejo de R. En particular, el siguiente libro, accesible on-line explica como utilizar R y R-Commander en Estadística básica y la forma de instalarlo tanto sobre Windows como sobre GNU/LINUX: http://knuth.uca.es/moodle/course/view.php?id=37

PSPP una alternativa libre al SPSS

PSPP es un una aplicación de software libre para el análisis de datos. Se presenta en modo gráfico y está escrita en el lenguaje de programación C.  Su apariencia es similar al software propietario SPSS, de hecho pretende ser su sustitución en versión libre, aunque por el momento dispone de menos funcionalidades que el SPSS. Con PSPP se pueden tratar ficheros de datos creados con SPSS sin ningún problema.

En el siguiente enlace podéis acceder a la web del producto: http://www.gnu.org/software/pspp/ y descargarlo.

Introducción al SPSS

Entre el software estadístico que utilizaremos para la parte práctica de la asignatura se encuentra el SPSS (Statistical Package for the Social Sciences). Este software estadístico es uno de los más utilizado a nivel mundial.  Aunque es un software propietario, la Universidad de Alicante dispone de licencias para poder trabajar con él tanto desde los laboratorios de prácticas como desde el Aula Informática Virtual accesible desde el  Campus Virtual. Por lo que lo podréis utilizar, desde cualquier ubicación con acceso a Internet. En este último caso,  las aplicaciones no se instalan en el ordenador del usuario, sino que se ejecutan en el servidor.

En el siguiente vídeo de la asignatura se  muestran unos ejemplos de introducción de datos y algunas opciones adicionales que se tratarán en las primeras clases de prácticas.

Si quieres ver más vídeos sobre SPSS puedes hacerlo desde aquí.