¿Qué es Stat Trek?

Link

Stat Trek es un  sitio web que proporciona herramientas on-line para ayudar a resolver problemas de  estadística.  Está bastante bien y ayuda a entender los conceptos. En esta asignatura lo utilizaremos especialmente en el tema de probabilidad y análisis combinatorio, pero puede servir para el cálculo de probabilidades en  el tema de modelos de distribuciones discretos y continuos o incluso para simular muestreos aleatorios.

 

La importancia de transmitir y analizar bien los datos estadísticos, un ejemplo sobre política

Estos últimos días he leído estas dos afirmaciones  en distintos medios de comunicación y blogs atribuidas al ministro de Educación Wert. No he podido contrastar qué dijo exactamente ya que no he encontrado el vídeo con las palabras exactas pero todo parece apuntar  que fue la segunda. Lo que sí he constatado es que el ministro suele basarse mucho en datos estadísticos para justificar reformas, comisiones de expertos y recortes. Pero hay que tener cuidado a la hora de transmitir datos estadísticos  ya que si el análisis previo  no es exhaustivo  la información que nos llega puede llenar titulares y darnos a entender a la sociedad cosas (en este caso ha sido sobre el sistema universitario) que realmente no son las que concluyen los datos estadísticos.

Las afirmaciones leídas  son:

(1)        Hay un 21% de desempleo entre los universitarios de 25 a 29 años.

(2)        Entre los parados de 25 a 29 años, el 21% son universitarios.

Muchas personas tienden a pensar que se está diciendo lo mismo en ambos casos pero ni mucho menos. Veámoslo:

(1)        Si se indica que hay un 21% de desempleo entre los universitarios de 25 a 29 años nos están diciendo que el porcentaje de parados en el conjunto de los universitarios entre 25 y 29 años es del 21%.

Vamos a plantearlo en forma de probabilidades condicionadas tal y como vimos en las clases de estadística:

P(estar parado| ser universitario entre 25 y 29 años)=0.21.

Si esto fuera cierto, es un dato muy  alarmante pero en un análisis estadístico serio que permitiera analizar realmente la situación se deberían haber incluido datos adicionales tales como el porcentaje de parados en  el conjunto de personas  no universitarias de 25 a 29 años o el porcentaje de parados en el conjunto de jóvenes en general de 25 a 29 años.

Estos porcentajes tratados como probabilidades (tanto por uno) corresponderían   con calcular las siguientes probabilidades condicionadas, respectivamente:

P(estar parado| no ser universitario y tener entre 25 y 29 años)

P(estar parado| tener entre 25 y 29 años)

Estas probabilidades no se pueden obtener del dato inicial (21%) ya que los conjuntos de referencia para los que se calcula la cantidad de parados son diferentes en cada uno de los tres casos.

Ya puestos, si se quiere hacer un estudio estadístico serio, se podrían realizar contrastes de hipótesis sobre proporciones y análisis ji-cuadrado para obtener unas primeras aproximaciones para el  total de la población que permitiera analizar el panorama actual de forma más fiable. No olvidemos que la mayoría de estas estimaciones estadísticas se obtienen a partir de muestras aleatorias, es decir con subconjuntos aleatorios de la población y no con toda la población. La inferencia estadística es la que permite extraer conclusiones para la población a partir de los datos muestrales.

(2)        En el segundo caso se dice: entre los parados de 25 a 29 años, el 21%  son universitarios.  La comprensión de esta afirmación es sencilla: concretamente nos están diciendo  que la población parada entre 25 y 29 años está distribuida de la siguiente forma: un 21% son universitarios y por tanto un 79% son no universitarios.  Si lo tratamos en términos de probabilidades diríamos:

P(ser universitario| ser parado con edad entre 25 y 29 años)=0.21.

Y como la probabilidad de un suceso es igual a uno menos la de su complementario obtenemos:

P(no ser universitario| ser parado con edad entre 25 y 29 años)=1-P( ser universitario| ser parado con edad entre 25 y 29 años)=1-0.21=0.79

Aunque a priori parezca dar mucha información, no es así,  y no son las probabilidades condicionadas más útiles para estudiar el problema del paro que nos ocupa. Para intentar analizar estadísticamente dicha afirmación deberíamos además  saber al menos qué porcentaje de universitarios y no universitarios hay en el conjunto de todos los jóvenes de 25 a 29 años y qué porcentaje de universitarios y no universitarios hay en el conjunto de todos los jóvenes de  25 a 29 años no parados.

En Facebook he compartido también un enlace a un artículo de José Antonio Pérez y Juan Hernández en el que los autores  muestran cómo el planteamiento que hace  Wert para justificar la reforma universitaria tiene datos estadísticos tratados  erróneamente.

No lo olvidéis, para hablar de estadística se ha de hacer con rigurosidad, no sirve con utilizar sólo aquellos datos estadísticos que van a ser favorables o convenientes  a unos propósitos  obviando otros que realmente permitirían radiografiar de forma más completa y real el sistema universitario español.

Enunciados de ejercicios relacionados con las distribuciones continuas

Ejercicio 1. Sea X una variable aleatoria continua tal que:

f(x)=1/x2, x>1

f(x)=0, en el resto

Comprueba que f cumple las propiedades para ser una función de densidad. Calcula la   función de distribución de X. Obtén k tal que F(k)=1/2.

Ejercicio 2. Sea X una variable aleatoria continua cuya función de densidad es

f(x)=x, 0≤x≤1

f(x)=2-x, 1<x≤2

f(x)=0, en el resto

Calcula su  función de distribución.

Ejercicio 3. Calcula el valor de k para que la siguiente función sea la función de densidad de una variable aleatoria continua X.

f(x)=k(1-x)2, 0<x<1

f(x)=0, en el resto

Una vez obtenido k, calcula la función de distribución de X.

Ejercicio 4. Sea X una variable aleatoria continua cuya función de densidad es

f(x)=1/3, 0<x<3

f(x)=0, en el resto

Calcula E(X) y Var(X).

Ejercicio 5. Calcula el valor de k para que la siguiente función sea la función de densidad de una variable aleatoria continua X.

f(x)=ke-x/2, x>0

f(x)=0, en el resto

Ejercicio 6. Sea X una variable aleatoria continua cuya función de densidad es

f(x)=1-|x|, |x|<1

f(x)=0, en el resto

Calcula su  función de distribución.

Ejercicio 7. Calcula el valor de k para que la siguiente función sea la función de densidad de una variable aleatoria continua X.

f(x)=kx2, -3<x<6

f(x)=0, en el resto

Una vez obtenido k, calcula P(X>2), sin calcular previamente la función de distribución.

Ejercicio 8. Calcula el valor de k para que la siguiente función sea la función de densidad de una variable aleatoria continua X.

f(x)=kx(1-x), 0<x<1

f(x)=0, en el resto

Una vez obtenido k, calcula P(X>0.5), sin calcular previamente la función de distribución.

Ejercicio 9. Sea X una variable aleatoria continua cuya función de densidad es

f(x)=2/3, 0<x<1

f(x)=1/3, 1≤x<2

f(x)=0, en el resto

Calcula E(X) y Var(X).

Ejercicio 10. Calcula el valor de k para que la siguiente función sea la función de densidad de una variable aleatoria continua X.

f(x)=k(1-x), 0≤x≤1

f(x)=0, en el resto

Una vez obtenido k, obtén la función de distribución. Calcula P(X<1/2), P(X>0.8) y  P(X>1/4| X<1/2). Calcula E(X) y Var(X).

¿Sabes resolver los ejercicios de análisis combinatorio de las actividades del tema 4? Compruébalo con la siguiente actividad

Con la realización de las siguientes actividades podréis analizar si sabéis resolver   ejercicios sencillos de análisis combinatorio.  Pincha en la imagen  de la entrada si deseas realizar la actividad desde la web de educaplay o  imprimir los enunciados de los ejercicios.

 

 

Ejercicio sobre muestreo estratificado, obteniendo las muestras de cada estrato mediante muestreo sistemático

Con la realización de la siguiente actividad podéis profundizar en la forma de realizar un muestreo estratificado en el que la muestra de cada estrato se obtiene por un muestreo sistemático. Este ejercicio  se puso en un control del curso 2010-2011.

¿Por qué usar muestras?

Llamamos muestreo a la técnica con la que se determina el tamaño y los elementos que integrarán la muestra, a fin de que cumpla la condición de ser representativa de toda la población. En el siguiente vídeo se introducen algunas de las ventajas de trabajar con muestras, en lugar de con toda la población, para realizar los estudios estadísticos. Tengamos en cuenta que, para que los resultados obtenidos en la muestra reflejen la realidad de la población, dicha muestra   debe obtenerse mediante un muestreo aleatorio. Una vez elegido el método de muestreo, se estudia el tamaño de muestra necesario para que los resultados sean extrapolables a la población. Los aspectos relativos al tamaño de muestra a utilizar se estudiará en la asignatura en el tema 6,  una vez que se tenga la base estadística necesaria.

Muestreo aleatorio simple

Un muestreo aleatorio simple consiste en escoger una muestra de n elementos de la población, de manera que todas las combinaciones posibles de n elementos de la población tengan la misma probabilidad de ser seleccionadas. Es el azar el que decide. Este muestreo tal y como se ha definido aquí es un muestreo sin reemplazamiento y nosotros nos restringiremos únicamente a este caso.

Las muestras obtenidas mediante este muestreo se denominan muestras aleatorias simples (m.a.s.). Notamos que se puede pensar en un muestreo aleatorio simple como en algo similar a sacar nombres o números de una urna. En el siguiente vídeo se ilustra dicho muestreo.

Para simular una muestra aleatoria simple, a la hora de hacer los ejercicios de la asignatura, podemos utilizar el siguiente generador on-line del que se habla en el vídeo: nosetup.org.


Grupos de interés en Estadística

En este vídeo se explica qué es un grupo de interés dentro del ámbito de la Estadística:


El tamaño de cada uno de estos  grupos de interés es reducido (entre 6 y 10 personas, aproximadamente) y las sesiones de estos grupos suelen durar entre una o dos horas.

Medición de audiencias en Internet

En los siguientes vídeos de la asignatura seguimos tratando  la  medición de audiencias. En este caso tratamos la medición de audiencias en Internet.

Vídeo 1: Metodología user-centric.

Vídeo 2: Metodología site-centric.

Ahora le toca el turno a la medición de audiencias en televisión

En el siguiente vídeo de la asignatura seguimos tratando  la  medición de audiencias. En este caso tratamos los parámetros básicos de interés en la medición de audiencias en televisión.

En el vídeo se habla muy de pasada  de los audímetros, si quieres saber algo más sobre ellos  y cómo funcionan te recomiendo que vayas a la siguiente entrada del blog: ¿Qué es un audímetro? ¿Has visto alguna vez uno?

 

Seguimos con medición de audiencias en prensa

En el siguiente vídeo de la asignatura seguimos tratando  la  medición de audiencias. En este caso tratamos los parámetros básicos de interés en la medición de audiencias en prensa.

En el vídeo anterior se habla del Estudio General de Medios (EGM), si quieres saber más sobre el mismo accede a la siguiente página web: ¿Qué es el EGM?

Hablemos de variables con Estadística+IM

Aquí os dejo el enlace a dos  vídeos introductorios sobre los tipos de variables que también hemos puesto en Facebook.

Vídeo 1: Introducción a las variables.


Vídeo 2: Seguimos con variables.



Santillana lanza el videojuego infantil Nanoland

Nanoland es un mundo virtual interactivo  diseñado para niños y niñas  de 8 a 15 años.  Este videojuego online  aúna diversión y el desarrollo de habilidades y destrezas, según indica Santillana. Los jugadores crearán su propio avatar o nano, y podrán elegir desde la ropa hasta las características físicas del personaje. Además, permite a cada nano conocer a otros nanos e interactuar con ellos en un entorno abierto y respetuoso.

Nanoland cuenta con cinco zonas en las que se irán encontrando con más de treinta minijuegos: Rokamon es la zona de los monstruos, Azaria, la de la magia, Nanoyork, la zona de la diversión, Starland, el área de la música y el Sector X, el territorio de los robots. A medida que el nano practique en ellos se le irá recompensando con puntos, llamados “botones”, con los que podrán obtener accesorios y ropa o decorar su casa con muebles y objetos para desarrollar su propia personalidad.

Nanoland ofrece juegos en abierto que son gratuitos para todos los jugadores, y juegos a los que se accede a través del modelo de suscripción o micropago. Está disponible en tres idiomas (español, portugués e inglés) a través de la web www.nanoland.com.

Leer noticia completa en El PAÍS.