miércoles, 19 de diciembre de 2012

Lo importante... no participar (o aprende estadística con El Hormiguero)

Hace unos días estaba yo viendo (jajaja, "yo viendo" "lloviendo" jajaja -ejem, perdón por el momento Peter Griffin-) El Hormiguero. Casi al final del programa, decidieron hacer un juego con el público, con el fin de regalar (o no) un juego de mesa del programa a cada uno de los asistentes. El juego consistía en lo siguiente: cada uno de los asistentes como público debía quitarse un zapato y, desde su asiento, lanzarlo (cual periodista irakí a Bush) al interior de una cuba que estaba más o menos en el centro del plató. Si al final del proceso quedaban menos de 30 zapatos fuera de la cuba, todos los asistentes se llevaban a su casa el susodicho juego de mesa; caso contrario... pues no se lo llevaban. El resultado fue favorable al público y todos se fueron contentos a casa.

Esto puede parecer un juego más de los que se hacen en la tele, pero a mi me llamó la atención un detalle. El caso es que no era la primera vez que veía este juego en El Hormiguero. Unas semanas antes también hicieron el juego, pero en esa ocasión, recuerdo que para ganar, impusieron la condición de que quedaran menos de 25 zapatos fuera. El resultado ya no fue tan satisfactorio para el público.

Con estos datos encima de la mesa, uno, que ya tiene las orejas tiesas con cuestiones así, percibe que el hecho de variar el número de zapatos fuera debería ser muy importante. Así que me puse a hacer algunos números... y aquí tenéis los resultados.



Como decía un profesor mío... vamos a estudiar el caso general y ya luego particularizamos.

Lo primero que hay que tener en cuenta es que, cada miembro del público lanza de forma independiente su zapato, es decir, que el lanzamiento de uno, no interfiere en el de otro. En realidad, esto no es cierto del todo, pero es que si no tenemos en cuenta este detalle, los cálculos se hacen imposibles. Así que podemos suponer que cada lanzamiento individual es un experimento independiente del otro.

Vamos a suponer que hay [;n;] personas en el público, que cada uno de ellos tiene una probabilidad [;p;] de encestar su zapato en el cajón (por lo tanto, hay una probabilidad [;q=1-p;] de fallar) y que para que el grupo gane, hace falta que haya menos de [;m;] zapatos fuera.

Vamos al lío. ¿Cual es la probabilidad de que gane el grupo? Vamos a responder de dos formas.

Llamamos [;X;] al número de zapatos que quedan fuera del cajón. Para que gane el grupo, hace falta que haya 30 o menos zapatos fuera, por lo que habrá que calcular, la probabilidad de que haya exactamente [;k;] zapatos fuera desde [;k=0;] hasta [;k=m;], es decir:
[;P(Ganar)=\sum_{k=0}^{m}P(X=k);]

Si tienes conocimientos de distribuciones estadísticas discretas, verás que se trata de una distribución de Binomial con [;n;] experimentos (cada uno de los lanzamientos) y probabilidad de éxito [;q;] (la probabilidad de fallar el lanzamiento, es más conveniente así), es decir, [;X=Bi(n,q);]. Por lo tanto, se tiene que
 [;P(x=k)=\binom{n}{k} (1-p)^kp^{n-k};]
y
[;P(Ganar)=p^n\,\sum_{k=0}^{m}\binom{n}{k}\left(\frac{1-p}{p}\right)^k;].

Vale, si no tienes conocimientos estadísticos, o bien no los recuerdas bien, vamos a a reobtener la fórmula de [;P(X=k);] de una forma razonada.
Para que entre los [;n;] miembros del público haya [;k;] zapatos fuera hace falta que también haya [;n-k;] zapatos dentro. Como la probabilidad de no encestar es [;1-p;] y la de encestar es [;p;], se tiene que la probabilidad de que haya exactamente [;k;] zapatos fuera es [;(1-p)^kp^{n-k};]. Pero esto no coincide con nuestra fórmula... aún. Lo que hemos hallado corresponde a una configuración específica del público. Me explico. Imaginad que en cada asiento hay un número del 1 al [;n;]. Esta es la probabilidad de que los que ocupan los asientos del 1 al [;k;] fallen y los del [;k+1;] al [;n;] encesten. Pero a nosotros nos da igual que los que fallen sean los primeros que los últimos que los de en medio, que salteados. Así que si calculamos todas las formas de colocar a los [;k;] que no encestan en los asientos numerados, sólo habrá que multiplicar ambos números (la probabilidad calculada y el número de configuraciones). Por tanto, habrá que calcular el número de formas en las que podemos elegir [;k;] números de entre [;n;] sin que me importe el orden en el que salgan pero sin que tampoco se repitan; ese número es, precisamente el coeficiente [;\binom{n}{k}=\frac{n!}{k!(n-k)!};] y lo podemos interpretar así.
Hay [;n!;] formas de ordenar a [;n;] personas (piensa: para el asiento 1, hay [;n;] candidatos; para el 2, [;n-1;]; para el 3; [;n-2;]; ... ; para el asiento [;n-1;] ya sólo quedan 2 candidatos y para el último asiento, un único candidato). Pero de esas [;n;] personas, seleccionamos [;k;] que fallan y que se pueden ordenar de cualquier manera; y lo mismo con las [;n-k;] que aciertan. Por tanto el número de formas de sentar a las [;n;] personas una vez prefijadas las que aciertan y las que fallan es, justamente \frac{n!}{k!(n-k)!}.



Vale, pues resumiendo todo, si tenemos [;n;] personas con probabilidad de encestar [;p;] y queremos que el grupo gane si el número de personas que encestan es inferior a [;m;], la probabilidad de que esto ocurra es:
[;P\[n,m,p\]:=p^n\,\sum_{k=0}^m \binom{n}{k}\left(\frac{1-p}{p}\right)^k;].


Perfecto, ya tenemos el caso general. Ahora vamos a particularizar nuestro estudio a los dos casos. En primer lugar, hay que establecer los datos del problema. El número [;m;] lo dan en ambos días ([;m=20;] uno y [;m=30;] el otro). Sin embargo, los otros dos datos (el número de personas [;n;] y la probabilidad de acertar [;p;]) los desconocemos.
Si uno ve el programa de El Hormiguero y mira una panorámica del público, observa que éste se distribuye en una grada con 4 filas en las que pueden caber, aproximadamente unas 20 personas, más una pequeña grada lateral con una fila superior de unas 10-15 personas arriba y otras tantas abajo. En total eso da una cifra aproximada de 100 personas en el público o, a lo más, 110. ¿Es ese el dato [;n;]? No. El dato [;n;] corresponde con el número de personas que participan en el juego y viendo el programa se observa que hay unos cuantos que no quieren desprenderse de un zapato (bien por vergüenza, por desgana... o porque son muy listos). Así que parece lógico suponer un número algo menor de esos 110, por ejemplo, [;n=100;] (y creo que estoy siendo muy generoso).
Finalmente, dada la situación respecto del público y el tamaño del cajón en el que encestar los zapatos, creo que es más fácil encestar que fallar y diría que 2 de cada 3 personas aciertan su lanzamiento, por lo tanto, podríamos asignar a [;p;] un valor de 2/3 (y creo que estoy volviendo a ser generoso).


En el primer caso, en que [;m=25;], la probabilidad de ganar el premio es poco más o menos del 4,5%; mientras que en el caso en que [;m=30;] resulta ser casi del 28%.
Anda! qué curioso. Un cambio, a priori tan insignificante, me da como resultado una variación tremenda de la probabilidad final.
Pero vamos a tomar unos datos, a mi modo de ver, más realistas. Supongamos que [;n=90;] (ya dije que creía que habría unas 100 personas, de las que algunas no participan en el juego) y que [;p=0,7;] (vamos a aumentar ligeramente la probabilidad de acertar). Ahora para [m=25], la probabilidad pasa a ser del 37%; pero resulta que para [;m=30;] ahora la probabilidad es del 79%.
¿Qué puedo concluir de estos datos? Pues que la dirección del programa tiene claro

Aquí os dejo con una tabla de probabilidades, asumiendo que [;p=0,7;] para diferentes valores de [;n;] desde 30 hasta 120 (aumentando de 5 en 5) para 3 posibles valores de [;m;], los 2 estudiados y uno algo menor todavía ([;m=20;], con el que las diferencias aún son más marcadas).

Público m=20 m=25 m=30
30 0.999993 1 1
35 0.999777 1 1
40 0.997581 0.999995 1
45 0.986477 0.9999 1
50 0.952236 0.999067 0.999997
55 0.879215 0.994812 0.999957
60 0.762217 0.980426 0.999636
65 0.612995 0.945199 0.997984
70 0.45502 0.878681 0.99202
75 0.311784 0.777251 0.975846
80 0.197847 0.647937 0.941252
85 0.116822 0.506334 0.880652
90 0.0645294 0.370293 0.791141
95 0.0335234 0.253646 0.677034
100 0.0164629 0.16313 0.549124
105 0.00767839 0.0988259 0.421082
110 0.00341587 0.0565981 0.305153
115 0.00145505 0.0307552 0.209197
120 0.000595534 0.0159137 0.135923

Como podréis ver, y de ahí el título del post, a medida que el número de jugadores disminuye, aumenta considerablemente la probabilidad de que el grupo gane (obviamente si [;m=n;] el suceso "Gana el grupo" es seguro, pues siempre quedarán "menos de [;m;]" zapatos, al haber exactamente [;n=m;] jugadores). Para [;m=30;] se pude observar que desde el caso 120 jugadores hasta el caso 100 jugadores (una diferencia de 20), la probabilidad de ganar aumenta un 40%. En el caso [;m=25;] entre 105 y 85 jugadores, el salto es del 49%; mientras que en el caso [;m=20;], el salto de 85 a 65 jugadores es del 50%.

Y esto ocurre porque los términos suma que nos da la probabilidad de ganar, al igual que pasa con los números del Triángulo de Pascal, son más grandes en el centro que en los extremos; y si nos fijamos, en las condiciones del problema, (90 personas en el público y pasar de 25 a 30), estamos quitando 5 de los términos centrales de la suma (fijaos que si [;m=n;] la suma se hace trivialmente 1).

¿Y todo esto para qué? Pues para divertirme, nada más. Eso sí. ¿Y si se utilizase esto para enseñar la distribución Binomial a unos alumnos? ¿Sería posible que les gustara más que de la forma tradicional con los aburridos lanzamientos de monedas? Yo os lo dejo ahí, por si algún profesor le apetece usar esta idea.


Tito Eliatron Dixit


PD1: Os dejo los enlaces a los programas de los que hablo: Programa en el que imponen m=30 y programa en el que imponen m=25.

PD2: En el los casos en los que trabajamos ([;n=100,\, p=2/3,\, q=1/3;] ó [;n=90,\, p=0,7,\, q=0,3;]) estamos en condiciones de aproximar la Binomial [;X;] de parámetros [;n;] y [;p;] por una Normal [;N;] de parámetros [;\mu=np;] y [;\sigma^2=npq;]. Así, bastaría con pasar a tipificar nuestra normal y calcular [;P(X\le 30);] a través de la tabla correspondiente de la normal.

PD3: Con esta entrada participo en la Edición 3.141592653 del Carnaval de Matemáticas cuyo anfitrión es el blog Que no te aburran las M@TES.

27 comentarios:

  1. Menudo tostón.

    Las mates bien, pero la parte de explicar el motivo y las conclusiones no queda nada clara...

    ResponderEliminar
  2. Pensaba que se te habia ocurrido lo realmente ingenioso: si las condiciones dicen que ganan si "al finalizar la prueba quedan menos de 30 zapatos fuera de la cuba", basta con que NADIE tire su zapato a la caja: fuera de la caja no habrá ningún zapato, y por tanto todos ganan.

    Es mas, el juego permite hasta 29 (o 24) esquiroles que tiren el zapato aunque no acierten a meterlo en la caja.

    En el momento de empezar el juego, basta con pegar un grito y decir "SI NO TIRAIS EL ZAPATO GANAMOS TODOS!!" y ya esta. Otro asunto es que Pablo Motos te eche despues del plató. Eso sí, con tu juego debajo del brazo.

    En cualquier caso, tu chapa estadistica mola. :-) Conoces a Martin Gardner? Le encantaban este tipo de juegos...

    ResponderEliminar
  3. Esta entrada es un ejemplo de sofismo matemático: o de cómo malgastar operaciones a falta de usar otra herramienta mucho más adecuada y aplastantemente sencilla.

    ResponderEliminar
    Respuestas
    1. La ESTADÍSTICA no es más que sentido común expresado en forma de números.
      Pierre Simon de Laplace
      (http://eliatron.blogspot.com/2009/05/sentido-comun.html)

      Eliminar
  4. Todo muy correcto hasta que te inventas la probabilidad de encestar y destrozas el análisis.

    ResponderEliminar
    Respuestas
    1. NO es exactamente "inventar". Es una suposición, al estilo Problema de Fermi.

      A priori, uno puede suponer que la probabilidad de acertar es 0,5; pero el cajón es bastante grande y está en una posición centrteral respecto del público, lo que me hace suponer que es más fácil acertar que fallar. Todo esto... es un análisis A PRIORI.

      A POSTERIORI, creo que se podría comprobar el número de zapatos que han acabado dentro, frente a los que han acabado fuera. "A ojo" se ve que en los 2 programas, el nº de dentro es más grande que el de fuera. ¿La proporción exacta? no la sé. en un primer caso he supuesto que entran 2 de cada 3 zapatos (p=2/3). En un segundo caso, he puesto una probabilidad algo mayor (y sencilla para hacer las cuentas: p=0,7).

      No, no creo que esté inventada. Aunque sí te doy la razón en que NO EXPLICO por qué tomo esos valores para "p".

      Eliminar
  5. Muy bien explicado, gracias. Página para favoritos.

    ResponderEliminar
  6. En el penúltimo párrafo a qué se refiere con "quitar los términos centrales de la suma". Lo que veo es que quita los últimos términos de la sumatorio, k=26,27,28,29,30.

    ResponderEliminar
    Respuestas
    1. Quizás fuese más correcto decir "alguno de los términos centrales"si el sumatorio se extiende hasta "n" (90 o 100), los términos en torno a "n/2" son los que más aportan a la suma. Esto sería absolutamente cierto, si p=0,5. Pero al ser p=2/3 ó p=0,7 (por ejemplo) ese "centro" se mueve ligeramente hacia los términos con potencias de p más grandes. En nuestro caso, como p está elevado a "n-k" resulta que se mueve hacia los términos algo menores que "n/2" (si asumimos n=90, términos algo más bajos que 45).

      Eliminar
  7. Cada persona del público no tiene la misma probabilidad de encestar. Se puede asumir esto para los que estén a la misma distancia más o menos, pero los de la última fila tienen menos probabilidad que los de la primera. Aún así, la aproximación de la binomial no está mal.

    ResponderEliminar
    Respuestas
    1. ¿No está explícitamente dicho que esto que comentas? ¿que no todos tienen la misma probabilidad? Si no está dicho explícitamente, está implícito en mi razonamiento. Además, el lanzamiento de una persona puede afectar al de otra (pueden chocar los zapatos, por ejemplo) con lo que tampoco serían experimentos independientes (para serlos, debnerían lanzarse los zapatos 1 a 1, por ejemplo)

      Eliminar
  8. Y pensar que en el pasado he dado todos estos conceptos matemáticos y estadísticos y ahora me suena todo a Chino :(

    ResponderEliminar
  9. Para mí esta entrada es fantástica. Todo aquel que entienda lo más mínimo de matemáticas merece una condecoración. Suerte en el concurso.

    ResponderEliminar
  10. ¿No faltan variables? Si los zapatos son de papel y en el público son todos mancos y ciegos todo esas osas que escribes no sirven para nada, que sin ser un erudito es fáci ver que pueden existir infinidad de variables.

    ResponderEliminar
  11. Dicho lo anterior, las matemáticas no tienen nada de divertido, son un tostón, como los captchas.

    ResponderEliminar
  12. Sinceramente, me parece una gilipollez absoluta, igual que el "juego". Porque si se gana "no encestando", la manera evidente es directamente no tirar el zapato. Ale todos ganan, no hace falta hacer un estudio estadístico.
    Si fuese al contrario (que el objetivo fuese encestar) si tendría algo mas de sentido, por que el encestar no es un suceso seguro, el "no encestar" si.

    ResponderEliminar
    Respuestas
    1. No se gana "no encestando".
      De hecho, si participan 90, han de encestar, al menos, 60 para ganar.

      Lo que digo es que mientras menos gente participe, más fácil es ganar.

      Además, que esto es una excusa para enseñar estadística. En lugar de enseñarla por el método tradicional, pues prefiero usar algo así.

      Eliminar
  13. puedes traducir para los que no tenemos la ESO?

    ResponderEliminar
  14. Tremenda tu aplicación del estudio de probabilidades. Me pregunto cómo se podrían aplicar este tipo de cálculos al mundo de la cocina. :)

    ResponderEliminar
  15. macho esos calculos son absurdos, no tienen ni pies ni cabeza, estas escribiendo formulas sin darle sentido a ninguna. Es una tonteria y te has rallado al extremo.

    ResponderEliminar
  16. Cómprate un amigo (con dos zapatos)

    ResponderEliminar
  17. Qué juego más idiota.
    Es de cajón que si nadie tira su zapato no habrá ningún zapato, ni fuera ni dentro de la caja. No hace falta ningún razonamiento matemático.
    Se enrolla ud. mucho para explicar lo evidente, Capitán Obvio.:)

    ResponderEliminar
  18. MATAR MOSCAS A CAÑONAZOS

    ResponderEliminar

Si no comentas, Gauss se comerá una integral.
Y, por favor, respeta a todos con tus opiniones.