Hace unos años, en una visita a Málaga, encontré en un periódico local un ejemplo maravilloso de una paradoja que, a pesar de ser conocida por los estadísticos y fácil de explicar, puede llevar a errores importantes en la interpretación de datos. Estábamos todavía en plena burbuja inmobiliaria (principios de 2006), pero el periódico informaba de que en 2005 el precio medio por metro cuadrado de las viviendas turísticas en la provincia de Málaga había bajado un 13,6% respecto a 2004. Era, en aquel entonces, una noticia muy extraña.
Comentarios
Ejemplo:
* Tengo 2 empleados que cobran 1000 euros y 2 empleados que cobran 500. El sueldo medio por empleado es de 750 euros.
* Les subo el sueldo a todos 100 euros y contrato 4 empleados más por 600 euros. Aunque todos cobran ahora 100 euros más que antes, el sueldo medio es ahora de 725 euros.
El motivo es que el grupo que cobra menos ha crecido en número más que el mejor pagado.
#8 Yo a veces, en algunas reuniones, explico lo mismo de forma un poco diferente. Pregunto: ¿Podemos subir el sueldo medio sin subirle el sueldo a nadie? Fácil: despidiendo a los que menos cobran. Todos se ríen y la idea queda clara.
Muy interesante. Por ejemplo hay otro caso en el tema demográfico, la tasa de mortalidad es mayor en España que en Marruecos. Pero si comparas por grupos de edad, ningún grupo de edad de España superaba al de Marruecos. ¿Que es lo que ocurre entonces? La población de España está envejecida y las muertes se concentran en los grupos superiores, arrastrando la tasa a niveles más elevados. Por eso hay un método en estadística llamado estandarización, que elimina el efecto de la estructura quedando solo el efecto de fenómeno.
En relación con esto, el sábado mismo había un buen ejemplo de ello en El Mundo, donde se veía que el sueldo medio general bajaba mas que el de hombres y mujeres por separado porque entre los trabajadores ha aumentado más la proporción de mujeres.
#1 Josu evita sistemáticamente temas conflictivos como ése.
Aunque es algo simple para ella cito afantomax
#2 Me viene guay para los alumnos, gracias.
#4 Si no estoy equivocado se trata de la 'Paradoja de Simpson'. En la descripción de Wikipedia encontrarás un caso de supuesta discriminación por género muy interesante que se dio en la Universidad de Berkeley.
https://es.wikipedia.org/wiki/Paradoja_de_Simpson
Otro caso quizás menos conocido es el del Titanic.
Si se obtienen los datos por clases (1ª, 2ª, 3ª y tripulación) se comprueba que la más perjudicada fue la tripulación con un 76% de fallecidos (en 3ª clase fue muy similar, un 75%, en primera 'solo' un 38%).
Pues bien, si se desglosan los datos de la tripulación por género verás que, por separado, tanto en hombres como en mujeres era mejor ser de la tripulación que de 3ª clase (hombres: 78% de fallecidos en la tripulación vs. un 83% en 3ª clase, mujeres: 13% de fallecidas en tripulación vs. un 54% en tercera).
La clave de ese promedio superior para el global es que el 97% de la tripulación eran hombres y estos salieron muy mal parados en cualquier clase (entre el 66% y el 86% murieron) mientras que del 3% de la tripulación que eran mujeres se salvó un 87%, el mismo porcentaje que las de 2ª clase.
Al hacer el promedio ponderado el peso de los hombres tripulantes es tan enorme en relación a otras clases (en 3ª eran casi mitad y mitad) que el % de supervivencia de la tripulación se desploma, hasta el fondo.
Por cierto, ahí tenéis las probabilidades de supervivencia de los personajes principales de Titanic (spoiler).
#17 Ya sé que esa película es antigua, pero menudo spoiler te gastaste con esa imagen.
La prueba de que muchos conceptos estadísticos pueden ser intuitivos si se explican bien... ¡Un 10 al artículo! Ejemplos elegidos perfectos, y sin necesidad de hacer números para entenderlo.
A ver si el periodismo sensacionalista de titulares llamativos se pone las pilas, aunque me temo que cuando parte de su éxito se basa en no entenderlo bien y en explicarlo confuso, poco hay que hacer.
#5 En la carrera tuve una asignatura llamada "métodos numéricos". El profesor jamás hizo un ejemplo con números, por más que se lo pedimos. Eso sí, el examen, era todo con casos concretos.
#5 Pues yo echo de menos un método para eliminar el efecto.
Los números, si los torturas lo suficiente, dirán lo que quieras.
Además, siempre hay formas de dar los números para que parezcan cualquier cosa. Ejemplo:
Se sube el IVA del 18% al 21%.
El gobierno va a decir que lo han subido nada más que tres puntos, y que no hay que preocuparse.
La oposición dice que el gobierno sube el IVA un 16,67%, lo cual resulta mucho más impactante.
Tanto los 3 puntos como el 16,67% son correctos pero son dos maneras muy distintas de presentar el mismo hecho, con connotaciones distintas.
Ya se sabe que una estadística se puede torturar para que diga lo que te interesa.
Siempre me gusta recordar que el problema de las estadísticas no son los datos (incluso si son erróneos) sino su interpretación. Los datos son solo eso, datos carentes de ningún significado más allá del que tú quieras darle.
#16 ¡Eso es! Hasta el indicador más patatero contiene información. El problema casi siempre la mala interpretación.
Como dijo (supuestamente) Winston Churchill "Hay verdades, mentiras y estadísticas"
Y, por desgracia, tanto los políticos que retuercen las cifras a su conveniencia, cómo los periodistas, que acostumbrar a no tener ni pajolera idea de estadística, crean eslóganes y titulares que son incorrectos, aunque no falsos.
Creo que no sólo faltan conocimientos de estadística, o sobran ganas de manipular, como decís.
También falta tiempo para analizar los datos. La necesidad de inmediatez en las noticias hace que los periodistas cojan los números, lo pasen por el excel y patapúm, ya tenemos chorri-artículo. Hay que sentarse y pasar un tiempo entendiendo lo que los números te dicen en realidad, correlando, verificando y revisando.
Pero el excel nos da una gráficas muy chulas que plantamos en el artículo-blog de turno y ale, a por el próximo
Siempre puedes decir que estás por debajo de la media de Europa, o del Euro, o que sólo se ha subido una media de x por año de gobierno, o que la presión fiscal está por debajo de la media de la UE, o del Euro, o que el porcentaje sobre la recaudación total es el más bajo o (insértese aquí algún estadístico que sea verídico y sirva a nuestros intereses)...
Esto es bastante conocido en el deporte.
Por ejmplo, un jugador que mete un 70/200 en triples en un anyo y un 20/50 al siguiente tiene peor porcentaje global que uno que mete 20/60 y 80/210, aunque el primero tenga dos mejores temporadas en porcentaje (35% vs 33% y 40% vs 38%).
Enhorabuena al autor, interesante y bien expuesto todo el artículo.
Articulo muy bueno! Parece como cuando se desvela el secreto de un truco de magia!