sábado, diciembre 20, 2014

El efecto cola de la distribución

El efecto de la cola de la distribución es un fenómeno estadístico sencillo y básico pero muchas veces subestimamos la importancia y capacidad explicativa de las cosas sencillas y básicas. Cuando tenemos dos curvas de Gauss o dos distribuciones normales que se solapan, ocurre que, aunque la diferencia en las medias sea pequeña, las diferencias en la cola de la distribución son mucho mayores. En la cola de la distribución las diferencias entre las dos curvas se hacen cada vez mayores. ¿Para qué nos sirve esto?

Steven Pinker explica este fenómeno en esta antigua pero interesante discusión con Elizabeth Spelke acerca de por qué hay tan pocas mujeres que destaquen en el área de ciencias, tecnología, matemáticas y ordenadores. La visión de muchas mujeres es que se trata de una discriminación o de algo cultural. Pinker explica, por contra, que aunque hay pequeñas diferencias psicológicas entre los sexos en las capacidades matemáticas y científicas cuando vamos al más alto nivel, a nivel de científicos que han conseguido los mayores logros y están en los puestos más altos, la explicación es puramente estadística. Por hacer una comparación: los hombres son de media un 10% más altos que las mujeres. No todos los hombres, por supuesto, son más altos que todas las mujeres, existen muchas mujeres más altas que muchos hombres. Si tomamos la altura de 1,78 cm, hay 30 hombres por cada mujer. Pero si tomamos la altura de 1,83 hay 2.000 hombres por cada mujer. 

Pero, además, hay que añadir la repercusión en la cola de la distribución de la varianza. En muchas características los hombres son más variables que las mujeres. De manera que, incluso aunque la media de las curvas de hombres y mujeres sea la misma, la proporción de hombres en las colas de la distribución será mayor, mientras que habrá más mujeres en la zona media. Como suele decirse, entre los hombres hay más genios pero también más idiotas.

Este fenómeno nos ayuda a entender por qué los judios askenazis han conseguido tantos premios Nobel. Los askenazis en las dos últimas generaciones han ganado 1/4 de los premios Nobel aunque son 1/600 de la población mundial. Han ganado el 25% de los premios A. M. Turing. Son la mitad de los campeones mundiales de ajedrez del siglo XX, y están sobre representados en  el mundo de los negocios, literatura, arte, etc. Aunque los judíos representan el 2% de la población norteamericana son el 30% de los estudiantes de Yale y el 27% de los de Harvard y porcentajes parecidos del resto de las mejores universidades estadounidenses, las de la liga Ivy.

Las puntuaciones de los judios askenazi en los test de inteligencia son variables pero la mayoría les adjudica un C.I. entre 107-115 siendo 110 un buen compromiso. Como referencia, la puntuación media en el C. I. de los europeos es de 100. Esto, en principio, no parece una diferencia como para justificar los espectaculares logros askenazis. Pero si suponemos que la desviación estándar es la misma (15) en los dos grupos, nos encontramos que europeos con un C.I. mayor de 140 hay 4 por 1.000, mientras que hay 23 askenazis por cada 1.000 con un cociente superior a 140. Si ponemos el límite en 160, la diferencia lógicamente será mayor. Un estudio ya viejo de 1954 de personas con más de 170 de C.I. encontró que de las 28 personas con esa inteligencia 24 eran judías.

También nos puede servir este fenómeno para entender otras cosas. Steve Stewart-Williams y Andrew Thomas  en un excelente artículo , “el Simio que se creía un Pavo Real”, lo utilizan para intentar demostrar que las diferencias psicológicas entre hombres y mujeres no son tan grandes en algunas cosas como creemos. Voy a citar uno de los ejemplos que ellos ponen. La discusión va de las diferencias en competición intrasexual entre hombres y mujeres. La competición intrasexual ser refiere a las peleas entre los miembros del mismo sexo por conseguir a los del otro sexo. El caso típico son las peleas entre ciervos o entre leones marinos y el que gana se lleva las hembras. Stewart-Williams y  Thomas insisten en que en nuestra especie eligen los dos sexos y, por lo tanto, los dos sexos compiten por el acceso al otro sexo. Es decir, que hay  competición entre mujeres por conseguir los mejores hombres. 

Como prueba de la mayor competición entre hombres que entre mujeres se han presentado los datos de homicidio. Son clásicos los estudios Martin Daly y Margo Wilson donde se ve que en toda cultura de la que hay datos hay muchos más hombres que matan a otros hombres que mujeres que matan a otras mujeres. En la mayoría de homicidios el autor es hombre (90%) y la víctima también es hombre (70%). Es más, la mayoría de estos asesinatos los cometen hombres jóvenes entre 16 y 44, es decir, en la época de mayor competición con otros hombres. 

Sin embargo, Stewart-Williams y Thomas  plantean que el homicidio es un acto violento extremo, es decir, muy pocos hombres cometen homicidio. Si nos centramos en una conducta extrema y rara (de la cola de la distribución) podemos sacar la impresión de que las diferencias entres sexos son muy grandes. Más cerca de la media las diferencias no serían tan extremas. De hecho, lo que se ve en cuestionarios y entrevistas donde se estudia la agresión (sin llegar al extremo del homicidio) es que las diferencias entre hombres y mujeres son más modestas.
diferencia en la varianza

Otra conducta que señala competición intrasexual en la que hay diferencias entre hombres y mujeres es en las conductas de riesgo, sobre todo en la juventud, que son más frecuentes en hombres. Como resultado de ello, los hombres mueren con más frecuencia por accidentes de coche y otros accidentes. La mortalidad juvenil es 2,5-5 veces más alta en hombres jóvenes que en mujeres jóvenes. Pero aquí Stewart-Williams y Thomas aplican la misma lógica. Aunque muchos más hombres que mujeres mueren jóvenes, la mayoría de los hombres no lo hace. Por ejemplo, en 2009 en USA, en edades de 15-24 años, fallecieron el 0,1% de los hombres y el 0,04%  de las mujeres. De la gente que muere joven, muchos ocupan presumiblemente los extremos de una curva con menos diferencias en la media. Es decir, ni los hombres que cometen homicidios ni los que mueren jóvenes por conductas de riesgo extremo serían representativos de la mayoría de los hombres.

No sé si te convencen los argumentos de Stewart-Williams y Thomas, pero, en cualquier caso, creo que sí merece la pena tener en cuenta que cuando estamos estudiando una conducta extrema, un área donde se han conseguido unos logros excepcionales, como premios Nobel, destacar a gran nivel en ciencia, etc., podemos sacar unas conclusiones erróneas sobre las diferencias a nivel general entre dos poblaciones, sean las que sean. No olvides chequear si la conducta que estudias está en el centro o en la cola de la distribución.

@pitiklinov

Referencias:



5 comentarios:

idea21 dijo...

El tema es muy interesante, y lo que se dice hay que tenerlo muy en cuenta. Con todo, se me ocurre algo con respecto a otra cosa que leí en otra parte (por desgracia no recuerdo exactamente donde)

"plantean que el homicidio es un acto violento extremo, es decir, muy pocos hombres cometen homicidio. Si nos centramos en una conducta extrema y rara (de la cola de la distribución) podemos sacar la impresión de que las diferencias entres sexos son muy grandes. Más cerca de la media las diferencias no serían tan extremas. De hecho, lo que se ve en cuestionarios y entrevistas donde se estudia la agresión (sin llegar al extremo del homicidio) es que las diferencias entre hombres y mujeres son más modestas."

La cuestión es la siguiente: las conductas extremas no solo son extremas, sino que son más fácilmente mensurables. Mientras que las menos extremas son mucho más difíciles de medir.

Esto me recuerda cuando "se puso de moda" el tema del "acoso sexual". Las violaciones son conductas extremas y resultan por ello fáciles de medir. Es relativamente fácil medir cuándo una mujer ha sido "violada": agredida físicamente, manipulada genitalmente, etc. Pero ¿cómo medir el acoso (la conducta menos extrema)?

Lo mismo pasa con la agresión en general, ¿los "scratches" son agresión?, ¿el "mobbing" es agresión?

Hay vienen también los problemas a la hora de la medición estadísticica.

Pitiklinov dijo...

Exacto, totalmente de acuerdo.

Anónimo dijo...

Hola, Pitiklinov.

“No olvides chequear si la conducta que estudias está en el centro o en la cola de la distribución”. No podría darte más la razón.

“…las conductas extremas no solo son extremas, sino que son más fácilmente mensurables. Mientras que las menos extremas son mucho más difíciles de medir.”

Obvio. Las conductas moderadas (¡bueno no pasa nada!) son mucho más abundantes, solo hay que observar un rato. Sin embargo, no deja de ser sorprendente verlo desde un enfoque estadístico como algo ajeno. Luego se puso de moda el concepto de gente tóxica (la de conductas que entra en esta definición). Cuando se llegue a saber si de esas pequeñas conductas moderadas se gestará una conducta extrema (sin retorno o incluso inesperada), cambiará nuestra percepción de lo que se considera una conducta normal y habrá nuevas distinciones de marginalidad social (como ya las hay ahora con determinadas enfermedades) y, probablemente, le daremos más consideración a las conductas moderadas que a las extremas, al menos desde el entendimiento no científico. Una vez leí en un cómic: “Un día me di cuenta de que cuando mi padre hablaba siempre hacía daño”. La capacidad sensorial que tenemos para captar lo dañino es sorprendentemente temprana (biológica y psicológicamente) y marginal, pero carecemos de la fuerza para evitarlo. (Mira, idea21, otro ejemplo sobre cómo no es posible racionalizar la empatía).

idea21 dijo...

"La capacidad sensorial que tenemos para captar lo dañino es sorprendentemente temprana (biológica y psicológicamente) y marginal, pero carecemos de la fuerza para evitarlo. (Mira, idea21, otro ejemplo sobre cómo no es posible racionalizar la empatía)."

Que no haya exactitud en el cálculo no quiere decir que no pueda haber mejoras. De hecho, los psicólogos usan ciertas estadísticas acerca de la "felicidad" percibida por cada cual y sobre la percepción del sufrimiento. No son cálculos muy exactos, pero sí lo suficiente para orientar el sentido de las mejoras.

En cualquier caso, la medición de las "conductas extremas" nos señala hechos ciertos. Hoy por hoy, nos podríamos conformar con una humanidad con cero homicidios, 2.500 calorías diarias por persona y ese tipo de cosas... ello denotaría una mayor confianza mutua y la correspondiente capacidad de cooperación

Anónimo dijo...

Hola.

Fue tan solo una opinión de un hecho (un… hablar en voz alta, sobre un caso concreto) que parece que se da sin pretender por ello ser conscientes del hecho en sí, que me vino a la cabeza al recordar el cómic, por ejemplo mientras aprendemos a espabilar en la vida en las diferentes etapas. (Los errores que vemos reconocidos en los hijos –no necesariamente hijos, pero quizá sea el ejemplo más intuitivo de entender- y que se tratan de evitar en su caso; esa libertad que se estira y encoje a juicio de los progenitores, que de manera acertada o errónea termina dejando huella). No era mi intención negar dato alguno.