Causalidad y correlación

Franz H. Messerli publicó en octubre de 2012 un artículo en la revista médica New England Journal of Medicine en el cual –entre otras cosas- glosaba el gráfico adjunto (que ha sido difundido a todo trapo por las redes sociales) en el cual se recogen datos de 23 países: por un lado, el consumo anual de chocolate per cápita y, por otro, el número de premios Nobel que lleva contabilizado cada país.

Cualquier observador puede objetar que los valores observados en un país pequeño, pongamos Dinamarca, Noruega, Suiza, Portugal o Irlanda no pueden equipararse a los observados en países grandes: EE.UU, Alemania, Brasil o Reino Unido. En otras palabras, si lo que se quiere es medir la influencia que pueda tener la ingesta de chocolate sobre el nivel intelectual lo más apropiado hubiera sido observar a individuos y no a países. Por ejemplo, haciendo una muestra de personas, amplia y geográficamente dispersa, realizando a cada encuestado un test de inteligencia y observando cuánto chocolate ha consumido durante, por ejemplo, una semana.

Del gráfico adjunto se deduce que la correlación entre los dos indicadores allí representados es muy alta, así lo señala el coeficiente de correlación lineal (r), que roza el 0,8[1]. ¿Y qué significa eso? Pues de momento nada y desde luego no demuestra que la ingesta de chocolate esté detrás del desarrollo intelectual.

Nos encontramos ante dos conceptos que no se deben confundir: la causalidad (un acontecimiento o el nivel de una variable es causa de la aparición de otro suceso o del nivel alcanzado por otra variable) y correlación (cuando el hechicero de la tribu toca el tam-tam poco después suele llover eso es correlación y no causalidad, porque nadie puede creer que el ruido del tambor o la magia tengan algo que ver con la lluvia).

En el caso aquí expuesto surge de inmediato una sospecha: la evidente correlación entre el consumo de chocolate y el número de agraciados con el Premio Nobel es producto de una relación espuria entre ambos indicadores. En otras palabras, detrás de estos dos indicadores se ve la mano de otra variable que influye sobre ambas. ¿Cuál? Pues el nivel de vida, el nivel de bienestar… conceptos que podemos medir a través de un indicador tan socorrido como es la renta per cápita… y, en efecto, al hacer intervenir esta nueva variable la magia del chocolate desaparece. Volvamos la vista al gráfico y fijémonos tan solo en países como EE.UU, Alemania, Holanda y Francia, que tienen un nivel de vida similar. ¿Qué vemos? Pues que no existe una recta que se aproxime, ni de lejos, a esos puntos, y lo mismo nos ocurre observando, por otro lado, a países como Suecia, Austria, Dinamarca, Noruega y Suiza, con la particularidad de que en este último conjunto de países la recta que más se podría aproximar a  esos 5 puntos crecería “al revés”, es decir: a menos chocolate, más premios Nobel.

Podemos concluir diciendo que la Estadística es una disciplina utilísima en cualquier investigación, incluso puede servir para encontrar “indicios” de causalidad, pero la causalidad entre la ingesta de chocolate y el nivel intelectual habría que buscarla estudiando la influencia que pueden tener los componentes del chocolate (cacao, azúcar, grasas…) sobre el cerebro humano y eso es bioquímica, no estadística y menos si utilizamos una correlación espuria como la aquí comentada.



[1] El coeficiente de correlación lineal (r) varía entre 0 cuando el valor de una de las variables no influye en el de la otra y 1 cuando todos los puntos observados están sobre una recta. En otras palabras: cuanto más se aproximan los puntos a una recta estimada por el método de mínimos cuadrados más alto es el coeficiente de correlación lineal.

Deja un comentario