Correlación espuria
¿Qué es la correlación espuria?
En estadística, una correlación espuria, o falsedad, se refiere a una conexión entre dos variables que parece causal pero no lo es. Las relaciones espurias a menudo tienen la apariencia de que una variable afecta a otra. Esta correlación espuria a menudo es causada por un tercer factor que no es aparente en el momento del examen, a veces llamado factor de confusión.
Conclusiones clave
- La correlación espuria, o falsedad, es cuando dos factores aparecen casualmente relacionados pero no lo están.
- La aparición de una relación causal a menudo se debe a un movimiento similar en un gráfico que resulta ser coincidente o causado por un tercer factor de «confusión».
- La correlación espuria a menudo puede deberse a tamaños de muestra pequeños o criterios de valoración arbitrarios.
Cómo funciona la correlación espuria
Cuando dos variables aleatorias se siguen de cerca en un gráfico, es fácil sospechar una correlación o una relación entre los dos factores, donde un cambio afecta al otro. Dejando de lado la «causalidad», otro tema, esta observación puede llevar al lector del gráfico a creer que el movimiento de la variable A está vinculado al movimiento de la variable B o viceversa. pero a veces, tras un examen estadístico más detallado, los movimientos alineados son coincidentes o son causados por un tercer factor que afecta a los dos primeros. Ésta es una correlación falsa. La investigación realizada con tamaños de muestra pequeños o criterios de valoración arbitrarios es particularmente susceptible a la falsedad.
Ejemplo de correlaciones espurias
No es demasiado difícil descubrir correlaciones interesantes. Sin embargo, muchos resultarán falsos. Para la especie masculina en Wall Street, dos correlaciones falsas populares involucran a las mujeres y los deportes. La teoría de la longitud de la falda se originó en la década de 1920, que sostiene que la longitud de la falda y la dirección del mercado de valores están correlacionadas. Si las faldas son largas, eso significa que el mercado de valores está cayendo; si son cortos, el mercado está subiendo. A fines de enero se habla del llamado indicador del Super Bowl, que sugiere que una victoria del equipo de la AFC probablemente signifique que el mercado de valores bajará el próximo año, mientras que una victoria del equipo de la NFC presagia un aumento en la cotización. mercado. Desde 1966, el indicador ha tenido una tasa de precisión del 80%. Es un tema de conversación divertido, pero probablemente no sea algo que un asesor financiero serio recomendaría como estrategia de inversión para los clientes.
Aquí hay algunos ejemplos más de correlaciones falsas comunes:
- Los ahogamientos aumentan cuando aumentan las ventas de helados. Puede parecer que el aumento de las ventas de helados provoca más ahogamientos, pero en realidad, el aumento del calor puede hacer que más personas naden, así como que compren más helados.
- La tasa de homicidios en EE. UU. Entre 2006 y 2011 se redujo al mismo ritmo que el uso de Microsoft Internet Explorer.
- Los ejecutivos que dicen por favor y gracias más a menudo disfrutan de un mejor rendimiento de las acciones.
- Las personas que usan ropa del equipo de los Oakland Raiders tienen más probabilidades de cometer delitos.
Cómo detectar correlaciones falsas
Los estadísticos y otros científicos que analizan datos deben estar atentos a las relaciones falsas todo el tiempo. Existen numerosos métodos que utilizan, que incluyen:
- Asegurar una muestra representativa adecuada.
- Obtención de un tamaño muestral adecuado.
- Ser cauteloso con los puntos finales arbitrarios.
- Controlar tantas variables externas como sea posible.
- Usando una hipótesis nula y verificando un valor p fuerte.