19 abril 2021 21:16

Correlación inversa

¿Qué es una correlación inversa?

Una correlación inversa, también conocida como correlación negativa, es una relación contraria entre dos variables, de modo que cuando el valor de una variable es alto, el valor de la otra variable probablemente sea bajo.

Por ejemplo, con las variables A y B, como A tiene un valor alto, B tiene un valor bajo y como A tiene un valor bajo, B tiene un valor alto. En terminología estadística, una correlación inversa a menudo se denota por el coeficiente de correlación «r» que tiene un valor entre -1 y 0, donde r = -1 indica una correlación inversa perfecta.

Conclusiones clave

  • La correlación inversa (o negativa) es cuando dos variables en un conjunto de datos están relacionadas de tal manera que cuando una es alta, la otra es baja.
  • Aunque dos variables pueden tener una fuerte correlación negativa, esto no implica necesariamente que el comportamiento de una tenga alguna influencia causal sobre la otra.
  • La relación entre dos variables puede cambiar con el tiempo y también puede tener períodos de correlación positiva.

Graficar la correlación inversa

Se pueden trazar dos conjuntos de puntos de datos en un gráfico en un eje xey para verificar la correlación. Esto se llama diagrama de dispersión y representa una forma visual de verificar una correlación positiva o negativa. El siguiente gráfico ilustra una fuerte correlación inversa entre dos conjuntos de puntos de datos trazados en el gráfico.

Ejemplo de cálculo de correlación inversa

La correlación se puede calcular entre variables dentro de un conjunto de datos para llegar a un resultado numérico, el más común de los cuales se conoce como r de Pearson. Cuando r es menor que 0, esto indica una correlación inversa. Aquí hay un ejemplo aritmético de cálculo de la r de Pearson, con un resultado que muestra una correlación inversa entre dos variables.

Suponga que un analista necesita calcular el grado de correlación entre X e Y en el siguiente conjunto de datos con siete observaciones sobre las dos variables:

  • X: 55, 37, 100, 40, 23, 66, 88
  • Y: 91, 60, 70, 83, 75, 76, 30

Hay tres pasos involucrados en encontrar la correlación. Primero, sume todos los valores de X para encontrar SUM (X), sume todos los valores de Y para encontrar SUM (Y) y multiplique cada valor de X con su valor de Y correspondiente y sume para encontrar SUM (X, Y):

SUM(Y)=91+60+70+83+75+76+30=485\ begin {alineado} \ text {SUM} (Y) & = 91 + 60 + 70 + 83 + 75 + 76 + 30 \\ & = 485 \\ \ end {alineado}SUMA (Y)​=91+60+70+83+75+76+30=485​

El siguiente paso es tomar cada valor de X, elevarlo al cuadrado y sumar todos estos valores para encontrar SUM (x 2 ). Se debe hacer lo mismo para los valores de Y:

SUM(X2)=(552)+(372)+(1002)+…+(882)=28,623\ text {SUM} (X ^ 2) = (55 ^ 2) + (37 ^ 2) + (100 ^ 2) + \ dotso + (88 ^ 2) = 28,623SUMA (X2)=(552)+(372)+(1002)+…+(882)=28,623

Teniendo en cuenta que hay siete observaciones, n, se puede utilizar la siguiente fórmula para encontrar el coeficiente de correlación, r:

r=[norte