Multicolinealidad
¿Qué es la multicolinealidad?
La multicolinealidad es la ocurrencia de altas intercorrelaciones entre dos o más variables independientes en un modelo de regresión múltiple. La multicolinealidad puede conducir a resultados sesgados o engañosos cuando un investigador o analista intenta determinar qué tan bien se puede usar cada variable independiente de manera más efectiva para predecir o comprender la variable dependiente en un modelo estadístico.
En general, la multicolinealidad puede conducir a intervalos de confianza más amplios que producen probabilidades menos confiables en términos del efecto de las variables independientes en un modelo. Es decir, las inferencias estadísticas de un modelo con multicolinealidad pueden no ser confiables.
Conclusiones clave
- La multicolinealidad es un concepto estadístico donde las variables independientes en un modelo están correlacionadas.
- La multicolinealidad entre variables independientes dará como resultado inferencias estadísticas menos fiables.
- Es mejor usar variables independientes que no estén correlacionadas o sean repetitivas cuando se construyen modelos de regresión múltiple que usan dos o más variables.
Comprensión de la multicolinealidad
Los analistas estadísticos utilizan modelos de regresión múltiple para predecir el valor de una variable dependiente especificada basándose en los valores de dos o más variables independientes. La variable dependiente a veces se denomina variable de resultado, objetivo o criterio.
Un ejemplo es un modelo de regresión multivariante que intenta anticipar los rendimientos de las acciones en función de elementos como la relación precio-beneficio ( relación P / E), la capitalización de mercado, el rendimiento pasado u otros datos. El rendimiento de las acciones es la variable dependiente y los diversos bits de datos financieros son las variables independientes.
La multicolinealidad en un modelo de regresión múltiple indica que las variables colineales independientes están relacionadas de alguna manera, aunque la relación puede ser casual o no. Por ejemplo, el rendimiento pasado puede estar relacionado con la capitalización de mercado, ya que las acciones que se han comportado bien en el pasado tendrán valores de mercado crecientes. En otras palabras, puede existir multicolinealidad cuando dos variables independientes están altamente correlacionadas. También puede suceder si se calcula una variable independiente a partir de otras variables en el conjunto de datos o si dos variables independientes proporcionan resultados similares y repetitivos.
Una de las formas más comunes de eliminar el problema de la multicolinealidad es identificar primero las variables independientes colineales y luego eliminar todas menos una. También es posible eliminar la multicolinealidad combinando dos o más variables colineales en una sola variable. A continuación, se puede realizar un análisis estadístico para estudiar la relación entre la variable dependiente especificada y una única variable independiente.
Ejemplo de multicolinealidad
Para invertir, la multicolinealidad es una consideración común cuando se realiza un análisis técnico para predecir los movimientos futuros probables del precio de un valor, como una acción o un futuro de materias primas.
Los analistas de mercado quieren evitar el uso de indicadores técnicos que sean colineales porque se basan en datos muy similares o relacionados; tienden a revelar predicciones similares con respecto a la variable dependiente del movimiento de precios. En cambio, el análisis de mercado debe basarse en variables independientes marcadamente diferentes para garantizar que analizan el mercado desde diferentes puntos de vista analíticos independientes.
Un ejemplo de un posible problema de multicolinealidad es realizar un análisis técnico utilizando solo varios indicadores similares.
El destacado analista técnico John Bollinger, creador del indicador Bandas de Bollinger, señala que «una regla fundamental para el uso exitoso del análisis técnico requiere evitar la multicolinealidad en medio de los indicadores». Para solucionar el problema, los analistas evitan utilizar dos o más indicadores técnicos del mismo tipo. En su lugar, analizan un valor utilizando un tipo de indicador, como un indicador de impulso, y luego hacen un análisis por separado utilizando un tipo diferente de indicador, como un indicador de tendencia.
Por ejemplo, el estocástico, el índice de fuerza relativa (RSI) y Williams% R son todos indicadores de impulso que dependen de entradas similares y es probable que produzcan resultados similares. En este caso, es mejor eliminar todos menos uno de los indicadores o encontrar una manera de fusionar varios de ellos en un solo indicador, al tiempo que agrega un indicador de tendencia que probablemente no esté altamente correlacionado con el indicador de impulso.