Regresión lineal múltiple (MLR) - KamilTaylan.blog
19 abril 2021 22:50

Regresión lineal múltiple (MLR)

¿Qué es la regresión lineal múltiple (MLR)?

La regresión lineal múltiple (MLR), también conocida simplemente como regresión múltiple, es una técnica estadística que utiliza varias variables explicativas para predecir el resultado de una variable de respuesta. El objetivo de la regresión lineal múltiple (MLR) es modelar la relación lineal entre las variables explicativas (independientes) y la variable de respuesta (dependiente).

En esencia, la regresión múltiple es la extensión de la regresión por mínimos cuadrados ordinarios (MCO) porque involucra más de una variable explicativa.

Conclusiones clave

  • La regresión lineal múltiple (MLR), también conocida simplemente como regresión múltiple, es una técnica estadística que utiliza varias variables explicativas para predecir el resultado de una variable de respuesta.
  • La regresión múltiple es una extensión de la regresión lineal (MCO) que utiliza solo una variable explicativa.
  • MLR se utiliza ampliamente en econometría e inferencia financiera.

Fórmula y cálculo de regresión lineal múltiple

Lo que la regresión lineal múltiple puede decirle

La regresión lineal simple es una función que permite a un analista o estadístico hacer predicciones sobre una variable basándose en la información que se conoce sobre otra variable. La regresión lineal solo se puede utilizar cuando se tienen dos variables continuas: una variable independiente y una variable dependiente. La variable independiente es el parámetro que se utiliza para calcular la variable dependiente o el resultado. Un modelo de regresión múltiple se extiende a varias variables explicativas.

El modelo de regresión múltiple se basa en los siguientes supuestos:

  • Existe una relación lineal entre las variables dependientes y las variables independientes
  • Las variables independientes no están muy correlacionadas entre sí.
  • y i las observaciones se seleccionan de forma independiente y aleatoria de la población
  • Los residuos deben distribuirse normalmente con una media de 0 y varianza σ

El coeficiente de determinación (R-cuadrado) es una métrica estadística que se utiliza para medir cuánto de la variación en el resultado puede explicarse por la variación en las variables independientes. R 2 siempre aumenta a medida que se agregan más predictores al modelo MLR, aunque los predictores pueden no estar relacionados con la variable de resultado.

Por lo tanto, R2 por sí solo no puede usarse para identificar qué predictores deben incluirse en un modelo y cuáles deben excluirse. R2 solo puede estar entre 0 y 1, donde 0 indica que ninguna de las variables independientes puede predecir el resultado y 1 indica que el resultado puede predecirse sin error a partir de las variables independientes.

Al interpretar los resultados de la regresión múltiple, los coeficientes beta son válidos mientras se mantienen constantes todas las demás variables («todo lo demás igual»). La salida de una regresión múltiple se puede mostrar horizontalmente como una ecuación o verticalmente en forma de tabla.

Ejemplo de cómo utilizar la regresión lineal múltiple

Por ejemplo, un analista puede querer saber cómo el movimiento del mercado afecta el precio de ExxonMobil (XOM). En este caso, su ecuación lineal tendrá el valor del índice S&P 500 como variable independiente, o predictor, y el precio de XOM como variable dependiente.

En realidad, existen múltiples factores que predicen el resultado de un evento. El movimiento de precios de ExxonMobil, por ejemplo, depende de algo más que del desempeño del mercado en general. Otros predictores, como el precio del petróleo, las tasas de interés y el movimiento del precio de los futuros del petróleo, pueden afectar el precio de XOM y los precios de las acciones de otras compañías petroleras. Para comprender una relación en la que están presentes más de dos variables, se utiliza la regresión lineal múltiple.

La regresión lineal múltiple (MLR) se utiliza para determinar una relación matemática entre varias variables aleatorias. En otros términos, MLR examina cómo se relacionan múltiples variables independientes con una variable dependiente. Una vez que se ha determinado cada uno de los factores independientes para predecir la variable dependiente, la información sobre las múltiples variables se puede utilizar para crear una predicción precisa sobre el nivel de efecto que tienen sobre la variable de resultado. El modelo crea una relación en forma de línea recta (lineal) que se aproxima mejor a todos los puntos de datos individuales.

Refiriéndose a la ecuación MLR anterior, en nuestro ejemplo:

  • y i = variable dependiente: el precio de XOM
  • x i1 = tipos de interés
  • x i2 = precio del petróleo
  • x i3 = valor del índice S&P 500
  • x i4 = precio de los futuros del petróleo
  • B 0 = intersección con el eje y en el tiempo cero
  • B 1 = coeficiente de regresión que mide un cambio unitario en la variable dependiente cuando cambia x i1 – el cambio en el precio de XOM cuando cambian las tasas de interés
  • B 2 = valor del coeficiente que mide un cambio unitario en la variable dependiente cuando cambia x i2 : el cambio en el precio de XOM cuando cambian los precios del petróleo

Las estimaciones de mínimos cuadrados, B 0, B 1, B 2 … B p, generalmente se calculan mediante software estadístico. Se pueden incluir tantas variables en el modelo de regresión en el que cada variable independiente se diferencia con un número: 1,2, 3, 4… p. El modelo de regresión múltiple permite a un analista predecir un resultado basado en la información proporcionada sobre múltiples variables explicativas.

Sin embargo, el modelo no siempre es perfectamente preciso, ya que cada punto de datos puede diferir ligeramente del resultado predicho por el modelo. El valor residual, E, que es la diferencia entre el resultado real y el resultado previsto, se incluye en el modelo para tener en cuenta estas ligeras variaciones.

Suponiendo que ejecutamos nuestro modelo de regresión de precios XOM a través de un software de cálculo de estadísticas, que devuelve este resultado:

Un analista interpretaría que esta producción significa que si otras variables se mantienen constantes, el precio de XOM aumentará en un 7.8% si el precio del petróleo en los mercados aumenta en un 1%. El modelo también muestra que el precio de XOM disminuirá en un 1.5% luego de un aumento del 1% en las tasas de interés. R 2 indica que el 86,5% de las variaciones en el precio de las acciones de Exxon Mobil pueden explicarse por cambios en la tasa de interés, el precio del petróleo, los futuros del petróleo y el índice S&P 500.

La diferencia entre regresión lineal y múltiple

La regresión de cuadrados lineales ordinarios (MCO) compara la respuesta de una variable dependiente ante un cambio en algunas variables explicativas. Sin embargo, es raro que una variable dependiente se explique por una sola variable. En este caso, un analista usa regresión múltiple, que intenta explicar una variable dependiente usando más de una variable independiente. Las regresiones múltiples pueden ser lineales y no lineales.

Las regresiones múltiples se basan en el supuesto de que existe una relación lineal entre las variables dependientes e independientes. Tampoco asume una correlación importante entre las variables independientes.

Preguntas frecuentes

¿Qué hace que una regresión múltiple sea ‘múltiple’?

Una regresión múltiple considera el efecto de más de una variable explicativa sobre algún resultado de interés. Evalúa el efecto relativo de estas variables explicativas o independientes sobre la variable dependiente cuando se mantienen constantes todas las demás variables del modelo.

¿Por qué se utilizaría una regresión múltiple en lugar de una simple regresión de MCO?

Es raro que una variable dependiente se explique por una sola variable. En tales casos, un analista usa regresión múltiple, que intenta explicar una variable dependiente usando más de una variable independiente. Sin embargo, el modelo asume que no existen correlaciones importantes entre las variables independientes.

¿Puedo hacer una regresión múltiple a mano?

Probablemente no. Los modelos de regresión múltiple son complejos y lo son aún más cuando hay más variables incluidas en el modelo o cuando aumenta la cantidad de datos a analizar. Para ejecutar una regresión múltiple, probablemente necesitará utilizar software estadístico especializado o funciones dentro de programas comerciales como Excel.

¿Qué significa que una regresión múltiple sea ‘lineal’?

En una regresión lineal múltiple, el modelo calcula la línea de mejor ajuste que minimiza las varianzas de cada una de las variables incluidas en relación con la variable dependiente. Debido a que se ajusta a una línea, es un modelo lineal. También existen modelos de regresión no lineal que involucran múltiples variables, como regresión logística, regresión cuadrática y modelos probit.

¿Cómo se utilizan los modelos de regresión múltiple en finanzas?

Cualquier modelo econométrico que considere más de una variable puede ser una regresión múltiple. Los modelos de factores, por ejemplo, comparan dos o más factores para analizar las relaciones entre las variables y el rendimiento resultante. La Fama y French Tres-Factor Mod es un modelo de este tipo que se expande en el modelo de valoración de activos de capital (CAPM) mediante la adición de factores de riesgo tamaño y riesgo de valor para el factor de riesgo de mercado en el CAPM (que es en sí mismo un modelo de regresión). Al incluir estos dos factores adicionales, el modelo se ajusta a esta tendencia de desempeño superior, que se cree que lo convierte en una mejor herramienta para evaluar el desempeño de los gerentes.