Regresión escalonada
¿Qué es la regresión por pasos?
La regresión escalonada es la construcción iterativa paso a paso de un modelo de regresión que implica la selección de variables independientes que se utilizarán en un modelo final. Implica agregar o eliminar posibles variables explicativas en sucesión y probar la significancia estadística después de cada iteración.
La disponibilidad de paquetes de software estadístico hace posible la regresión por pasos, incluso en modelos con cientos de variables.
Conclusiones clave
- La regresión escalonada es un método que examina iterativamente la significancia estadística de cada variable independiente en un modelo de regresión lineal.
- El enfoque de selección hacia adelante comienza con nada y agrega cada nueva variable de forma incremental, probando la significancia estadística.
- El método de eliminación hacia atrás comienza con un modelo completo cargado con varias variables y luego elimina una variable para probar su importancia en relación con los resultados generales.
- Sin embargo, la regresión escalonada tiene sus desventajas, ya que es un enfoque que ajusta los datos a un modelo para lograr el resultado deseado.
Tipos de regresión escalonada
El objetivo subyacente de la regresión por pasos es, a través de una serie de pruebas (por ejemplo, pruebas F, pruebas t ), encontrar un conjunto de variables independientes que influyan significativamente en la variable dependiente. Esto se hace con computadoras a través de la iteración, que es el proceso de llegar a resultados o decisiones al pasar por rondas o ciclos repetidos de análisis. La realización de pruebas automáticamente con la ayuda de paquetes de software estadístico tiene la ventaja de ahorrar tiempo y limitar los errores.
La regresión escalonada se puede lograr probando una variable independiente a la vez e incluyéndola en el modelo de regresión si es estadísticamente significativa o incluyendo todas las posibles variables independientes en el modelo y eliminando aquellas que no son estadísticamente significativas. Algunos usan una combinación de ambos métodos y, por lo tanto, hay tres enfoques para la regresión por pasos:
- La selección hacia adelante comienza sin variables en el modelo, prueba cada variable a medida que se agrega al modelo, luego mantiene las que se consideran más significativas estadísticamente, repitiendo el proceso hasta que los resultados sean óptimos.
- La eliminación hacia atrás comienza con un conjunto de variables independientes, eliminando una a la vez y luego probando para ver si la variable eliminada es estadísticamente significativa.
- La eliminación bidireccional es una combinación de los dos primeros métodos que prueban qué variables deben incluirse o excluirse.
Ejemplo
Un ejemplo de una regresión paso a paso que utiliza el método de eliminación hacia atrás sería un intento de comprender el uso de energía en una fábrica utilizando variables como el tiempo de funcionamiento del equipo, la antigüedad del equipo, el tamaño del personal, las temperaturas exteriores y la época del año. El modelo incluye todas las variables; luego, cada una se elimina, una a la vez, para determinar cuál es menos significativa desde el punto de vista estadístico. Al final, el modelo podría mostrar que la época del año y las temperaturas son más significativas, lo que posiblemente sugiere que el consumo máximo de energía en la fábrica es cuando el uso del aire acondicionado es más alto.
Limitaciones de la regresión escalonada
El análisis de regresión, tanto precio-ganancias y los rendimientos de las acciones durante muchos años para determinar si las acciones con relaciones P / E bajas (variable independiente) ofrecen rendimientos más altos (variable dependiente). El problema con este enfoque es que las condiciones del mercado a menudo cambian y las relaciones que se han mantenido en el pasado no necesariamente son verdaderas en el presente o en el futuro.
Mientras tanto, el proceso de regresión paso a paso tiene muchas críticas e incluso hay llamadas para dejar de usar el método por completo. Los estadísticos notan varios inconvenientes del enfoque, incluidos resultados incorrectos, un sesgo inherente en el proceso en sí y la necesidad de una potencia informática significativa para desarrollar modelos de regresión complejos a través de la iteración.