Crear un modelo de regresión lineal en Excel
¿Qué es la regresión lineal?
La regresión lineal es una gráfica de datos que representa gráficamente la relación lineal entre una variable independiente y una dependiente. Por lo general, se usa para mostrar visualmente la fuerza de la relación y la dispersión de los resultados, todo con el propósito de explicar el comportamiento de la variable dependiente.
Digamos que queríamos probar la fuerza de la relación entre la cantidad de helado ingerido y la obesidad. Tomaríamos la variable independiente, la cantidad de helado, y la relacionaríamos con la variable dependiente, obesidad, para ver si existe una relación. Dado que una regresión es una representación gráfica de esta relación, cuanto menor sea la variabilidad en los datos, más fuerte será la relación y más ajustado será el ajuste a la línea de regresión.
Conclusiones clave
- La regresión lineal modela la relación entre una variable dependiente e independiente.
- El análisis de regresión se puede lograr si las variables son independientes, no hay heterocedasticidad y los términos de error de las variables no están correlacionados.
- Modelar la regresión lineal en Excel es más fácil con el paquete de herramientas de análisis de datos.
Consideraciones importantes
Hay algunas suposiciones críticas sobre su conjunto de datos que deben ser verdaderas para proceder con un análisis de regresión :
- Las variables deben ser verdaderamente independientes (utilizando una prueba de Chi-cuadrado ).
- Los datos no deben tener diferentes variaciones de error (esto se llama heterocedasticidad (también deletreada heterocedasticidad)).
- Los términos de error de cada variable no deben estar correlacionados. Si no es así, significa que las variables están correlacionadas en serie.
Si esas tres cosas suenan complicadas, lo son. Pero el efecto de que una de esas consideraciones no sea cierta es una estimación sesgada. Esencialmente, declararía erróneamente la relación que está midiendo.
Generación de una regresión en Excel
El primer paso para ejecutar el análisis de regresión en Excel es verificar que el complemento gratuito de Excel Data Analysis ToolPak esté instalado. Este complemento facilita el cálculo de una serie de estadísticas. Se no requiere trazar una línea de regresión lineal, pero hace que la creación de tablas estadísticas más simple. Para verificar si está instalado, seleccione «Datos» en la barra de herramientas. Si «Análisis de datos» es una opción, la función está instalada y lista para usar. Si no está instalado, puede solicitar esta opción haciendo clic en el botón de Office y seleccionando «Opciones de Excel».
Con el paquete de herramientas de análisis de datos, la creación de una salida de regresión es solo unos pocos clics.
La variable independiente va en el rango de X.
Dados los rendimientos del S&P 500 , digamos que queremos saber si podemos estimar la solidez y la relación de los rendimientos de las acciones de Visa (
- Seleccione «Datos» en la barra de herramientas. Aparece el menú «Datos».
- Seleccione «Análisis de datos». Aparecerá el cuadro de diálogo Análisis de datos – Herramientas de análisis.
- En el menú, seleccione «Regresión» y haga clic en «Aceptar».
- En el cuadro de diálogo Regresión, haga clic en el cuadro «Input Y Range» y seleccione los datos de la variable dependiente (devoluciones de acciones de Visa (V)).
- Haga clic en el cuadro «Input X Range» y seleccione los datos de la variable independiente (devoluciones del S&P 500).
- Haga clic en «Aceptar» para ejecutar los resultados.
[Nota: si la tabla parece pequeña, haga clic con el botón derecho en la imagen y ábrala en una nueva pestaña para una resolución más alta]
Interprete los resultados
Usando esos datos (los mismos de nuestro artículo de R-cuadrado ), obtenemos la siguiente tabla:
El valor R 2, también conocido como coeficiente de determinación, mide la proporción de variación en la variable dependiente explicada por la variable independiente o qué tan bien el modelo de regresión se ajusta a los datos. El valor de R 2 varía de 0 a 1 y un valor más alto indica un mejor ajuste. El valor p, o valor de probabilidad, también varía de 0 a 1 e indica si la prueba es significativa. En contraste con el valor R 2, un valor p más pequeño es favorable ya que indica una correlación entre las variables dependientes e independientes.
Trazar una regresión en Excel
Podemos trazar una regresión en Excel resaltando los datos y trazándolos como un diagrama de dispersión. Para agregar una línea de regresión, elija «Diseño» en el menú «Herramientas de gráficos». En el cuadro de diálogo, seleccione «Línea de tendencia» y luego «Línea de tendencia lineal». Para agregar el valor R 2, seleccione «Más opciones de línea de tendencia» en el menú «Línea de tendencia. Por último, seleccione» Mostrar valor R cuadrado en el gráfico «. El resultado visual resume la fuerza de la relación, aunque a costa de no proporcionar tantos detalles como la tabla de arriba.