Homocedástica
¿Qué es homocedástico?
Homoscedástico (también deletreado «homoscedástico») se refiere a una condición en la que la varianza del residuo, o término de error, en un modelo de regresión es constante. Es decir, el término de error no varía mucho a medida que cambia el valor de la variable predictora. Otra forma de decir esto es que la varianza de los puntos de datos es aproximadamente la misma para todos los puntos de datos. Esto sugiere un nivel de coherencia y facilita el modelado y el trabajo con los datos a través de la regresión. Sin embargo, la falta de homocedasticidad puede sugerir que el modelo de regresión puede necesitar incluir variables predictoras adicionales para explicar el desempeño de la variable dependiente.
Conclusiones clave
- La homocedasticidad ocurre cuando la varianza del término de error en un modelo de regresión es constante.
- Si la varianza del término de error es homocedástica, el modelo estaba bien definido. Si hay demasiada variación, es posible que el modelo no esté bien definido.
- Agregar variables predictoras adicionales puede ayudar a explicar el desempeño de la variable dependiente.
- Por el contrario, la heterocedasticidad ocurre cuando la varianza del término de error no es constante.
Cómo funciona la homocedasticidad
La homocedasticidad es un supuesto del modelo de regresión lineal y los datos de este tipo funcionan bien con el método de mínimos cuadrados. Si la varianza de los errores alrededor de la línea de regresión varía mucho, el modelo de regresión puede estar mal definido. Lo opuesto a la homocedasticidad es la heterocedasticidad, así como lo opuesto a «homogéneo» es «heterogéneo». La heterocedasticidad (también denominada “heterocedasticidad”) se refiere a una condición en la que la varianza del término de error en una ecuación de regresión no es constante.
Cuando se considera que la varianza es la diferencia medida entre el resultado previsto y el resultado real de una situación determinada, la determinación de la homocedasticidad puede ayudar a determinar qué factores deben ajustarse para obtener precisión.
Consideraciones Especiales
Un modelo de regresión simple, o ecuación, consta de cuatro términos. En el lado izquierdo está la variable dependiente. Representa el fenómeno que el modelo busca «explicar». En el lado derecho hay una constante, una variable predictora y un término residual o de error. El término de error muestra la cantidad de variabilidad en la variable dependiente que no es explicada por la variable predictora.
Ejemplo de homocedástico
Por ejemplo, suponga que desea explicar los puntajes de las pruebas de los estudiantes utilizando la cantidad de tiempo que cada estudiante pasó estudiando. En este caso, las puntuaciones de las pruebas serían la variable dependiente y el tiempo dedicado al estudio sería la variable predictora.
El término de error mostraría la cantidad de variación en los puntajes de las pruebas que no se explica por la cantidad de tiempo de estudio. Si esa varianza es uniforme u homocedástica, eso sugeriría que el modelo puede ser una explicación adecuada para el rendimiento de la prueba, explicándolo en términos de tiempo dedicado al estudio.
Pero la varianza puede ser heterocedástica. Un gráfico de los datos del término de error puede mostrar que una gran cantidad de tiempo de estudio se corresponde muy de cerca con puntuaciones altas en las pruebas, pero que las puntuaciones bajas en las pruebas de tiempo de estudio variaron ampliamente e incluso incluyeron algunas puntuaciones muy altas. De modo que la varianza de las puntuaciones no se explicaría bien simplemente por una variable predictora: la cantidad de tiempo que se estudia. En este caso, es probable que intervenga algún otro factor, y es posible que sea necesario mejorar el modelo para identificarlo o identificarlos.
Una investigación más profunda puede revelar que algunos estudiantes habían visto las respuestas de la prueba antes de tiempo o que habían tomado una prueba similar anteriormente y, por lo tanto, no necesitaban estudiar para esta prueba en particular. De hecho, puede resultar que los estudiantes tuvieran diferentes niveles de habilidades para aprobar exámenes, independientemente de su tiempo de estudio y su desempeño en exámenes anteriores, independientemente de la materia.
Para mejorar el modelo de regresión, el investigador tendría que probar otras variables explicativas que podrían proporcionar un ajuste más preciso a los datos. Si, por ejemplo, algunos estudiantes hubieran visto las respuestas con anticipación, el modelo de regresión tendría dos variables explicativas: el tiempo de estudio y si el estudiante tenía conocimiento previo de las respuestas. Con estas dos variables, se explicaría una mayor parte de la varianza de los puntajes de las pruebas y la varianza del término de error podría ser homocedástica, lo que sugiere que el modelo estaba bien definido.