20 abril 2021 1:38

Desviación estándar residual

¿Qué es la desviación estándar residual?

La desviación estándar residual es un término estadístico que se utiliza para describir la diferencia en las desviaciones estándar de los valores observados frente a los valores predichos, como se muestra mediante puntos en un análisis de regresión.

El análisis de regresión es un método utilizado en estadística para mostrar una relación entre dos variables diferentes y para describir qué tan bien se puede predecir el comportamiento de una variable a partir del comportamiento de otra.

La desviación estándar residual también se conoce como la desviación estándar de puntos alrededor de una línea ajustada o el error estándar de estimación.

Conclusiones clave

  • La desviación estándar residual es la desviación estándar de los valores residuales o la diferencia entre un conjunto de valores observados y predichos.
  • La desviación estándar de los residuos calcula cuánto se extienden los puntos de datos alrededor de la línea de regresión.
  • El resultado se utiliza para medir el error de la predictibilidad de la línea de regresión.
  • Cuanto menor sea la desviación estándar residual en comparación con la desviación estándar de la muestra, más predictivo o útil será el modelo.

Comprensión de la desviación estándar residual

La desviación estándar residual es una medida de bondad de ajuste que se puede utilizar para analizar qué tan bien un conjunto de puntos de datos se ajusta al modelo real. En un entorno comercial, por ejemplo, después de realizar un análisis de regresión en múltiples puntos de datos de costos a lo largo del tiempo, la desviación estándar residual puede proporcionar al propietario de una empresa información sobre la diferencia entre los costos reales y los costos proyectados, y una idea de cuánto se proyecta. los costos podrían variar de la media de los datos históricos de costos.

Fórmula para la desviación estándar residual

Cómo calcular la desviación estándar residual

Para calcular la desviación estándar residual, primero se debe calcular la diferencia entre los valores predichos y los valores reales formados alrededor de una línea ajustada. Esta diferencia se conoce como valor residual o, simplemente, residuos o la distancia entre los puntos de datos conocidos y los puntos de datos predichos por el modelo.

Para calcular la desviación estándar residual, inserte los residuos en la ecuación de la desviación estándar residual para resolver la fórmula.

Ejemplo de desviación estándar residual

Empiece por calcular los valores residuales. Por ejemplo, suponiendo que tiene un conjunto de cuatro valores observados para un experimento sin nombre, la siguiente tabla muestra los valores de y observados y registrados para valores dados de x:

Si la ecuación lineal o pendiente de la línea predicha por los datos en el modelo se da como y est = 1x + 2 donde y est = valor de y predicho, se puede encontrar el residual para cada observación.

El residual es igual a (y – y est ), por lo que para el primer conjunto, el valor de y real es 1 y el valor de y est predicho dado por la ecuación es y est = 1 (1) + 2 = 3. El valor residual es por tanto 1 – 3 = -2, un valor residual negativo.

Para el segundo conjunto de puntos de datos xey, el valor de y predicho cuando x es 2 y y es 4 se puede calcular como 1 (2) + 2 = 4.

En este caso, los valores reales y previstos son los mismos, por lo que el valor residual será cero. Usaría el mismo proceso para llegar a los valores predichos para y en los dos conjuntos de datos restantes.

Una vez que haya calculado los residuos para todos los puntos usando la tabla o un gráfico, use la fórmula de desviación estándar residual.

Ampliando la tabla anterior, calcula la desviación estándar residual:

Observe que la suma de los residuos al cuadrado = 6, que representa el numerador de la ecuación de desviación estándar residual.

Para la parte inferior o denominador de la ecuación de desviación estándar residual, n = el número de puntos de datos, que es 4 en este caso. Calcula el denominador de la ecuación como:

  • (Número de residuos – 2) = (4 – 2) = 2

Finalmente, calcule la raíz cuadrada de los resultados:

  • Desviación estándar residual:  √ (6/2) = √3 ≈ 1.732

La magnitud de un residuo típico puede darle una idea general de cuán cerca están sus estimaciones. Cuanto menor sea la desviación estándar residual, más se acercará el ajuste de la estimación a los datos reales. En efecto, cuanto menor es la desviación estándar residual en comparación con la desviación estándar de la muestra, más predictivo o útil es el modelo.

La desviación estándar residual se puede calcular cuando se ha realizado un análisis de regresión, así como un análisis de varianza (ANOVA). Al determinar un límite de cuantificación (LoQ), se permite el uso de una desviación estándar residual en lugar de la desviación estándar.