Suma de cuadrados residual (RSS)
¿Qué es la suma de cuadrados residual (RSS)?
Una suma de cuadrados residual (RSS) es una técnica estadística utilizada para medir la cantidad de varianza en un conjunto de datos que no se explica por un modelo de regresión en sí. En cambio, estima la varianza en los residuos o término de error.
La regresión lineal es una medida que ayuda a determinar la fuerza de la relación entre una variable dependiente y uno o más factores, conocidos como variables independientes o explicativas.
Conclusiones clave
- Una suma de cuadrados residual (RSS) mide el nivel de varianza en el término de error, o residuos, de un modelo de regresión.
- Idealmente, la suma de los residuos cuadrados debería ser un valor menor o menor que la suma de los cuadrados de las entradas del modelo de regresión.
- Los analistas financieros utilizan el RSS para estimar la validez de sus modelos econométricos.
La fórmula para RSS es
ESS =
∑
norte
yo = 1 (
y yo –
f (
x yo ))
2
dónde:
- y i = el i- ésimo valor de la variable a predecir
- f (x i ) = valor predicho de y i
- n = límite superior de la suma
- y i = el i- ésimo valor de la variable a predecir
- f (x i ) = valor predicho de y i
- n = límite superior de la suma
Comprensión de la suma de cuadrados residual (RSS)
En términos generales, la suma de cuadrados es una técnica estadística utilizada en el análisis de regresión para determinar la dispersión de puntos de datos. En un análisis de regresión, el objetivo es determinar qué tan bien se puede ajustar una serie de datos a una función que podría ayudar a explicar cómo se generó la serie de datos. La suma de cuadrados se utiliza como una forma matemática de encontrar la función que mejor se ajusta (varía menos) de los datos.
El RSS mide la cantidad de error que queda entre la función de regresión y el conjunto de datos después de ejecutar el modelo. Una cifra de suma de cuadrados residual más pequeña representa una función de regresión.
El RSS, también conocido como la suma de los residuos al cuadrado, determina esencialmente qué tan bien un modelo de regresión explica o representa los datos en el modelo.
RSS frente a RSE
Error estándar residual * RSE) es otro término estadístico utilizado para describir la diferencia en las desviaciones estándar de los valores observados frente a los valores predichos, como se muestra por puntos en un bondad de ajuste que se puede utilizar para analizar qué tan bien se ajusta un conjunto de puntos de datos al modelo real.
El RSE se calcula dividiendo el RSS por el número de observaciones en la muestra menos 2 y luego tomando la raíz cuadrada: RSE = [RSS / (n-2)] 1/2
RSS, finanzas y econometría
Los mercados financieros se han vuelto cada vez más impulsados cuantitativamente; como tal, en busca de una ventaja, muchos inversores están utilizando técnicas estadísticas avanzadas para ayudar en sus decisiones. Las aplicaciones de big data, aprendizaje automático e inteligencia artificial requieren además el uso de propiedades estadísticas para guiar las estrategias de inversión contemporáneas. La suma residual de cuadrados, o estadísticas RSS, es una de las muchas propiedades estadísticas que disfrutan de un renacimiento.
Los inversores y los gestores de carteras utilizan modelos estadísticos para realizar un seguimiento del precio de una inversión y utilizar esos datos para predecir movimientos futuros. El estudio, llamado análisis de regresión, podría involucrar el análisis de la relación en los movimientos de precios entre un producto y las acciones de las empresas que se dedican a producir el producto.
Cualquier modelo puede tener variaciones entre los valores predichos y los resultados reales. Aunque las varianzas pueden explicarse mediante el análisis de regresión, la suma de cuadrados residual representa las varianzas o errores que no se explican.
Dado que se puede hacer una función de regresión suficientemente compleja para ajustarse a prácticamente cualquier conjunto de datos, se necesitan más estudios para determinar si la función de regresión es, de hecho, útil para explicar la varianza del conjunto de datos. Normalmente, sin embargo, un valor menor o menor para la suma de cuadrados residual es ideal en cualquier modelo, ya que significa que hay menos variación en el conjunto de datos. En otras palabras, cuanto menor sea la suma de los residuos al cuadrado, mejor será el modelo de regresión para explicar los datos.