Regla empírica - KamilTaylan.blog
19 abril 2021 17:52

Regla empírica

¿Qué es la regla empírica?

La regla empírica, también conocida como la regla de los tres sigma o la regla 68-95-99.7, es una regla estadística que establece que para una distribución normal, casi todos los datos observados estarán dentro de tres desviaciones estándar (indicadas por σ) de la media o promedio (denotado por µ).

En particular, la regla empírica predice que el 68% de las observaciones se encuentran dentro de la primera desviación estándar (µ ± σ), el 95% dentro de las dos primeras desviaciones estándar (µ ± 2σ) y el 99,7% dentro de las tres primeras desviaciones estándar (µ ± 3σ).

Conclusiones clave

  • La regla empírica establece que el 99,7% de los datos observados siguiendo una distribución normal se encuentran dentro de 3 desviaciones estándar de la media.
  • Según esta regla, el 68% de los datos se encuentra dentro de una desviación estándar, el 95% por ciento dentro de dos desviaciones estándar y el 99,7% dentro de tres desviaciones estándar de la media.
  • Los límites de tres sigma que siguen la regla empírica se utilizan para establecer los límites de control superior e inferior en gráficos de control de calidad estadístico y en análisis de riesgo como VaR.

Comprensión de la regla empírica

La regla empírica se utiliza a menudo en estadísticas para pronosticar los resultados finales. Después de calcular la desviación estándar y antes de recopilar datos exactos, esta regla se puede utilizar como una estimación aproximada del resultado de los datos inminentes que se recopilarán y analizarán.

Por tanto, esta distribución de probabilidad se puede utilizar como una heurística provisional, ya que la recopilación de los datos adecuados puede llevar mucho tiempo o incluso ser imposible en algunos casos. Tales consideraciones entran en juego cuando una empresa está revisando sus medidas de control de calidad o evaluando su exposición al riesgo. Por ejemplo, la herramienta de riesgo de uso popular conocida como valor en riesgo (VaR) asume que la probabilidad de eventos de riesgo sigue una distribución normal.

La regla empírica también se utiliza como una forma aproximada de probar la «normalidad» de una distribución. Si demasiados puntos de datos caen fuera de los tres límites de la desviación estándar, esto sugiere que la distribución no es normal y, en cambio, puede estar sesgada o seguir alguna otra distribución.

Las reglas empíricas también se conocen como la regla de tres sigma, ya que «tres sigma» se refiere a una distribución estadística de datos dentro de tres desviaciones estándar de la media en una distribución normal ( curva de campana ), como se indica en la figura siguiente.

Ejemplos de la regla empírica

Supongamos que se sabe que una población de animales en un zoológico se distribuye normalmente. Cada animal vive hasta los 13,1 años en promedio (media) y la desviación estándar de la esperanza de vida es de 1,5 años. Si alguien quiere saber la probabilidad de que un animal viva más de 14,6 años, puede utilizar la regla empírica. Sabiendo que la media de la distribución es de 13,1 años, se producen los siguientes rangos de edad para cada desviación estándar:

  • Una desviación estándar (µ ± σ): (13,1 – 1,5) a (13,1 + 1,5), o 11,6 a 14,6
  • Dos desviaciones estándar (µ ± 2σ): 13,1 – (2 x 1,5) a 13,1 + (2 x 1,5) o 10,1 a 16,1
  • Tres desviaciones estándar (µ ± 3σ): 13,1 – (3 x 1,5) a 13,1 + (3 x 1,5), o 8,6 a 17,6

La persona que resuelve este problema debe calcular la probabilidad total de que el animal viva 14,6 años o más. La regla empírica muestra que el 68% de la distribución se encuentra dentro de una desviación estándar, en este caso, de 11,6 a 14,6 años. Así, el 32% restante de la distribución queda fuera de este rango. La mitad está por encima de 14,6 y la mitad por debajo de 11,6. Entonces, la probabilidad de que el animal viva por más de 14.6 es 16% (calculado como 32% dividido por dos).

Como otro ejemplo, suponga en cambio que un animal en el zoológico vive un promedio de 10 años de edad, con una desviación estándar de 1.4 años. Suponga que el cuidador del zoológico intenta calcular la probabilidad de que un animal viva durante más de 7.2 años. Esta distribución tiene el siguiente aspecto:

  • Una desviación estándar (µ ± σ): 8,6 a 11,4 años
  • Dos desviaciones estándar (µ ± 2σ): 7,2 a 12,8 años
  • Tres desviaciones estándar ((µ ± 3σ): 5,8 a 14,2 años

La regla empírica establece que el 95% de la distribución se encuentra dentro de dos desviaciones estándar. Por lo tanto, el 5% se encuentra fuera de dos desviaciones estándar; la mitad por encima de 12,8 años y la mitad por debajo de 7,2 años. Por tanto, la probabilidad de vivir más de 7,2 años es:

95% + (5% / 2) = 97,5%

Preguntas frecuentes

¿Qué es la regla empírica?

En estadística, la regla empírica establece que el 99,7% de los datos ocurren dentro de tres desviaciones estándar de la media dentro de una distribución normal. Para ello, el 68% de los datos observados ocurrirá dentro de la primera desviación estándar, el 95% ocurrirá en la segunda desviación y el 97,5% dentro de la tercera desviación estándar. La regla empírica predice la distribución de probabilidad para un conjunto de resultados.

¿Cómo se usa la regla empírica?

La regla empírica se aplica para anticipar resultados probables en una distribución normal. Por ejemplo, un estadístico usaría esto para estimar el porcentaje de casos que caen en cada desviación estándar. Considere que la desviación estándar es 3,1 y la media es igual a 10. En este caso, la primera desviación estándar estaría entre (10 + 3,2) = 13,2 y (10-3,2) = 6,8. La segunda desviación estaría entre 10 + (2 X 3,2) = 16,4 y 10 – (2 X 3,2) = 3,6, y así sucesivamente.

¿Cuáles son los beneficios de la regla empírica?

La regla empírica es beneficiosa porque sirve como medio para pronosticar datos. Esto es especialmente cierto cuando se trata de grandes conjuntos de datos y aquellos en los que se desconocen las variables. Específicamente en finanzas, la regla empírica está relacionada con los precios de las acciones, los índices de precios y los valores logarítmicos de las tasas de cambio, que tienden a caer en una curva de campana o distribución normal.