19 abril 2021 16:03

Intervalo de confianza

¿Qué es un intervalo de confianza?

Un intervalo de confianza, en estadística, se refiere a la probabilidad de que un parámetro de población se encuentre entre un conjunto de valores durante una determinada proporción de veces. Los intervalos de confianza miden el grado de incertidumbre o certeza en un método de muestreo. Pueden tomar cualquier número de límites de probabilidad, siendo el más común un nivel de confianza del 95% o 99%.

Los intervalos de confianza se llevan a cabo utilizando métodos estadísticos, como una  prueba t.

Conclusiones clave

  • Un intervalo de confianza muestra la probabilidad de que un parámetro se encuentre entre un par de valores alrededor de la media.
  • Los intervalos de confianza miden el grado de incertidumbre o certeza en un método de muestreo.
  • La mayoría de las veces se construyen utilizando niveles de confianza del 95% o 99%.

Comprensión de un intervalo de confianza

Los estadísticos utilizan intervalos de confianza para medir la incertidumbre en una variable de muestra. Por ejemplo, un investigador selecciona diferentes muestras al azar de la misma población y calcula un intervalo de confianza para cada muestra para ver cómo puede representar el verdadero valor de la variable de población. Los conjuntos de datos resultantes son todos diferentes; algunos intervalos incluyen el parámetro de población real y otros no.

Un intervalo de confianza es un rango de valores, delimitado por encima y por debajo de la media de la estadística, que probablemente contendría un parámetro de población desconocido. El nivel de confianza se refiere al porcentaje de probabilidad, o certeza, de que el intervalo de confianza contendría el parámetro de población real cuando se extrae una muestra aleatoria muchas veces. O, en la lengua vernácula, «estamos 99% seguros ( nivel de confianza) de que la mayoría de estas muestras (intervalos de confianza) contienen el verdadero parámetro de población».



El intervalo de confianza y el nivel de confianza están relacionados entre sí, pero no son exactamente lo mismo.

Calcular un intervalo de confianza

Suponga que un grupo de investigadores está estudiando la altura de los jugadores de baloncesto de la escuela secundaria. Los investigadores toman una muestra aleatoria de la población y establecen una altura media de 74 pulgadas.

La media de 74 pulgadas es una estimación puntual de la media de la población. Una estimación puntual por sí misma es de utilidad limitada porque no revela la incertidumbre asociada con la estimación; no tiene una idea clara de lo lejos que podría estar esta media muestral de 74 pulgadas de la media de la población. Lo que falta es el grado de incertidumbre en esta única muestra.

Los intervalos de confianza proporcionan más información que las estimaciones puntuales. Al establecer un intervalo de confianza del 95% utilizando la media y la desviación estándar de la muestra, y asumiendo una distribución normal representada por la curva de campana, los investigadores llegan a un límite superior e inferior que contiene la media verdadera el 95% del tiempo.

Suponga que el intervalo está entre 72 y 76 pulgadas. Si los investigadores toman 100 muestras aleatorias de la población de jugadores de baloncesto de la escuela secundaria en su conjunto, la media debería caer entre 72 y 76 pulgadas en 95 de esas muestras.

Ejemplos de intervalo de confianza

Si los investigadores desean una confianza aún mayor, pueden ampliar el intervalo al 99% de confianza. Si lo hace, invariablemente crea una gama más amplia, ya que deja espacio para un mayor número de medias de muestra. Si establecen el intervalo de confianza del 99% entre 70 y 78 pulgadas, pueden esperar que 99 de las 100 muestras evaluadas contengan un valor medio entre estos números.

Un nivel de confianza del 90%, por otro lado, implica que esperaríamos que el 90% de las estimaciones de intervalo incluyeran el parámetro de población, y así sucesivamente.

Consideraciones Especiales

El mayor error con respecto a los intervalos de confianza es que representan el porcentaje de datos de una muestra determinada que se encuentra entre los límites superior e inferior.

Por ejemplo, se podría interpretar erróneamente que el intervalo de confianza del 99% mencionado anteriormente de 70 a 78 pulgadas indica que el 99% de los datos en una muestra aleatoria se encuentra entre estos números. Esto es incorrecto, aunque existe un método separado de análisis estadístico para hacer tal determinación. Hacerlo implica identificar la desviación estándar y media de la muestra y trazar estas cifras en una curva de campana.