Distribución muestral
¿Qué es una distribución de muestreo?
Una distribución de muestreo es una distribución de probabilidad de una estadística obtenida de un mayor número de muestras extraídas de una población específica. La distribución muestral de una población dada es la distribución de frecuencias de un rango de resultados diferentes que posiblemente podrían ocurrir para una estadística de una población.
En estadística, una población es el conjunto completo del que se extrae una muestra estadística . Una población puede referirse a un grupo completo de personas, objetos, eventos, visitas al hospital o mediciones. Por tanto, se puede decir que una población es una observación agregada de sujetos agrupados por una característica común.
- Una distribución de muestreo es una estadística que se obtiene mediante un muestreo repetido de una población más grande.
- Describe una gama de posibles resultados de una estadística, como la media o la moda de alguna variable, ya que realmente existe una población.
- La mayoría de los datos analizados por los investigadores en realidad se extraen de muestras y no de poblaciones.
Comprensión de la distribución de muestras
Una gran cantidad de datos extraídos y utilizados por académicos, estadísticos, investigadores, comercializadores, analistas, etc. son en realidad muestras, no poblaciones. Una muestra es un subconjunto de una población. Por ejemplo, un investigador médico que quisiera comparar el peso promedio de todos los bebés nacidos en América del Norte entre 1995 y 2005 con los nacidos en América del Sur en el mismo período de tiempo no puede, dentro de un período de tiempo razonable, extraer los datos de toda la población de más de un millón de partos que se produjeron durante el período de diez años. En cambio, solo usará el peso de, digamos, 100 bebés, en cada continente para llegar a una conclusión. El peso de 200 bebés utilizado es la muestra y el peso medio calculado es la media de la muestra.
Ahora suponga que en lugar de tomar solo una muestra de 100 pesos de recién nacidos de cada continente, el investigador médico toma muestras aleatorias repetidas de la población general y calcula la media de la muestra para cada grupo de muestra. Entonces, para América del Norte, obtiene datos para 100 pesos de recién nacidos registrados en los EE. UU., Canadá y México de la siguiente manera: cuatro 100 muestras de hospitales seleccionados en los EE. UU., Cinco 70 muestras de Canadá y tres 150 registros de México, para un total de 1200 pesos de recién nacidos agrupados en 12 juegos. También recopila datos de muestra de 100 pesos al nacer de cada uno de los 12 países de América del Sur.
Cada muestra tiene su propia media muestral y la distribución de las medias muestrales se conoce como distribución muestral.
El peso promedio calculado para cada conjunto de muestras es la distribución muestral de la media. No solo se puede calcular la media a partir de una muestra. Otras estadísticas, como la desviación estándar, la varianza, la proporción y el rango, se pueden calcular a partir de datos de muestra. La desviación estándar y la varianza miden la variabilidad de la distribución muestral.
El número de observaciones en una población, el número de observaciones en una muestra y el procedimiento utilizado para extraer los conjuntos de muestras determinan la variabilidad de una distribución muestral. La desviación estándar de una distribución muestral se denomina error estándar. Si bien la media de una distribución muestral es igual a la media de la población, el error estándar depende de la desviación estándar de la población, el tamaño de la población y el tamaño de la muestra.
Saber cuán separada está la media de cada uno de los conjuntos de muestras entre sí y de la media de la población dará una indicación de qué tan cerca está la media de la muestra de la media de la población. El error estándar de la distribución muestral disminuye a medida que aumenta el tamaño de la muestra.
Consideraciones Especiales
Una población o un conjunto de números de muestra tendrá una distribución normal. Sin embargo, debido a que una distribución de muestreo incluye múltiples conjuntos de observaciones, no necesariamente tendrá una forma de campana curva.
Siguiendo nuestro ejemplo, el peso promedio de la población de bebés en América del Norte y en América del Sur tiene una distribución normal porque algunos bebés tendrán bajo peso (por debajo de la media) o sobrepeso (por encima de la media), y la mayoría de los bebés se ubicarán en el medio (alrededor de la media). ). Si el peso promedio de los recién nacidos en América del Norte es de siete libras, el peso medio de la muestra en cada uno de los 12 conjuntos de observaciones de muestra registradas para América del Norte también estará cerca de las siete libras.
Sin embargo, si grafica cada uno de los promedios calculados en cada uno de los 1200 grupos de muestra, la forma resultante puede resultar en una distribución uniforme, pero es difícil predecir con certeza cuál será la forma real. Cuantas más muestras utilice el investigador de la población de más de un millón de cifras de peso, más comenzará a formar una distribución normal el gráfico.