Estadísticas descriptivas
¿Qué son las estadísticas descriptivas?
Las estadísticas descriptivas son coeficientes descriptivos breves que resumen un conjunto de datos dado, que puede ser una representación de la totalidad o una muestra de una población. Las estadísticas descriptivas se dividen en medidas de tendencia central y medidas de variabilidad (dispersión). Las medidas de tendencia central incluyen la media, la mediana y la moda, mientras que las medidas de variabilidad incluyen curtosis y la asimetría.
Conclusiones clave
- La estadística descriptiva resume o describe las características de un conjunto de datos.
- La estadística descriptiva consta de dos categorías básicas de medidas: medidas de tendencia central y medidas de variabilidad (o dispersión).
- Las medidas de tendencia central describen el centro de un conjunto de datos.
- Las medidas de variabilidad o dispersión describen la dispersión de datos dentro del conjunto.
Comprensión de la estadística descriptiva
En resumen, las estadísticas descriptivas ayudan a describir y comprender las características de un conjunto de datos específico al brindar breves resúmenes sobre la muestra y las medidas de los datos. Los tipos más reconocidos de estadística descriptiva son las medidas de centro: la media, la mediana y la moda, que se utilizan en casi todos los niveles de matemáticas y estadística. La media, o el promedio, se calcula sumando todas las cifras dentro del conjunto de datos y luego dividiendo por el número de cifras dentro del conjunto. Por ejemplo, la suma del siguiente conjunto de datos es 20: (2, 3, 4, 5, 6). La media es 4 (20/5). La moda de un conjunto de datos es el valor que aparece con mayor frecuencia y la mediana es la cifra situada en el medio del conjunto de datos. Es la figura que separa las cifras más altas de las más bajas dentro de un conjunto de datos. Sin embargo, existen tipos menos comunes de estadística descriptiva que siguen siendo muy importantes.
Las personas usan estadísticas descriptivas para reutilizar conocimientos cuantitativos difíciles de entender a través de un gran conjunto de datos en descripciones del tamaño de un bocado. El promedio de calificaciones de un estudiante (GPA), por ejemplo, proporciona una buena comprensión de las estadísticas descriptivas. La idea de un GPA es que toma puntos de datos de una amplia gama de exámenes, clases y calificaciones, y los promedia juntos para proporcionar una comprensión general del rendimiento académico general de un estudiante. El GPA personal de un estudiante refleja su rendimiento académico medio.
Medidas de estadística descriptiva
Todas las estadísticas descriptivas son medidas de tendencia central o medidas de variabilidad, también conocidas como medidas de dispersión. Las medidas de tendencia central se centran en los valores medios o medios de los conjuntos de datos, mientras que las medidas de variabilidad se centran en la dispersión de los datos. Estas dos medidas utilizan gráficos, tablas y discusiones generales para ayudar a las personas a comprender el significado de los datos analizados.
Las medidas de tendencia central describen la posición central de una distribución para un conjunto de datos. Una persona analiza la frecuencia de cada punto de datos en la distribución y la describe utilizando la media, la mediana o la moda, que mide los patrones más comunes del conjunto de datos analizados.
Las medidas de variabilidad, o las medidas de dispersión, ayudan a analizar qué tan dispersa está la distribución para un conjunto de datos. Por ejemplo, si bien las medidas de tendencia central pueden dar a una persona el promedio de un conjunto de datos, no describen cómo se distribuyen los datos dentro del conjunto. Entonces, si bien el promedio de los datos puede ser 65 de 100, todavía puede haber puntos de datos tanto en 1 como en 100. Las medidas de variabilidad ayudan a comunicar esto al describir la forma y la extensión del conjunto de datos. El rango, los cuartiles, la desviación absoluta y la varianza son ejemplos de medidas de variabilidad.
Considere el siguiente conjunto de datos: 5, 19, 24, 62, 91, 100. El rango de ese conjunto de datos es 95, que se calcula restando el número más bajo (5) en el conjunto de datos del más alto (100).
Preguntas frecuentes
¿Por qué necesitamos estadísticas que simplemente describan datos?
Las estadísticas descriptivas se utilizan para describir o resumir las características de una muestra o conjunto de datos, como la media, la desviación estándar o la frecuencia de una variable. Estadística inferencial. Este tipo de estadísticas puede ayudarnos a comprender las propiedades colectivas de los elementos de una muestra de datos. Estas medidas pueden darnos una idea sobre la distribución de probabilidad , o la «forma» general de los datos, que se puede representar en un gráfico como un histograma o un diagrama de puntos. Conocer la media muestral, la varianza y la distribución de una variable puede ayudarnos a comprender el mundo que nos rodea.
¿Qué son la desviación estándar y la media?
Estos son dos estadísticos descriptivos comúnmente empleados. La media es el nivel promedio observado en algún dato, mientras que la desviación estándar describe la varianza, o cuán dispersos se distribuyen los datos observados en esa variable alrededor de su media.
¿Se pueden usar estadísticas descriptivas para hacer inferencias o predicciones?
No. Si bien estos descriptivos son útiles para comprender los atributos de los datos, se requieren técnicas estadísticas inferenciales, una rama separada de la estadística, para comprender cómo las variables interactúan entre sí en un conjunto de datos.