20 abril 2021 6:38

Definición de media Winsorizada

¿Qué es la media Winsorizada?

La media Winsorizada es un método de promediar que inicialmente reemplaza los valores más pequeños y más grandes con las observaciones más cercanas a ellos. Esto se hace para limitar el efecto de valores atípicos o valores extremos anormales, o valores atípicos, en el cálculo. Después de reemplazar los valores, la fórmula de la media aritmética se usa para calcular la media ganada.

conclusiones clave

  • La media winsorizada es un método de promediado que implica reemplazar los valores más pequeños y más grandes de un conjunto de datos con las observaciones más cercanas a ellos.
  • Mitiga los efectos de los valores atípicos reemplazándolos por valores menos extremos.
  • La media ganadera no es la misma que la media recortada, que implica eliminar puntos de datos en lugar de reemplazarlos, aunque los resultados de los dos tienden a ser parecidos.

Fórmula para la media Winsorizada

Las medias Winsorizadas se expresan de dos formas. Una «k n » media winorizada se refiere al reemplazo de ‘k’ observaciones más pequeñas y más grandes, donde ‘k’ es un número entero. Una media de «X%» ganada implica reemplazar un porcentaje dado de valores de ambos extremos de los datos.

La media ganadera se logra reemplazando los puntos de datos más pequeños y más grandes, luego sumando todos los puntos de datos y dividiendo la suma por el número total de puntos de datos.

¿Qué te dice el significado de Winsorized?

La media winsorizada es menos sensible a los valores atípicos porque puede reemplazarlos con valores menos extremos. Es decir, es menos susceptible a valores atípicos que el promedio aritmético. Sin embargo, si una distribución tiene colas gruesas, el efecto de eliminar los valores más alto y más bajo de la distribución tendrá poca influencia debido al alto grado de variabilidad en las cifras de distribución.

Ejemplo de cómo utilizar la media Winsorizada

Calculemos la media winorizada para el siguiente conjunto de datos: 1, 5, 7, 8, 9, 10, 34. En este ejemplo, asumimos que la media winorizada está en el primer orden, en el que reemplazamos los valores más pequeños y más grandes con sus observaciones más cercanas.

El conjunto de datos ahora aparece de la siguiente manera: 5, 5, 7, 8, 9, 10, 10. Tomar un promedio aritmético del nuevo conjunto produce una media ganada de 7.7, o (5 + 5 + 7 + 8 + 9 + 10 + 10) dividido por 7. Tenga en cuenta que la media aritmética tendría mayor – 10,6. La media ganada reduce efectivamente la influencia del valor 34 como un valor atípico.

O considere una media ganadera del 20% que toma el 10% superior y el 10% inferior y los reemplaza con su siguiente valor más cercano. Ordenaremos el siguiente conjunto de datos: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Los dos los puntos de datos más pequeños y más grandes (el 10% de los 20 puntos de datos) serán reemplazados por su siguiente valor más cercano. Por lo tanto, el nuevo conjunto de datos es el siguiente: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. La media ganada es 33,9, o el total de los datos (678) dividido por el número total de puntos de datos (20).

Media Winsorizada frente a Media recortada

La media ganada incluye la modificación de puntos de datos, mientras que la media recortada implica la eliminación de puntos de datos. Es común que la media winorizada y la media recortada estén cerca o, a veces, tengan el mismo valor entre sí.

Limitaciones de la media Winsorizada

Una desventaja importante de los medios ganadores es que, naturalmente, introducen algún sesgo en el conjunto de datos. Al reducir la influencia de los valores atípicos, el análisis se modifica para un mejor análisis, pero también elimina información sobre los datos subyacentes.