Estadísticas no paramétricas
¿Qué son las estadísticas no paramétricas?
La estadística no paramétrica se refiere a un método estadístico en el que no se supone que los datos provengan de modelos prescritos que están determinados por una pequeña cantidad de parámetros; ejemplos de tales modelos incluyen el modelo de distribución normal y el modelo de regresión lineal. Las estadísticas no paramétricas a veces usan datos ordinales, lo que significa que no se basan en números, sino más bien en una clasificación u orden de clases. Por ejemplo, una encuesta que transmita preferencias de los consumidores que van desde lo que les gusta hasta lo que no les gusta se consideraría datos ordinales.
La estadística no paramétrica incluye estadística descriptiva no paramétrica, modelos estadísticos, inferencia y pruebas estadísticas. La estructura del modelo de los modelos no paramétricos no se especifica a priori, sino que se determina a partir de los datos. El término no paramétrico no significa que tales modelos carecen por completo de parámetros, sino que el número y la naturaleza de los parámetros son flexibles y no se fijan de antemano. Un histograma es un ejemplo de una estimación no paramétrica de una distribución de probabilidad.
Conclusiones clave
- Las estadísticas no paramétricas son fáciles de usar pero no ofrecen la precisión milimétrica de otros modelos estadísticos.
- Este tipo de análisis suele ser más adecuado cuando se considera el orden de algo, donde incluso si los datos numéricos cambian, es probable que los resultados sigan siendo los mismos.
Comprensión de las estadísticas no paramétricas
En estadística, la estadística paramétrica incluye parámetros como la media, la desviación estándar, la correlación de Pearson, la varianza, etc. Esta forma de estadística utiliza los datos observados para estimar los parámetros de la distribución. En las estadísticas paramétricas, a menudo se supone que los datos provienen de una distribución normal con parámetros desconocidos μ (media de la población) y σ2 (varianza de la población), que luego se estiman utilizando la media de la muestra y la varianza de la muestra.
La estadística no paramétrica no presupone el tamaño de la muestra o si los datos observados son cuantitativos.
Las estadísticas no paramétricas no asumen que los datos se extraen de una distribución normal. En cambio, la forma de la distribución se estima bajo esta forma de medición estadística. Si bien hay muchas situaciones en las que se puede suponer una distribución normal, también hay algunos escenarios en los que el verdadero proceso de generación de datos está lejos de estar distribuido normalmente.
Ejemplos de estadísticas no paramétricas
En el primer ejemplo, considere un analista financiero que desea estimar el valor en riesgo (VaR) de una inversión. El analista recopila datos de ganancias de cientos de inversiones similares en un horizonte temporal similar. En lugar de suponer que los ingresos siguen una distribución normal, utiliza el histograma para estimar la distribución de forma no paramétrica. El percentil 5 de este histograma proporciona al analista una estimación no paramétrica del VaR.
Para un segundo ejemplo, considere un investigador diferente que quiere saber si el promedio de horas de sueño está relacionado con la frecuencia con la que uno se enferma. Debido a que muchas personas se enferman raras veces, si es que lo hacen, y otras ocasionalmente se enferman con mucha más frecuencia que la mayoría de las demás, la distribución de la frecuencia de la enfermedad es claramente anormal, está sesgada hacia la derecha y es propensa a valores atípicos. Por lo tanto, en lugar de utilizar un método que asume una distribución normal para la frecuencia de la enfermedad, como se hace en el análisis de regresión clásico, por ejemplo, el investigador decide utilizar un método no paramétrico como el análisis de regresión por cuantiles.
Consideraciones Especiales
Las estadísticas no paramétricas han ganado reconocimiento debido a su facilidad de uso. A medida que se alivia la necesidad de parámetros, los datos se vuelven más aplicables a una mayor variedad de pruebas. Este tipo de estadísticas se puede utilizar sin la media, el tamaño de la muestra, la desviación estándar o la estimación de cualquier otro parámetro relacionado cuando no se dispone de esa información.
Dado que las estadísticas no paramétricas hacen menos suposiciones sobre los datos de muestra, su aplicación tiene un alcance más amplio que las estadísticas paramétricas. En los casos en que las pruebas paramétricas sean más apropiadas, los métodos no paramétricos serán menos eficientes. Esto se debe a que las estadísticas no paramétricas descartan parte de la información que está disponible en los datos, a diferencia de las estadísticas paramétricas.