Prueba P
¿Qué es una prueba P?
Una prueba P es un método estadístico que prueba la validez de la hipótesis nula, que establece una afirmación comúnmente aceptada sobre una población. Aunque el término nulo es un poco engañoso, el objetivo es probar el hecho aceptado intentando refutarlo o anularlo. La prueba P puede proporcionar la evidencia que puede rechazar o no rechazar (las estadísticas hablan de «no concluyente») una afirmación ampliamente aceptada.
El resultado de una prueba P es un valor p. El valor p se utiliza como heurística del nivel más pequeño de significancia en el que se rechazaría la hipótesis nula. Un valor p más pequeño significa que hay pruebas más sólidas a favor de la hipótesis alternativa y que la nula debe rechazarse.
Conclusiones clave
- Una prueba P es un método estadístico que prueba la validez de la hipótesis nula que establece una afirmación comúnmente aceptada sobre una población.
- Cuanto menor sea el valor p, mayor será la evidencia de que la hipótesis nula debe rechazarse y de que la hipótesis alternativa podría ser más creíble.
- El estadístico de la prueba P generalmente sigue una distribución normal estándar cuando se utilizan tamaños de muestra grandes.
Comprensión de las pruebas P
Una prueba P calcula un valor que permite al investigador determinar la credibilidad de la afirmación aceptada. Este valor p correspondiente se compara con un cierto nivel de significación estadística (conocido como nivel de confianza o alfa [α]), que el investigador ha elegido para medir la aleatoriedad de los resultados. El estadístico de la prueba P generalmente sigue una distribución normal estándar cuando se utilizan tamaños de muestra grandes.
Los investigadores generalmente elegirán niveles alfa del 5% o menos, lo que se traduce en niveles de confianza del 95% o más. En otras palabras, un valor p menor que un nivel alfa del 5% significa que existe una probabilidad superior al 95% de que sus resultados no sean aleatorios, lo que aumenta la importancia de sus resultados. Esta es la evidencia que permitiría al investigador rechazar la hipótesis nula.
- Cuanto menor sea el valor p (valor p <alfa), mayor será la evidencia de que la hipótesis nula debe rechazarse y que la hipótesis alternativa podría ser más creíble.
- Cuanto mayor sea el valor p (valor p> alfa), más débil será la evidencia contra la hipótesis nula, lo que significa que no se puede rechazar, lo que hace que la prueba no sea concluyente.
Pruebas de valores p e hipótesis nulas
Al realizar una prueba de hipótesis para validar una afirmación, el investigador postula dos hipótesis: nula (H 0 ) y alternativa (H 1 ). La formulación de hipótesis nula y alternativa es clave para la utilidad que una prueba P puede ofrecer al investigador.
La hipótesis nula establece una creencia o premisa comúnmente sostenida que el investigador prueba para ver si puede rechazarla. El punto clave a comprender es que el investigador siempre quiere rechazar la hipótesis nula y la prueba P lo ayuda a lograr este objetivo. Otro punto a tener en cuenta es que si la prueba P no rechaza la hipótesis nula, entonces se considera que la prueba no es concluyente y de ninguna manera pretende ser una afirmación de la hipótesis nula.
La hipótesis alternativa es la explicación diferente planteada por el investigador para explicar mejor el fenómeno que se investiga. Como tal, debe ser la única o la mejor explicación alternativa posible. De esta manera, si el valor p valida un rechazo de la hipótesis nula, entonces la hipótesis alternativa puede considerarse creíble.
P-valores se pueden generar usando varios tipos de pruebas estadísticas comunes tales utilizando las pruebas t y pruebas z.
Ejemplo del mundo real de valor P
Suponga que un inversor afirma que el rendimiento de su cartera de inversiones es equivalente al del índice Standard & Poor’s (S&P) 500. Para determinar esto, el inversor realiza una prueba de dos colas. La hipótesis nula establece que los rendimientos de la cartera son equivalentes a los rendimientos del S&P 500 durante un período específico, mientras que la hipótesis alternativa establece que los rendimientos de la cartera y los rendimientos del S&P 500 no son equivalentes. (Si el inversor realizó una prueba de una cola, la hipótesis alternativa indicaría que los rendimientos de la cartera son menores o mayores que los rendimientos del S&P 500).
Una prueba P no necesariamente hace uso de un nivel de confianza preseleccionado en el que el inversor debería rechazar la hipótesis nula de que los rendimientos son equivalentes. En cambio, proporciona una medida de cuánta evidencia hay para rechazar la hipótesis nula (o no). Cuanto menor sea el valor p generado a partir de la prueba P, mayor será la evidencia en contra de la hipótesis nula. Por lo tanto, si el inversionista encuentra que el valor p es <0.01, hay evidencia bastante fuerte en contra de la hipótesis nula, y el inversionista puede concluir con confianza que los rendimientos de la cartera y los rendimientos del S&P 500 no son equivalentes.
Aunque esto no proporciona un umbral exacto sobre cuándo el inversor debe aceptar o rechazar la hipótesis nula, tiene otra ventaja muy práctica. La prueba de hipótesis de valor P ofrece una forma directa de comparar la confianza relativa que el inversor puede tener al elegir entre varios tipos diferentes de inversiones o carteras, en relación con un índice de referencia como el S&P 500. Por ejemplo, para dos carteras, A y B, cuyo rendimiento difiere del S&P 500 con valores p de 0,10 y 0,01 respectivamente, el inversor puede estar mucho más seguro de que la cartera B, con un valor p más bajo, mostrará resultados consistentemente diferentes.