Prueba de dos colas
¿Qué es una prueba de dos colas?
En estadística, una prueba de dos colas es un método en el que el área crítica de una distribución es de dos lados y prueba si una muestra es mayor o menor que un cierto rango de valores. Se utiliza en pruebas de hipótesis nulas y pruebas de significancia estadística. Si la muestra que se está probando cae en alguna de las áreas críticas, se acepta la hipótesis alternativa en lugar de la hipótesis nula.
Conclusiones clave
- En estadística, una prueba de dos colas es un método en el que el área crítica de una distribución es de dos caras y prueba si una muestra es mayor o menor que un rango de valores.
- Se utiliza en pruebas de hipótesis nulas y pruebas de significancia estadística.
- Si la muestra que se está probando cae en alguna de las áreas críticas, se acepta la hipótesis alternativa en lugar de la hipótesis nula.
- Por convención, las pruebas de dos colas se utilizan para determinar la significancia al nivel del 5%, lo que significa que cada lado de la distribución se reduce al 2,5%.
Comprensión de una prueba de dos colas
Un concepto básico de la estadística inferencial es la prueba de hipótesis, que determina si una afirmación es verdadera o no, dado un parámetro de población. Una prueba de hipótesis diseñada para mostrar si la media de una muestra es significativamente mayor y significativamente menor que la media de una población se denomina prueba de dos colas. La prueba de dos colas recibe su nombre de probar el área debajo de ambas colas de una distribución normal, aunque la prueba se puede utilizar en otras distribuciones no normales.
Una prueba de dos colas está diseñada para examinar ambos lados de un rango de datos especificado según lo designado por la distribución de probabilidad involucrada. La distribución de probabilidad debe representar la probabilidad de un resultado específico basado en estándares predeterminados. Esto requiere el establecimiento de un límite que designe los valores de variable aceptados más altos (o superiores) y más bajos (o más bajos) incluidos dentro del rango. Cualquier punto de datos que exista por encima del límite superior o por debajo del límite inferior se considera fuera del rango de aceptación y en un área denominada rango de rechazo.
No existe un estándar inherente con respecto al número de puntos de datos que deben existir dentro del rango de aceptación. En los casos en que se requiera precisión, como en la creación de medicamentos farmacéuticos, se puede establecer una tasa de rechazo del 0,001% o menos. En los casos en que la precisión es menos crítica, como la cantidad de alimentos en una bolsa de producto, una tasa de rechazo del 5% puede ser apropiada.
Muestreo aleatorio
Una prueba de dos colas también se puede utilizar prácticamente durante ciertas actividades de producción en una empresa, como con la producción y envasado de dulces en una instalación en particular. Si la planta de producción designa 50 dulces por bolsa como su meta, con una distribución aceptable de 45 a 55 dulces, cualquier bolsa que se encuentre con una cantidad inferior a 45 o superior a 55 se considera dentro del rango de rechazo.
Para confirmar que los mecanismos de empaque están calibrados correctamente para cumplir con el resultado esperado, se puede tomar un muestreo aleatorio para confirmar la precisión. Una muestra aleatoria simple toma una pequeña porción aleatoria de toda la población para representar el conjunto de datos completo, donde cada miembro tiene la misma probabilidad de ser elegido.
Para que los mecanismos de envasado se consideren precisos, se desea una media de 50 caramelos por bolsa con una distribución adecuada. Además, el número de bolsas que se encuentran dentro del rango de rechazo debe estar dentro del límite de distribución de probabilidad considerado aceptable como tasa de error. Aquí, la hipótesis nula sería que la media es 50 mientras que la hipótesis alternativa sería que no es 50.
Si, después de realizar la prueba de dos colas, la puntuación z cae en la región de rechazo, lo que significa que la desviación está demasiado lejos de la media deseada, es posible que se requieran ajustes en la instalación o en el equipo asociado para corregir el error. El uso regular de métodos de prueba de dos colas puede ayudar a garantizar que la producción se mantenga dentro de los límites a largo plazo.
Tenga cuidado de notar si una prueba estadística es de una o dos colas, ya que esto influirá en gran medida en la interpretación de un modelo.
Dos colas vs. Prueba de una cola
Cuando se configura una prueba de hipótesis para mostrar que la media de la muestra sería mayor o menor que la media de la población, esto se denomina prueba de una cola. La prueba de una cola recibe su nombre de probar el área debajo de una de las colas (lados) de una distribución normal. Cuando se usa una prueba de una cola, un analista está probando la posibilidad de la relación en una dirección de interés y descartando por completo la posibilidad de una relación en otra dirección.
Si la muestra que se está probando cae en el área crítica unilateral, se aceptará la hipótesis alternativa en lugar de la hipótesis nula. Una prueba de una cola también se conoce como hipótesis direccional o prueba direccional.
Una prueba de dos colas, por otro lado, está diseñada para examinar ambos lados de un rango de datos específico para probar si una muestra es mayor o menor que el rango de valores.
Ejemplo de una prueba de dos colas
Como ejemplo hipotético, imagine que un nuevo corredor de bolsa (XYZ) afirma que sus tarifas de corretaje son más bajas que las de su actual corredor de bolsa (ABC). Los datos disponibles de una firma de investigación independiente indican que la media y la desviación estándar de todos los clientes de corredores de ABC son $ 18 y $ 6, respectivamente.
Se toma una muestra de 100 clientes de ABC y se calculan los cargos de corretaje con las nuevas tarifas del broker XYZ. Si la media de la muestra es de $ 18,75 y la desviación estándar de la muestra es de $ 6, ¿se puede hacer alguna inferencia sobre la diferencia en la factura de intermediación promedio entre el corredor ABC y XYZ?
- H 0 : Hipótesis nula: media = 18
- H 1 : Hipótesis alternativa: media 18 (Esto es lo que queremos probar).
- Región de rechazo: Z = Z 2.5 (asumiendo un nivel de significancia del 5%, dividir 2.5 en cada lado).
- Z = (media de la muestra – media) / (std-dev / sqrt (no. De muestras)) = (18,75 – 18) / (6 / (sqrt (100)) = 1,25
Este valor Z calculado cae entre los dos límites definidos por: – Z 2.5 = -1.96 y Z 2.5 = 1.96.
Esto concluye que no hay evidencia suficiente para inferir que existe alguna diferencia entre las tarifas de su corredor actual y las del nuevo corredor. Por tanto, la hipótesis nula no puede rechazarse. Alternativamente, el valor p = P (Z 1.25) = 2 * 0.1056 = 0.2112 = 21.12%, que es mayor que 0.05 o 5%, lleva a la misma conclusión.
Preguntas frecuentes
¿Cómo se diseña una prueba de dos colas?
Una prueba de dos colas está diseñada para determinar si una afirmación es verdadera o no, dado un parámetro de población. Examina ambos lados de un rango de datos especificado según lo designado por la distribución de probabilidad involucrada. Como tal, la distribución de probabilidad debe representar la probabilidad de un resultado específico basado en estándares predeterminados. Esto requiere el establecimiento de un límite que designe los valores de variable aceptados más altos (o superiores) y más bajos (o más bajos) incluidos dentro del rango. Cualquier punto de datos que exista por encima del límite superior o por debajo del límite inferior se considera fuera del rango de aceptación y la reclamación se rechaza.
¿Cuál es la diferencia entre una prueba de dos colas y una de una cola?
Una prueba de hipótesis de dos colas está diseñada para mostrar si la media de la muestra es significativamente mayor y significativamente menor que la media de una población. La prueba de dos colas recibe su nombre de probar el área debajo de ambas colas (lados) de una distribución normal. Por otro lado, se establece una prueba de hipótesis de una cola para mostrar que la media de la muestra sería mayor o menor que la media de la población. La prueba de una cola recibe su nombre de probar el área debajo de una de las colas de una distribución normal.
¿Qué es una puntuación Z?
Una puntuación Z describe numéricamente la relación de un valor con la media de un grupo de valores y se mide en términos del número de desviaciones estándar de la media. Si una puntuación Z es 0, indica que la puntuación del punto de datos es idéntica a la puntuación media, mientras que las puntuaciones Z de 1,0 y -1,0 indicarían valores una desviación estándar por encima o por debajo de la media. En la mayoría de los conjuntos de datos grandes, el 99% de los valores tienen una puntuación Z entre -3 y 3, lo que significa que se encuentran dentro de tres desviaciones estándar por encima y por debajo de la media.