Definición estadística de chi-cuadrado (χ2)
¿Qué es una estadística de chi-cuadrado?
Una estadística de chi-cuadrado ( χ 2 ) es una prueba que mide cómo se compara un modelo con los datos observados reales. Los datos utilizados para calcular una estadística de chi-cuadrado deben ser aleatorios, sin procesar, mutuamente excluyentes, extraídos de variables independientes y extraídos de una muestra lo suficientemente grande. Por ejemplo, los resultados de lanzar una moneda justa cumplen con estos criterios.
Las pruebas de chi-cuadrado se utilizan a menudo en las pruebas de hipótesis. La estadística de chi-cuadrado compara el tamaño de las discrepancias entre los resultados esperados y los resultados reales, dado el tamaño de la muestra y el número de variables en la relación. Para estas pruebas, los grados de libertad se utilizan para determinar si una determinada hipótesis nula puede rechazarse en función del número total de variables y muestras dentro del experimento. Como ocurre con cualquier estadística, cuanto mayor sea el tamaño de la muestra, más fiables serán los resultados.
Conclusiones clave
- Una estadística de chi-cuadrado ( χ 2 ) es una medida de la diferencia entre las frecuencias observadas y esperadas de los resultados de un conjunto de eventos o variables.
- χ 2 depende del tamaño de la diferencia entre los valores reales y observados, los grados de libertad y el tamaño de las muestras.
- χ 2 se puede utilizar para probar si dos variables están relacionadas o son independientes entre sí o para probar la bondad de ajuste entre una distribución observada y una distribución teórica de frecuencias.
La fórmula para chi-cuadrado es
¿Qué te dice una estadística de chi-cuadrado?
Hay dos tipos principales de pruebas de chi-cuadrado: la prueba de independencia, que plantea una cuestión de relación, como «¿Existe una relación entre el sexo del estudiante y la elección del curso?»; y la prueba de bondad de ajuste, que pregunta algo como «¿Qué tan bien coincide la moneda en mi mano con una moneda teóricamente justa?»
Independencia
Al considerar el sexo del estudiante y la elección del curso, se podría utilizar una prueba de independencia de χ 2. Para hacer esta prueba, el investigador recopilaría datos sobre las dos variables elegidas (sexo y cursos elegidos) y luego compararía las frecuencias en las que los estudiantes masculinos y femeninos seleccionan entre las clases ofrecidas utilizando la fórmula dada anteriormente y una tabla estadística χ 2.
Si no existe una relación entre el sexo y la selección del curso (es decir, si son independientes), entonces se debe esperar que las frecuencias reales en las que los estudiantes masculinos y femeninos seleccionen cada curso ofrecido sean aproximadamente iguales o, a la inversa, la proporción de hombres y mujeres. las estudiantes mujeres en cualquier curso seleccionado deben ser aproximadamente iguales a la proporción de estudiantes hombres y mujeres en la muestra. Una prueba de χ 2 para la independencia puede decirnos qué tan probable es que la probabilidad aleatoria pueda explicar cualquier diferencia observada entre las frecuencias reales en los datos y estas expectativas teóricas.
Bondad de ajuste
χ 2 proporciona una manera de probar qué tan bien una muestra de datos coincide con las características (conocidas o supuestas) de la población más grande que la muestra pretende representar. Si los datos de la muestra no se ajustan a las propiedades esperadas de la población que nos interesa, entonces no querríamos usar esta muestra para sacar conclusiones sobre la población más grande.
Por ejemplo, considere una moneda imaginaria con exactamente 50/50 de posibilidades de que salga cara o cruz y una moneda real que lance 100 veces. Si esta moneda real tiene un valor justo, entonces también tendrá la misma probabilidad de caer en ambos lados, y el resultado esperado de lanzar la moneda 100 veces es que las caras saldrán 50 veces y las cruz 50 veces. En este caso, χ 2 puede decirnos qué tan bien se comparan los resultados reales de 100 lanzamientos de moneda con el modelo teórico de que una moneda justa dará resultados de 50/50. El lanzamiento real podría ser 50/50, 60/40 o incluso 90/10. Cuanto más lejos estén los resultados reales de los 100 lanzamientos de 50/50, menos bueno será el ajuste de este conjunto de lanzamientos a la expectativa teórica de 50/50 y más probable es que podamos concluir que esta moneda no es realmente una moneda justa. moneda.