# Prueba de hipótesis para la diferencia de proporciones Suponga que se tienen $X$ y $Y$ éxitos de dos variables aleatorias binomiales con las siguientes características: - $X$ número de éxitos observados en $n_1$ ensayos cuya probabilidad de éxito es $p_1$. - $Y$ número de éxitos observados en $n_2$ ensayos cuya probabilidad de éxito es $p_2$. En este caso se quiere estudiar la hipótesis nula $H_0: p_1 - p_2 = \delta_0$ y se sospecha que la diferencia de proporciones $p_1 - p_2$ podría estar en alguna de las siguientes situaciones: - $H_a: p_1 - p_2 < \delta_0$ - $H_a: p_1 - p_2 \neq \delta_0$ - $H_a: p_1 - p_2 > \delta_0$ El estadístico para realizar la prueba es: $$ Z_0=\frac{\hat{p}_1 - \hat{p}_2 - \delta_0}{\sqrt{\frac{\hat{p}_{1}(1-\hat{p}_{1})}{n_1} +\frac{\hat{p}_{2}(1-\hat{p}_{2})}{n_2}}}, $$ donde $\hat{p}_1 =X/n_1$ y $\hat{p}_2 =Y/n_2$ corresponden a la proporción de éxitos en una muestra de tamaño $n_1$ y $n_2$, respectivamente. En estas pruebas es común considerar que $\delta_0=0$. En este caso, una práctica estándar es crear una estimación conjunta de las proporciones poblacionales tal que $p_1=p_2$, de tal forma que el estadístico de prueba es: $$ Z_0=\frac{\hat{p}_1 - \hat{p}_2 }{\sqrt{ \hat{p}(1-\hat{p})\left(\frac{1}{n_1} +\frac{1}{n_2} \right)}}, $$ donde $\hat{p}=(X+Y)/(n_1 + n_2)$. Bajo la suposición de que $H_0$ es verdadera, el estadístico $Z_0$ en \eqref{est_difprop2}tiene una distribución aproximadamente normal estándar. Si el valor calculado para el estadístico dado en la ecuación se denota por $z_0$, entonces el valor-$P$ de la prueba se calcula de acuerdo a la hipótesis alterna como: - Si $H_a:p_1 - p_2 < 0$, entonces valor-$P$=$P(z < z_0)$. - Si $H_a:p_1 - p_2 \neq 0$, entonces valor-$P$=$2 \times P(z > \lvert z_0 \rvert)$. - Si $H_a: p_1 - p_2 > 0$, entonces valor-$P$=$P(z > z_0)$. La hipótesis nula $H_0$ se rechaza si el valor-$P$ es menor que el nivel de significancia ($\alpha$).\\ Cuando $\left| \hat{p}_1-\hat{p}_2 \right|> 0.5 \left( 1/n_1 + 1/n_2 \right)$ se usa corrección por continuidad en el estadístico de prueba. Así el estadístico tendrá una expresión diferente: - Si $\hat{p}_1 - \hat{p}_2 > 0$, entonces $$ Z_0=\frac{\hat{p}_1 - \hat{p}_2 - \frac{1}{2} \left( \frac{1}{n_1} + \frac{1}{n_2} \right)}{\sqrt{ \hat{p}(1-\hat{p})\left(\frac{1}{n_1} +\frac{1}{n_2} \right)}}. $$ - Si $\hat{p}_1 - \hat{p}_2 < 0$, entonces $$ Z_0=\frac{\hat{p}_1 - \hat{p}_2 + \frac{1}{2} \left( \frac{1}{n_1} + \frac{1}{n_2} \right)}{\sqrt{ \hat{p}(1-\hat{p})\left(\frac{1}{n_1} +\frac{1}{n_2} \right)}}. $$ El criterio del valor-$P$ será el mismo utilizado cuando no se usa corrección por continuidad.