R: La prueba t.

Una vez que hemos aprendido a calcular los intervalos de confianza podemos definir un entorno donde pudiera vivir nuestro parámetro poblacional, sin embargo, es necesario definir un elemento que nos permita usar este entorno para determinar si el planteamiento de nuestra investigación, se ajusta a la estimación que hemos hecho.

La idea básica de las pruebas de significancia es la de definir un estadístico de prueba y su distribución muestral según la hipótesis nula. La decisión de rechazar o no rechazar la hipótesis nula se toma con base en el valor del estadístico de prueba obtenido con los datos disponibles.

Anuncios

Prueba de significancia de los coeficientes de regresión: la prueba t

Con el supuesto de normalidad de u_i, los estimadores de MCO \hat{\beta}_1 y \hat{\beta}_2 son en sí mismos normalmente distribuidos con sus medias y varianzas correspondientes. Por consiguiente, la variable

t = \dfrac{\hat{\beta}_i - \beta_i}{ee(\hat{\beta}_i)} = \dfrac{(\hat{\beta}_i - \beta_i) \sqrt{\sum x_i^2}}{\hat{\sigma}}

Sigue la distribución t con n - 2 grados de libertad. Si el valor del verdadero \beta_i se especifica con la hipótesis nula, el valor t se calcula fácilmente a partir de la muestra disponible y, por consiguiente, sirve como estadístico de prueba.

Y como este estadístico de prueba sigue una distribución t, caben afirmaciones sobre los intervalos de confianza como la siguiente:

P \left[ -t_{\alpha/2} \leq \dfrac{\hat{\beta}_i - \beta^*_i}{ee(\hat{\beta}_i)} \leq t_{\alpha/2} \right] = 1-\alpha

donde \beta^*_i es el valor de \beta_i que se plantea en la hipótesis nula H_0 y -t_{\alpha/2} y t_{\alpha/2} son los valores de t (los valores críticos de t) obtenidos de la tabla t para un nivel de significancia (\alpha/2) y n-2 grados de libertad.

Reescribiendo la inecuación involucrada, tenemos que

P \left[ \beta^*_i - t_{\alpha/2} ee(\hat{\beta}_i) \leq  \hat{\beta}_i  \leq \beta^*_i + t_{\alpha/2} ee(\hat{\beta}_i) \right] = 1-\alpha

obteniendo así, el intervalo en el cual se encontrará \hat{\beta}_i con probabilidad 1-\alpha, dado \hat{\beta}_i = \beta^*_i.

Calculamos los valores críticos en R usando la siguiente sintaxis:

li.H0.betai <- betai - qt(alpha/2, df=length(escolaridad)-2,lower.tail=F)*ee.betai
ls.H0.betai <- betai + qt(alpha/2, df=length(escolaridad)-2,lower.tail=F)*ee.betai

En el lenguaje de pruebas de hipótesis, este intervalo de confianza a 100(1 -\alpha)\% se conoce como la región de no rechazo (de la hipótesis nula H_0), y la región que queda fuera del intervalo de confianza conoce como región de rechazo (de la hipótesis nula H_0) o región crítica.

Prueba de Hipótesis, estadístico t | totumat.com

Los límites de confianza dados por los puntos extremos del intervalo de confianza se llaman también valores críticos.

Ahora se aprecia la estrecha conexión entre los enfoques de intervalo de confianza y prueba de significancia para realizar pruebas de hipótesis, pues al compararlos, tenemos que:

En el enfoque de intervalo de confianza se trata de establecer un rango o intervalo que tenga una probabilidad determinada de contener al verdadero aunque desconocido \beta_i

P \left[ \hat{\beta}_i - t_{\alpha/2} ee(\hat{\beta}_i) \leq \beta_i \leq \hat{\beta}_i + t_{\alpha/2} ee(\hat{\beta}_i) \right] = 1-\alpha

En el enfoque de prueba de significancia se somete a hipótesis algún valor de \beta_i y se ve si el estimador \hat{\beta}_i calculado se encuentra dentro de los límites (de confianza) razonables alrededor del valor sometido a hipótesis.

P \left[ \beta^*_i - t_{\alpha/2} ee(\hat{\beta}_i) \leq \hat{\beta}_i  \leq \beta^*_i + t_{\alpha/2} ee(\hat{\beta}_i) \right] = 1-\alpha

Sin embargo, en la práctica, no hay necesidad de estimar este intervalo explícitamente. Se calcula el valor de t y se ve si cae entre los valores críticos t o fuera de ellos y calculamos el valor de t en R usando la siguiente sintaxis:

t.c <- (betai - H0.betai)/ee.betai
Prueba de Hipótesis, estadístico t | totumat.com

Ejemplo

Consideremos un pequeño conjunto de datos, particularmente, los datos que se encuentran en la Tabla 3.2 del libro de Econometría de Damodar N. Gujarati and Dawn Porter en su quinta edición. Este conjunto de datos proporciona los datos primarios que se necesitan para estimar el efecto cuantitativo de la escolaridad en los salarios:

ObservaciónSalarioEscolaridad
14.45676
25.777
35.97878
47.33179
57.318210
66.584411
77.818212
87.835113
911.022314
1010.673815
1110.836116
1213.61517
1313.53118
Tabla 3.2

Sabiendo que \hat{\beta}_2 = 0.7240, ee(\hat{\beta}_2) = 0.0700 y gl=11. Si consideramos \alpha=5\%, entonces t_{\alpha/2}=2.201.

Considerando la hipótesis nula H_0 : \beta_2 = \beta_2^* = 0.5 y la hipótesis alternativa H_1:\beta_2 \neq 0.5, calculamos los valores críticos en R usando la siguiente sintaxis:

H0.beta2 <- 0.5
li.H0.beta2 <- H0.beta2 - qt(alpha/2, df=length(escolaridad)-2,lower.tail=F)*ee.beta2
ls.H0.beta2 <- H0.beta2 + qt(alpha/2, df=length(escolaridad)-2,lower.tail=F)*ee.beta2

Una vez ejecutadas estas instrucciones, obtenemos que

P (0.3460 \leq \hat{\beta}_2 \leq 0.6540) = 1-\alpha

De forma gráfica, podemos expresar esta probabilidad así

Prueba de Hipótesis, estadístico t | totumat.com

Notamos entonces, que el valor \hat{\beta}_2 = 0.7240 está en la región de rechazo, por lo tanto, se rechaza la hipótesis nula H_0.

Veamos ahora, qué es lo que ocurre con el valor que hemos calculado de t. ¿Cae entre los valores críticos t o fuera de ellos? t = \frac{0.7240 - 0.5}{0.0700} = 3.2. Calculamos el valor de t en R usando la siguiente sintaxis:

H0.beta2 <- 0.5
t.c <- (beta2 - H0.beta2)/ee.beta2

En el siguiente gráfico, vemos con claridad que el valor se encuentra en la región crítica y la conclusión se mantiene; es decir, rechazamos H_0.

Prueba de Hipótesis, estadístico t | totumat.com

En su pantalla debería aparecer:

Prueba de Hipótesis, estadístico t | totumat.com

Notas:

Observe que si el \beta_i estimado es igual al \beta_i hipotético, el valor t será cero. Por otra parte, a la medida en que el valor de \beta_2 estimado se aleje del valor hipotético de \beta_2, el |t| será cada vez mayor. Por consiguiente, un valor grande de |t| nos permite rechazar la hipótesis nula con mayor confianza.

En la práctica, se plantea la hipótesis nula H_0 : \beta_i (con énfasis en beta_2) pues al rechazar esta hipótesis, podemos asegurar con cierto grado de confianza, que beta_2 \neq 0 y así, concluir que la variable que acompaña a beta_2 explica a la variable dependiente.


Anuncio publicitario

Un comentario en “R: La prueba t.

¿Tienes alguna duda? Compártela en los comentarios.

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.