Factorice las siguientes expresiones descomponiendo cada uno de los elementos involucrados en factores primos y posteriormente usando las propiedades de los radicales.
Factorice las siguientes expresiones descomponiendo cada uno de los elementos involucrados en factores primos y posteriormente usando las propiedades de los radicales.
Factorice y simplifique las siguientes expresiones descomponiendo cada uno de los elementos involucrados en factores primos y posteriormente usando las propiedades de las potencias.
Calcule el resultado de las siguientes expresiones matemáticas tomando en cuenta la jerarquía de las operaciones básicas y los signos de agrupación.
Introducir a la econometría requiere estudiar de forma minuciosa cada uno de los elementos que permiten el análisis de regresión y si bien podemos calcular cada uno de estos usando las fórmulas que provee la teoría, la idea de usar programas de paquetes estadísticos como R es usar instrucciones que nos permitan hacer este tipo de cálculos de forma automática.
También pudiera interesarte
Si se cuentan con al menos dos variables, digamos y
, podemos determinar la Recta de Regresión Muestral usando la instrucción lm() usando la virgulilla ~ para definir la relación entre las dos variables. La sintaxis para definir un modelo lineal que describa a la variable dependiente
en función de la variable independiente
es la siguiente:
lm(Y ~ x)
Al ejecutar esta instrucción se mostrará el valor de que es el punto de corte con el Eje de la variable
y el valor de
que es el parámetro que multiplica a la variable
(también conocido como el peso de la variable).
Esta información puede almacenarse en una variable pues a partir de ella obtener información valiosa sobre nuestro modelo. Entonces, para almacenar esta información en una variable, digamos yx.lm, usamos la siguiente sintaxis:
yx.lm <- lm(Y ~ x)
Veamos la información básica que podemos obtener definiendo del modelo lineal de esta forma.
Podemos observar directamente los coeficientes del modelo lineal haciendo el llamado coefficients a partir de la variable que almacena la información del modelo lineal, para esto, recurrimos el símbolo de dólar $ usando la siguiente sintaxis:
yx.lm$coefficients
Podemos observar directamente los residuos del modelo lineal haciendo el llamado residuals a partir de la variable que almacena la información del modelo lineal, para esto, recurrimos el símbolo de dólar $ usando la siguiente sintaxis:
yx.lm$residuals
Podemos observar directamente los valores ajustados del modelo lineal, es decir, todos los valores estimados , haciendo el llamado fitted.values a partir de la variable que almacena la información del modelo lineal, para esto, recurrimos el símbolo de dólar $ usando la siguiente sintaxis:
yx.lm$fitted.values
Si bien se puede obtener información individual haciendo un llamado a algunos elementos específicos del modelo lineal, una de las herramientas más valiosas que provee R para el análisis regresión lineal es el resumen del modelo pues a partir de él, podemos consultar los siguientes elementos:
Es importante verificar que el valor de la media de los residuos sea cero o esté muy cercano a cero, pues este es uno de los supuestos del Método de los Mínimos Cuadrado Ordinarios (MCO).
En este caso la prueba t plantea la hipótesis nula , por lo tanto, es importante verificar que el valor
sea lo más grande posible, pues esto nos indica la confianza con la que podemos rechazar la hipótesis nula.
El valor p o p-value determina la probabilidad exacta de cometer un error tipo I considerando el valor calculado, por lo tanto, es importante verificar que este valor sea lo más bajo posible, pues esto nos indica la confianza con la que podemos rechazar la hipótesis nula.
Para facilitar la interpretación del p-value, se utiliza un código de significancia, notando que
Recordando que el error estándar de estimación nos sirve como una medida de bondad de ajuste, es importante verificar que este sea lo más pequeño posible, recordando siempre que este nunca es igual a cero, pues se define a partir de una suma de cuadrados.
Es importante añadir que al definir modelos, estos no necesariamente se determinan con dos variables, así que al incluir más variables el coeficiente de determinación que determina Multiple R-squared aumentará a medida que se agregan variables, por otra parte, el coeficiente de determinación que determina Adjusted R-squared será corregido por la cantidad de variables involucradas en el modelo por lo que indica de forma más realista en qué medida las variables independientes (en conjunto) explican a la variable dependiente.
Recordemos que si bien es importante que la variable independiente explique la variable pendiente, el objetivo del análisis de regresión no es que el valor del coeficiente de determinación sea igual a 1.
Para el caso de dos variables, la prueba F plantea la hipótesis nula , por lo tanto, es importante verificar que el valor
sea lo más grande posible, pues esto nos indica la confianza con la que podemos rechazar la hipótesis nula.
Para el caso de más variables, se plantea una hipótesis conjunta , y de igual forma, es importante verificar que el valor
sea lo más grande posible, pues esto nos indica la confianza con la que podemos rechazar la hipótesis nula.
El valor p o p-value determina la probabilidad exacta de cometer un error tipo I considerando el valor calculado, por lo tanto, es importante verificar que este valor sea lo más bajo posible, pues esto nos indica la confianza con la que podemos rechazar la hipótesis nula.
Consideremos un pequeño conjunto de datos, particularmente, los datos que se encuentran en la Tabla 3.2 del libro de Econometría de Damodar N. Gujarati and Dawn Porter en su quinta edición. Este conjunto de datos proporciona los datos primarios que se necesitan para estimar el efecto cuantitativo de la escolaridad en los salarios:
| Observación | Salario | Escolaridad |
| 1 | 4.4567 | 6 |
| 2 | 5.77 | 7 |
| 3 | 5.9787 | 8 |
| 4 | 7.3317 | 9 |
| 5 | 7.3182 | 10 |
| 6 | 6.5844 | 11 |
| 7 | 7.8182 | 12 |
| 8 | 7.8351 | 13 |
| 9 | 11.0223 | 14 |
| 10 | 10.6738 | 15 |
| 11 | 10.8361 | 16 |
| 12 | 13.615 | 17 |
| 13 | 13.531 | 18 |
Definimos un modelo lineal que describe el salario en función de la escolaridad con la instrucción lm() y almacenamos esta información en la variable se.lm usando la siguiente sintaxis:
se.lm <- lm(salario ~ escolaridad)
Posteriormente, hacemos un resumen de la información que provee este modelo lineal con la instrucción summary() usando la siguiente sintaxis:
summary(se.lm)
Al ejecutar esta instrucción, inmediatamente aparecerá lo siguiente en la consola:
> summary(se.lm)
Call:
lm(formula = salario ~ escolaridad)
Residuals:
Min 1Q Median 3Q Max
-1.5637 -0.7350 0.1266 0.7158 1.3198
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.01445 0.87462 -0.017 0.987
escolaridad 0.72410 0.06958 10.406 4.96e-07 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.9387 on 11 degrees of freedom
Multiple R-squared: 0.9078, Adjusted R-squared: 0.8994
F-statistic: 108.3 on 1 and 11 DF, p-value: 4.958e-07
Usualmente el análisis de regresión se enfoca en el coeficiente que acompaña a la variable independiente y le resta importancia a los resultados expuestos sobre el intercepto. Dicho esto, podemos identificar los siguientes elementos en el resumen generado:








Una vez que hemos aprendido a calcular los intervalos de confianza podemos definir un entorno donde pudiera vivir nuestro parámetro poblacional, sin embargo, es necesario definir un elemento que nos permita usar este entorno para determinar si el planteamiento de nuestra investigación, se ajusta a la estimación que hemos hecho.
La idea básica de las pruebas de significancia es la de definir un estadístico de prueba y su distribución muestral según la hipótesis nula. La decisión de rechazar o no rechazar la hipótesis nula se toma con base en el valor del estadístico de prueba obtenido con los datos disponibles.
También pudiera interesarte
Con el supuesto de normalidad de , los estimadores de MCO
y
son en sí mismos normalmente distribuidos con sus medias y varianzas correspondientes. Por consiguiente, la variable
Sigue la distribución con
grados de libertad. Si el valor del verdadero
se especifica con la hipótesis nula, el valor
se calcula fácilmente a partir de la muestra disponible y, por consiguiente, sirve como estadístico de prueba.
Y como este estadístico de prueba sigue una distribución , caben afirmaciones sobre los intervalos de confianza como la siguiente:
donde es el valor de
que se plantea en la hipótesis nula
y
y
son los valores de
(los valores críticos de
) obtenidos de la tabla t para un nivel de significancia
y
grados de libertad.
Reescribiendo la inecuación involucrada, tenemos que
obteniendo así, el intervalo en el cual se encontrará con probabilidad
, dado
.
Calculamos los valores críticos en R usando la siguiente sintaxis:
li.H0.betai <- betai - qt(alpha/2, df=length(escolaridad)-2,lower.tail=F)*ee.betai
ls.H0.betai <- betai + qt(alpha/2, df=length(escolaridad)-2,lower.tail=F)*ee.betai
En el lenguaje de pruebas de hipótesis, este intervalo de confianza a se conoce como la región de no rechazo (de la hipótesis nula
), y la región que queda fuera del intervalo de confianza conoce como región de rechazo (de la hipótesis nula
) o región crítica.
Los límites de confianza dados por los puntos extremos del intervalo de confianza se llaman también valores críticos.
Ahora se aprecia la estrecha conexión entre los enfoques de intervalo de confianza y prueba de significancia para realizar pruebas de hipótesis, pues al compararlos, tenemos que:
En el enfoque de intervalo de confianza se trata de establecer un rango o intervalo que tenga una probabilidad determinada de contener al verdadero aunque desconocido
En el enfoque de prueba de significancia se somete a hipótesis algún valor de y se ve si el estimador
calculado se encuentra dentro de los límites (de confianza) razonables alrededor del valor sometido a hipótesis.
Sin embargo, en la práctica, no hay necesidad de estimar este intervalo explícitamente. Se calcula el valor de y se ve si cae entre los valores críticos
o fuera de ellos y calculamos el valor de
en R usando la siguiente sintaxis:
t.c <- (betai - H0.betai)/ee.betai
Consideremos un pequeño conjunto de datos, particularmente, los datos que se encuentran en la Tabla 3.2 del libro de Econometría de Damodar N. Gujarati and Dawn Porter en su quinta edición. Este conjunto de datos proporciona los datos primarios que se necesitan para estimar el efecto cuantitativo de la escolaridad en los salarios:
| Observación | Salario | Escolaridad |
| 1 | 4.4567 | 6 |
| 2 | 5.77 | 7 |
| 3 | 5.9787 | 8 |
| 4 | 7.3317 | 9 |
| 5 | 7.3182 | 10 |
| 6 | 6.5844 | 11 |
| 7 | 7.8182 | 12 |
| 8 | 7.8351 | 13 |
| 9 | 11.0223 | 14 |
| 10 | 10.6738 | 15 |
| 11 | 10.8361 | 16 |
| 12 | 13.615 | 17 |
| 13 | 13.531 | 18 |
Sabiendo que ,
y
. Si consideramos
, entonces
.
Considerando la hipótesis nula y la hipótesis alternativa
, calculamos los valores críticos en R usando la siguiente sintaxis:
H0.beta2 <- 0.5
li.H0.beta2 <- H0.beta2 - qt(alpha/2, df=length(escolaridad)-2,lower.tail=F)*ee.beta2
ls.H0.beta2 <- H0.beta2 + qt(alpha/2, df=length(escolaridad)-2,lower.tail=F)*ee.beta2
Una vez ejecutadas estas instrucciones, obtenemos que
De forma gráfica, podemos expresar esta probabilidad así
Notamos entonces, que el valor está en la región de rechazo, por lo tanto, se rechaza la hipótesis nula
.
Veamos ahora, qué es lo que ocurre con el valor que hemos calculado de . ¿Cae entre los valores críticos
o fuera de ellos?
. Calculamos el valor de
en R usando la siguiente sintaxis:
H0.beta2 <- 0.5
t.c <- (beta2 - H0.beta2)/ee.beta2
En el siguiente gráfico, vemos con claridad que el valor se encuentra en la región crítica y la conclusión se mantiene; es decir, rechazamos .
En su pantalla debería aparecer:

Observe que si el estimado es igual al
hipotético, el valor
será cero. Por otra parte, a la medida en que el valor de
estimado se aleje del valor hipotético de
, el
será cada vez mayor. Por consiguiente, un valor grande de
nos permite rechazar la hipótesis nula con mayor confianza.
En la práctica, se plantea la hipótesis nula (con énfasis en
) pues al rechazar esta hipótesis, podemos asegurar con cierto grado de confianza, que
y así, concluir que la variable que acompaña a
explica a la variable dependiente.
Debe estar conectado para enviar un comentario.