A continuación se presentan las fórmulas usadas para desarrollar la teoría del Modelo Clásico de Regresión Lineal (MCRL), acompañadas por su sintaxis en R de forma respectiva.
También pudiera interesarte
Anuncios
Medias
Media de la variable X:
m.X <- sum(X)/length(X)
# o también
m.X <- mean(X)
Media de la variable Y:
m.Y <- sum(Y)/length(Y)
# o también
m.Y <- mean(Y)
Estimadores
Pendiente
beta2 <- sum((X - m.X)*(Y - m.Y))/sum((X - m.X)^2)
Intercepto
beta1 <- m.Y - beta2*m.X
Residuos
res <- Y - Y.e
SCR <- sum(res^2)
SCR <- sum((Y-Y.e)^2) - (sum((X-m.X)*(Y-m.Y)))^2/sum((X-m.X)^2)
Anuncios
Varianza y Error Estándar
var.beta1 <- sigma2.e*sum( X^2 )/(length(X) * sum( (X-m.X)^2 ))
ee.beta1 <- sqrt(var.beta1)
var.beta1 <- sigma2.e*sum( X^2 )/(length(X) * sum( (X-m.X)^2 ))
ee.beta1 <- sqrt(var.beta1)
sigma2.e <- SCR/(lenght(X)-2)
ee.e <- sqrt(sigma2.e)
Anuncios
Covarianza
cov.b1b2 <- -m.X (sigma2.e/sum((X-m.X)^2))
Bondad de Ajuste
r2 <- sum((Y.e - m.Y)^2)/sum((Y - m.Y)^2)
r2 <- 1 - sum((Y - Y.e)^2)/sum((Y - m.Y)^2)
r2 <- (sum((X-m.X)*(Y-m.Y))^2/(sum((X - m.X)^2)*sum((Y - m.Y)^2))
r <- sum((X-m.X)*(Y-m.Y))/sqrt(sum((X - m.X)^2)*sum((Y - m.Y)^2))
r2 <- (sum(Y-m.Y)*(Y-Y.e))^2/(sum((Y - m.Y)^2)*sum((Y - Y.e)^2))
Anuncios
Estadísticos
Estadístico F
F.c <- beta2^2 * sum((X-m.X)^2)/sigma2.e
#p-value de F.c
pf(F.c,1,length(X)-2,lower.tail = F)
Estadístico t
# Dos colas
qt(alpha/2,df=length(X)-2,lower.tail = FALSE)
# Una cola
qt(alpha,df=length(X)-2,lower.tail = FALSE)
Estadístico chi cuadrado 
# Cola izquierda
qchisq(alpha/2,df=length(X)-2,lower.tail = FALSE)
# Cola derecha
qchisq(1-alpha/2,df=df=length(X)-2,lower.tail = FALSE)
Anuncios
Intervalos de Confianza
li.beta2 <- beta2 - qt(alpha/2, df=length(escolaridad)-2,lower.tail=F)*ee.beta2
ls.beta2 <- beta2 + qt(alpha/2, df=length(escolaridad)-2,lower.tail=F)*ee.beta2
li.beta1 <- beta1 - qt(alpha/2, df=length(escolaridad)-2,lower.tail=F)*ee.beta1
ls.beta1 <- beta1 + qt(alpha/2, df=length(escolaridad)-2,lower.tail=F)*ee.beta1
li.sigma2 <- (length(escolaridad)-2)*sigma2.e/qchisq(alpha/2,df=length(escolaridad)-2,lower.tail=F)
ls.sigma2 <- (length(escolaridad)-2)*sigma2.e/qchisq(1-alpha/2,df=length(escolaridad)-2,lower.tail=F)
Anuncios
Predicción
latex Y.0 <- beta1 + beta2*X.0
Varianza de la Predicción Media
varm.Y.0 <- sigma2.e*(1/length(X)+(X.0-m.X)^2/sum((X-m.X)^2))
eem.C.0 <- sqrt(varm.C.0)
Intervalo de Confianza de la Predicción Media
li.C.0 <- beta1 + beta2*X.0 - qt(0.025,df=length(X)-2,lower.tail = FALSE)*eem.C.0
ls.C.0 <- beta1 + beta2*X.0 + qt(0.025,df=length(X)-2,lower.tail = FALSE)*eem.C.0
Varianza de la Predicción Individual
vari.Y.0 <- sigma2.e*(1+1/length(X)+(X.0-m.X)^2/sum((X-m.X)^2))
eei.C.0 <- sqrt(vari.C.0)
Intervalo de Confianza de la Predicción Media
li.C.0 <- beta1 + beta2*X - qt(0.025,df=length(X)-2,lower.tail = FALSE)*eei.C.0
ls.C.0 <- beta1 + beta2*X + qt(0.025,df=length(X)-2,lower.tail = FALSE)*eei.C.0
[…] una de las fórmulas para calcular el coeficiente de determinación , definimos un nuevo valor que está íntimamente […]
Me gustaMe gusta