Diagrama de Dispersión

R: Diagrama de Dispersión

Antes de empezar a definir un modelo sobre un conjunto de datos, es importante conocer el comportamiento de una variable respecto a otra pues de esta forma, podemos hacernos una idea de cual es el modelo más adecuado para describirlo.

También pudiera interesarte

Anuncios

Diagrama de Dispersión

Una de las formas más directas y sencillas para estudiar la forma en que se relacionan dos variables es usando un diagrama de dispersión. Si consideramos dos variables de un conjunto de datos, digamos una variable exógena x y una variable endógena y, un Diagrama de Dispersión (o Gráfico de Dispersión) consiste en ubicar en el plano cartesiano cada par ordenado formado por los elementos de estas dos variables. Ubicando la variable exógena en el eje horizontal y la variable endógena en el eje vertical.

De esta forma, si nuestro objetivo es definir un Modelo de Regresión Lineal, ubicamos en el eje horizontal, los valores de la variable X y en el eje vertical, los valores de la variable Y. Podemos generar un diagrama de dispersión en R recurriendo a la instrucción plot y usamos la siguiente sintaxis:

plot(X,Y)

Ejemplo

Consideremos un pequeño conjunto de datos, particularmente, los datos que se encuentran en la Tabla 3.2 del libro de Econometría de Damodar N. Gujarati and Dawn Porter en su quinta edición. Este conjunto de datos proporciona los datos primarios que se necesitan para estimar el efecto cuantitativo de la escolaridad en los salarios:

ObservaciónSalarioEscolaridad
14.45676
25.777
35.97878
47.33179
57.318210
66.584411
77.818212
87.835113
911.022314
1010.673815
1110.836116
1213.61517
1313.53118
Tabla 3.2

Para generar un diagrama de dispersión que nos ayude a estudiar como el nivel de estudios afecta el salario de una persona, entonces: la variable Escolaridad será nuestra variable exógena y será ubicada en el eje horizontal; la variable Salario será nuestra variable endógena y será ubicada en el eje vertical.

Recurriremos a la instrucción plot para generar un diagrama de dispersión y usamos la siguiente sintaxis:

plot(escolaridad,salario)

Al ejecutar esta instrucción, aparecerá de forma inmediata el siguiente gráfico:

Diagrama de Dispersión | totumat.com

En su pantalla debería aparecer lo siguiente:

Diagrama de Dispersión | totumat.com

También es posible dibujar sobre el diagrama de dispersión la Recta de Regresión, para esto recurrimos a la instrucción abline(), usamos la siguiente sintaxis para generar la recta definida por $\hat{Y} = \hat{\beta}_1 + \hat{\beta}_2 X$:

abline(lm(Y ~ X))
Anuncios

Ejemplo para los residuos

Si bien los diagramas de dispersión nos ayudan a estudiar el comportamiento de dos variables, también nos ayudan a estudiar el comportamiento de los residuos. Uno de los supuestos para del Modelo Clásico de Regresión Lineal, estipula que no debe haber autocorrelación, esto quiere decir que la correlación de los residuos debe ser nula.

A partir de la forma en que está definido el modelo lineal, podemos calcular los residuos usando la siguiente fórmula:

\hat{u}_i = Y_i - \hat{Y}_i

Entonces, si calculamos cada uno de los valores estimados \hat{Y}_i, podemos determinar los residuos usando la siguiente sintaxis:

Y.e <- beta1 + beta2*X
res <- Y - Y.e

Usamos la instrucción plot(res) para generar un gráfico de dispersión de los residuos tomando en cuenta que en el eje horizontal se ubica el número de observación y en el vertical el residuo correspondiente. Un indicador de no autocorrelación es que el gráfico de dispersión no presente ningún patrón de comportamiento, en términos coloquiales: que estén todos a lo loco.

Continuando con nuestro ejemplo, generamos un gráfico usando la siguiente sintaxis:

salario.e <- beta1 + beta2*escolaridad
residuos <- salario - salario.e
plot(residuos)

Al ejecutar estas instrucciones, aparecerá de forma inmediata el siguiente gráfico:

Diagrama de Dispersión de los Residuos | totumat.com

En su pantalla debería aparecer:

Diagrama de Dispersión de los Residuos | totumat.com

Aunque pareciera no haber ningún patrón, no podemos asegurar no hay autocorrelación, también hay que considerar que el tamaño de la muestra es pequeño así que las afirmaciones que se hagan sobre el comportamiento que describe el modelo lineal puede ser impreciso.


Anuncio publicitario

5 comentarios en “R: Diagrama de Dispersión

Responder a R para introducir a la Econometría: Análisis de Residuos – totumat Cancelar la respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.