Ahora, para cada una de las distribuciones de probabilidad condicional de Y podemos calcular su media o valor promedio, conocido como la media condicional o la esperanza condicional, que se denota como E(Y|X=Xi)y se lee así:<< el valor esperado de Y dado que X adquiere el valor especifico de Xi>>, lo cual se escribirá E(Y|Xi) para efectos de simplificar la notación. Para nuestras cifras hipotéticas, estas esperanzas condicionales pueden calcularse fácilmente como la sumatoria de los productos entre los valores relevantes de Y(tabla 2.1) y sus respectivas probabilidades (tabla 2.2). Como ilustración, la media condicional o esperanza de Y dado X =80 es 55(1/5) + 60(1/5)+70(1/5) +75(1/5) = 65. Las medias condicionales así calculadas aparecen en la ultima fila de la tabla 2.2.
Antes de proceder, es instructivo observar las cifras de la tabla 2.1 en un diagrama de dispersión, como el que aparece en la figura 2.1. El diagrama de dispersión muestra la distribución condicional de Y correspondiente a diversos valores de X. Aunque hay variaciones en los gastos de consumo familiar individual, la figura 2.1 muestra muy claramente que el valor promedio del gasto de consumo aumenta a medida que el ingreso aumenta. Planteado en forma diferente, el diagrama de dispersión revela que los valores de la media (condicional) de Y aumenta a medida que X aumenta. Esta observación puede verse más claramente si se concentra en los puntos más gruesos que representan diversas medias condicionales de Y. El diagrama de dispersión muestra que estas medias condicionales caen sobre una línea recta con una pendiente positiva. Esta línea se conoce como la línea de regresión poblacional, o más generalmente,la curva de regresión poblacional. Más sencillamente, es la regresión de Y sobre X.
De esta forma, una curva de regresión poblacional es simplemente el lugar geométrico de las medias condicionales o esperanzas de la variable dependiente para los valores fijos de la(s) variable(s) explicativa(s). Esto puede apreciarse en la figura 2.2, que muestra cómo para cada Xi existen valores poblacionales de Y(los cuales se suponen normalmente distribuidos por razones que se explicarán más adelante) y una media (condicional) correspondiente. Y la línea o curva de regresión pasa a través de estas medias condicionales.
No hay comentarios.:
Publicar un comentario