Para entender el razonamiento detrás de este supuesto, obsérvese la figura del anterior post. Como lo muestra la figura, la var(u|X1) < var (u|X2),........, <var(u|Xi). Por consiguiente, lo más probable es que las observaciones de Y que provienen de la población con X = X1 estarían más cercanas a la FRP que aquellas que vienen de poblaciones correspondientes a X =X2, X=X3, y así sucesivamente. En resumen, no todos los valores de Y que corresponden a diversos X serán igualmente confiables, juzgando la confiabilidad por al cercanía o el alejamiento con el cual están distribuídos los valores de Y alrededor de sus medias, esto es, los puntos sobre la FRP. Si, de hecho, este es el caso, no se preferiría obtener muestras de aquellas poblaciones Y más cercanas a su media que de aquellas muy dispersas? Pero el hecho de actuar así podría restringir la variación que se obtiene a través de los valores de X.
Al invocar el supuesto 4, se está diciendo que en esta etapa todos los valores de Y correspondientes a diversos valores de X son igualmente importantes.
Notese que sel supuesto 4, implica que las varianzas condiciones de Yi también son homoscedásticas. Esto es,
var (Yi|Xi) = σ²
No hay comentarios.:
Publicar un comentario