jueves, 31 de octubre de 2013

Propiedad de varianza mínima de los estimadores de mínimos cuadrados

Para demostrar que estos estimadores tienen varianza mínima dentro de la clase de todos los estimadores líneales insesgados, consideremos el estimador de minimos cuadrados β2:







Expresado en palabras, con ponderaciones wi = ki, que son ponderaciones de mínimos cuadrados la varianza del estimador líneal β2 es igual a la del estimador de mínimos cuadrados β2; de lo contrario la var (β*2) > var(β2). Dicho de otra manera, si hay un estimador lineal insesgado de β2 de varianza mínima, éste debe ser el estimador de mínimos cuadrados. Igualmente, puede demostrarse que β1 es un estimador líneal insesgado con varianza mínima de β1.

martes, 29 de octubre de 2013

Varianza y errores estándar de los estimadores de mínimos cuadrados

Ahora, de acuerdo con la definición de varianza, se puede escribir.



La varianza de β1 puede ser obtenida siguiendo el mismo tipo de raciocinio. Una vez que se hayan obtenido las varianzas de β1 y β2, se pueden obtener los errores estándar correspondientes, tomando las raíces cuadradas positivas.


Propiedades de linealidad e insesgamiento de los estimadores de mínimos cuadrados

De (3.1.8) se tiene



que muestra que β2 es un estimador lineal porque es una función líneal de Y; de hecho es un promedio ponderado de Yi en donde ki representa las ponderaciones. De la misma manera, puede demostrarse que β1 es también un estimador lineal.

Apartándonos del tema central, nótese las siguientes propiedades de las ponderaciones ki.


  1. Puesto que se ha supuesto que las Xi no son estocásticas, las ki tampoco lo son.
  2. Σki =0
  3. Σk²i =0 1/Σx²i
  4. Σkixi = ΣkiXi = 1. Estas propiedades pueden verificarse directamente de la definición de ki. 

Por ejemplo


lunes, 28 de octubre de 2013

Derivación de los mínimos cuadrados estimados

Diferenciando (3.1.2) parcialmente con respecto a β1 y β2, se obtiene

Igualando estas ecuaciones a cero y después de alguna simplificación y manipulación algebraica, se obtienen los estimadores dados en las ecuaciones (3.1.6) y (3.1.7)

Un experimento Monte Carlo se realiza de la siguiente forma


  1. Supóngase que los valores verdaderos de los parámetros son los siguientes: β1 = 20 y β2 = 0.6.
  2. Escójase el tamaño de la muestra, por ejemplo n = 25
  3. Fíjense los valores de X para cada observación. En total usted tendrá 25 valores de X.
  4. Supóngase que se consulta una tabla de números aleatorios, escójanse 25 valores y llámense ui (hoy en día la mayoría de los paquetes estadísticos tienen generadores de números aleatorios).
  5.  Ahora que se conocen β1, β2, Xi y ui, utilizando (3.9.1) obténgase 25 valores de Yi.
  6. Utilizando los 25 valores de Yi, generados de esa forma, hágase la regresión de estos valores sobre los 25 valores de X seleccionados en el paso 3, obteniendo así los estimadores de mínimos cuadrados β1 y β2.
  7. Supóngase que se repite este experimento 99 veces, utilizando cada vez los mismos valores de β1 y β2 y X. Ciertamente los valores ui, variarán de un experimento a otro. Por consiguiente, en total se tienen 100 experimentos, generando así 100 valores para cada β1 y β2.
  8. Obtengase los promedios de estos 100 valores estimados y denomínese β1 y β2.
  9. Si estos valores promedios son aproximadamente los mismos que los valores verdaderos de β1 y β2 supuestos en el paso 1, mediante este experimento de Monte Carlos se "establece" que, en efecto, los estimadores de mínimos cuadrados son insesgados. Recuérdese que bajo el MCRL, E(β1) = β1 y E(β2) = β2
Estos pasos caracterizan la naturaleza general de los experimentos de Monte Calo. Tales experimentos son frecuentemente utilizados para estudiar las propiedades estadísticas de diversos métodos de estimación de los parámetros poblacionales. Son partícularmente útiles para estudiar el comportamiento de los estimadores en muestras pequeñas, o finitas. Estos experimentos son también un medio excelente de aplicar personalmente el concepto de muestreo repetido, que es la base de la mayor parte de la inferencia estadística clásica, como se verá en el capítulo 5. 

domingo, 27 de octubre de 2013

Nota sobre Experimentos de Monte Carlo

En este capítulo se muestra cómo bajo los supuestos del MCRL los estimadores de mínimos cuadrados tienen ciertas características estadísticas deseables que se resumen en la propiedad MELI. Pero en la práctica, cómo se puede saber si se mantiene la propiedad MELI? Por ejemplo, cómo se puede averiguar si los estimadores MCO son insesgados? La respuesta se logra mediante los llamados experimentos de Monte Carlo, los cuales son esencialmente experimentos de muestreo o de simulación en computador.

Para introducir las ideas básicas, considérese la FRP de dos variables:

Yi = β1 + β2Xi + ui

sábado, 26 de octubre de 2013

Listado de Computador de la Función de demanda de café

Como se anotó en la introducción a lo largo de este blog se estará utilizando intensamente el computador, para obtener respuestas a los ejemplos ilustrativos con el fin de familiarizar al lector con algunos paquetes de programas de regresión. En los ejemplos ilustrativos de este blog se hace uso de uno o más de estos programas.

Ejemplo Consumo de café en Estados Unidos (1980-1991) (I)

Retómese los datos dados en la tabla 1.1 de la introducción. Con base en esta información se estimó la siguiente regresión MCO, donde Y representa el gasto de consumo personal (GCP) en miles de millones de dólares de 1987 y X representa el Producto Interno Bruto (PIB), una medida del ingreso, en miles de millones de dólares de 1987.



Como lo sugieren estos resultados, durante el período 19801-1991 la media del gasto de consumo aumentó en cerca de 72 centavos por cada dólar de incremento en el PIB; esto es, la propensión marginal a consumir (PMC) estuvo cercana a los 72 centavos. Interpretando literalmente, el valor del intercepto de cerca de -232 sugiere que si el PIB fuera cero, la media del gasto de consumo habría sido de -232 mil millones de dólares. Nuevamente tal interpretación mecánica del intercepto no tiene sentido económico en el presente caso pues está por fuera del rango de valores, con el cual se está trabajando y, por tanto, no representa realmente un resultado probable. El valor de r² de cerca de 0,99 significa que el PIB explica aproximadamente el 99% de la variación en la media del gasto de consumo que, por cierto, es un valor elevado.

A pesar de este valor elevado de r² se puede cuestionar si una función de consumo keynesiana sencilla como esta sería el modelo apropiado para explicar el gasto de consumo agregado de los Estados Unidos. Algunas veces los modelos de regresión muy simples (por ejemplo, de dos variables) pueden proporcionar información útil. Los valores estimados de la PMC está cercana a 0.7. Pero se tendrá más que decir sobre la adecuación del modelo en capítulos posteriores.


viernes, 25 de octubre de 2013

Ejemplo Consumo de café en Estados Unidos (1970-1980) (II)

La interpretación de la regresión estimada es la siguiente: Si el precio de venta al detal observado promedio del café por libra aumenta, digamos, en dólar, se espera que el consumo promedio diario del café disminuya en aproximadamente media taza. Si el precio del café fuera igual a cero, se esperaría que el consumo promedio de café por persona fuera de aproximadamente 2.69 tazas por día. Ciertamente, como se mencionó anteriormente, con frecuencia no podemos asignar algún significado físico al intercepto. Sin embargo, se debe tener en mente que aún si el precio del café fuera cero, la gente no consumiría cantidades desproporcionadas de café por el aparente efecto negativo de la cafeína en la salud. El valor r² significa que cerca del 66% dela variación en el consumo de café  diario per cápita está explicado por la variación en el precio al detal del café.

Qué tal real es el modelo que se ha ajustado a la transformación? Puesto que no incluye todas las variables relevantes, no se puede decir que es una función completa de demanda de café. Este modelo sencillo seleccionado para este ejemplo fue ciertamente escogido para fines didácticos en esta etapa del estudio. 

Ejemplo Consumo de café en Estados Unidos (1970-1980) (I)

Considérense los datos de la tabla 3.4

Según la micro economía. la demanda de un bien de consumo primario depende generalmente del precio de ese bien, de los precios de otros bienes que compiten con él o que son complementarios al bien primario del ingreso del consumidor. Para incorporar todas estas variables a la función de demanda, suponiendo que los datos están disponibles, se precisaría un modelo de regresión múltiple  para lo cual no estamos aún preparados. Por consiguiente, lo que hará será suponer una función de demanda parcial o ceteris paribus (todo lo demás constante) en la que se relaciona solamente la cantidad de mandad con su precio - y se supone que las demás variables que entran en la función de demanda permanecen constantes. Entonces, si se ajusta el modelo lineal de dos variables (2.4.2) a los datos dados en la tabla 3.4, se obtienen los siguientes resultados.





jueves, 24 de octubre de 2013

Ejemplo Numérico (II)

Siguiendo lo expuesto en el capítulo 2, la FRM y la línea de regresión asociada son interpretadas de la siguiente forma: Cada punto en la línea de regresión de un estimado del valor esperado o de la media de Y correspondiente al valor seleccionado X; es decir, Yi es un valor estimado de E(Y|Xi). El valor de β2 = 0.5091,  que mide la pendiente de la curva, indica que , dentro de un rango muestral de X entre US$80 y US$260 por semana, a medida que X se incrementa, digamos en US$1 centavos. El valor de β1 = 24.4545, es el intercepto de la línea e indica el nivel promedio del gasto de consumo promedio cuando el ingreso semanal es cero. Sin embargo, ésta es una interpretación mecánica del Intercepto. En el análisis de regresión, este tipo de interpretación literal, del término intercepto puede no siempre tener sentido, aunque en este ejemplo puede argumentarse que una familia sin ingreso alguno (por razones de desempleo, despido tempral, etc) podría mantener algún nivel mínimo de gasto de consumo mediante endeudamiento o desahorro. Pero en general, uno debe utilizar el sentido común al interpretar el término intercepto ya que muy frecuentemente el rango muestral de los valores de X no incluye el cero como uno de los valores observados.

Tal vez lo mejor sea interpretar el término intercepto como el efecto de la media o promedio sobre Y de todas la variables omitidas del modelo de regresión. El valor de r² de 0.9621 significa que cerca del 96% de la variación en el gasto de consumo semanal está explicado por el ingreso. Puesto que r² puede llegar a ser máximo 1, la r² observada sugiere la línea de regresión muestral se ajusta muy bien a los datos. El coeficiente de correlación de 0.9809 indica que las dos variables, el gasto de consumo y el ingreso, tienen una alta correlación positiva. Los errores estándar de los coeficientes estimados de regresión serán interpretados luego.


Ejemplo Numérico (I)

Se ilustra la teoría econométrica dessarrollada hasta el momento considerando la función keynesiana de consumo expuesta en la introducción. Recuérdese que Keynes planteaba "La ley fundamental de sicología, según la cual los hombres [y las mujeres] están dispuestos, como regla y en promedio, a incrementar su consumo a medida que su ingreso aumenta, pero no tanto como el incremento en su ingreso", es decir la propensión marignal a consumir (PMC) es mayor que cero pero menor que uno. Aunque Keynes no especificó la forma funcional exacta de la relación entre el consumo y el ingreso, supóngase para simplificar que la relación es líneal como en (2.4.2). Como prueba de la función keynesiana de consumo, se utilizan los datos muestrales de la tabla 2.4, los cuales por conveniencia se reproducen en la tabla 3.2. La información primaria requerida para obtener los valores estimados de los coeficientes de regresión, sus errores estándar, etc., están dados en la tabla 3.3. Con base a esta información, se obtuvieron los siguientes cálculos, que se recomienda al lector verificar.



miércoles, 23 de octubre de 2013

Coeficiente de determinación r²: Medida de la "Bondad del ajuste" (VI)

En el contexto de la regresión, r² es una medida con más significado que r, ya que la primera nos dice la proporción de la variación en la variable dependiente explicada por la(s) variable(s) explicativa(s) y, por consiguiente, constituye una medida global del grado en que la variación en una variable determina la variación en la otra. La segunda no tiene tal valor. Además, como se verá, la interpretación de r( =R) en un modelo de regresión múltiple es de valor dudoso. Sin embargo, se tendrá más que decir sobre r² mas adelante.

Nótese  que la r² definida anteriormente también puede ser calculada  como el coeficiente de correlación elevado al cuadrado entre Yi observado Yi estimado, es decir, Yi. Esto es, utilizando (3.5.13), se puede escribir.





Algunas de las propiedades de r


  1. Puede tener signo positivo o negativo, dependiendo del signo del término en el numerador de (3.5.13), el cual mide la covariación muestral de dos variables.
  2. Cae entre los límites de -1 y +1; es decir, -1 ≤ r ≤ 1.
  3. Es simétrico por naturaleza; es decir, el coeficiente de correlación entre X y Y(rxy) es el mismo que entre Y y X(ryx).
  4. Es independiente del origen y de la escala; es decir, si definimos Xi* = aXi + c y Yi* = bYi + d, donde a a > 0, b > 0, y c y d son constantes, entonces r entre X* y Y* es igual al r entre las variables originales X y Y.
  5. Si X y Y son estadísticamente independientes, el coeficiente de correlación entre ellos es cero; pero si r =0, esto no significa que las dos variables sean independientes. En otras palabras, una correlación igual a cero no necesariamente implica independencia.
  6. Es una medida de asociación líneal o dependencia lineal solamente; su uso e la descripción de relaciones no lineales no tiene significado. Así en la figura 3.11 (h), Y = X²es una relación exacta y aún r es cero. Por qué?
  7. Aunque es una medida de asociación lineal entre dos variables, esto no implica necesariamente alguna relación causa-efecto, como se anotó en el capítulo 1.

martes, 22 de octubre de 2013

Coeficiente de determinación r²: Medida de la "Bondad del ajuste" (V)

Una cantidad estrechamente relacionada con r² pero conceptualmente muy diferente de éste es el coeficiente de correlación, el cual, como se anotó en el capítulo 1, es una medida del grado de asociación entre dos variables. Puede ser calculado a partir de






medida que se conoce como el coeficiente de correlación muestral


Coeficiente de determinación r²: Medida de la "Bondad del ajuste" (IV)

Pueden anotarse dos propiedades de r²


  1. Es una cantidad no negativa (Por qué?)
  2. Sus límites son 0 ≤  r ≤  1. Un r² de 1 significa un ajuste perfecto, es decir Yi = Yi para cada i. Por otra parte, un r de cero significa que no hay relación alguna entre la variable dependiente y la variable explicativa (es decir, β2 = 0). En este caso, como lo indica (3.1.9). Yi = β1 = Y, es decir, la mejor predicción de cualquier valor de Y es simplemente el valor de su media. En esta situación por consiguiente, la línea de regresión será horizontal al eje X.
A pesar de que r² puede ser calculado directamente a partir de su definición dada en (3.5.5) su valor puede ser obtenido más rápidamente haciendo uso de la siguiente formula:


una expresión que econtraremos muy útil más adelante.

lunes, 21 de octubre de 2013

Coeficiente de determinación r²: Medida de la "Bondad del ajuste" (III)

Ahora dividiendo (3.5.3) por la STS a ambos lados, se obtiene

La cantidad r² así definida se conoce como el coeficiente de determinación (muetral) y es la medida de bondad del ajuste de una línea de regresión más frecuentemente utilizada. Verbalmente, r² mide la proporción o el porcentaje de la variación total en Y explicada por el modelo de regresión.


Coeficiente de determinación r²: Medida de la "Bondad del ajuste" (II)

Para calcular esta r², se procede de la siguiente forma: Recuérdese que

Yi = Yi + ûi

o expresado en formas de desviaciones

yi = yi + ûi

Donde se hace uso de (3.1.13) y de (3.1.14). Elevando al cuadrado  en ambos lados y sumando sobre la muestra, se obtiene:

puesto que Σyiûi = 0 (por qué?) y yi = β2xi.

Las diversas sumas de cuadrados que aparecen en (3.5.2) pueden ser descritas de la manera siguiente:  Σy²i =Σ(Yi-Y)² = variación total de los valores observados de Y con respecto a su media muestral, los cuales pueden  ser llamados suma total de cuadrados (STC). Σyi = Σ(Yi-Y)² = Σ(Yi-Y)² = β²2Σx²i = variación de los valores Y estimados alrededor de su media (Y=Y) que apropiadamente puede llamarse la suma de los cuadrados debida a la regresión [es decir, debida a la(s) variable(s) explicativa(s)], o explicada por ésta, o simplemente la suma explicada de cuadrados (SEC). Σu²i =  la variación residual o no explicada de los valores de Y alrededor de la línea de regresión, o simplemente la suma de residuales cuadrados (SRC). ASi, (3.5.2) es

STC = SEC + SRC

y muestra que la variación total en los valores Y observados alrededor del valor de su media puede ser dividida en dos partes, atribuible a la línea de regresión y la otra a fuerzas aleatorias puesto que no todas las observaciones Y caen sobre la línea ajustada. Geométricamente,se tiene la figura 3.10.



domingo, 20 de octubre de 2013

Coeficiente de determinación r²: Medida de la "Bondad del ajuste" (I)

Hasta el momento nos hemos concentrado en el problema de estimar los coeficientes de regresión, sus errores estándar y algunas de sus propiedades. Se considerará ahora la bondad del ajuste de la línea de regresión ajustada a un conjunto de datos: es decir, se verá qué tan "bien" se ajusta la línea de regresión a los datos. De la figura 3.1, es claro que si todas las observaciones fueran a caer en la linea de regresión, se obtendría un ajuste "perfecto, pero raramente se presenta este caso. Generalmente, hay algunas ûi positivas y algunas ûi negativas. Se tiene la esperanza de que estos residuos alrededor de la muestra serán lo más pequeños posibles. El coeficiente de determinación r² (caso de dos variables) o R² (regresión múltiple) es una medida resumen que nos dice qué tan bien se ajusta la línea de regresión muestral a los datos.

Antes de mostrar la forma como se calcula r², considérese una explicación heurística de r² en términos de una herramienta gráfica, conocida como el diagrama de Venn o de Ballentine, que aparecen en la figura 3.9.

En esta figura el circulo Y representa la variación en la variable dependiente Y y el círculo X representa la variación en la variable explicativa X. La intersección de los dos círculos  (el área sombreada) indica la medida en la cual la variación en Y es explicada por la variación en X (por ejemplo, a través de una regresión MCO). Entre mayor sea la medida de la intersección, mayor será la variación en Y que es explicada por X. El r² es simplemente una medida numérica de esta intersección. En la figura, amedida que se va de izquierda a derecha, el área de la intersección aumenta, es decir, sucesivamente hay una porpoción cada vez mayor de la variación en Y que está explicada por X. En resumen, r² aumenta. Cuando no hay intersección, obviamente  r² es cero, pero cuando la intersección es completa, r² es 1, puesto que el 100 por ciento de la variación en Y está explicada por X. Como se verá pronto, r² se encuentra entre 0 y 1.


Propiedades de los Estimadores de Mínimos Cuadrados: Teorema de Gauss-Markov (III)

En la figura del anterior post se ha mostrado la distribución muestral del estimador MCO β2, esto es, la distribución de los valores asumidos por β2 en experimentos repetidos de muestreo. Por conveniencia se ha supuesto que β2 está distribuido simétricamente. Como lo indica la figura, la media de los valores β2, E(β2), es igual al verdadero β2. En esta situación se dice que β2 es un estimador insesgado de β2. En la figura 3.8(b) se mostró  la distribución muestral de β2*, un estimador alterno de β2 obtenida utilizando otro método (es decir, difrente al MCO). Por conveniencia, supóngase además que β2 y β2* son estimadores lineales, es decir, son funciones lineales de Y. Cual estimador escogería, β2 o β2*?

Para responder a esta pregunta, sobreponga las dos figuras, como se muestra en la figura 3.8(c). Es obvio que si bien β2 y β2* son insesgados la distribución de β2* está más difusa o dispersa alrededor del valor de la media que la distribución de β2. En otras palabras, la varianza de β2* es mayor que la varianza de β2. Ahora, dados dos estimadores que son a la vez lineales e insesgasdos uno escogería el estimador con la menor varianza porque es probable que esté más cercano a β2 que el estimador alterno. En resumen, uno escogería el estimador MELI

Las propiedades estadísticas que se acaban de exponer se conocen como propiedades de muestra finita: Estas propiedades se mantienen sin importar el tamaño de la muestra sobre la cual estén basados los estimadores. Más adelante se tendrá ocasión de considerar las propiedades asintóticas, es decir, propiedades que se mantienen solamente sí el tamaño de la muestra es muy grande (técnicamente hablando es, infinito).


sábado, 19 de octubre de 2013

Propiedades de los Estimadores de Mínimos Cuadrados: Teorema de Gauss-Markov (II)

La prueba de este teorema se presenta mas adelante. La trascendencia del teorema de Gauss-Markov se hará más clara a medida que se avance. Es suficiente anotar aquí que el teorema tiene importancia teórica y práctica a la vez.

Lo que todo esto significa puede ser explicado con la ayuda de la figura 3.8


Propiedades de los Estimadores de Mínimos Cuadrados: Teorema de Gauss-Markov (I)

Como se mencionó anteriormente, dados los supuestos del modelo clásico de regresión líneal, los valores estimados de mínimos cuadrados poseen algunas propiedades ideales u óptimas. estas propiedades están contenidas en el muy conocido teorema Gauss-Markov. Para entender este teorema, se necesita considerar la propiedad por la cual un estimador se considera el mejor estimador lineal insesgado. Como se explico en el apéndice A, se dice que un estimador, es decir, el estimador MCO β2, es un mejor estimador lineal insesgado (MELI) de β2 si se cumple lo siguiente.

1. Es lineal, es decir, función lineal de una variable aleatoria, tal como la variable dependiente Y en el modelo de regresión.
2. Es insesgado, es decir, su valor promedio o esperado, E(β2), es igual al valor verdadero, β2.
3. Tiene varianza minima dentro de la clase de todos los estimadores lineales insesgados; un estimador insesgado con varianza mínimaes conocido como un estimador eficiente.
En el contexto de regresión puede probarse que los estimadores MCO son MELI. Esta es la clave del famoso teorema Gauss-Markov, el cual se puede enunciar de la siguiente forma:

viernes, 18 de octubre de 2013

Precisión o errores estándar de los mínimos cuadrados estimados (IV)

2. La varianza de β1 es directamente es directamente proporcional a σ² y a Σx²i pero inversamente proporcional a Σx²i y al tamaño n de la muestra

3. Puesto que β1 y β2 son estimadores, estos no sólo variarán de una muestra a otra sino que también en una muestra dada es probable que dependan entre sí; esta dependencia es medida por al covarianza entre ellos.

Puesto que var (β2) es siempre positivo, al igual que la varianza de cualquier variable, la naturaleza de la covarianza entre β1 y β2 depende del signo de X. Si X es positivo, entonces como lo indica la fórmula, la covarianza seránegativa. Así, si el coeficientede la pendiente β2 está sobreestimado (es decir, la pendiente está muy inclinada), el coeficiente delintercepto β1 estará subestimado ( es decir, el intercepto será muy pequeño). Más adelante, se verá la utilidad de estudiar las covarianzas entre lo coeficientes estimados de regresión.

Cómo pueden las varianzas y los errores estándar de los coeficientes estimados de regresión permitir y juzgar la confiabilidad de estos valores estimados?

Precisión o errores estándar de los mínimos cuadrados estimados (III)

Anteriormente se anotó que, dado Xi, σ² representa la varianza (condicional) de ui y Yi. Por consiguiente, el error estándar del valor estimado puede llamarse también la desviación estándar (condicional) de ui y Yi. Ciertamente, como es usual, σ²y y σy representan la varianza y la desviación estándar incondicionales de Y, respectivamente.

Nótese las siguientes características de las varianzas (y por consiguiente, los errores estándar) de β1 y β2.


  1. La varianza de β2 es directamente proporcional a σ² pero inversamente proporcional a  Σx²i. Esto es, dado σ², entre más grande sea la variación en los valores X, menor será la varianza de β2 y por lo tanto mayor será la precisión con la cual β2 puede ser estimada. En resumen, dado σ², si hay una variación sustancial en los valores de X (recuérdese el supuesto 8), β2 puede medirse en forma más precisa que cuando las Xi no variaban sustancialmente. También, dado Σx²i, entre mayor sea la varianza de σ², mayro será la de β2. Adviértase que a medida que aumenta el tamaño n de la muestra, aumentará el número de términos en la suma,  Σx²i. A medida que aumenta n, la precisión con la cual β2 puede ser estimada también es mayor. Por qué?

jueves, 17 de octubre de 2013

Precisión o errores estándar de los mínimos cuadrados estimados (II)

Todas las cantidades que entran en las anteriores ecuaciones excepto  σ² pueden ser estimadas a partir de los datos. la misma σ² es estimada mediante la fórmula:

donde σ² es el estimador de MCO de la verdadera σ² aunque desconocida y donde la expresión n-2 es conocida como el número de grados de libertad (g de l), Σû²i siendo la suma de los valores residuales al cuadrado o la suma de residuales al cuadrado (SRS)

Una vez conocida Σû²i, σ² puede calcularse fácilmente  Σû² puede obtenerse de (3.1.2) o de la siguiente expresion:

Comparada la ecuación (3.1.2.) la ecuación (3.3.6) es fácil de utilizar, ya que no requiere calcular ûi para cada observación a pesar deque tal cálculo será útil en esencia.

Puesto que






es conocida como el error estandar del valor estimado. Simplemente es la desviación estándar de los valores Y alrededor de la línea de regresión estimada, la cual es utilizada frecuentemente como una medida resumen de la "bondad del ajuste" de dicha línea, tema que será analizado en la sección 3.5


Precisión o errores estándar de los mínimos cuadrados estimados (I)

De las ecuaciones (3.1.6) y (3.1.7) es evidente que los mínimos cuadrados estimados son función de los datos muestrales. Pero puesto que es probable que los datos cambien entre una muestra y otra,los valores estimados cambiarían ipso facto. Por consiguiente, lo que se requiere es alguna medida de "confiabilidad" o precisión de los estimadores β1 y β2. En estadística la precisión de un valor estimado es medida por su error estandar (se). Dados los supuestos gaussianos, en el apéndice 3A, seccion 3A.3, se muestra que los errores estándar de los MCO estimados pueden ser obtenidos de la siguiente manera:


donde var = varianza y ee = error estándar y donde  σ² es la constante o varianza homoscedástica de ui del supuesto 4.

miércoles, 16 de octubre de 2013

Qué tan realistas son los supuestos? (II)

El plan de estudiar primero a fondo las propiedades del MCRL y, luego, examinar a fondo lo que sucede si uno o más de los supuestos del MCRL no se cumple. Como lo señalaba un colega mio, cuando revisamos las investigaciones realizadas por otros, necesitamos considerar si los supuestos hechos por el investigador son apropiados para los datos y para el problema. Muy frecuentemente, la investigación publicada está basada en supuestos implícitos sobre el problema y los datos que probablemente no son correctos y que producen estimaciones basados en esos supuestos. Claramente, el lector conocedor, sabiendo que estos problemas existen, debe adoptar una actitud escéptica hacia la investigación. Los supuestos enumerados en la tabla 3.5 por consiguiente, constituyen una lista de verificación para guiar la investigación y para evaluar la gestión de otros.

Con esta salvedad, se está listo ahora para estudiar el MRCL. En particular se desea encontrar las propiedades estadísticas de los MCO comparadas con las propiedades numéricas puras expuesstas anteriormente. Las propiedades estadísticas de los MCO están basadas en los supuestos del MCRL ya estudiado y están protegidos por el famos teorema  Gauss-Markov. Pero antes de referirse a este teorema, el cual proporciona justificación teórica para la popularidad de los MCO, se necesita considerar primero los errores estándar o de precisión de los mínimos cuadrados estimados.

Modelo Clásico de regresión lineal: Supuestos detrás del método de mínimos cuadrados (XIII)

La exposición de los supuestos en los cuales se basa el modelo clásico de regresión lineal ya está completa. Es importante anotar que todos estos supuestos se relacionan con la FRP solamente y  no con la FRM. Pero es interesante observar que el método de mínimos cuadrados expuesto anteriormente tiene algunas propiedades que son similares a los supuestos que se han hecho sobre la FRP. Por ejemplo, encontrar que Σûi = 0, y ,por consiguiente û = 0, tiene similitud con el supuesto de que E(ui|Xi) = 0. De la misma manera que ΣûiXi = 0 es similar al supuesto de que cov(ui,Xi)=0. Es alentador afirmar entonces que el método de mínimos cuadrados entonces trata de "duplicar" algunos de los supuestos que se han formulado sobre la FRP.

Ciertamente, la FRM no duplica todos los supuestos del MCRL. Como mostraremos más adelante, aunque cov(ui,uj) = 0(i≠ j)por supuesto, no es cierto que para la muestra la cov(ûi,ûj)=0 (i≠j). De hecho se mostrará más adelante que los residuos no sólo están autocorrelacionados sino que también son heteroscedásticos.

Cuando vamos más adelante del modelo de dos variables y consideramos los modelos de regresión múltiple, es decir, modelos que contienen diversos regresores, se agregan los siguientes supuestos.


martes, 15 de octubre de 2013

Modelo Clásico de regresión lineal: Supuestos detrás del método de mínimos cuadrados (XII)

Si el modelo (3.2.8) es el modelo "correcto"o "verdadero", el ajuste del modelo (3.2.7) a los puntos dispersos que aparecen en la figura 3.7 nos dará predicciones erróneas: Entre los puntos A y B, para cualquier Xi dado, el modelo (3.2.7) sobreestimará el valor verdadero de la media de Y, mientras que hacia la izquierda de A (o hacia la derecha de B) el modelo subestimará ( o sobreestimará, en términos absolutos) el valor verdadero de la media de Y.

El ejemplo anterior ilustra lo que se conoce como el sesgo de especificación o el error de especificación; aquí el sesgo consiste en escoger la forma funcional equivocada. Se verán otros tipos de errores de especificación mas adelante.

Desafortunadamente, en la practica rara vez se conocen con precisión las variables que deben ser incluidas en el modelo o la forma funcional correcta de éste o los supuestos probabilísticos correctos sobre las variables que entran al modelo por la teoría en la cual se basa la investigación particular (por ejemplo, la relación de tipo Phillips que muestra la disyuntiva existente entre el cambio en los salarios monetarios y la tasa de desempleo) ya que está puede no ser lo suficientemente fuerte o sólida para responder a todas estas preguntas. Por consiguiente, en la práctica, el econometrista tiene que usar algún tipo de juicio al escoger el número de variables que ingresan al modelo y la forma funcional de éste y además tiene que plantear algunos supuestos sobre la naturaleza estocástica de las variables incluidas en el modelo. En cierta medida,hay algo de ensayo y error involucrado en la escogiencia del modelo "correcto" para análisis empírico.

Si se necesita realizar un juicio en el momento de seleccionar un modelo, por qué razónse requiere el supuesto 9? Sin entrar aquí en detalles, este supuesto se especifíca para recordar que el análisis de regresión y, por consiguiente, los resultados basados en ese análisis están condicionados al modelo escogido y para advertir que se debe pensar cuidadosamente al formular modelos econométricos, especialmente cuando puede haber diversas teorías compitiendo para tratar de explicar un fenómeno económico, tal como la tasa de inflación o la demanda de dinero, o la determinación del valor apropiado o de equilibrio de una acción o bono. Así, la construcción de modelos econométricos, como se verá posteriormente, con más frecuencia resulta ser más un arte que una ciencia. 

Modelo Clásico de regresión lineal: Supuestos detrás del método de mínimos cuadrados (XI)

Como se expuso en la Introducción, la metodología econométrica clásica supone implícitamente, cuando no lo hace explícito, que el modelo utilizado para verificar una teoría económica está "especificado correctamente". Este supuesto puede ser explicado informalmente de la manera siguiente. Una investigación econométrica empieza con la especificación de un modelo econométrico que sirve de base para explicar el fenómeno de interés. Surgen algunas preguntas importantes en la especificación del modelo entre las cuales se incluyen las siguientes: 1) Cuáles son las variables deben estar incluidas en el modelo? 2) Cuál es la forma funcional del modelo? Es el modelo lineal en los parámetros, en las variables, o en ambos? 3) Cuáles son los supuestos probabilísticos considerados sobre inclusión Yi, Xi y ui en el modelo?



Estas preguntas son muy importantes, ya que, como demostraremos en el capítulo 13, la omisión de variables importantes del modelo, o la escogencia de una forma funcional equivocada, o la consideración de supuestos estocásticos equivocados sobre las variables del modelo, harán muy cuestionable la validez de la interpretación de la regresión estimada. Para poder apreciar esto intuitivamente, obsérvese la curva de Phillips que aparece en la figura 1.3. Supóngase que se seleccionan los dos modelos siguientes para describir la relación entre la tasa de cambio de los salarios monetarios y al  tasa de desempleo:

donde Yi = la tasa de cambio de los salarios monetarios y Xi= la tasa de desempleo.

El modelo de regresión (3.2.7) es líneal en los parámetros al igual que en las variables, mientras (3.2.8) es lineal en los parámetros ( y por tanto, es un modelo de regresión lineal, de acuerdo con nuestra definición) pero no lo respecto a la variable X. Ahora considérese la figura 3.7 en la siguiente página.


lunes, 14 de octubre de 2013

Modelo Clásico de regresión lineal: Supuestos detrás del método de mínimos cuadrados (X)

Este supuesto tampoco es tan inocuo como parece. Observese la ecuación (3.1.6). Si todos los valores de X son idénticos, entonces Xi = X y el denominador de esa ecuación será cero, haciendo esto que la estimacion de β2 y, por consiguiente, de β1 sea imposible. Intuitivamente pronto se advierte la razón por al cual este supuesto es importante. Obsérvese el ejemplo de gasto de consumo familiar de los anteriores post. Si la variación en el ingreso familiar es muy leve, no seremos capaces de explicar gran parte de la variación en el gasto de consumo. El lector debe tener en mente al que variación en Y al igual que en X es esencial para utilizar el análisis de regresión como herramientas de investigación. En pocas palabras, las variables deben variar.


Modelo Clásico de regresión lineal: Supuestos detrás del método de mínimos cuadrados (IX)

Este supuesto no es tan inocuo como parece. En el ejemplo hipotético de la tabla 3.1, imagínese que se tenía solamente el primer par de observaciones sobre Y y X(4 y 1). De esta sola observación no hay forma de estimar los dos parámetros desconocidos, β1 y β2. Se necesitan por lo menos dos pares de observaciones para estimar dichos parámetros. En un capítulo posterior se verá la importancia crítica de este supuesto.


domingo, 13 de octubre de 2013

Modelo Clásico de regresión lineal: Supuestos detrás del método de mínimos cuadrados (VIII)

El supuesto 6 establece que la perturbación u y la variable explicativa X no están correlacionadas. El razonamiento para este supuesto es el siguiente: Cuando se expresa la FRP en la forma (2.4.2), se supone  que X y u (la cual representa la influencia de todas las variables omitidas) tienen una influencia separada (y aditiva) sobre Y. Pero si X y u están correlacionadas, no es posible determinar sus efectos individuales sobre Y. Así, si X y u están correlacionados positivamente, X aumenta cuando u aumenta y disminuye cuando u disminuye. Similarmente, si X y u están correlacionados negativamente, X aumenta cuando u disminuye y disminuye cuando u aumenta. En cualquier caso, es dificil aislar la influencia de X y u sobre Y.

El supuesto 6 se cumple automáticamente si la variable X no es aleatoria o no es estocástica y el supuesto 3 se mantiene, ya que en ese caso, la cov(ui, Xi) = [Xi - E(Xi)]E[ui -E(ui)] = 0. Pero puesto que se ha supuesto que la variable X no solamente no es estocástica sino que también asume valores fijos en muestras repetidas, el supuesto 6 no es muy crítico para nosotros se plantea aquí solamente para resaltar que la teoría de regresión presentada continúa siendo válida aún si las X son estocásticas o aleatorias, siempre que éstas sean independientes o, por lo menos, no estén correlacionadas con las perturbaciónes ui.


Modelo Clásico de regresión lineal: Supuestos detrás del método de mínimos cuadrados (VII)

Por supuesto, la varianza incondicional de Y es σ²y. Posteriormente veremos la importancia de distinguir  entre varianza  condicional e incondicional de Y (véase apéndice A para detalles de varianzas condicionales e incondicionales).



En palabras, (3.2.5) postula que las perturbaciones ui y uj no están correlacionadas. Técnicamente, éste es un supuesto de no correlación serial, o no autocorrelación. Esto significa que, dado Xi, las desviaciones de dos valores cualesquiera de Y de su media no muestran patrones como los que aparecen en la figura 3.6a y b. En la figura 3.6b se ve que los u están correlacionados positivamente, ya que un u positivo o un u negativo está seguido por un u negativo y viceversa.

Si las perturbaciones (desviaciones) siguen patrones sistemáticos, tales como los que aparecen en la figura 3.6a y b, hay correlación serial o autocorrelación y lo que requiere el supuesto 5 es que dichas correlaciones estén ausentes. La figura 3.6c muestra que no hay un patrón sistemático para los u, indicando así cero correlación.

Intuitivamente uno puede explicar este supuesto de la siguiente forma. Supóngase que en la FRP(Yt = β1 + β2Xt + ut)ut y u(t-1) están correlacionados positivamente. Entonces Yt depende no solamente de Xt sino también de u(t-1) puesto que u(t-1) determina en cierta medida a u. En esta etapa del desarrollo de la materia, al invocar el supuesto 5, se está diciendo que se considerará el efecto sistemático, si éste existe, de Xt sobre Yt, sin preocuparse sobre las otras influencias que podrían actuar sobre Y como resultado de las posibles correlaciones entre los u.
  

sábado, 12 de octubre de 2013

Modelo Clásico de regresión lineal: Supuestos detrás del método de mínimos cuadrados (VI)

Para entender el razonamiento detrás de este supuesto, obsérvese la figura del anterior post. Como lo muestra la figura, la var(u|X1) < var (u|X2),........, <var(u|Xi). Por consiguiente, lo más probable es que las observaciones de Y que provienen de la población con X = X1 estarían más cercanas a la FRP que aquellas que vienen de poblaciones correspondientes a X =X2, X=X3, y así sucesivamente. En resumen, no todos los valores de Y que corresponden a diversos X serán igualmente confiables, juzgando la confiabilidad por al cercanía o el alejamiento con el cual están distribuídos los valores de Y alrededor de sus medias, esto es, los puntos sobre la FRP. Si, de hecho, este es el caso, no se preferiría obtener muestras de aquellas poblaciones Y más cercanas a su media que de aquellas muy dispersas? Pero el hecho de actuar así podría restringir la variación que se obtiene a través  de los valores de X.

Al invocar el supuesto 4, se está diciendo que en esta etapa todos los valores de Y correspondientes a diversos valores de X son igualmente importantes.

Notese que sel supuesto 4, implica que las varianzas condiciones de Yi también son homoscedásticas. Esto es,

var (Yi|Xi) = σ²


Qué tan realistas son los supuestos? (I)

La pregunta del millón de dólares es: Qué tan realistas son todos estos supuestos? La "realidad de los supuestos" es una pregunta que desde hace muchos años ha sido planteada en la filosofía de las ciencias. Algunos argumentan que no interesa si los supuestos son realistas. Lo que interesa son las predicciones basadas en esos supuestos. Entre quienes apoyan la "tesis de la irrelevancia de los supuestos" sobresale Milton Friedman. Para él, la irrealidad de los supuestos es una ventaja positiva: "para que una hipótesis sea importante... debe ser descriptivamente falsa en sus supuestos."

Uno puede no estar completamente de acuerdo con este punto de vista, pero recuérdese que en cualquier estudio científico se hacen ciertos supuestos porque ellos facilitan el desarrollo de la materia objeto de estudio en pasos graduales, no por que ellos sean necesariamente realistas en el sentido de que repliquen la realidad exactamente. Como lo anota un autor "... si la simplicidad es un criterio deseable en una buena teoría, todas las buenas teorías idealizan y sobresimplifican violentamente " 

La siguiente analogía puede ser utilidad aquí. Los estudiantes de economía generalmente son introducidos al modelo de competencia perfecta antes de haber sido introducidos a los modelos de competencia imperfecta tales como el monopolio y el oligopolio, debido a que las implicaciones derivadas de este modelos nos capacitan para apreciar mejor los modelos de competencia imperfecta y no por que el modelo de competencia perfecta sea necesariamente realista. !El MCRL en econometría es el equivalente al modelo de competencia perfecta en la teoría de precios!

Modelo Clásico de regresión lineal: Supuestos detrás del método de mínimos cuadrados (V)

En contraste, considere la figura 3.5 donde la varianza condicional de la población Y varía con X. Esta situación se conoce apropiadamente como heteroscedasticidad, o dispersión desigual, o varianza desigual. Simbólicamente, en esta situación (3.2.2) puede escribirse como

var (ui|Xi) = σ²i
Obsérvese el subíndice sobre σ² en la ecuación (3.2.3), el cual indica que la varianza de la población Y ya no es constante.

Para diferenciar claramente las dos situaciones, sea Y el gasto de consumo semanal y X el ingreso semanal. Las figuras 3.4 y 3.5 muestran que a medida que el ingreso aumenta, el gasto de consumo promedio también aumenta. Pero en la figura 3.4 la varianza del gasto de consumo permanece igual para todos los niveles de ingreso mientras que en la figura 3.5 ésta aumenta con incrementos en el ingreso. En otras palabras, en promedio, las familias más ricas consumen más que las familias más pobres, pero hay también mayor variabilidad en el gasto de consumo de las primeras.

viernes, 11 de octubre de 2013

Modelo Clásico de regresión lineal: Supuestos detrás del método de mínimos cuadrados (IV)

Notese que el supuesto de E(ui|Xi)=0 implica que E(Yi|Xi) = β1+β2Xi.  Por consiguiente los dos supuestos son equivalentes



La ecuación (3.2.2) establece que la varianza de ui para cada Xi(esto es, la varianza condicional de ui) es algún número positivo constante igual a σ. Técnicamente representa el supuesto de homoscedasticidad, o igual (homo) dispersión (cetasticidad), o igual varianza. Planteado de otra forma (3.2.2) significaque las poblaciones Y correspondientes a diversos valores de X tienen la misma varianza. Esta situación puede apreciarse en el diagrama de la figura 3.4


Modelo Clásico de regresión lineal: Supuestos detrás del método de mínimos cuadrados (III)

Lo que todo esto significa es que el análisis de regresión es un análisis de regresión condicional, esto es, condicionado a los valores dados del (los) regresor(es) X.

El supuesto 3 establece que el valor de la media de ui, condicional sobre las Xi dadas, es cero Geométricamente, este supuesto puede representarse gráficamente como aparece en la figura 3.3,  que muestra algunos valores de la variable X y las poblaciones Y asociadas con cada uno de ellos. Puede observarse que cada población Y correspondiente a un X dado está distribuida alrededor de su media (que se representa por los puntos rodeados por un círculo sobre la FRP) con algunos valores de Y por encima y por debajo de ésta. Las distancias por encima y por debajo de los valores medios no son otra cosa que los ui,  y lo que (3.2.1) requiere es que el promedio o el valor medio de estas desviaciones correspondientes a cualquier X dado deban ser cero.

Este supuesto no debe ser difícil de entender en vista de lo expuesto en la seccion 2.4. Lo que el supuesto dice es que los factores que no están incluidos en el modelo y que, por consiguiente, están incorporados en ui, no afectan sistemáticamente el valor de la media de Y; es decir, los valores positivos de ui se cancelan con los valores negativos de ui de tal manera que el efecto promedio o de su media sobre Y es cero.

jueves, 10 de octubre de 2013

Modelo Clásico de regresión lineal: Supuestos detrás del método de mínimos cuadrados (II)

Puesto que los modelos de regresión lineal en parámetros son el punto de partida del MCRL, se mantendrá este supuesto a lo largo de este blog. Es de recordar que la variable  dependiente Y y el regreso X pueden no ser lineales en sí mismos, como se explicó el en anteriores posts.

Este supuesto está implícito en nuestro análisis de la FRP en los anteriores post. Pero es muy importante entender el concepto de "valores fijos en muestreo repetido", que puede ser explicado en términos del ejemplo dado en la tabla 2.1. Considérense las diversas poblaciones Y correspondientes a los niveles de ingreso que aparecen en esa tabla. Manteniendo el valor del ingreso X fijo, al nivel US$80, se puede seleccionar aleatoriamente una familia y observar su gasto de consumo familiar semanal Y, digamos US$60. Manténgase X aún en US$80, mientras se selecciona aleatoriamente otra familia y se observe su valor de Y de Us$75. En cada una de estas selecciones (es decir, muestreo repetido), el valor de X estáfijo en US$80. Se puede repetir este proceso para todos los valores de X que aparecen en la tabla 2.1. A propósito, los datos muestrales que aparecen en las tablas 2.4 y 2.5 fueron seleccionados en esta forma.


Modelo Clásico de regresión lineal: Supuestos detrás del método de mínimos cuadrados

Si nuestro objetivo consiste en estimar β1 y β2    solamente, el método de MCO presentado en la sección anterior será suficiente. Pero recuérdese de los anteriores posts que en el análisis de regresión nuestro objetivo es no solo obtener β1 y β2   sino también hacer inferencia sobre los verdaderos β1 y β2   . Por ejemplo, se desearía saber qué tan cerca están β1 y β2   de sus contrapartes en la población o que tan cerca esta Yi de la verdadera E(Y|Xi). Para este fin, no solamente se debe especificar la forma funcional del modelo, como aparece en la figura (2.4.2), sino también se deben hacer ciertos supuestos sobre la forma como las Yi son generadas. Para ver las razones de este requisito, observese la FRP: Yi =  β1 + β2Xi +ui   . Esta expresión muestra que Yi depende de Xi y de ui. Por consiguiente, mientras no se especifique la forma como se crean o se generan las Xi y las ui no hay manera de hacer alguna inferencia estadística sobre las Yi ni tampoco, como se verá, sobre     β1 y β2 . Así los supuestos hechos sobre la(s) variable(s) Xi y el término de error son muy críticos para lograr una interpretación válida de los valores estimados de la regresión. 

miércoles, 9 de octubre de 2013

Método de mínimos cuadrados ordinarios (MCO) (IX)

La ecuación (3.1.13) es conocida como forma de desviación. Notese que el término del intercepto β1 ha desaparecido. Pero este término siempre podrá ser estimado mediante (3.1.7), debido al hecho de que la línea de regresión muestral pasa a través  de las medias muestrales de Y y X. Una ventaja de las ecuaciones en forma de desviaciones es que éstas frecuentemente simplifican los cálculos aritméticos mientras se esté trabajando con calculadoras de escritorio. Pero en esta época del computador esta ventaja pierde validez.

Obsérvese de paso, que la FRM puede se escrita en forma de desviaciones como:


4. Los residuos ûi no están correlacionados con el valor predicho de Yi, lo cual puede ser verificado de la siguiente manera: utilizando la forma de desviación, podemos escribir.


Método de mínimos cuadrados ordinarios (MCO) (VIII)

3. El valor de la media de los residuos ûi es cero, la primera ecuación es:

donde yi y xi, de acuerdo con nuestra convención, representan desviaciones con relación a los valores respectivos de sus medidas (muestrales)

martes, 8 de octubre de 2013

Método de mínimos cuadrados ordinarios (MCO) (VII)


  1. Pasa a través de las medias muestrales de Yy X. Este hecho es obvio a partir de (2.1.7), ya que esta ecuación puede escribirse como Y =  β1 + β2X,  como se observa gráficamente es la figura 3.2.
  2. El valor promedio o medio del Y estimado = Yi es igual al valor medio del Y observado para 


Sumando ambos lados de esta última igualdad sobre los valores muestrales y dividiendo por el tamaño n  de la muestra se obtiene: