martes, 31 de marzo de 2015

Prueba de Berenblutt-Webb (IV)

Para el ejemplo salarios-productividad, d = 0.1380. Por tanto, ρ = 1- (0.1382)/2= 0.931.

Una vez se ha estimado ρ de (12.6.12), es posible transformar los datos como se indica en (12.6.6) y proceder con al estimación MCO usual. Esta técnica se ilustrará en breve. Pero antes de eso, se plantea una pregunta importante: Tendrán los coeficientes de regresión estimados las propiedades óptimas usuales del modelo clásico? Obsérvese que en la ecuación de diferencias generalizadas, aparece ρ y no ρ, pero al efectuar la regresión MCO utilizamos la última. Sin entrar en aspectos técnicos complejos, puede establecerse que como principio general, siempre que utilicemos un estimador en lugar del verdadero valor, los coeficientes estimados MCO tiene las propiedades óptimas usuales sólo asintóticamente, es decir, en muestras grandes . También los procedimientos de prueba de hipótesis convencionales son, estrictamente hablando, válidos asintóticamente. En muestras pequeñas, por consiguiente, se debe tener precaución al interpretar los resultados estimados.

lunes, 30 de marzo de 2015

Prueba de Berenblutt-Webb (III)

Al consultar la tabla de Durbin-Watson para 31 observaciones y 1 variable explicativa, se encuentra que dL = 1.363 y du = 1.496 (al nivel de significancia del 5%) y dL = 1.147 y dU = 1.273 (al nivel de significancia del 1%). Puesto que el valor de g observado se encuentra por debajo del límite inferior no se rechaza la hipótesis nula de que el verdadero ρ=1. Téngase presente que, aunque se utilizan las mismas tablas de Durbin-Watson, ahora la hipótesis nula es que ρ = 1 y no que ρ = 0. En vista de este hallazgo, la transformación de primera diferencia analizada anteriormente, bajo el supuesto de que ρ = 1, puede ser apropiada ρ basado en el estadistico d de Durbin-Watson. Recuérdese que anteriormente se establecio la siguiente relación.

lo cual sugiere una forma simple de obtener una estimación de ρ a partir del estadístico d estimado. Es claro de (12.6.12) que el supuesto  de primera diferencia de que ρ  = +1 es válido solamente si d = 0 o aproximadamente este valor. Es claro también cuando d = 2,  ρ =0 y cuando d = 4, ρ  = -1.  Por consiguiente, el estadístico d proporciona un método rápido para obtener una estimación de ρ. Pero obsérvese que la relación (12.6.12) es solamente una aproximación y puede no cumplirse para muestras pequeñas. Para muestras pequeñas, se puede utilizar el estadístico d modificado de Theil-Nagar.

domingo, 29 de marzo de 2015

Prueba de Berenblutt-Webb (II)

Si el modelo original contiene un término constante, se pueden utilizar las tablas de Durbin Watson para probar el estadistico g, excepto que la hipótesis nula es ahora que ρ = 1 en lugar de la hipótesis de Durbin-Watson de que ρ = 0.

Para ilustrar la prueba de Berenblutt-Webb, debe tenerse en cuenta el ejemplo salarios-productividad y suponer que Ho: ρ = 1. Regresando Y(salarios) sobre X(productividad), se obtiene SRC = 204.6934. En tanto que, regresando ΔY sobre ΔX, se obtiene SRC = 28.1938. Por consiguiente:

sábado, 28 de marzo de 2015

Prueba de Berenblutt-Webb (I)

Sobre la hipótesis de que ρ = 1. Para probar la hipótesis de que ρ = 1 (es decir, correlación serial de primer orden positivo perfecto). Berenblutt y Webb han desarrollado el siguiente estadístico g (o prueba).

viernes, 27 de marzo de 2015

Método de la primera diferencia (III)

El modelo anterior se conoce como regresión de promedios móviles (de dos períodos) porque se está regresando el valor de un promedio móvil sobre otro.

La transformación de primera diferencia, presentada anteriormente, es bastante popular en la econometría aplicada puesto que es fácil de realizar. Pero obsérvese que esta transformación decansa sobre el supuesto de que ρ = +1,; es decir, que la perturbaciones están correlacionadas positivamente en forma perfecta. Si este no es el caso el remedio puede ser peor que la enfermedad Pero Cómo se averigua si el supuesto de ρ = +1 se justifica en una situación dad? Esto puede comprobarse mediante la prueba de Berenblutt-Webb

jueves, 26 de marzo de 2015

Método de la primera diferencia (III)

Pero, por supuesto, β3 es el coeficiente de la variable de tendencia en el modelo original. Por tanto, la presencia de un término de intercepto en la forma de primera diferencia significa que hay un término de tendencia lineal en el modelo original y que el término de intercepto es, en realidad, el coeficiente de la variable de tendencia. Si β3 por ejemplo, es positivo en (12.6.9), significa que hay una tendencia arriba en Y después de permitir la influencia de todas las otras variables.

En lugar de suponer que ρ =+1, si se supone que ρ = -1, es decir, correlación serial negativa perfecta (lo cual no es típico en la series de tiempo económicas). La ecuación en diferencia generalizada (12.6.5) se convierte ahora en


miércoles, 25 de marzo de 2015

Método de la primera diferencia (II)

Obsérvese una característica importante del modelo en primera diferencia: No hay término de intercepto en él. Por tanto, para efectuar (12.6.7), deberá utilizarse el modelo de regresión a través del origen. Pero supóngase que el modelo original fuera:


martes, 24 de marzo de 2015

Método de la primera diferencia (I)

Puesto que ρ se encuentra entre 0 y ±1, se puede partir de dos posiciones extremas. En un extremo, se puede suponer que ρ = 0, es decir, no hay correlación serial y en el otro extremo, se puede considerar que ρ = ±1, es decir, una autocorrelación positiva o negativa perfecta. En realidad, cuando se efectúa una regresión, generalmente se supone que no hay autocorrelación y luego se deja que la prueba de Durbin-Watson u otras pruebas demuestren si el supuesto es justificado. Sin embargo, si ρ = ±1, la ecuación en diferencia generalizada (12.6.5) se reduce a la ecuación en primera diferencia ya que


donde Δ, denominado delta es el operador de primera diferencia y es un símbolo u operador (igual que el operador E de valor esperado) para diferencias consecutivas de dos valores. (Nota: Generalmente un operador es un símbolo para expresar una operación matemática). Al efectuar la regresión (12.6.7), todo lo que se debe hacer es formar las primeras diferencias de la variables dependiente y explicativa y utilizarlas en el análisis de regresión.

lunes, 23 de marzo de 2015

Cuando ρ no es conocida

Aunque la regresión en diferencias generalizada es de aplicación sencilla, esta regresión generalmente es difícil de efectuar en la práctica porque ρ raramente se conoce. Por consiguiente, se requiere diseñar métodos alternativos. Algunos de estos métodos son los siguientes.

domingo, 22 de marzo de 2015

Cuando la estructura de la autocorrelación es conocida (III)

Puesto que εt satisface todos los supuestos MCO, se puede proceder a aplicar MCO sobre las variables transformadas Y* y X* y obtener estimadores con todas las propiedades óptimas es decir, MELI. En efecto, realizar la regresión (12.6.6) es equivalente a utilizar los mínimos cuadrados generalizados (MCG), estudiados en la sección 12.3. Pero obsérvese que la primera expresión (Y1, X1) es excluida. Por qué?

LA regresión (12.6.5) se conoce por el nombre de ecuación en diferencia generalizada o cuasi-. Esta consiste en regresar Y sobre X, no en la forma original, sino en forma de diferencia, lo cual se logra restando una proporción (=ρ) del valor de una variable en el período de tiempo anterior de su valor en el período de tiempo actual. En este procedimiento de diferenciación se pierde una observación, puesto que la primera observación no tiene precedente. Para evitar esta pérdida de una observación, la primera observación sobre Y y X es transformada de la siguiente manera: Y1√(1-ρ²) y X1√(1-ρ²). Esta transformación es conocida como la transformación de Prais-Winsten.

sábado, 21 de marzo de 2015

Cuando la estructura de la autocorrelación es conocida (II)

Si se supone la validez de (12.6.1), el problema de correlación serial puede ser resuelto satisfactoriamente si se conoce ρ, el coeficiente de autocorrelación. Para ver esto, se tiene en cuenta al modelo con dos variables

viernes, 20 de marzo de 2015

Cuando la estructura de la autocorrelación es conocida (I)

Puesto que las perturbaciones ut no son observables, la naturaleza de la correlación serial es frecuentemente un asunto de especulación o de exigencias prácticas. En la práctica, usualmente se supone que las ut siguen el esquema autorregresivo de primer orden, a saber

ut = ρu(t-1) + εt

donde |ρ| < 1 y donde las εt siguen los supuestos MCO de valor esperado cero, varianza constante y no autocorrelación, como se muestra en (12.2.2)

jueves, 19 de marzo de 2015

Medidas Remediales

Puesto que en presencia de correlación serial los estimadores MCO son ineficientes, es esencial buscar medidas remediales. El remedio, sin embargo, depende del conocimiento que se tenga sobre la naturaleza de la interdependencia entre las perturbaciones. Se distinguen dos situaciones: cuando la estructura de la autocorrelación es conocida y cuando no lo es.

miércoles, 18 de marzo de 2015

Los siguientes puntos prácticos sobre la prueba BG puede mencionarse (II)

Un ejemplo ilustrativo. Retornando a la regresión salarios-productividad, considerada anteriormente, se siguió el procedimiento BG, introduciendo cinco valores rezagados de los residuales MCO en la regresión auxiliar (es decir, en la regresión de salarios sobre productividad y cinco valores rezagados de los residuales, obtenidos de la regresión de salarios sobre productividad solamente). El valor R² de esta regresión (auxiliar) fue 0.8660. En total, hay 32 observaciones en la regresión original pero, debido a los cinco rezagos utilizados, se tienen solamente 27 observaciones en la regresión auxiliar. Por consiguiente, (27)(0.8660) = 23.382; el valor p, o probabilidad exacta de obtener tal valor ji cuadrado es alrededor de 0.0003, el cual es bastante bajo. Por tanto, se puede rechazar la hipótesis de que todos los cinco coeficientes rezagados de las u son iguales a cero. Al menos un coeficiente rezagado debe ser diferente de cero. Este hecho no es sorprendente dado el hallazgo anterior de que hay autocorrelación AR(I) en los residuales.



martes, 17 de marzo de 2015

Los siguientes puntos prácticos sobre la prueba BG puede mencionarse (I)


  1. Los regresores incluidos en el modelo de regresión pueden contener valores rezagados de la variable regresada Y, es decir, Y(t-1), Y(t-2) etc. pueden aparecer como variables explicativas. Contrástese este modelo con la restricción de la prueba de Durbin-Watson, que no permite valores rezagados de la variable regresada entre las variables explicativas.
  2. La prueba BG esaplicable aun si el término de perturbación sigue un proceso MA de orden p, es decir, que los ut son generados de la forma:
ut = 
εt + λ1ε(t-1) + λ2ε(t-2) + ...... λpε(t-p)

donde ε es un término de perturbación aleatorio con media cero y varianza constante.
3. Si p = 1 (12.5.12), significando autorregresión de primer orden, entonces la prueba BG se conoce por el nombre de prueba m de Durbin.

4. Una desventaja de la prueba BG es que el valor de p la longitud de rezago, no puede especificarse a priori. Es inevitable algún grado de experimentación con el valor de p. Se retornará a este tema más adelante en el análisis de series de tiempo econométricas.

lunes, 16 de marzo de 2015

Prueba de Breusch-Godfrey (BG) Sobre autocorrelación de orden superior (III)

Es decir, asintóticamente, (n-p) veces el R² obtenido en el paso 2 sigue la distribución ji cuadrado con p y g de l. Si en una aplicación (n-p).R² excede el valor crítico ji cuadrado al nivel de significancia seleccionado, se puede rechazar la hipótesis nula, en cuyo caso, por lo menos un ρ es significativamente diferente de cero.

domingo, 15 de marzo de 2015

Prueba de Breusch-Godfrey (BG) Sobre autocorrelación de orden superior (II)


  1. Estímese el modelo de regresión mediante el procedimiento MCO usual y obtenga los residuales ut.
  2. Efectése la regresión de ut sobre todos los regresores en el modelo más estos regresores adicionales, u(t-1), u(t-2),...... u(t-p), donde éstos últimos sonlos valores rezagados de los residuales estimados en el paso 1. Así, si p =4, se introducirán en el modelo cuatro valores rezagados de los residuales como regresores adicionales. Obsérvese que para efectuar esta regresión, se tendrán solamente (n-p) observaciones Por qué?. Obténgase el valor R² de esta regresión, la regresión auxiliar.
  3. Si el tamaño de la muestra es grande, Breusch y Godfrey han demostrado que 
(n- p).R²  ~ X²p

sábado, 14 de marzo de 2015

Prueba de Breusch-Godfrey (BG) Sobre autocorrelación de orden superior (I)

Supóngase que el término de perturbación ut es generado por el siguiente esquema autorregresivo de orden p:

ut = ρ1u(t-1) + ρ2u(t-2) + ...............+ ρpu(t-p) + εt

donde εt es un término de perturbación puramente aleatorio con media cero y varianza constante.

Nuestra hipótesis nula Ho es: ρ1 = ρ2 = ........= ρp = 0, que todos los coeficientes autorregresivos son simultáneamente iguales a cero, es decir, que no hay autocorrelación de ningún orden. Breusch y Godfrey han demostrado que la hipótesis nula puede ser probada de la siguiente manera.

viernes, 13 de marzo de 2015

Pruebas adicionales de autocorrelación

Prueba asintótica, o de grandes muestras. Bajo la hipótesis nula de que ρ = 0 y suponiendo que el tamaño n de la muestra es grande (técnicamente, infinito), puede demostrarse que √ n .ρ sigue una distribución normal con media 0 y varianza = 1. Es decir, asintóticamente,

(√n).ρ ~ N(0,1)

Como ilustración de la prueba, para el ejemplo de salarios-productividad, la estimación de ρ resultó ser 0.8844. Dado el tamaño de la muestra igual a 32, se encuentra que (√32).ρ=(0.8844) = 5.003. Asintóticamente, si la hipótesis nula de que ρ = 0 fuera verdadera, la probabilidad de obtener un valor de alrededor de 5.00 a superior es muy baja. Recuérdese que para la distribución normal estándar, el valor Z crítico al 5% (dos colas) (es decir la variable normal estándar) es 1.96 y el valor Z crítico al 1% es alrededor de 2.58. Por tanto, se rechaza Ho de que ρ = 0 .

jueves, 12 de marzo de 2015

Prueba d de Durbin-Watson (XI)

Si no se desea utilizar la prueba d modificada, puede caerse en la prueba no paramétrica de rachas analizada anteriormente.

Al utilizar la prueba de Durbin-Watson, es esencial anotar que ésta no puede ser aplicada si se violan los supuestos en los cuales se basa la misma. En particular, no debe ser utilizada para comprobar la presencia de correlación serial en modelos autorregresivos, es decir, en modelos que contienen uno o varios valores rezagados de la variable dependiente como variable(s) explicativa(s). Si se aplica erróneamente, el valord en tales casos estará frecuentemente alrededor de 2, que es el valor d esperado en ausencia de autocorrelación de primer orden. Por tanto hay un sesgo construido en contra del descubrimiento de correlación serial en tales modelos. Este resultado no significa que los modelos autorregresivos no sufran del problema de autocorrelación. Como se verá e un capítulo posterior, Durbin ha desarrollado el llamado estadístico h para probar correlación serial en tales modelos.

miércoles, 11 de marzo de 2015

Prueba d de Durbin-Watson (X)

1. Ho: ρ = 0 vs H1: ρ > 0: Si el valor estimado d < du, rechácese Ho el nivel α, es decir, hay correlación positiva estadísticamente significativa.

2.  Ho: ρ = 0 vs H1: ρ < 0: Si el valor estimado (4-d) < du, rechácese Ho al nivel α; hay evidencia estadísticamente significativa de autocorrelación negativa.

3. Ho: ρ = 0 vs H1: ρ ≠ 0: Si el valor estimado d < dv o (4-d) < dv, rechácese Ho al nivel 2α; estadísticamente, hay evidencia significativa de autocorrelación positiva o negativa.

Un ejemplo. Supóngase que en una regresión que considera 50 observaciones y 4 regresores, el valor estimado para d fue 1.43. De las tabla Durbin-Watson, se encuentra que el nivel del 5%, los valores d críticos son dL = 1.38 y du = 1.72. Con base en la prueba d usual, no se puede decir si existe correlación positiva o no porque el valor d estimado se encuentra en el rango de indecisión. Pero con base en la prueba d modificada, se puede rechazar la hipótesis de no correlación positiva puesto que d < dv.

martes, 10 de marzo de 2015

Prueba d de Durbin-Watson (IX)

A pesar de ser muy popular, la prueba d tiene una gran desventaja: cuando cae en la zona de indecisión o región de ignorancia, no se puede concluir si la autocorrelación existe o no. Para resolver este problema, diversos autores han propuesto modificaciones a la prueba d de Durbin-Watson pero son un poco complicadas y están por fuera del alcance de este blog. El programa de computador Shazam lleva a a cabo una prueba d exacta (ésta da el valor p, la probabilidad exacta del valord calculado) y quienes tengan acceso a este programa puede utilizar esta prueba en caso de que el estadístico d usual se encuentre  en la zona de indecisión. En muchas situaciones, sin embargo, se han encontrado que el límite superior du es aproximadamente el verdadero límite de significancia y, por consiguiente, en el caso de que el valor d estimado se encuentre en la zona de indecisión, se puede utilizar el siguiente procedimiento de prueba d modificada. Dado el nivel de significancia α.

lunes, 9 de marzo de 2015

Prueba d de Durbin-Watson (VIII)

Para ilustrar el mecanismo, se retorna a la regresión salarios-productividad. De la información dada en la tabla 12.4, podemos apreciar que el valor estimado de d es 0.1380, sugiriendo que existe una correlación serial positiva en los residuales. Por qué?. A partir de las tablas de Durbin-Watson, se encuentra que para 32 observaciones y una variable explicativa (excluyendo el intercepto), dL = 1.37 y dU = 1.50 al nivel de 5%. Puesto que el valor estimado de 0.1380 se encuentra por debajo de 1.37, no se puede rechazar la hipótesis  de que hay correlación serial positiva en los residuales.


domingo, 8 de marzo de 2015

Prueba d de Durbin-Watson (VII)

El mecanismo de la prueba de Durbin-Watson es el siguiente, suponiendo que se cumplen los supuestos sobre los cuales se basa la prueba:


  1. Efectuar la regresión MCO y obtener los residuales
  2. Calcular d a partir de (12.5.4). (La mayoría de los programas de computador incluyen este cálculo).
  3. Para un tamaño de muestra dado y un número de variables explicativas dado, encuéntrese los valores críticos dL y du.
  4. Síganse ahora las reglas de decisión dadas en la tabla 12.5. Para facilitar su entendimiento, estas reglas se resumen en la figura 12.9.

sábado, 7 de marzo de 2015

Prueba d de Durbin-Watson (VI)

Es deducible de la ecuación (12.5.9) que si p = 0, d= 2; es decir si no hay correlación serial (de primer orden), se espera que d esté alrededor de 2. Por consiguiente, como regla práctica, si en una aplicación se encuentra que d es igual a 2, se puede suponer que no hay autocorrelación de primer orden, bien sea positiva o negativa. Si p = +1, indica una correlación positiva perfecta en los residuales, d = 0. Por consiguiente, entre más cercano esté d a 0, mayor será la evidencia de correlación serial positiva. Esta relación debe ser evidente de (12.5.4) por que si hay autocorrelación positiva, las ut aparecerán agrupadas y sus diferencias, por consiguiente, tenderán a ser pequeñas. Como resultado, la suma de cuadrados del numerador será menor en comparación con la suma de cuadrados del denominador, el cual es un valor que permanece fijo para cualquier regresión dad.

Si p=1 es decir, hay una correlación negativa perfecta entre los valores cosecutivos de los residuales, d =4. Por tanto, entre más se acerque d a 4, mayor será la evidencia de correlación serial negativa. Nuevamente, al analizar (12.5.4), esto es entendible. Pues, si hay autocorrelación negativa, una ut positiva tenderá a estar seguida por un ut negativo y viceversa, de tal forma que |ut - u(t-1)| será usualmente mayor que |ut|. Por consiguiente, el numerador de d será comparativamente mayor que el denominador.

viernes, 6 de marzo de 2015

Prueba d de Durbin-Watson (V)

El procedimiento de prueba aplicado puede explicarse mejor con la ayuda de la figura 12.9, a cual muestra que los límites de d son 0 y 4. Estos pueden establecerse expandiendo (12.5.4) para obtener.


jueves, 5 de marzo de 2015

Prueba d de Durbin-Watson (IV)

El muestreo exacto o la distribución de probabilidad del estadístico d dado en (12.5.4) es difícil de derivar porque, como lo han demostrado Durbin y Watson depende de forma compleja de los valores presentes de X en una muestra dada. Esta dificultad puede ser entendida porque d es calculadoa partir de ut, los cuales, por supuesto, dependen de las X dadas. Por consiguiente, a diferencia de las pruebas t, F o X², no hay un valor crítico único que lleve al rechazo o a la apceptación de la hipótesis nula de que no hay correlación serial de primer orden de las perturbaciones ui. Sin embargo Durbin y Watson tuvieron éxito al encontrar un límite inferior dL y un límite sperior du tales que si el valor d calculado de (12.5.4) cae por fuera de estos valores críticos, puede tomarse una decisión con respecto a la presencia de correlación serial positiva o negativa. Además, estos límites solamente dependen del número de observaciones n y del número de variables explicativas y no dependen de los valores que adquieren estas variables explicativas. Estos límites para n, de 6 a 200 y hasta 20 variables explicativas, han sido tabuladas por Durbin y Watson y son reproducidos en el apéndice D, tabla .5.

miércoles, 4 de marzo de 2015

Prueba d de Durbin-Watson (III)

4. El modelo de regresión no incluye valor(es) rezagado(s) de la variable dependiente como una de las variables explicativas. Por tanto, la prueba es inaplicable a modelos del siguiente tipo

donde Y(t-1) es el valor de Y rezgado un período. Tales modelos se conocen como modelos autorregresivos, los cuales serán estudiados en el cap 17.

5. No hay observaciones faltantes en los datos. Por tanto, en nuestra regresión de salarios productividad para el período 1960-1991 si por alguna razón faltaran las observaciones, por ejemplo para 1963 y 1972, el estadístico d no permitiría la ausencia de tales observaciones.

martes, 3 de marzo de 2015

Prueba d de Durbin-Watson (II)


  1. El modelo de regresión incluye el término de itercepto. Si dicho término no está presente, como es el caso de la regresión a través del origen, es esencial efectuar nuevamente la regresión incluyendo el término del intercepto para obtener la SRC.
  2. Las variables explicativas, X, son no estocásticas, es decir, son fijas en muestreo repetido.
  3. Las perturbaciones ut se generan mediante el esquema autorregresivo de primer orden ut = ρu(t-1) + εt 

lunes, 2 de marzo de 2015

Prueba d de Durbin-Watson (I)

La prueba más conocida para detectar correlación serial es la desarrollada por los estadísticos Durbin y Watson. Es comúnmente conocida como el estadístico d de Durbin-Watson, el cual se define como

que es simplemente la razón de la suma de las diferencias al cuadrado de residuales sucesivos sobre las SRC. Obsérvese que en el numerador del estadístico d, el número de observaciones es n-1 porque una observación se pierde al obtener las diferencias consecutivas.

Una gran ventaja del estadístico d es que está basado en los residuales estimados, que aparecen sistematizados en los análisis de regresión, junto con otros estadísticos resumen tales como el R², el R² ajustado, las razones t, etc. Aunque el estadístico d es utilizado ahora en forma sistematizad, es importante anotar los supuestos en los cuales éste se basa:


domingo, 1 de marzo de 2015

Prueba de "Las rachas" (IV)

Puesto que el número de racha es 5, éste claramente cae por fuera de este intervalo. Por consiguiente, se puede rechazar la hipótesis de que la secuencia observada de los residuales que se muestra en la figura 12.7 sea aleatoria, con el 95% de confianza.

Puesto que el número de observaciones puede ser pequeño para la prueba de la normal anterior, se invita al lector para que verifique, con base en los valores críticos de las rachas dados en el apéndice D, tabla D.6, que es posible llegar a la misma conclusión, a saber, que la secuencia observada no es aleatoria.

Si n1 o n2 son inferiores a 20, Swed y Eisenhart han desarrollado tablas especiales que proporcionan valores críticos de las rachas esperadas en una secuencia aleatoria de n observaciones. Estas tablas se dan en el apéndice D, tabla D. 6.