viernes, 31 de enero de 2014

Modelos semilogarítmicos: Log-Lin y Lin-Long (II)

Este modelo es igual a cualquier otro modelo de regresión líneal en el sentido de que los parámetros β1 y β2 son lineales. La única diferencia es que la variable dependiente o regresada es el logaritmo de Y y el regresor o variable explicativa es el "tiempo", que adquiere valore de 1,2,3, etc.

Modelos como (6.5.6) se denominan modelos semilog porque solamente una variable (en este caso la regresada) aparece en forma logarítmica. Para fines descriptivos, un modelo en el cual la variable regresada es logaritmica se denominará modelo log-lin. Más adelante se considerará un modelo en el cual la varible regresada es lineal pero el(los) regresor(es) es (son) logarítmico(s) y lo llamaremos un modelo lin-log.

Antes de presentar los resultados de la regresión, examínense las propiedades del modelo (6.5.5). En este modelo el coeficiente de la pendiente mide el cambio proporcional constante o relativo en Y para un cambio absoluto dado en el valor del regresor (en este caso la variable t), es decir,

β2 = (Cambio relativo en la variable regresada/cambio absoluto en el regresor) (6.5.7)

Si se multiplica el cambio relativo en Y por 100, (6.5.7) nos dará entonces el cambio porcentual, o la tasa de crecimiento, en Y ocasionada por un cambio absoluto en X, el regresor.

jueves, 30 de enero de 2014

Modelos semilogarítmicos: Log-Lin y Lin-Long (I)

Cómo medir la tasa de crecimiento: Modelo Log-Lin

Los economistas, la gente de negocios y los gobiernos frecuentemente están interesados en encontrar la tasa de crecimiento de ciertas variables económicas, tales como población, PNB, oferta monetaria, empleo, productividad, déficit comercial, etc.

En el ejercicio 3.22 presentamos información sobre el PIB real para los Estados Unidos durante el período 1972-1991. Suponga que deseamos encontrar la tasa de crecimiento del PIB real en este período. Sea Yt = PIB real (PIBR) en el tiempo t y Yo = el valor inicial (por ejemplo, 1972) del PIB real. Ahora recuérdese la siguiente fórmula conocida de interés compuesto de cursos introductorios en moneda, banca y finanzas.

miércoles, 29 de enero de 2014

Ecuaciones de diferencias a partir de la ecuación diferencial de energía (V)

Ahora, para el modelo lineal (3.7.1) una estimación de la pendiente está dada por el coeficiente β2 estimado, el cual, para la función de demanda de café, es -0.4795. Como se observa por el coeficiente β2 estimado, el cual, para la función de demanda de café, es -0.4795. Como se observa en 96.4.6), para obtener la elasticidad, se debe multiplicar este coeficiente de la pendiente por la razón (X/Y), es decir, el precio sobre la cantidad. Pero, Cuáles valores de X y de Y seleccionar? Como lo muestra la tabla 3.4 , hay 11 pares de valores de precio (X) y cantidad (Y). Si se utilizan todos estos valores, se tendrá 11 estimaciones de la elasticidad-precio.

En la práctica, sin embargo, la elasticidad se calcula para los valores medios, o promedios, de Y y de X. Es decir, se obtiene una estimación de la elasticidad promedio. Para el ejemplo, Y=2.43 tasas y X = US$1.11. Utilizando estos valores y el valor estimado de la pendiente de -0.4795, se obtiene de (6.4.6) un coeficiente de elasticidad-precio promedio de (-0.4795)(1.11/2.43) = -0.219,o cerca de -0.22. Este resultado presenta diferencia con el coeficiente de elasticidad de cerca de -0.25 obtenido del modelo log-lineal. Obsérvese que esta última elasticidad permanece igual sin importar el precio al cual es medida (Por que?), mientras que la primera depende de los valores particulares de la media.

martes, 28 de enero de 2014

Ejemplo ilustrativo: función de demanda de café reconsiderada (III)

La elasticidad E de la variable Y(por ejemplo, la cantidad demandada) con respecto a otra variable X (por ejemplo, el precio) es definido como

donde Δ denota un cambio (pequeño). Si Δ es suficientemente pequeño, podemos reemplazar ΔY/ΔX por la notación de cálculo diferencial, dY/dX.

lunes, 27 de enero de 2014

Ejemplo ilustrativo: función de demanda de café reconsiderada (II)

Surge una pregunta intersante: Comparando los resultados de la función de demanda log-lineal vs. la función de demanda lineal de (3.7.1), cómo se decide cuál es el mejor modelo? Se puede decir que (6.4.5) es mejor que (3.7.1) por que su valor r² es superior (0.7448 vs 0.6628)? Desafortunadamente,no se puede decir esto, como será demostrado en el capítulo 7, cuando la variable dependiente de dos modelos no es la misma (aquí, ln Y Vs.Y), los dos valores de r² no son directamente comparables. No se puede tampoco comparar directamente los dos coeficientes de las pendientes ya que en (3.7.1) el coeficiente de la pendiente da el efecto de un cambio unitario en el precio del café, por ejemplo US$1por libra, sobre la cantidad absoluta (es decir, no relativa) constante de reducción en el consumo de café, que es 0.4795 tazas por día. Por otra parte, el coeficiente de -0.2530 obtenido de (6.4.5) da la reducción porcentual constante en el consumo de café como resultado de un incremento del 1% en el precio del café por libra (es decir, da la elasticidad-precio).

Cómo se pueden entonces comparar los resultados de los dos modelos?Esta interrogante hace parte de uno más amplio relacionado con análisis de especificación, un tema analizado en el capítulo 13. Por ahora, una forma de comparar los dos modelos consiste en calcular una medida aproximada de la elascidad-precio para el modelo (3.7.1). Esto puede hacerse de la manera que lo explicamos en el siguiente post.

domingo, 26 de enero de 2014

Ejemplo ilustrativo: función de demanda de café reconsiderada (I)

Considérese la función de demanda de café de la sección 3.7. Mi asistente de investigación me había informado que, cuando se graficaron los datos utilizando la escala ln Y y ln X, el diagrama de dispersión parecia indicar que el modelo log-log podría haberse ajustado tan bien a los datos como el modelo lineal (3.7.1). Al efectuar los cálculos, el asistente obtuvo los siguientes resultados:




donde Yt = consumo de café, tasas por persona por día y Xt precio real del café, dólares por libra.

De estos resultados, vemos que el coeficiente de elasticidad-precio es -0.25, lo cual implica que por un incremento del 1% en el precio real del café por libra, la demanda de café (medida en términos de consumo diario de tazas de café) se reduce, en promedio, en cerca de 0.25%. Puesto que el valor de la elasticidad precio 0.25 es menor que 1 en términos absolutos, podemos decir que la demanda por café es inelástica al precio.

sábado, 25 de enero de 2014

Cómo medir la elasticidad: Modelo log-lineal (II)

Una característica importante del modelo log-log, que lo ha hecho muy popular en el trabajo empírico, es que el coeficiente de la pendiente β2 mide la elasticidad de Y con respecto a X, es decir, el cambio porcentual en Y ante un pequeño cambio porcentual en X dado. Así, si Y representa la cantidad demandada de un bien y X su precio unitario, β2 mide la elasticidad-precio de la demanda, un parámetro de gran interés en economía. Si la relación entre la cantidad demandada y el precio es como se muestra en figura 6.3a, la transformación doble-log presentada en la Figura 6.3b dará entonces la estimación de la elasticidad-precio (-β2).

Puede observarse dos características especiales del modelo log-lineal: El modelo supono que el coeficiente de la elasticidad entre Y y X, β2, permanece constante a través del tiempo Por qué? de aquí su nombre alterno moldeo de elasticidad constante. En otras palabras, como lo indica la figura 6.3b, el cambio en ln Y por unidad de cambio en ln X (es decir, la elasticidad, β2) permanece igual sin importar en cual ln X medimos la elasticidad. Otro aspecto del modelo es que a pesar de que α y β son estimadores insesgados de α y β2, β1 (el parámetros del modelo original) al ser estimado como β1 = antilog (α) es, de por sí, un estimador sesgado. En la mayor parte de los problemas prácticos, sin embargo, el término del intercepto es de importancia secundaria y no es necesario preocuparse por obtener este estimador insesgado.

En el modelo de dos variables, la forma más simple de decidir si el modelo log-lineal se ajusta a los datos es graficar el diagrama de dispersión de ln Yi frente a ln Xi y ver si las observaciones caen aproximadamente sobre una línea recta, como en la figura 6.3b.

viernes, 24 de enero de 2014

Cómo medir la elasticidad: Modelo log-lineal (I)

Considérese el siguiente modelo, conocido como el modelo de regresión exponencial:

Si los supuestos del modelo clásico d regresión lineal se cumplen, los parámetros puede ser estimados por el método MCO considerando

Yi* = α + β2X*i + ui

Donde Yi*=lnYi y X*i=lnXi. Los estimadores MCO obtenidos, α y β2, serán los mejores estimadores líneales insesgados de α y β2, respectivamente.

jueves, 23 de enero de 2014

Formas funcionales de los modelos de Regresión

Como se observa en capitulos anteriores, este blog trata principalmente con modelos que son lineales en los parámetros; los cuales pueden ser o no lineales en las variables. En las secciones que siguen, se consideran algunos modelos de regresión más comúnmente utilizados, que pueden ser no lineales en las variables pero que son lineales en los parámetros o que pueden serlo mediante transformaciones apropiadas de las variables. En particular, se analizarán los siguientes modelos de regresión:

  1. El modelo log-lineal
  2. Modelos semilogarítmicos 
  3. Modelos recíprocos
Analizaremos las características especiales de cada modelo, los casos en los cuales su uso es apropiado y la forma como éstos son estimados. Cada modelo es ilustrado con ejemplos apropiados.

miércoles, 22 de enero de 2014

Una nota sobre la interpretación

Puesto que el coeficiente de la pendiente, β2, es simplemente la tasa de cambio, ésta se mide en unidades de razón.

Unidades de la variable dependiente, Y/ Unidades de la variable explicativa, X

Así en al regresión (6.2.21), la interpretación del coeficiente de la pendiente 0.17395 es que si el PNB cambia en una unidad, siendo ésta mil millones de dólares, la IDPB cambia en promedio en 0.17395 mil millones de dólares. En la regresión (6.2.23), una unidad de cambio en el PNB, que es un millón de dólares, induce en promedio a un cambio de 0.00017395 miles de millones de dólares en la IDPB. Los dos resultados son pro supuesto idénticos en sus efectos del PNB sobre la IDPB; simplemente, están expresados en diferentes unidades de medición.

martes, 21 de enero de 2014

Ejemplo numérico: relación entre el IDPB y el PNB, Estados Unidos, 1974-1983 (II)

Obsérvese que el intercepto, lo mismo que su error estándar, es 1000( es decir w1 =1000 al pasar de miles de millones a millones de dólares) veces los valores correspondientes en la regresión (6.2.21), pero el coeficiente de la pendiente, al igual que su error estándar permanecen inalterados, como lo afirma la teoría.

La IDPB en miles de millones de dólares y el PNB en millones de dólares

lunes, 20 de enero de 2014

Ejemplo numérico: relación entre el IDPB y el PNB, Estados Unidos, 1974-1983 (I)

Para respaldar los resultados teóricos anteriores, considérese nuevamente el ejemplo de la tabla 6.2 y examínese los resultados de regresión siguientes. (Las cifras en paréntesis son los errores estándar estimados).

Si la escala de la IDPB y del PNB está en miles de millones de dólares.

domingo, 19 de enero de 2014

Escalas y Unidades de Medición (V)

DE los resultados anteriores debe quedar claro que, dados los resultados de regresión basados en una escala de medición, se pueden obtener los resultados basados en otra una vez se conozcan los factores de escala, w. En la práctica, sin embargo, se pueden escoger las unidades de medición en forma razonable, no tiene objeto manejar todos esos ceros al expresar números en millones o en miles de millones de dólares.

De los resultados dados en (6.2.15) hasta (6.2.20) se pueden derivar fácilmente algunos casos especiales. Por ejemplo, si w1 = w2, es decir, los factores de escala son idénticos, el coeficiente de la pendiente y su error estándar permanecen inalterados en el cambio de escala de (Yi, Xi) a (Y*i, W*i), lo cual intuitivamente debería ser claro. Sin embargo, el intercepto y su error estándar están ambos multiplicados por w1. Si la escala X no es cambiada (es decir, w2=1), peo la escala Y es cambiada por el factor w1, el coeficiente de la pendiente al igual que el intercepto y sus errores estándar respectivos, se multiplican todos por el mismo factor w1. Finalmente si la escala Y permanece inalterada (es decir, w1 =1), pero la escala X es cambiada por el factor w2, el coeficiente de la pendiente y su error estándar son multiplicados por el factor (1/w2), pero el coeficiente del intercepto y su error estándar permanecen inalterados.

Sin embargo, debe observarse que la transformación de la escala (Y,X) a la escala (Y*, X*)no afecta las propiedades de los estimadores MCO analizadas en los capítulos anteriores.

sábado, 18 de enero de 2014

Escalas y Unidades de Medición (IV)

DE estos resultados, es fácil establecer relaciones entre estos dos conjuntos de parámetros estimados. Todo lo que se debe hacer es recordar las siguientes relaciones definicionales: Y*i = w1Yi(o y*i = w1yi); X*i = w2Xi (o x*i = w2xi); û*i = w1ûi; Y* = w1Y y X* = w2X, mediante las cuales el lector fácilmente verificar que

viernes, 17 de enero de 2014

Escalas y Unidades de Medición (III)

Ahora, considérese la regresión utilizando las variables Y*i y X*i:


jueves, 16 de enero de 2014

Escalas y Unidades de Medición (II)

Para responder estas preguntas, se procede sistematicamente. Sea


miércoles, 15 de enero de 2014

Escalas y Unidades de Medición

Para entender las ideas desarrolladas en esta sección, considérese la información dada en la tabla 6.2. La información en esta tabla se refiere a la inversión doméstica privada bruta (IDPB) de los Estados Unidos y al Producto Nacional Bruto (PNB) en dólares de 1972 durante el período 1974-1983. En la columna (1) aparecen cifras del IDPB en miles de millones de dólares, mientras que en la columna (2) la misma información aparace expresada en millones de dólares. En las columnas (3) y (4) aparece información sobre el PNB en miles de millones de dólares y en millones de dólares respectivamente.

Supóngase que en la regresión de la IDPB sobre el PNB, un investigador utiliza información medida en miles de millones de dólares y otro lo hace sobre estas variables medidas en millones de dólares. Serán iguales los resultados de la regresión en ambos casos? De no ser así, Cuál de los resultados debe ser utilizado? En resumen, hay alguna diferencia en los resultados de regresión si las unidades en las cuales se miden las variables Y y X son distintas? De ser así, qué curso razonable debe seguirse en la selección de unidades de medida para el análisis de regresión?

martes, 14 de enero de 2014

Ejemplo ilustrativo: Linea característica de la teoría del portafolio (III)

Nota: Los valores r² de (6.1.12) y (6.1.13) no son directamente comparables. A partir de estos resultados, no se puede rechazar la hipótesis de que el verdadero intercepto sea igual a cero, justificando con ello, el uso de (6.1.1) es decir, la regresión a través del origen.

A propósito, obsérvese que no existe una gran diferencia en os resultados de (6.1.12) y (6.1.13), a pesar de que el error estándar estimado de β es ligeramente inferior para el modelo de regresión a través del origen, apoyando así el argumento de Theil dado en la nota de pie de página 4 que si αi es en realidad cero, el coeficiente de la pendiente puede ser medido con mayor precisión; utilizando la información dada en la tabla 6.1 y los resultados de regresión, el lector puede verificar fácilmente que el intervalo de confianza al 95% para el coeficiente de la pendiente del modelo de regresión a través del origen es (0.6566, 1.5232) mientras que para el modelo (6.1.13) es (0.5195, 1.6186); es decir, el primer intervalo de confianza es más angosto que el segundo.

lunes, 13 de enero de 2014

Ejemplo ilustrativo: Linea característica de la teoría del portafolio (II)

Si decidimos utilizar el modelo, obtenemos los siguientes resultados de regresión:
lo cual indica que βi es significativamente mayor que cero. La interpretación es que un incremento del 1% en la tasa de retorno del mercado, conduce en promedio a un incremento de cerca del 1.09% en la tasa de retorno del Fondo "Afuture Fund"

Cómo podemos estar seguros de que el modelo (6.1.11) y no (6.1.10), es el apropiado, especialmente en vista del hecho de que no existe una creencia a priori fuerte en la hipótesis de que α sea de hecho cero? Esto puede ser verificado corriendo la regresión (6.1.10). Utilizando la información dada en la tabla 6.1 se obtuvieron los siguientes resultados.

domingo, 12 de enero de 2014

Ejemplo ilustrativo: Linea característica de la teoría del portafolio (I)

La tabla 6.1 presenta los datos observados de las tasas anuales de retorno (%) sobre el fondo "A future fund", un fondo mutuo cuyo principal objetivo de inversión es obtener una ganancia máxima máxima sobre el capital y sobre el portafolio del mercado con base en el índice Fisher, durante el periodo 1971-1980.

En el ejercicio 5.5 introdujimos la línea característica del análisis de inversión, la cual puede ser escrita como



En la explicación no hay consenso sobre el valor teórico de αi. Algunos resultados empíricos han mostrado que éste es positivo y estadísticamente significativo en tanto que otros han mostrado que no es estadísticamente significativo, es decir no es diferente de cero; en este último caso escribíriamos el modelo así

Yi = βiXi + ui

es decir, una regresión a través del origen

sábado, 11 de enero de 2014

r² para el modelo de regresión a través del origen

Como recién se anotó y se analizará en mayor detalle en más adelante., el r² convencional dado en el capítulo 3 no se apropiado en regresiones que no incluyan o consideren el intercepto. Pero se puede calcular para tales modelos, lo que se conoce como el r² simple, el cual es definido como.


Noto: se trata de sumas de cuadrados simples o sencillas ( es decir, no corregidas por la media) y de productos cruzados.

A pesar de que este r² simple satisface la relación 0
Debido a las características especiales de este modelo, se debe ser muy cauteloso al utlizar el modelo de regresión de intercepto cero. A menos que haya una expectativa a priori muy fuerte, sería aconsejable apegarse al modelo convencional con presencia de intercepto. Esto tiene una doble ventaja. Primero, si el término intercepto es incluido en el modelo, pero resulta ser estadísticamente no significativo (es decir, estadísticamente igual a cero), para todos los fines prácticos tenemos una regresión a través del origen. Segundo y más importante, si de hecho, el modelo tiene un intercepto pero nosotros insistimos en ajustar una regresión a través del origen, estaríamos cometiendo un error de especificación, violando así el supuesto 9 del modelo clásico de regresión lineal.

viernes, 10 de enero de 2014

Regresión a través del origen (VI)

Las diferencias entre estos dos conjuntos de fórmulas deben ser obvias: En el modelo sin términos de intercepto, utilizamos sumas sencillas de cuadrados y productos cruzados pero en el modelo con intercepto, utilizamos sumas de cuadrados ajustadas (de la media) y productos cruzados. Segundo, los g de l para calcular σ^2 son (n-1) en el primer caso y (n-2) en el segundo caso.

Aunque el modelo sin intercepto o con intercepto cero puede ser apropiado en algunas ocasiones, hay algunas características de este modelo que deben ser observadas. Primero, Σûi que es siempre cero en el modelo con intercepto (el modelo convencional), no necesita serlo cuando este término está ausente. En resumen, Σûi no necesita ser cero en la regresión a través del origen. Segundo r², el coeficiente de determinación introducido en el capítulo 3, que siempre es no negativo del modelo convencional, en ocasiones puede volverse negativo al considerar el moldeo sin intercepto! este resultado anómalo surge por que el r² introducido ante supone explicitamente que el intercepto está incluido en el modelo. Por consiguiente, el r² calculado convencionalmente puede no ser apropiado en los modelos de regresión a través del origen.

jueves, 9 de enero de 2014

Regresión a través del origen (V)

Cómo se estiman modelos como (6.1.1) y qué problemas presentan ello? Para responder a estas preguntas, escríbanse primero la FRM de (6.1.1), a saber.

miércoles, 8 de enero de 2014

Regresión a través del origen (IV)

Como lo muestra este ejemplo, algunas veces la teoría que sirve de base requiere o exige que el término del intercepto deba estar ausente del modelo. La hipótesis de ingreso permanente de Milton Friedman, que afirma que el consumo permanente es proporcional al ingreso permanente, es otro caso en el cual el modelo de intercepto cero puede ser apropiado como también en la teoría del análisis de costos, en donde se postula que la variable costo de producción es proporcional al producto; y en algunas versiones de la teoría monetarista que afirman que la tasa de crecimiento de los precios (es decir, la tasa de inflación) es proporcional a la tasa de crecimiento de la oferta monetaria.

martes, 7 de enero de 2014

Regresión a través del origen (III)

Para fines empíricos, (6.1.2) es expresado frecuentemente así.




Este último modelo es conocido como el Modelo del Mercado. Si el MPAC se mantiene, se espera que αi sea cero.

Obsérvese que en (6.1.4) la variable dependiente, Y, es (Ri - rj) y la variable explicativa, X, es βi, el coeficiente de volatilidad y no(Rm- rj). Por consiguiente, para realizar la regresión (6.1.4), se debe estimar primero βi, el cual usualmente se obtiene de la línea característica, como se describió en un anterior ejercicio.

lunes, 6 de enero de 2014

Regresión a través del origen (II)

Si los mercados de capitales trabajan eficientemente, entonces el MPAC postula que el premio esperado del riesgo del título -valor (=ERi - rj) es igual a ese coeficiente β del título valor multiplicado por el premio esperado del riesgo del mercado (=ERm - rj). Si el MPAC se mantiene, tenemos la situación de la fig.6.1. La línea que aparece en la figura es conocida como línea del mercado de titulos-valores (LMV).

domingo, 5 de enero de 2014

Regresión a través del origen (I)

Hay ocasiones en las cuales la FRP de dos variables adquiere la siguiente forma:

Yi = β2Xi + ui

En este modelo el término intercepto está ausente o es cero, lo cual explica el nombre regresión a través del origen.

A manera de ilustración, considérese el Modelo de Fijación de Precios de Activos de Capital (MPAC) de la teoría moderna de portafolio la cual, en su forma riesgo-premio, puede expresarse como:

(ERi - rf) = βi(ERm - rj)

donde ERi = tasa esperada de retorno sobre el título-valor i.
          ERm = tasa esperada de retorno sobre el portaforlio del mercado como aparece representada por ejemplo, por el índice compuesto de acciones S&P500
rj = tasa de retorno libre de riesgo, por ejemplo, el retorno de los bonos del Tesoro a 90 días
βi = el coeficiente Beta, una medida de riesgo sistemático, es decir, riesgo que no puede ser eliminado a través de diversificación. También, una medida del grado es el cual la iésima tasa de retorno del título-valor se mueve con el mercado. Un βi > implica un título-valor volátil o riesgoso, mientras que βi < 1 es un título-valor seguro.

(Nota: No confunda esta βi con el coeficiente de la pendiente de la regresión con dos variables, β2)


sábado, 4 de enero de 2014

Extensiones del modelo de regresión lineal de dos variables

Algunos aspectos del análisis de regresión lineal pueden introducirse fácilmente dentro del marco del modelo de regresión lineal con dos variables que se ha estado analizando hasta ahora. Primero consideraremos el caso de regresión a través del origen, es decir, una situación en la cual el término del intercepto, β1 está ausente del modelo. Luego se considerará el tema de las unidades de medición, es decir, la forma como han sido medidas X y Y y la forma como un cambio en las unidades de medición afecta los resultados de la regresión. Finalmente, se verá el tema de la forma funcional del modelo de regresión lineal. Hasta el momento, se han considerado modelos que son lineales en los parámetros al igual que en las variables. Pero recuérdese que la teoría de regresión desarrollada en los capítulos anteriores solamente exige linealidad en los parámetros; las variables pueden entrar linealmente al modelo o pueden no hacerlo. Al considerar modelos que son lineales en los parámetros pero no necesariamente en las variables, se demuestra en este capítulo la forma como el modelo de dos variables puede tratarse a través de algunos problemas prácticos de interés.

Una vez haya sido entendidas las ideas introducidas en este capítulo, su extensión a los modelos de regresión múltiple es bastante sencilla, como se vera mas adelante.

viernes, 3 de enero de 2014

Otras prueba sobre la bondad del modelo

Recuérdese que el MCRLN tiene muchos otros supuestos adicionales al de la normalidad del término de error. A medida que se desarrolle la teoría econométrica, se considerarán diversas pruebas de la bondad del modelo. Hasta entonces, recuérdese que nuestra elaboración de modelos de regresión está basado en diversos supuestos simplificadores que pueden no mantenerse en todos los casos.

jueves, 2 de enero de 2014

Prueba de normalidad de Jarque-Bera (JB)

La prueba de JB de normalidad es una prueba asintótica, o de grandes muestras. También está basada en los residuos MCO. Esta prueba calcula primero la asimetría y los curtosis o apuntamiento de los residuos MCO y utiliza el siguiente estadístico de prueba:



donde A representa la asimetría y K representa la curtosis o apuntamiento.

Puesto que para una distribución normal el valor de la asimetría es cero y el valor de la curtosis es 3, en (5.12.2)(K-3) representa la curtosis excedente. Bajo la hipótesis nula de que los residuos están normalmente distribuidos, Jarque y Bera demostraron que asintóticamente (es, decir en muestras grandes) el estadístico JB dado en (5.12.2) sigue una distribución Ji cuadrado con 2 g de l. Si el valor p del estadístico ji cuadrado calculado en una aplicación es suficientemente pequeño, se puede rechazar la hipótesis de que los residuos están normalmente distribuidos. Pero si el valor p es razonablemente alto, no se rechaza el supuesto de normalidad.

En el ejemplo consumo-ingreso se encuentra (utilizando los paquetes de SHAZAM, TSP, ET) ek valor JB de 0.7769. Si la muestra fuera razonablemente grande, el valor p de obtener tal valor ji cuadrado para 2 g de l sería alrededor de 0.6781, una probabilidad bastante grande. Por consiguiente, asintóticamente, no se rechaza el supuesto de normalidad.

miércoles, 1 de enero de 2014

Prueba de Bondad de Ajuste Ji Cuadrado(X²) (IV)

Volviendo al ejemplo de consumo-ingreso, como se mostró en la tabla anterior, vemos que el valor de X² es alrededor de 0.92. Aunque el tamaño de la muestra es más bien pequeño, solamente para ilustrar el procedimiento aplicaremos la prueba Ji cuadrado. En este ejemplo se tienen seis clases. Parecería que los grados de libertad fueran (6-1) = 5. Pero, como se anotó en la nota de pie de página 21, perdimos 3 g de l más, pues se tuvieron que estimar β1 y β2 antes de poder calcular los residuos ûi y 1 porque se utilizan los datos para estimar la desviación estándar de los residuos. Ahora para 2 g de l, el valor p de obtener un Ji cuadrado mayor o igual que 0.925 es alrededor de 0.63. Puesto que esta probabilidad es bastante, alta la diferencia entre los valores observado y esperado de lso residuos no es lo suficientemente fuerte para rechazar el supuesto de normalidad.

A propósito, antes de aplicar la prueba Ji cuadrado de la forma recién descrita, se puede, en forma sencilla, graficar los residuos observados dados en la tabla anterior en la forma de histogramas como aparece en la figura 5.7. Como lo muestra esta figura, los residuales observados (medidos en términos de unidades de desviación estándar desde cero) parecen aproximarse a la distribución normal. Muy frecuentemente, una gráfica como ésta es una buena manera de aprender informalmente sobre la forma probable de la distribución de probabilidad de una variable aleatoria.