domingo, 30 de noviembre de 2014

Métodos formales - Prueba de Park (II)

Puesto que σi² generalmente no se conoce, Park sugiere utilizar ûi² como aproximación y correr la siguiente regresión:

Si β resulta ser estadísticamente significativo, esto sugerirá que hay heteroscedasticidad en los datos. Si resulta ser no significativo, se puede aceptar el supuesto de heteroscedasticidad. La prueba de Park es, por tanto, un procedimiento de dos etapas. En la primera etapa se efectúa la regresión MCO ignorando el interrogante de la heteroscedasticidad. Se obtiene ûi de esta regresión y luego, en la segunda etapa, se efectúa la regresión (11.5.2).

Aunque empíricamente la prueba de Park es atractiva, ésta tiene algunos problemas. Goldfeld y Quandt han argumentado que el término de error vi que entra en (11.5.2) puede no satisfacer los supuestos MCO y puede en sí mismo ser heteroscedástico. No obstante, es posible utilizar la prueba de Park como un método esctrictamente exploratorio.

sábado, 29 de noviembre de 2014

Métodos formales - Prueba de Park (I)

Park formaliza el método gráfico sugiriendo que σi² es algún tipo de función de la variable explicativa Xi. La forma funcional sugerida por él fue.

viernes, 28 de noviembre de 2014

Método gráfico (II)

En lugar de graficar los ûi² frente a los Yi, se pueden graficar frente a una de las variables explicativas, especialmente si el grafico de ûi² frente a Yi presenta un patrón como el que se aprecia en la figura 11.7a. Tal gráfico que aparece en la figura 11.8 puede revelar patrones similares a aquellos dados en la figura 11.7 (en el caso del modelo con dos variables, el grafico de los ûi² frente a los Yi es equivalente a graficar los primeros frente a X, razón por la cual la figura 11.8 es similar a la figura 11.7. Pero esta no es la situación cuando se considera un modelo que involucra dos o más variables Xi en este caso ûi² puede ser graficado frente a cualquier variable X incluida en el modelo.

jueves, 27 de noviembre de 2014

Método gráfico (I)

Si no hay información a priori o empírica sobre la naturaleza de la heteroscedasticidad, en la práctica se puede llevar a cabo el análisis de regresión bajo el supuesto de que hay heteroscedasticidad y luego hacer un examen post mortem de los residuales elevados al cuadrado, ûi², para ver si ellos exhíben algún patrón sistemático. Aunque los ui² no son lo mismo que los ui², los primeros puede ser usados como aproximación de los últimos especialmente si el tamaño de la muestra es suficientemente grande. Un examen de los ui² puede revelar patrones tales como los presentados en la figura 11.7.

En la figura 11.7 se grafican los ûi² frente a los Yi, que son los Yi estimados mediante la línea de regresión, con la idea de averiguar si el valor medio estimado de Y está relacionado sistemáticamente con el residual al cuadrado. En la figura 11.7a se ve que no hay patrón sistemático entre las dosvariables, lo cual sugiere que posiblemente no hay heteroscedasticidad en los datos. Sin embargo las figuras 11.7b hasta 11.7e muestran patrones definidos. Por ejemplo, la figura 11.7c sugiere una relación lineal, mientras que las figuras 11.7 y 11.7e indican una relación cuadrática entre ûi² y Yi. Utilizando tal conocimiento, si bien es informal, es posible transformar los datos de tal manera que una vez transformados, no presenten heteroscedasticidad. En la sección 11.6 se examinarán diversas transformaciones de este tipo.

miércoles, 26 de noviembre de 2014

Métodos informales

Naturaleza del problema. Con bastante frecuencia, la naturaleza del problema bajo consideración sugiere la posibilidad de que exista heteroscedsasticidad. Por ejemplo, a partir del trabajo pioner de Paris y Houthakker sobre estudíos de presupuesto familiar, en el cual se encontró que la varianza residual correspondiente a la regresión del consumo sobre el ingreso aumentaba con el ingreso, ahora, generalmente, se supone que encuestas similares, se pueden esperar varianzas desiguales entre las perturbaciones. De hecho, en la información de corte transversal que comprende unidades heterogéneas, la heteroscedasticidad puede ser la regla mas que la excepción. Así, en el análisis de corte transversal que relaciona el gasto de inversión con las ventas, la tasa de interés, etc., generalmente se esepera la presencia de heteroscedasticidad si se han agrupado empresas de tamaños pequeño, mediano y grande.

martes, 25 de noviembre de 2014

Detección de la heteroscedasticidad

De igual forma que sucede con la multicolinealidad, la pregunta práctica importante es: Cómo se sabe que la heteroscedasticidad está presente en una situación específica? Nuevamente, como en el caso de la multicolinealidad, no existen reglas fuertes y rápidas para detectar la heteroscedasticidad, solamente algunas reglas prácticas. Pero esta situación es inevitable porque σi² solamente puede conocerse si se tiene la población Y, correspondiente a las X seleccionadas, compelta tal como la población presentada en la tabla 2.1 o en la tabla 11.1. Pero tal información es una excepción más que la regla en la mayoría de las investigaciones económicas. A este respecto, el econometrista difiere de los cientifícos en campos tales como la agricultura y la biología, donde los investigadores tienen gran parte del control sobre sus temas. En los estudios de economía, es frecuente que solamente haya un valor muestral Y correspondiente a un valor particular de X. Por consiguiente, no hay forma de conocer σi² a partir de una sola observación Y. Así en la mayoría de los casos relacionados con investigaciones econométricas, la heteroscedasticidad puede ser un asunto de intuición o un "educated guesswork" o un trabajo basado en experiencia empírica previa o en pura especulación.

Teniendo en mente la advertencia anterior, se pueden examinar algunos de los métodos informales y formales para detectar la heteroscedasticidad. Como lo revelará el siguiente análisis, la mayoría de estos métodos están basados en el examen de los residuales ûi de MCO, puesto que son estos los que se observan y no las perturbaciones ui. Se espera que ellos sean buenas estimaciones de ui. una esperanza que puede cumplirse si el tamaño de la muestra es relativamente grande.

lunes, 24 de noviembre de 2014

Estimación MCO ignorando la heteroscedasticidad (III)

La caracteristica más sobresaliente de estos resultados es que los MCO con o sin corrección por heteroscedasticidad, sobrestiman consistentemente el verdadero error estándar obtenido mediante el procedimiento (correcto) MCG, especialmente para valores grandes de α, con lo cual se establece  la superioridad de MCG. Estos resultados también muestran que si no se utiliza MCG y se depende de MCO - permitiendo o no la heteroscedasticidad- el resultado es una mezcla. Los errores estándar MCO usuales son muy grandes  (para el intercepto) o generalmente muy bajos (para el coeficiente de pendiente ) con relación a los obtenidos por MCO permitiendo la heteroscedasticidad . El mensaje es claro, ante la presencia de heteroscedasticidad, utilícese MCG. Sin embargo,por las razones explicadas más adelante en el capítulo, en la práctica no siempre es fácil aplicar el MCG.

DEl análisis anterior, es claro que la hetorscedasticidad es un problema potencialmente grave y el investigador debe saber si ella está presente en una situación dada. Si se detecta su presencia, se pueden tomar acciones correctivas, tales como utilizar una regresión de mínimos cuadrados ponderados o alguna otra técnica. Sin embargo, antes de examinar los diversos procedimientos correctivos, es preciso averiguar primero si hay presencia de heteroscedasticidad o si es probable que la haya en un caso dado. Este tema se analiza en la siguiente sección.

domingo, 23 de noviembre de 2014

Estimación MCO ignorando la heteroscedasticidad (II)

Para dar mayor claridad a este tema, se hace referencia a un estudio de Monte Carlo realizado por DAvidson y Mackinnon. ellos se consideran el siguiente modelo simple, que en la notación es

Yi = β1+β2Xi +ui

Suponen que β1=1, β2 = 2 y ui ~N(0,Xi^α) Como lo indica la última expresión, ellos suponen que la varianza del error es heteroscedástica y que está relacionada con el valor del regresor X elevado a la potencia α. Si, por ejemplo, α =1, la varianza del error es proporcional al valor de Xi si α =2, la varianza del error es proporcional al cuadrado del valor de X y así sucesivamente. En la sección 11.6 se considerará la lógica que soporta tal procedimiento. Basados en 20,000 replicaciones y permitiendo diversos valores para α, ellos obtienen los errores estándar de los dos coeficientes de regresión utilizando MCO. MCO con presencia de heteroscedasticidad y MCG. Se citan sus resultados para valores seleccionados de α:

sábado, 22 de noviembre de 2014

EStimación MCO ignorando la heteroscedasticidad (I)

La situación se torna muy grave si, además de utilizar β2, también se sigue utilizando la fórmula usual de varianza (homoscedástica) dada en (11.2.3), aun si existe heteroscedasticidad como si se sospecha de su existencia: obsérvese que este es el caso más probable de los dos que aquí se analizan, puesto que al correr un paquete de regresión MCO estándar e ignorar (o no saber de) la existencia de heteroscedasticidad se producirá una varianza de β2 como la daad en (11.2.3). En primero lugar, la var(β2) dada en (11.2.3) es un estimado sesgado de var(β2) dada en (11.2.2), es decir en promedio (sobreestimación) o negativo (subestimación) pues este depende de la naturaleza de la relación entre σi² y los valores tomados por la variable explicativa X, como puede verse claramente en (11.2.2). El sesgo surge del hecho de que σ², el estimador convencional de σ², a saber Σui²/(n-2) deja de ser un estimador insesgado del último cuando hay presencia de heteroscedasticidad. Como resultado, ya no podemos depender de los intervalos de confianza calculados convencionalmente y de las pruebas t y F tradicionalmente empleadas. En resumen, si se persiste en utilizar los procedimientos de prueba usuales, a pesar de la presencia de hetorscedasticidad, las conclusiones a las cuales se llegue o a las inferencias que se hagan pueden ser erróneas.

viernes, 21 de noviembre de 2014

Estimación MCO considerando la heteroscetasticidad

Supóngase que se utiliza β2 y se usa la fórmula de varianza dada en (11.2.2), la cual considera explícitamente la hetorscedasticidad. Utilizando esta varianza y suponiendo que los σi² son conocidos, es posible establecer intervalos de confianza y probar hipótesis con las pruebas t y F usuales? La respuesta generalmente es no, pues puede demostrarse que var(β2), lo cual significa que los intervalos de confianza basadosen estos últimos serán innecesariamente grandes. Como resultado, es probable que las pruebas t y F nos den resultados imprecisos en el sentido de que la var(β2) es demasiado grande y lo que parece ser un coeficiente, estadísticamente no significativo (puesto que el valor t es mas bajo de lo apropiado), de hecho, puede resultar significativo si establecen intervalos de confianza correctos con base en el procedimiento MCG.

jueves, 20 de noviembre de 2014

Consecuencias de utilizar MCO en presencia de heteroscedasticidad

Como se ha visto, ambos β2* y β2 son estimadores (lineales) insesgados: En muestreo repetido, en promedio, β2* y β2 serán iguales al verdadero β2, es decir, ambos son estimadores insesgados. Pero se sabe que β2* es el eficiente, es decir, tiene la menor varianza. Qué sucede con el intervalo de confianza, las pruebas de hipótesis y con otros procedimientos si se continúa utilizando el estimado MCO, β2? Se distinguen dos situaciones.

miércoles, 19 de noviembre de 2014

El método de mínimos cuadrados generalizados (MCG) (V)

En el MCO (sin ponderar), cada ui² asociado con los puntos A, B y C, recibirá el mismo peso al minimizar la SRC. Obviamente, en este caso el ui² asociado con el punto C dominará la SRC. Pero, en MCG la observación extrema C obtendrá relativamente un peso menor que las otras dos observaciones. Como se anotó anteriormente, esta es la estrategia correcta, ya que para estimar la función de regresión poblacional (FRP) de una manera más confiable, sería deseable dar más peso a las observaciones que están agrupadas cerca de su media (poblacional) que a aquellas que están ampliamente dispersas a su alrededor.

Puesto que (11.3.11) miminiza un SRC ponderada, esto se conoce apropiadamente como mínimos cuadrados ponderados (MCP) y los estimadores así obtenidos que aparecen en (11.3.8) y (11.3.9) son conocidos como estimadores MCP. Pero MCP es apenas un caso especial de la técnica de estimación mas general, MCL. En el contexto de la heroscedasticidad, se pueden tratar los dos términos MCP y MCG indistintamente. En capítulos posteriores se presentarán otros casos especiales de MCG.

A propósito, obsévese que si wi= w es constante para todos los i, el β2* es idéntico al β2 y la var(β2) es idéntica a la var(β2) usual (es decir, homoscedástica) dada en (11.2.3), lo cual no debe sorprender (Por que?).

martes, 18 de noviembre de 2014

El método de mínimos cuadrados generalizados (MCG) (IV)

Por tanto, en MCG se minimiza una suma ponderada de residuales al cuadrado donde wi = 1/σi², actúan como ponderación, pero en MCO se minimiza la SRC sin ponderar o (lo que equivale a lo mismo) con ponderaciones iguales. Como lo muestra (113.3.7), en MCG, el peso asignado a cada observación es inversamente prorporcional a su σi, es decir, las observaciones que provienen de una poblacion con una σi más grande tendrían una ponderación relativamente menor y aquellas de una población con un σi menor tendrán una ponderación relativamente menor y aquellas de una población con un σi meno tendrán una ponderación proporcionalmente mayor al minimizar la SRC (11.3.11). Para ver claramente la diferencia entre MCO y MCG, considérese el diagrama hipotético de dispersión dado en la figura 11.6.

lunes, 17 de noviembre de 2014

El método de mínimos cuadrados generalizados (MCG) (III)

Este procedimiento de transformar variables originales, de tal forma que las variables transformadas satisfagan los supuestos del modelo clásico y de aplicar luego MCO a éstos, se conoce como el método de mínimos cuadrados generalizados (MCG) En resumen MCG es MCO sobre las variables transformadas que satisfacen los supuestos estándar de mínimos cuadrados. Los estimadores así obtenidos se conocen como estimadores MCG y son éstos los estimadores que son MELI.


domingo, 16 de noviembre de 2014

El método de mínimos cuadrados generalizados (MCG) (II)

Cuál es el prósito de transformar el modelo original? Para ver esto, obsérvese la siguiente característica del término de error transformado ui*:


sábado, 15 de noviembre de 2014

El método de mínimos cuadrados generalizados (MCG) (I)

Por qué el estimador usual MCO de β2 dado en (11.2.1) no es el mejor, aunque aun sea insesgado? La razón puede verse intuitivamente, en la figura 11.5. Como lo indica la figura, hay una gran variabilidad en los ingresos entre clases de empleo.Si se fuese a efectuar una regresión de salarios por empleado, sobre el tamaño del empleador, sería recomendable aprovechar el conocimiento que se tiene deque existe considerable variabildiad entre los ingresos de las diferentes clases. Idealmente, se quisiera diseñar un esquema de estimación de tal manera que las observaciones que surgen de poblaciones con mayor variabilidad, reciban menos peso que aquellas que provienen de poblaciones con menor variabilidad. Al examinar la figura 11.5, se desearía dar mayor ponderación a las observaciones que provienen de las clases de empleo 10-19 y 20-49 que a las clases de empleo como 5-9 y 250-499, ya que las primeras están más concentradas alrededor de sus valores medios que las últimas, permitiendo con esto estimar la FRP en forma más precisa.

Desafortunadamente, el método MCO usual no sigue esta estrategia y , por consiguiente no hace uso de la "información" contenida en la variabilidad desigual de la variable dependiente Y, como es el caso de la compensación salarial de empleados de la figura 11.5. Este método asigna igual peso o importancia a cada observación. Pero existe un método de estimación, conocido como mínimos cuadrados generalizados (MCG), que tiene en cuenta esta información explícitamente y, por consiguiente, es capaz de producir estimadores que son MELI. Para ver la forma como esto se logra, considerese el modelo con dos variables ya familiar:

viernes, 14 de noviembre de 2014

Estimación MCO en presencia de Heteroscedasticidad (II)

REcuérdese que β2 es el mejor estimador lineal e insesgado (MELI)si se mantienen los supuestos del modelo clásico, incluyendo el de homoscedasticidad. Sigue aun siendo éste MELI cuando se elimina solamente el supuesto de homoscedasticidad y se reemplaza por el supuesto de heteroscedasticida? Es fácil probar que β2 sigue siendo lineal e insesgado. En realidad, como se indica en el apéndice 3A, sección 3A.2, para establecer el insesgamiento de β2, no es necesario que las perturbaciones (ui) sean homoscedásticas. realmente, la varianza de ui,homoscedástica o heteroscedástica no juega papel alguno en la determinación de la propiedad de insesgamiento.

Una vez se ha garantizado que β2 continúa siendo lineal e insesgado, sigue éste siendo "eficiente" o "el mejor", es decir, tendrá varianza mímina en la clase de los estimadores lineales e insesgados? y dicha varianza mínima estará dada por la ecuación (11.2.2)? La respuesta a ambas preguntas es no: β2 deja de ser el mejor y la varianza míinima ya no está dada por (11.2.2) Entonces, cuál estimador es MELI en presencia de heteroscedasticidad? La respuesta se da en la siguiente sección.

jueves, 13 de noviembre de 2014

Estimación MCO en presencia de Heteroscedasticidad (I)

Qué sucede a los estimadores MCO y a sus varianzas si se introduce la heteroscedasticidad permitiendo que E(ui²) = σi² pero se conservan todos los demás supuestos del modelo clásico? Para responder a esta pregunta, recuérdese el modelo con dos variables:


miércoles, 12 de noviembre de 2014

Naturaleza de la Heteroscedasticidad (IX)

Aunque las industrias difieran en la composición de su producción, la tabla 11.1 muestra claramente que, en promedio, las empresas grandes pagan más que las firmas pequeñas. Como ejemplo, las empresas que emplean entre uno y cuatro empleados pagaron, en promedio, sueldos de alrededor de US$3396, mientras que aquellas que emplean entre 1000 y 2499 empleados pagaron, en promedio, alrededor de US$4843. Pero obsérvese que hay una gran movilidad en las ganancias entre la diversas clases de empleos, como lo indican las desviaciones estándar estimadas de las ganancias. Esto puede verse también en la figura siguiente que muestra el rango de ganancias dentrode cada clase de empleo. Como lo muestra la figura 11.5 el rango (valor más alto - valor más bajo), una medida simple de variablidad, difiere de una clase a otra, indicando la presencia de heteroscedasticidad en la ganancias de las diversas clases de empleo.

martes, 11 de noviembre de 2014

Naturaleza de la Heteroscedasticidad (VIII)

Obsérvese que el problema de heteroscedasticidad es probablemente más común en la información de corte transversalmente que en la información de series de tiempo. En la información de corte transversal, generalmente se trata con miembros de una población en un momento dado del tiempo, tal como consumidores individuales o sus familias, empresas, industrias, o subdivisiones geográficas tales como estados, países, ciudades, etc. Además, estos miembros pueden ser de diferentes tamaños como por ejemplo empresas pequeñas, medianas o grandes o ingresos bajos, medios o altos. En las series de tiempo, por el contrario, las variables tienden a ser órdenes de  magnitud similares porque generalmente se recopila información sobre el mismo fenómeno o hecho durante un período de tiempo. Son ejemplos de PNB, el gasto de consumo, el ahorro o el empleo en los Estados Unidos, digamos, durante el período 1950 a 1994.

A manera de ilustración sobre la heteroscedasticidad que es posible encontrar en un análisis de corte transversal, considérese la tabla 11.1. Esta tabla presenta información sobre compensación salarial por empleado en 10 industrias de bienes manufacturados no durables, clasificadas según número de empleados de la empresa o establecimiento para el año 1958. En la tabla se presenta además cifras de productividad promedio para nueve clases de empleos.

lunes, 10 de noviembre de 2014

Naturaleza de la Heteroscedasticidad (VII)

5. Otra fuente de heteroscedasticidad surge de la violación del supuesto 9 del MCRL, que establece que el modelo de regresión está correctamente especificado. Aunque se analizarán más a fondo los errores de especificación en el capítulo 13, con mucha frecuencia, lo que parece ser heteroscedasticidad, puede deberse al hecho de que algunas variables importantes son omitidas del modelo. Así, en la función de demanda de un bien, si no se incluyen los precios de los bienes que le son complementarios o de los que compiten con éste (sesgo de variable omitada), los residuales obtenidos de la regresión pueden dar la clara impresión de que la varianza del error no es constante. Pero si las variables omitidas son incluidas en el modelo, esa impresión puede desaparecer.

domingo, 9 de noviembre de 2014

Naturaleza de la Heteroscedasticidad (VI)

4. La heterostacidad también puede surgir como resultado de la presencia de factores atípicos. Una observación o factor atípico es una observación que es muy diferente (o bien es muy pequeña o es muy grande) con relación a las demás observaciones en la muestra. La inclusión o exclusión de una observación de este tipo, especialemente si el tamaño de la muestra es pequeño, puede alterar sustancialmente los resultados del análisis de regresión. Como ejemplo, considérese el diagrama de dispersión dado en la figura 11.4. Con base en la información dada en el ejercicio 11.20, en esta figura se ha graficado la tasa de cambio porcentual de los precios de las acciones (Y) y los precios al consumidor (X) para el período posterior a la segunda guerra mundial hasta 19669 en 20 países. En esta figura, la observación sobre Y y X para Chile puede considerarse como atípica puesto que los valores Y y X son mucho más grandes que para el resto de los países. En situaciones como ésta, sería dificil mantener el supuesto de homoscedasticidad. En el ejercicio 11.20 se pide encontrar lo que sucede a los resultados de la regresión, si se retiran del análisis las observaciones de Chile.

sábado, 8 de noviembre de 2014

Naturaleza de la Heteroscedasticidad (V)

3. A medida que mejoran las técnicas de recolección de información, es probable que σ²i se reduzca. Así, es probable que los bancos poseen equipos sofisticados de procesamiento de información comentan menos errores en los extractos mensuales o trimestrales de sus clientes que los bancos que no los posean.

viernes, 7 de noviembre de 2014

Naturaleza de la Heteroscedasticidad (IV)

2. A medida que aumentan los ingresos, la gente posee más ingreso discrecional y, por tanto, tiene mayores posibilidades de selección con respecto a al forma de disponer de su ingreso. En consecuencia, es probable que σi²aumente con el ingreso. Así, en la regresión del ahorro sobre el ingreso, es probable encontrar que σ²i aumenta con el ingreso (como sucede en la figura 11.2)., pues las personas tienen mayores posibilidades de selección acerca de su comportamiento respecto al ahorro. En forma similar, se espera que las compañias con mayores ganancias presenten mayor variabilidad en sus políticas de dividendos, que las compañias cuyas ganancias son menores. Además, es probable que las empresas orientadas hacia el crecimiento presenten una mayor variabilidad en su tasas de pago de dividendos que las empresas ya establecidas.

jueves, 6 de noviembre de 2014

Naturaleza de la Heteroscedasticidad (III)

Hay diversas razones por las cuales las varianzas de ui pueden ser variables, algunas de las cuales son las siguientes:

1. Con base en los Modelos de aprendizaje sobre errores, a medida que la gente aprende, con el tiempo, sus errores de comportamiento se hacen menores. en este caso, se espera que σi² se reduzca. Como ejemplo, considérese la figura 11.3,que relaciona el número de errores cometidos en una prueba de tiempo, establecida para la práctica de mecanografía durante un período de tiempo dado. Como lo indica la figura 11.3, a medida que aumenta el número de horas de esta práctica, el número promedio de errores de mecanografía se reduce al igual que sus varianzas.


miércoles, 5 de noviembre de 2014

Naturaleza de la Heteroscedasticidad (II)

En contraste, considérese la figura 11.2 que muestra que la varianza condicional de Yi aumenta a medida que X aumenta. Aquí, las varianzas de Yi no son las mismas. Por tanto, hay heteroscedasticidad. Simbólicamente

E(ui²) = σi²

Obsérvese el subídice de σ² que nos recuerda que las varianzas condicionales de ui (=varianzas condicionales de Yi) han dejado de ser constantes.

Para entender la diferencia entre homoscedasticidad y heteroscedasticidad, supóngase que en el modelo con dos variables Yi = β1+ β2Xi +ui, Y representa el ahorro y X representa el ingreso. Las figuras 11.1 y 11.2 indican que a medida que el ingreso aumenta, el ahorro en promedio también aumenta. Pero, en la figura 11.1, la varianza del ahorro permanece igual entodos los niveles de ingreso, mientras que, en la figura 11.2 ésta se incrementa con aumentos del ingreso. Parece que en la figura 11.2, en promedio, las familias de ingresos más altos ahorran más que las de ingresos más bajos, pero también hay más variabilidad en su ahorro.

martes, 4 de noviembre de 2014

Naturaleza de la Heteroscedasticidad (I)

Como se mencionó en el capítulo 3, uno de los supuestos importantes del modelo clásico regresión lineal es que la varianza de cada término de perturbación ui, condicional a los valores seleccionados de las variables explicativas, es algún número constante igual a σ². Este es el supuesto de homoscedasticidad, o igual (homo) dispersión (cedasticidad), es decir igual varianza. Simbólicamente,

E(ui²) = σ² i = 1,2,.....,n

Gráficamente,la homoscedasticidad en el modelo de regresión con dos variables puede ser observada en la figura 3.4, la cual, por conveniencia, se reproduce en la figura 11.1. Como lo indica esta figura, la varianza condicional de Yi (la cual es igual a la de ui), condicional a las Xi dadas, permanece igual sin importar los valores que tome la variable X.

lunes, 3 de noviembre de 2014

Heteroscedasticidad

La presencia de heteroscedasticidad nunca ha sido razón para descartar un buen modelo*.
Sin embargo, esto no significa que ella deba ser ignorada!

Un supuesto importante del modelo clásico de regresión lineal (supuesto 4) es que las perturbaciones ui que aparecen en la función de regresión poblacional son homoscedásticas; es decir todas tienen la misma varianza. En este capítulo se examina la validez de este supuesto y se analiza lo que sucede si éste no se cumple. Lo miso que en el capítulo 10 se buscan respuestas a las siguientes preguntas:


  1. Cuál es la naturaleza de la heteroscedasticidad?
  2. Cuáles son sus consecuencias?
  3. Cómo se detecta?
  4. Qué medidas remediales existen?

domingo, 2 de noviembre de 2014

Resumen y conclusiones Multicolinealidad y Muestras pequeñas (VI)

6. Aunque la multicolinealidad ha recibido extensa (algunos dirían excesiva) atención en la teoría, un problema igualmente importante que se ha presentado en la investigación empírica es el de la micronumerosidad, o pequeñez del tamaño de la muestra. De acuerdo con Goldberger, "Cuando un artículo de investigación acusa la presencia de multicolinealidad, los lectores deben ver si esa queja seriá convincente si se sustituyera el concepto de "micronumerosidad" por el de "multicolineealidad". Él sugiere que el lector decida, qué tan pequeña debe ser n, el número de observaciones, antes de decidir que se tiene un problema de muestra pequeña, exactamente en la misma forma en que uno decide qué tan alto es un valor de R² en una regresión auxiliar antes de declarar que el problema de colinealidad es muy severo.

sábado, 1 de noviembre de 2014

Resumen y conclusiones Multicolinealidad y Muestras pequeñas (V)

4. La detección de multicolinealidad es la mitad de la batalla. La otra mitad está relacionada con hallar la forma de deshacerse del problema. Nuevamente, no existen métodos seguros, solamente unas pocas reglas prácticas. Algunas de estas reglas son las siguientes: (1) utilizar información obtenida a priori al modelo, (2) combinar información de corte transversal y de series de tiempo (3) omitir una variable si es altamente colineal, (4) transformar los datos y (5) obtener información adicional o nueva. Naturalmente, saber cuál de estas reglas funcionará en la práctica dependerá de la naturaleza de la información y de la severidad el problema de colinealidad.

5. Se mencionó aquí el papel de la multicolinealidad en la predicción y se señaló que a menos de que la estructura colineal continúe en la muestra futura, es peligroso utilizar una regresión estimada que haya sido contaminada por multicolinealidad para fines de proyección.