miércoles, 20 de enero de 2016

MLP: Un ejemplo númerico (II)

Primero, se interpreta esta regresión de la siguiente manera. El intercepto de -0.9457 da la "probabilidad" de que una familia con ingreso cero posea una casa. Puesto que este valor es negativo y dado que la probabilidad no puede ser negativa, se considera que este valor es cero, lo cual es razonable en este caso. El valor de la pendiente de 0.1021  significa que para un cambio  unitario en el ingreso (aquí US$ 1,000) en promedio, la probabilidad de poseer una casa aumenta en 0.1021 o alrededor del 10% Por supuesto, dado un nivel de ingreso determinado, se puede estimar la probabilidad real de poseer unacasa a partir de (16.4.1). Así, X = 12 (US$ 12,000), la probabilidad estimada de poseer casa es


martes, 19 de enero de 2016

MLP: Un ejemplo númerico (I)

Para ilustrar algunos de los puntos señalados sobre el MLP en la sección anterior, se presenta un ejemplo numérico. La tabla 16.1 muestra información inventada sobre propiedad de vivienda Y( 1 = posee casa, 0 = no posee casa) en ingreso familiar X (miles de dólares) para 40  familias.  Con base en esta información, el MLP estimado por MCO fue el siguiente:


domingo, 17 de enero de 2016

Problemas en la estimación de MLP - R², Valor cuestionable como medida de bondad del ajuste

El R² calculado convencionalmente tiene un valor limitado en los modelos de respuesta dicótoma. Para ver la razón, considérese la siguiente figura. Dado un X, Y es igual a 0 o a 1. Por consiguiente, todos los valores de Y se encontrarán en el eje X o en la línea correspondiente a 1. Entonces, por lo general, no se espera que haya un MLP que ajuste bien a tal dispersión, bien sea el MLP no restringido (fig 16.1a) o el MLP truncado o restringido (fig. 16.1b), un MLP estimado en forma tal que no caiga por fuera de la banda lógica 0-1. Como resultado, es probable que el R² calculado convencionalmente sea muy inferior a 1 para tales modelos. En la mayoría de las aplicaciones prácticas, el R² se encuentra dentro de un rango de 0.2 a 0.6. El R² en ese tipo de modelos será elevado, por ejemplo, si es superior a 0.8, solamente cuando la dispersión observada esté muy concentrada alrededor de los puntos A y B (figura 16.1c), ya que en ese caso es fácil establecer la línea recta uniendo los dos puntos A y B. En este caso, el Yi predicho estará muy cerca a 0 o a 1.

Por estas razones, John Aldrich y Forrest Nelson sostienen que "el uso del coeficiente de determinación como estadístico resumen debe evitarse en modelos con variable dependiente cualitativa."


sábado, 16 de enero de 2016

Problemas en la estimación de MLP - No cumplimiento de 0 ≤ E(Yi| Xi) ≤ 1

Puesto que E(Yi| Xi) en los modelos lineales de probabilidad mide la probabilidad condicional de que ocurra el evento Y dado X, ésta debe encontrarse necesariamente entre 0 y 1. Aunque a priori esto es verdadero, no hay garantía de que Yi, los estimadores de E(Yi| Xi), cumplan  necesariamente esta restricción y éste es el problema real con la estimacion MCO del MLP. Hay dos formas de establecer si el Yi estimado se encuentra entre 0 y 1. Una es estimar el MLP mediante el método usual MCO y determinar si el Yi estimado se encuentra entre 0 y 1. Si algunos valores son menors que 0 (es decir, negativos), para esos casos se supone que Yi  es cero; si son mayores de 1, se supone que son 1. El segundo procedimiento es diseñar una técnica de estimación que garantice que las probabilidades condicionales estimadas Yi  se encuentran entre 0 y 1. Los modelos logit y probit analizados más adelante garantizarán que las probabilidades estimadas se encuentren con seguridad entre los límites lógicos 0 y 1.

viernes, 15 de enero de 2016

Problemas en la estimación de MLP - Varianzas heteroscedásticas de las perturbaciones (IV)

Por supuesto, la verdadera E(Yi|Xi) no se conoce; por tanto, las ponderaciones wi no se conocen. Para estimar wi, se puede utilizar el siguiente procedimiento que consta de dos etapas:

Etapa 1

Efectúese la regresión MCO sobre (16.2.1) sin considerar el problema de heteroscedasticidad y obténgase Yi = el valro estimado de la verdadera E(Yi|Xi). Luego, obténgase wi = Yi(1-Yi), el valor estimado de wi.

Etapa 2

Utilícese el wi estimado para transformar la información como en (16.3.5) y efectúese la regresión MCO sobre la informaci;on así transformada.

jueves, 14 de enero de 2016

Problemas en la estimación de MLP - Varianzas heteroscedásticas de las perturbaciones (III)

Ya se sabe que en presencia de heteroscedasticidad los estimadores MCO, aunque insesgados, no son eficientes: es decir, no tienen varianza mínima. Pero, nuevamente, el problema de heteroscedasticidad no es insuperable. En el capítulo 11 se analizaron diversos métodos para tratar el problema de heteroscedasticidad. Puesto que la varianza de ui depende del valor esperado de Y, el cual está condicionado al valor de X, como se muestra en (16.3.3), una forma de resolver el problema de heteroscedasticidad es transformar la información dividiendo ambos lados del modelo (16.2.1) por


miércoles, 13 de enero de 2016

Problemas en la estimación de MLP - Varianzas heteroscedásticas de las perturbaciones (II)

Por consiguiente, utilizando la distribución de probabilidad anterior para ui, se obtiene.

donde se hace uso del hecho de que E(Yi|Xi) = β1 + β2Xi = Pi. La ecuación (16.3.4) muestra que la varianza de ui es heteroscedástica porque depende de la esperanza condicional de Y, la cual, por supuesto, depende del valor que adquiera X. Así, en última instancia, la varianza de ui depende de X y, por tanto no es homoscedástica.

martes, 12 de enero de 2016

Problemas en la estimación de MLP - Varianzas heteroscedásticas de las perturbaciones (I)

Aun si E(ui) = 0 y E(ui uj) = 0, para i ≠ j (es decir, no hay correlación serial), ya no es posible sostener la afirmación de que las perturbaciones ui son homoscedásticas. Para ver esto, las u dadas en (16.3.2) tienen la siguiente distribución:

lunes, 11 de enero de 2016

Problemas en la estimación de MLP - No normalidad de las perturbaciones ui (II)

Obviamente, no puede suponerse que ui, esté normalmente distribuida; en realidad ésta sigue un distribución binomial.

Pero el no cumplimiento del supuesto de normalidad puede no ser tan crítico como parece porque se sabe que las estimaciones puntuales MCO aún permanecen insesgadas (recuérdese que si el objetivo es la estimación puntual, el supuesto de normalidad es inconsecuente). Además, puede demostrarse que a medida que el tamaño de la muestra aumenta indefinidamente, los estimadores MCO generalmente tienden a estar normalmente distribuidos. Por consiguiente, en muestras grandes, la inferencia estadística del MLP  seguirá el procedimiento MCO usual bajo el supuesto de normalidad.

domingo, 10 de enero de 2016

Problemas en la estimación de MLP - No normalidad de las perturbaciones ui (I)

Aun cuando MCO no requiere que las perturbaciones (las u) estén normalmente distribuidas, se supuso que lo estaban para fines de inferencia estadística, es decir,  para las pruebas de hipótesis, etc. Pero el supuesto de normalidad para ui yo no se mantiene en los MLP porque, al igual que Yi, ui solamente toma dos valores. Para ver esto, se escribe (16.2.1) como


sábado, 9 de enero de 2016

Problemas en la estimación de MLP

Puesto que (16.2.1) "aparece" igual a cualquier otro modelo de regresión, por qué no estimarlo mediante el método MCO estándar? Esto puede hacerse como parte de una rutina mecánica. Sin embargo, se deben enfrentar algunos problemas especiales que son los siguientes.

viernes, 8 de enero de 2016

Modelo lineal de probabilidad (MLP) (III)

Ahora, permitiendo que Pi = probabilidad de que Yi = 1 ( es decir, de que el evento ocurra) y 1 - Pi = probabilidad de que Yi = 0 (es decir, de que el evento no ocurra), la variable Y tiene la siguiente distribución:

es decir, la esperanza condicional o probabilidad condicional debe encontrarse entre 0 y 1.

miércoles, 6 de enero de 2016

Modelo lineal de probabilidad (MLP) (II)

Modelos tales como (16.2.1), que expresan la variable dicótoma Yi como una función lineal de la(s) variable(s) explicativa(s) Xi, se denominan modelos lineales de probabilidad (MLP) puesto que E(Yi| Xi), la esperanza condicional de Yi dado Xi, puede ser interpretada como la probabilidad condicional de que el evento suceda dado Xi, es decir, Pr(Yi = 1|Xi). Así, en el caso anterior, E(Yi|Xi) de la probabilidad de que una familia posea una casa y tenga un ingreso de una cierta cantidad Xi. La justificación del nombre MLP para modelos como (16.2.1) puede ser la siguiente.
Suponiendo que E(ui) = 0, como es lo usual (para obtener estimadores insesgados), se obtiene:
E(Yi| Xi) = β1 + β2Xi

martes, 5 de enero de 2016

Modelo lineal de probabilidad (MLP) (I)

Para establecer las ideas, considérese el siguiente modelo simple: