miércoles, 29 de junio de 2016

Estimación del modelo LOGIT (II)

Obviamente, estas expresiones no tienen sentido. Por consiguiente, si la información disponible está a un nivel micro o individual, no se puede estimar (16.8.1) mediante la rutina MCO estándar. En esta situación puede ser preciso recurrir al método de máxima verosimilitud para estimar los parámetros. Pero, debido a su complejidad matemática, no se proceder;a a hacerlo aquí, aunque más adelante se presentará un ejemplo basado en este método.

Pero supóngase que se tiene la información, como se muestra en la tabla 16.4. Correspondiente a cada nivel de ingreso X, en esta tabla son Ni familias, de las cuales ni poseen casa (ni ≤ Ni). Por consiguiente, si ahora se calcula.

martes, 28 de junio de 2016

Estimación del modelo LOGIT (I)

Para fines de estimación, se escribe (16.7.6) de la siguiente manera:

En breve, se analizarán las propiedades del término de perturbación estocástico.

Para estimar el modelo, además de Xi, se necesitan los valores de logit Li. Pero ahora se incurre en algunas dificultades. Si existe información disponible sobre familias individuales, como en la tabla 16.1., entonces Pi = 1 si una familia posee una casa y Pi = 0 si no la posee. Pero si se colocan estos valores directamente en el logit Li, se obtiene.


lunes, 20 de junio de 2016

El modelo Logit (VI)

4. Dado un nivel determinado de ingreso, por ejemplo, X*, si realmente se desea estimar la probabilidad misma de poseer una casa, y no las probabilidades en favor de poseer una casa, esto puede hacerse directamente a partir de (16.7.2) una vez se disponga de las estimaciones de β1 y β2 en primer lugar? La respuesta está dada en la siguiente sección.

5. Mientras que el MLP supone que Pi está linealmente relacionado con Xi, el modelo logit supone que el algoritmo de la razón de probabilidades está relacionado linealmente con Xi.

domingo, 19 de junio de 2016

El modelo Logit (V)

3. La interpretación del modelo logit es la siguiente: β2, la pendiente, mide el cambio en L ocasionado por un cambio unitario en X, es decir, dice cómo el algoritmo de las probabilidades en favor de poseer una casa cambia a medida que el ingreso cambia en una unidad, por ejemplo US$1000. El intercepto β1 es el valor del algoritmo de las probabilidades en favor de poseer una casa si el ingreso es cero. Al igual que la mayoría de las interpretaciones de interceptos, esta interpretación puede no tener significado físico alguno.

sábado, 18 de junio de 2016

El modelo Logit (IV)

Obsérvese estas características del modelo logit


  1. A medida que P va de 0 a 1 (es decir, a medida que Z varía de -∞ a + ∞, el logit L va de  -∞ a + ∞. Es decir, aunque las probabilidades (por necesidad) se enceuntran entre 0 y 1, los logit no están limitados en esa forma.
  2. Aunque L es lineal en X, las probabilidades en sí mismas no lo son. Esta propiedad hace contraste con el modelo MLP (16.7.1) en donde las probabilidades aumentan linealmente con X^18

viernes, 17 de junio de 2016

El modelo Logit (III)

Ahora Pi(1-Pi) es sencillamente la razón de probabilidades en favor de poseer una casa - la razón de la probabilidad  de que una familia posea una casa a la probabilidad de que no la posea. Así, si Pi = 0.8, significa que las probabilidades son 4 a 1 en favor de la familia que posee una casa.

Ahora, si se toma el logartimo natural de (16.7.5), se obtiene un resultado muy interesante, a saber


jueves, 16 de junio de 2016

El modelo Logit (II)

La ecuación (16.7.3) representa lo que se conoce como función de distribución logística (acumalativa).

Es fácil verificar que a medida que Zi se encuentra dentro de un rango de -∞ a + ∞ , Pi se encuentra dentro de un rango de 0 a 1 y que Pi no está linealmente relacionado con Zi (es decir, con Xi), satisfaciendo así los dos requerimientos considerados anteriormente. Pero parece que al satisfacer estos requerimientos, se ha creado un problema de estimación porque Pi es no lineal no solamente en X sino tambien en los β, como puede verse claremente a partir de (16.7.2). Esto significa que no se puede utilizar el procedimiento familiar MCO para estimar los parámetros. Pero este problema es más aparente que real porque (16.7.2) es intrínsecamente lineal, lo cual puede verse de la siguiente manera.


Si Pi, la probabilidad de poseer una casa, está dada por (16.7.3), entonces (1-Pi), la probabilidad de no poseer una casa es

miércoles, 15 de junio de 2016

El modelo Logit (I)

Se continúa con el ejemplo de propiedad de vivienda para explicar las ideas básicas detrás del modelo logit. Recuérdese que en la explicación de la propiedad de vivienda en relación con el ingreso, el MLP fue

martes, 14 de junio de 2016

Alternativas al MLP (IV)

El lector se dará cuenta de que el sigmoide o curva en forma de S en la figura se parece mucho a la función de distribución acumulativa de una variable aleatoria (FDA). Por consiguiente, se puede utilizar fácilmente la FDA en regresiones de modelos en los cuales la variable de respuesta es dicótoma, adquiriendo valores 0 -1. La pregunta práctica ahora es, Cuál FDA? Puesto que aunque todos los FDA tiene forma de S, para cada variable aleatoria hay una FDA única. Por razones históricas al igual que prácticas, las FDA comúnmente seleccionadas para representar los modelos de respuesta 0-1 son (1) la lógistica y (2) la normal, la primera dando lugar al modelo logit y la última, al modelo probit (o normit).

Aunque el análisis detallado de los modelos logit y probit está por fuera del alcance de este libro, se indicará de manera algo informal la forma de estimar tales modelos y la forma de interpretarlos.


domingo, 12 de junio de 2016

Alternativas al MLP (III)

Por consiguiente, lo que se necesita es un modelo (probabílistico) que tenga estas dos características: (1) A medida que Xi aumenta, Pi = E(Y = 1|X) aumenta pero nunca se sale del intervalor 0-1 y (2) la relación entre Pi y Xi es no lineal, es decir, "uno se acerca a cero a tasas cada vez más lentas a medida que Xi se hace más pequeño y se acerca a uno a tasas cada vez más lentas a medida que Xi se hace muy grande."

Geomeétricamente, el modelo que se desea tendría la forma de la figura 16.2. Obsérvese en este modelo que la probabilidad se encuentra entre 0 y 1 y que éste varía en forma no lineal con X.

sábado, 11 de junio de 2016

Alternativas al MLP (II)

Pero aun entonces el problema fundamental con el MLP es que lógicamente no es un modelo muy atractivo porque supone que Pi = E(Y = 1|X) aumenta linealmentecon X, es decir, el efecto marginal o incremental de X permanece constante todo el tiempo. Así, en el ejemplo de propiedad de vivienda se encontró que a medida que X aumenta en una unidad (US$1,000), la probabilidad de ser propietario de una casa aumenta en la misma cantidad constante de 0,10. Esto es así sera el nivel del ingreso US$8,000, US$10,000, US$18,000 o US$22,000. Esto no parece ser realista. En realidad se esperaría que Pi estuviera relacionado en forma no lineal con Xi: Par ingresos muy bajos, una familia no poseerá una casa, pero a un nivel de ingresos suficientemente altos, por ejemplo, X*, es muy probable que ésta sí posea una casa. Cualquier incremento en el ingreso más allá de X* tendrá un efecto pequeño sobre la probabilidad de poseer una casa. Así, a ambos extremos de la distribución de ingresos, la probabilidad de poseer casa no se verá afectada, virtualmente, por un pequeño incremento en X.

viernes, 10 de junio de 2016

Alternativas al MLP (I)

Como se ha visto, el MLP tiene infidad de problemas, tales como (1) la no normalidad de los ui, (2) la heteroscedasticidad de ui, (3) la posibilidad de que Yi se encuentre por fuera del rango 0-1 y (4) los valores generalmente bajos de R². Pero estos problemas se pueden resolver. Por ejemplo, se puede utilizar el MCP para resolver el problema de heteroscedasticidad o incrementar el tamaño de la muestra y minimizar así el problema de la no normalidad. Recurriendo a las técnicas de mínimos cuadrados restringidos o de programación matemática, es posible hacer que las posibilidades estimadas se encuentren dentro del intervalo 0-1.

jueves, 9 de junio de 2016

Aplicaciones de MLP - Ejemplo Predicción de omisiones en el pago de bonos (II)

Donde P = 0 si la comunidad incumplió el pago y de lo contrario, IMPUESTO = tasas de impuesto promedio de 1929, 1930 y 1931: INT = % del presupuesto observado asignado a pagos de interés en 1930; AV = Crecimiento porcentual en los avalúos catastrales de la propiedad entre 1925 y 1930; DAV = razón de la deuda neta directa total con respecto al avalúo catastral total en 1930; y BIENESTAR = porcentaje del presupuesto de 1930 asignado a caridad, pensiones y beneficios de los soldados.

La interpretación de (16.5.2) nuevamente es clara. Así, manteniendo las otras condiciones iguales, un incremento en la tasa de impuestos de US$1 por cada mil aumentará la probabilidad de incumplimiento en alrededor de 0.03, o 3%. El valor de R² es relativamente bajo pero, como se mencionó anteriormente, en los MLP, los valores de R² generalmente tienden a ser inferiores y son de uso limitado al juzgar la bondad de ajustes del modelo.

miércoles, 8 de junio de 2016

Aplicaciones de MLP - Ejemplo Predicción de omisiones en el pago de bonos (I)

Para predecir la probabilidad de que no se pagaran sus obligaciones en forma de bonos, Daniel Rubinfeld estudió una muestra de 35 municipalidades en Massachusetts durante el año 1930, donde una diversidad de éstos incumplieron sus obligaciones de pago. El modelo MLP seleccionado y estimado por él siguiente:

martes, 7 de junio de 2016

Aplicaciones de MLP - Ejemplo Predicción de las tasas de bonos (II)

Todos los coeficientes, a excepción de X4, tienen los signos correctos. Se deja que los estudiantes de finanzas deduzcan la razón por la cual el coeficiente de la variabilidad de la tasa de rentabilidad tiene signo positivo, ya que se espera que cuanto mayor sea la variabilidad en las utilidades, menos probable es que la firma Moody de una clasificación Aa, manteniendo iguales las demás condiciones.

La interpretación de la regresión es clara. Por ejemplo, el 0.0486 asociado con X3 significa que, manteniendo las otras condiciones iguales, un incremento de un punto porcentual en la tasa de rendimiento conducirá, en promedio, a alrededor de un 0.05 de incremento en la probabilidad de que un bono obtenga la clasificación Aa. En forma similar, cuanto más alta sea la tasa de endeudamiento elevada al cuadrado, menor en 0.02 será la probabilidad de que un bono sea clasificado como bono Aa por unidad de incremento en esta tasa.



domingo, 5 de junio de 2016

Aplicaciones de MLP - Ejemplo Predicción de las tasas de bonos (I)

Con base en información de series de tiempo y corte transversal de 200 bonos Aa (alta calidad) y Baa (calidad media) durante el período 1961 - 1966, Joseph Cappelleri estimó el siguiente modelo de predicción para la clasificación de bonos.


sábado, 4 de junio de 2016

Aplicaciones de MLP - Estudio de Cohen, Rea y Lerman (IV)

Ahora, considérese el término de interacción estado civil y edad. La tabla muestra que la probabilidad de participación en la fuerza laboral es más alta en cerca de 29% para aquellas mujeres solteras (comparado con la categoría base) y es más baja en alrededor de 28% para aquellas mujeres de 65 y más años de edad (nuevamente en relación con la categoría base). Pero la probabilidad de participación de mujeres solteras y que tienen 65 años o más a menor en cerca de 20% compara con la categoría base. Esto implica que es probable que las mujeres solteras de 65 años de edad y más participen en la fuerza laboral en mayor proporción que aquellas casadas o clasificadas dentro de la categoría "otros", con 65 años de edad.

Siguiendo este procedimient, el lector puede interpretar fácilmente el resto de los coeficientes dados en la tabla 16.3. De la información dada, es fácil obtener las estimaciones de las probabilidades condicionales de la participación de la fuerza laboral de las diversas categorías. Así, si se desea encontrar la probabilidad para mujeres casadas (otras), entre las edades de 22 a 54, con 12 a 15 años de educación, con una tasa de desempleo de 2.4 a 3.4%, cambio de empleo de 3.5 a 6.49%, oportunidades relativas de empleo de 74% y por encima y con IFMJ de US$7500 y más se obtiene

0.4368 + 0.1523 + 0.2231 + 0.0213 + 0.0301 + 0.0571 - 0.2455 = 0.6326

En otras palabras, la probabilidad de la participación de las mujeres en la fuerza laboral, con las características anteriores se ha estimado en alrededor del 63%.

viernes, 3 de junio de 2016

Aplicaciones de MLP - Estudio de Cohen, Rea y Lerman (III)

Retornando a la interpretación de los resultados, se observa que cada coeficiente de pendiente de la tasa de cambio en la probabilidad condicional del evento que está ocurriendo ante un cambio unitario en el valor de la variable explicativa. Por ejemplo, el coeficiente de -0.2753 que acompaña a la variable "edad 65 y más" significa que, manteniendo todos los demás factores constantes, la probabilidad de participación en la fuerza laboral de mujeres con edades entre 22 y 54 años). Utilizando el mismo razonamiento, el coeficiente de 0.3061, asociado con la variable "16 o más años de educación", significa que manteniendo todos los demás factores constantes, la probabilidad de que las mujeres con esta misma educación participen en la fuerza laboral es más alta en cerca del 31% (comparado con la categoría base, que son mujeres con menos de 5 años de educación.)

miércoles, 1 de junio de 2016

Aplicaciones de MLP - Estudio de Cohen, Rea y Lerman (II)

Antes de interpretar los resultados, obsérvese estas características: la regresión anterior fue estimada utilizando MCO. Para corregir por heteroscedasticidad, los autores utilizaron el procedimiento de dos etapas descrito anteriormente en algunas de sus regresiones pero encontraron que los errores estándar de las estimaciones así obtenidas no diferían materialmente de las obtenidas sin la corrección por heteroscedasticidad. Posiblemente, este resultado se deba al puro tamaño de la muestra, de alrededor de 25,000. Debido a este gran tamaño de muestra, los valores t estimados pueden ser probados por su significancia estadística mediante el procedimiento MCO usual aun cuando el término de error adquiera valores dicotómicos. El R² estimado de 0.175 puede parecer relativamente bajo, pero en vista del gran tamaño de la muestra, este R² sigue siendo significativo con base en la prueba F dada en la sección 8.5. Finalmente, obsérvese la forma como los autores han mezclado variables cuantitativas y cualitativas y cómo han tomado en consideración los efectos de la interacción.