jueves, 18 de agosto de 2016

Modelo LOGIT: Ejemplos Ilustrativos "Una aplicación del análisis Logit a la predicción de blancos de fusión"

Para predecir la probabilidad de que una empresa dada sea blanco de fusión, J. Kimball Dietrich y Eric Sorensen estimaron el siguiente modelo logit:



miércoles, 17 de agosto de 2016

Modelo LOGIT: Ejemplo Numérico (VI)

Para concluir nuestros análisis de los modelos logit, se presentan a continuación los resultados de la regresión basadas en MCO, o regresión no ponderada, para el ejemplo de propiedad de vivienda.



miércoles, 3 de agosto de 2016

Modelo LOGIT: Ejemplo Numérico (V)

Retornando a la regresión (16.9.1), se observa que los coeficientes estimados individualmente son estadísticamente significativos aun al nivel del 1%. Pero, como se advirtió anteriormente, esta afirmación es correcta, estrictamente, en muestras grandes, es decir, cuando el número de observaciones Ni para cada Xi es grande -no es preciso que el número de niveles al cual se mide Xi sea necesariamente grande; en el ejemplo, X tiene 10 valores diferentes.

Al examinar la tabla 16.5, se observa que las Ni, aunque no son muy grandes, son razonablemente grandes, pero téngase en mente que entre más grandes sean las Ni, mejores serán los procedimientos de prueba.

El R² estimado es bastante "alto", alrededor de 0.96. Pero se ha señalado que en modelos de variables dependiente dicótoma, el R² como medida de bondad del ajuste es de valor cuestionable. En la literatura se han sugerido diversas alternativas pero éstas no se considerarán aquí.

martes, 2 de agosto de 2016

Modelo LOGIT: Ejemplo Numérico (IV)

Como se mencionó, el coeficiente de pendiente de 0.0787 da el cambio en el algoritmo ponderado de la razón de probabilidades de poseer una casa por unidad de incremento en el ingreso ponderado. También se ha visto que [el antilog de 0.0787 menos uno] multiplicado por 100 da el cambio porcentual en las probabilidades ponderadas por un incremento unitario en el ingreso ponderado.. Es posible calcular el cambio en la probabilidad misma de poseer una casa por cambio unitario en el ingreso? Como se mencionó en la nota de pie de página 18, eso depende no solamente del β2 estimado, sino también del nivel de la probabilidad a partir del cual se calcula la probabilidad. Para ilustrar, supóngase que se desea medir el cambio en la probabilidad de poseer una casa empezando en el nivel de ingreso de US$20,000. Entonces, de la nota de pie de página 18, se obtiene el cambio en la probabilidad por un incremento unitario en el ingreso del nivel 20 (miles) es β2

lunes, 1 de agosto de 2016

Modelo LOGIT: Ejemplo Numérico (III)

Se puede calcular la probabilidad de poseer una casa, dado el ingreso, a partir de la razón de probabilidades estimada? Este cálculo puede hacerse fácilmente. Supóngase que se desea estimar la probabilidad de poseer una casa para el nivel de ingreso de US$20,000. Reemplazando X = 20 en (16.9.1) se obtiene.

sábado, 9 de julio de 2016

Modelo LOGIT: Ejemplo Numérico (II)

Como lo muestra esta regresión, el coeficiente de pendiente estimado sugiere que para un incremento unitario (US$1000) en el ingreso ponderado, el logaritmo ponderado de las probabilidades a 1.0818 aproximadamente, lo cual significa que par aun incremento unitario en X*, las probabilidades ponderadas en favor de poseer una casa aumentan en 1.0818 o alrededor de 8.18%. En general, si se toma el antilogaritmo del coeficiente de la jésima pendiente, se resta una de éste valor y se multiplica el resultado por 100, se obtendrá el cambio porcentual en las probabilidades para una unidad de incremento en el j ésimo regresor.

viernes, 8 de julio de 2016

Modelo LOGIT: Ejemplo Numérico (I)

Aunque paquetes tales como SAS y SHAZAM estiman ahora los modelos logit con relativa facilidad, se puede entender más fácilmente la lógica en la cual se apoyan realizando un problema numérico. SE utilizará la información dada en la tabla 16.4. La información necesaria sin procesar y otros cálculos relevantes están dados en la tabla 16.5. Los resultados de la regresión de mínimos cuadrados ponderados (16.8.6) basados en la información dada en la tabla 16.5 son los siguientes:


jueves, 7 de julio de 2016

Estimación del modelo LOGIT (VIII)

5. Establézcanse intervalos de confianza y/o prueba de hipótesis dentro del marco usual MCO pero tenga en mente que todas las conclusiones serán válidas estrictamente hablando si la muestra es razonablemente grande (por qué?) Por consiguiente, en muestras pequeñas, los resultados estimados deben ser interpretados cuidadosamente.

miércoles, 6 de julio de 2016

Estimación del modelo LOGIT (VII)

4. Estímese (16.8.6) mediante MCO -recuérdese que MCP es MCO aplicado sobre la información transformada. Obsérves que en (16.8.6) no hay término de intercepto introducido explícitamente (por qué?). Por consiguiente, se tendrá que utilizar el procedimiento de regresión a través del origen para estimar (16.8.6).

martes, 5 de julio de 2016

Estimación del modelo LOGIT (VI)

3. Para resolver el problema de heteroscedasticidad, transforme (16.8.1) de la siguiente manera



lunes, 4 de julio de 2016

Estimación del modelo LOGIT (V)

Por consiguiente, como en el caso del MLP, el término de perturbación en el modelo logit es heteroscedástico. Así, en lugar de utilizar MCO se deberán utilizar mínimos cuadrados ponderados (MCP). Para fines empíricos, sin embargo, se reemplazará la Pi desconocida por Pi y se utilizará


domingo, 3 de julio de 2016

Estimación del modelo LOGIT (IV)

En resumen, dada la información agrupada replicada (observaciones repetidas), tal como la que se presenta en la tabla 16.4, se puede obtener información sobre la variable dependiente, los logit, para estimar el modelo (16.8.1). Puede entonces aplicarse MCO a (16.8.3) y estimar los parámetros en la forma usual? La respuesta es, aún no, ya que hasta el momento no se ha dicho nada sobre las propiedades del término de perturbación estocástico. Puede demostrarse que si Ni es relativamente grande y si cada observación en una clase de ingreso dado Xi está distribuida en forma independiente como una variable binominal, entonces


sábado, 2 de julio de 2016

Estimación del modelo LOGIT (III)

es decir, la frecuencia relativa, se puede utilizar ésta como una estimación del verdadero Pi correspondiente a cada Xi. Si Ni es relativamente grande, Pi será una estimación razonablemente buena de Pi. Utilizando el Pi estimado, se puede obtener el logit estimado como



lo cual será una estimación relativamente buena del verdadero logit Li si el número de observaciones Ni a cada nivel Xi es razonablemente grande.

miércoles, 29 de junio de 2016

Estimación del modelo LOGIT (II)

Obviamente, estas expresiones no tienen sentido. Por consiguiente, si la información disponible está a un nivel micro o individual, no se puede estimar (16.8.1) mediante la rutina MCO estándar. En esta situación puede ser preciso recurrir al método de máxima verosimilitud para estimar los parámetros. Pero, debido a su complejidad matemática, no se proceder;a a hacerlo aquí, aunque más adelante se presentará un ejemplo basado en este método.

Pero supóngase que se tiene la información, como se muestra en la tabla 16.4. Correspondiente a cada nivel de ingreso X, en esta tabla son Ni familias, de las cuales ni poseen casa (ni ≤ Ni). Por consiguiente, si ahora se calcula.

martes, 28 de junio de 2016

Estimación del modelo LOGIT (I)

Para fines de estimación, se escribe (16.7.6) de la siguiente manera:

En breve, se analizarán las propiedades del término de perturbación estocástico.

Para estimar el modelo, además de Xi, se necesitan los valores de logit Li. Pero ahora se incurre en algunas dificultades. Si existe información disponible sobre familias individuales, como en la tabla 16.1., entonces Pi = 1 si una familia posee una casa y Pi = 0 si no la posee. Pero si se colocan estos valores directamente en el logit Li, se obtiene.


lunes, 20 de junio de 2016

El modelo Logit (VI)

4. Dado un nivel determinado de ingreso, por ejemplo, X*, si realmente se desea estimar la probabilidad misma de poseer una casa, y no las probabilidades en favor de poseer una casa, esto puede hacerse directamente a partir de (16.7.2) una vez se disponga de las estimaciones de β1 y β2 en primer lugar? La respuesta está dada en la siguiente sección.

5. Mientras que el MLP supone que Pi está linealmente relacionado con Xi, el modelo logit supone que el algoritmo de la razón de probabilidades está relacionado linealmente con Xi.

domingo, 19 de junio de 2016

El modelo Logit (V)

3. La interpretación del modelo logit es la siguiente: β2, la pendiente, mide el cambio en L ocasionado por un cambio unitario en X, es decir, dice cómo el algoritmo de las probabilidades en favor de poseer una casa cambia a medida que el ingreso cambia en una unidad, por ejemplo US$1000. El intercepto β1 es el valor del algoritmo de las probabilidades en favor de poseer una casa si el ingreso es cero. Al igual que la mayoría de las interpretaciones de interceptos, esta interpretación puede no tener significado físico alguno.

sábado, 18 de junio de 2016

El modelo Logit (IV)

Obsérvese estas características del modelo logit


  1. A medida que P va de 0 a 1 (es decir, a medida que Z varía de -∞ a + ∞, el logit L va de  -∞ a + ∞. Es decir, aunque las probabilidades (por necesidad) se enceuntran entre 0 y 1, los logit no están limitados en esa forma.
  2. Aunque L es lineal en X, las probabilidades en sí mismas no lo son. Esta propiedad hace contraste con el modelo MLP (16.7.1) en donde las probabilidades aumentan linealmente con X^18

viernes, 17 de junio de 2016

El modelo Logit (III)

Ahora Pi(1-Pi) es sencillamente la razón de probabilidades en favor de poseer una casa - la razón de la probabilidad  de que una familia posea una casa a la probabilidad de que no la posea. Así, si Pi = 0.8, significa que las probabilidades son 4 a 1 en favor de la familia que posee una casa.

Ahora, si se toma el logartimo natural de (16.7.5), se obtiene un resultado muy interesante, a saber


jueves, 16 de junio de 2016

El modelo Logit (II)

La ecuación (16.7.3) representa lo que se conoce como función de distribución logística (acumalativa).

Es fácil verificar que a medida que Zi se encuentra dentro de un rango de -∞ a + ∞ , Pi se encuentra dentro de un rango de 0 a 1 y que Pi no está linealmente relacionado con Zi (es decir, con Xi), satisfaciendo así los dos requerimientos considerados anteriormente. Pero parece que al satisfacer estos requerimientos, se ha creado un problema de estimación porque Pi es no lineal no solamente en X sino tambien en los β, como puede verse claremente a partir de (16.7.2). Esto significa que no se puede utilizar el procedimiento familiar MCO para estimar los parámetros. Pero este problema es más aparente que real porque (16.7.2) es intrínsecamente lineal, lo cual puede verse de la siguiente manera.


Si Pi, la probabilidad de poseer una casa, está dada por (16.7.3), entonces (1-Pi), la probabilidad de no poseer una casa es

miércoles, 15 de junio de 2016

El modelo Logit (I)

Se continúa con el ejemplo de propiedad de vivienda para explicar las ideas básicas detrás del modelo logit. Recuérdese que en la explicación de la propiedad de vivienda en relación con el ingreso, el MLP fue

martes, 14 de junio de 2016

Alternativas al MLP (IV)

El lector se dará cuenta de que el sigmoide o curva en forma de S en la figura se parece mucho a la función de distribución acumulativa de una variable aleatoria (FDA). Por consiguiente, se puede utilizar fácilmente la FDA en regresiones de modelos en los cuales la variable de respuesta es dicótoma, adquiriendo valores 0 -1. La pregunta práctica ahora es, Cuál FDA? Puesto que aunque todos los FDA tiene forma de S, para cada variable aleatoria hay una FDA única. Por razones históricas al igual que prácticas, las FDA comúnmente seleccionadas para representar los modelos de respuesta 0-1 son (1) la lógistica y (2) la normal, la primera dando lugar al modelo logit y la última, al modelo probit (o normit).

Aunque el análisis detallado de los modelos logit y probit está por fuera del alcance de este libro, se indicará de manera algo informal la forma de estimar tales modelos y la forma de interpretarlos.


domingo, 12 de junio de 2016

Alternativas al MLP (III)

Por consiguiente, lo que se necesita es un modelo (probabílistico) que tenga estas dos características: (1) A medida que Xi aumenta, Pi = E(Y = 1|X) aumenta pero nunca se sale del intervalor 0-1 y (2) la relación entre Pi y Xi es no lineal, es decir, "uno se acerca a cero a tasas cada vez más lentas a medida que Xi se hace más pequeño y se acerca a uno a tasas cada vez más lentas a medida que Xi se hace muy grande."

Geomeétricamente, el modelo que se desea tendría la forma de la figura 16.2. Obsérvese en este modelo que la probabilidad se encuentra entre 0 y 1 y que éste varía en forma no lineal con X.

sábado, 11 de junio de 2016

Alternativas al MLP (II)

Pero aun entonces el problema fundamental con el MLP es que lógicamente no es un modelo muy atractivo porque supone que Pi = E(Y = 1|X) aumenta linealmentecon X, es decir, el efecto marginal o incremental de X permanece constante todo el tiempo. Así, en el ejemplo de propiedad de vivienda se encontró que a medida que X aumenta en una unidad (US$1,000), la probabilidad de ser propietario de una casa aumenta en la misma cantidad constante de 0,10. Esto es así sera el nivel del ingreso US$8,000, US$10,000, US$18,000 o US$22,000. Esto no parece ser realista. En realidad se esperaría que Pi estuviera relacionado en forma no lineal con Xi: Par ingresos muy bajos, una familia no poseerá una casa, pero a un nivel de ingresos suficientemente altos, por ejemplo, X*, es muy probable que ésta sí posea una casa. Cualquier incremento en el ingreso más allá de X* tendrá un efecto pequeño sobre la probabilidad de poseer una casa. Así, a ambos extremos de la distribución de ingresos, la probabilidad de poseer casa no se verá afectada, virtualmente, por un pequeño incremento en X.

viernes, 10 de junio de 2016

Alternativas al MLP (I)

Como se ha visto, el MLP tiene infidad de problemas, tales como (1) la no normalidad de los ui, (2) la heteroscedasticidad de ui, (3) la posibilidad de que Yi se encuentre por fuera del rango 0-1 y (4) los valores generalmente bajos de R². Pero estos problemas se pueden resolver. Por ejemplo, se puede utilizar el MCP para resolver el problema de heteroscedasticidad o incrementar el tamaño de la muestra y minimizar así el problema de la no normalidad. Recurriendo a las técnicas de mínimos cuadrados restringidos o de programación matemática, es posible hacer que las posibilidades estimadas se encuentren dentro del intervalo 0-1.

jueves, 9 de junio de 2016

Aplicaciones de MLP - Ejemplo Predicción de omisiones en el pago de bonos (II)

Donde P = 0 si la comunidad incumplió el pago y de lo contrario, IMPUESTO = tasas de impuesto promedio de 1929, 1930 y 1931: INT = % del presupuesto observado asignado a pagos de interés en 1930; AV = Crecimiento porcentual en los avalúos catastrales de la propiedad entre 1925 y 1930; DAV = razón de la deuda neta directa total con respecto al avalúo catastral total en 1930; y BIENESTAR = porcentaje del presupuesto de 1930 asignado a caridad, pensiones y beneficios de los soldados.

La interpretación de (16.5.2) nuevamente es clara. Así, manteniendo las otras condiciones iguales, un incremento en la tasa de impuestos de US$1 por cada mil aumentará la probabilidad de incumplimiento en alrededor de 0.03, o 3%. El valor de R² es relativamente bajo pero, como se mencionó anteriormente, en los MLP, los valores de R² generalmente tienden a ser inferiores y son de uso limitado al juzgar la bondad de ajustes del modelo.

miércoles, 8 de junio de 2016

Aplicaciones de MLP - Ejemplo Predicción de omisiones en el pago de bonos (I)

Para predecir la probabilidad de que no se pagaran sus obligaciones en forma de bonos, Daniel Rubinfeld estudió una muestra de 35 municipalidades en Massachusetts durante el año 1930, donde una diversidad de éstos incumplieron sus obligaciones de pago. El modelo MLP seleccionado y estimado por él siguiente:

martes, 7 de junio de 2016

Aplicaciones de MLP - Ejemplo Predicción de las tasas de bonos (II)

Todos los coeficientes, a excepción de X4, tienen los signos correctos. Se deja que los estudiantes de finanzas deduzcan la razón por la cual el coeficiente de la variabilidad de la tasa de rentabilidad tiene signo positivo, ya que se espera que cuanto mayor sea la variabilidad en las utilidades, menos probable es que la firma Moody de una clasificación Aa, manteniendo iguales las demás condiciones.

La interpretación de la regresión es clara. Por ejemplo, el 0.0486 asociado con X3 significa que, manteniendo las otras condiciones iguales, un incremento de un punto porcentual en la tasa de rendimiento conducirá, en promedio, a alrededor de un 0.05 de incremento en la probabilidad de que un bono obtenga la clasificación Aa. En forma similar, cuanto más alta sea la tasa de endeudamiento elevada al cuadrado, menor en 0.02 será la probabilidad de que un bono sea clasificado como bono Aa por unidad de incremento en esta tasa.



domingo, 5 de junio de 2016

Aplicaciones de MLP - Ejemplo Predicción de las tasas de bonos (I)

Con base en información de series de tiempo y corte transversal de 200 bonos Aa (alta calidad) y Baa (calidad media) durante el período 1961 - 1966, Joseph Cappelleri estimó el siguiente modelo de predicción para la clasificación de bonos.


sábado, 4 de junio de 2016

Aplicaciones de MLP - Estudio de Cohen, Rea y Lerman (IV)

Ahora, considérese el término de interacción estado civil y edad. La tabla muestra que la probabilidad de participación en la fuerza laboral es más alta en cerca de 29% para aquellas mujeres solteras (comparado con la categoría base) y es más baja en alrededor de 28% para aquellas mujeres de 65 y más años de edad (nuevamente en relación con la categoría base). Pero la probabilidad de participación de mujeres solteras y que tienen 65 años o más a menor en cerca de 20% compara con la categoría base. Esto implica que es probable que las mujeres solteras de 65 años de edad y más participen en la fuerza laboral en mayor proporción que aquellas casadas o clasificadas dentro de la categoría "otros", con 65 años de edad.

Siguiendo este procedimient, el lector puede interpretar fácilmente el resto de los coeficientes dados en la tabla 16.3. De la información dada, es fácil obtener las estimaciones de las probabilidades condicionales de la participación de la fuerza laboral de las diversas categorías. Así, si se desea encontrar la probabilidad para mujeres casadas (otras), entre las edades de 22 a 54, con 12 a 15 años de educación, con una tasa de desempleo de 2.4 a 3.4%, cambio de empleo de 3.5 a 6.49%, oportunidades relativas de empleo de 74% y por encima y con IFMJ de US$7500 y más se obtiene

0.4368 + 0.1523 + 0.2231 + 0.0213 + 0.0301 + 0.0571 - 0.2455 = 0.6326

En otras palabras, la probabilidad de la participación de las mujeres en la fuerza laboral, con las características anteriores se ha estimado en alrededor del 63%.

viernes, 3 de junio de 2016

Aplicaciones de MLP - Estudio de Cohen, Rea y Lerman (III)

Retornando a la interpretación de los resultados, se observa que cada coeficiente de pendiente de la tasa de cambio en la probabilidad condicional del evento que está ocurriendo ante un cambio unitario en el valor de la variable explicativa. Por ejemplo, el coeficiente de -0.2753 que acompaña a la variable "edad 65 y más" significa que, manteniendo todos los demás factores constantes, la probabilidad de participación en la fuerza laboral de mujeres con edades entre 22 y 54 años). Utilizando el mismo razonamiento, el coeficiente de 0.3061, asociado con la variable "16 o más años de educación", significa que manteniendo todos los demás factores constantes, la probabilidad de que las mujeres con esta misma educación participen en la fuerza laboral es más alta en cerca del 31% (comparado con la categoría base, que son mujeres con menos de 5 años de educación.)

miércoles, 1 de junio de 2016

Aplicaciones de MLP - Estudio de Cohen, Rea y Lerman (II)

Antes de interpretar los resultados, obsérvese estas características: la regresión anterior fue estimada utilizando MCO. Para corregir por heteroscedasticidad, los autores utilizaron el procedimiento de dos etapas descrito anteriormente en algunas de sus regresiones pero encontraron que los errores estándar de las estimaciones así obtenidas no diferían materialmente de las obtenidas sin la corrección por heteroscedasticidad. Posiblemente, este resultado se deba al puro tamaño de la muestra, de alrededor de 25,000. Debido a este gran tamaño de muestra, los valores t estimados pueden ser probados por su significancia estadística mediante el procedimiento MCO usual aun cuando el término de error adquiera valores dicotómicos. El R² estimado de 0.175 puede parecer relativamente bajo, pero en vista del gran tamaño de la muestra, este R² sigue siendo significativo con base en la prueba F dada en la sección 8.5. Finalmente, obsérvese la forma como los autores han mezclado variables cuantitativas y cualitativas y cómo han tomado en consideración los efectos de la interacción.

martes, 31 de mayo de 2016

Aplicaciones de MLP - Estudio de Cohen, Rea y Lerman (I)

En un estudio preparado por el Departamento del Trabajo de los Estados Unidos, Cohen, Rea y Lerman estuvieron interesados en examinar la participación en la fuerza laboral de diversas categorías de trabajo como función de diversas variables socioeconómico-demográficas. En todas sus regresiones, la variable dependiente era dicótoma, con un valor de 1 si la persona pertenecia a la fuerza laboral y con un valor de 0 si él o ella no pertenecián a ésta. En la tabla 16.3 se reproduce una de sus diversas regresiones de variable dependiente dicótoma.

sábado, 28 de mayo de 2016

Aplicaciones de MLP

Hasta el desarrollo de paquetes de computador para estimar los modelos logit y probit (que serán analizados en breve), el MLP era utilizado en forma bastante extensa debido a su simplicidad. A continuación se ilustran algunas de estas aplicaciones.

viernes, 27 de mayo de 2016

MLP: Un ejemplo númerico (V)

EStos resultados demuestrnan que, comparado con (16.4.1), los errores estándar estimados son menores y, correspondientemente, las razones t estimadas (en valores absolutos) son más grandes. Pero se debe tomar este resultado con cierta reserva puesto que al estimar (16.4.2) se tuvieron que eliminar 12 observaciones. Además, puesto que los wi son estimados, los procedimientos usuales de prueba de hipótesis estadísticas son válidas, estrictamente hablando, en muestras grandes.

jueves, 4 de febrero de 2016

MLP: Un ejemplo númerico (IV)

Aun si los Yi estimados fueran todos positivos e inferiores a 1, el MLP aún sufre del problema de heteroscedasticidad, lo cual puede verse fácilmente de (16.3.4). Como consecuencia, no se puede confiar en los errores estándar estimados que se reportan en (16.4.1). (Por qué) Pero se puede utilizar el procedimiento de mínimos cuadrados ponderados (MCP), analizado anteriormente, para obtener estimaciones más eficientes de los errores estándar. Las ponderaciones necesarias, wi, requeridas para la aplicación de MCP se muestran también en la tabla 16.2. Pero, obsérvese que algunos Yi son negativos y algunos exceden el valor de uno, los wi correspondientes a estos valores será negativos. Por tanto, no se pueden utilizar etas observaciones en MCP (por qué?), con lo cual se reduce el número de observaciones, de 40 a 28 en este ejemplo. Omitiendo estas observaciones, la regresión MCP es:

miércoles, 3 de febrero de 2016

MLP: Un ejemplo númerico (III)

ES decir, la probabilidad de que una familia con un ingreso de US$12,000 posea una casa es alrededor de 28% La tabla 16.2  muestra las probabilidades estimadas, Yi, para los diversos niveles de ingreso enumerados en la tabla. La característica más sobresaliente de esta tabla es que seis valores estimados son negativos y seis valores exceden a uno, lo cual demuestra claramente el punto planteado anteriormente de que, aunque E(Yi|Xi) es positivo y menor que 1, no necesariamente se cumple que sus estimadores Yi sean positivos o inferiores a 1. Esta es una razón por la cual el MLP no es el modelo recomendado cuando la variable dependiente es dicótoma.

miércoles, 20 de enero de 2016

MLP: Un ejemplo númerico (II)

Primero, se interpreta esta regresión de la siguiente manera. El intercepto de -0.9457 da la "probabilidad" de que una familia con ingreso cero posea una casa. Puesto que este valor es negativo y dado que la probabilidad no puede ser negativa, se considera que este valor es cero, lo cual es razonable en este caso. El valor de la pendiente de 0.1021  significa que para un cambio  unitario en el ingreso (aquí US$ 1,000) en promedio, la probabilidad de poseer una casa aumenta en 0.1021 o alrededor del 10% Por supuesto, dado un nivel de ingreso determinado, se puede estimar la probabilidad real de poseer unacasa a partir de (16.4.1). Así, X = 12 (US$ 12,000), la probabilidad estimada de poseer casa es


martes, 19 de enero de 2016

MLP: Un ejemplo númerico (I)

Para ilustrar algunos de los puntos señalados sobre el MLP en la sección anterior, se presenta un ejemplo numérico. La tabla 16.1 muestra información inventada sobre propiedad de vivienda Y( 1 = posee casa, 0 = no posee casa) en ingreso familiar X (miles de dólares) para 40  familias.  Con base en esta información, el MLP estimado por MCO fue el siguiente:


domingo, 17 de enero de 2016

Problemas en la estimación de MLP - R², Valor cuestionable como medida de bondad del ajuste

El R² calculado convencionalmente tiene un valor limitado en los modelos de respuesta dicótoma. Para ver la razón, considérese la siguiente figura. Dado un X, Y es igual a 0 o a 1. Por consiguiente, todos los valores de Y se encontrarán en el eje X o en la línea correspondiente a 1. Entonces, por lo general, no se espera que haya un MLP que ajuste bien a tal dispersión, bien sea el MLP no restringido (fig 16.1a) o el MLP truncado o restringido (fig. 16.1b), un MLP estimado en forma tal que no caiga por fuera de la banda lógica 0-1. Como resultado, es probable que el R² calculado convencionalmente sea muy inferior a 1 para tales modelos. En la mayoría de las aplicaciones prácticas, el R² se encuentra dentro de un rango de 0.2 a 0.6. El R² en ese tipo de modelos será elevado, por ejemplo, si es superior a 0.8, solamente cuando la dispersión observada esté muy concentrada alrededor de los puntos A y B (figura 16.1c), ya que en ese caso es fácil establecer la línea recta uniendo los dos puntos A y B. En este caso, el Yi predicho estará muy cerca a 0 o a 1.

Por estas razones, John Aldrich y Forrest Nelson sostienen que "el uso del coeficiente de determinación como estadístico resumen debe evitarse en modelos con variable dependiente cualitativa."


sábado, 16 de enero de 2016

Problemas en la estimación de MLP - No cumplimiento de 0 ≤ E(Yi| Xi) ≤ 1

Puesto que E(Yi| Xi) en los modelos lineales de probabilidad mide la probabilidad condicional de que ocurra el evento Y dado X, ésta debe encontrarse necesariamente entre 0 y 1. Aunque a priori esto es verdadero, no hay garantía de que Yi, los estimadores de E(Yi| Xi), cumplan  necesariamente esta restricción y éste es el problema real con la estimacion MCO del MLP. Hay dos formas de establecer si el Yi estimado se encuentra entre 0 y 1. Una es estimar el MLP mediante el método usual MCO y determinar si el Yi estimado se encuentra entre 0 y 1. Si algunos valores son menors que 0 (es decir, negativos), para esos casos se supone que Yi  es cero; si son mayores de 1, se supone que son 1. El segundo procedimiento es diseñar una técnica de estimación que garantice que las probabilidades condicionales estimadas Yi  se encuentran entre 0 y 1. Los modelos logit y probit analizados más adelante garantizarán que las probabilidades estimadas se encuentren con seguridad entre los límites lógicos 0 y 1.

viernes, 15 de enero de 2016

Problemas en la estimación de MLP - Varianzas heteroscedásticas de las perturbaciones (IV)

Por supuesto, la verdadera E(Yi|Xi) no se conoce; por tanto, las ponderaciones wi no se conocen. Para estimar wi, se puede utilizar el siguiente procedimiento que consta de dos etapas:

Etapa 1

Efectúese la regresión MCO sobre (16.2.1) sin considerar el problema de heteroscedasticidad y obténgase Yi = el valro estimado de la verdadera E(Yi|Xi). Luego, obténgase wi = Yi(1-Yi), el valor estimado de wi.

Etapa 2

Utilícese el wi estimado para transformar la información como en (16.3.5) y efectúese la regresión MCO sobre la informaci;on así transformada.

jueves, 14 de enero de 2016

Problemas en la estimación de MLP - Varianzas heteroscedásticas de las perturbaciones (III)

Ya se sabe que en presencia de heteroscedasticidad los estimadores MCO, aunque insesgados, no son eficientes: es decir, no tienen varianza mínima. Pero, nuevamente, el problema de heteroscedasticidad no es insuperable. En el capítulo 11 se analizaron diversos métodos para tratar el problema de heteroscedasticidad. Puesto que la varianza de ui depende del valor esperado de Y, el cual está condicionado al valor de X, como se muestra en (16.3.3), una forma de resolver el problema de heteroscedasticidad es transformar la información dividiendo ambos lados del modelo (16.2.1) por


miércoles, 13 de enero de 2016

Problemas en la estimación de MLP - Varianzas heteroscedásticas de las perturbaciones (II)

Por consiguiente, utilizando la distribución de probabilidad anterior para ui, se obtiene.

donde se hace uso del hecho de que E(Yi|Xi) = β1 + β2Xi = Pi. La ecuación (16.3.4) muestra que la varianza de ui es heteroscedástica porque depende de la esperanza condicional de Y, la cual, por supuesto, depende del valor que adquiera X. Así, en última instancia, la varianza de ui depende de X y, por tanto no es homoscedástica.

martes, 12 de enero de 2016

Problemas en la estimación de MLP - Varianzas heteroscedásticas de las perturbaciones (I)

Aun si E(ui) = 0 y E(ui uj) = 0, para i ≠ j (es decir, no hay correlación serial), ya no es posible sostener la afirmación de que las perturbaciones ui son homoscedásticas. Para ver esto, las u dadas en (16.3.2) tienen la siguiente distribución:

lunes, 11 de enero de 2016

Problemas en la estimación de MLP - No normalidad de las perturbaciones ui (II)

Obviamente, no puede suponerse que ui, esté normalmente distribuida; en realidad ésta sigue un distribución binomial.

Pero el no cumplimiento del supuesto de normalidad puede no ser tan crítico como parece porque se sabe que las estimaciones puntuales MCO aún permanecen insesgadas (recuérdese que si el objetivo es la estimación puntual, el supuesto de normalidad es inconsecuente). Además, puede demostrarse que a medida que el tamaño de la muestra aumenta indefinidamente, los estimadores MCO generalmente tienden a estar normalmente distribuidos. Por consiguiente, en muestras grandes, la inferencia estadística del MLP  seguirá el procedimiento MCO usual bajo el supuesto de normalidad.

domingo, 10 de enero de 2016

Problemas en la estimación de MLP - No normalidad de las perturbaciones ui (I)

Aun cuando MCO no requiere que las perturbaciones (las u) estén normalmente distribuidas, se supuso que lo estaban para fines de inferencia estadística, es decir,  para las pruebas de hipótesis, etc. Pero el supuesto de normalidad para ui yo no se mantiene en los MLP porque, al igual que Yi, ui solamente toma dos valores. Para ver esto, se escribe (16.2.1) como


sábado, 9 de enero de 2016

Problemas en la estimación de MLP

Puesto que (16.2.1) "aparece" igual a cualquier otro modelo de regresión, por qué no estimarlo mediante el método MCO estándar? Esto puede hacerse como parte de una rutina mecánica. Sin embargo, se deben enfrentar algunos problemas especiales que son los siguientes.

viernes, 8 de enero de 2016

Modelo lineal de probabilidad (MLP) (III)

Ahora, permitiendo que Pi = probabilidad de que Yi = 1 ( es decir, de que el evento ocurra) y 1 - Pi = probabilidad de que Yi = 0 (es decir, de que el evento no ocurra), la variable Y tiene la siguiente distribución:

es decir, la esperanza condicional o probabilidad condicional debe encontrarse entre 0 y 1.

miércoles, 6 de enero de 2016

Modelo lineal de probabilidad (MLP) (II)

Modelos tales como (16.2.1), que expresan la variable dicótoma Yi como una función lineal de la(s) variable(s) explicativa(s) Xi, se denominan modelos lineales de probabilidad (MLP) puesto que E(Yi| Xi), la esperanza condicional de Yi dado Xi, puede ser interpretada como la probabilidad condicional de que el evento suceda dado Xi, es decir, Pr(Yi = 1|Xi). Así, en el caso anterior, E(Yi|Xi) de la probabilidad de que una familia posea una casa y tenga un ingreso de una cierta cantidad Xi. La justificación del nombre MLP para modelos como (16.2.1) puede ser la siguiente.
Suponiendo que E(ui) = 0, como es lo usual (para obtener estimadores insesgados), se obtiene:
E(Yi| Xi) = β1 + β2Xi

martes, 5 de enero de 2016

Modelo lineal de probabilidad (MLP) (I)

Para establecer las ideas, considérese el siguiente modelo simple: