sábado, 31 de octubre de 2015

Otro método para evitar la trampa de la variable dicótoma (I)

Hay otra forma de evitar la trampa de la variable dicótoma. Para ver esto, continúese con el modelo (15.2.4) para escríbase el modelo como:

Yi = α2D2i + α3D3i + βXi + ui

con las variables dicótomas como aparecen definidas en la ecuación (15.2.4). Obsérvese que en (15.13.3) se ha eliminado el término intercepto α1. Ahora no e caeráen la trampa de la variable dicótoma porque ya no se tiene colinealidad perfecta, como puede verse de la matriz de datos dada en seguida de la ecuación (15.2.4, al eliminar la columna de unos.

viernes, 30 de octubre de 2015

Regresión semilogarítmica con variable dicótoma (II)

Como lo indican estos resultados y manteniendo otras cosas iguales (en este caso el sexo de los profesores), el salario promedio o medio aumenta en 5.46% por año. Pero no se puede decir que, manteniendo constante la experiencia docente, el salario promedio sea superior en 13.41% para los profesores hombres.

Siguiendo a Halvorsen y Palmquist, se enceuntra el antilog de 0.1341 = 1.1435. Restando 1 de este valor, se obtiene 0.1435 o 14.35%; el salario promedio de los profesores es entonces más alto (que para las profesoras) en 14.35%. En el ejercicio 15.33 se le pide comparar los resultados de la regresión dados en (15.13.2) con los obtenidos del modelo líneal.

jueves, 29 de octubre de 2015

Regresión semilogarítmica con variable dicótoma (I)

A manera de ilustración, considérese la información dada en la tabla 15.5 que relaciona el salario de iniciación (Y) con años de expericiencia docente (X2) y el sexo (D=1 para los profesores hombres). Suponiendo el modelo (15.13.1), se obtienen los siguientes resultados


miércoles, 28 de octubre de 2015

Interpretación de las variables dicótomas en regresiones semilogarítmicas (II)

Siguiendo el capítulo 6, se interpreta el coeficiente β2 como el que da el cambio relativo (o cambio porcentual cuando se multiplica el cambio relativo por 100) en el valor de la media de Y por un cambio unitario en X. Por tanto, en el presente ejemplo, si la experiencia docente aumenta en un año, el cambio relativo en el salario de iniciación promedio será igual a β2. Esta interpretación puede aplicarse  a un cambio en el valor de cualuier regresor, siempre y cuando el regresor sea una variable continua y no dicótoma como es el caso de la varible dicótoma, Pero se puede obtener el cambio relativo en la media de Y aun para variables dicótomas mediantes el mecanismo sugerido por Halvorsen y Palmquist: tome el antilog(base e) del coeficiente dicótomo estimado y reste 1 de éste.

martes, 27 de octubre de 2015

Interpretación de las variables dicótomas en regresiones semilogarítmicas (I)

Recuérdese el análisis con respecto  los modelos de regresión log-lin donde la variable regresada es logarítmica y los regresores son lineales. Para ser específicos, considérese el siguiente modelo:

ln Yi = β1  + β2Xi + β3Di + ui

donde Y = es el salario de iniciación de los profesores de universidad, X = años de experiencia docente y D = 1 para hombres e igual a cero de lo contrario.

  

lunes, 26 de octubre de 2015

Algunos aspectos técnicos del método de la variable dicótoma

En esta sección se analizan algunos puntos específicos sobre el uso de las variables dicótomas en el análisis de regresión.

domingo, 25 de octubre de 2015

Ejemplo, Funciones de inversión para las compañias General Motors y Westinghouse

Utilizando la información dada en la tabla 15.4, se obtienen las siguientes estimaciones de (15.10.4)

Como lo indican estos resultados, puesto que el intercepto diferencial dicótomo no es estadísticamente significativo, se puede concluir que las funciones de inversión de la G.M. y de la Westinghouse tienen estadísticamente los mismos interceptos. Por supuesto, esta conclusión debe tomarse con un poco de reserva, puesto que solamente hemos permitido que difieran los interceptos y no las pendientes. El hecho de que el estadístico Durbin-Watson sea bajo sugiere que probablemente hay errores de especificación en (15.2.4) Es de admitir que la regresión (15.2.4) fue seleccionada solamente para demostrar el uso de la variables dicótomas en la información agrupada.

sábado, 24 de octubre de 2015

Regresión agrupada: manejo de series de tiempo e información de corte transversal, agrupadas (V)

Con estos supuestos, se escribe (15.12.3) como

donde D1t = 1 para observaciones sobre G.M. y 0 de lo contrario. Así, si β4 en (15.12.4) es estadísticamente significativo, quiere decir que el valor del intercepto de la función de inversión de G.M. es diferente de aquél de la función de inversión de la Westinghouse. En otras palabras, β4 es el valor del intercepto diferencial. En el ejercicio 15.32 se le pide al lector introducir los coeficientes diferenciales de pendiente.

viernes, 23 de octubre de 2015

Regresión agrupada: manejo de series de tiempo e información de corte transversal, agrupadas (IV)

Considérense ahora los problemas de estimación de (15.12.3). Supóngase que se estima mediante el procedimiento usual MCO: Simplemente se ordenan las observaciones de la G.M. y de la Westinghouse, de tal manera que las primeras 20 observaciones corresponden a G.M. y las últimas 20 correspondan a la Westinghouse. Es este procedimiento equivocado?

Tal procedimiento supone implícitamente que los parámetros de regresión no cambian en el tiempo (estabilidad temporal) y que no difieren entre las diversas unidades de corte transversal (estabilidad de corte transversal). También está implícito en ese procedimiento el supuesto de que la varianza del error, de las funciones de inversión de la G.M. en el tiempo t no está correlacionado con el término de error en la función de inversión de la Westinghouse en el tiempo t. Estos son obviamente supuestos poco probables. Existen diversas formas de suavizar estos supuestos y de incorporarlos al procedimiento de estimación. Desafortunadamente, el tiempo, el espacio y las limitantes matemáticas impiden avanzar más con ellos. Se presentará solamente un caso en donde se supone que los valores del intercepto en las funciones de inversión de la G.M. y de la Westinghouse son diferentes (cuestión de estabilidad de corte transversal) pero que los coeficientes de las pendientes son los mismos. También se supone que el término de error en la regresión agrupada tiene las propiedades MCO usuales para todas las observaciones de series de tiempo y de corte transversal.

jueves, 22 de octubre de 2015

Regresión agrupada: manejo de series de tiempo e información de corte transversal, agrupadas (III)

Tercero, por qué no agrupar todas las 40 observaciones (20 observaciones de series de tiemp para cada una de las dos firmas) y estimar la siguiente regresión?

donde i representa la firma iésima y t representa al periodo de tiempo iésimo. En nuestro ejemplo i = 2 y t = 20, dando así un total de 40 observaciones. La ecuación (15.12.3) es un ejemplo de una regresión agrupada en donde las observaciones de series de tiempo y de corte transversal han sido combinadas o agrupadas. Tales regresiones se estiman frecuentemente en situaciones en donde se tienen muy pocas observaciones de corte transversal (como en el presente caso) y un buen número de observaciones de series de tiempo. Como escriben Vinod y Ullah:

Cuando se está trantando con información de corte transversal y de series de tiempo en donde cada muestra individual de corte transversal es pequeña de tal forma que no es posible realizar inferencias precisa sobre los coeficientes, es un práctica frecuente en el trabajo aplicado reunir todos los datos y estimar una regresión común. La motivación básica para agrupar información de series de tiempo y de corte transversal es que si el modelo está apropiadamente especificado, la agrupación proporciona una estimación más eficiente, permite la inferencia y posiblemente la predicción.

miércoles, 21 de octubre de 2015

Regresión agrupada: manejo de series de tiempo e información de corte transversal, agrupadas (II)

Primero, se puede efectuar la siguiente regresión de series de tiempo para cada empresa separadamente:

Utilizando la técnica de la variable dicótoma o la prueba de Chow, se puede averiguar si los parámetros de las dos funciones de inversión son los mismos.

Segundo, para cada año se puede estimar una regresión de corte transversal. Desafortunadamente, en el caso actual no puede hacerse porque solamente hay dos observaciones de corte transversal (las dos firmas) pero son tres los parámetros que van a ser estimados, lo cual es imposible. Si se tuviera, por ejemplo, información sobre cuatro empresas al menos, se podría estimar dicha regresión de corte transversal para cada uno de los 20 años, dando un total de 20 regresiones de corte transversal.

martes, 20 de octubre de 2015

Regresión agrupada: manejo de series de tiempo e información de corte transversal, agrupadas (I)

Considérese la información dada en la tabla 15.4, tomada de un estudio famoso de la teoría de la inversión propuesto por Y. Grunfeld estaba interesado en averiguar la forma como la inversión bruta (Y) depende del valor de la firma (X2) y de las existencias de capital (X3). En esta tabla hay datos para cada una de estas tres variables para cada año, considerado para General Motors y para Westinghouse (por el momento, ignore la información para General Electric, pero véase el ejercicio 15.31). Estos son un ejemplo de información de corte transversal. Así mismo, para cada firma se tiene datos sobre estas variables durante 20 años. Estos son un ejemplo de datos de series de tiempo. Ahora, para estudiar la respuesta de Y a X2 y X3, se puede proceder en una de tres formas diferentes.


lunes, 19 de octubre de 2015

El uso de las variables dicótomas al combinar series de tiempo e información de corte transversal

Para ilustrar la versatilidad de las variables dicótomas, se considera en esta sección aun otra aplicación.

domingo, 18 de octubre de 2015

Costo total con relación a la producción (II)

Como lo muestran estos resultados, el costo marginal de producción es de cerca de 28 centavos de dólar por unidad y aunque éste es cerca de 37 centavos (28 + 9) para la producción por encima de 5500 unidades, la diferencia entre los dos no es estadísticamente significativa puesto que la variable dicótoma no es significativa, por ejemplo, al nivel del 5%. Para todos los fines prácticos, entonces, se puede efectuar la regresión del costo total sobre la producción total, eliminando la variable dicótoma.


sábado, 17 de octubre de 2015

Costo total con relación a la producción (I)

Como ejemplo de aplicación de la regresión lineal por tramos, considérese la información hipotética sobre costo total-producción total dada en la tabla 15.3. Se dice que el costo total puede cambiar su pendiente al alcanzar un nivel de producción de 5500 unidades.


viernes, 16 de octubre de 2015

Regresión lineal por tramos (III)

Asi, β1 corresponde a la pendiente de la línea de regresión en el segmento I y β1 + β2 corresponde a la pendiente de la línea de regresión en el segmento II de la regresión lineal por trmos que aparace en la figura 15.8. Es fácil realizar una prueba sobre la hipótesis de que no existe, en la regresión, una discontinuidad en el valor del umbral X* observando la significancia estadística del coeficiente estimado de la pendiente diferencial β2

A propósito, la regresión lineal por tramosque se acaba de exponer es un ejemplo de una clase más general de funciones conocidas como funciones de spline.

jueves, 15 de octubre de 2015

Regresión lineal por tramos (II)

(Nota: además de las ventas, hay otros facores que afectan la comisión de las ventas. Supóngase que estos otros factores están represetandos por el término de perturbación estocástico):Más específicamente, se supone que la comisión de ventas aumenta linealmente con las ventas hasta el nivel del umbral X*, después del cual ésta también aumenta linealmente con las ventas pero a una tasa mayor. Por tanto, se tiene una regresión lineal por tramos que consta de dos piezas o segmentos lineales, a los cuales se les da el nombre de I y II en la figura 15.8 y la función de las comisiones cambia su pendiente en el valor del umbral. dada la información sobre comisiones, ventas y el valor del nivel del umbral X*, la técnica de las variables dicótomas puede ser utilizada para estimar las diferentes pendientes de los dos segmentos de la regresión lineal por tramos que aparece en la figura 15.8. Se procede de la siguiente manera:


miércoles, 14 de octubre de 2015

Regresión lineal por tramos (I)

Para ilustrar una vez más eluso de las variables dicótomas, considérese la figura 15.8, que muestra la forma como una compañia hipótetica remunera a sus representantes de ventas. Ésta paga comisiones con base en las ventas de tal forma que hasta un cierto nivel, meta, o  umbral, el nivel X*, existe una estructura de comisiones (estocástica), mientras que por encima de ese nivel existe otra .


martes, 13 de octubre de 2015

Comportamiento de las utilidades y de las ventas en la industria manufacturera de los Estados Unidos (V)

El lector podrá darse cuenta de que (15.10.3) es una versión restringida de (15.10.2), siendo la restricción que el intercepto para el primero, tercero y cuarto trimestres son iguales. A Juzgar por los resultados de (15.10.2), se podría esperar que éstas restricciones sean válidas pero se sabe, del capítulo 8, como probarlas explícitamente. En el ejercicio 15.21, se pide verificar que estas restricciones sean realmente validas. Por consiguiente, la conclusiones se mantienen igual que antes - hay algún patrón estacional solamente en el segundo trimestre.

En la formulación del modelo (15.10.1) se supuso que solamente el término de intercepto difiere entre trimestre, siendo el coeficiente de la pendiente de la variable ventas el mismo en cada trimestre. siendo el coeficiente de la pendiente de la variable de ventas el mismo en cada trimestre. Pero este supuesto puede probarse por la técnica dicótoma multiplicativa de variable dicótoma analizada anteriormente.

lunes, 12 de octubre de 2015

Comportamiento de las utilidades y de las ventas en la industria manufacturera de los Estados Unidos (IV)

Puesto que el segundo trimestre parece ser diferente del resto, si se desea, se podría efectuar nuevamente la regresión (15.10.2) utilizando solamente una variable dicótoma para diferenciar el segundo trimestre del resto de la siguiente manera:

donde D2 = 1 para la observación en el segundo trimestre y cero para las demás.

domingo, 11 de octubre de 2015

Comportamiento de las utilidades y de las ventas en la industria manufacturera de los Estados Unidos (III)

Los resultados muestran que solamente el coeficiente de ventas y el intercepto diferencial asociado con el segundo trimestre  son estadísticamente significativos al nivel del 5%. Así, se puede concluir que hay algún factor estacional operando en el segundo trimestre de cada año. El coeficiente de ventas de 0.0383 indica que, después de tener en cuenta el efecto estacional, si las ventas aumentan, por ejemplo en US$ 1, se espera que las utilidades promedio aumenten en cerca de 4 centavos. El nivel promedio de la utilidades en la base o primer trimestre fue US$ 6,688 y en el segundo trimestre fue superior en alrededor de US$ 1,323 o fue alrededor de US$ 8,011.


sábado, 10 de octubre de 2015

Comportamiento de las utilidades y de las ventas en la industria manufacturera de los Estados Unidos (II)

Utilizando los datos dados en el apéndice 15A, sección 15A.2, se obtuvieron los siguientes resultados (la cifras de utilidades y de ventas están expresadas en millones de dólares):


viernes, 9 de octubre de 2015

Comportamiento de las utilidades y de las ventas en la industria manufacturera de los Estados Unidos (I)

Obsérvese que se está suponiendo que la variable "estación" tiene cuatro categorías, los cuatro trimestres de un año, requiriendo con esto el uso de tres variables dicótomas. Así, si hay un patrón estacional presente en los diferentes trimestres, los interceptos diferenciales estimados α2, α3 y α4 serán estadísdicamente significativos y lo reflejarán. Es posible que sólo algunos de estos interceptos diferenciales sean estadísticamente significativos, de tal modo que sólo algunos trimestres pueden reflejarlo. Pero el modelo (15.10.1) es suficientemente generalpara acomodar todos estos casos. (Obsérvese que el primer trimestre del año se considera como el trimestre base).

jueves, 8 de octubre de 2015

Uso de las variables dicótomas en el análisis estacional (II)

Hay diversos métodos para desestacionalizar una serie de tiempo, pero se considerará solamente uno de ellos, a saber, el método de las variables dicótomas. Para ilustrar la forma como las variables dicótomas pueden ser utilizadas para desestacionalizar las series de tiempo económicas, supóngase quesedesea efectuar la regresión de las utilidades de las corporaciones manufactureras de los Estados Unidos  sobre sus ventas durante el período 1965-1970 con información trimestral. La información relevante, sin ajuste estacional, está dada en el apéndice 15A. sección 15A.2 que muestra también la forma como se prepara la matriz de datos para incorporar las variables dicótomas. Una mirada a esta información revela un patrón interesante. Tanto las utilidades como las ventas son más elevadas en el segundo trimestre que en el primero o el tercero de cada año. Posiblemente, el segundo trimestre presenta algún efecto estacional. Para investigar esto, se procede de la siguiente manera.

miércoles, 7 de octubre de 2015

Uso de las variables dicótomas en el análisis estacional (I)

Muchas series de tiempo económicas basadas en información mensual o trimestral presentan patrones estacionales (movimiento oscilatorio regular). Como ejemplos están las ventas de almacenes de departamento de la época de Navidad, la demanda de dinero (saldos de efectivo) por parte de las familias en épocas de vacaciones, la demanda de helado y de bebidas refrescantes durante el verano y los precios de los cultivos justo después de la época de cosecha. Frecuentemente es útil eliminar el factor o componente etacional de las seris de tiempo con el fin de poderse conecentra en loo demás componentes, tales como al tendencia. El proceso de eliminar el componente estacional de una serie de tiempo se conoce como desestacionalización, o ajuste estacional y la serie de tiempo así obtenida e denomina serie de tiempo desestacionalizada o ajustada estacionalmente. Las series de tiempo económicas importantes, tales como el índice de precios al consumidor, el índice de precios al por mayor y el índice de producción industrial, frecuentemente son publicados en forma ajustada estacionalmente.

martes, 6 de octubre de 2015

Efectos de interacción (III)

De (15.9.2), se obtiene
lo cual muestra que el gasto promedio en vestido de las mujeres profesionales es diferente (por α4) del gasto promedio en vestido de las mujeres o de los profesionales. Si α2, α3 y α4 son todos positivos, el gasto promedio en vestido de las mujeres es más alto (que la categoría base, que se hombre no profesional), pero es mucho más alto si las mujeres también resultan ser profesionales. En forma similar, el gasto promedio en vestido de un profesional tiende a ser superior que el de la categoría bae, pero mucho más si el profesional resulta ser una mujere. Esto muestra cómo la variable dicótoma de interacciónmodifica el efecto de los atributos considerados individualmente.

La significancia estadística del coeficiente de la variable dicótoma de interacción se puede evaluar por medio de la prueba t usual. Si ésta resulta ser significativa, la presencia simultánea de los dos atributos atenuará o reforzará los efectos individuales de estos atributos. Sobra decir que la omisión de un términode interacción significativo llevará a un sesgo de especificación.

lunes, 5 de octubre de 2015

Efectos de interacción (II)

En muchas aplicaciones, al supuesto puede ser imposible de mantener. Una mujer profesional puede gastar más en ropa que un hombre profesionale. En otras palabras, puede haber interacción entre dos variables cualitativas D2 y D3 y, por consiguiente, su efecto sobre la media de Y puede no ser aditivo como en (15.9.1) sino multiplicativo, como en el siguiente modelo:


domingo, 4 de octubre de 2015

Efectos de interacción (I)

Considérese el siguiente modelo:

En este modelo está implícito el supuesto de que el efecto diferencial de la variable dicótoma sexo D2 es constante a través de los dos niveles de educación y el efecto diferencial de la variable dicótoma D3 educación, es también constante a través de los dos sexos. ES decir, si, por ejemplo, el gasto medio en un vestido es más alto para las mujeres que para los hombres, ésto sucede ya sean ellos profesionales o no. De la misma manera, si por ejemplo, en promedio los profesionales gastan más en ropa que los no profesionales, ésto se tiene yasean ellos hombres o mujeres.

sábado, 3 de octubre de 2015

Ejemplo Comportamiento del desempleo y de las vacantes sin llenar: Gran Bretaña, 1958-1971 (IV)

Con base en los criterios usuales, la regresión estimada muestra un ajuste excelente. Obsérvese que tanto el intercepto diferencial como los coeficientes de las pendientes son estadísticamente significativos al nivel del 5% (una cola). Así, se puede aceptar la hipótesis de que definitivamente hubo un desplazamiento en la relación UN-V a partir del cuarto trimestre de 1966.

De la regresión anterior, se pueden derivar las siguientes regresiones:

viernes, 2 de octubre de 2015

Ejemplo Comportamiento del desempleo y de las vacantes sin llenar: Gran Bretaña, 1958-1971 (III)

Con base en 51 observaciones para el período 1958-IV a 1971-II, se obtuvieron los siguientes resultados (los datos observados utilizados se presentan en el ápendice 15A, sección 15A.1; si el lector lo desea puede examinar esta información ya que ésta muestra la forma como se introducen las variables dicótomas).


jueves, 1 de octubre de 2015

Ejemplo Comportamiento del desempleo y de las vacantes sin llenar: Gran Bretaña, 1958-1971 (II)

Para verificar si la desviación observada en la relación desempleo-vacantes que comenzó a observarse a partir del cuarto trimestre de 1966 era estadísticamente significativa, el autor utilizó el siguiente modelo.