lunes, 30 de septiembre de 2013

Variables próximas inadecuadas

A pesar de que el modelo de regresión clásico supone que las variables Y y X son medidas en formaprecisa, en la práctica los datos pueden estar plagados de errores de medición. Considérese , por ejemplo la teoria muy conocida de Milton Friedman de la función de consumo. El considera el consumo permanente (Yp) como función del ingreso permanente (Xp). Pero como la información sobre estas variables no es observable directamente, en la práctica se utilizan variables próximas, tales como el consumo observado (Y) y el ingreso observado (X). Puesto que las Y y las X observadas pueden no ser iguales a Yp y Xp, existe el problema de errores de medición. El término de perturbación u puede en este caso también representar entonces los errores de medición.

Aleatoriedad intrínseca en el comportamiento humano

Aun si tiene éxito en la introduccion en el modelo de todas las variables relevantes, hay posibilidad de que exista alguna aleatoriedad "intrinseca" en Y que no pueda ser explicada a pesar de todos los esfuerzos que se hagan. Las perturbaciones, u, pueden reflejar muy bien esta aleatoriedad intrínseca.


domingo, 29 de septiembre de 2013

Variables centrales vs. variables periféricas

Supóngase en el ejemplo consumo-ingreso que además del ingreso X1, hay otras variables que afectan también el gasto de consumo, como el número de hijos por familia X2, el sexo X3, la religión X4, la educación X5, y la región geográfica X6. Pero es muy posible que la influencia conjunta de todas o de algunas de estas variables pueda ser muy pequeña o a lo mejor no sistemática o aleatoria, y que desde el punto de vista práctico y por consideraciones de costo no se justifique su introducción explícita en el modelo. Uno espera que su efecto combinado pueda ser tratado como una variable aleatoria ui.

No disponibilidad de información

Aún se si sabe cuáles son algunas de las variables excluidas y se considera por consiguiente una regresión múltiple en lugar de una regresión simple, se puede no tener información cuantitativa sobre esas variables. Es una experiencia corriente en el análisis empírico que la información que idealmente se desearía tener, frecuentemente no esté disponible. Por ejemplo, en principio se podría introducir la riqueza familiar, como una variable explicativa adicional a la variable ingreso para explicar el gasto de consumo familiar. Pero desafortunadamente, la información sobre riqueza familiar por lo general no está disponible. Por consiguiente, se puede ver forzado a omitir la variable riqueza de nuestro modelo a pesar de su gran relevancia teórica en la explicación del gasto de consumo.


sábado, 28 de septiembre de 2013

Vaguedad de la Teoría

De existir una teoría que determine el comportamiento de Y, ésta puede estar incompleta y frecuentemente lo está. Podríamos saber con seguridad que el ingreso semanal X afecta el gasto de consumo semanal Y, pero se podría ignorar o no estar seguros sobre las demás variables que afectan a Y. Por consiguiente, ui, puede ser utilizada como sustituto de todas la variables excluidas u omitidas del modelo.

Significado del término "Perturbación Estocástica"

Como se anoto en la sección 2.4 el término "perturbación estocástica" ui es un sustituto para todas aquellas variables que son omitidas del modelo pero que, colectivamente, afectan a Y. La pregunta obvia es: Por qué no se introducen estas variables en el modelo explícitamente? Planteado de otra forma, Por qué no se desarrolla un modelo de regresión múltiple con tantas variables como sea posible?. las razones son muchas

viernes, 27 de septiembre de 2013

Cómo se interpreta Yi = E(Y|Xi) + ui ?

Se puede decir que el gasto de una familia individual, dado su nivel de ingresos, puede ser expresado como la suma de sus componentes: (1)E(Y|Xi), que es simplemente la media del gasto de consumo de todas las familias con el mismo nivel de ingresos. Este componente se conoce como, el componente sistemático, o determinístico, y (2) ui que es el componente aleatorio, o no sistemático. Se examinará en breve la naturaleza del término de perturbación estocástica, pero por el momento supóngase que es un término que sustituye o representa todas las variables omitidas o ignoradas que puedan afectar a Y pero que no están (o pueden no estar) incluidas en el modelo de regresión.

Si se supone que E(Y|Xi) es lineal en Xi, como en (2.2.2), la ecuación (2.4.1) puede escribirse como:



Así, el supuesto de que la línea de regresión pasa a través de las medias condicionales de Y implica que los valores de la media condicional de ui (condicionadas al valor dado de X) son cero.

De la exposición anterior es claro que (2.2.2) y (2.4.2) son formas equivalentes si E(ui|Xi) = 0. Pero la especificacion estocástica tiene la ventaja que muestra claramente otras variables además del ingreso, que afectan el gasto de consumo y que un gasto de consumo de familias individuales no puede ser explicado en su totalidad solamente por la(s) variable(s) incluidas en el modelo de regresión.


Especificación Estocástica de la FRP

Es claro que la figura 2.1 que a medida que el ingreso familiar aumenta, el gasto de consumo familiar en promedio, también aumenta. Pero, qué sucede con el gasto de consumo de una familia individual con relación a su nivel (fijo) de ingresos? Es obvio en la Tabla 2.1 y en la figura 2.1 que el gasto de consumo de una familia individual no necesariamente aumenta a medida que el nivel de ingresos es mayor. Por ejemplo, en la tabla 2.1, se observa que para el nivel de ingresos de US$100 existe una familia cuyo gasto de consumo de US$65 es menor que los gatos de consumo de dos familias cuyos ingreso semanal es solamente de U$80. Pero advierta que el gasto de consumo promedio de familias con un ingreso semanal de US$100 es mayor que el gasto de consumo promedio de familias con un ingreso semanal de US$80 ($77 Vs, US$65).

Entonces, qué podemos decir sobre la relación entre el gasto de consumo de una familia individual y un nivel dado de ingresos? Se ve en la figura 2.1, que dado el nivel de ingresos de Xi, el gasto de consumo de una familia individual está agrupado alrededor del consumo promedio de todas las familias en ese nivel de Xi, esto es, alrededor de su esperanza condicional. Por consiguiente, podemos expresar la desviación de un Yi individual alrededor de su valor esperado de la manera siguiente:

ui = Yi - E(Y|Xi)

o

Yi = E(Y|Xi) + ui

donde la desviación ui, es una variable aleatoria no observable que toma valores positivos o negativos. Técnicamente, ui, es conocida como perturbación estocástica o término de error estocástico.


jueves, 26 de septiembre de 2013

Linealidad en los parámetros

La segunda interpretación de linealidad se presenta cuando la esperanza condicional de Y, E(Y|Xi), es una función lineal  de los parámetros, los Bs; puede ser lineal en la variable X o puede no serlo. De acuerdo con esta interpretación, E(Y|Xi) = B1 + B2X²i es un modelo de regresión lineal pero E(Y|Xi) = Bi + Raiz Cuadrada(B2Xi) no lo es. El segundo es un ejemplo de modelo de regresión no lineal.

De las dos interpretaciones de linealidad, la linealidad en los parámetros es relevante para el desarrollo de la teoría de regresión que será presentada en breve. Por consiguiente, de ahora en adelante el término regresión "lineal" siempre significara una regresión que es lineal en los párametros, los Bs (esto es, los parámetros son elevados solamente a la primera potencia); puede o no ser lineal en las variables explicativas X. Esquemáticamente, tenemos la tabla 2.. Asi E(Y|Xi) = B1 + B2Xi, lineal en los parámetros igual que en las variables, es un MRL, lo mismo que E(Y|Xi) = B1 + B2X²i, es lineal en los párametros pero no lineal en la variable X.

Linealidad en las variables

El primer significado y posiblemente el más "natural" de linealidad es aquel en que la esperanza condicional de Y es una función lineal de Xi, como es el caso de (2.2.2). Geómetricamente, la curva de regresión en esta caso es una línea recta. En esta interpretación, una función de regresión como E(Y|Xi) = B1 + B2X²i no es una función lineal por que la variable X aparece elevada a una potencia.

miércoles, 25 de septiembre de 2013

Significado del Término "Lineal"

Puesto que este texto se relaciona principalmente con modelos lineales tales como (2.2.2), es esencial entender lo que significa realmente el término lineal, ya que éste puede ser interpretado de dos formas diferentes.

Qué forma toma la función f(Xi)?

Esta pregunta es importante por que en una situación real no tenemos a nuestra disposición la totalidad de la población para efectuar el análisis. La forma funcional de la FRP es, por consiguiente, una pregunta empírica, aunque en casos específicos la teoría puede tener algo que decir. Por ejemplo, un economista podría plantear que el gasto de consumo está relacionado linealmente con el ingreso. Por lo tanto, como una primera aproximación o como una hipótesis de trabajo, podemos suponer que la FRP E(Y|Xi) es una función lineal de Xi, digamos, del tipo:

donde B1 y B2 son parámetros no conocidos pero fijos que se denominan coeficientes de regresión; B1 y B2 son conocidos también como el intercepto y el coeficiente del pendiente, respectivamente. La ecuación (2.2.2) en sí misma es conocida como la función de regresión lineal poblacional, o simplemente la regresión lineal poblacional. En las explicaciones se utilizan algunas expresiones alternativas, tales como modelo de regresión lineal poblacional o ecuación de regresión lineal poblacional. En lo sucesivo, los términos regresión, ecuación de regresión y modelo de regresión serán considerados sinónimos.

En el análisis de regresión el interés es estimar las FRP como (2.2.2), es decir, estimar los valores de B1 y B2 no conocidos con base en las observaciones de Yy X. 

martes, 24 de septiembre de 2013

Concepto de Función de regresión poblacional (FRP)

De la anterior exposición y especialmente de las figuras 2.1 y 2.2, es claro que cada media condicional E(Y|Xi) es una función lineal de Xi. La ecuación (2.2.1) es conocida como la función de regresión poblacional (FRP) en dos variables, o regresión poblacional (RP) para abreviar. Dicha función denota únicamente que la media (poblacional) de la distribución de Y dado Xi está relacionada funcionalmente con Xi. En otras palabras, nos dice cómo la media o respuesta promedio de Y varía con X.


Ejemplo de Análisis de regresión con dos variables (II)

Ahora, para cada una de las distribuciones de probabilidad condicional de Y podemos calcular su media o valor promedio, conocido como la media condicional o la esperanza condicional, que se denota como E(Y|X=Xi)y se lee así:<< el valor esperado de Y dado que X adquiere el valor especifico de Xi>>, lo cual se escribirá E(Y|Xi) para efectos de simplificar la notación. Para nuestras cifras hipotéticas, estas esperanzas condicionales pueden calcularse fácilmente como la sumatoria de los productos entre los valores relevantes de Y(tabla 2.1) y sus respectivas probabilidades (tabla 2.2). Como ilustración, la media condicional o esperanza de Y dado X =80 es 55(1/5) + 60(1/5)+70(1/5) +75(1/5) = 65. Las medias condicionales así calculadas aparecen en la ultima fila de la tabla 2.2.

Antes de proceder, es instructivo observar las cifras de la tabla 2.1 en un diagrama de dispersión, como el que aparece en la figura 2.1. El diagrama de dispersión muestra la distribución condicional de Y correspondiente a diversos valores de X. Aunque hay variaciones en los gastos de consumo familiar individual, la figura 2.1 muestra muy claramente que el valor promedio del gasto de consumo aumenta a medida que el ingreso aumenta. Planteado en forma diferente, el diagrama de dispersión revela que los valores de la media (condicional) de Y aumenta a medida que X aumenta. Esta observación puede verse más claramente si se concentra en los puntos más gruesos que representan diversas medias condicionales de Y. El diagrama de dispersión muestra que estas medias condicionales caen sobre una línea recta con una pendiente positiva. Esta línea se conoce como la línea de regresión poblacional, o más generalmente,la curva de regresión poblacional. Más sencillamente, es la regresión de Y sobre X.

De esta forma, una curva de regresión poblacional es simplemente el lugar geométrico de las medias condicionales o esperanzas de la variable dependiente para los valores fijos de la(s) variable(s) explicativa(s). Esto puede apreciarse en la figura 2.2, que muestra cómo para cada Xi existen valores poblacionales de Y(los cuales se suponen normalmente distribuidos por razones que se explicarán más adelante) y una media (condicional) correspondiente. Y la línea o curva de regresión pasa a través de estas medias condicionales.

lunes, 23 de septiembre de 2013

Ejemplo de Análisis de regresión con dos variables (I)

El análisis de regresión se relaciona en gran medida con la estimación y/o predicción de la media (de la población) o valor promedio de la variable dependiente, con base en los valores conocidos o fijos de las variables explicativas. Para entender la forma como esto se realiza, considere el siguiente ejemplo.

Imagínese un país hipotético con una población total de 60 familias. Supóngase que se está interesados en estudiar la relación entre el gasto de consumo familiar semanal Y y el ingreso semanal familiar después de impuestos o disponible X. Más específicamente, supóngase que se desea predecir el nivel de la media (poblacional) del gasto de consumo semanal conociendo el ingreso semanal de la familia. Para este fin, supóngase que se dividen estas 60 familias en 10 grupos con ingresos aproximadamente iguales y se examinan los gastos de consumo de las familias en cada uno de estos grupos. Las cifras hipoteticas están dadas en la tabla 2.1.

La tabla 2.1 debe ser interpretada de la siguiente manera: Correspondiente a un ingreso semanal de US$ 80, por ejemplo, existen cinco familias cuyos gastos de consumo semanal se encuentran en un rango de US$55 a US$75. En forma similar, dado que X = US$240, hay seis familias cuyos gastos de consumo semanal se encuentran entre US$137 y US$189. En otras palabras, cada columna de la tabla 2.1 presenta la distribución del gasto de consumo Y correspondiente a un nivel de ingreso fijo X; esto es, da la distribución condicional de Y, condicionada a los valores dados de X.

Al advertir las cifras de la tabla 2.1 representa la población, podemos calcular fácilmente las probabilidades condicionales de Y, p(Y/X), probabilidad de Y dado X, de la siguiente manera. Para X =  US$80, por ejemplo, hay cinco valores de Y:US$55, US$60, US$70 y US$75. Por consiguiente, dado X=80, la probabilidad de obtener cualquiera de estos catos de consumo es 1/5. Simbólicamente, p(Y=55 |X=80) = 1/5. En forma similar, p(Y=150|X=260)=1/7. y así sucesivamente, Las probabilidades condicionales para las cifras dadas en la tabla 2.1 están dadas por la tabla 2.2



Análisis de Regresión con dos variables: Algunas ideas básicas

En los anteriores posts se estudió el concepto de regresión en términos generales. En este capítulo se aborda la materia más formalmente. De manera específica, este capítulo y los tres siguientes introduciran al lector en la teoría que consitituye la base para el análisis de regresión más sencillo posible, el caso de dos variables. Este caso es considerando primero, no necesariamente debido a su adecuación práctica sino por que presenta las ideas fundamentales del análisis de regresión de la manera más sencilla posible y algunas de estas ideas puedan ser ilustradas con la ayuda de diagramas bidimensionales. Además, como se verá, el análisis de regresión múltiple más general es, en gran parte, una extensión lógica del caso de dos variables.

domingo, 22 de septiembre de 2013

Resumen y Conclusiones del análisis de regresión


  1. La idea clave detrás del análisis de regresión es la dependencia estadística de una variable, la variable dependiente, sobre una o más variables, las variables explicativas.
  2. El objetivo de tal análisis es estimar y/o predecir la media o el valor promedio de la variable dependiente con base en los valores conocidos o determinados de las variables explicativas.
  3. En la práctica el éxito del análisis de regresión depende de la disponibilidad de la información apropiada. En este capítulo se analizó la naturaleza, las fuentes y limitaciones de los datos que están disponibles para la investigación, especialmente en las ciencias sociales.
  4. En cualquier investigación, el investigador debe describir en forma clara las fuentes de los datos utilizadas en el análisis, sus definiciones, sus métodos de recolección y cualquier brecha u omisión en los datos igual que cualquier revisión hecha sobre éstos. Recuerde que los datos macroeconómicos publicados por el gobierno con frecuencia son objeto de revisión.
  5. Puesto que el lector puede no tener el tiempo, la energía o los recursos para llegar a la fuente original de los datos, el lector tiene el derecho de suponer que los datos utilizados por el investigador han sido reunidos de manera apropiada y que los cálculos y análisis están correctos.

Precisión de la información (II)

Debido a múltiples problemas, el investigador debe tener siempre en mente que el resultado de la investigación solamente será tan bueno como lo sea la calidad de los datos. Por consiguiente, si en situaciones dadas los investigadores encuentran que los resultados de la investigación son "insatisfactorios', la causa puede ser la mala calidad de los datos y no la utilización de un modelo equivocado. Desafortunadamente, debido a la naturaleza no experimental de los datos utilizados en la mayoría de los estudios de las ciencias sociales, los investigadores, con frecuencia no tiene alternativa diferente que depender de la información disponible. Pero ellos siempre deben tener en mente que los datos utilizados pueden ser los mejores y deben tratar de no ser muy dogmáticos sobre los resultados obtenidos de un estudio dado, especialmente cuando la calidad de los datos es sospechosa.


sábado, 21 de septiembre de 2013

Precisión de la información (I)

Aunque existe cuantiosa información disponible para la investigación económica, la calidad de ésta no siempre es buena. Existen múltiples razones para ello. Primero, como se anotó, la mayor parte  de la información de las ciencias sociales es de la naturaleza no experimental. Por consiguiente, existe una posibilidad de incurrir en errores de observación, bien sea por acción u omisión. Segundo, aún en datos reunidos experimentalmente surgen errores de medición debido a las aproximaciones o al redondeo. Tercero, en encuestas tipos de cuestionario, el problema de respuestas en blanco puede ser grave; un investigador tiene suerte al obtener respuestas del 40% a un cuestionario. El análisis basado en tal respuesta parcial puede no reflejar verdaderamente el comportamiento del 60% que no respondió, ocasionando por consiguiente, lo que se conoce como un sesgo de selectividad (muestral). Entonces existe el problema adicional de aquellos quienes responden el cuestionario pero pueden no responder a todas las preguntas, especialmente aquellas sensibles por se de naturaleza financiera, generando así un sesgo adicional de selectividad. Cuarto, los métodos de muestreo utilizados en la obtención de datos pueden variar tanto que frecuentemente es difícil comparar los resultados obtenidos de las diversas muestras. Quinto, las cifras económicas generalmente están disponibles a niveles altamente agregados.

 Por ejemplo, la mayor parte de los macrodatos (v.gr., el PIB, el empleo, la inflación, el desempleo) están disponibles para la economía como un todo o, en el mejor de los casos, para algunas regiones geograficas muy amplias. Tales datos con un elevado nivel de agregación pueden no decirnos mucho sobre el individuo o sobre las microunidades que puedan ser el objeto fundamental del estudio. Sexto, debido a su carácter confidencial, cierta información puede ser publicada solamente en forma muy agregada. En el caso de los Estados Unidos, por ejemplo, a la agencia de impuestos no le está permitido, por ley revelar la información sobre declaraciones individuales de renta; solamente puede revelar algunos datos agregados y resumidos. Por consiguiente, si uno desea saber cuánto dinero gastan en salud los individuos con cierto nivel de ingresos, no es posible hacer ese análisis, excepto a un nivel muy agregado. Pero los macro análisis de este tipo frecuentemente resultan insuficientes para revelar la dinámica del comportamiento de las microunidades. En forma similar, el Departamento de Comercio, que realiza el Censo de Negocios cada cinco años, no tiene autorización de revelar información sobre producción, empleos, consumo de energías, gastos de investigación y desarrollo, etc, , a nivel de empresa. Por consiguiente, es difícil estudiar las diferencias entre empresas con respecto a estos renglones.


Fuentes de información

Los datos utilizados en el análisis empírico pueden ser recogidos por una agencia gubernamental (v.gr., El departamento de Comercio), una agencia internacional (v.gr., el FMI o el Banco Mundial), una organización privada (v.gr., la empresa Standard & Poor's), o un individuo. Literalmente, hay miles de agencias de este tipo recolectando información para uno u otro fin.
La información reunida por estas agencias puede ser de naturaleza experimental o no experimental. En la información experimental, reunida frecuentemente en las ciencias naturales, el investigador puede desear recoger datos manteniendo constantes ciertos factores con el fin de evaluar el impacto de otros sobre un fenómeno dado. Por ejemplo, al estimar el impacto de la obesidad sobre la presión arterial, el investigador podría desear reunir información manteniendo constantes los hábitos alimenticios, el fumar y el beber de las personas con el fin de minimizar la influencia de estas variables sobre la presión arterial.

En las ciencias sociales los datos obtenidos son generalmente de naturaleza no experimental, es decir, no están sujetos al control del investigador. Por ejemplo, los datos sobre el PIB, el desempleo, los precios de las acciones, etc., no están directamente bajo el control del investigador. Como se verá, esta falta de control frecuentemente crea problemas especiales para el investigador en el momento de identificar la causa exacta o las causas que afectan una situación particular. Por ejemplo. la oferta monetaria determina el PIB(nominal)?, o, presenta la relacion inversa?


viernes, 20 de septiembre de 2013

Información combinada

Los datos agrupados tienen elementos de series de tiempo y de corte transversal reunidos. Los datos de la tabla del anterior post son un ejemplo de datos agrupados. Para cada año tenemos 50 observaciones de corte transversal y para cada estado tenemos dos observaciones de series de tiempo sobre precios y cantidades de huevos producidas; un total de 100 observaciones agrupadas. De igual forma, los datos dados en el ejercicio 1.1 son agrupados ya que al tasa de inflación para cada país durante 1960-1980 es una serie de tiempo mientras que los datos sobre la tasa de inflación dados para un sólo año correspondientes a los cinco países son de corte transversal. En la información agrupada tenemos 105 observaciones -21 anuales para cada uno de los cinco países.

Hay un tipo especial de datos agrupados, la información de panel o longitudinal, también llamada información micropanel, en la cual la misma unidad de corte transversal (v.gr., una familia o una empresa) es encuestada a través del tiempo. Por ejemplo, el Departamento de Comercio de los Estados Unidos realiza un censo de vivienda en intervalos periódicos. Para cada encuesta periódica se entrevista la misma unidad familiar (o la gente que vive en la misma dirección) para encontrar si hay habido algún cambio en las condiciones de vivienda o financieras de esa unidad familiar desde la última encuesta. La entrevista periodica a una misma unidad familiar, la información de panel, proprociona información muy útil sobre la dinámica del comportamiento de las unidades familiares.


Información de corte transversal

La información de corte transversal consiste en datos de una o más variables recogidos en el mismo momento del tiempo, tales como el censo de población realizado por la Oficina del Censo cada 10 años, las encuestas de gastos del consumidor realizadas por la Universidad de Michigan y, ciertamente, las encuestas de opinión tales como las realizadas por Gallup y diferentes empresas especializadas. Un ejemplo concreto de información de corte transversal está dado en la tabla 1.1 que presenta datos sobre producción de huevos en los Estados Unidos y sus precios para 50 estados de la Unión durante los años 1990 y 1991. Para cada año los datos sobre los 50 estados son información de corte transversal. Así en la tabla 1.1 tenemos dos muestras de corte transversal.

De igual manera, la información de series de tiempo crea sus propios problemas especiales debido al factor estacionario; la información de corte transversal tiene también sus propios problemas, específicos de heterogeneidad. Hay algunos estados que producen grandes cantidades de huevos (v. gr., Pensilvania) y otros que producen muy poco (v.gr., Alaska). Cuando incluimos unidades heterogéneas en un análisis estadístico, el efecto de tamaño o de escala debe ser tenido en cuenta con el fin de no mezclar manzanas con naranjas. Si se grafican los precios de los huevos y el número de huevos producidos para el año 1990, v.gr., de los datos de la tabla 1.1. verá la amplia dispersión que presentan las observaciones.


Series de Tiempo

Una serie de tiempo es un conjunto de observaciones sobre los valores que toma una variable en diferentes momentos del tiempo. Tal información debe ser recopilada a intervalos regulares, es decir, en forma diaria (v.g.r., precios de acciones), semanal (v.gr. cifras de oferta monetaria proporcionadas por al Junta de la Reserva Federal), mensual (v.gr. los presupuestos del gobierno), quinquenal, es decir cada 5 años (v, gr., el Censo Manufacturero), o decenalmente (v.gr., los censos de población). Algunas veces los datos están disponibles trimestral y anualmente, como en el caso de datos sobre el PIB y los gastos de consumo (v.gr., las cifras anuales sobre el PIB y gastos de consumo).

La información así reunida puede ser cuantitativa (v.gr., Ingreso, precios, oferta monetaria) o cualitativa (v.gr., masculino o femenino, empleado o desocupado, casado o soltero, graduado o no graduado en la universidad).  Las variables cualitativas, llamadas también variables dicótomas o categoricas, pueden ser tan importantes como las variables cuantitativas.

Aunque la información de series de tiempo es utilizada en muchos estudios econometricos, estas presentan algunos problemas especiales para los econometristas. Aunque es muy pronto para introducir el significado técnico preciso de series estacionaria, informalmente hablando, una serie de tiempo. se debe tener en cuenta que al manejar series de tiempo, hay que revisar su estacionariedad.


jueves, 19 de septiembre de 2013

Tipos de información

Puede haber tres tipos de datos disponibles para el análisis empírico: series de tiempo, series de corte transversal, e información combinada (combinación de series de tiempo y series de corte transversal)..

Naturaleza y Fuentes de información para el análisis econométrico

El éxito de cualquier análisis econométrico depende en último término de la disponibilidad de información apropiada. Es muy importante dedicar algún tiempo a estudiar la naturaleza, las fuentes y las limitaciones de los datos que se pueden encontrar en el análisis empírico.

miércoles, 18 de septiembre de 2013

Terminología y notación (II)

Si se está estudiando la dependencia de una variable en una única variable explicativa, como es el caso del gasto de consumo sobre el ingreso real, dicho estudio es conocido como el análisis de regresión simple, o con dos variables. Sin embargo, si está estudiando la dependencia de una variable en más de una variable explicativa, tal como el producto de una cosecha, la lluvia, la temperatura, el solo y los fertilizantes, éste se conoce como el análisis de regresión múltiple. En otras palabras, en una regresión de dos variables sólo hay una variable explicativa mientras que en la regresión múltiple hay más de una variable explicativa.

El término aleatorio es un sinónimo de estocástico. Como se anóto anteriormente una variable aleatoria o estocástica es aquella que puede tomar cualquier conjunto de valores, positivos o negativos, con una probabilidad dad. 

Si se afirma lo contrario, la letra Y representará la variable dependiente  y las X(X1,X2...... ,Xk) representarán las variables explicativas,siendo Xk la k-esima variable explicativa. Los subíndices i o t denotarán la observación o valor i-ésimo o t-ésimo respectivamente. Xk1 (o Xkt) denotará la i-ésima (o la t-ésima) observación de la variable Xk. N (o T) representará el número total de observaciones o valores en la población y n (o t) el número total de observaciones en una muestra. Por convención, se utilizará el subíndice i para los datos de corte transversal (es decir, información recogida en un punto del tiempo) y el subíndice t será utilizado para datos de series de tiempo (es decir, información recogida a lo largo de cierto periodo). La naturaleza de la información de las series de corte transversal y de las series de tiempo, igual que el importante tema de la naturaleza y las fuentes de información para el análisis empírico, se estudiarán en la siguiente sección. 

Terminología y notación (I)

Antes de proceder a un análisis formal de la teoría de regresión, se puede ver brevemente el tema de la terminología y la notación. En la teoría económica los términos variable dependiente y variable explicativa están descritos de varias maneras; a continuación se presenta una lista representativa de ellas:

variable dependiente                                variable explicativa
             ↨                                                              ↨
Variable explicada                                  Variable independiente
              ↨                                                             ↨
       Predicha                                                    Predictor
            ↨                                                                ↨
      Regresada                                                    Regresor
             ↨                                                               ↨
      Repuesta                                                      Variable de control o estímulo
          ↨                                                                 ↨
   Endógena                                                       Exógena

Aunque es un asunto de preferencia personal y de tradición, en este texto se utiliza la terminología de variable-dependiente-variable explicativa.  

martes, 17 de septiembre de 2013

Regresión Vs Correlación

El análisis de correlación está estrechamente relacionado con el de regresión aunque conceptualmente los dos son muy diferentes. En el análisis de correlación el objetivo principal es medir la fuerza o el grado de asociación lineal, entre dos variables. El coeficiente de correlación, que se estudiará en detalle mas adelante, mide esta fuerza de asociación (lineal). Por ejemplo, se puede  estar interesado en encontrar la correlación (el cofeciente) entre el hábito de fumar y el puede estar interesado en encontrar la correlación (el coeficiente) entre el hábito de fumar y el cáncer de pulmón; entre las calificaciones obtenidas en la escuela secundaria y en la universidad, y así sucesivamente. En el análisis de regresión, como ya se mencionó, no estamos interesados en este tipo de medición. En cambio, se tata de estimar o de predecir el valor promedio de una variable sobre la base de valores fijos de otras variables. Así, puede ser que se  desee saber si se puede predecir el promedio de las calificaciones en un examén de estadística, conociendo la calificación de un estudiante en un examén de matemáticas.

La regresión y la correlación tienen algunas diferencias fundamentales que vale la pena mencionar. En el análisis de regresión hay una asimetría en el tratamiento que se da a las variables dependientes y explicativas. Se supone que la variable dependiente es estadística, aleatoria, o estocástica, esto es, que tiene una distribución de probabilidad. Por otra parte se ha determinado que las variables explicativas tiene valores fijos (en  muestras repetidas), lo cual fue hecho explícito en la definición de regresión. Así, en los anteriores ejemplos se supuso que la variable edad era fija a los niveles dados y se obtuvieron medidas de estatura a esos niveles. En el análisis de correlación, por otra parte, tratamos dos variables cualquiera en forma simétrica; no hay distinción entre la variable dependiente y las explicativas. Después de todo, la correlación entre las calificaciones  de los exámenes de matemáticas y de estadística es la misma que la existente entre calificaciones de los exámenes de estadística y el de matemáticas. Además, se ha supuesto que las dos variables son aleatorias. Como se verá, la mayor parte de la teoría de correlación está basada en el supuesto de aleatoriedad de variables, mientras que la mayor parte de la teoría de regresión que se expondrá en este texto está condicionada al supuesto de que la variable dependiente es estocástica pero las variables explicativas son fijas o no estocásticas. 

Regresión vs Causalidad

A pesar de que el análisis de regresión tiene que ver con la dependecia de una variable de otras variables, esto no implica la causalidad necesariamente. En palabras de Kendall  y Stuart, "Una relación estadística, sin importar qué tan fuerte y sugestiva sea, nunca podrá establecer una conexión causal; nuestras ideas de causalidad deben venir de estadísticas externas y, en último término, de uno u otra teoría".

En el ejemplo del producto de una cosecha citado previamente, no hay una razon estadistica para suponer que la lluvia no depende del producto de la cosecha. El hecho de que se trata el producto de la cosecha como dependiente de lluvia ( entre otras cosas) es debido a consideraciones no estadísticas, el sentido común sugiere que la relación no puede revertirse, ya que no podemos controlar la lluvia modificando la producción de la cosecha.

En todos los ejemplos citados en los anteriores posts, el punto de anotar es que una relación estadística no puede por sí misma implicar en forma lógica una causalidad. Para aducir causalidad se debe acudir a consideraciones a priori o teóricas. Así, en el tercer ejemplo  citado, uno puede recurrir a la teoría económica al afirmar que el gasto de consumo depende del ingreso real.


lunes, 16 de septiembre de 2013

Relaciones estadísticas vs relaciones determinísticas (II)

En los fenómenos determinísticos, por otra parte, tratamos con relaciones tales como la ley de la gravedad de Newton, la cual plantea que toda partícula en el universo atrae a cualquier otra partícula con una fuerza directamente proporcional al producto de sus masas e inversamente proporcional al cuadrado de la distancia entre ellas. Simbólicamente, F=k(m1,m2/r²), donde F=fuerza, m1 y m2 son las masas de las dos partículas, r=distancia, y k=constante de proporcionalidad. Otro ejemplo es el de la ley de Ohm, la cual postula que para conductores metálicos dentro de un rango limitado de temperatura, la corriente C es proporcional al voltaje V; esto es C = (1/k)V donde 1/k es la constate de la proporcionalidad. Otros ejemplos de tales relaciones determínisticas son la ley de los gases de Boyle, la ley de electricidad de Kirchoff y la ley de movimiento de Newton.

En este contexto no estamos interesados en tales relaciones determinísticos. Obviamente, de haber errores de medición, por ejemplo, en la k de la ley de la gravedad de Newton, la relación que de otra forma hubiera sido determinística se convierte en una relación estadística. En esta situación es posible predecir la fuerza en forma aproximada solamente, a partir de un valor dado de k(y, m1, m2 y r), el cual contiene errores. La variable F se convierte en este caso en aleatoria.


Relaciones estadísticas vs relaciones determinísticas (I)

De los anteriores ejemplos, el lector podra observar que en el análisis de regresión nos interesa lo que se conoce como dependencia estadística entre variables, no aquella funcional o deterministica propia de la física clásica. En las relaciones estadisticas entre variables tratamos esencialmente con variables aleatorias o estocasticas, esto es, variables que tienen distribuciones de probabilidad. Por otra parte, en la dependencia funcional o deterministica también manejamos variables no son aleatorias o estocásticas.

La dependencia del producto de una cosecha de la temperatura ambiente, la lluvia, el sol y los fertilizantes, por ejemplo, es de naturaleza estadística en el sentido que las variables explicativas, si bien son importantes, no permitirán al agrónomo predecir en forma exacta el producto de la cosecha debido a los errores involucrados en la medición de estas variables y en razón de otras serie de factores (variables), que afectan colectivamente la producción pero pueden ser difíciles de indentificar individualmente. De esta manera habrá alguna variabilidad "intrínseca" o aleatoria en la variable dependiente, producto de la cosecha, que no puede ser explicada en su todalidad sin importar cuántas otras variables explicativas consideramos.

domingo, 15 de septiembre de 2013

Ejemplo de Regresión 8

Finalmente, un agrónomo puede estar interesado en estudiar la dependencia existente entre el producto de una cosecha, de trigo por ejemplo, y la temperatura, la lluvia, la cantidad de sol y los fertilizantes. Un análisis de dependencia de ese tipo puede facilitar la predicción o el pronóstico de la producción media de la cosecha, dada la información sobre las variables explicativas.


Ejemplo de Regresión 7

El director de mercadeo de una compañia puede desear saber al forma como se relaciona la demanda del producto de su compañia con el gasto de publicidad, por ejemplo. Un estudio de este tipo será de gran ayuda para encontrar la elasticidad de la demanda con respecto a los gastos de publicidad, esto es, el cambio porcentual en la demanda en respuesta, por ejemplo, a un cambio de 1 por ciento en el presupuesto de publicidad. Este conocimiento puede ser útil para determinar el presupuesto "óptimo" de publicidad.


sábado, 14 de septiembre de 2013

Ejemplo de Regresión 6

De la economía  monetaria se sabe que, si se mantienen algunos factores constantes, entre mayor sea la tasa de inflación, menor será la proporción k de su ingreso que la gente desearía mantener en forma de dinero, como se deduce de la anterior figura. Un análisis cuantitativo de esta relación permitirá al economista monetario predecir la cantidad de dinero, como proporción de su ingreso, que la gente desearía mantener a diversas tasas de inflación.

Ejemplo de Regresión 5

Un economista laboral puede desear estudiar la tasa de cambio de los salarios monetarios o nominales con relación a la tasa de desempleo. Las cifras históricas aparecen en el diagrama de dispersión dado acá abajo. La curva de la figura es un ejemplo de la celebre curva de phillips que relaciona cambios en los salarios nominales con la tasa de desempleo. Un diagrama de dispersión  de este tipo permite al economista laboral, predecir el cambio promedio en los salarios nominales dada una cierta tasa de desempleo. Tal conocimiento es útil para establecer ciertas ideas sobre el proceso inflacionario en una economía, ya que es probable que los incrementos en los salarios monetarios se reflejen en incrementos de precios.


viernes, 13 de septiembre de 2013

Ejemplo de Regresión 4

Un monopolista que puede fijar el precio o la producción (pero no ambos factores) puede desear encontrar la respuesta de la demanda de un producto ante cambios en el precio. Tal experimento puede permitir la estimación de la elasticidad-precio ( es decir, la respuesta  a variaciones en el precio) de la demanda del producto y ayudar  a determinar el precio que maximiza las ganancias de una empresa 

Ejemplo de Regresión 3

Volviendo a los ejemplos de la economía, un economista puede estar interesado en estudiar la dependencia del gasto de consumo personal en el ingreso personal neto disponible (después de impuestos). Un análisis de este tipo puede ser útil para estimar la propersión marginal a consumir (PMC), esto es, el cambio promedio en el gasto de consumo ante un cambio de un dólar, por ejemplo, en el ingreso real.

jueves, 12 de septiembre de 2013

Ejemplo de Regresión 2

Considerese el diagrama de abajo, que presenta la distribución de una población hipotética de estaturas de los niños medidas a edades determinadas. Nótese que existe un rango de estaturas correspondiente a cada edad dada. Obviamente no es probable que todos los niños de una edad determinada tengan estaturas idénticas. Pero el promedio de las estaturas se incrementa con la edad (obviamente, hasta un cierto momento). Así, conociendo la edad, podemos predecir la estatura promedio correspondiente a ésta.


Ejemplo de Regresión 1

Considerese nuevamente la ley de regresión universal de Galton. Él estaba interesado en averiguar las razones por las cuales existía estabilidad en la distribución de estaturas dentro de una población. En el enfoque moderno la preocupación no está dirigida a esta explicación sino a averiguar la manera como cambia la estatura promedio de los hijos, dada la estatura de los padres. En otras palabras, se está interesado en predecir la estatura promedio de los hijos conociendo la estatura de sus padres. Para apreciar la forma como puede esto llevarse a cabo, se considera la figura de abajo, que corresponde a un diagrama de dispersión.


La figura muestra la distribución de las estaturas de los hijos en una población hipotética, correspondiente al conjunto de valores dados o fijos de las estaturas de los padres. notese que para cualquier estatura dada de un padre existe un rango (distribución) de estaturas de los hijos. Sin embargo, adviertase que la estatura promedio. de los hijos aumenta a medida que la estatura de los padres es mayor. Para ver esto claramente, hemos trazado una línea recta a través de los puntos dispersos. Esta línea muestra la forma como aumenta la estatura promedio de los hijos con la estatura de los padres. Esta línea, como se verá, se conoce como la línea de regresión.

miércoles, 11 de septiembre de 2013

Origen histórico del térmico "regresión"

El termino regresión fue introducido por Fracis Galton. En un famoso artículo Galton planteó que, a pesar de la presencia de una tendencia en al que los padres de estatura alta tenían hijos altos y los padres de estatura baja tenían hijos bajos, la estatura promedio de los niños nacidos de padres de una estatura dada tendían a moverse o "regresar" hacia la estatura promedio de la población total. En otras palabras, la estatura de los hijos inusualmente altos o de padres inusualmente bajos tiende a moverse hacia la estatura promedio de la población. La Ley de regresión universal de Galton fue confirmada por su amigo Karl Pearson, quien reunió más de mil registros de estaturas de miembros de grupos familiares. Pearson encontró que la estatura promedio de los hijos de un grupo de padres de estatura alta era menor que la estatura de sus padres y la estatura promedio de los hijos de un grupo de padres de estatura baja era mayor que la estatura de los padres, generandose una fenómeno mediante el cual los hijos altos e hijos bajos, "regresaban" en forma similar hacia la estatura promedio de todos los hombres. En palabras de Galton, se trataban de una "regresión hacia la mediocridad "

Modelos de regresión uniecuacionales

En estos modelos, una variable  llamada dependiente, es expresada como una función lineal de una o más variables, llamadas explicativas. En modelos de este tipo se supone implícimante que si existen relaciones causales entre las variables dependientes y explicativas, éstas van en una dirección solamente: de las variables explicativas hacia la variable dependiente.

En este capitulo se hace una exposición relacionada con la interpretación, tanto histórica como moderna, del término regresión y se ilustran las diferencias entre las dos interpretaciones con diversos ejemplos tomados de la economía y de otros campos.

En el siguiente capitulo se introducirán algunos conceptos fundamentales del análisis de regresión con la ayuda del modelo de regresión lineal con dos variables, en el cual la variable dependiente es expresada como una función lineal de sólo una variable explicativa.

En siguiente del siguiente se seguiran manejando el modelo con dos variables y se introducirá lo que se conoce como el modelo clásico de regresión lineal, que tiene diversos supuestos simplificadores con estos supuestos, se introducirá el método de minimos cuadrados ordinarios (MCO) para estimar los parámetros del modelo de regresión con dos variables. El método MCO es simple de aplicar y tiene algunas propiedades estadísticas muy deseables.



Interpretación moderna de la regresión

La interpretación moderna de la regresión es, sin embargo bastante diferente. En términos generales se puede decir:

El análisis de regresión trata del estudio de la dependencia de la variable dependiente, en una o más variables, las variables explicativas, con el objetivo de estimar y/o predecir la media o valor promedio poblacional de la primera en términos de los valores conocidos o fijos (en muestras repetidas) de las últimas.

La trascendental importancia de este enfoque del análisis de regresión se hará más claro a medida que avanzamos, pero algunos ejemplos sencillos aclararán este concepto básico.

martes, 10 de septiembre de 2013

Sugerencias para lecturas posteriores

El tema de la metodología econométrica es vasto y controversial. Para aquellos interesados en este tema, sugiero los siguientes libros:

Neil de Marchi y Christopher Gilbert, eds., History and Methodology of Econometrics, Oxford University Press, New York, 1989. En esta colección de lecturas se analizan los primerostrabajos realizados sobre metodología econométrica. El análisis se extiende al enfoque británico de la econometría relacionado con cifras de series de tiempo, esto es, datos recolectados durante un periodo de tiempo..

Wojciech W. Charemza y Derek F. Deadman. New Directions in Econometric Practice: General to Specific Modelling, Cointegration and Vector Autoregression, Edward Elgar Publishing Ltd. Hants, England, 1992. Los autores de este libro critican el enfoque tradicional de la econometríca.

Adrian C Darnell y J. Lynne Evans, The Limits of Econometrics, Edward Elgar Publishing Ltd., Hants, England, 1990. Este blog presenta un análisis en cierta medida balanceado de los diversos enfoques metodologicos a  la econometría, con una renovada fidelidad a la metodologia eoconometrica tradicional.


Prerrequisitos matemáticos y estadísticos

A pesar de que este blog esta en términos elementales, el autor sopone que el lector está familiarizado con los conceptos básicos de la estimación estadística y prueba de hipótesis.

Sin embargo, una revisión amplia pero no técnica de los conceptos estadísticos básicos utilizados en este blog se presentara al finalizar los contenidos en este blog. En lo que concierne a las matemáticas, es deseable aunque no esencia, estar un poco familiarizado con las nociones de cálculo diferencial. Si bien la mayoría de los textos de  econometría para graduados hace amplio uso del álgebra matricial, deseo aclarar que este blog no requiere estudio. Considero firmemente que las ideas fundamentales de econometría pueden ser transmitidas sin el uso del álgebra matricial. Sin embargo, para el beneficio del estudiante amigo de las matemáticas habra algunos posts especiales al seguir con este blog.


lunes, 9 de septiembre de 2013

Tipos de Econometría

Como lo sugiere el esquema de clasificación en la figura de abajo, la econometría puede ser dividida en dos amplias categorías: la econmetría teórica y la econometría aplicada. En cada categoría, uno puede enfocar la materia en la tradición clásica o en la bayesiana. En este libro se hace énfasis en el enfoque clásico.

La econometría teórica se relaciona con el desarrollo de métodos apropiados, para medir las relaciones económicas  especificadas por los modelos econométricos. En este aspecto, la econometría se apoya en gran medida en la estadistica matematica. Por ejemplo, uno de los metodos utilizados ampliamente en este blog es el de mínimos cuadrados. La econometria téorica debe expresar los supuestos de este método, sus propiedades y lo que sucede a éstas cuando uno o más de los supuestos del método no se cumplen.

En la econometría aplicada utilizamos utilizamos herramientas de la econometría teórica para estudiar algunos campos especiales de la economía y los negocios, tales como la función de producción, la función de inversión, las funciones de demanda y oferta,  la teoría de portafolio, etc.

Este blog se refiere en gran parte al desarrollo de los métodos econometricos, sus supuestos sus usos y limitantes. Estos métodos están ilustrados con ejemplos en diversas áreas de la economia y los negocios. Pero éste  no es un blog de econometria aplicada en el sentido de buscar a fondo dentro de un campo particular de aplicación economica. Para esa labor existen textos especializados.

Econometría
Torica                          Aplicada
│                                     │
Clasica      Bayesiana      Clasica     Bayesiana

Uso del modelo para fines de control o de política

Suponga que tenemos la función keynesiana de consumo estimada dada en (1.3.3). Suponga además que el gobierno considera que un nivel de gasto de 4000 (miles de millones de dolares de 1987) mantendrá la tasa de desempleo en su nivel actual de cerca de 6.5 por ciento (estimación de abril de 1994 realizado por el Bureau of Labor Statistics). Cuál nivel de ingreso garantizará la cantidad de gasto de consumo fijado como meta?

Si la función de consumo dada en (1.3.3) es aceptable, la aritmética simple mostrará que

4000 = -231.8+0.7194X
X = 5882 (aprox.)

Esto es, un nivel de ingresos de US$5882 (miles de millones), dada una PMC de cercade 0.72, producirá un gasto de US$ 4000 miles de millones.

Como lo sugieren estos cálculos, un modelo estimado puede ser utilizado para fines de control o de política. Mediante una mezcla apropiada de política fiscal monetaria, el gobierno puede manejar la variable de control X para producir el nivel deseado de la variable objetivo Y.

La siguiente figura resume la anatomía de la elaboración de modelos econométricos clásicos.

                  -----------------------------------------------------------------------------
Teoría económica
Modelo matematico de la teoria
modelo econometrico de la teoria
Datos
Estimación del modelo econométrico
Prueba de hipótesis
Pronóstico o predicción
Uso del Modelo para fines de control o de política
--------------------------------------------------------------------------------------------------

domingo, 8 de septiembre de 2013

Proyección o predicción

Si el modelo escogido confirma la hipótesis o la teoría en consideración, se puede utilizar para predecir el (los) valor(es) futuro(s) de la variable  dependiente Y, o de pronostico, con base en el valor futuro conocido o esperado de la variable X explicativa, o predictora.

A manera de ilustración, suponga que se espera un PIB real de US$6000 (mil millones) en 1994. ¿Cuál es el pronóstico de gasto de consumo en 1994? Si se considera que la función consumo (1.3.3) continuará siendo válida en 1994, podemos contestar esta pregunta simplemente así.

Y = -231 + 0.7196 (6000)                     (1.3.4)
= 4084.6                          
es decir, cerca de 4085 miles de millones de dólares.

Hay otro uso del modelo estimado (1.3.3). Poco después de su posesión en 1993, el presidente Clinton anunció su plan económico, que incluyó un incremento en Impuestos para la gente con ingresos por encima de un nivel mínimo de cerca de US$140.000. Propuso también gravar la energía, entre otros renglones, para recortar el deficit del presupuesto federal; el impuesto sobre la gasolina, de hecho, fue elevado 5 centavos por galón. ¿Cuál será el efecto de estas políticas sobre el ingreso y, por consiguiente, sobre el gasto de consumo y finalmente sobre el empleo?.

Supóngase que como resultado de estos cambios de política el gasto de inversión se reduce. ¿Cuál será el efecto sobre la economía? De acuerdo con la teoría macroeconómica, el cambio en el ingreso generado por un cambio por valor de un dólar, por ejemplo, en el gasto de inversión está dado por el multiplicador de ingreso (M), el cual está definido como

M = (1/(1-PMC))
Si se utiliza la PMC de 0.72 obtenida de (1.3.3) este multiplicador se convierte en M= 1(1-0.72)= = 3.57. Esto es, una reducción  ( o aumento) de un dólar en la inversión, finalmente llevará a una reducción  (o incremento) cerca de cuatro veces mayor en el ingreso; advierta que el multiplicador demora algún tiempo en actuar.

El valor crítico en este cálculo e sla PMC, ya que M depende de ésta. Y este valor estimado de la PMC se obtiene de modelos de regresión tales como (1.3.3). Así, un valor estimado cuantitativo de la PMC proporciona valiosa información para fines de política. Conociendo la PMC, uno puede predecir el curso futuro del ingreso y del gasto de consumo que sigue a un cambio en las políticas fiscales del gobierno.


Prueba de hipótesis

Suponiendo que el modelo ajustado es una aproximación razonablemente buena de la realidad, se tiene que desrrollar criterios apropiados para encontrar si los valores estimados obtenidos en una ecuación como la (1.3.3) , por ejemplo, concuerdan con las expectativas de la teoría que está siendo probada. De acuerdo con los economistas "positivos", como Milton Friedman, una teoría o hipótesis que no es verificable por la evidencia empírica no puede ser admisible como parte de la investigación científica.

Como se anotó anteriormente, Keynes esperaba que la PMC fuera positiva pero meno que 1. En el ejemplo se encuentra una PMC de cerca de 0.72. Pero antes de aceptar este hallazgo como confirmación de la teoría keynesiana de consumo., debemos averiguar si este estimativo está suficientemente por debajo de la unidad para convencernos de que no se trata de un suceso del azar o de una peculiaridad de la información particular que hemos utilizado. En otras palabras, ¿es 0.72 estadisticamente menor que 1? Si lo es, puede apoyar la teoría de Keynes.

Tal confirmación o refutación de las teorías económicas con base en evidencia muestral está basada en una rama de la teoría estadística conocida como inferencia estadística (prueba de hipótesis). A lo largo de este libro se verá cómo se realiza en la práctica este proceso de inferencia.

sábado, 7 de septiembre de 2013

Estimación del modelo econométrico

Ahora que tenemos los datos, nuestra siguiente labor es estimar los parámetros de la función consumo. La estimación numérica de los parámetros da contenido empírico a la función consumo. El mecanimo real para estimar los parámetros da contenido empírico a la función consumo. El mecanismo real para estimar los parámetros será ilustrada en los siguientes posts. Por el momento, note que la técnica estadística conocida como análisis de regresión es la herramienta principal utilizada para obetener los valores estimados. Utilizando esta técnica y la información dada en la tabla 1.1. obtuvimos los siguientes valores estimados de B1 y B2, a saber, -231.8 y 0.7194. Así la función de consumo estimada es

Y = -231.8 + 0.7194X (1.3.3.)

 El gorro sobre Y indica que es un valor estimado

De esta ecuación vemos que para el periodo 1980 a 1991 el coeficiente de la pendiente (es, decir, la PMC) fue alrededor de 0.72, sugiriendo que para el período muestral un incremento de un dólar en el ingreso real lleva, en promedio, a un incremento de cerca de 72 centavos en el gasto de comsumo real. Se dice en promedio , por que la relación entre consumo e ingreso es inexacta, como se deduce de la figura 1.2, la cual muestra la línea de regresión obtenida en (1.3.3.)

Obtención de Información

Para estimar el modelo econométrico dado en (1.3.2), esto es,  para obtener los valores numéricos de B1 y B2, necesitamos datos. Aunque tendremos más que decir en el siguiente capítulo sobre la importancia crucial de los datos para el análisis económico, por el momento observemos unas cifras relacionadas con la economía de los Estados Unidos. La variable Y en esta tabla es el gasto de consumo personal agregado (para la economía como un todo) y la variable X es el Producto Interno Bruto (PIB), una medida del ingreso agregado, ambos medidos en miles de millones de dólares de 1987. Por consiguiente, los datos están en términos reales, es decir, han sido medidos en precios constantes (1987). Estos datos se han gráficado en la figura:


viernes, 6 de septiembre de 2013

Especificación del modelo econométrico de consumo

El modelo puramente matemático de la función de consumo dado en la ecuación del anterior post, es de interés limitado para el econometrista, ya que supone que existe una relación exacta o deterministica entre el consumo y el ingreso. Pero las relaciones entre las variables económicas generalmente son inexactas. Así, por ejemplo, si se fuera a obtener información sobre gasto de consumo e ingreso disponible (es decir, después de impuestos) de una muestra de 500 familias americanas y graficar estos datos, asignando el eje vertical al gasto de consumo y el eje horizontal al ingreso disponible, no se esperaria que todas las 500 observaciones quedaran exactamente  sobre la línea recta de la ecuación porque, además del ingreso, existen otras variables que afectan el gasto de consumo. Por ejemplo, el tamaño de la familia, las edades de sus miembros, su religión, etc., ejercerán probablemente alguna influencia sobre el consumo.

Para dar cabida a relaciones inexactas entre las variables económicas, el econometrista modficaría la función deterministica de consumo de la siguiente manera:

Y = B1 + B2X +u (1.3.2)

donde u, conocida como el término de perturbación, o de error es una variable aleatoria (estocástica) que tiene propiedades probabilíssticas claramente definidas. El térmico de perturbación u puede representar claramente todos aquellos factores que afectan el consumo pero que no son considerados en el modelo en forma explicita.

La ecuacion (1.3.2) es un ejemplo de un modelo econométrico. Más técnicamente, dicha ecuación es un ejemplo de un modelo de regresión lineal, el principal interés de este blog. La funcion econometrica de consumo plantea como hipotesis que al variable dependiente Y(consumo) está relacionada linealmente con la variable explicativa X (ingreso) pero que la relación entre las dos no es exacta; está sujeta a variaciones individuales.

El modelo econométrico de la función de consumo  puede representarse gráficamente.

jueves, 5 de septiembre de 2013

Especificación del modelo matemático de consumo

A pesar de haber postulado una relación positiva entre el consumo y el ingreso, Keynes no especifica la forma precisa de la relacion funcional entre las dos. Por simplicidad, un economista matemático podría sugerir la siguiente forma de la función keynesiana de consumo:

Y = B1 + B2X         0 < B2 < 1

donde Y= gasto de consumo y X = Ingreso, y donde B1 y B2, conocidos como parámetros del modelo son, respectivamente, los coeficientes del intercepto y de la pendiente.

El coeficiente de la pendiente B2 mide la PMC. Geométricamente, la Ecuacion de arriba se muestra en la figura 1.1. Esta ecuación plantea que el consumo está relacionado linealmente con el ingreso, y es un ejemplo de un modelo matemático de la relación entre consumo e ingreso llamada en economía la función consumo. Un modelo es simplemente un conjunto de ecuaciones matemáticas. Si el modelo tiene una sola ecuación, como en el ejemplo anterior, se denomina modelo uniecuacional, mientras que si tiene más de una ecuación, se conoce como modelo multiecuacional.

En la ecuación la variable aparece al lado izquierdo del signo de la igualdad se llama variable dependiente y la(s) variable(s) en el lado derecho se llama(n) variable(s) independiente(s), o explicativa(s). Así, en la función keynesiana de consumo, la ecuación, el consumo (gasto) es la variable dependiente y el ingreso la variable explicativa.


Planteamiento de la teoría o hipótesis - Keynes Plantea

La Ley sicológica fundamental.... consiste en que los hombres (y las mujeres) como regla general y en promedio, están dispuestos a incrementar sus consumo a medida que su ingreso aumenta, pero no en la misma  cuantía del aumento en su ingreso.

En pocas palabras, Keynes postula que la propensión marginal a consumir (PMC), es decir, la tasa de cambio del consumo generado por una unidad (digamos, un dólar) de cambio en el ingreso, es mayor que cero pero menor que uno.


miércoles, 4 de septiembre de 2013

Metodología de la Econometría

Cómo proceden los econometristas en el análisis de un problema económico? Es decir, Cuál es su metodología? Aunque existen diversas escuelas de pensamiento sobre metodología econométrica, se presenta aquí la metodología tradicional o clásica, que predomina en la investigación empírica en economía y en los campos relacionados.

En términos generales, la metodología econométrica tradicional se realiza dentro de los siguientes lineamientos:

1. Planteamiento de la teoría de la hipótesis
2. Especificación del modelo matemático de la teoría
3. Especificiación del modelo econométrico de la teoría
4. Obtención de datos
5. Estimación de los parámetros del modelo econométrico
6. Prueba de hipótesis
7. Pronósticos o predicción
8 Utlización del modelo para fines de control o de política


Por que una disciplina aparte? (II)

La estadística económica se relaciona principalmente con la recolección, procesamiento y presentación de las cifras económicas en forma de gráficos y tablas. Este es el trabajo del estadístico económico, cuya actividad principal consiste en recoger cifras sobre el PIB, el empleo, el desempleo, los precios, etc. La información así recogida constituye la materia prima para el trabajo econométrico. Pero el estadístico ecónomico no va más alla de la recolección de información, pues no le concierne la utilización de las cifras recogidas para probar la validez de las teorías económicas o para refutarlas. Ciertamente, es el econometrista quien se ocupa de realizar esa labor.

Aunque la estadística matemática proporciona muchas de las herramientas utilizadas por esta ciencia, el econometrista frecuentemente necesita métodos especiales en vista de la naturaleza única de la mayoría de las cifras económicas, ya que estás no se generan como resultado de un experimento controlado. El econometrista, como el meteorólogo, depende generalmente de cifras que no pueden ser controladas directamente. Por tanto, las cifras sobre consumo, ingreso, inversión, ahorro, precios, etc., recogidas por agencias oficiales y privadas, son información no experimental. 

El econometrista toma estos datos como dados, hecho que genera problemas especiales que normalmente no se manejan en la estadística matemática. Además, es probable que tales cifras contengan errores de medición, situación que el econometrista puede ayudar a remediar desarrollando métodos especiales de análisis.


martes, 3 de septiembre de 2013

Por que una disciplina aparte?

Como lo sugieren las definiciones anteriores, la econometría es una amalgama de teoría económica, economía matemática, estadística económica y estadística matemática. Todavía la materia merece ser estudiada en forma separada por las siguientes razones.

La teoría económica hace afirmaciones o formula hipótesis de naturaleza principalmente cuantitativa cualitativa. Por ejemplo, la teoría microeconómica establece que, permaneciendo constantes otros factores, se espera que una reducción en el precio de un bien aumente la cantidad demandada de ese bien. Así, la teoría económica postula una relación negativa o inversa entre el precio y la cantidad demandada de un bien. Pero la teoría de por sí no proporciona medida numérica alguna de la relación entre los dos; no dice en qué magnitud aumentará o se reducirá la cantidad como resultado de un cambio determinado en el precio del bien. El trabajo del econometrista es proporcionar tales estimativos númericos. Planteado de otra forma, la econometría da contenido empírico a gran parte de la teoría económica.

El interés principal de la economía matemática es expresar la teoría económica en una forma matemática (ecuaciones) sin considerara la capacidad de medición o de verificación empírica de la teoría. La econometría está esta interesada principalmente en la verificación empírica de la teoría económica. Como veremos el econometrista utiliza frecuentemente las ecuaciones matemáticas, propuestas por el economista matematico, pero las expresa en tal forma que éstas se prestan para la prueba empírica. Y esta conversión de ecuaciones matemáticas en ecuaciones econométricas requiere una gran dosis de ingenio y destreza.


Que es la Econometría?

Literalmente, econometría significa "medición económica". Sin embargo, si bien es cierto que la medición es una parte importante de la econometría, el alcance de esta disciplina es mucho más amplio, como se puede deducirse de las siguientes citas:


La econometri a, resultado de cierta perspectiva sobre el papel que juega la economía , consiste en la aplicaci on de la estad stica matem atica a la informaci on econ omica para dar soporte emp rico a los modelos construidos por la econom a matem atica y obtener resultados núm ericos.

. . . la econometri a puede ser de finida como el an alisis cuantitativo de fen omenos econ omicos reales, basado en el desarrollo simultaneo de teori a y observaciones, y relacionado por m etodos apropiados de inferencia.2

La econometri a puede ser de nida como la ciencia social en la cual las herramientas de la teor ia econ omica, las matem aticas y la inferencia estad stica son aplicadas al an alisis de los fen omenos econ omicos.

La econometri a tiene que ver con la determinación on emp rica de las leyes econ omicas.

El arte del econometrista consiste en encontrar el conjunto de supuestos que sean su cientemente espec cos y realistas, de tal forma que le permitan aprovechar de la mejor manera los datos que tiene a su disposici on.

Los econometristas . . . son una ayuda en el esfuerzo por disipar la mala imagen pública de la economi a (cuantitativa o de otro tipo) considerada como una materia en la cual se abren cajas vac as, suponiendo la existencia de abrelatas, para revelar un contenido que ser a interpretado por cada diez economistas de 11 maneras diferentes.

El m étodo de la investigaci on econom etrica busca esencialmente una conjunci on entre la teor a econ omica y la medici on real, utilizando como puente la teori a y la t écnica de la inferencia estad istica.