Busca en el Blog

sábado, 31 de mayo de 2014

La contribución "incremental" o "marginal" de una variable explicativa (III)

Suponiendo que las perturbaciones ui están normalmente distribuidas y la hipótesis nula β12 = 0, sabemos que

F = (65898.235/11.080) = 5947.494 (8.5.15)

sigue una distribución F con 1 y 13 g de l. Este valor F es significativo a los niveles usuales de significancia. Así, como antes, se puede rechazar la hipótesis de que β12 = 0. A propósito, obsérvese que t² = (77.2982)² = 5975.02, que es igual al valor F de (8.5.15) excepto por errores de aproximación. Pero este resultado no debe sorprender puesto que, como se anotó en el capítulo 5, bajo la misma hipótesis nula y el mismo nivel de significancia, el cuadrado del valor t con n-2 g de l es igual al valor F con 1 y n-2 g de l.

Habiendo efectuado la regresión (8.5.14), supóngase que se decide agregar X3 al modelo y obtener la regresión múltiple (8.2.2). Las preguntas que se quieren responder son estas:

1) Cuál es la contribución marginal o incremental de X3 sabiendo que X2 ya aparece en el modelo y que está relacionada significativamente con Y? (2) Es la contribución incremental estadísticamente significativa? (3) Cuál es el criterio para agregar variables al modelo? Estas preguntas pueden ser resueltas mediante la técnica ANOVA. Para ver esto, se construye la tabla 8.6. Para el ejemplo numérico, la tabla 8.6 se convierte en tabla 8.7.




viernes, 30 de mayo de 2014

La contribución "incremental" o "marginal" de una variable explicativa (II)

Supóngase que se efectúa primero la regresión de Y (gasto personal de consumo) sobre X2 (ingreso personal disponible) y se obtiene la siguiente regresión:

Bajo la hipótesis nula 
β1 2 = 0, puede verse que el valor t estimado es de 77.2982 (= 08812/0.0114), el cual obviamente es estadísticamente significativo a los niveles de significancia del 5 o del 1%. Así, X2 afecta significativamente a Y. La tabla ANOVA para la regresión (8.514) está dad en la tabla 8.5.

jueves, 29 de mayo de 2014

La contribución "incremental" o "marginal" de una variable explicativa (I)

Retornar al ejemplo ilustrativo. Se sabe de (8.2.2) que los coeficientes de X2(ingreso) y de X3(tendencia)  son estadísticamente significativos con base en pruebas t separadas. También se ha visto que la línea de regresión obtenida es significativa en si misma con base en la prueba F dada en (8.5.7) o (8.5.13). Ahora supóngase que introducimos X2 y X3 secuencialmente; es decir, se efectúa una primera regresión de Y sobre X2 y se evalúa su significancia y luego se agrega X3 al modelo para encontrar si contribuye de alguna forma (por supuesto, el orden en el cual X2 y X3 ingresan puede ser intercambiado). Por contribución queremos decir si la adición de la variable al modelo incrementa la SEC (y por consiguiente R2) "significativamente" en relación con la SRC. Esta contribución puede ser denominada apropiadamente la contribución incremental, o marginal, de una variable explicativa.

El tema de la contribución incremental es importante en la práctica. En la mayoría de las investigaciones empíricas, e, investigador puede no estar completamente seguro de si se justifica agregar una variable X al modelo, sabiendo que ya se encuentran presentes en el modelo muchas otras variables X. No se desea incluir variable(s) que aumente(n) sustancialmente la SEC. Pero, cómo se decide si una variable X reduce significativamente la SRC? La técnica de análisis de varianza peude fácilmente extenderse para responder a esta pregunta.

miércoles, 28 de mayo de 2014

Prueba de significancia global d una regresión múltiple en términos de R²

Regla de decisión. Para probar la significancia global de una regresión en terminos de R². Pruebe  alternativa pero equivalente a (8.5.7)




martes, 27 de mayo de 2014

Una relación importante entre R² y F (II)

Para el caso de tres variables (8.5.11) se convierte en:


Debido a la estrecha conexión entre F y R², la tabla ANOVA 8.2 puede ser convertida en la tabla 8.4.

PAra el ejemplo ilustrativo, el lector debe verificar que la F de (8.5.12) es 4994, lo cual es aproximadamente igual al valor F de (8.5.6), atribuyendo la diferencia a errores de aproximación. Como antes, el valor F de (8.5.6) es altamante significativo y se puede rechazar la hipótesis nula de que Y no está relacionada linealmente con X2 y X3.

Una ventaja de la prueba F expresada en Términos de R² es su facilidad de cálculo: todo lo que se necesita saber es el valor de R². Por consiguiente, la prueba de significancia global dada F dada en (8.5.7) puede ser expresada en términos de R² como se indica en la tabla 8.4.

lunes, 26 de mayo de 2014

Una relación importante entre R² y F (I)

Existe una relación estrecha entre el coeficiente de determinación R² y la prueba F utilizada en el análisis de varianza. Suponiendo que las perturbaciones ui están normalmente distribuidas y bajo la hipótesis nula de que β2 = β3 = 0, se ha visto que

donde se hace uso de la definición R² = SEC/STC. La ecuación (8.5.11) muestra la forma como F y R² están relacionados. Estos dos varían en relación directa. Cuando R² = 0, F es cero ipso facto. Cuanto mayor sea el R², mayor será el valor F. En el límite, cuando R² = 1, F es infinito. Así la prueba F, que nos mide la significancia global de la regresión estimada, es también una prueba de significancia de R². En otras palabras, la prueba de la hipótesis nula (8.5.9) es equivalente a probar la hipótesis nula de que el R² poblacional es cero.

domingo, 25 de mayo de 2014

Prueba de hipótesis individual versus conjunta

En la sección 8.4 se realizó la prueba de significancia de un coeficiente de regresión simple y en la sección 8.5 se estudió la prueba de significancia conjunta o global de la regresión estimada (es decir, todos los coeficientes de pendiente son simultáneamente iguales a cero). Se reitera que estas prueba son diferentes. Así, con base en la prueba t o intervalo de confianza (de la sección .4), es posible aceptar la hipótesis de que un coeficiente de pendiente particular, βk es cero y aún rechazar la hipótesis conjunta de que todos los coeficientes de pendiente son cero.

La lección que debe prenderse es que el "mensaje" conjunto de los intervalos de confianza individuales, no sustituye una región de confianza conjunta [implicada por la prueba F], en el momento de realizar pruebas de hipótesis conjuntas y realizar afirmaciones de confianza conjuntas.

sábado, 24 de mayo de 2014

Prueba de Significancia Global de una Regresión Múltiple: La Prueba F

Sobra decir que en el caso de tres variables (Y y X2, X3) k es 3 en el caso de cuatro variables k es 4 y así sucesivamente.

A propósito, obsérvese que la mayoría de los paquetes de regresión calculan el valor F (dado en la tabla de análisis de varianza) junto con las estadísticas usuales de regresión, tales como los coeficientes estimados, sus errores estandár, los valores t, etc. Usualmente se supone que la hipótesis nula para el cálculo t es βi = 0.

viernes, 23 de mayo de 2014

El enfoque del análisis de varianza en las pruebas de significancia global de una regresión múltiple observada: prueba F (V)

Si se utiliza el nivel de significancia de 5%, el valor F crítico para 2 y 12 g de l, F0,05(2,12), es 3.89. Obviamente el valor F calculado es significativo y por tanto, se puede rechazar la hipótesis nula. (Si la hipótesis nula fuera verdadera, la probabilidad de obtener un valor F de 5129 es menor que 5 en 100). Si se ha supuesto que el nivel de significancia es 1%, F0.01(2,12) = 6.93. El F calculado aún excede este valor crítico por un gran margen. Aún se rechaza la hipótesis nula; si la hipótesis nula fuera verdadera, la posiblidad de obtener un valor F de 5129 es menor de 1 en 100^9. A propósito, el valor p del F observado es extremadamente pequeño.

Podemos generalizar el anterior procedimiento de prueba F de la siguiente manera


jueves, 22 de mayo de 2014

El enfoque del análisis de varianza en las pruebas de significancia global de una regresión múltiple observada: prueba F (IV)

Por consiguiente, si la hipótesis nula es verdadera, ambas ecuaciones (8.5.4) y (8.5.5) proporcionan estimaciones idénticas del verdadero σ². Esta afirmación no debe sorprender puesto que si existe una relación trivial entre Y y X2 y X3, la única fuente de variación en Y se debe a las fuerzas aleatorias representadas por ui. Sin embargo, si la hipótesis nula es falsa, es decir si X2 y X3 definitivamente ejercen influencia sobre Y, la igualdad entre (8.5.4) y (8.5.5) no se mantendrá. En este caso, la SEC será relativamente más grande que la SRC, teniendo en cuenta sus respectivos g de l. Por consiguiente, el valor F de (8.5.3) proporciona una prueba de la hipótesis nula de que los verdaderos coeficientes de pendientes son simultáneamente cero. Si el valor F calculado de (8.5.3) excede el valor F crítico de la tabla F al nivel de significancia α %, se rechaza Ho: de otra forma no se rechaza. Alternativamente, si el valor p del F observado es suficientemente bajo, se puede rechazar Ho.

Volviendo al ejemplo, se obtiene la tabla 8.3. Utilizando (8.5.3), se obtiene.

F = (32982.5502/6.4308) = 5128.8781 (8.5.6)

miércoles, 21 de mayo de 2014

martes, 20 de mayo de 2014

El enfoque del análisis de varianza en las pruebas de significancia global de una regresión múltiple observada: prueba F (II)

Ahora puede demostrarse que, bajo el supuesto de la distribución normal para ui y la hipótesis nula β2 = β3 = 0, la variable

El enfoque del análisis de varianza en las pruebas de significancia global de una regresión múltiple observada: prueba F (I)

Por las razones recién explicadas, no se puede utilizar la prueba t usual para probar la hipótesis conjunta de que los verdaderos coeficientes de pendientes parciales, sean simultáneamente iguales a cero. Sin embargo, esta hipótesis conjunta puede ser probada por la técnica del análisis de varianza (ANOVA) introducida por primera vez en la sección 5.9, lo cual puede ser demostrado de la siguiente manera:

Recuérdese la identidad.

lunes, 19 de mayo de 2014

Prueba de significancia global de la regresión muestral (II)

Puede la hipótesis conjunta en (8.5.1) ser aprobada al aprobar la significacia de β2 y β3 individualmente como en la sección 8.4? la respuesta es no y el razonamiento es el siguiente:

Al probar la significancia individual de un coeficiente de regresión parcial observado en la sección 8.4, se supuso implícitamente que cada prueba de significancia estaba basada en una muestra diferente (es decir, independiente). Así, en la prueba de significancia de β2 bajo la hipótesis de que β2 = 0, se supuso tácitamente que la prueba estaba basada en una muestra diferente de la utilizada en la prueba de significancia de β3 bajo la hipótesis nula de que β3 =0. Pero para probar la hipótesis conjunta de (8.5.1), si se utilizan los mismos datos muestrales (Tabla 8.1), se estará violando el supuesto existente detrás del procedimiento de pruebas. El asunto puede plantearse en forma diferente: En (8.4.2) se estableció un intervalo de confianza al 95% para β2. Pero si se utilizan los mismos datos muestrales para establecer un intervalo de confianza para β3, es decir, con un coeficiente de confianza del 95%, no podemos asegurar que ambos β2 y β3 se encuentren dentro de sus respectivos intervalos de confianza con una probabilidad de (1-α )(1-α )= (0.95)(0.95).

En otras palabras, aun cuando las afirmaciones

El resultado final del argumento anterior es que para un ejemplo dado (muestra) solamente puede obtenerse un intervalo de confianza o sólo una prueba de significancia, Cómo, entonces, puede probarse la hipótesis nula simúltanea de que β2 = β3 = 0? Enseguida se responde a esta pregunta.

sábado, 17 de mayo de 2014

Prueba de significancia global de la regresión muestral (I)

En la sección anterior se hizo referencia a la prueba de significancia individual de los coeficientes de regresión parcial estimados, es decir, bajo la hipótesis separada de que cada uno de los verdaderos coeficientes de regresión parcial de la población era cero. Pero ahora considérese la siguiente hipótesis:

Ho: β2 = β3 = 0

Esta hipótesis nula es conjunta de que β2 y β3 son iguales a cero en forma cojunta o simultánea. Una prueba de tal hipótesis se denomina prueba de significancia global de la línea de regresión observada o estimada, es decir, si Y está relacionada linealmente con X2 y X3 a la vez.

Puede la hipótesis conjunta en (8.5.1) ser probada al probar la significancia de β2 y β3 individualmente como en la sección 8.4? La respuesta es no y el razonamiento es el el del siguiente post.

viernes, 16 de mayo de 2014

Prueba de Hipótesis sobre coeficientes individuales de regresión parcial (III)

Siguiendo el procedimiento recién descrito, se puede probar la hipótesis sobre otros parámetros del modelo (8.2.1) a partir de la información presentada en la  ecuación (8.2.2). Si, por ejemplo, se supone que α = 0.05 y se postula la hipótesis de que cada uno de los verdaderos coeficientes de regresión parcial individualmente son iguales a cero, entonces, es claro de (8.2.2) que cada coeficiente de regresión parcial estimado es estadísticamente significativo, es decir, significativamente diferente de cero, porque el valor t calculado en cada caso excede el valor t crítico: individualmente se puede rechazar la hipótesis nula (individual).

A propósito, obsérvese que los valores p de los diferentes coeficientes de regresión en (8.2.2) son extremadamente bajos, lo cual sugiere que cada coeficiente de regresión parcial, es estadísticamente significativo a un nivel de significancia mucho más bajo, que los niveles convencionales de 5% o de 1%.

jueves, 15 de mayo de 2014

Prueba de Hipótesis sobre coeficientes individuales de regresión parcial (II)

En el capítulo 5 se vió la estrecha conexión entre la prueba de hipótesis y la estimación de intervalos de confianza. Para el ejemplo, el intervalo de confianza al 95% para β2 es
es decir, β2 se encuentra entre 0.6205 y 0.8327 con un coeficiente de confianza del 95%. Por tanto, si se seleccionan 100 muestras de tamaño 15 y se construyen 100 intervalos de confianza como β2 ± tα/2 ee(β2), se espera que 95 de ellos contengan el verdadero parámetro poblacional β2. Puesto que el valor de cero, postulado bajo la hipótesis nula no se encuentra en el intervalo (8.4.2), se puede rechazar la hipótesis nula de que β2 = 0 con un coeficiente de confianza de 95%. Así mediante la utilización de la prueba de significancia t como en (8.4.1) o con la estimación del intervalo de confianza como en (8.4.2), se llega a la misma conclusión. Pero esto no debe sorprender en vista de la estrecha conexión entre la estimación de intervalos de confianza y las pruebas de hipótesis.

miércoles, 14 de mayo de 2014

Prueba de Hipótesis sobre coeficientes individuales de regresión parcial (I)

Bajo el supuesto de que ui ~ N(0,σ²), entonces, como se anotó en la sección 8.1, se puede utilizar la prueba t para probar una hipótesis sobre cualquier coeficiente de regresión parcial individual. Para ilustrar el procedimiento, considérese el ejemplo númerico. Se postula que

H0: β2 = 0 y H1: β2 ≠ 0

La hipótesis nula establece que, manteniendo X3 constante, el ingreso personal disponible no tiene influencia (lineal) sobre el gasto personal de consumo. Para probar la hipótesis nula, se utiliza la prueba t dada en (8.1.2). Siguiendo el capítulo 5, si el valor de t calculado excede el valor de t crítico al nivel de significancia escogido, podemos rechazar la hipótesis ; de lo contrario, no se puede hacer. Para el ejemplo, utilizando (8.1.2) y advirtiendo que β2 = 0 bajo la hipótesis nula, se obtiene.

t = (0.7266/0.0487) = 14.9060 (8.4.1)

Si se supone α = 0.05, tα/2 =2.179 para 12 g de l. [Nota: Se está utilizando la prueba t de dos colas. [(Por que?)] Puesto que 14.9060, valor de t calculado, excede ampliamente al valor de t crítico 2.179, se puede rechazar la hipótesis nula y decir que β2 es estadísticamente significativo, es decir, significativamente diferente de cero. A propósito, como lo índica (8.2.2), el valor p de obtener un valor t mayor o igual a 14.9060 es en extremo bajo. Gráficamente, la situación se muestra en la figura 8.1.




martes, 13 de mayo de 2014

Prueba de hipótesis en regresión múltiple : Comentarios generales

Una vez fuera del mundo simple del modelo de regresión lineal con dos variables, la prueba de hipótesis adquiere diversas e interesantes formas, tales como las siguientes:


  1. Prueba de hipótesis sobre un coeficiente de regesión parcial individual (sección 8.4)
  2. Prueba de significancia global del modelo de regresión múltiple estimado, es decir, encontrar si todos los coeficientes de pendiente parciales son iguales a cero simultáneamente (sección 8.5)
  3. Prueba de que dos o más coeficientes son iguales a otro (sección 8.6)
  4. Prueba de que los coeficientes de regresión parcial satisfacen ciertas restricciones (sección 8.7)
  5. Prueba de la estabilidad del modelo de regresión estimado a través del tiempo o en diferentes unidades de corte transversal (sección 8.8)
  6. Prueba sobre la forma funcional de los modelos de regresión (sección 8.9)
Puesto que el uso de este tipo de pruebas es tan frecuente en el análisis empírico, dedicamos una sección a cada tipo.

lunes, 12 de mayo de 2014

Relación entre el consumo personal de los Estados Unidos y el Ingreso personal disponible, 1956-1970 (VII)

La interpretación de la ecuación (8.2.2)  es la siguiente: Si X2 y X3 se fijan en cero, el valor promedio o la media del gasto personal de consumo (en donde se refleja tal vez la influencia de todas las variables omitidas) es estimado en aproximadamente 53.16 mil millones de dólares de 1958. como se previno anteriormente, en la mayoría de los casos el término del intercepto no tiene significado económico. El coeficiente de regresión parcial 0.7266 significa que, si se mantienen constantes las demás variables (x3 en el presente caso), a medida que aumenta el ingreso personal, es decir, en US$1, el gasto medio de consumo aumenta en cerca de 73 centavos. Por el mismo procedimiento, si X2 se mantiene constante, se estima que el gasto personal de consumo promedio aumente a la tasa de 2.7 mil millones de dólares por año. El valor R² de 0.9988 indica que las dos variables explicativas explican cerca del 99,9% de la variación, en el gasto personal de consumo en los EStados Unidos durante el período 1956-1970. El R² ajustado indica que, después de considera los g de 1, X2 y X3 aún explican cerca del 99,8% de la variación en Y.


domingo, 11 de mayo de 2014

Relación entre el consumo personal de los Estados Unidos y el Ingreso personal disponible, 1956-1970 (VI)

Como prueba del modelo (8.2.1), se obtuvo la información presentada en la tabla 8.1. La línea de regresión estimada es la siguiente:


donde, al seguir el formato de la ecuación (5.11.1), las cifras en el primer grupo de parántesis son los errores estándar estimados, las del segundo grupo son los valores t, bajo la hipótesis nula de que el coeficiente poblacional relevante tiene un valor de cero y las del tercer grupo son los valores p estimados.

sábado, 10 de mayo de 2014

Relación entre el consumo personal de los Estados Unidos y el Ingreso personal disponible, 1956-1970 (V)

Una nota de precaución

El procedimiento recién descrito para limpiar una serie de tiempo de la tendencia, aun cuando en el trabajo aplicado es comúnmente utilizado, ha venido a ser objeto de análisis crítico por parte de los teorícos del análisis de series de tiempo. Como lo analizaremos en los capítulos sobre análisis de series de tiempo, el procedimiento de eliminación de tendencias recién descrito en (3) puede ser apropiado si una serie de tiempo presenta una tendencia determinística y no a una tendencia estocástica (o variable). En estos capítulos, se delimitarán los métodos utilizados, para determinar si una serie de tiempo particular presenta una tendencia determinística o estocástica.


viernes, 9 de mayo de 2014

Relación entre el consumo personal de los Estados Unidos y el Ingreso personal disponible, 1956-1970 (IV)

3. Otra razón para introducir la variable de tendencia es para evitar el problema de correlación espuria. La información relacionada con series de tiempo económicas, tales como el GPC y el IPD en la regresión (8.2.1), frecuentemente tienden a moverse en la misma dirección, reflejando una propensión creciente o decreciente. Por consiguiente, si se fuera a efectuar la regresión e GPC sobre IPD y obtener un valor R² elevado, este valor elevado puede no reflejar la verdadera asociación entre GPS e IP; puede reflejar simplemente la inclinación común  presente en ellas. Para evitar dicha asociación espuria entre series de tiempo económicas se puede proceder en algunas de las dos siguientes maneras: Suponiendo que las series de tiempo presentan una tendencia lineal, se puede introducir el tiempo, o variable de tendencia explícitamente en el modelo, como en la ecuación (8.2.1)^2. Como resultado, β2 en (8.2.1) refleja ahora la verdadera asociación entre GPC e IPD, es decir, la asociación neta del efecto de tiempo (lineal) recuérdese la definición del coeficiente de regresión parcial).

Alternativamente, se puede eliminar el efecto de tendencia de Y (GPC) y de X2 (IPD) y efectuar la regresión de sobre Y y X2 libres de tendencia. Suponiendo nuevamente una tendencia de tiempo lineal, la eliminación del efecto de tendencia puede realizarse mediante el procedimiento de tres etapas analizado el capitulo 7. Primero se efectúa la regresión de Y sobre X3(tiempo) y se obtienen los residuos de esta regresión, û1t. Segundo, se efectúa la regresión de X2 sobre X3 y se obtienen los residuos de esta regresión, û2t. Finalmente, se efectúa la resgresión de û1t sobre û2t, los cuales están libres de la influencia (lineal) del tiempo. El coeficiente de pendiente en esta regresión reflejara la verdadera asociación entre Y y X2 y deberá por consiguiente ser igual a β2 (véase el ejercicio 8.7) Desde el punto de vista computacional, el primer método es más económico que el último.

jueves, 8 de mayo de 2014

Relación entre el consumo personal de los Estados Unidos y el Ingreso personal disponible, 1956-1970 (III)

2. Muchas veces la variable tendencia es un sustituto de una variable básica que afecta Y. Pero esta variable básica puede no ser directamente observable o, de serlo, puede suceder que su información no esté disponible o sea díficil de obtener. Por ejemplo, en la teoría de producción la tecnología es una de estas variables. Se puede sentir el impacto de la tecnología, pero no saber cómo medirla. Por consiguiente, puede ser "conveniente" suponer que la tecnología es alguna función del tiempo medido cronólogicamente. En algunas situaciones puede creerse que una variable, que afecta a Y, y que puede ser medida, está tan estrechamente relacionada con el tiempo que es más fácil (al menos en términos de costo), introducir la variable tiempo que la misma variable básica. Por ejemplo, en (8.2.1), el tiempo X3 puede representar muy bien la población. El GPC agregado aumenta a medida que la población aumenta y la población puede estar muy bien relacionada (linealmente) de alguna forma con el tiempo.


miércoles, 7 de mayo de 2014

Relación entre el consumo personal de los Estados Unidos y el Ingreso personal disponible, 1956-1970 (II)

1. El interés puede ser simplemente encontrar la forma como se comporta la variable dependiente a través del tiempo. Por ejemplo, frecuentemente se llevan a cabo gráficas mostrando, por ejemplo, el comportamiento del PNB, el empleo, el desempleo, los precios de las acciones, etc, durante diversos períodos de tiempo. Una mirada a tales gráficas puede revelar si el movimiento general de las series de tiempo, bajo consideración es hacia arriba (tendencia hacia arriba), hacia abajo (tendencia hacia abajo) o no muestra tendencia (es decir, no se observa un patrón distinguible). En un análisis de este tipo, se puede no estar interesados en las causas detrás de la tendencia hacia arriba o hacia abajo; el objetivo puede ser simplemente describir la información en el tiempo.

martes, 6 de mayo de 2014

Relación entre el consumo personal de los Estados Unidos y el Ingreso personal disponible, 1956-1970 (I)

Supóngase que se desea estudiar el comportamiento el gasto de consumo personal en los Estados Unidos durante los últimos años. Con este fin, se utiliza el siguiente modelo simple:

E(Y︱X2,X3) = β1 + β2X2i + β3X3i

donde Y = gasto personal de consumo (GPC)
X2 = ingreso del personal disponible (después de impuestos) (IPD)
X3 = tiempo medido en años.

La ecuación (3.2.1) postula que el GPC está relacionado linealmente con el IPD y con el tiempo o variable de tendencia. En la mayoría de los análisis de regresión múltiple que consideran series de tiempo es común la práctica de introducir la variable tiempo o variable de tendencia adicionalmente a otras variables explicativas por las siguientes razones.

lunes, 5 de mayo de 2014

Una vez más, el supuesto de normalidad (II)

Obsérvese que los g de l son ahora n-3 porque, al calcular Σui² y, por consiguiente, σ², se necesita primero estimar los tres coeficientes de regresión parcial, lo cual impone por lo tanto tres restricciones sobre la suma de residuos al cuadrado (SRC) (siguiendo esta lógica, en el caso de cuatro variables habrá n-4 g de l, y así sucesivamente). Por consiguiente, la distribución t puede ser utilizada para establecer intervalos de confianza y para probar hipótesis estadísticas sobre los verdaderos coeficientes de regresión parcial poblacionales. Similarmente, la distribución X² puede ser utilizada para probar hipótesis sobre el verdadero σ². Para demostrar el mecanismo real, se utiliza el siguiente ejemplo ilustrativo.

domingo, 4 de mayo de 2014

Una vez más, el supuesto de normalidad (I)

Como ya se sabe si el único objetivo es la estimación puntual de los parámetros de los modelos de regresión, será suficiente el método de mínimos cuadrados ordinarios (MCO), el cual no hace supuestos sobre la distribución de probabilidad de las perturbaciones ui. Pero si el objetivo no sólo es la estimación sino además la inferencia, entonces, como se discutió en los capítulos 4 y 5, se debe  suponer que las ui siguen alguna distribución de probabilidad.

Por las razones ya expresadas, se supuso que las ui segían la distribución normal con media cero y varianza constante σ². Se mantiene el mismo supuesto para los modelos de regresión múltiple. con el supuesto de normalidad y continuando la discusión de los capítulos 4 y 7, se halla que los estimadores MCO de los coeficientes de regresión parcial, los cuales son idénticos a los estimadores de máxima verosimilitud (MV), son los mejores estimadores lineales insesgados (MELI). Además, los estimadores β2, β3 y β1, están ellos mismos, normalmente distribuidos con medias iguales a los verdaderos β2, β3 y β1 y con las varianzas dadas en el capítulo 7. Además, (n-3)σ²/σ² sigue una distribución X² con n-3 g de l, y los tres estimadores MCO están distribuidos independientemente de σ². Las pruebas son similares a las del caso de dos variables estudiado en el apéndice 3. Como resultado y siguiendo el capítulo 5, se puede demostrar que, al reemplazar σ² por su estimador insesgado σ² en el cálculo de los errores estándar, cada una de las variables.
sigue la distribución t con n-3 g de l

sábado, 3 de mayo de 2014

Análisis de regresión múltiple: Problema de inferencia

En este capítulo, continuación del número 5, se amplían las ideas sobre estimación de intervalos y pruebas de hipótesis, allí desarrolladas a modelos que contienen tres o más variables. Aunque en muchas formas los conceptos desarrollados en el capítulo 5 pueden ser aplicados directamente el modelo de regresión múltiple, estos modelos poseen algunas características adicionales que les son únicas y por tanto recibirán más atención.

viernes, 2 de mayo de 2014

Resumen y Conclusiones Análisis de Regresión Múltiple - Problema de Estimación (II)

4. Aun cuando el R² y el R² ajustado son medidas globales que indican la forma como el modelo escogido  se ajusta a un conjunto dado de datos, su importancia no debe ser exagerada. Los aspectos críticos son las expectativas teóricas en las cuales se basa el modelo en términos de los signos a priori de los coeficientes de las variables incluidas en el modelo y, como se muestra en el siguiente capítulo, su significancia estadística.

5. Los resultados presentados en este capítulo pueden ser facílmente generalizados a un modelo de regresión líneal múltiple que involucre cualquier número de regresores. Pero el álgebra se vuelve tediosa. Este tedio puede ser evitado recurriendo al álgebra matricial. Para el lector interesado, la extensión al modelo de regresión e k variables utilizando álgebra matricial se presenta en el capítulo 9 opcional. Pero el lector general puede leer el resto del blog sin conocer mucho de álgebra matricial.


jueves, 1 de mayo de 2014

Resumen y Conclusiones Análisis de Regresión Múltiple - Problema de Estimación (I)


  1. En este capítulo se introdujo el modelo más simple posible de regresión líneal múltiple a saber, el modelo de regresión con tres variables. Se entiende que el término lineal se refiere a linealidad en los parámetros y no necesariamente en variables.
  2. Aunque el modelo de regresión con tres variables es, en muchas formas una extensión del modelo con dos variables, hay algunos conceptos nuevos involucrados, tales como coeficientes de regresión parcial, coeficientes de correlación parcial, coeficientes de correlación múltiple, R² ajustado y no ajustado (por grados de libertad) multicolinealidad y sesgo de especificación.
  3. En este capítulo se consideró también la forma funcional del modelo de regresión múltiple, tal como la función de producción de Cobb-Douglas y el modelo de regresión polinomial.