donde Oi = frecuencia observada en la clase o intervalo i y Ei = la frecuencia esperada en la clase i con base en la distribución hipotética, es decir, la normal. Ahora, si la diferencia entre las frecuencias observada y esperada es "pequeña", esto sugiere que las perturbaciones ui probablemente provienen de la distribución de probabilidad hipotética. Por otra parte, si la discrepancia entre las frecuecias observada y esperada es "grande", podemos rechazar la hipótesis nula de que las perturbaciones provienen, de la distribución de probabilidad hipotética.Por esta razón, el estadístico dado en (5.12.1) es llamado una medida de bondad de ajuste, ya que nos dice qué tan bien se ajusta la distribución de probabilidad hipotética a los datos observados, es decir es el ajuste bueno?.
Qué tan "grande" o "pequeño" debe ser el valor de X² dado en (5.12.1) para hacernos decidir en contra o a favor de la hipótesis nula, es decir, rechazarla o no? Puede mostrarse que si el tamaño de la muestra es razonablemente grande, el estadístico X² dado en (5.12.1) presenta aproximadamente la distribución Ji cuadrado (X²) con (N-1) g de l, donde N es el número de clases o de grupo. Se pierde un grado de libertad debido a la restricción de que el número total de frecuencias observadas y esperadas debe ser el mismo.
Busca en el Blog
martes, 31 de diciembre de 2013
lunes, 30 de diciembre de 2013
Prueba de Bondad de Ajuste Ji Cuadrado(X²) (II)
La fila titulada como residuales observados de la distribución de frecuencia de los residuales para desviaciones estándar específicas por debajo y por encima de cero. En el ejemplo no hay residuales a una distancia de 2 desviaciones estándar por debajo de cero, hay 2 residuales entre 1 y 2 desviaciones estándar por debajo de cero, hay 3 residuales entre 0 y 1 desviaciones estándar por debajo de cero, hay 4 residuales entre 0 y 1 desviación estándar por encima de cero hay 1 residual entre 1 y 2 desviaciones estándar por encima de cero y no hay residuales más allá de 2 desviaciones estándar por encima de cero.
De la fila de residuos esperados se obtiene la distribución de frecuencia de los residuos con base en una distribución de probabilidad hipotética, norma en este caso. En la tercera fila se calcula la diferencia entre las frecuencias observadas y esperadas, se eleva al cuadrado la diferencia, se divide por la frecuencia esperada y se suman. Algebraicamente, se tiene
De la fila de residuos esperados se obtiene la distribución de frecuencia de los residuos con base en una distribución de probabilidad hipotética, norma en este caso. En la tercera fila se calcula la diferencia entre las frecuencias observadas y esperadas, se eleva al cuadrado la diferencia, se divide por la frecuencia esperada y se suman. Algebraicamente, se tiene
domingo, 29 de diciembre de 2013
Prueba de Bondad de Ajuste Ji Cuadrado(X²) (I)
Esta prueba se realiza de la siguiente forma: Primero se corre la regresión, se obtienen los residuales, ui y se calcula la desviación estándar muestral de ûi. Entonces se ordenan los residuales por rango y se ubican en diversos grupos (en el ejemplo, se han ubicado en seis grupos) correspondientes al número de desviaciones estándar desde cero, Para el ejemplo, se obtienen los siguientes datos, para su análisis.
sábado, 28 de diciembre de 2013
Prueba de normalidad
Aunque se han estudiado diversas pruebas de normalidad en la teoría, solamente se considerarán dos: (1) la prueba de bondad de ajuste ji cuadrado (2) la prueba de Jarque-Bera. Ambas pruebas utilizan los resuduaes ûi y la distribución de probabilidad ji-cuadrado.
viernes, 27 de diciembre de 2013
Evaluación de resultados del análisis de regresión
En la figura 1.4 de la introducción se esboza la anatomía de la elaboración de modelos econométricos. Ahora que se han presentado los resultados del análisis de regresión de nuestro ejemplo consumo ingreso en (5.11.1), nos gustaría cuestionar la bondad del modelo ajustado. Qué tan "bueno" es el modelo ajustado? Se necesita algún criterio para poder responder a esta pregunta.
Primero. Están los signos de los coeficientes estimados de acuerdo con las expectativas teóricas o previas? A priori, la propensión marginal a consumir (PMC) en la función consumo β2, debe ser positiva. En el presente ejemplo, lo es. Segundo, si la teoría dice que la relación no debe ser solamente positiva sino también estadísticamente significativa. Es este el caso en la presente aplicación? Como lo analizamos en la sección 5.11, la PMC no sólo es positiva sino también estadísticamente significativa, es decir, diferente de cero; el valor p del valor t estimado es extremadamente pequeño. Los mismos comentarios son aplicables al coeficiente del intercepto. Tercero, Qué tan bien explica el modelo de regresión la variación en el gasto de consumo? se puede utilizar r² para responder esta pregunta. En el ejemplo presente r² es alrededor de 0.96, el cual es un valor muy alto considerando que r² puede ser como máximo 1.
Por tanto, el modelo que se ha escogido para explicar el comportamiento de gasto de consumo parece muy bueno. Pero antes de comprometerse con él, sería interesante averiguar si el modelo satisface los supuestos del MCRLN. No se mirarán, ahora los diversos supuestos pues la simplicidad del modelo es clara. Solo hay un supuestos que podría verificar, a saber, el de normalidad del término de perturbación, ui. Recuérdese que las pruebas t y F utilizadas antes requieren que el término de error siga una distribución normal. De lo contrario, el procedimiento de prueba no será válido en muestras pequeñas, o finitas.
Primero. Están los signos de los coeficientes estimados de acuerdo con las expectativas teóricas o previas? A priori, la propensión marginal a consumir (PMC) en la función consumo β2, debe ser positiva. En el presente ejemplo, lo es. Segundo, si la teoría dice que la relación no debe ser solamente positiva sino también estadísticamente significativa. Es este el caso en la presente aplicación? Como lo analizamos en la sección 5.11, la PMC no sólo es positiva sino también estadísticamente significativa, es decir, diferente de cero; el valor p del valor t estimado es extremadamente pequeño. Los mismos comentarios son aplicables al coeficiente del intercepto. Tercero, Qué tan bien explica el modelo de regresión la variación en el gasto de consumo? se puede utilizar r² para responder esta pregunta. En el ejemplo presente r² es alrededor de 0.96, el cual es un valor muy alto considerando que r² puede ser como máximo 1.
Por tanto, el modelo que se ha escogido para explicar el comportamiento de gasto de consumo parece muy bueno. Pero antes de comprometerse con él, sería interesante averiguar si el modelo satisface los supuestos del MCRLN. No se mirarán, ahora los diversos supuestos pues la simplicidad del modelo es clara. Solo hay un supuestos que podría verificar, a saber, el de normalidad del término de perturbación, ui. Recuérdese que las pruebas t y F utilizadas antes requieren que el término de error siga una distribución normal. De lo contrario, el procedimiento de prueba no será válido en muestras pequeñas, o finitas.
jueves, 26 de diciembre de 2013
Informe de resultados del análisis de regresión (II)
Al presentar los valores p de los coeficientes t estimados, se puede ver inmediatamente el nivel exacto de significancia de cada valor t estimado. Así, bajo la hipótesis nula de que el verdadero valor del intercepto poblacional es cero, la probabilidad exacta (es decir, el valor p) de obtener un valor t mayor o igual a 3.8128 es apenas de 0.0026. Por consiguiente, si rechazamos esta hipótesis nula, la probabilidad de que se cometa un error tipo 1 es de cerca de 26 en 10,000 en efecto una probabilidad muy baja. Para todo fin práctico, se puede decir que el verdadero intercepto poblacional es diferente de cero. De igual forma, el valor p del coeficiente de la pendiente estimado es cero para cualquier fin práctico. Si la verdadera PMC fuera de hecho cero, la posibilidad de obtener una PMC de 0.5091 sería prácticamente cero. Por lo cual se puede rechazar la hipótesis nula de que la verdadera PMC es cero.
En el teorema 4.7 se muestra la conexión entre los estadisticas F y t, a saber, F(1,k) = t²k Bajo la hipótesis nula de que el verdadero β2 = 0, (5.11.1)muestra que el valor F es 202.87 (para 1 g de l en el numerador y 8 g de l en el denominador) y el valor t es cercano a 14.24 (8 g de l); como se esperaba, el primer valor es igual al último valor elevado al cuadrado, salvo por errores de aproximación. La tabla ANOVA para este problema ya ha sido analizada.
En el teorema 4.7 se muestra la conexión entre los estadisticas F y t, a saber, F(1,k) = t²k Bajo la hipótesis nula de que el verdadero β2 = 0, (5.11.1)muestra que el valor F es 202.87 (para 1 g de l en el numerador y 8 g de l en el denominador) y el valor t es cercano a 14.24 (8 g de l); como se esperaba, el primer valor es igual al último valor elevado al cuadrado, salvo por errores de aproximación. La tabla ANOVA para este problema ya ha sido analizada.
Etiquetas:
Regresión con dos variables
miércoles, 25 de diciembre de 2013
Informe de resultados del análisis de regresión (I)
Existen diversas formas de presentar los resultados de un análisis de regresión, sin embargo, en este texto se utilizará el siguiente formato, empleando el ejemplo consumo-ingreso del capítulo 3 a manera de ilustración.
En la ecuación (5.11.1), las cifras en el primer conjunto de paréntsis son los errores estándar estimados de los coeficientes de regresión, las cifras del segundo conjunto son los valores t estimados calculados de (5.3.2) bajo la hipótesis nula de que el verdadero valor poblacional de cada coeficiente de regresión individual es cero (es decir, 3.8128 = 24.4545 + 6.4138), y las cifras en el tercer grupo son los valores p o "p-values" estimados. Por tanto, para 8 g de l la probabilidad de obtener un valor t mayor o igual a 3.8128 es 0.0026 y la probabilidad de obtener un valor t mayor o igual a de 14.2405 es alderededor de 0.00000003.
En la ecuación (5.11.1), las cifras en el primer conjunto de paréntsis son los errores estándar estimados de los coeficientes de regresión, las cifras del segundo conjunto son los valores t estimados calculados de (5.3.2) bajo la hipótesis nula de que el verdadero valor poblacional de cada coeficiente de regresión individual es cero (es decir, 3.8128 = 24.4545 + 6.4138), y las cifras en el tercer grupo son los valores p o "p-values" estimados. Por tanto, para 8 g de l la probabilidad de obtener un valor t mayor o igual a 3.8128 es 0.0026 y la probabilidad de obtener un valor t mayor o igual a de 14.2405 es alderededor de 0.00000003.
martes, 24 de diciembre de 2013
Predicción individual (II)
Comparando este intervalo con (5.10.5), se ve que el intervalo de confianza para el Yo individual es más amplio que el intervalo para el valor medio de Yo. (Por qué?) Calculando los intervalos de confianza como en (5.10.7) condicionales a los valores de X dados en la tabla 3.2, se obtiene la banda de confianza al 95% para los valores individuales Y correspondientes a estos valores de X.
Esta banda de confianza, al igual que la banda de confianza para Yo asociadas con los mosmos X,se muestran en la figura 5.6
Nótese una caraterística importante de las bandas de confianza que se muestran en la figura 5.6. La amplitud más pequeña de estas bandas se presenta cuando Xo = X. Por qué? Sin embargo, ésta aumenta considerablemente a medida que Xo se aleja de X. Por qué? Este cambio sugeriría que la capacidad de predicción de la línea de regresión muestral histórica decrece a medida que Xo se aleja progresivamente de X. Por consiguiente, se debe ser cauteloso al "extrapolar la línea" de regresión histórica para predecir E(Y|Xo) o Yo asociado con una Xo dado, que está muy alejado de la medida muestral X.
Esta banda de confianza, al igual que la banda de confianza para Yo asociadas con los mosmos X,se muestran en la figura 5.6
Nótese una caraterística importante de las bandas de confianza que se muestran en la figura 5.6. La amplitud más pequeña de estas bandas se presenta cuando Xo = X. Por qué? Sin embargo, ésta aumenta considerablemente a medida que Xo se aleja de X. Por qué? Este cambio sugeriría que la capacidad de predicción de la línea de regresión muestral histórica decrece a medida que Xo se aleja progresivamente de X. Por consiguiente, se debe ser cauteloso al "extrapolar la línea" de regresión histórica para predecir E(Y|Xo) o Yo asociado con una Xo dado, que está muy alejado de la medida muestral X.
Etiquetas:
Regresión con dos variables
lunes, 23 de diciembre de 2013
Predicción individual (I)
Si nuestro interés está en predecir un valor individual Y, Yo correspondiente a un valor dado X, digamos, Xo, entonces, como se muestra en el apendice, el mejor estimador lineal insesgado de Yo está dado también por (5.10.1) pero su varianza es la siguiente.
Puede demostrarse además que Yo también sigue una distribución normal con media y varianza dadas por (5.10.1) y (5.10.6), respectivamente. Sustituyendo σ² desconocido por σ², se cumple que
también sigue una distribución t. Por consiguiente, la distribución t puede utilizarse para hacer inferencia sobre el verdadero Yo. Al continuar con nuestro ejemplo consumo-ingreso, se ve que la predicción puntual de Yo es 75.3645, igual a Yo y su varianza es 52.6349 (el lector debe verificar con cálculo). Por consiguiente, el intervalo de confianza al 95% para Yo correspondiente a Xo = 100 es
Puede demostrarse además que Yo también sigue una distribución normal con media y varianza dadas por (5.10.1) y (5.10.6), respectivamente. Sustituyendo σ² desconocido por σ², se cumple que
también sigue una distribución t. Por consiguiente, la distribución t puede utilizarse para hacer inferencia sobre el verdadero Yo. Al continuar con nuestro ejemplo consumo-ingreso, se ve que la predicción puntual de Yo es 75.3645, igual a Yo y su varianza es 52.6349 (el lector debe verificar con cálculo). Por consiguiente, el intervalo de confianza al 95% para Yo correspondiente a Xo = 100 es
Etiquetas:
Regresión con dos variables
domingo, 22 de diciembre de 2013
Predicción Media (II)
Por tanto, dada Xo = 100, en muestreo repetido, en 95 de cada 100 intervalos como (5.10.5) estará incluido el verdadero valor medio; la mejor estimación del verdadero valor medio es, por supuesto, la estimación puntual 75.3645.
Si se obtienen intervalos de confianza al 95% como (5.10.5) para cada uno de los valores de X dados en la tabla 3.2, se obtiene lo que se conoce como el intervalo de confianza, o banda de confianza, para la función de regresión poblacional, que se presenta en la figura 5.6
Si se obtienen intervalos de confianza al 95% como (5.10.5) para cada uno de los valores de X dados en la tabla 3.2, se obtiene lo que se conoce como el intervalo de confianza, o banda de confianza, para la función de regresión poblacional, que se presenta en la figura 5.6
Etiquetas:
Regresión con dos variables
sábado, 21 de diciembre de 2013
Predicción Media (I)
Al reemplazar σ² desconocido por su estimador insesgado σ², se cumple que la variable.
sigue una distrubición t con n-2 g de l. La distribución t puede ser utilizada por consiguiente para construir intervalos de confianza para el verdadero E(Yo|Xo) y para hacer pruebas de hipótesis acerca de tal valor de manera usual, a saber.
sigue una distrubición t con n-2 g de l. La distribución t puede ser utilizada por consiguiente para construir intervalos de confianza para el verdadero E(Yo|Xo) y para hacer pruebas de hipótesis acerca de tal valor de manera usual, a saber.
Etiquetas:
Regresión con dos variables
viernes, 20 de diciembre de 2013
Predicción Media
Para obtener las ideas, supóngase que Xo=100 y se desea predecir E(Y|Xo =100). Ahora, puede demostrarse que la regresión historica (3.6.2) proporciona la estimación puntual de esta predicción media de la siguiente forma:
donde Yo = estimador de E(Y|Xo). Puede demostrarse que este predictor puntual es el mejor estimador lineal e insesgado (MELI)
Puesto que Yo es un estimador, es probable que éste sea diferente de su verdadero valor. La diferencia entre los dos valores dará alguna idea sobre el error de predicción o de pronostico. Para evaluar este error, es necesario encontrar la distribución muestral de Yo. En el apéndice 5A, sección 5A.3, se demuestra que en la ecuación (5.10.1), Yo está normalmente distribuida con media (β1 + β2Xo) y con varianza dada por la siguiente fórmula:
donde Yo = estimador de E(Y|Xo). Puede demostrarse que este predictor puntual es el mejor estimador lineal e insesgado (MELI)
Puesto que Yo es un estimador, es probable que éste sea diferente de su verdadero valor. La diferencia entre los dos valores dará alguna idea sobre el error de predicción o de pronostico. Para evaluar este error, es necesario encontrar la distribución muestral de Yo. En el apéndice 5A, sección 5A.3, se demuestra que en la ecuación (5.10.1), Yo está normalmente distribuida con media (β1 + β2Xo) y con varianza dada por la siguiente fórmula:
jueves, 19 de diciembre de 2013
Aplicación del análisis de regresión: Problema de Predicción
Con base en los datos muestrales de la tabla 3.2, se obtuvo la siguiente regresión muestral.
Yi = 24.4545 + 0.5091Xi
donde Yt es el estimador del verdadero E(Yi) correspondiente a X dado. Qué uso se puede dar a esta regresión histórica? Un uso es "predecir" o "pronosticar" el gasto de consumo futuro Y correspondiente a algún nivel dado de ingreso X. Ahora, hay dos clases de predicciones: (1) la predicción del valor de la media condicional de Y correspondiente a un valor escogido X, por ejemplo Xo, que es el punto sobre la línea de regresión poblacional misma y (2) predicción de un valor individual Y correspondiente a Xo. Se llamarán estas dos predicciones la predicción media y la predicción individual.
Yi = 24.4545 + 0.5091Xi
donde Yt es el estimador del verdadero E(Yi) correspondiente a X dado. Qué uso se puede dar a esta regresión histórica? Un uso es "predecir" o "pronosticar" el gasto de consumo futuro Y correspondiente a algún nivel dado de ingreso X. Ahora, hay dos clases de predicciones: (1) la predicción del valor de la media condicional de Y correspondiente a un valor escogido X, por ejemplo Xo, que es el punto sobre la línea de regresión poblacional misma y (2) predicción de un valor individual Y correspondiente a Xo. Se llamarán estas dos predicciones la predicción media y la predicción individual.
miércoles, 18 de diciembre de 2013
Análisis de regresión y análisis de varianza (V)
Recuérdese el teorema 4.7 de la sección 4.5, que plantea que el cuadrado del valort con k g de l es un valor F con un g de l en el numerador y k g de l en el denominador. Para el ejemplo consumo ingreso, si se supone Ho: β2 = 0, entonces de (5.3.2) puede verificarse fácilmente que el valor t estimado es 14.24. Este valor t tiene 8 g de l. Bajo la misma hipótesis nula, el valor F er 202.87 con 1 y 8 gde l. De donde (14.24)^2 = valor F, excepto por errores de aproximación.
Así, las pruebas t y F proporcionan dos formas alternas, pero complementarias, de probar la hipótesis nula que β2 = 0. Si este es el caso, por qué no simplemente confiar en la prueba t y no preocuparse por la prueba F y por el análisis de varianza que lo acompaña? Para el modelo de dos variables, realmente no hay necesidad de recurrir a la prueba F. Pero cuando se considere el tema de la regresión múltiple, se verá que la prueba F tiene diversas aplicaciones interesantes que hacen que sea un método muy útil y poderoso de demostrar hipótesis estadísticas.
Así, las pruebas t y F proporcionan dos formas alternas, pero complementarias, de probar la hipótesis nula que β2 = 0. Si este es el caso, por qué no simplemente confiar en la prueba t y no preocuparse por la prueba F y por el análisis de varianza que lo acompaña? Para el modelo de dos variables, realmente no hay necesidad de recurrir a la prueba F. Pero cuando se considere el tema de la regresión múltiple, se verá que la prueba F tiene diversas aplicaciones interesantes que hacen que sea un método muy útil y poderoso de demostrar hipótesis estadísticas.
martes, 17 de diciembre de 2013
Análisis de regresión y análisis de varianza (IV)
(Obsérvese que β2 y σ^2 al lado derecho de estas ecuaciones son los verdaderos parámetros). Por consiguiente, si β2, es en realidad cero,ambas ecuaciones (5.9.2) y (5.9.3) proporcionan estimaciones idénticas del verdadero σ^2. En esta situación, la variable explicativa X no tiene influencia lineal alguna sobre Y y toda la variación en Y es explicada por las perturbaciones aleatorias ui. De otra parte si, β2 es diferente de cero, (5.9.2) y (5.9.3) serán diferentes y parte de la variación en Y se atribuirá a X. Por consiguiente, la razón F de (5.9.1) constituye una prueba sobre la hipótesis nula Ho:β2 = 0. Puesto que todas las cantidades que hacen parte de esta ecuación pueden ser obtenidas a partir de la muestra disponible, esta razón F constituye un estadístico de prueba para verificar la hipótesis nula de que el verdadero β2 es igual a cero. Todo lo que debe hacerse es calcular la razón F y compararla con el valor crítico F obtenida de la tabla F al nivel de significancia seleccionado, u obtener el valor p del estadístico F calculado.
A manera de ilustración, se continúa con el ejemplo consumo-ingreso. La tabla ANOVA para este ejemplo se presenta en la Tabla 5.4. El valor F calculado es 202.87. El valor p de este estadístico F correspondiente a 1 y 8 g de l no puede se obtenido de la tabla F dada en el apéndice D pero, utilizando las tablas estadísticas electrónicas puede demostrarse que el valor p es 0.0000001, en efecto una probabilidad muy pequeña. Si se decide escoger el enfoque de nivel de significancia para la prueba de hipótesis y fijar α en 0.01, o en un nivel del 1%, se puede ver que la F calculada de 202.87 es obviamente significativa a ese nivel. Por consiguiente, si se rechaza la hipótesis nula de que β2 =0, la probabilidad de cometer un error tipo 1 es muy pequeña. Para todos los fines prácticos, la muestra no puedo haber provenido de una población con un valor β2 igual a cero y se puede concluir con gran confianza que X, el ingreso, afecta Y, el gasto de consumo.
A manera de ilustración, se continúa con el ejemplo consumo-ingreso. La tabla ANOVA para este ejemplo se presenta en la Tabla 5.4. El valor F calculado es 202.87. El valor p de este estadístico F correspondiente a 1 y 8 g de l no puede se obtenido de la tabla F dada en el apéndice D pero, utilizando las tablas estadísticas electrónicas puede demostrarse que el valor p es 0.0000001, en efecto una probabilidad muy pequeña. Si se decide escoger el enfoque de nivel de significancia para la prueba de hipótesis y fijar α en 0.01, o en un nivel del 1%, se puede ver que la F calculada de 202.87 es obviamente significativa a ese nivel. Por consiguiente, si se rechaza la hipótesis nula de que β2 =0, la probabilidad de cometer un error tipo 1 es muy pequeña. Para todos los fines prácticos, la muestra no puedo haber provenido de una población con un valor β2 igual a cero y se puede concluir con gran confianza que X, el ingreso, afecta Y, el gasto de consumo.
lunes, 16 de diciembre de 2013
Análisis de regresión y análisis de varianza (III)
Si se supone que las perturbaciones ui están normalmente distribuidas y H0: β2=0, puede demostrarse que la F de (5.9.1) satisface las condiciones del teorema 4.6 (sección 4.5) y, por consiguiente presenta la distribución F con 1 y n-2 g de l.
Qué uso puede hacerse de la razón F anterior? Puede demostrarse que
Qué uso puede hacerse de la razón F anterior? Puede demostrarse que
domingo, 15 de diciembre de 2013
Análisis de regresión y análisis de varianza (II)
Reorganícemos la sumas de cuadrados y sus g de l asociadas en la tabla 5.3, que es la forma estándar de la tabla AOV, denominada algunas veces la tabla ANOVA. Dada la información de la tabla 5.3, considérese ahora la siguiente variable:
sábado, 14 de diciembre de 2013
Análisis de regresión y análisis de varianza (I)
En esta sección se estudiará el análisis de regresión desde el punto de vista del análisis de varianza y se introducirá al lector hacia una forma complementaria de mirar el problema de la inferencia estadística.
En el capítulo 3, sección 3.5, se desarrolló la siguiente identidad
es decir, STC = SEC + SRC, la cual descompone la suma total de cuadrados (STC) en dos componentes: la suma explicada de cuadrados (SEC) y al suma de residuales al cuadrado (SRC). Un estudio de estos componentes de STC se conoce como el análisis de varianza (ANOVA) desde el punto de vista de la regresión.
Asociado con toda suma de cuadrados están sus g de l, es decir, el número de observaciones independientes sobre las cuales está basada. La STC tiene n-1 g de l porque se pierde 1 g de l en el cálculo de la media muestral Y. La SRC tiene n-2 g de l.(Por qué) (Nota: Esto es cierto solamente para el modelo de regresión con dos variables con presencia del intercepto β1). SEC tiene 1 g de l (de nuevo, esto es cierto solamente para el caso de dos variables), lo cual se deduce del hecho de que SEC = B2^2Σx²i es una función β2 ólo si Σx²i es conocida.
En el capítulo 3, sección 3.5, se desarrolló la siguiente identidad
es decir, STC = SEC + SRC, la cual descompone la suma total de cuadrados (STC) en dos componentes: la suma explicada de cuadrados (SEC) y al suma de residuales al cuadrado (SRC). Un estudio de estos componentes de STC se conoce como el análisis de varianza (ANOVA) desde el punto de vista de la regresión.
Asociado con toda suma de cuadrados están sus g de l, es decir, el número de observaciones independientes sobre las cuales está basada. La STC tiene n-1 g de l porque se pierde 1 g de l en el cálculo de la media muestral Y. La SRC tiene n-2 g de l.(Por qué) (Nota: Esto es cierto solamente para el modelo de regresión con dos variables con presencia del intercepto β1). SEC tiene 1 g de l (de nuevo, esto es cierto solamente para el caso de dos variables), lo cual se deduce del hecho de que SEC = B2^2Σx²i es una función β2 ólo si Σx²i es conocida.
viernes, 13 de diciembre de 2013
Selección entre los enfoques del intervalo de confianza y la prueba de significancia en la prueba de hipótesis
En la mayor parte de los análisis económicos aplicados, la hipótesis nula postulada hace las vece de comodín, y el objetivo del trabajo empírico es tumbarlo, es decir, rechazar la hipótesis nula. Por tanto, en nuestro ejemplo consumo-ingreso, la hipótesis nula de que la PMC, β2 = 0 es claramente absurda, pero con frecuencia la utilizamos para ejempleficar los resultados empíricos. Parece ser que los editores de publicaciones especializadas de renombre no encuentran emocionante publicar un trabajo empírico que no rechace la hipótesis nula. De alguna manera, como noticia es más novedoso el hallazgo de que la PMC sea estadísticamente diferente de cero que el hallazgo de que sea igual, a digamos !0.7.
Por tanto, J. Bradford De Long y Kevin Lang sostienen que es mejor para los economistas.
...concentrarse en las magnitudes de los coeficientes y dar informes sobre los niveles de confianza y no sobre las pruebas de significancia. Si todas, o casi todas, las hipótesis nulas son falsas, tiene poco sentido concentrarse en averiguar si un estimado es o no indistinguible de su valor predicho bajo la hipótesis nula. En lugar de esto, deseamos averiguar cuáles modelos son buenas aproximaciones, para lo cual es necesario que conozcamos los rangos de los valores de los parámetros excluidos por los estimados empíricos.
En resumen, estos autores prefieren el enfoque del intervalo de confianza al enfoque de la prueba de significancia. El lector puede desear tener este consejo en mente.
Por tanto, J. Bradford De Long y Kevin Lang sostienen que es mejor para los economistas.
...concentrarse en las magnitudes de los coeficientes y dar informes sobre los niveles de confianza y no sobre las pruebas de significancia. Si todas, o casi todas, las hipótesis nulas son falsas, tiene poco sentido concentrarse en averiguar si un estimado es o no indistinguible de su valor predicho bajo la hipótesis nula. En lugar de esto, deseamos averiguar cuáles modelos son buenas aproximaciones, para lo cual es necesario que conozcamos los rangos de los valores de los parámetros excluidos por los estimados empíricos.
En resumen, estos autores prefieren el enfoque del intervalo de confianza al enfoque de la prueba de significancia. El lector puede desear tener este consejo en mente.
jueves, 12 de diciembre de 2013
Significancia estadística versus significancia práctica (II)
El punto de toda esta exposición es que no se debe confundir la significancia estadística con la significancia práctica o económica. Como lo afirma Goldberger:
Cuando una hipótesis nula, digamos β1 = 1, se especifica, lo que se busca es que βi esté cercano a 1, tan cerca que para todos los propósitos prácticos pudiera ser tratado como si fuera 1. Pero el que 1.1. sea "prácticamente lo mismo que" 1.0 es un asunto de economía, no de estadística. No se puede resolver el asunto apoyándose en una prueba de hipótesis porque el estadístico de prueba [t=](bi-1)/σbi mide el coeficiente estimado en unidades de errores estándar, las cuales no tienen significado para medir el parámetro económico Bi - 1. Puede ser una buena idea reservar el término "significancia" para el concepto estadístico, adoptando la palabra "sustancial" para el concepto económico.
El punto expresado por Goldelberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados con significancia estadística se hace mucho menor pero los temas de significancia económica adquieren importancia crítica. En efecto, puesto que con muestras grandes casi todas las hipótesis nulas serán rechazadas, puede haber estudios en los cuales la magnitud de los valores estimados puntuales pueda ser lo único importante.
Cuando una hipótesis nula, digamos β1 = 1, se especifica, lo que se busca es que βi esté cercano a 1, tan cerca que para todos los propósitos prácticos pudiera ser tratado como si fuera 1. Pero el que 1.1. sea "prácticamente lo mismo que" 1.0 es un asunto de economía, no de estadística. No se puede resolver el asunto apoyándose en una prueba de hipótesis porque el estadístico de prueba [t=](bi-1)/σbi mide el coeficiente estimado en unidades de errores estándar, las cuales no tienen significado para medir el parámetro económico Bi - 1. Puede ser una buena idea reservar el término "significancia" para el concepto estadístico, adoptando la palabra "sustancial" para el concepto económico.
El punto expresado por Goldelberger es importante. A medida que el tamaño de la muestra se hace muy grande, la importancia de los temas relacionados con significancia estadística se hace mucho menor pero los temas de significancia económica adquieren importancia crítica. En efecto, puesto que con muestras grandes casi todas las hipótesis nulas serán rechazadas, puede haber estudios en los cuales la magnitud de los valores estimados puntuales pueda ser lo único importante.
miércoles, 11 de diciembre de 2013
Significancia estadística versus significancia práctica (I)
Recuérdese el ejemplo consumo-ingreso y ahora planteése que la verdadera PMC es 0.61 (H0: β2 = 0.61). Basados en el resultado muestral de β2 = 0.5091, se obtuvo el intervalo (0.4268, 0.5914) al 95% de confianza. Puesto que este intervalo no incluye 0.61, es posible decir, con un 95% de confianza, que el valor estimado es estadísticamente significativo, es decir, significativamente diferente de 0.61.
Pero, Cuál es el significado práctico o real del hallazgo? Es decir, Qué diferencia existe entre asignar a la PMC, un valor de 0.61 o uno de 0.5091? Es la diferencia de 0.1009 entre las dos PMC así de importante en la práctica?
La respuesta a esta pregunta depende de lo que en realidad se haga con estos estimados. Por ejemplo, de la macroeconomía se sabe que el multiplicador del ingreso es 1/(1-PMC). Por tanto, si la PMC e 0.5091, el multiplicador es 2.04, pero será 2.56 si la PMC es igual a 0.61. Esto es, si el gobierno fuera a incrementar su gasto en US$1 para sacar la economía de una recesión, el ingreso aumentaría en ese caso en US$2.04 si la PMC es 0.5091 pero lo hará en US$2.56 si la PMC es 0.61. Y esa diferencia podría ser crucial para reactivar la economía.
Pero, Cuál es el significado práctico o real del hallazgo? Es decir, Qué diferencia existe entre asignar a la PMC, un valor de 0.61 o uno de 0.5091? Es la diferencia de 0.1009 entre las dos PMC así de importante en la práctica?
La respuesta a esta pregunta depende de lo que en realidad se haga con estos estimados. Por ejemplo, de la macroeconomía se sabe que el multiplicador del ingreso es 1/(1-PMC). Por tanto, si la PMC e 0.5091, el multiplicador es 2.04, pero será 2.56 si la PMC es igual a 0.61. Esto es, si el gobierno fuera a incrementar su gasto en US$1 para sacar la economía de una recesión, el ingreso aumentaría en ese caso en US$2.04 si la PMC es 0.5091 pero lo hará en US$2.56 si la PMC es 0.61. Y esa diferencia podría ser crucial para reactivar la economía.
Nivel exacto de significancia: Valor ρ o "P-value" (II)
Como se anotó anteriormente, si los datos no apoyan la hipótesis nula, el ︱t︱ obtenido bajo tal hipótesis nula será "grande" y, por consiguiente, el valor ρ de obtener tal ︱t︱ será "pequeño". En otras palabras, para un tamaño de muestra dado, a medida que aumenta ︱t︱, el valor p se reduce y se puede, por consiguiente, rechazar la hipótesis nula con mayor confianza.
Cuál es la relación entre el valor p y el nivel de significancia α? Si se adquiere el hábito de fijar α igual al valor p de un estadístico de prueba (es decir, el estadístico t), entonces no hay conflicto entre estos dos valores. Expresado en otros términos, es mejor no fijar α a algún nivel de forma arbitraria sino escoger simplemente el valor p del estadístico de prueba. Es preferible dejar que el lector decida si debe rechazar la hipótesis nula al valor p dado. Si, en una aplicación, el valor p de un estadístico de prueba resulta ser, por ejemplo, 0.145 o 14.5% y si el lector desea rechazar la hipótesis nula a este nivel(exacto) de significancia, entonces lo puede hacer. No está mal tomar el riesgo de equivocarse un 14.5% de las veces si se rechaza la hipótesis nula verdadera. De manera similar como en el ejemplo de consumo-ingreso, no está mal si el investigador desea escoger un valor p cercano al 0.02% y no tomar el riesgo de equivocarse en más de 12 veces de cada 10,000!. Después de todo, algunos investigadores pueden ser amantes del riesgo y otros opuestos a él!
En el resto de este texto, se citará generalmente el valor p de un estadístico de prueba dado. Algunos lectores pueden desear fijar α a algún nivel y rechazar la hipótesis nula si el valor p es menor que α. Es su opción.
Cuál es la relación entre el valor p y el nivel de significancia α? Si se adquiere el hábito de fijar α igual al valor p de un estadístico de prueba (es decir, el estadístico t), entonces no hay conflicto entre estos dos valores. Expresado en otros términos, es mejor no fijar α a algún nivel de forma arbitraria sino escoger simplemente el valor p del estadístico de prueba. Es preferible dejar que el lector decida si debe rechazar la hipótesis nula al valor p dado. Si, en una aplicación, el valor p de un estadístico de prueba resulta ser, por ejemplo, 0.145 o 14.5% y si el lector desea rechazar la hipótesis nula a este nivel(exacto) de significancia, entonces lo puede hacer. No está mal tomar el riesgo de equivocarse un 14.5% de las veces si se rechaza la hipótesis nula verdadera. De manera similar como en el ejemplo de consumo-ingreso, no está mal si el investigador desea escoger un valor p cercano al 0.02% y no tomar el riesgo de equivocarse en más de 12 veces de cada 10,000!. Después de todo, algunos investigadores pueden ser amantes del riesgo y otros opuestos a él!
En el resto de este texto, se citará generalmente el valor p de un estadístico de prueba dado. Algunos lectores pueden desear fijar α a algún nivel y rechazar la hipótesis nula si el valor p es menor que α. Es su opción.
Etiquetas:
Regresión con dos variables
lunes, 9 de diciembre de 2013
Nivel exacto de significancia: Valor ρ o "P-value" (I)
Como recién se anotó, el talón de Aquiles del enfoque clásico de la prueba de hipótesis es su arbitrariedad en la selección de α. Una vez se ha obtenido un estadístico de prueba (es decir el estadístico t) en un ejemplo dado, por qué no consultar sencillamente la tabla estadística apropiada y encontrar la probabilidad real de obtener un valor del estadístico de prueba tan grande o mayor que el obtenido en el ejemplo? Esta probabilidad se denomina el valor ρ (es decir, el valor de probabilidad), también conocido como el nivel observado o exacto de significancia o la probabilidad exacta de cometer un error tipo I. Más técnicamente, el valor ρ está definido como el nivel de significancia más bajo al cual puede rechazarse una hipótesis nula.
Para ilustrar, recuérdese el ejemplo consumo-ingreso. Dad la hipótesis nula de que la verdadera PMC es 0.3, se obtuvo un valor t de 5.86 en (5.7.4), Cual es el valor ρ o "p-value" de obtener un valor t igual o superior a 5.86? En la tabla t del apéndice D, se observa que para 8 g de l la probabilidad de obtener tal valor t debe estar muy por debajo de 0.001 (una cola) o 0.002 (dos colas). Mediante el uso del computador, puede mostrarse que la probabilidad de obtener un valor t mayor o igual a 5.86 (8 g de l) es alrededor de 0.000189. Este valor ρ del estadístico t observado. Este nivel de significancia observado o exacto del estadístico t es mucho menor que los niveles de significancia del 1%, del 5% o del 10% fijados convencional y arbitrariamente. De hecho, si fueramos a utilizar el valor ρ recién calculado y rechazar la hipótesis nula que la verdera PMC es 0.3, la probabilidad de que se cometa un error tipo I es sólo de cerca de 0,02%, es decir, solamente 2 en 10,000!
Para ilustrar, recuérdese el ejemplo consumo-ingreso. Dad la hipótesis nula de que la verdadera PMC es 0.3, se obtuvo un valor t de 5.86 en (5.7.4), Cual es el valor ρ o "p-value" de obtener un valor t igual o superior a 5.86? En la tabla t del apéndice D, se observa que para 8 g de l la probabilidad de obtener tal valor t debe estar muy por debajo de 0.001 (una cola) o 0.002 (dos colas). Mediante el uso del computador, puede mostrarse que la probabilidad de obtener un valor t mayor o igual a 5.86 (8 g de l) es alrededor de 0.000189. Este valor ρ del estadístico t observado. Este nivel de significancia observado o exacto del estadístico t es mucho menor que los niveles de significancia del 1%, del 5% o del 10% fijados convencional y arbitrariamente. De hecho, si fueramos a utilizar el valor ρ recién calculado y rechazar la hipótesis nula que la verdera PMC es 0.3, la probabilidad de que se cometa un error tipo I es sólo de cerca de 0,02%, es decir, solamente 2 en 10,000!
Etiquetas:
Modelo de regresión con dos variables
domingo, 8 de diciembre de 2013
Selección del nivel de significancia α (II)
Desde luego, pocas veces se conocen los costos de cometer los dos tipos de error. Por tanto, los econometristas tienen por costumbre fijar el valor de α a niveles del 1, el 5 o el 10% como máximo y escogen un estadístico de pruebas que minimice la probabilidad de cometer un error tipo II. Puesto que uno menos la probabilidad de cometer un error tipo II se conoce como la potencia de la prueba, este procedimiento equivale a maximizar esa potencia de la prueba.
Pero todo este problema relacionado con la selección del valor apropiado de α puede ser evitado si se utiliza lo que se conoce como el "P-value" del estadístico de prueba, que se analiza a continuación.
Pero todo este problema relacionado con la selección del valor apropiado de α puede ser evitado si se utiliza lo que se conoce como el "P-value" del estadístico de prueba, que se analiza a continuación.
Etiquetas:
Regresión con dos variables
sábado, 7 de diciembre de 2013
Selección del nivel de significancia α (I)
Del análisis adelantado hasta el momento, debe tenerse claro que el hecho de rechazar o no una hipótesis nula depende en forma crítica de α, el nivel de significancia o probabilidad de cometer error tipo I, o sea, la probabilidad de rechazar la hipótesis cuando es verdadera. En un blog introductorio como éste no es posible analizar a fondo la razón por la cual se escogen los niveles de significancia 1,5 o 10%, ya que esto nos llevaría al campo de la toma de decisiones estadísticas, que de por sí es una disciplina completa. Sin embargo, puede ofrecerse un breve resumen. Como se estudió en el apendice A, para un tamaño de muestra dada, si tratamos de reducir un error tipo I, un error tipo II aumenta y viceversa. Es decir, dado el tamaño de la muestra, si tratamos de reducir la probabilidad de rechazar la hipótesis cuando es verdadera, se puede aumentar al mismo tiempo la probabilidad de aceptarla cuando es falsa. Por tanto, dado el tamaño de la muestra, existe una conexión de intercambio entre estos dos tipos de error. Ahora, la única forma en la cual se puede decidir sobre esta conexión es encontrar los costos relativos de los dos tipos de error. Entonces.
Si el error de rechazar la hipótesis nula cuando es verdadera (error tipo I) es costoso en comparación con el error de no rechzar la hipótesis nula cuando es falsa (error tipo II), será razonable fijar la probabilidad de ocurrencia del primer tipo de error a niveles bajos. Si, por otra parte, el costo de incurrir en el error tipo I es bajo comparado con el costo de cometer el error tipo II, se justificará que la probabilidad del primer tipo de error sea alta (rebajando así la posibilidad en el segundo tipo de error)
viernes, 6 de diciembre de 2013
Formación des hipótesis nula y alterna
Dadas las hipótesis nula y alterna, probar su significancia estadística no debe seguir siendo un misterio. Pero, Cómo se formulan estas hipótesis? No existen reglas específicas. Muy frecuentemente el fenómeno bajo estudio sugerirá la forma de la hipótesis nula y alterna. Por ejemplo, en el ejercicio 5.16 se pide estimar la línea del mercado de capitales (LMC) de la teoría de portafolio, que postula que Ei = β1 + β2σi donde E = retorno esperado sobre el portafolio y σ = la desviación estándar del retorno, una medida de riesgo. Puesto que se espera que el retorno y el riesgo estén relacionados positivamente entre mayor sea el riesgo, más alto será el retorno; la hipótesis alterna natural a la hipótesis nula, β2 = 0, sería β2 > 0. Es decir, no se considerar'n valores de β2 menores de cero.
Pero considérese el caso de la demanda de dinero. Como se demostrará más adelante, uno de los determinantes importantes de la demanda de dinero es el ingreso. Estudios anteriores de las funciones de demanda de dinero han mostrado que la elasticidad ingreso de la demanda de dinero (el cambio porcentual en la demanda de dinero por un cambio porcentual de 1% en el ingreso) ha estado típicamente dentro de un rango de 0.7 a 1.3. Por consiguiente, en un nuevo estudio de la demanda de dinero, si se postula que el coeficiente β2 de la elasticidad ingreso es 1, la hipótesis alterna podría ser que β2 ≠1, una hipótesis alterna de dos lados.
Por tanto, las expectativas teóricas o el trabajo empírico previo o ambos pueden ser la base para la formulación de hipótesis. Sin embargo, sin importar la forma como se postulen las hipótesis, es extremadamente importante que el investigador plantee estas hipótesis antes de llevar a cabo la investigación empírica. De lo contrario, él o ella serán culpables de razonamientos circulares o de profecias autocumplidas. Es decir, si se formulara la hipótesis después de examinar los resultados empíricos, podría presentarse la tentación de formular la hipótesis de tal manera que justifique los resultados obtenidos. Una práctica así debe ser evitada a cualquier costo, al menos para salvar la objetividad científica.
Pero considérese el caso de la demanda de dinero. Como se demostrará más adelante, uno de los determinantes importantes de la demanda de dinero es el ingreso. Estudios anteriores de las funciones de demanda de dinero han mostrado que la elasticidad ingreso de la demanda de dinero (el cambio porcentual en la demanda de dinero por un cambio porcentual de 1% en el ingreso) ha estado típicamente dentro de un rango de 0.7 a 1.3. Por consiguiente, en un nuevo estudio de la demanda de dinero, si se postula que el coeficiente β2 de la elasticidad ingreso es 1, la hipótesis alterna podría ser que β2 ≠1, una hipótesis alterna de dos lados.
Por tanto, las expectativas teóricas o el trabajo empírico previo o ambos pueden ser la base para la formulación de hipótesis. Sin embargo, sin importar la forma como se postulen las hipótesis, es extremadamente importante que el investigador plantee estas hipótesis antes de llevar a cabo la investigación empírica. De lo contrario, él o ella serán culpables de razonamientos circulares o de profecias autocumplidas. Es decir, si se formulara la hipótesis después de examinar los resultados empíricos, podría presentarse la tentación de formular la hipótesis de tal manera que justifique los resultados obtenidos. Una práctica así debe ser evitada a cualquier costo, al menos para salvar la objetividad científica.
jueves, 5 de diciembre de 2013
Hipótesis nula o "cero" y regla práctica "2-t" (II)
Ahora, si se examina la tabla t dada más adelante, se ve que para g de l alrededor de 20 o más, un valor calculado t mayor que 2 (en términos absolutos), es decir, 2.1, es estadísticamente significativo al nivel del 5%, lo cual implica rechazo de la hipótesis nula. Por consiguiente, si se encuentra que para 20 o más g de l el valor t calculado es, digamos, 2.5 o 3, ni siquiera se tiene que consultar la tabla t para asegurar la significancia del coefciente de la pendiente estimado. Por supuesto, siempre puede referirse a la tabla t para obtener el nivel preciso de significancia. Sin embargo, esto debe hacerse siempre cuando los g de l sean inferiores, por ejemplo, a 20.
A propósito, obsérvese que si se está probando la hipótesis de un lado β2 = 0 va β2 > 0 o β2 <0 , entonces se debe rechazar la hipótesis nula si
Si se fija α en 0.05, entonces la tabla t se observa que, para 20 o más g de l, un valor t mayor que de 1.73 es estadísticamente significativo al nivel de significancia del 5% (de una cola). Por lo tanto siempre que un valor t exceda, por ejemplo 1.9 (en términos absolutos) y los g de l sean 20 o más, no es necesario consultar la tabla t para la significancia estadística del coeficiente observado. Es claro que, si se escoge α igual a 0.01 o cualquier otro nivel, se tendrá que decidir sobre el valor apropiado de t como valor crítico de referencia; el valor deberá ser capaz de hacer eso.
A propósito, obsérvese que si se está probando la hipótesis de un lado β2 = 0 va β2 > 0 o β2 <0 , entonces se debe rechazar la hipótesis nula si
Si se fija α en 0.05, entonces la tabla t se observa que, para 20 o más g de l, un valor t mayor que de 1.73 es estadísticamente significativo al nivel de significancia del 5% (de una cola). Por lo tanto siempre que un valor t exceda, por ejemplo 1.9 (en términos absolutos) y los g de l sean 20 o más, no es necesario consultar la tabla t para la significancia estadística del coeficiente observado. Es claro que, si se escoge α igual a 0.01 o cualquier otro nivel, se tendrá que decidir sobre el valor apropiado de t como valor crítico de referencia; el valor deberá ser capaz de hacer eso.
miércoles, 4 de diciembre de 2013
Hipótesis nula o "cero" y regla práctica "2-t"
La hipótesis nula que es objeto frecuente de prueba en el trabajo empírico es Ho: β2 = 0, es decir, el coeficiente de la pendiente es cero. Esta hipótesis nula de "cero" es un mecanismo para establecer su Y tiene relación con X, la variable explicativa. Si, para empezar, no existe relación entre Y y X, entonces la prueba de hipótesis tal como β2 = 0.3 o cualquier otro valor no tiene significado.
Esta hipótesis nula puede probarse fácilmente mediante los enfoques de intervalos de confianza o prueba t estudiados en las secciones anteriores. Pero, muy frecuentemente, tales pruebas formales puede abreviarse adoptando la regla de significancia "2-t" que puede expresarse así:
Esta hipótesis nula puede probarse fácilmente mediante los enfoques de intervalos de confianza o prueba t estudiados en las secciones anteriores. Pero, muy frecuentemente, tales pruebas formales puede abreviarse adoptando la regla de significancia "2-t" que puede expresarse así:
martes, 3 de diciembre de 2013
Prueba de hipótesis: Algunos aspectos prácticos
El significado de "aceptar" o "rechazar" una hipótesis.
Si, con base en una prueba de significancia, por ejemplo, la prueba t, se decide "aceptar" la hipótesis nula, todo lo que se está diciendo es que con base en la evidencia dada por la muestra, no existe razón para rechazarla: no se está diciendo que la hipótesis nula sea verdadera con absoluta certeza. Por qué? para responder esto, téngase en cuenta el ejemplo consumo-ingreso y supongase que Ho: β2 (PMC) = 0.50. Ahora, el valor estimado de la PMC es β2 = 0.5091 con un se (β2) = 0.0357. Entonces con base en la prueba t, se encuentra que t = (0.5091-0.50)/0.0357= 0.25, que es no significativo, es decir, para un α = 5%. Por consiguiente, se dice que "aceptamos" Ho. Pero ahora supóngase Ho: β2 = 0.48. Aplicando la prueba t, se obtiene t = (0.5091 -0.48)/0.0357 = 0.82, el cual tampoco es estadísticamente significativo. Entonces, se dice ahora que "se acepta" esta Ho. Cuál de estas dos hipótesis nulas es la "verdadera"? No se sabe. Por consiguiente, en la "aceptación" de una hipótesis nula se debe tener presente siempre que pueda existir otra hipótesis nula igualmente compatible con los datos. Es preferible, por tanto, decir que se puede aceptar la hipótesis nula en lugar de decir que se la acepta. Mejor aún.
.... de la misma manera que un corte pronuncia un veredicto de "no culpable" en lugar de decir "inocente", así la conclusión de un estadístico de prueba es la de "no rechazar" en lugar de "aceptar"
Si, con base en una prueba de significancia, por ejemplo, la prueba t, se decide "aceptar" la hipótesis nula, todo lo que se está diciendo es que con base en la evidencia dada por la muestra, no existe razón para rechazarla: no se está diciendo que la hipótesis nula sea verdadera con absoluta certeza. Por qué? para responder esto, téngase en cuenta el ejemplo consumo-ingreso y supongase que Ho: β2 (PMC) = 0.50. Ahora, el valor estimado de la PMC es β2 = 0.5091 con un se (β2) = 0.0357. Entonces con base en la prueba t, se encuentra que t = (0.5091-0.50)/0.0357= 0.25, que es no significativo, es decir, para un α = 5%. Por consiguiente, se dice que "aceptamos" Ho. Pero ahora supóngase Ho: β2 = 0.48. Aplicando la prueba t, se obtiene t = (0.5091 -0.48)/0.0357 = 0.82, el cual tampoco es estadísticamente significativo. Entonces, se dice ahora que "se acepta" esta Ho. Cuál de estas dos hipótesis nulas es la "verdadera"? No se sabe. Por consiguiente, en la "aceptación" de una hipótesis nula se debe tener presente siempre que pueda existir otra hipótesis nula igualmente compatible con los datos. Es preferible, por tanto, decir que se puede aceptar la hipótesis nula en lugar de decir que se la acepta. Mejor aún.
.... de la misma manera que un corte pronuncia un veredicto de "no culpable" en lugar de decir "inocente", así la conclusión de un estadístico de prueba es la de "no rechazar" en lugar de "aceptar"
lunes, 2 de diciembre de 2013
Prueba de significancia para σ²: La prueba X²
Como otro ejemplo de la metodología de las pruebas de significancia, considérese la siguiente variable.
la cual, como se anotó previamente, sigue una distribución X² con n-2 g de l. Para el ejemplo hipotético, σ² = 42.1591 y g de l = 8. Si se postula que Ho: σ² = 85 vs H1: σ² ≠ 85, la ecuación (5.4.1) proporciona al estadístico de prueba para Ho. Sustituyendo los valores apropiados en (5.4.1), puede encontrarse que bajo Ho, X² = 3.97. Si se supone α = 5% los valores críticos X² son 2.1797 y 17.5346. Puesto que el X² calculado cae dentro de estos límites, los datos apoyan la hipótesis nula y no se la rechaza. Este procedimiento de prueba se denomina la prueba de significancia ji cuadrado. El enfoque de la prueba de significancia X² para la prueba de hipótesis se resumen en la tabla del siguiente post.
la cual, como se anotó previamente, sigue una distribución X² con n-2 g de l. Para el ejemplo hipotético, σ² = 42.1591 y g de l = 8. Si se postula que Ho: σ² = 85 vs H1: σ² ≠ 85, la ecuación (5.4.1) proporciona al estadístico de prueba para Ho. Sustituyendo los valores apropiados en (5.4.1), puede encontrarse que bajo Ho, X² = 3.97. Si se supone α = 5% los valores críticos X² son 2.1797 y 17.5346. Puesto que el X² calculado cae dentro de estos límites, los datos apoyan la hipótesis nula y no se la rechaza. Este procedimiento de prueba se denomina la prueba de significancia ji cuadrado. El enfoque de la prueba de significancia X² para la prueba de hipótesis se resumen en la tabla del siguiente post.
domingo, 1 de diciembre de 2013
Prueba de significancia de los coeficientes de regresión: La prueba t (VI)
Un resumen del enfoque de la prueba t de significancia para la prueba de hipótesis se presenta en la tabla 5.1
Etiquetas:
Regresión con dos variables
Suscribirse a:
Entradas (Atom)