Busca en el Blog

viernes, 11 de abril de 2014

El "juego" de maximización de R²

Para concluir esta sección debe hacerse una advertencia: Algunas veces los investigadores juegan de maximizar el R², es decir, escogen el modelo que da el R² más elevado. Pero esto puede ser peligroso, ya que en el análisis de regresión, el objetivo no es obtener un R² elevado per se sino más bien obtener estimados de los verdaderos coeficientes de regresión poblacional de los cuales se puede depender y sea posible realizar inferencia estadística sobre ellos. En el análisis empírico no es inusual obtener un R² muy elevado, sino encontrar que algunos de los coeficientes de regresión no son estadísticamente significativos o muestran signos contrarios a los esperados a priori. Por consiguiente, el investigador debe preocuparse más por la relevancia lógica o teórica que tienen las variables explicativas para la variable dependiente y por su significancia estadística. Si en este proceso se obtiene un R² elevado, muy bien; por otra parte, si R² es bajo, esto no significa que el modelo sea necesariamente malo.

De hecho, Goldberger es muy crítico sobre el papel del R²; ha dicho:

Desde nuestra perspectiva, el R² tiene un papel muy modesto en el análisis de regresión, y es una medida de la bondad del ajuste de una regresión lineal MC (mínimos cuadrados) de una muestra en un cuerpo de datos. Nada en el modelo RC [MCRL] exige que R² sea elevado. Por tanto, un R² elevado no es evidencia en favor del modelo y un R² bajo no es evidencia en su contra.

De hecho, lo más importante sobre el R² es que éste no es importante en el modelo RC. El modelo RC tiene que ver con parámetros en una población, no con la bondad de ajuste en la muestra. Si se insiste en una medida de predecir el éxito (o más bien el fracaso), entonces σ² sería suficiente: después de todo el parámetro σ² es el error de predicción esperado al cuadrado que resultaría si la población CEF[FRP] fuera utilizado como predictor. En forma alterna, el error estándar de predicción elevado al cuadrado para valores relevantes de x [regresores] puede ser informativo.

No hay comentarios.:

Publicar un comentario