Ahora, Σyi² es independiente del número de variables X en el modelo porque es simplemente Σ(Yi-Y)². La SRC, Σûi², sin embargo, depende del número de regresores presentes en el modelo. Intuitivamente, es calor que a medida que el número de variables X aumenta, es más probable que Σui² disminuya (al menos no aumentará); por tanto, el R² como ha sido definido en (7.8.1) aumentará. En vista de esto, al comparar los modelos de regresión con la misma variable dependiente pero un número diferente de variables X. se debe tener mucho cuidado al escoger el modelo con el R² más alto.
Para compara dos términos R², se debe tener en cuenta el número de variables X presentes en el modelo. Esto puede hacerse fácilmente si se considera un coeficiente de determinación alternativo, que es el siguiente:
donde k = el número de parámetros en el modelo incluyendo el término de intercepto. (En la regresión con tres variables, k = 3. Por qué? El R² así definido se conoce como R² ajustado, denotado por R². El término ajustado significa ajustado por los g de l asociados con las sumas de los cuadrados que se consideran en (7.8.1): Σûi² tiene n-k g de l en un modelo que contiene k parámetros, el cual incluye el término de intercepto y Σyi² tiene n-1 g de l. Por qué? Para el caso de tres variables, se sabe que Σûi² tiene n-3 g de l.
No hay comentarios.:
Publicar un comentario