Busca en el Blog

miércoles, 26 de enero de 2022

Naturaleza del análisis de regresión - Regresión y correlación

El análisis de correlación se relaciona de manera estrecha con el de regresión, aunque conceptualmente los dos son muy diferentes. En el análisis de correlación, el objetivo principal es medir la fuerza o el grado de asociación lineal entre dos variables. El coefi ciente de correlación, que veremos en detalle en el capítulo 3, mide esta fuerza de asociación (lineal): por ejemplo, si se desea encontrar la correlación (coefi ciente) entre el hábito de fumar y el cáncer del pulmón; entre las califi caciones en exámenes de estadística y en exámenes de matemáticas; entre las califi caciones de bachillerato y de la universidad, y así sucesivamente. En el análisis de regresión, como ya mencionamos, no interesa ese tipo de medición. En cambio, se trata de estimar o predecir el valor promedio de una variable con base en los valores fi jos de otras. Así, quizá se desee predecir el promedio de las califi caciones en un examen de estadística a partir de la califi - cación de un estudiante en un examen de matemáticas.

La regresión y la correlación presentan diferencias fundamentales que vale la pena mencionar. En el análisis de regresión hay una asimetría en el tratamiento a las variables dependientes y explicativas. Se supone que la variable dependiente es estadística, aleatoria o estocástica, es decir, que tiene una distribución de probabilidad. Por otra parte, se asume que las variables explicativas tienen valores fi jos (en muestras repetidas),7 lo cual es explícito en la defi nición de regresión de la sección 1.2. Así, en la fi gura 1.2 se supuso que la variable de edad era fi ja en los niveles dados y se obtuvieron medidas de estatura en esos niveles. En el análisis de correlación, por otra parte, se tratan dos variables cualesquiera en forma simétrica; no hay distinción entre las variables dependiente y explicativa. Después de todo, la correlación entre las califi caciones de los exámenes de matemáticas y de estadística es la misma que la existente entre califi caciones de exámenes de estadística y de matemáticas. Además, las dos variables se consideran aleatorias. Como veremos, la mayor parte de la teoría de correlación parte del supuesto de aleatoriedad de las variables, mientras que la mayor parte de la teoría de regresión que expondremos en este texto está condicionada al supuesto de que la variable dependiente es estocástica y que las variables explicativas son fi jas o no estocásticas.8

No hay comentarios.:

Publicar un comentario