El análisis de correlación está estrechamente relacionado con el de regresión aunque conceptualmente los dos son muy diferentes. En el análisis de correlación el objetivo principal es medir la fuerza o el grado de asociación lineal, entre dos variables. El coeficiente de correlación, que se estudiará en detalle mas adelante, mide esta fuerza de asociación (lineal). Por ejemplo, se puede estar interesado en encontrar la correlación (el cofeciente) entre el hábito de fumar y el puede estar interesado en encontrar la correlación (el coeficiente) entre el hábito de fumar y el cáncer de pulmón; entre las calificaciones obtenidas en la escuela secundaria y en la universidad, y así sucesivamente. En el análisis de regresión, como ya se mencionó, no estamos interesados en este tipo de medición. En cambio, se tata de estimar o de predecir el valor promedio de una variable sobre la base de valores fijos de otras variables. Así, puede ser que se desee saber si se puede predecir el promedio de las calificaciones en un examén de estadística, conociendo la calificación de un estudiante en un examén de matemáticas.
La regresión y la correlación tienen algunas diferencias fundamentales que vale la pena mencionar. En el análisis de regresión hay una asimetría en el tratamiento que se da a las variables dependientes y explicativas. Se supone que la variable dependiente es estadística, aleatoria, o estocástica, esto es, que tiene una distribución de probabilidad. Por otra parte se ha determinado que las variables explicativas tiene valores fijos (en muestras repetidas), lo cual fue hecho explícito en la definición de regresión. Así, en los anteriores ejemplos se supuso que la variable edad era fija a los niveles dados y se obtuvieron medidas de estatura a esos niveles. En el análisis de correlación, por otra parte, tratamos dos variables cualquiera en forma simétrica; no hay distinción entre la variable dependiente y las explicativas. Después de todo, la correlación entre las calificaciones de los exámenes de matemáticas y de estadística es la misma que la existente entre calificaciones de los exámenes de estadística y el de matemáticas. Además, se ha supuesto que las dos variables son aleatorias. Como se verá, la mayor parte de la teoría de correlación está basada en el supuesto de aleatoriedad de variables, mientras que la mayor parte de la teoría de regresión que se expondrá en este texto está condicionada al supuesto de que la variable dependiente es estocástica pero las variables explicativas son fijas o no estocásticas.
No hay comentarios.:
Publicar un comentario