Aunque es cuestión de preferencia personal y tradición, en este texto se utiliza la terminología de
variable dependiente/variable explicativa, o la más neutral de regresada y regresora.
Si se estudia la dependencia de una variable respecto de una única variable explicativa, como
el consumo que depende del ingreso real, dicho estudio se conoce como análisis de regresión
simple, o con dos variables. Sin embargo, si se estudia la dependencia de una variable respecto
de más de una variable explicativa, como el rendimiento de un cultivo, la lluvia, la temperatura,
el Sol y los fertilizantes, se trata de un análisis de regresión múltiple. En otras palabras, en una
regresión de dos variables sólo hay una variable explicativa, mientras que en la regresión múltiple
hay más de una variable explicativa.
El término aleatorio es sinónimo de estocástico. Como ya vimos, una variable aleatoria o
estocástica es la que toma cualquier conjunto de valores, positivos o negativos, con una probabilidad
dada.9
A menos que se indique lo contrario, la letra Y representa la variable dependiente, y las X (X1,
X2,…, Xk), las variables explicativas, con Xk como la k-ésima variable explicativa. Los subíndices
i o t denotan la observación o valor i-ésimo o t-ésimo. Xki (o Xkt) denota la i-ésima (o la t-ésima)
observación de la variable Xk. N (o T) representa el número total de observaciones o valores en la
población, y n (o t), el número total de observaciones en una muestra. Por convención, se utiliza
el subíndice de observación i para los datos transversales (es decir, información recopilada en
un momento determinado), y el subíndice t, para datos de series de tiempo (es decir, información
reunida a lo largo de un periodo). La naturaleza de datos transversales y de series de tiempo,
así como el importante tema de la naturaleza y las fuentes de datos para el análisis empírico, se
estudian en la siguiente sección.
No hay comentarios.:
Publicar un comentario