Busca en el Blog

domingo, 30 de enero de 2022

Naturaleza del análisis de regresión - Terminología y notación

Antes de proceder al análisis formal de la teoría de regresión abordaremos brevemente la terminología y la notación. En las publicaciones especializadas, los términos variable dependiente y variable explicativa se defi nen de varias maneras; a continuación se presenta una lista representativa:
Terminología y notación

Aunque es cuestión de preferencia personal y tradición, en este texto se utiliza la terminología de variable dependiente/variable explicativa, o la más neutral de regresada y regresora.

Si se estudia la dependencia de una variable respecto de una única variable explicativa, como el consumo que depende del ingreso real, dicho estudio se conoce como análisis de regresión simple, o con dos variables. Sin embargo, si se estudia la dependencia de una variable respecto de más de una variable explicativa, como el rendimiento de un cultivo, la lluvia, la temperatura, el Sol y los fertilizantes, se trata de un análisis de regresión múltiple. En otras palabras, en una regresión de dos variables sólo hay una variable explicativa, mientras que en la regresión múltiple hay más de una variable explicativa.

El término aleatorio es sinónimo de estocástico. Como ya vimos, una variable aleatoria o estocástica es la que toma cualquier conjunto de valores, positivos o negativos, con una probabilidad dada.9

A menos que se indique lo contrario, la letra Y representa la variable dependiente, y las X (X1, X2,…, Xk), las variables explicativas, con Xk como la k-ésima variable explicativa. Los subíndices i o t denotan la observación o valor i-ésimo o t-ésimo. Xki (o Xkt) denota la i-ésima (o la t-ésima) observación de la variable Xk. N (o T) representa el número total de observaciones o valores en la población, y n (o t), el número total de observaciones en una muestra. Por convención, se utiliza el subíndice de observación i para los datos transversales (es decir, información recopilada en un momento determinado), y el subíndice t, para datos de series de tiempo (es decir, información reunida a lo largo de un periodo). La naturaleza de datos transversales y de series de tiempo, así como el importante tema de la naturaleza y las fuentes de datos para el análisis empírico, se estudian en la siguiente sección.

No hay comentarios.:

Publicar un comentario