REGRESIÓN LINEAL MÚLTIPLE
INTRODUCCIÓN
El modelo de regresión lineal con una única variable regresora no es adecuado cuando para explicar el comportamiento
de una variable se hace necesario considerar varios factores que resultan ser relevantes en el modelo, ya que la omisión
de variables relevantes puede generar sesgo cuando esta variable es un factor determinante en la explicación de la
variable regresada.
Por ejemplo,
El salario de una persona se puede expresar en términos de su nivel de escolaridad y de su experiencia, según el
modelo econométrico
salario = 0 + 1 nivel + 2 experiencia +
donde comprende todos los otros factores, no considerados en el modelo, y que influyen en el salario de una
persona.
Las ventas, de determinado bien, se pueden expresar en términos de su precio, del precio de sus sustitutos y de
los gastos en publicidad, mediante el modelo
Ventas = 0 + 1 precio del bien + 2 precio del sustituto + 3 gastos en publicidad +
Si suponemos que el gasto familiar se puede expresar como una función cuadrática del ingreso familiar, se
escribe
Gastos = 0 + 1 ingreso + 2 (ingreso)2 +
El valor monetario de todos los bienes producidos, en el modelo de producción de Cobb-Douglas, se puede
expresar en términos de la fuerza laboral (medida en horas-hombre) y del capital (constituido básicamente por
maquinaria, o instalaciones que, que combinados con otros factores permiten desarrollar bienes de consumo), de la
siguiente manera:
Ln(Q) = 0 + 1 Ln( L) + 2 Ln( K ) +
Siendo,
Q: el valor monetario de todos los bienes producidos
L: la fuerza laboral
K: el capital
Es necesario entonces definir un modelo de regresión donde intervenga más de una variable regresora, el cual se llama
modelo de regresión lineal múltiple y que resulta ser una extensión del modelo de regresión lineal simple, pues
permite explicar el efecto que tiene sobre la variable regresada Yi la variación de la variable X i1 y manteniendo fijas
el resto de regresoras X i 2 , X i3 ,..., X ik .
Supóngase que se tienen ahora k variables regresoras X i1, X i 2 , Xi3 ,..., X ik y la variable regresada Yi .
La función de regresión poblacional se expresa de manera general como,
Yi = 0 + 1 X i1 + 2 X i 2 + ... + k X ik + i , i = 1, 2, ,n (1)
donde los parámetros 0 , 1,..., k deben estimarse a partir de los datos muéstrales y,
, • Yi : es la i-ésima respuesta observada
• 0 : es la ordenada en el origen
Yi
• j : es el coeficiente de regresión parcial de la j-ésima variable regresora, es decir = j , y da el cambio
X j
en la variable respuesta Yi cuando la variable independiente X j , j = 1, 2,..., k tiene un incremento unitario,
permaneciendo las demás variables constantes.
• Xij : es la i-ésima observación de la j-ésima variable regresora, j = 1,2,..., k
• i : es el término de error o la perturbación aleatoria asociada a la i-ésima observación.
Independiente del número de variables regresoras que se tengan en el modelo, siempre habrá factores que se han
omitido y que se consideran incluidos de manera agrupada en i .
En el modelo de regresión lineal múltiple se tienen k variables regresoras y k +1 parámetros que deben estimarse.
El modelo de regresión lineal múltiple poblacional (1) también puede escribirse como
Yi = 0 X i 0 + 1 X i1 + 2 X i 2 + ... + k X ik + i , i = 1, 2, ,n
en el cual la variable X i 0 se denomina regresora constante, toma el valor de uno, para cualquier observación.
INTERPRETACIÓN DE LOS PARÁMETROS
Si cada una de las variables independientes toma el valor de cero, puede observarse de la ecuación que
E Yi X i1 = 0, X i 2 = 0,..., X ik = 0 = 0
ˆ 0 : Es decir que ˆ 0 es el valor esperado de la variable dependiente cuando todas las variables independientes toman
el valor de cero. El coeficiente 0 suele llamarse intercepto, término independiente o término constante y en muchos
casos no tiene sentido interpretarlo.
ˆ j : Si el valor de la variable X j se incrementa en una unidad dejando fijas las demás variables (Ceteris Paribus) se
espera que la variable regresada en promedio se incremente o disminuya en ˆ j unidades. De manera que ˆ j es el
efecto parcial sobre la variable Y de X j , manteniendo fijas las demás variables. En forma análoga se interpretan los
demás parámetros.
Si se tiene que el gasto familiar se expresa como
Gastos = 0 + 1 ingreso + 2 (ingreso)2 +
La interpretación de 1 no se puede hacer de la misma manera puesto que no tiene sentido hablar del efecto parcial de
los ingresos familiares en los gastos manteniendo fijo (ingreso)2 , puesto que si ingreso cambia, también lo hará
(ingreso)2 . Por lo tanto, el cambio en los gastos debido a un incremento unitario en los ingresos está dado por
, Gastos
= 1 + 22 ingreso
ingreso
y este resultado indica que el efecto marginal del ingreso en los gastos depende tanto de 1 como de 2 y del ingreso.
Efecto marginal
El efecto marginal de una variable regresora X j sobre la variable regresada Y es un concepto que se usa en economía
y finanzas para describir el cambio que ocurre en Y y motivado por un incremento unitario en X j y manteniendo las
demás variables constantes. Es decir
Y
efecto marginal = = j (2)
X j
Es claro entonces que, el efecto marginal coincide con los coeficientes de regresión en el caso de un modelo de
regresión lineal. Sin embargo, en otro tipo de modelos los coeficientes de regresión no van a coincidir con este
concepto.
EJEMPLO
Se dispone del siguiente modelo en el cual el consumo de los hogares de un determinado bien se expresa en términos
de su renta y del precio del bien
consumo i = 0 + 1rentai1 + 2 precioi 2 + i
Donde
Y : es la cantidad que se consume de un bien (en unidades)
X 1 :es la medida de la renta disponible (en unidades monetarias)
X 2 :es el precio del bien (en unidades monetarias)
La estimación de mínimos cuadrados de los parámetros fue ˆ0 = 9.7233, ˆ1 = 7.1464, ˆ2 = −2.7420 y por lo
tanto el modelo ajustado es
consumo = 9.7233 + 7.1464 renta − 2.7420 precio
Interpretaciones
ˆ0 = 9.7233 : este representa el consumo promedio mínimo, el cual se denomina consumo autónomo.
ˆ1 = 7.1464 : cuando se presenta un incremento de una unidad monetaria en la renta, manteniendo el precio constante,
se espera que el consumo promedio de ese bien aumente 7.1464 unidades
ˆ2 = −2.7420 : cuando se presenta un incremento de una unidad monetaria en el precio, manteniendo la renta
constante, se espera que el consumo promedio del bien disminuya 2.7420 unidades.
EJEMPLO
Se ajustó el siguiente modelo de regresión con una muestra de 30 familias para explicar el consumo familiar de leche.
Yi = 0 + 1 X i1 + 2 X i 2 + i
donde:
Yi : consumo de leche en litros por semana
X i1 : ingreso semanal, en cientos de dólares
X i 2 : tamaño de la familia
INTRODUCCIÓN
El modelo de regresión lineal con una única variable regresora no es adecuado cuando para explicar el comportamiento
de una variable se hace necesario considerar varios factores que resultan ser relevantes en el modelo, ya que la omisión
de variables relevantes puede generar sesgo cuando esta variable es un factor determinante en la explicación de la
variable regresada.
Por ejemplo,
El salario de una persona se puede expresar en términos de su nivel de escolaridad y de su experiencia, según el
modelo econométrico
salario = 0 + 1 nivel + 2 experiencia +
donde comprende todos los otros factores, no considerados en el modelo, y que influyen en el salario de una
persona.
Las ventas, de determinado bien, se pueden expresar en términos de su precio, del precio de sus sustitutos y de
los gastos en publicidad, mediante el modelo
Ventas = 0 + 1 precio del bien + 2 precio del sustituto + 3 gastos en publicidad +
Si suponemos que el gasto familiar se puede expresar como una función cuadrática del ingreso familiar, se
escribe
Gastos = 0 + 1 ingreso + 2 (ingreso)2 +
El valor monetario de todos los bienes producidos, en el modelo de producción de Cobb-Douglas, se puede
expresar en términos de la fuerza laboral (medida en horas-hombre) y del capital (constituido básicamente por
maquinaria, o instalaciones que, que combinados con otros factores permiten desarrollar bienes de consumo), de la
siguiente manera:
Ln(Q) = 0 + 1 Ln( L) + 2 Ln( K ) +
Siendo,
Q: el valor monetario de todos los bienes producidos
L: la fuerza laboral
K: el capital
Es necesario entonces definir un modelo de regresión donde intervenga más de una variable regresora, el cual se llama
modelo de regresión lineal múltiple y que resulta ser una extensión del modelo de regresión lineal simple, pues
permite explicar el efecto que tiene sobre la variable regresada Yi la variación de la variable X i1 y manteniendo fijas
el resto de regresoras X i 2 , X i3 ,..., X ik .
Supóngase que se tienen ahora k variables regresoras X i1, X i 2 , Xi3 ,..., X ik y la variable regresada Yi .
La función de regresión poblacional se expresa de manera general como,
Yi = 0 + 1 X i1 + 2 X i 2 + ... + k X ik + i , i = 1, 2, ,n (1)
donde los parámetros 0 , 1,..., k deben estimarse a partir de los datos muéstrales y,
, • Yi : es la i-ésima respuesta observada
• 0 : es la ordenada en el origen
Yi
• j : es el coeficiente de regresión parcial de la j-ésima variable regresora, es decir = j , y da el cambio
X j
en la variable respuesta Yi cuando la variable independiente X j , j = 1, 2,..., k tiene un incremento unitario,
permaneciendo las demás variables constantes.
• Xij : es la i-ésima observación de la j-ésima variable regresora, j = 1,2,..., k
• i : es el término de error o la perturbación aleatoria asociada a la i-ésima observación.
Independiente del número de variables regresoras que se tengan en el modelo, siempre habrá factores que se han
omitido y que se consideran incluidos de manera agrupada en i .
En el modelo de regresión lineal múltiple se tienen k variables regresoras y k +1 parámetros que deben estimarse.
El modelo de regresión lineal múltiple poblacional (1) también puede escribirse como
Yi = 0 X i 0 + 1 X i1 + 2 X i 2 + ... + k X ik + i , i = 1, 2, ,n
en el cual la variable X i 0 se denomina regresora constante, toma el valor de uno, para cualquier observación.
INTERPRETACIÓN DE LOS PARÁMETROS
Si cada una de las variables independientes toma el valor de cero, puede observarse de la ecuación que
E Yi X i1 = 0, X i 2 = 0,..., X ik = 0 = 0
ˆ 0 : Es decir que ˆ 0 es el valor esperado de la variable dependiente cuando todas las variables independientes toman
el valor de cero. El coeficiente 0 suele llamarse intercepto, término independiente o término constante y en muchos
casos no tiene sentido interpretarlo.
ˆ j : Si el valor de la variable X j se incrementa en una unidad dejando fijas las demás variables (Ceteris Paribus) se
espera que la variable regresada en promedio se incremente o disminuya en ˆ j unidades. De manera que ˆ j es el
efecto parcial sobre la variable Y de X j , manteniendo fijas las demás variables. En forma análoga se interpretan los
demás parámetros.
Si se tiene que el gasto familiar se expresa como
Gastos = 0 + 1 ingreso + 2 (ingreso)2 +
La interpretación de 1 no se puede hacer de la misma manera puesto que no tiene sentido hablar del efecto parcial de
los ingresos familiares en los gastos manteniendo fijo (ingreso)2 , puesto que si ingreso cambia, también lo hará
(ingreso)2 . Por lo tanto, el cambio en los gastos debido a un incremento unitario en los ingresos está dado por
, Gastos
= 1 + 22 ingreso
ingreso
y este resultado indica que el efecto marginal del ingreso en los gastos depende tanto de 1 como de 2 y del ingreso.
Efecto marginal
El efecto marginal de una variable regresora X j sobre la variable regresada Y es un concepto que se usa en economía
y finanzas para describir el cambio que ocurre en Y y motivado por un incremento unitario en X j y manteniendo las
demás variables constantes. Es decir
Y
efecto marginal = = j (2)
X j
Es claro entonces que, el efecto marginal coincide con los coeficientes de regresión en el caso de un modelo de
regresión lineal. Sin embargo, en otro tipo de modelos los coeficientes de regresión no van a coincidir con este
concepto.
EJEMPLO
Se dispone del siguiente modelo en el cual el consumo de los hogares de un determinado bien se expresa en términos
de su renta y del precio del bien
consumo i = 0 + 1rentai1 + 2 precioi 2 + i
Donde
Y : es la cantidad que se consume de un bien (en unidades)
X 1 :es la medida de la renta disponible (en unidades monetarias)
X 2 :es el precio del bien (en unidades monetarias)
La estimación de mínimos cuadrados de los parámetros fue ˆ0 = 9.7233, ˆ1 = 7.1464, ˆ2 = −2.7420 y por lo
tanto el modelo ajustado es
consumo = 9.7233 + 7.1464 renta − 2.7420 precio
Interpretaciones
ˆ0 = 9.7233 : este representa el consumo promedio mínimo, el cual se denomina consumo autónomo.
ˆ1 = 7.1464 : cuando se presenta un incremento de una unidad monetaria en la renta, manteniendo el precio constante,
se espera que el consumo promedio de ese bien aumente 7.1464 unidades
ˆ2 = −2.7420 : cuando se presenta un incremento de una unidad monetaria en el precio, manteniendo la renta
constante, se espera que el consumo promedio del bien disminuya 2.7420 unidades.
EJEMPLO
Se ajustó el siguiente modelo de regresión con una muestra de 30 familias para explicar el consumo familiar de leche.
Yi = 0 + 1 X i1 + 2 X i 2 + i
donde:
Yi : consumo de leche en litros por semana
X i1 : ingreso semanal, en cientos de dólares
X i 2 : tamaño de la familia