- Antecedentes: Una vez comprobada la existencia de relación lineal entre dos variables cuantitativas (Tema 3 en esta unidad
determinaremos la recta que mejor representa la relación encontrada y que nos permita realizar predicciones sobre los valores de una
variable a partir de los datos de otra
Modelo de regresión simple
- Los modelos de regresión son usados para predecir o explicar una medida basándonos en el conocimiento de otra u otras Las variables
no tienen por qué ser numéricas, incluso ninguna de ellas Nosotros veremos el modelo más sencillo La regresión lineal simple, que es
para estudiar la relación entre dos variables numéricas
Regresión lineal simple: cálculo de la recta de regresión
- Como hemos comentado anteriormente, la regresión lineal consiste en encontrar aproximar los valores de una variable a partir de los de
otra y hacer predicciones sobre los valores de una variable a partir de los datos de otra En este contexto, una variable será la dependiente
o endógena, que llamaremos Y, y la otra será la independiente o exógena que llamaremos X
- Considerando la variable estadística bidimensional ( Y) para la que se ha comprobado previamente que existe una correlación entre X e
Y, obtener la ecuación de la función matemática que mejor se ajusta al diagrama de dispersión será el objetivo de la regresión lineal y así
permitirnos predecir de la mejor manera una variable ( en función de otra ( La línea que mejor se ajusta al diagrama de dispersión será la
que haga que las desviaciones de los puntos de la nube respecto de los correspondientes de la línea sea lo menor posible (figura página 6
En estas condiciones diremos que es la línea que menos se separa de la nube de puntos y que por tanto minimice el error entre los valores
predichos y los reales
Página 1 de 7
Luis Pedro García San Segundo Jiménez
Diseño de Investigación y Análisis de Datos en Educación
, La recta roja minimiza los errores que hay en los datos experimentales, esa recta es la mas optima, la que me minimiza el error, me ajusta todos los
datos. Es el método de mínimos cuadrados.
Página 2 de 7
Luis Pedro García San Segundo Jiménez
Diseño de Investigación y Análisis de Datos en Educación