Ajuste por mínimos cuadrados: Regresión Lineal
Recta de regresión lineal
La recta de regresión lineal indica la correlación de los datos en una nube de puntos. Además, proporciona los datos para calcular una de las variables a partir de los datos ya obtenidos.
y−yˉ=Sx2Sxy⋅(x−xˉ)
Para calcular la recta de regresión es necesario conocer:
media
| xˉ=N∑xiyˉ=N∑yj |
covarianza | Sxy=N∑xiyj−(xˉ⋅yˉ) |
varianza | Sx2=N∑xi2−xˉ2 |
Coeficiente de correlación | r=Sx⋅SySxy |
Recuerda que: si r es cercano a 1, el ajuste es bueno y la dispersión es baja, mientras que si r es cercano a 0, es malo y la dispersión es muy alta.
Para calcular la recta de regresión lineal y todos los parámetros estadísticos relacionados debes seguir el siguiente procedimiento:
Procedimiento
1. | Identifica en tu tabla de datos las variables xi e yi. |
2. | Añade a tu tabla de datos tres filas más para calcular xi2,yi2 e (xi⋅yi) |
3. | Suma todos los valores en una columna para obtener el sumatorio de todos tus cálculos. |
4. | Calcula la media aritmética (xˉ,yˉ) de cada una de las variables. |
5. | Calcula la varianza ( Sx2 y Sy2) aplicando la fórmula |
6. | Calcula la desviación típica ( Sx y Sy) y la covarianza (Sxy), aplicando las fórmulas. Recuerda que: la desviación típica es la raíz cuadrada de la varianza. |
7. | Calcula el coeficiente de relación (r) aplicando la fórmula y estima si es necesario calcular la recta de regresión o no. |
8. | Si es óptimo, sustituye los datos en la expresión general de la recta de regresión lineal. |
Recuerda que: lo que tienes que obtener para calcular la recta de regresión lineal es diferente si te piden la recta de y sobre x, o la dex sobre y.
Ejemplo
En el instituto se ha realizado una encuesta para conocer el número de taquillas (xi) que los alumnos (yi) necesitan en cada clase. Partiendo de estos datos, calcula la recta de regresión de y sobre x.
Primero, amplía la tabla y calcula xi2,yi2, xi⋅yi y el número total de datos, así como el sumatorio de las variables anteriores:
| Total |
| | | | | | |
| | | | | | |
| | | | | | |
| | | | | | |
xi⋅yi | | | | | | |
Calcula la media: xˉ=N∑xi=520=4 e yˉ=N∑yi=519=3,8
Calcula la varianza: Sx2=N∑xi2−xˉ2=590−(4)2=18−16=2
Calcula la covarianza: Sxy=N∑xi⋅yi−(xˉ⋅yˉ)=580−(4⋅3,8)=16−15,2=0,8
Si sustituimos en la expresión general:
y−3,8=20,8⋅(x−4)⟹y−3,8=0,4⋅(x−4)