Inicio

Matemáticas

Estadística bidimensional

Ajuste por mínimos cuadrados: Regresión Lineal

Ajuste por mínimos cuadrados: Regresión Lineal

Seleccionar lección

Vídeo Explicativo

Loading...
Docente: Pablo

Resumen

Ajuste por mínimos cuadrados: Regresión Lineal

En general

El modelo de regresión lineal simple consiste en construir una recta de forma que para cada valor de la variable XX​ el valor de YY​ en la recta se acerque lo más posible a la yy real. Para calcular los elementos de esta recta necesitas:

  • xˉ\bar x​ e yˉ\bar y: la media de cada variable.
  • sx,ys_{x,y}: la desviación típica, se calcula sxy=xiyiN(xˉyˉ)s_{xy}=\cfrac{\sum x_iy_i}{N}-(\bar x \cdot \bar y).
  • sx2s_x^2​ y sy2s_y^2​: la varianza de cada variable. Se calcula sx2=xi2Nxˉ2s_x^2=\cfrac{\sum x_i^2}{N}-\bar x^2​ y sy2=yi2Nyˉ2s_y^2=\cfrac{\sum y_i^2}{N}-\bar y^2.
  • rr​: el coeficiente de correlación, se calcula r=sxysxsyr=\cfrac{s_{xy}}{s_x\cdot s_y}​.



Método de los mínimos cuadrados ordinarios

La recta de regresión del tipo y=a+bxy=a+bx​ que minimiza el error cuadrático medio se define como:


ECM=1ni=1n(y1abx1)2ECM=\cfrac{1}{n}\displaystyle\sum_{i=1}^n (y_1-a-bx_1)^2

Donde a=ysxysx2xa=y-\cfrac{s_{xy}}{s_x^2}\overline x​, b=sxysx2b=\cfrac{s_{xy}}{s_x^2}​ y y=y+sxysx2(xx)y=\overline y +\cfrac{s_{xy}}{s_x^2}(x-\overline x)​​


Con esto se llega a la expresión


ECM=sy2(1sxy2sy2sx2)ECM=s_y^2(1-\cfrac{s_{xy}^2}{s_y^2s_x^2})​​


Varianza residual

El residuo es la diferencia entre el valor observado y el valor estimado. Cuanto más pequeño sea, más ajustados a la recta están los valores reales.


ECM=1ni=1n(yiyˆi)2ECM=\cfrac{1}{n}\displaystyle\sum_{i=1}^n (y_i-\^y_i)^2​​


Ejemplo

Calcula la varianza residual de tres puntos que se alejan de la recta de regresión 22, 44 y 55 unidades.


La varianza residual es 1ni=1n(yiyˆi)2=22+32+52312,67\cfrac{1}{n}\displaystyle\sum_{i=1}^n (y_i-\^y_i)^2=\cfrac{2^2+3^2+5^2}{3}\approx\underline{12,67}​​

Coeficiente de determinación

Para comparar el nivel de ajuste entre la recta y los valores reales, se usa el coeficiente de determinación R2R^2. Mide la proporción de la variabilidad explicada por la recta de regresión. Es el cuadrado del coeficiente de correlación.


R2=syˆ2sy2=sxy2sx2sy2R^2=\cfrac{s_{\^y}^2}{s_y^2}=\cfrac{s_{xy}^2}{s_x^2\cdot s_y^2}​​


Ejemplo

Una tienda anota el número de paraguas que vende cada día y la precipitación en centímetros de lluvia durante una semana.


​​paraguas vendidos

33​​
1212​​
1616​​
4242​​
4747​​
6767​​
7878​​

lluvia

0,20,2​​
0,50,5​​
11​​
22​​
2,52,5​​
33​​
44​​


Traza una recta de regresión que estime la venta de paraguas según la precipitación del día. ¿Cuántos paraguas se estima que venderán cuando llueva 3,5 cm3,5\space cm? Calcula el error cuadrático medio.


La media de paraguas vendidos es yˉ=37,86\bar y=37,86 y la media de lluvia es xˉ=1,89\bar x=1,89. La desviación típica es sxy=33,74s_{xy}=33,74 y la varianza de xx es sx=1,28s_x=1,28 y la de yy es sy=26,51s_y=26,51. La recta de rgresión es:


y37,86=33,741,282(x1,89) y=20,59x38,92+37,86 y=20,59x1,06y-37,86=\cfrac{33,74}{1,28^2}(x-1,89)\implies y=20,59x-38,92+37,86\implies \underline{y=20,59x-1,06}​​


Por lo tanto, un dıˊa que llueva 3,5 cm ​se espera que venda y=20,593,51,0671 paraguas.\underline{\rm Por \ lo\ tanto,\ un\ día\ que\ llueva\ {3,5\ cm}\ ​ se \ espera\ que\ venda\ {y=20,59\cdot3,5-1,06\approx71}\ paraguas.}​​


El error cuadrático medio es ECM=sy2(1sxy2sy2sx2)=7,96ECM=s_y^2(1-\cfrac{s_{xy}^2}{s_y^2s_x^2})=\underline{7,96}​​


La recta de regresión lineal se representa:

Matemáticas; Estadística bidimensional; 1. Bachillerato; Ajuste por mínimos cuadrados: Regresión Lineal



Crear una cuenta para leer el resumen

Ejercicios

Crear una cuenta para empezar los ejercicios

Preguntas frecuentes

¿Qué es una recta de regresión?

¿Qué es el coeficiente de determinación?

Beta

Soy Vulpy, ¡tu compañero de estudio de IA! Aprendamos juntos.