Coeficiente de correlação linear de dados bivariados
Explicação
O coeficiente de correlação linear é o que permite avaliar a precisão da reta de mínimos quadrados numa nuvem de pontos.
Sendo n um número natural e (x,y) uma amostra de dados bivariados, o coeficiente de correlação linear representa-se por
r=SSxSSyi=1∑n(xi−x)(yi−y) ou ainda r=aSSySSx,
sendo a o declive da reta de mínimos quadrados.
A partir desta segunda representação, é possível concluir que, como r é proporcional a a e SSySSx>0, r e a têm o mesmo sinal. Desta forma, se r>0, a associação linear entre as variáveis estatísticas é positiva, assim como passa a ser negativa se r<0. As variáveis consideram-se independentes se r=0.
r>0
r<0
Tem-se sempre que ∣r∣⩽1. A associação linear entre variáveis estatísticas é tanto mais forte quanto mais perto de 1 estiver ∣r∣. Nos casos extremos de r=1 ou r=−1, os pontos da nuvem estão todos alinhados.
Exemplo
Considera as amostras x=(1,2,3,6) e y=(4,6,7,7). Calcula o coeficiente de correlação linear, r, e diz se a associação linear entre as variáveis estatísticas é forte ou fraca.
Ora, podes calcular r neste exercício utilizando a expressão
r=SSxSSyi=1∑n(xi−x)(yi−y)
As médias são x=41+2+3+6=412=3 e y=44+6+7+7=424=6.
Concluis que o valor pedido é r=0,76 e a associação entre as variáveis não é muito forte, uma vez que o coeficiente de correlação ainda está longe de 1.