Interpretação dos intervalos de confiança: precisão, erro e dimensão ótima

Interpretação

Um intervalo de confiança de, por exemplo, $90\%$ , significa que, se recolheres muitas amostras aleatórias de dimensão $n$ e construíres os respetivos intervalos de confiança para cada amostra, cerca de $90\%$ desses intervalos irão conter o valor do parâmetro a estimar, pelo que os restantes $10\%$ não.

Mas isso não quer dizer que tenhamos a certeza que um intervalo específico contenha o valor do parâmetro.

Apenas se está "confiante a $90\%$ " de que o intervalo calculado através de uma dada amostra contenha o valor do parâmetro desconhecido.

Precisão, erro e dimensão ótima

O processo de amostragem levanta dois problemas: o enviesamento da amostra e a falta de precisão.

O enviesamento tem a ver com o desvio no valor da estatística em comparação com o valor do parâmetro. Este problema pode ser reduzido com o recurso a amostras aleatórias.

Já a falta de precisão tem a ver com a variabilidade nos valores da estatística, algo que pode ser minimizado com o aumento da dimensão da amostra.

Margem de erro

A margem de erro, $E$ , no caso da estimação do valor médio, com $\sigma$ conhecido ou não, é:

$E=z\dfrac{\sigma}{\sqrt{n}}$ ou $E=z\dfrac{s}{\sqrt{n}}$ , em que

$n$ é a dimensão da amostra;
$\sigma$ é o desvio padrão da variável;
$s$ é o desvio padrão amostral;
$z$ é o valor relacionado com o grau de confiança.

A margem de erro, $E$ , no caso da estimação da proporção populacional, é:

$E=z\sqrt{\dfrac{\^p(1-\^p)}{n}}$ , em que

$\^p$ é a proporção amostral.

Nota: Quanto maior for a dimensão da amostra, menor será a amplitude do intervalo, menor será o erro e mais precisa será a estimativa!

Exemplo

Pretende-se estimar a quantidade média de água, em litros, que as famílias portuguesas gastam durante o dia. Para isso, selecionou-se uma amostra de $74$ famílias e obtiveram-se os seguintes dados: $\bar{x}=19 \ L$ e $\sigma=2{,}4 \ L$ .

Constrói intervalos de confiança a $95\%$ e a $99\%$ para o parâmetro do gasto médio de água da população e verifica como varia a margem de erro com o grau de confiança.

Intervalo de $95\%$ : $\Bigg]19-1{,}96\times\dfrac{2{,}4}{\sqrt{74}}; 19+1{,}96\times\dfrac{2{,}4}{\sqrt{74}}\Bigg[\approx]18{,}453; \ 19{,}547[$

Margem de erro : $E=1{,}96\times\dfrac{2{,}4}{\sqrt{74}}\approx0{,}547 \ L$

Intervalo de $99\%$ : $\Bigg]19-2{,}576\times\dfrac{2{,}4}{\sqrt{74}}; 19+2{,}576\times\dfrac{2{,}4}{\sqrt{74}}\Bigg[\approx]18{,}281; \ 19{,}719[$

Margem de erro: $2{,}576\times\dfrac{2{,}4}{\sqrt{74}}\approx0{,}719 \ L$

Portanto, podes verificar que, quanto maior é o nível de confiança, maior é o intervalo e maior é a margem de erro.

Dimensão ótima da amostra

Quando o parâmetro é o valor médio, a dimensão da amostra para um dado erro máximo, $|\bar{x}-\mu|\leqslant E$ , é:

$n=\Bigg(\dfrac{z\times\sigma}{E}\Bigg)^2$ , quando $\sigma$ é conhecido;
$n=\Bigg(\dfrac{z\times s}{E}\Bigg)^2$ , quando $\sigma$ é desconhecido.

Quando o parâmetro é a proporção populacional, a dimensão da amostra para um dado erro máximo, $|\^p-p|\leqslant E$ , é:

$n=\Bigg(\dfrac{z}{E}\Bigg)^2\times\^p\times(1-\^p)$

Nota: Quando o valor de $n$ não é inteiro, arredonda-se por excesso.

Exemplo

Considera uma amostra aleatória de $408$ adultos, em que $68$ ainda vivem em casa dos pais.

Num nível de confiança de $90\%$ , qual é a dimensão da amostra, para que o erro seja, no máximo, $8$ pontos percentuais?

Sabe-se que $\^p=\dfrac{68}{408}=\dfrac{1}{6}\approx0{,}167$ , $z=1{,}645$ e $E=0{,}08$ .

Então,

$n=\Bigg(\dfrac{1{,}645}{0{,}08}\Bigg)^2\times\dfrac{1}{6}\times\Bigg(1-\dfrac{1}{6}\Bigg)\approx58{,}725$

Conclui-se que, para que o erro seja no máximo de $8$ pontos percentuais, num intervalo de confiança de $90\%$ , a dimensão da amostra tem que ser $59$ .