Interpretação dos intervalos de confiança: precisão, erro e dimensão ótima
Interpretação
Um intervalo de confiança de, por exemplo, 90%, significa que, se recolheres muitas amostras aleatórias de dimensão n e construíres os respetivos intervalos de confiança para cada amostra, cerca de 90% desses intervalos irão conter o valor do parâmetro a estimar, pelo que os restantes 10% não.
Mas isso não quer dizer que tenhamos a certeza que um intervalo específico contenha o valor do parâmetro.
Apenas se está "confiante a 90%" de que o intervalo calculado através de uma dada amostra contenha o valor do parâmetro desconhecido.
Precisão, erro e dimensão ótima
O processo de amostragem levanta dois problemas: o enviesamento da amostra e a falta de precisão.
O enviesamento tem a ver com o desvio no valor da estatística em comparação com o valor do parâmetro. Este problema pode ser reduzido com o recurso a amostras aleatórias.
Já a falta de precisão tem a ver com a variabilidade nos valores da estatística, algo que pode ser minimizado com o aumento da dimensão da amostra.
Margem de erro
A margem de erro, E, no caso da estimação do valor médio, com σ conhecido ou não, é:
E=znσ ou E=zns, em que
n é a dimensão da amostra;
σ é o desvio padrão da variável;
s é o desvio padrão amostral;
z é o valor relacionado com o grau de confiança.
A margem de erro, E, no caso da estimação da proporção populacional, é:
E=znpˆ(1−pˆ), em que
pˆ é a proporção amostral.
Nota: Quanto maior for a dimensão da amostra, menor será a amplitude do intervalo, menor será o erro e mais precisa será a estimativa!
Exemplo
Pretende-se estimar a quantidade média de água, em litros, que as famílias portuguesas gastam durante o dia. Para isso, selecionou-se uma amostra de 74 famílias e obtiveram-se os seguintes dados: xˉ=19L e σ=2,4L.
Constrói intervalos de confiança a 95% e a 99% para o parâmetro do gasto médio de água da população e verifica como varia a margem de erro com o grau de confiança.
Intervalo de 95%: ]19−1,96×742,4;19+1,96×742,4[≈]18,453;19,547[
Margem de erro : E=1,96×742,4≈0,547L
Intervalo de 99%: ]19−2,576×742,4;19+2,576×742,4[≈]18,281;19,719[
Margem de erro: 2,576×742,4≈0,719L
Portanto, podes verificar que, quanto maior é o nível de confiança, maior é o intervalo e maior é a margem de erro.
Dimensão ótima da amostra
Quando o parâmetro é o valor médio, a dimensão da amostra para um dado erro máximo, ∣xˉ−μ∣⩽E, é:
n=(Ez×σ)2, quando σ é conhecido;
n=(Ez×s)2, quando σ é desconhecido.
Quando o parâmetro é a proporção populacional, a dimensão da amostra para um dado erro máximo, ∣pˆ−p∣⩽E, é:
n=(Ez)2×pˆ×(1−pˆ)
Nota: Quando o valor de n não é inteiro, arredonda-se por excesso.
Exemplo
Considera uma amostra aleatória de 408 adultos, em que 68 ainda vivem em casa dos pais.
Num nível de confiança de 90%, qual é a dimensão da amostra, para que o erro seja, no máximo, 8 pontos percentuais?
Sabe-se que pˆ=40868=61≈0,167, z=1,645 e E=0,08.
Então,
n=(0,081,645)2×61×(1−61)≈58,725
Conclui-se que, para que o erro seja no máximo de 8 pontos percentuais, num intervalo de confiança de 90%, a dimensão da amostra tem que ser 59.