A estimação de um parâmetro através de um único valor é chamada deestimação pontual.
Para fazer estimação pontual do valor médio, recorre-se muitas vezes ao teorema do limite central, desde que a amostra em questão seja suficientemente grande (n⩾30) e que seja obtida através de um processo aleatório.
Exemplo
A taxa de adesão ao cartão de sócio da Universidade de Lisboa segue uma distribuição normal de valor médio 82 e de desvio padrão 2.
Qual é a probabilidade de se obter uma média entre 82 e 96, em amostras aleatórias de dimensão 40?
Como n=40⩾30, então podes aplicar o teorema do limite central:
X~N(μ,nσ)⇔X~N(82,402)⇔X~N(82,1010)
Assim, recorrendo à calculadora, sabes que P(82<X<96)=0,5.
Ou seja, a probabilidade de se obter uma média entre os 82 e os 96 em amostras aleatórias de dimensão 40 é 0,5.
Estimação intervalar do ponto médio
A estimação por pontos leva a grandes erros, uma vez que, dependendo da amostra, o valor estimado para o parâmetro é diferente. Então, de forma a contornar isso, utiliza-se a estimação intervalar. Assim, ao invés de determinar um valor pontual, determina-se um intervalo de valores que contenha o parâmetro que se queira estimar e que seja possível controlar a probabilidade disso acontecer.
A esse intervalo, chama-se de intervalo de confiança, que é um intervalo em que há uma certa confiança de que o valor do parâmetro esteja nele contido.
A essa confiança chama-se de grau ou nível de confiança.
Intervalo de confiança
O intervalo de confiança do valor médio μ de uma variável normalX, com o desvio padrão conhecido, é dado por:
]xˉ−znσ,xˉ+znσ[, onde
n é a dimensão da amostra;
xˉ é a média amostral;
σ é o desvio padrão da variável;
z é o valor relacionado com o grau de confiança.
Nota: Abaixo encontram-se os valores de z para os graus de confiança mais utilizados:
Níveis de confiança
90%
95%
99%
z
1,645
1,960
2,576
Exemplo
A quantidade semanal de legumes que a população residente na região do Douro ingere segue uma distribuição de desvio padrão de 1kg.
Selecionou-se uma amostra aleatória de 100 residentes, cuja média é de 4kg.
Qual é o intervalo de confiança de 99% para o valor médio da quantidade semanal de ingestão de legumes?
X é a variável aleatória que representa a média de amostras dos 100 residentes.
Segundo o teorema do limite central, a distribuição de amostragem da média pode ser aproximada a uma normal, com valor médio μ e desvio padrão 1001=0,1.
Portanto, podes dizer que ]4−2,576×0,1;4+2,576×0,1[=]3,7424;4,2576[ é um intervalo de confiança de nível 99% para o parâmetro valor médio do consumo semanal de legumes pelos residentes do Douro.
Intervalo de confiança em amostras de dimensão superior a 30
O intervalo de confiança do valor médio μ de uma variável normal X, com desvio padrão populacional desconhecido e cuja amostra tem uma dimensão superior a 30 é dado por:
]xˉ−zns,xˉ+zns[, em que
n é a dimensão da amostra;
xˉ é a média amostral;
s é o desvio padrão amostral;
z é o valor relacionado com o grau de confiança.
Exemplo
Uma fábrica de tábuas de corte de madeira assumiu que a espessura das tábuas deve ser de 10cm.
Selecionaram-se 320 tábuas para ver se a espessura estava correta e obtiveram-se os seguintes dados: xˉ=10,2cm e s=0,2cm.
Determina um intervalo com 95% de confiança para a espessura média das tábuas fabricadas.
A amostra tem uma dimensão suficientemente grande para assumir que a distribuição das diferentes médias de amostras com 320 de dimensão pode ser aproximada de uma distribuição normal N(μ,320σ).
Mas, como σ é desconhecido, substitui-se por s=0,2 e tem-se na mesma uma distribuição normal.
Assim, o intervalo de confiança para um grau de 95% de confiança é:
Portanto, com uma confiança de 95%, estima-se que a espessura média das tábuas de madeira esteja entre 10,178 e 10,222 centímetros, o que não vai ao encontro do estabelecido.