Estimação pontual e intervalar da proporção

Estimação pontual da proporção

A proporção populacional é a frequência relativa com que alguma característica se verifica na população.

A estimação da proporção é muito utilizada para ver, por exemplo, qual é o candidato favorito numa eleição ou se algum produto está a ter a adesão esperada por parte do consumidor.

A estimativa normalmente utilizada para estimar a proporção populacional é a proporção amostral, $\boldsymbol{\^{p}}$ .

$\^{p}=\dfrac{\text{número de elementos da amostra que verificam a característica}}{\text{número total de elementos da amostra}}$

Nota: Amostras diferentes levam a estimativas diferentes!

Exemplo

Considera uma amostra aleatória de $40$ alunos, em que se apuraram as cores de cabelo de cada um deles.

Cor de cabelo	Castanho	Loiro	Ruivo	Preto
Número de alunos	$22$	$5$	$3$	$10$

Determina a estimativa da proporção populacional de alunos com o cabelo ruivo.

Para obter a estimativa da proporção populacional, $p$ , basta calcular a proporção amostral, $\^p$ :

$\^p=\dfrac{3}{40}=0{,}075$

Portanto, estima-se que $7{,}5\%$ dos alunos tenham o cabelo ruivo.

Também é possível recorrer ao teorema do limite central para fazer estimação pontual da proporção.

Assume que recolhes aleatoriamente uma amostra de dimensão $n\geqslant30$ da população $X$ , na qual cada elemento verifica ou não uma dada propriedade.

Então, sendo $p$ a proporção de elementos da população que verificam a propriedade, a distribuição de amostragem da proporção $\^p$ pode ser aproximada a uma distribuição normal de valor médio $p$ e de desvio padrão $\sqrt{\dfrac{p(1-p)}{n}}$ .

$\boldsymbol{\^p \sim N\Bigg(p, \sqrt{\dfrac{p(1-p)}{n}}\Bigg)}$

Exemplo

Sabe-se que $48\%$ dos copos de plástico gastos numa discoteca de Lisboa são reciclados.

Numa noite, a discoteca gasta $532$ copos.

Determina a probabilidade da proporção de copos reciclados numa noite, escolhidos aleatoriamente, ser superior a $51\%$ .

A proporção de copos reciclados na população é $p=48\%$ .

Em cada noite, a amostra aleatória é de $n=532$ copos, pelo que se pode aplicar o teorema do limite central, que garante que a distribuição de amostragem da proporção pode ser aproximada a uma distribuição normal de valor médio ${p=0{,}48}$ e desvio padrão $\sqrt{\dfrac{0{,}48(1-0{,}48)}{532}}\approx0{,}022$ .

Portanto, $\^p \sim N(0{,}48; \ 0{,}022)$

Pedem para calcular $P(\^p>0{,}51)$ .

Pela calculadora, tens que $P(\^p>0{,}51)\approx2{,}74\times10^{-6}$ , ou seja, a probabilidade da proporção de copos reciclados ser superior a $51\%$ é $0{,}000274\%$ .

Estimação intervalar da proporção

A estimação por pontos leva a grandes erros, uma vez que, dependendo da amostra, o valor estimado para o parâmetro é diferente. Então, de forma a contornar isso, utiliza-se a estimação intervalar. Assim, ao invés de determinar um valor pontual, determina-se um intervalo de valores que contenha o parâmetro que se queira estimar e que seja possível controlar a probabilidade disso acontecer.

A esse intervalo, chama-se de intervalo de confiança, que é um intervalo em que há uma certa confiança de que o valor do parâmetro esteja nele contido.

A essa confiança chama-se de grau ou nível de confiança.

Intervalo de confiança

O intervalo de confiança da proporção $p$ , admitindo que a amostra tem uma dimensão superior a $30$ é dado por:

$\Bigg]\^p-z\sqrt{\dfrac{\^p(1-\^p)}{n}},\^p+z\sqrt{\dfrac{\^p(1-\^p)}{n}} \Bigg[$ , onde

$n$ é a dimensão da amostra;
$\^p$ é a proporção amostral;
$z$ é o valor relacionado com o grau de confiança.

Nota: Abaixo encontram-se os valores de $z$ para os graus de confiança mais utilizados:

Níveis de confiança	$90\%$	$95\%$	$99\%$
$\boldsymbol{z}$	$1{,}645$	$1{,}960$	$2{,}576$

Exemplo

Considera uma amostra aleatória de $195$ residentes em Braga.

Desses $195$ residentes, apenas $45$ utilizam transportes públicos no seu dia-a-dia.

Determina um intervalo de confiança a $95\%$ para estimar a proporção populacional de residentes que utilizam transportes públicos no seu dia-a-dia.

A proporção amostral é $\^p=\dfrac{45}{195}\approx0{,}231$

Como o nível de confiança é $95\%$ , então o valor relacionado com o nível de confiança é $z=1{,}96$

Portanto, o intervalo de confiança será:

$\Bigg]0{,}231-1{,}96\sqrt{\dfrac{0{,}231(1-0{,}231)}{195}};0{,}231+1{,}96\sqrt{\dfrac{0{,}231(1-0{,}231)}{195}} \Bigg[\approx]0{,}172; \ 0{,}290[$

Pode-se concluir, então, com um nível de confiança de $95\%$ , que a proporção populacional de residentes em Braga que anda em transportes públicos no seu dia-a-dia está entre os $17{,}2\%$ e os $29\%$ , aproximadamente.