A proporção populacional é a frequência relativa com que alguma característica se verifica na população.
A estimação da proporção é muito utilizada para ver, por exemplo, qual é o candidato favorito numa eleição ou se algum produto está a ter a adesão esperada por parte do consumidor.
A estimativa normalmente utilizada para estimar a proporção populacional é a proporção amostral, pˆ.
pˆ=nuˊmero total de elementos da amostranuˊmero de elementos da amostra que verificam a caracterıˊstica
Nota: Amostras diferentes levam a estimativas diferentes!
Exemplo
Considera uma amostra aleatória de 40 alunos, em que se apuraram as cores de cabelo de cada um deles.
Cor de cabelo
Castanho
Loiro
Ruivo
Preto
Número de alunos
22
5
3
10
Determina a estimativa da proporção populacional de alunos com o cabelo ruivo.
Para obter a estimativa da proporção populacional, p, basta calcular a proporção amostral, pˆ:
pˆ=403=0,075
Portanto, estima-se que 7,5% dos alunos tenham o cabelo ruivo.
Também é possível recorrer ao teorema do limite central para fazer estimação pontual da proporção.
Assume que recolhes aleatoriamente uma amostra de dimensão n⩾30 da população X, na qual cada elemento verifica ou não uma dada propriedade.
Então, sendo p a proporção de elementos da população que verificam a propriedade, a distribuição de amostragem da proporção pˆ pode ser aproximada a uma distribuição normal de valor médio p e de desvio padrão np(1−p).
pˆ∼N(p,np(1−p))
Exemplo
Sabe-se que 48% dos copos de plástico gastos numa discoteca de Lisboa são reciclados.
Numa noite, a discoteca gasta 532 copos.
Determina a probabilidade da proporção de copos reciclados numa noite, escolhidos aleatoriamente, ser superior a 51%.
A proporção de copos reciclados na população é p=48%.
Em cada noite, a amostra aleatória é de n=532 copos, pelo que se pode aplicar o teorema do limite central, que garante que a distribuição de amostragem da proporção pode ser aproximada a uma distribuição normal de valor médio p=0,48 e desvio padrão 5320,48(1−0,48)≈0,022.
Portanto, pˆ∼N(0,48;0,022)
Pedem para calcular P(pˆ>0,51).
Pela calculadora, tens que P(pˆ>0,51)≈2,74×10−6, ou seja, a probabilidade da proporção de copos reciclados ser superior a 51% é 0,000274%.
Estimação intervalar da proporção
A estimação por pontos leva a grandes erros, uma vez que, dependendo da amostra, o valor estimado para o parâmetro é diferente. Então, de forma a contornar isso, utiliza-se a estimação intervalar. Assim, ao invés de determinar um valor pontual, determina-se um intervalo de valores que contenha o parâmetro que se queira estimar e que seja possível controlar a probabilidade disso acontecer.
A esse intervalo, chama-se deintervalo de confiança, que é um intervalo em que há uma certa confiança de que o valor do parâmetro esteja nele contido.
A essa confiança chama-se degrauounível de confiança.
Intervalo de confiança
O intervalo de confiança da proporção p, admitindo que a amostra tem uma dimensão superior a 30 é dado por:
]pˆ−znpˆ(1−pˆ),pˆ+znpˆ(1−pˆ)[, onde
n é a dimensão da amostra;
pˆ é a proporção amostral;
z é o valor relacionado com o grau de confiança.
Nota: Abaixo encontram-se os valores de z para os graus de confiança mais utilizados:
Níveis de confiança
90%
95%
99%
z
1,645
1,960
2,576
Exemplo
Considera uma amostra aleatória de 195 residentes em Braga.
Desses 195 residentes, apenas 45 utilizam transportes públicos no seu dia-a-dia.
Determina um intervalo de confiança a 95% para estimar a proporção populacional de residentes que utilizam transportes públicos no seu dia-a-dia.
A proporção amostral é pˆ=19545≈0,231
Como o nível de confiança é 95%, então o valor relacionado com o nível de confiança é z=1,96
Pode-se concluir, então, com um nível de confiança de 95%, que a proporção populacional de residentes em Braga que anda em transportes públicos no seu dia-a-dia está entre os 17,2% e os 29%, aproximadamente.