Distribuição de amostragem e teorema do limite central: Conceito e aplicação
Estimação de parâmetros
A estimação de parâmetros é um método que, partindo de uma dada amostra, utiliza estatísticas para estimar valores sobre os parâmetros.
Exemplo
Se quiseres saber a altura média de todos os encarregados de educação do país, podes pegar numa amostra de 200encarregados de educação, fazer a média amostral dessas alturas e inferir que a altura média dos encarregados de educação é essa média amostral. Neste caso, o parâmetro é a altura média dos encarregados de educação e a média das 200 alturas dos encarregados de educação é a estatística.
A estatística utilizada para estimar o valor médio, μ, é a média amostral, xˉ, em que X é o estimador;
A estatística utilizada para estimar a proporção populacional, p, é a proporção amostral, pˆ, em que P é o estimador.
A estimação de um parâmetro através de um único valor é chamado de estimação pontual. Esta estimação é feita recorrendo a um estimador, que é uma função da amostra em questão, ou seja, são variáveis aleatórias que podem assumir valores distintos, dependendo da amostra. A estimativa é o valor que o estimador assume em cada amostra.
Por outro lado, a estimação de um parâmetro através de um intervalo de valores é chamada de estimação intervalar.
O erro de amostragem é a diferença entre o valor do parâmetro e a estimativa feita através do estimador.
Nota: Amostras diferentes levam a estimativas diferentes!
Distribuição de amostragem
A distribuição de amostragem é o conjunto de todos os valores possíveis que uma estatística pode assumir, obtidos através de todas as amostras possíveis, cuja dimensão é n.
Exemplo
Considera uma população constituída pelas alturas, em centímetros, de 3 alunos de uma escola de Lisboa: (159,163,182).
Define a distribuição de amostragem do estimador média (X), que representa essa população.
Se selecionares aleatoriamente uma amostra de dois elementos, por exemplo, X=(159,163), a média da amostra é dada por X=2159+163=161.
Este valor é diferente do valor médio da população: μ=3159+163+182=168.
Neste caso, como a população tem apenas 3 elementos, consegues calcular o valor médio da população, mas, se a população tivesse muitos elementos, isso era quase impossível.
Podes ter, no total, 32=9 amostras de dois elementos extraídas da população das alturas dos 3 alunos da escola de Lisboa:
Alturas
159
163
182
159
X1=(159,159)
X2=(163,159)
X3=(182,159)
163
X4=(159,163)
X5=(163,163)
X6=(182,163)
182
X7=(159,182)
X8=(163,182)
X9=(182,182)
As médias das 9 amostras são as seguintes:
X1=2159+159=159
X2=2163+159=161
X3=2182+159=170,5
X4=2159+163=161
X5=2163+163=163
X6=2182+163=172,5
X7=2159+82=170,5
X8=2163+182=172,5
X9=2182+182=182
Assim, X é uma variável aleatória e é possível escrever a sua distribuição de probabilidade.
Distribuição de amostragem do estimador média, X:
X=xi
159
161
163
170,5
172,5
182
P(X=xi)
91
92
91
92
92
91
Valor médio e desvio padrão da distribuição de amostragem do estimador média
O valor médio da distribuição de amostragem da média, μX, é igual ao valor médio da população, μ.
Ou seja, o estimador média é não enviesado.
μX=μ
Por sua vez, o desvio padrão da distribuição de amostragem da média, σX, é igual a nσ, em que n é o número de elementos das amostras.
O teorema do limite central é uma forma de evitar calcular a distribuição de amostragem dos estimadores para fazer estimação de parâmetros.
Assim, se uma amostra for suficientemente grande, (n⩾30), e for obtida por um processo aleatório, a distribuição de amostragem da média X pode ser aproximada a uma distribuição normal com valor médio μ e desvio padrão nσ, em que μ é o valor médio da população X e σ é o seu desvio padrão. Escreve-se:
X∼N(μ,nσ)
Se a população seguir uma distribuição normal, então podes aplicar o teorema do limite central, independentemente da dimensão da amostra, desde que o desvio padrão seja conhecido;
Quanto maior for a dimensão da amostra, melhor a distribuição de amostragem da média se aproxima à distribuição normal e menor será o desvio padrão da distribuição de amostragem, ou seja, menor será o erro cometido na estimação do valor médio.
Exemplo
Considera uma população constituída por 500 gatos. Sabe-se que o valor médio do peso dos gatos é 4,2kg e o desvio padrão é 0,15kg.
Recolheu-se uma amostra aleatória de 82 gatos.
Define a distribuição de amostragem da média do peso dos gatos.
Comon=82⩾30 e a amostra é aleatória, podes utilizar o teorema do limite central.
μ=4,2kg
σ=0,15kg
n=82⇔n=82
A distribuição de amostragem da média do peso dos gatos é normal e é definida da seguinte forma: