Tudo para aprender melhor...

Início

MACS

Inferência estatística

Distribuição de amostragem e teorema do limite central: Conceito e aplicação

Distribuição de amostragem e teorema do limite central: Conceito e aplicação

Selecionar aula

Vídeo Explicativo

Loading...
Docente: Joana T

Resumo

Distribuição de amostragem e teorema do limite central: Conceito e aplicação

Estimação de parâmetros

A estimação de parâmetros é um método que, partindo de uma dada amostra, utiliza estatísticas para estimar valores sobre os parâmetros.


Exemplo

Se quiseres saber a altura média de todos os encarregados de educação do país, podes pegar numa amostra de 200200 encarregados de educação, fazer a média amostral dessas alturas e inferir que a altura média dos encarregados de educação é essa média amostral. Neste caso, o parâmetro é a altura média dos encarregados de educação e a média das 200200 alturas dos encarregados de educação é a estatística.


  • A estatística utilizada para estimar o valor médio, μ\mu, é a média amostral, xˉ\bar{x}, em que X\overline{X } é o estimador;
  • A estatística utilizada para estimar a proporção populacional, pp, é a proporção amostral, pˆ\^p, em que PP é o estimador.


A estimação de um parâmetro através de um único valor é chamado de estimação pontual. Esta estimação é feita recorrendo a um estimador, que é uma função da amostra em questão, ou seja, são variáveis aleatórias que podem assumir valores distintos, dependendo da amostra. A estimativa é o valor que o estimador assume em cada amostra.

Por outro lado, a estimação de um parâmetro através de um intervalo de valores é chamada de estimação intervalar.


erro de amostragem é a diferença entre o valor do parâmetro e a estimativa feita através do estimador.


Nota: Amostras diferentes levam a estimativas diferentes! 


Distribuição de amostragem

A distribuição de amostragem é o conjunto de todos os valores possíveis que uma estatística pode assumir, obtidos através de todas as amostras possíveis, cuja dimensão é nn.


Exemplo

Considera uma população constituída pelas alturas, em centímetros, de 3 alunos de uma escola de Lisboa: (159,163,182)(159,163,182).

Define a distribuição de amostragem do estimador média (X\overline{X}), que representa essa população.


Se selecionares aleatoriamente uma amostra de dois elementos, por exemplo, X=(159,163)X=(159,163), a média da amostra é dada por X=159+1632=161\overline{X}=\dfrac{159+163}{2}=161.


Este valor é diferente do valor médio da população: μ=159+163+1823=168\mu=\dfrac{159+163+182}{3}=168.


Neste caso, como a população tem apenas 33 elementos, consegues calcular o valor médio da população, mas, se a população tivesse muitos elementos, isso era quase impossível.


Podes ter, no total, 32=93^2=9 amostras de dois elementos extraídas da população das alturas dos 33 alunos da escola de Lisboa:


Alturas

159159
163163
182182
159159
X1=(159,159)X_1=(159,159)
X2=(163,159)X_2=(163,159)
X3=(182,159)X_3=(182,159)
163163
X4=(159,163)X_4=(159,163)
X5=(163,163)X_5=(163,163)
X6=(182,163)X_6=(182,163)
182182
X7=(159,182)X_7=(159,182)
X8=(163,182)X_8=(163,182)
X9=(182,182)X_9=(182,182)


As médias das 99  amostras são as seguintes:


X1=159+1592=159\overline{X_1}=\dfrac{159+159}{2}=159
X2=163+1592=161\overline{X_2}=\dfrac{163+159}{2}=161
X3=182+1592=170,5\overline{X_3}=\dfrac{182+159}{2}=170{,}5
X4=159+1632=161\overline{X_4}=\dfrac{159+163}{2}=161
X5=163+1632=163\overline{X_5}=\dfrac{163+163}{2}=163
X6=182+1632=172,5\overline{X_6}=\dfrac{182+163}{2}=172{,}5
X7=159+822=170,5\overline{X_7}=\dfrac{159+82}{2}=170{,}5
X8=163+1822=172,5\overline{X_8}=\dfrac{163+182}{2}=172{,}5
X9=182+1822=182\overline{X_9}=\dfrac{182+182}{2}=182


Assim, X\overline{X} é uma variável aleatória e é possível escrever a sua distribuição de probabilidade.


Distribuição de amostragem do estimador média, X\overline{X}:

X=xi\boldsymbol{\overline{X}=x_i}
159159
161161
163163
170,5170{,}5
172,5172{,}5
182182
P(X=xi)\boldsymbol{P(\overline{X}=x_i)}
19\dfrac{1}{9}
29\dfrac{2}{9}
19\dfrac{1}{9}
29\dfrac{2}{9}
29\dfrac{2}{9}
19\dfrac{1}{9}



Valor médio e desvio padrão da distribuição de amostragem do estimador média

O valor médio da distribuição de amostragem da média, μX\mu_{\overline{X}}, é igual ao valor médio da população, μ\mu.

Ou seja, o estimador média é não enviesado

μX=μ\boldsymbol{\mu_{\overline{X}}=\mu}


Por sua vez, o desvio padrão da distribuição de amostragem da média, σX\sigma_{\overline{X}}, é igual a σn\dfrac{\sigma}{\sqrt{n}}, em que nn é o número de elementos das amostras.

σX=σn\boldsymbol{\sigma_{\overline{X}}=\dfrac{\sigma}{\sqrt{n}}}


Exemplo

Segundo o exemplo de cima, tens que:


μ=159+163+1823=168\mu=\dfrac{159+163+182}{3}=168

μX=19×159+29×161+19×163+29×170,5+29×172,5+19×182=168\mu_{\overline{X}}=\dfrac{1}{9}\times159+\dfrac{2}{9}\times161+\dfrac{1}{9}\times163+\dfrac{2}{9}\times170{,}5+\dfrac{2}{9}\times172{,}5+\dfrac{1}{9}\times182=168

Portanto, μX=μ\mu_{\overline{X}}=\mu


σ=(159168)2+(163168)2+(182168)23=3023\sigma=\sqrt{\dfrac{(159-168)^2+(163-168)^2+(182-168)^2}{3}}=\sqrt{\dfrac{302}{3}}


σX=(159168)29+2×(161168)29+(163168)29+2×(170,5168)29+2(172,5168)29+(182168)29=1513{\sigma_{\overline{X}}=\sqrt{\frac{(159-168)^2}{9}+2\times\frac{(161-168)^2}{9}+\frac{(163-168)^2}{9}+2\times\frac{(170{,}5-168)^2}{9}+2\frac{(172{,}5-168)^2}{9}+\frac{(182-168)^2}{9}}}=\sqrt{\frac{151}{3}}​​


Portanto, σX=σn=30232=1513\sigma_{\overline{X}}=\dfrac{\sigma}{\sqrt{n}}=\dfrac{\sqrt{\frac{302}{3}}}{\sqrt{2}}=\sqrt{\dfrac{151}{3}}


Teorema do limite central

O teorema do limite central é uma forma de evitar calcular a distribuição de amostragem dos estimadores para fazer estimação de parâmetros.

Assim, se uma amostra for suficientemente grande, (n30n\geqslant30), e for obtida por um processo aleatório, a distribuição de amostragem da média X\overline{X} pode ser aproximada a uma distribuição normal com valor médio μ\mu e desvio padrão σn\dfrac{\sigma}{\sqrt{n}}, em que μ\mu é o valor médio da população XX e σ\sigma é o seu desvio padrão. Escreve-se:


XN(μ,σn)\boldsymbol{\overline{X}\sim N\Bigg(\mu,\dfrac{\sigma}{\sqrt{n}}\Bigg)}


  • Se a população seguir uma distribuição normal, então podes aplicar o teorema do limite central, independentemente da dimensão da amostra, desde que o desvio padrão seja conhecido;
  • Quanto maior for a dimensão da amostra, melhor a distribuição de amostragem da média se aproxima à distribuição normal e menor será o desvio padrão da distribuição de amostragem, ou seja, menor será o erro cometido na estimação do valor médio.


Exemplo

Considera uma população constituída por 500500 gatos. Sabe-se que o valor médio do peso dos gatos é 4,2 kg4{,}2\ kg e o desvio padrão é 0,15 kg0{,}15 \ kg.

Recolheu-se uma amostra aleatória de 8282 gatos.

Define a distribuição de amostragem da média do peso dos gatos.


Como n=8230n=82\geqslant30 e a amostra é aleatória, podes utilizar o teorema do limite central.

μ=4,2 kg\mu=4{,}2 \ kg

σ=0,15 kg\sigma=0{,}15 \ kg

n=82n=82n=82\Leftrightarrow \sqrt{n}=\sqrt{82}


A distribuição de amostragem da média do peso dos gatos é normal e é definida da seguinte forma:


XN(4,2;0,1582)\overline{X}\sim N\Bigg(4{,}2;\dfrac{0{,}15}{\sqrt{82}}\Bigg)


Criar uma conta para ler o resumo

Exercícios

Criar uma conta para iniciar os exercícios

FAQs - Perguntas Frequentes

O que é o erro de amostragem?

Qual é a estatística utilizada para estimar a proporção populacional?

Qual é a estatística utilizada para estimar o valor médio de uma população?

Beta

Eu sou o Vulpy, teu companheiro de estudo de IA! Vamos estudar juntos.