Se quiseres saber a altura média de todos os encarregados de educação do país, podes pegar numa amostra de $200$ encarregados de educação, fazer a média amostral dessas alturas e inferir que a altura média dos encarregados de educação é essa média amostral. Neste caso, o parâmetro é a altura média dos encarregados de educação e a média das $200$ alturas dos encarregados de educação é a estatística.

A estatística utilizada para estimar o valor médio, $\mu$ , é a média amostral, $\bar{x}$ , em que $\overline{X }$ é o estimador;
A estatística utilizada para estimar a proporção populacional, $p$ , é a proporção amostral, $\^p$ , em que $P$ é o estimador.

A estimação de um parâmetro através de um único valor é chamado de estimação pontual. Esta estimação é feita recorrendo a um estimador, que é uma função da amostra em questão, ou seja, são variáveis aleatórias que podem assumir valores distintos, dependendo da amostra. A estimativa é o valor que o estimador assume em cada amostra.

Por outro lado, a estimação de um parâmetro através de um intervalo de valores é chamada de estimação intervalar.

O erro de amostragem é a diferença entre o valor do parâmetro e a estimativa feita através do estimador.

Nota: Amostras diferentes levam a estimativas diferentes!

Distribuição de amostragem

A distribuição de amostragem é o conjunto de todos os valores possíveis que uma estatística pode assumir, obtidos através de todas as amostras possíveis, cuja dimensão é $n$ .

Exemplo

Considera uma população constituída pelas alturas, em centímetros, de 3 alunos de uma escola de Lisboa: $(159,163,182)$ .

Define a distribuição de amostragem do estimador média ( $\overline{X}$ ), que representa essa população.

Se selecionares aleatoriamente uma amostra de dois elementos, por exemplo, $X=(159,163)$ , a média da amostra é dada por $\overline{X}=\dfrac{159+163}{2}=161$ .

Este valor é diferente do valor médio da população: $\mu=\dfrac{159+163+182}{3}=168$ .

Neste caso, como a população tem apenas $3$ elementos, consegues calcular o valor médio da população, mas, se a população tivesse muitos elementos, isso era quase impossível.

Podes ter, no total, $3^2=9$ amostras de dois elementos extraídas da população das alturas dos $3$ alunos da escola de Lisboa:

Alturas	$159$	$163$	$182$
$159$	$X_1=(159,159)$	$X_2=(163,159)$	$X_3=(182,159)$
$163$	$X_4=(159,163)$	$X_5=(163,163)$	$X_6=(182,163)$
$182$	$X_7=(159,182)$	$X_8=(163,182)$	$X_9=(182,182)$

As médias das $9$ amostras são as seguintes:

$\overline{X_1}=\dfrac{159+159}{2}=159$	$\overline{X_2}=\dfrac{163+159}{2}=161$	$\overline{X_3}=\dfrac{182+159}{2}=170{,}5$
$\overline{X_4}=\dfrac{159+163}{2}=161$	$\overline{X_5}=\dfrac{163+163}{2}=163$	$\overline{X_6}=\dfrac{182+163}{2}=172{,}5$
$\overline{X_7}=\dfrac{159+82}{2}=170{,}5$	$\overline{X_8}=\dfrac{163+182}{2}=172{,}5$	$\overline{X_9}=\dfrac{182+182}{2}=182$

Assim, $\overline{X}$ é uma variável aleatória e é possível escrever a sua distribuição de probabilidade.

Distribuição de amostragem do estimador média, $\overline{X}$ :

$\boldsymbol{\overline{X}=x_i}$	$159$	$161$	$163$	$170{,}5$	$172{,}5$	$182$
$\boldsymbol{P(\overline{X}=x_i)}$	$\dfrac{1}{9}$	$\dfrac{2}{9}$	$\dfrac{1}{9}$	$\dfrac{2}{9}$	$\dfrac{2}{9}$	$\dfrac{1}{9}$

Valor médio e desvio padrão da distribuição de amostragem do estimador média

O valor médio da distribuição de amostragem da média, $\mu_{\overline{X}}$ , é igual ao valor médio da população, $\mu$ .

Ou seja, o estimador média é não enviesado.

$\boldsymbol{\mu_{\overline{X}}=\mu}$

Por sua vez, o desvio padrão da distribuição de amostragem da média, $\sigma_{\overline{X}}$ , é igual a $\dfrac{\sigma}{\sqrt{n}}$ , em que $n$ é o número de elementos das amostras.

$\boldsymbol{\sigma_{\overline{X}}=\dfrac{\sigma}{\sqrt{n}}}$

Exemplo

Segundo o exemplo de cima, tens que:

$\mu=\dfrac{159+163+182}{3}=168$

$\mu_{\overline{X}}=\dfrac{1}{9}\times159+\dfrac{2}{9}\times161+\dfrac{1}{9}\times163+\dfrac{2}{9}\times170{,}5+\dfrac{2}{9}\times172{,}5+\dfrac{1}{9}\times182=168$

Portanto, $\mu_{\overline{X}}=\mu$

$\sigma=\sqrt{\dfrac{(159-168)^2+(163-168)^2+(182-168)^2}{3}}=\sqrt{\dfrac{302}{3}}$

${\sigma_{\overline{X}}=\sqrt{\frac{(159-168)^2}{9}+2\times\frac{(161-168)^2}{9}+\frac{(163-168)^2}{9}+2\times\frac{(170{,}5-168)^2}{9}+2\frac{(172{,}5-168)^2}{9}+\frac{(182-168)^2}{9}}}=\sqrt{\frac{151}{3}}$

Portanto, $\sigma_{\overline{X}}=\dfrac{\sigma}{\sqrt{n}}=\dfrac{\sqrt{\frac{302}{3}}}{\sqrt{2}}=\sqrt{\dfrac{151}{3}}$

Teorema do limite central

O teorema do limite central é uma forma de evitar calcular a distribuição de amostragem dos estimadores para fazer estimação de parâmetros.

Assim, se uma amostra for suficientemente grande, ( $n\geqslant30$ ), e for obtida por um processo aleatório, a distribuição de amostragem da média $\overline{X}$ pode ser aproximada a uma distribuição normal com valor médio $\mu$ e desvio padrão $\dfrac{\sigma}{\sqrt{n}}$ , em que $\mu$ é o valor médio da população $X$ e $\sigma$ é o seu desvio padrão. Escreve-se:

$\boldsymbol{\overline{X}\sim N\Bigg(\mu,\dfrac{\sigma}{\sqrt{n}}\Bigg)}$

Se a população seguir uma distribuição normal, então podes aplicar o teorema do limite central, independentemente da dimensão da amostra, desde que o desvio padrão seja conhecido;
Quanto maior for a dimensão da amostra, melhor a distribuição de amostragem da média se aproxima à distribuição normal e menor será o desvio padrão da distribuição de amostragem, ou seja, menor será o erro cometido na estimação do valor médio.

Exemplo

Considera uma população constituída por $500$ gatos. Sabe-se que o valor médio do peso dos gatos é $4{,}2\ kg$ e o desvio padrão é $0{,}15 \ kg$ .

Recolheu-se uma amostra aleatória de $82$ gatos.

Define a distribuição de amostragem da média do peso dos gatos.

Como $n=82\geqslant30$ e a amostra é aleatória, podes utilizar o teorema do limite central.

$\mu=4{,}2 \ kg$

$\sigma=0{,}15 \ kg$

$n=82\Leftrightarrow \sqrt{n}=\sqrt{82}$

A distribuição de amostragem da média do peso dos gatos é normal e é definida da seguinte forma:

$\overline{X}\sim N\Bigg(4{,}2;\dfrac{0{,}15}{\sqrt{82}}\Bigg)$

Criar uma conta para ler o resumo

Exercícios

Fácil

4 Tarefas

Médio

6 Tarefas

Difícil

4 Tarefas

Criar uma conta para iniciar os exercícios

FAQs - Perguntas Frequentes

O que é o erro de amostragem?

É a diferença entre o valor real do parâmetro e a estimativa feita através do estimador.

Qual é a estatística utilizada para estimar a proporção populacional?

É a proporção amostral.

Qual é a estatística utilizada para estimar o valor médio de uma população?

É a média amostral.

Beta

Eu sou o Vulpy, teu companheiro de estudo de IA! Vamos estudar juntos.

Distribuição de amostragem e teorema do limite central: Conceito e aplicação

Vídeos explicativos

Resumo

Exercícios

Selecionar aula

Inferência estatística

Modelos de probabilidade

Modelos populacionais

Modelos de grafos

Vídeo Explicativo

Resumo

Distribuição de amostragem e teorema do limite central: Conceito e aplicação

Estimação de parâmetros

Exemplo

Distribuição de amostragem

Exemplo

Valor médio e desvio padrão da distribuição de amostragem do estimador média

Exemplo

Teorema do limite central

Exemplo

Criar uma conta para ler o resumo

Exercícios

Fácil

Médio

Difícil

Criar uma conta para iniciar os exercícios

FAQs - Perguntas Frequentes

O que é o erro de amostragem?

Qual é a estatística utilizada para estimar a proporção populacional?

Qual é a estatística utilizada para estimar o valor médio de uma população?