Considera uma população e uma variável quantitativa x associada. A amostra (x) é um qualquer subconjunto dessa população.
Exemplo
Pretende-se fazer um estudo sobre os alunos de 10.º ano em Portugal. Na impossibilidade de recolher dados sobre todos eles, escolhemos um conjunto representativo de alunos de 10.º ano para o fazer.
A esse conjunto de alunos chamamos amostra.
Média de uma amostra
Tem em conta uma população e uma variável quantitativa x associada. Seja x uma amostra de dimensão n, com n∈N, então calculamos a média da amostra da seguinte forma:
xˉ=n1i=1∑nxi
Exemplo
Seja x a seguinte amostra de dados:
1,2,2,2,3,3,3,3,5
Então, tens que a média do conjunto de dados será calculada da seguinte forma:
xˉ=91i=1∑9xi=91+2+2+2+3+3+3+3+5=38
Média em dados agrupados
Tem em conta uma população e uma variável estatística associada. Seja x uma amostra de dimensão n, tal que:
x=(x1,...,xn)
Considera ainda, que dentro dos n elementos da amostra, apenas m elementos são distintos. O seguinte conjunto é o conjunto dos representantes de cada elemento distinto da amostra:
x~=(x1~,...,xm~)
Seja ni a frequência absoluta de cada x~i, então:
i=1∑mni=n e i=1∑nxi=i=1∑mnixi~
Logo, a média em dados agrupados será dada por:
xˉ=n1i=1∑mnixi~
Exemplo
Observa a amostra do exemplo anterior.
Tendo em conta x~=(1,2,3,5) e ni com i∈{1,2,3,4} igual à frequência absoluta de cada um dos dados distintos da amostra.
Então, a média pode ser calculada por:
xˉ=91i=1∑4xi~ni=91×1+2×3+3×4+5×1=38
Nota: Esta resolução é uma alternativa à do exemplo anterior, utiliza a que te for mais favorável.
Desvios em relação à média
Seja x=(x1,...,xn) uma amostra. Denomina-se desvio de xi em relação à média o valor:
di=xi−xˉ
Nota:Temosi=1∑ndi=0.
Exemplo
Tem em conta o exemplo anterior e calcula d1.
d1=1−38=−35
Soma dos quadrados dos desvios em relação à média de uma amostra
Considera uma amostra x=(x1,...,xn). Denota-se a soma dos quadrados dos desvios em relação à média por SSx, e calcula-se a partir da seguinte formula:
SSx=j=1∑n(dj)2=j=1∑n(xj−xˉ)2
Nota: Diz-se que SSx associada a uma amostra de dimensão n, tem n−1 graus de liberdade, dado que só o conhecimento do valor de n−1 desvios, permite determinar o enésimo.