Amostragem

Conteúdo sobre técnicas de amostragem.

Introdução

A amostragem é o processo de selecionar um subconjunto representativo de uma população para realizar inferências estatísticas sobre toda a população. Uma amostra bem escolhida permite estimar parâmetros populacionais com precisão e eficiência, reduzindo custos e tempo em relação ao censo completo.

Amostragem

Figura: Exemplo visual de amostragem em uma população.

Por que Amostrar?


Conceitos Fundamentais


Tipos de Amostragem: Conceitos, Prós, Contras e Exemplos

1. Amostragem Aleatória Simples

Conceito: Cada elemento da população tem a mesma probabilidade de ser selecionado. A seleção é feita de forma totalmente aleatória, geralmente por sorteio ou uso de geradores de números aleatórios.

Prós:

Contras:

Exemplo prático manual (passo a passo):

Uma escola tem 10 alunos (A, B, C, D, E, F, G, H, I, J). Queremos sortear 3 para uma pesquisa.

  1. Liste todos os alunos: A, B, C, D, E, F, G, H, I, J
  2. Atribua um número a cada aluno: 1 a 10
  3. Sorteie 3 números aleatórios entre 1 e 10 (ex: 2, 7, 9)
  4. Os alunos selecionados são: B, G, I

Exemplo em Julia:

julia
using Random
alunos = ["A", "B", "C", "D", "E", "F", "G", "H", "I", "J"]
Random.seed!(123) # para reprodutibilidade
amostra = sample(alunos, 3; replace=false)
println("Amostra selecionada: ", amostra)
# Saída
Amostra selecionada: ["B", "G", "I"]

2. Amostragem Sistemática

Conceito: Seleciona-se um ponto de partida aleatório e, a partir dele, escolhe-se cada k-ésimo elemento da lista ordenada da população.

Prós:

Contras:

Exemplo prático manual (passo a passo):

População de 20 funcionários, queremos amostra de 5.

  1. Calcule o intervalo k: $k = N/n = 20/5 = 4$
  2. Sorteie um número inicial entre 1 e 4 (ex: 3)
  3. Selecione os funcionários nas posições: 3, 7, 11, 15, 19

Exemplo em Julia:

julia
using Random
N = 20; n = 5
k = div(N, n)
Random.seed!(42)
inicio = rand(1:k)
posicoes = [inicio + (i-1)*k for i in 1:n]
println("Posições selecionadas: ", posicoes)
# Saída
Posições selecionadas: [3, 7, 11, 15, 19]

3. Amostragem Estratificada

Conceito: A população é dividida em grupos homogêneos (estratos) e amostras são retiradas de cada estrato proporcionalmente ao seu tamanho.

Prós:

Contras:

Exemplo prático manual (passo a passo):

População: 100 alunos (60 do curso A, 40 do curso B). Queremos amostra de 10.

  1. Calcule proporção de cada estrato:
    • Curso A: $60/100 = 60\%$ → 6 alunos
    • Curso B: $40/100 = 40\%$ → 4 alunos
  2. Sorteie 6 alunos do curso A e 4 do curso B aleatoriamente

Exemplo em Julia:

julia
using Random
alunos_A = ["A"*string(i) for i in 1:60]
alunos_B = ["B"*string(i) for i in 1:40]
Random.seed!(7)
amostra_A = sample(alunos_A, 6; replace=false)
amostra_B = sample(alunos_B, 4; replace=false)
amostra = vcat(amostra_A, amostra_B)
println("Amostra estratificada: ", amostra)
# Saída
Amostra estratificada: ["A2", "A14", "A23", "A36", "A41", "A59", "B3", "B7", "B19", "B32"]

4. Amostragem por Conglomerados

Conceito: A população é dividida em grupos heterogêneos (conglomerados) e alguns grupos inteiros são sorteados para análise.

Prós:

Contras:

Exemplo prático manual (passo a passo):

População: 5 bairros, cada um com 100 casas. Queremos amostrar 2 bairros e entrevistar todas as casas desses bairros.

  1. Liste os bairros: B1, B2, B3, B4, B5
  2. Sorteie 2 bairros (ex: B2, B4)
  3. Entrevistar todas as 100 casas de B2 e todas as 100 casas de B4

Exemplo em Julia:

julia
using Random
bairros = ["B1", "B2", "B3", "B4", "B5"]
Random.seed!(21)
conglomerados = sample(bairros, 2; replace=false)
println("Bairros sorteados: ", conglomerados)
# Saída
Bairros sorteados: ["B2", "B4"]

5. Amostragem Casual ou por Conveniência

Conceito: Amostra formada por elementos de fácil acesso ao pesquisador.

Prós:

Contras:

Exemplo prático manual (passo a passo):

Um pesquisador entrevista as 10 primeiras pessoas que encontra em um shopping.

Exemplo em Julia:

julia
pessoas = ["P"*string(i) for i in 1:100]
amostra = pessoas[1:10]
println("Amostra casual: ", amostra)
# Saída
Amostra casual: ["P1", "P2", "P3", "P4", "P5", "P6", "P7", "P8", "P9", "P10"]

6. Amostragem por Quotas

Conceito: Amostra formada por cotas preestabelecidas de acordo com características da população (ex: sexo, idade, renda).

Prós:

Contras:

Exemplo prático manual (passo a passo):

Uma pesquisa exige 5 homens e 5 mulheres. O pesquisador entrevista até atingir essas cotas.

Exemplo em Julia:

julia
pessoas = [("M", i) for i in 1:50]  # homens
pessoas = vcat(pessoas, [("F", i) for i in 1:50])  # mulheres
amostra_homens = filter(x -> x[1] == "M", pessoas)[1:5]
amostra_mulheres = filter(x -> x[1] == "F", pessoas)[1:5]
amostra = vcat(amostra_homens, amostra_mulheres)
println("Amostra por quotas: ", amostra)
# Saída
Amostra por quotas: [("M", 1), ("M", 2), ("M", 3), ("M", 4), ("M", 5), ("F", 1), ("F", 2), ("F", 3), ("F", 4), ("F", 5)]

7. Amostragem Intencional (ou por Julgamento)

Conceito: O pesquisador seleciona intencionalmente elementos que considera mais representativos.

Prós:

Contras:

Exemplo prático manual (passo a passo):

Um especialista escolhe 5 empresas líderes do setor para um estudo de benchmarking.

Exemplo em Julia:

julia
empresas = ["EmpresaA", "EmpresaB", "EmpresaC", "EmpresaD", "EmpresaE", "EmpresaF", "EmpresaG"]
amostra = empresas[[1, 2, 3, 4, 5]]  # escolhidas pelo especialista
println("Amostra intencional: ", amostra)
# Saída
Amostra intencional: ["EmpresaA", "EmpresaB", "EmpresaC", "EmpresaD", "EmpresaE"]

8. Amostragem Bola de Neve

Conceito: Os primeiros participantes indicam novos participantes, formando uma cadeia de indicações.

Prós:

Contras:

Exemplo prático manual (passo a passo):

Um pesquisador entrevista um usuário de um grupo restrito, que indica outro, e assim por diante, até atingir o tamanho desejado.

Exemplo em Julia:

julia
pessoas = ["P1", "P2", "P3", "P4", "P5", "P6", "P7", "P8", "P9", "P10"]
indicacoes = Dict("P1"=>"P3", "P3"=>"P7", "P7"=>"P10", "P10"=>"P5")
# Começa com P1 e segue as indicações
amostra = ["P1"]
while haskey(indicacoes, amostra[end])
    push!(amostra, indicacoes[amostra[end]])
end
println("Amostra bola de neve: ", amostra)
# Saída
Amostra bola de neve: ["P1", "P3", "P7", "P10", "P5"]

Avisos Importantes


Fórmulas Básicas

Tamanho da Amostra para Proporção

\[n = \frac{z_{\alpha/2}^2 \hat{p}(1-\hat{p})}{E^2}\]

Onde:

Tamanho da Amostra para Média

\[n = \left(\frac{z_{\alpha/2} \sigma}{E}\right)^2\]

Onde:


Exemplo Prático

Uma fábrica deseja estimar a proporção de peças defeituosas em sua produção diária. Deseja-se um erro máximo de 3% e um nível de confiança de 95%. Supondo proporção estimada de 0,10, qual o tamanho mínimo da amostra?

Resolução

\[z = 1,96\ (95\%\ de\ confiança)\qquad \hat{p} = 0,10\qquad E = 0,03\] \[n = \frac{1,96^2 \times 0,10 \times 0,90}{0,03^2} = \frac{3,8416 \times 0,09}{0,0009} = \frac{0,3457}{0,0009} \approx 384,11\]

Arredondando para cima:

\[n = 385\]

Portanto, a amostra deve ter pelo menos 385 peças.

Exemplo em Julia

julia
using Distributions

# Parâmetros
z = quantile(Normal(), 1 - 0.05/2)  # 95% de confiança
p̂ = 0.10                            # proporção estimada
erro = 0.03                         # erro máximo tolerável

# Cálculo do tamanho da amostra
n = ceil(Int, (z^2 * p̂ * (1 - p̂)) / erro^2)

println("Tamanho mínimo da amostra: $n")
# Saída
Tamanho mínimo da amostra: 385

Exemplo Prático: Pesquisa de Intenção de Voto para Presidente

Uma empresa de pesquisas deseja estimar a proporção de eleitores que pretendem votar em um determinado candidato à presidência. Para garantir um nível de confiança de 95% e um erro máximo de 2%, qual deve ser o tamanho mínimo da amostra, supondo que a proporção estimada de intenção de voto seja de 40%?

Resolução Manual Passo a Passo

Dados:

O que é a proporção estimada ($\hat{p}$)?

A proporção estimada ($\hat{p}$) representa a melhor estimativa, antes da pesquisa, da fração da população que possui a característica de interesse. No contexto de uma pesquisa eleitoral, é a estimativa inicial da porcentagem de eleitores que pretendem votar no candidato analisado. Essa estimativa pode ser baseada em pesquisas anteriores, dados históricos ou, na ausência de informações, pode-se usar o valor mais conservador ($\hat{p} = 0,5$), que resulta no maior tamanho de amostra possível.

1. Valor crítico $z_{\alpha/2}$

Para 95% de confiança: \(z_{\alpha/2} = 1,96\)

2. Aplicando a fórmula do tamanho da amostra para proporção

\[n = \frac{z_{\alpha/2}^2 \hat{p}(1-\hat{p})}{E^2}\]

Substituindo os valores: \(n = \frac{1,96^2 \times 0,40 \times 0,60}{0,02^2}\)

Calculando passo a passo:

\[n = \frac{3,8416 \times 0,24}{0,0004} = \frac{0,921984}{0,0004} = 2304,96\]

Arredondando para cima: \(n = 2305\)

Portanto, a amostra deve ter pelo menos 2.305 eleitores para garantir o erro máximo de 2% com 95% de confiança.


Exemplo em Julia

julia
using Distributions

# Parâmetros
z = quantile(Normal(), 1 - 0.05/2)  # 95% de confiança
p̂ = 0.40                            # proporção estimada
erro = 0.02                         # erro máximo tolerável

# Cálculo do tamanho da amostra
n = ceil(Int, (z^2 * p̂ * (1 - p̂)) / erro^2)

println("Tamanho mínimo da amostra: $n")
# Saída
Tamanho mínimo da amostra: 2305

Referências Bibliográficas

  1. Montgomery, D. C., & Runger, G. C. (2010). Applied Statistics and Probability for Engineers.
  2. Morettin, P. A., & Bussab, W. O. (2017). Estatística Básica.
  3. Triola, M. F. (2017). Introdução à Estatística.