As distribuições de probabilidade são funções matemáticas que descrevem a probabilidade de diferentes resultados para uma variável aleatória. Elas são fundamentais na estatística e na ciência de dados, permitindo modelar e entender fenômenos aleatórios em diversas áreas do conhecimento.
Cada distribuição tem pressupostos e aplicações específicas que devem ser considerados.
Símbolos e Conceitos Fundamentais
Variáveis Aleatórias
- Variável Aleatória Discreta (VAD): Assume valores em um conjunto finito ou infinito enumerável.
- Exemplo: Número de clientes em uma fila, número de acidentes por dia.
- Variável Aleatória Contínua (VAC): Assume valores em um intervalo contínuo.
- Exemplo: Peso, altura, tempo de espera.
Funções de Probabilidade
- Função de Probabilidade (Discreta): $P(X = x_i) = p_i$
- Função Densidade de Probabilidade (Contínua): $f(x)$ tal que $P(a \leq X \leq b) = \int_a^b f(x)dx$
- Função de Distribuição Acumulada (FDA): $F(x) = P(X \leq x)$
1. Distribuições Discretas
1.1 Distribuição de Bernoulli
Modela experimentos com apenas dois resultados possíveis (sucesso ou fracasso).
Parâmetros
- $p$: probabilidade de sucesso ($0 \leq p \leq 1$)
Função de Probabilidade
\(P(X = x) = p^x(1-p)^{1-x}, \text{ onde } x \in \{0,1\}\)
Média e Variância
- Média ($\mu$): $p$
- Variância ($\sigma^2$): $p(1-p)$
Aplicações
- Modelagem de sucesso/falha
- Testes binários (ex: teste de qualidade)
Lançamento de uma moeda viciada onde a probabilidade de cara (sucesso) é $p=0.6$.
using Distributions, Plots
d = Bernoulli(0.6)
data = rand(d, 1000)
histogram(data, bins=2, normalize=:pdf,
legend=false,
title="Distribuição de Bernoulli (p = 0.6)",
xlabel="Resultado",
ylabel="Densidade de Probabilidade",
xticks=([0, 1], ["Coroa", "Cara"]),
color=:steelblue,
alpha=0.6,
lw=0,
xlims=(-0.5, 1.5))
# Linha teórica
plot!([0, 1], [1 - 0.6, 0.6], seriestype=:sticks, color=:darkred, lw=2, label="Teórico")
1.2 Distribuição Binomial
Modela o número de sucessos em $n$ tentativas independentes de Bernoulli.
Parâmetros
- $n$: número de tentativas
- $p$: probabilidade de sucesso em cada tentativa
Função de Probabilidade
\(P(X = k) = C(n,k) \cdot p^k (1-p)^{n-k}, \text{ para } k = 0,1,2,...,n\)
onde $C(n,k) = \frac{n!}{k!(n-k)!}$ é o coeficiente binomial.
Média e Variância
- Média ($\mu$): $np$
- Variância ($\sigma^2$): $np(1-p)$
Aplicações
- Controle de qualidade
- Pesquisas de opinião
- Testes de múltipla escolha
Número de caras em 10 lançamentos de uma moeda justa.
using Distributions, Plots
# Parâmetros da distribuição binomial
n, p = 10, 0.5
d_bin = Binomial(n, p)
x = 0:n
probs_bin = pdf.(d_bin, x)
# Plotando a distribuição binomial (gráfico de barras)
bar(x, probs_bin,
legend=false,
title="Distribuição Binomial\nAproximação Normal (n = 10, p = 0.5)",
xlabel="Número de sucessos",
ylabel="Probabilidade",
color=:steelblue,
alpha=0.6,
lw=0,
bar_width=0.8,
ylims=(0, maximum(probs_bin) + 0.05))
# Anotações com valores de probabilidade
annotate!([(x[i], probs_bin[i] + 0.01, text(string(round(probs_bin[i], digits=3)), :black, 8)) for i in 1:length(x)]...)
# Parâmetros da normal aproximada
μ = n * p
σ = sqrt(n * p * (1 - p))
d_normal = Normal(μ, σ)
# Curva da normal: aplicamos a correção de continuidade para melhorar a aproximação
x_dense = range(0, n, length=200)
pdf_normal = pdf.(d_normal, x_dense)
# Sobrepondo a curva normal
plot!(x_dense, pdf_normal,
lw=2, color=:darkred,
label="Aproximação Normal")
1.3 Distribuição de Poisson
Usada para modelar o número de eventos que ocorrem em um intervalo fixo de tempo ou espaço.
Parâmetro
- $\lambda$: taxa média de ocorrências no intervalo
Função de Probabilidade
\(P(X = k) = \frac{e^{-\lambda} \lambda^k}{k!}, \text{ para } k = 0,1,2,...\)
Média e Variância
- Média ($\mu$): $\lambda$
- Variância ($\sigma^2$): $\lambda$
Aplicações
- Número de chamadas em uma central telefônica por hora
- Número de acidentes em uma rodovia por mês
- Número de erros de digitação por página
Número de chamadas recebidas por um call center em uma hora (λ = 5).
using Distributions, Plots
# Parameter λ (mean rate of occurrences)
λ = 5
# Create Poisson distribution
d = Poisson(λ)
# Values to plot (extending slightly beyond likely range)
x = 0:14
probs = pdf.(d, x)
# Create bar plot
bar(x, probs,
legend=:topright,
title="Distribuição de Poisson (λ = $λ)",
xlabel="Número de Eventos (k)",
ylabel="Probabilidade P(X = k)",
color=:steelblue,
alpha=0.6,
bar_width=0.8,
lw=0,
xticks=x,
grid=false,
framestyle=:box)
# Add vertical lines for mean and standard deviation
μ = mean(d) # For Poisson, μ = λ
σ = std(d) # For Poisson, σ = √λ
vline!([μ], linestyle=:dash, color=:darkred, linewidth=2, label="Média (μ = $μ)")
vline!([μ - σ, μ + σ], linestyle=:dot, color=:slateblue, linewidth=2, label="±1σ (σ = $(round(σ, digits=2)))")
# Annotate probabilities for significant bars
for (xi, prob) in zip(x, probs)
if prob > 0.01 # Only label probabilities > 1%
annotate!(xi, prob + 0.005, text("$(round(prob, digits=3))", 8, :black, :center))
end
end
# Adjust plot limits
ylims!(0, maximum(probs) + 0.03)
xlims!(-0.5, 14.5)
# Add Poisson PMF formula to plot
annotate!(10, maximum(probs)*0.9, text("Fórmula:\nP(X=k) = e^{-λ}λ^k/k!", 10, :black, :right))
A distribuição de Poisson foi introduzida por Siméon Denis Poisson em 1837 em seu trabalho sobre a probabilidade de condenações em julgamentos criminais.
2. Distribuições Contínuas
2.1 Distribuição Normal (Gaussiana)
A distribuição mais importante em estatística, com forma de sino simétrico.
Parâmetros
- $\mu$: média (localização do pico)
- $\sigma$: desvio padrão (largura da curva)
Função Densidade de Probabilidade
\(f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\)
Propriedades
- Simétrica em relação à média
- Média = Mediana = Moda
- Aproximadamente 68% dos dados estão dentro de $\mu \pm \sigma$
- Aproximadamente 95% dos dados estão dentro de $\mu \pm 2\sigma$
- Aproximadamente 99.7% dos dados estão dentro de $\mu \pm 3\sigma$
Aplicações
- Altura, peso, QI
- Erros de medição
- Características biológicas
Distribuição de alturas de uma população (μ = 170cm, σ = 10cm).
using Distributions, Plots
μ, σ = 170, 10
d = Normal(μ, σ)
x = 130:0.1:210
pdf_values = pdf.(d, x)
plot(x, pdf_values,
lw=2,
legend=true,
title="Distribuição Normal\n(μ = $μ, σ = $σ)",
titlefontsize=11,
xlabel="Altura (cm)",
ylabel="Densidade de Probabilidade",
grid=true,
color=:steelblue,
fillrange=0,
fillalpha=0.2,
fillcolor=:cornflowerblue)
vline!([μ], lw=2, linestyle=:dash, color=:black, label="μ = $μ")
vline!([μ - σ, μ + σ], lw=1, linestyle=:dot, color=:red, label="±1σ")
vline!([μ - 2σ, μ + 2σ], lw=1, linestyle=:dot, color=:orange, label="±2σ")
vline!([μ - 3σ, μ + 3σ], lw=1, linestyle=:dot, color=:green, label="±3σ")
2.2 Distribuição Exponencial
Modela o tempo entre eventos em um processo de Poisson.
Parâmetro
- $\lambda$: taxa de ocorrência
Função Densidade de Probabilidade
\(f(x) = \lambda e^{-\lambda x}, \text{ para } x \geq 0\)
Média e Variância
- Média ($\mu$): $1/\lambda$
- Variância ($\sigma^2$): $1/\lambda^2$
Aplicações
- Tempo entre chamadas telefônicas
- Vida útil de componentes eletrônicos
- Tempo de espera em filas
Tempo entre chegadas de clientes em um banco (λ = 0.5 clientes/minuto).
using Distributions, Plots
# Parameter
λ = 0.5
d = Exponential(1/λ)
# Values
x = 0:0.1:10
pdf_values = pdf.(d, x)
# Statistics
μ = mean(d)
med = quantile(d, 0.5)
σ² = var(d) # Variance
σ = std(d) # Standard deviation
# Create plot
plot(x, pdf_values,
linewidth=2,
legend=:topright,
title="Distribuição Exponencial (λ = $λ)",
xlabel="Tempo entre chegadas (min)",
ylabel="Densidade de Probabilidade",
grid=true,
color=:steelblue,
fillrange=0,
fillalpha=0.2,
fillcolor=:lightblue,
framestyle=:zerolines)
# Vertical lines for statistics
vline!([μ], linestyle=:dash, linewidth=2, color=:black, label="Média = $(round(μ, digits=2))")
vline!([med], linestyle=:dot, linewidth=2, color=:red, label="Mediana = $(round(med, digits=2))")
vline!([μ + σ], linestyle=:dashdot, linewidth=1.5, color=:green, label="μ + σ = $(round(μ+σ, digits=2))")
# Annotations
annotate!(μ, pdf(d, μ)+0.005, text("μ", :black, 10))
annotate!(med, pdf(d, med)+0.005, text("med", :red, 10))
annotate!(μ+σ, pdf(d, μ+σ)+0.005, text("μ+σ", :green, 10))
# Add variance information
annotate!(5, 0.25,
text("Estatísticas:\nMédia (μ) = 1/λ = $(round(μ, digits=2))\n" *
"Variância (σ²) = 1/λ² = $(round(σ², digits=2))\n" *
"Desvio Padrão (σ) = 1/λ = $(round(σ, digits=2))",
10, :left))
# Highlight important region
plot!(x, pdf_values, fillrange=0, fillalpha=0.3, fillcolor=:steelblue,
label="P(X ≤ $(round(μ, digits=2))) = $(round(cdf(d, μ), digits=2))")
# Add exponential formula
annotate!(7, 0.35, text("f(x) = λe^{-λx}", 12, :left))
2.3 Distribuição Uniforme Contínua
Todos os valores em um intervalo têm a mesma probabilidade de ocorrência.
Parâmetros
- $a$: limite inferior
- $b$: limite superior
Função Densidade de Probabilidade
\(f(x) = \frac{1}{b-a}, \text{ para } a \leq x \leq b\)
Média e Variância
- Média ($\mu$): $\frac{a+b}{2}$
- Variância ($\sigma^2$): $\frac{(b-a)^2}{12}$
Aplicações
- Geração de números aleatórios
- Modelagem de situações equiprováveis
- Simulações computacionais
Geração de números aleatórios entre 0 e 1.
using Distributions, Plots
# Parâmetros da distribuição uniforme
a, b = 0, 1
# Criando a distribuição
d = Uniform(a, b)
# Calculando Média e Variância
μ = mean(d)
σ² = var(d)
# Valores para o eixo x
x = -0.5:0.01:1.5
# Calculando a PDF
pdf_values = pdf.(d, x)
# Plotando PDF
plot(x, pdf_values,
lw=2,
legend=true,
title="Distribuição Uniforme (a=$a, b=$b)",
xlabel="Valor",
ylabel="Densidade de Probabilidade",
ylim=(0, 1.2),
grid=true,
color=:steelblue,
fillrange=0,
fillalpha=0.2,
fillcolor=:lightblue)
# Linhas verticais para limites, média
vline!([a], linestyle=:dash, color=:red, alpha=0.7, label="Limite a = $a")
vline!([b], linestyle=:dash, color=:orange, alpha=0.7, label="Limite b = $b")
vline!([μ], linestyle=:dashdot, color=:purple, alpha=0.8, lw=2, label="Média μ = $(round(μ, digits=2))")
# Linha horizontal da densidade constante
hline!([pdf(d, 0.5)], linestyle=:dot, color=:green, label="Densidade Constante = $(round(pdf(d, 0.5), digits=2))")
# Pontos destacados nos limites e média
scatter!([a, b, μ], [pdf(d, a), pdf(d, b), pdf(d, μ)],
markersize=7,
markercolor=:white,
markerstrokecolor=[:red, :orange, :purple],
markerstrokewidth=2,
label="")
# Anotações para a, b, média
annotate!([(a, -0.1, text("a = $a", :red, 10, :center)),
(b, -0.1, text("b = $b", :orange, 10, :center)),
(μ, 0.05, text("μ = $(round(μ, digits=2))", :purple, 10, :center))])
# Texto para variância no gráfico
annotate!(0.5, 0.5, text("Variância σ² = $(round(σ², digits=3))", :black, 11))
plot!(legend=:topright)
3. Como Escolher a Distribuição Correta?
- Identifique o tipo de variável: Discreta ou contínua?
- Analise o domínio dos dados: Quais valores são possíveis?
- Verifique a forma dos dados: Simétricos, assimétricos, com caudas pesadas?
- Considere o fenômeno subjacente: Qual modelo teórico melhor se ajusta ao fenômeno?
- Use testes de adequação:
- Teste Qui-quadrado
- Teste de Kolmogorov-Smirnov
- Teste de Anderson-Darling
- Gráficos Q-Q
A escolha incorreta da distribuição pode levar a conclusões equivocadas. Sempre valide os pressupostos antes de realizar inferências.
4. Aplicações Práticas
5. Aplicações Práticas
Engenharia
- Controle de qualidade (Distribuição Normal)
- Confiabilidade de sistemas (Distribuição Exponencial, Weibull)
- Processos estocásticos (Distribuição de Poisson)
Finanças
- Modelagem de riscos (Distribuição Normal, t-Student)
- Precificação de opções (Distribuição Log-Normal)
- Análise de retornos financeiros (Distribuição Normal, Cauchy)
Ciências Naturais
- Física: Movimento browniano (Distribuição Normal)
- Química: Decaimento radioativo (Distribuição Exponencial)
- Biologia: Crescimento populacional (Distribuição de Poisson)
Ciências Sociais
- Pesquisas de opinião (Distribuição Binomial)
- Estudos demográficos (Distribuição de Poisson, Normal)
- Psicometria (Distribuição Normal)
Referências
- Bussab, W. O.; Morettin, P. A. Estatística Básica. 9ª ed. Saraiva, 2017.
- Montgomery, D. C.; Runger, G. C. Estatística Aplicada e Probabilidade para Engenheiros. 5ª ed. LTC, 2015.
- Magalhães, M. N.; Lima, A. C. P. Noções de Probabilidade e Estatística. 7ª ed. Edusp, 2013.
- Triola, M. F. Introdução à Estatística. 11ª ed. LTC, 2008.
- Devore, J. L. Probabilidade e Estatística para Engenharia e Ciências. 8ª ed. Cengage Learning, 2014.