Professional Documents
Culture Documents
Engenharia de Produção
EMENTA:
Probabilidades e seus eventos. Probabilidade condicional. Eventos independentes. Teorema de Bayes.
Variáveis aleatórias: distribuição, esperança e variabilidade. Distribuições de probabilidades discretas e
contínuas. Inferência: População e amostra. Métodos de amostragem. Distribuição amostral. Intervalos
de confiança. Teste de hipóteses. Correlação e Regressão.
OBJETIVO:
Possibilitar aos estudantes o acesso a conceitos e procedimentos fundamentais da metodologia
estatística, como ferramenta de suporte à tomada de decisão e à abordagem cientifica de populações,
sistemas e processos, nas áreas de engenharia, indústria, comercio e serviços.
Saiba
mais
Clique aqui
www.udemy.com
Junte-se a milhões de estudantes na maior plataforma on-line
de cursos curtos e práticos do mundo.
Com mais de 45.000 cursos virtuais disponíveis, o Udemy é uma plataforma global de
ensino on-line onde 15 milhões de alunos estão dominando novas habilidades.
Sumário
Engenharia de Produção -3-
APRESENTAÇÃO
DA DISCIPLINA
Uma das ferramentas mais utilizadas hoje em dia
pelos cientistas, analistas financeiros, médicos, engenheiros,
jornalistas etc. é a Estatística, que descreve os dados observados e
desenvolve a metodologia para a tomada de decisão em presença
da incerteza. O verbete estatística foi introduzido no século XVIII,
tendo origem na palavra latina status (Estado), e serviu
inicialmente a objetivos ligados à organização político-social, como
o fornecimento de dados ao sistema de poder vigente. Hoje em dia,
os modelos de aplicação da Teoria Estatística se estendem por todas
as áreas do conhecimento, como testes educacionais, pesquisas
eleitorais, análise de riscos ambientais, finanças, controle de
qualidade, análises clínicas, índices de desenvolvimento,
modelagem de fenômenos atmosféricos etc. Podemos
informalmente dizer que a Teoria Estatística é uma ferramenta que
ajuda a tomar decisões com base na evidência disponível, decisões
essas afetadas por margens de erro, calculadas através de modelos
de probabilidade.
Números 1: 1-4; 46
Sumário
1 – INTRODUÇÃO À PROBABILIDADE (REVISÃO) ESTIMATIVAS E TAMANHOS AMOSTRAIS
Estimativa pontual e intervalar, 64
PROBABILIDADE BÁSICA Intervalos de confiança – IC, 64
Revisão de Contagem e Probabilidade, 7 Intervalos de confiança para média (amostras grandes), 64
Probabilidade com eventos complementares, 8 Determinação do tamanho da amostra, 66
ADIÇÃO DE PROBABILIDADES Intervalos de confiança para média (amostras pequenas), 66
Probabilidade com eventos mutuamente exclusivos, 9 Intervalos de confiança para Proporções P, 68
Probabilidade com eventos NÃO mutuamente exclusivos, 9 Determinação do tamanho da amostra para P, 68
PROBABILIDADE CONDICIONAL E MULTIPLICAÇÃO DE Intervalos de confiança para o Desvio padrão, 69
PROBABILIDADES
Probabilidade com eventos dependentes, 10 5 – TESTE DE HIPÓTESE
Multiplicação de probabilidade com eventos dependentes, 12
Conceitos introdutórios, 73
Multiplicação de probabilidade com eventos independentes, 13
Teste de hipótese para média (amostras grandes),74
Teorema de Bayes, 14
Teste de hipótese para média (amostras pequenas), 75
Apêndice A – Quadro resumo de probabilidades, 15
Teste de hipótese para proporção, 76
2 – VARIÁVEIS ALEATÓRIAS Teste de hipótese para o desvio padrão, 77
Teste para duas amostras – conceitos introdutórios, 80
VARIÁVEL ALEATÓRIA E DISTRIBUIÇÕES DE PROBABILIDADES, 17 Teste para diferença de duas médias (dependente),80
VALOR ESPERADO, 19 Teste para diferença de duas médias (independente), 82
VARIÂNCIA E DESVIO PADRÃO, 20
Distribuição de Weibull, 54
CAPÍTULO 1
INTRODUÇÃO À
PROBABILIDADE
É possível quantificar o
acaso?
Probabilidade
figuras
(Paus)
13 cartas
(Ouros)
13 cartas
(Espadas)
13 cartas
(Copas)
13 cartas
Sair um Reis: Como temos 4 Reis no baralho (um de Paus, um de Ouros, um de Espadas e um de Copas). Então:
Uma probabilidade próxima de 0 indica que é pouco provável que um evento ocorra, enquanto que próxima de 1 revela que um
evento é quase certo. Outras probabilidades entre 0 e 1 representam o grau de possibilidade de um evento vir a ocorrer. A figura
abaixo retrata a imagem da probabilidade como uma medida numérica da possibilidade de um evento ocorrer.
Chance 50-50
Por exemplo, o meteorologista diz que a probabilidade de chover amanhã é de 0,4 (ou 40%). Assim, os 0,4 (ou 40%) de chances de
chover amanhã podem significar que se você observar os dados obtidos a partir de um grande número de dias semelhantes ao tipo
de dia esperado para amanhã, vai descobrir que choveu em 40% desses dias.
Probabilidade do P( A ) = 1 – P(A)
evento não ocorrer Probabilidade clássica
EXEMPLO
O diagrama e Venn abaixo ilustra a relação entre o espaço amostral, o evento A e seu complemento A :
P(A) = 16,66% P( A ) = 83,33%
Probabilidade A S Probabilidade com
1
Clássica Evento
2 3 Complementar
5
6
4 A
ADIÇÃO DE PROBABILIDADES
Probabilidade com Eventos mutuamente exclusivos
É a probabilidade com eventos que não ocorrem ao mesmo tempo. Ou ocorre A ou ocorre B (A ou B).
A ocorrência de um evento impossibilita a ocorrência do outro.
Dois eventos são mutuamente exclusivos quando a ocorrência de um evento exclui a ocorrência de outro. É impossível ocorrer os eventos A
e B ao mesmo tempo. Então, o termo “ou” indicará “adição de probabilidades”. Para encontrar a probabilidade de um evento ou outro
ocorrer, adicionamos as probabilidades de cada evento: P(A ou B) = P(A) + P(B).
Exemplo 2. Ao retirar uma carta de um baralho de 52 cartas, a Exemplo 3. Numa urna estão 10 bolas, sendo 2 pretas
probabilidade de sair um Rei ou uma Dama é: (P), 5 amarelas (A) e 3 verdes (V). Pegando-se uma bola,
qual a probabilidade de ela ser preta ou verde?
A = {R,R,R,R } → A=4 P(AouB) = 4 + 4 = 8 = 0,1538 A = {P,P } → A=2 P(AouB) = 2 + 3 = 5 = 0,5
B = {D,D,D,D} → B=4 52 52 52 B= {V,V,V} → B=3 10 10 10
S = {52 cartas → S = 52
S = {10} → S = 10
Dois eventos NÂO são mutuamente exclusivos quando a ocorrência de um evento não exclui a ocorrência de outro. É possível ocorrer os
eventos A e B ao mesmo tempo. O termo “ou”, indicará “adição” e “e” indicará “ambos”
Exemplo 1 Ao lançar um dado, a probabilidade de obter um número ímpar ou menor que 3 é:
ímpar Menor que 3 Os eventos A e B não são mutuamente exclusivos, pois “1” ocorre em A e B (ambos).
B S
A 3 2 5
Se aplicarmos P(AouB) = P(A) + P(B) teremos: /6 + /6 = /6. Observe no diagrama que
3 4
este resultado está incorreto, pois P(AouB) = /6. Este erro foi provocado pela dupla
1 6
5 2 contagem de “1”.
4
Neste caso, ajustaremos a regra da soma para evitar a dupla contagem. A equação será:
AeB
* Regra da soma para três eventos: P(A ou B ou C) = P(A) + P(B) + P(C) - P(A e B) - P(B e C) + P(A e B e C)
; Diz-se probabilidade condicional quando a ocorrência de um evento está condicionada à ocorrência do outro.
Portanto, os eventos são dependentes. A probabilidade de um é alterada pela existência do outro.
Ao calcular P(B|A) tudo se passa como se P(A) fosse o novo espaço amostral “reduzido” dentro do qual, queremos
calcular a probabilidade de B. Não utilizamos o espaço amostral original.
Exemplo 1. Ao lançar um dado, observou-se um número maior que 2 (evento A ocorreu). Qual a probabilidade de esse
número ser o “5” (evento B)?
O evento A ocorreu e queremos saber o B (dentro de A):
Maior que 2 Ser o 5
A B A = {3, 4, 5, 6}
4 3
B = {5}
Novo espaço 6 5
P(B|A) será a probabilidade de ocorrer o número 5 no novo espaço
amostral
amostral reduzido de A. Então:
EXEMPLO 2 Ao lançar um dado, observou-se um número maior que 1 (evento A ocorreu). Qual é a probabilidade de esse
número ser ímpar (Evento B)?
EXEMPLO 3 Duas cartas são selecionadas em sequência em um baralho. Qual a probabilidade de que a 2ª
carta seja uma dama, dado que a 1ª seja um rei. (assuma que o rei está sem reposição).
Solução. Em razão de a primeira carta ser um rei e não ser a resposta, P (B|A) = 4 = 0,078
o baralho restante tem 51 cartas, 4 das quais são dama. Então: 51
EXEMPLO 4 Cinco cartas são selecionadas em sequência em um baralho. Qual a probabilidade de que a 5ª carta seja uma
dama. Dado que a 1ª = rei; 2ª = dama; 3ª = 8 ; 4ª = Ás. (assuma que não há reposição).
EXEMPLO 5 Numa pesquisa sobre a preferência de dois jornais, consultamos 470 pessoas e o resultado foi o seguinte: 250
lêem o jornal A, 180 lêem o jornal B, 60 lêem os jornais A e B. Escolhendo uma pessoa ao acaso, qual a probabilidade de:
a) Um leitor do jornal A, também ser leitor do B? b) Um leitor do jornal B, também ser leitor do A?
Jornal Jornal
Jornal A B Jornal A B
Novo espaço
190 60 190 60
amostral
Novo espaço
amostral 120 120
O evento A ocorreu e queremos saber o B. Então, denotamos O evento B ocorreu e queremos saber o A. Então, denotamos
P(B|A). Dentre os leitores do Jornal A, devemos destacar os que P(A|B). Dentre os leitores do Jornal B, devemos destacar os que
lêem B; logo, o espaço amostral desse evento é A (190+60=250). lêem A; logo, o espaço amostral desse evento é B (120+60=180).
Então, a probabilidade é: Então, a probabilidade é:
EXEMPLO 6. O quadro abaixo mostra os resultados de um estudo no qual os pesquisadores examinaram o QI de uma criança
e a presença de um gene específico nela.
Gene Gene não A probabilidade de que a criança tenha um QI alto (Evento B), dado que
presente presente a criança tenha o gene (Evento A) é?
QI alto 33 19 52 Solução. Há 72 crianças que têm o gene. Então, o espaço amostral consiste
QI normal 39 11 50 dessas 72 crianças. Dessas, 33 tem QI alto. Então:
EXEMPLO 7 Em um lote de 12 peças, 8 são de “qualidade” e 4 são “defeituosas”. Ao selecionar duas peças em sequência, sem
reposição, qual a probabilidade de:
Solução. Em razão de a 1ª peça ser defeituosa, o lote restante tem 11 P (B|A) = 3 = 0,2727
peças, 3 das quais são defeituosas. Então: 11
Multiplicação de probabilidade com eventos dependentes ...ache P(A e B) , dado P(B|A) e P(A)
EXEMPLO 1 Duas cartas são selecionadas em sequência em um baralho de 52 cartas. Qual a probabilidade de
selecionar um Rei e uma Dama? (não há reposição).
A probabilidade de a 1ª carta ser um Rei é /52. A
4 P(A e B) = ? P(A e B) = P(A) x P(B|A)
4
4
2ª carta ser uma Dama é /51, pois o baralho P(A) = /52 4 x 4 → 16 = 0,006
4
restante tem 51 cartas, 4 das quais são dama. P(B|A) = /51 52 51 2652
EXEMPLO 2 Em um lote de 12 peças, 8 são de “qualidade” e 4 são “defeituosas”. Sendo retiradas duas peças em sequência,
qual a probabilidade de que: (não há reposição)
a) Ambas sejam “defeituosas” b) Ambas sejam de “qualidade”
P(A e B) = ? P(A e B) = ?
4 4 x 3 = 0,090 8 8 x 7 = 0,4242
P(A) = /12 P(A) = /12
3 12 11 7 12 11
P(B|A) = /11 P(B|A) = /11
4 3 8 7
A probabilidade de a 1ª peça ser defeituosa é /12 e a 2ª é /11, pois o A probabilidade de a 1ª peça ser de qualidade é /12 e a 2ª é /11,
lote restante tem 11 peças, 3 das quais são defeituosas. pois o lote restante tem 11 peças, 7 das quais são de qualidade.
EXEMPLO 3 Uma urna contém 7 bolas brancas (B) e 3 pretas (P). Extraindo-se três bolas em sequência, qual a probabilidade
de que: (não há reposição).
a) As duas primeiras sejam brancas e a terceira seja preta (ou seja, BBP)
7 6 7
A probabilidade de a 1ª bola ser branca é /10 e a 2ª é /9. A P(A) = /10
3 6 7 x 6 x 3 = 0,175
probabilidade de a 3ª bola ser preta é /8, pois a urna restante P(B|A) = /9
3 10 9 8
tem 8 peças, 3 das quais são pretas. P(C|B) = /8
b) Duas sejam brancas e uma seja preta (ou seja: BBP, BPB ou PBB) = 3[BBP]
O evento sair “duas brancas e uma preta” pode ocorrer de três maneiras que 7
P(A) = /10
diferem apenas pela ordem de aparecimento das bolas: (BBP, BPB, PBB). Logo, a ⎛ 7 6 3⎞
probabilidade será a soma dessas maneiras. Então, basta calcular a probabilidade de
6
P(B|A) = /9 3 • ⎜ x x ⎟ = 0,525
3
P(C|B) = /8 ⎝ 10 9 8 ⎠
uma dessas maneiras (por exemplo, a primeira) e multiplicar por 3. Então: 3(BBP).
e) Pelo menos uma seja preta. (ou seja: 3[PBB] + 3[PPB] + [PPP])
1 preta 2 pretas 3 pretas
3[PBB] 3[PPB] [PPP]
3 3 3
P(A) = /10 P(A) = /10 P(A) = /10 ⎛ 3 7 6⎞ ⎛ 3 2 7⎞ ⎛ 3 2 1⎞
7
P(B|A) = /9
2
P(B|A) = /9
2
P(B|A) = /9
3 • ⎜ x x ⎟ + 3 • ⎜ x x ⎟ + ⎜ x x ⎟ = 0,7083
6 7 1 ⎝ 10 9 8 ⎠ ⎝ 10 9 8 ⎠ ⎝ 10 9 8 ⎠
P(C|B) = /8 P(C|B) = /8 P(C|B) = /8
1 ( 2, 1 )
Pelo Diagrama de árvore: Então, a probabilidade é:
2 ( 2, 2 )
3 ( 2, 3 ) (2,1), (2,3), (2,5) 3 = 8,33%
2
4 ( 2, 4 ) 36
5 ( 2, 5 ) Se aplicarmos a regra da multiplicação, temos:
6 ( 2, 6 )
Exemplo 2. Cirurgias de microfraturas no joelho têm 75% de chance de Sucesso em pacientes com joelhos
degenerativos (25% é de fracasso). A cirurgia é realizada em 3 pacientes. Calcule a probabilidade de que:
Nota: A probabilidade de que cada cirurgia seja um sucesso é de 0,75. A chance de um sucesso para uma cirurgia é
independente das chances para as outras cirurgias. Portanto, os eventos são independentes.
a) As três cirurgias sejam um sucesso. ou seja:[SSS] b) As três cirurgias sejam um fracasso. ou seja:[FFF]
c) Duas cirurgias sejam um sucesso (ou seja: SSF, SFS, FSS) = 3[SSF]
O evento “Duas cirurgias” pode ocorrer de três maneiras que diferem apenas pela
P(A) = 0,75
ordem dos resultados das cirurgias: (SSF, SFS, FSS). Logo, a probabilidade será a
soma dessas maneiras. Então, basta calcular a probabilidade de uma dessas
P(B) = 0,75 3 * (0,75*0,75*0,25) = 0,4218
P(C) = 0,25
maneiras (por exemplo, a primeira) e multiplicar por 3. Então: 3(SSF).
(0,65) . (0,02)
P(x) = = 0,4262
(0,65) . (0,02) + (0,35) . (0,05)
Exemplo 2. As máquinas A e B são responsáveis por 400 e 150, respectivamente, da produção de peças de uma
empresa. A quantidade de peças defeituosas produzidas pelas respectivas máquinas são 10 e 20. Se uma peça
defeituosa foi selecionada da produção, qual a probabilidade de que tenha sido produzida pela máquina B?
Probabilidade Clássica
P(A) = _n(A)_ → número de elementos no evento A___
S → espaço amostral
ADIÇÃO DE PROBABILIDADES
Probabilidade com Eventos mutuamente exclusivos
É a probabilidade com Eventos que não podem ocorrer ao mesmo tempo. A ocorrência de um impossibilita
a ocorrência do outro. Ou ocorre A ou ocorre B. (A ou B)
Ao lançar um dado, a probabilidade de se tirar o 3 ou 5 é:
A = {2} → A=1 P(A ou B)= 1 + 1 = 2 = 33,33%
B = {5} → B=1 6 6 6
S = {1,2,3,4,5,6} → S=6
CAPÍTULO 2
VARIÁVEIS ALEATÓRIAS
1 ( 1, 1 )
2 ( 1, 2 )
1 3
4
( 1, 3 )
( 1, 4 ) Construindo modelos teóricos...
5 ( 1, 5 )
6 ( 1, 6 )
1
2
( 2, 1 )
( 2, 2 )
É possível criar um modelo teórico
2 3
4
( 2, 3 )
( 2, 4 )
que descreva como se espera que o
5
6
( 2, 5 )
( 2, 6 ) experimento se comporte?
1 ( 3, 1 )
2 ( 3, 2 )
3 3 ( 3, 3 )
Lançar dois dados 4 ( 3, 4 )
5 ( 3, 5 )
6 ( 3, 6 )
1 ( 4, 1 )
2 ( 4, 2 )
4 3 ( 4, 3 )
4 ( 4, 4 )
5 ( 4, 5 )
6 ( 4, 6 )
6
1 ( 5, 1 ) /36 6
2 ( 5, 2 )
5 5 5
5 3 ( 5, 3 ) /36
4 ( 5, 4 ) 4 4
4
5 ( 5, 5 ) /36
6 ( 5, 6 ) 3 3
3
/36
2 2
1 ( 6, 1 ) 2
/36
2 ( 6, 2 ) 1 1
6 3 ( 6, 3 ) 1
/36
4 ( 6, 4 )
5 ( 6, 5 )
2 3 4 5 6 7 8 9 10 11 12
6 ( 6, 6 )
Soma dos dados
Saiba
mais
Clique aqui
www.udemy.com
Junte-se a milhões de estudantes na maior plataforma on-line
de cursos curtos e práticos do mundo.
Com mais de 45.000 cursos virtuais disponíveis, o Udemy é uma plataforma global de
ensino on-line onde 15 milhões de alunos estão dominando novas habilidades.
Uma variável aleatória “X” representa um valor numérico associado a cada resultado de um
experimento de probabilidade.
Exemplo 1. A tabela e o gráfico abaixo representam um modelo de probabilidade para a soma de dois dados
lançados simultaneamente:
Variáveis aleatórias(X)
Valor numérico de cada Distribuição de
experimento
frequências probabilidades
É a lista de cada valor de
1 ( 1, 1 )
2 ( 1, 2 ) uma variável aleatória “X”
1 3 ( 1, 3 ) Soma dos Probabilidade
4 ( 1, 4 ) f
dados “X” “P(x)”
5 ( 1, 5 ) 1
6 ( 1, 6 ) 2 1 /36
2
3 2 /36
1 ( 2, 1 ) 3
2 ( 2, 2 )
4 3 /36
4
2 3 ( 2, 3 ) 5 4 /36
4 ( 2, 4 ) 5
6 5 /36
5 ( 2, 5 ) 6
6 ( 2, 6 ) 7 6 /36
5
8 5 /36
1 ( 3, 1 ) 4
2 ( 3, 2 ) 9 4 /36
3
3 3 ( 3, 3 ) 10 3 /36
Lançar dois dados 4 ( 3, 4 ) 2
11 2 /36
5 ( 3, 5 )
1
6 ( 3, 6 ) 12 1 /36
- ∑=36 ∑=1
1 ( 4, 1 )
2 ( 4, 2 )
4 3 ( 4, 3 )
4 ( 4, 4 ) 6
/36 6
5 ( 4, 5 )
6 ( 4, 6 ) 5
/36 5 5 Representação
1 ( 5, 1 )
4 4
gráfica da
2 ( 5, 2 ) /36 4
5 3 ( 5, 3 ) distribuição
4 ( 5, 4 ) 3 3 3
/36
5 ( 5, 5 )
6 ( 5, 6 ) 2 2 2
/36
1 ( 6, 1 ) 1 1 1
2 ( 6, 2 ) /36
6 3 ( 6, 3 )
4 ( 6, 4 )
5 ( 6, 5 ) 2 3 4 5 6 7 8 9 10 11 12
6 ( 6, 6 )
Soma dos dados
Notas e comentários
A palavra “aleatório” indica que “X” é determinado pelo acaso. A variável aleatória é uma regra que associa um valor
numérico a cada resultado experimental possível.
A distribuição de probabilidades de uma variável aleatória descreve como as probabilidades estão distribuídas sobre os
valores da variável aleatória. Para uma variável “X”, a distribuição de probabilidade é definida por uma função probabilidade,
denotada por f(x). A função probabilidade fornece a probabilidade correspondente a cada um dos valores da variável aleatória.
A principal vantagem de definir uma variável aleatória “X” e sua distribuição de probabilidade é que, uma vez que a
distribuição seja conhecida, torna-se relativamente fácil determinar a probabilidade de uma série de eventos que podem ser
do interesse de um tomador de decisões.
Exemplo 2. Um projeto de ampliação da capacidade produtiva da empresa ABC divide-se em duas etapas
seqüenciais: etapa 1 (projeto – em 2, 3 ou 4 meses) e etapa 2 (construção – em 6, 7 ou 8 meses).
Probabilidade
0.8
Assim, podemos responder rapidamente alguns questionamentos:
Qual a probabilidade de o projeto ser concluído em 8 meses? R.: 11% 0.6
Qual a probabilidade de o projeto ser concluído em 9 meses? R.: 22% 0.33
Qual a probabilidade de o projeto ser concluído em 10 meses? R.: 33% 0.4
0.22 0.22
Qual a probabilidade de o projeto ser concluído em 10 ou 11 meses? R.: 55%
0.2 0.11 0.11
Qual a probabilidade de o projeto ser concluído entre 9 e 11 meses? R.: 77%
0
8 9 10 11 12
meses
Exemplo 3. Uma pesquisa entrevistou 200 casas de um bairro sobre quantas televisões possuem. Os dados mostram
que 3 casas não possuem televisão, 38 casas possuem 1 televisão, 95 casas possuem 2 televisões, 52 casas possuem 3
televisões e 12 casas possuem 4 televisões.
Definimos a variável aleatória de interesse como “X” o número de televisões. A partir dos dados, sabemos que X é uma variável
aleatória que pode assumir 0, 1, 2, 3, ou 4. Temos, então, a distribuição de probabilidades e o gráfico abaixo:
3
0 3 /200 = 0,015 0.8
38
1 38 /200 = 0,190
95 0.6 0.475
2 95 /200 = 0,475
52
3 52 /200 = 0,260
12 0.4
4 12 /200 = 0,060 0.26
0.19
- ∑=200 ∑=1 0.2
0.015 0.06
0
0 1 2 3 4
Número de televisões
Assim, podemos responder rapidamente alguns questionamentos:
Ao selecionar aleatoriamente uma casa, qual a probabilidade de ela não possuir televisão? R.: 1,5%
Ao selecionar aleatoriamente uma casa, qual a probabilidade de ela possuir 1 televisão? R.: 19%
Ao selecionar aleatoriamente uma casa, qual a probabilidade de ela possuir 2 televisões? R.: 47,5%
Ao selecionar aleatoriamente uma casa, qual a probabilidade de ela possuir 2 ou 3 televisões? R.: 73,5%
Ao selecionar aleatoriamente uma casa, qual a probabilidade de ela possuir televisão? R.: 98,5%
Podemos considerar o Valor esperado no sentido de que é o valor médio que esperaríamos se o experimento fosse feito diversas vezes.
Então, podemos dizer que o conceito de Valor esperado aplicado em uma variável aleatória é equivalente à Média ponderada dos
possíveis valores que “X” pode receber, onde os pesos são as probabilidades associadas. É semelhante ao cálculo da Média de uma
Distribuição de frequência. Obtemos, então, a seguinte fórmula:
E (X) = ∑ X . P(x)
Probabilidades associadas
Variáveis Aleatórias
Cada valor de X é multiplicado por sua probabilidade e os produtos são adicionados. O Valor esperado, representado por
E(X), também é chamado de Média de uma Variável Aleatória, Esperança matemática, Esperança ou Expectância.
Exemplo 1. Um projeto de ampliação da capacidade produtiva da empresa ABC divide-se em duas etapas
seqüenciais: etapa 1 (projeto – em 2, 3 ou 4 meses) e etapa 2 (construção – em 6, 7 ou 8 meses). Qual o prazo
esperado para conclusão do projeto?
Exemplo 2. A tabela abaixo representa um modelo de probabilidade para a soma de dois dados lançados
simultaneamente. Qual o valor esperado para a soma dos dados?
3
1
2
( 1, 1 )
( 1, 2 )
Soma dos Probabilidade X . P(x)
1 3
4
( 1, 3 )
( 1, 4 )
dados “X” “P(x)”
5 ( 1, 5 ) 2 x 0,0278 = 0,0556
6 ( 1, 6 )
3 0,0556 0,1667
1 ( 2, 1 )
2 ( 2, 2 ) 4 0,0833 0,3333
3 ( 2, 3 )
2
4 ( 2, 4 ) 5 0,1111 0,5556
5 ( 2, 5 )
6 ( 2, 6 ) 6 0,1389 0,8333
1 ( 3, 1 ) 7 0,1667 1,1667
2 ( 3, 2 )
3 3 ( 3, 3 ) 8 0,1389 1,1111
Lançar dois dados 4
5
( 3, 4 )
( 3, 5 )
9 0,1111 1,0000
6 ( 3, 6 )
10 0,0833 0,8333
1
2
( 4, 1 )
( 4, 2 )
11 0,0556 0,6111
4 3
4
( 4, 3 )
( 4, 4 )
12 0,0278 0,3333
5
6
( 4, 5 )
( 4, 6 )
- ∑=1 ∑ X.P(x) = 7
1 ( 5, 1 )
5
2
3
( 5, 2 )
( 5, 3 )
Valor esperado E(X)
4 ( 5, 4 )
5
6
( 5, 5 )
( 5, 6 )
Interpretação: Espera-se que a soma dos dados seja 7.
1
2
( 6, 1 )
( 6, 2 )
NOTA: Posso fazer também da seguinte forma:
6 3
4
( 6, 3 )
( 6, 4 )
E(X) = 2(0,0278) + 3(0,0556) + 4(0,0833) + 5(0,1111) 6(0,1389) + 7(0,1667) +
5
6
( 6, 5 )
( 6, 6 )
8(0,1389) + 9(0,1111) + 10(0,0833) + 11(0,0556) + 12(0,0278) = 7
; Embora o Valor esperado de uma distribuição de probabilidades da variável aleatória descreva um resultado
comum, ela não dá informações sobre a maneira que os resultados variam. Para estudar a variação dos resultados,
você pode usar a variância e o desvio padrão de uma distribuição de probabilidades da variável aleatória. Então:
FÓRMULA DA VARIÂNCIA E DESVIO PADRÃO DO VALOR ESPERADO
Exemplo Um projeto de ampliação da capacidade produtiva da empresa ABC divide-se em duas etapas seqüenciais:
etapa 1 (projeto – em 2, 3 ou 4 meses) e etapa 2 (construção – em 6, 7 ou 8 meses). Qual o prazo esperado para
conclusão do projeto, a variância e o desvio padrão?
2
Então, a Variância é: S = 1,32 e o Desvio padrão é: S = s2 → S = 1,32 → 1,15 meses
8,85 11,15
CAPÍTULO 3
DISTRIBUIÇÕES DE
PROBABILIDADES
As variáveis aleatórias podem ser discretas ou contínuas, conforme mostra o esquema abaixo.
Em Probabilidade, existem as chamadas “distribuições de probabilidades” criadas por diversos estudiosos no tema,
que podem ser discretas ou contínuas. As principais são listadas abaixo:
DISTRIBUIÇÕES DISCRETAS
Distribuição Binomial
Distribuição Hipergeométrica
Distribuição de Poisson
DISTRIBUIÇÕES CONTÍNUAS
Distribuição Uniforme
Distribuição Normal
Distribuição Exponencial
Distribuição de Erlang
Distribuição de Weibull
Sumário
Engenharia de Produção - 22 -
Revisão de FATORIAL (O fatorial é usado na equação binomial, por isso a importância da revisão)
FATORIAL é um procedimento matemático utilizado para calcular o produto de uma multiplicação cujos
fatores são números naturais consecutivos, denotado por x!. Exemplos:
Há três resultados que têm dois sucessos e cada um tem uma probabilidade de Usando a equação Binomial obtemos
0,141. Aplicando a Regra da Adição, a probabilidade de a cirurgia ser um sucesso o mesmo resultado pelo método do
com dois pacientes é 0,422. (0,141 + 0,141 + 0,141) Diagrama de árvore, de 0,422.
Exemplo 2. Um levantamento estatístico realizado pelo IBGE constatou que a taxa de desemprego na cidade de
Resende é da ordem de 13%. Ao tomarmos uma amostra de 30 pessoas, com reposição, qual a probabilidade de:
a) 5 estarem desempregados 13% desemprego(Sucesso) 87% emprego(Fracasso)
b) 28 estarem empregados Sucesso é o que se deseja estudar;
c) 27 estarem empregados 87% emprego(Sucesso) 13% desemprego(Fracasso) Fracasso é o que não se deseja estudar
P(x) = n! . S x . F n-x
x! (n - x)!
n = 30 n = 30 n = 30
x=5 x = 28 x = 27
S = 0,13 S = 0,87 S = 0,87
F = 0,87 F = 0,13 F = 0,13
P(x)= 30! . 0,13 5 . 0,87 30 - 5 P(x)= 30! . 0,87 28 . 0,13 30-28 P(x)= 30! . 0,87 27 . 0,13 30-27
5! (30-5)! 28! (30-28)! 27! (30-27)!
P(x)= 142506 . 0,000037 . 0,0307 P(x)= 435 . 0,0202 . 0,0169 P(x)= 4060 . 0,0232 . 0,0021
Para calcular 0,135 use a tecla Xy ou ^ . Introduza 0,13 Xy 5 = 3,7-05 que é o mesmo que 0,000037
Exemplo 3. Uma caixa contém 50 bolas, sendo 40 brancas e 10 pretas. Tirando-se 5 bolas, COM REPOSIÇÃO, qual a
probabilidade de saírem:
a) 2 bolas pretas
b) 4 bolas brancas
Você pode usar o software BIOESTAT para calcular probabilidades Binomiais. Siga o caminho abaixo
R resposta
Para usar o Bioestat, basta incluir “n” tamanho da amostra e “x” nº sucessos na amostra. Observe que não é necessário incluir os dados
do Fracasso. O próprio software já entende que o Fracasso será o valor restante. Ex.: Se Sucesso = 20%, então Fracasso = 80% (omitido no
software). A resposta será o valor que está destacada no quadro azul.
Exemplo 4. Uma moeda é lançada 5 vezes. Qual a probabilidade de obter “3 caras” nessas cinco provas?
n = 5 (tamanho da amostra)
x = 3 (nº sucessos da amostra) P(x) = n! . S x . F n - x P(x) = 5! __ . 0,503 . 0,505–3 ≈ 0,3125
S = 0,50 ( = ½ a p de obter cara) 3! (5-3)!
x! (n - x)!
F = 0,50 (= ½ a p de obter coroa)
Exemplo 5. Um dado é lançado 6 vezes. Qual a probabilidade de que a “face 4” apareça 2 vezes?
n = 6 (tamanho da amostra)
x = 2 (nº sucessos da amostra) P(x) = 6! __ . 0,172 . 0,836–2 ≈ 0,2057
1
S = 0,17 ( = /6 a p de obter “4”) 2! (6-2)!
5
F = 0,83 (= /6 a p de não obter “4”)
Exemplo 6. Dois times de futebol, A e B, jogam entre si 6 vezes. Qual a probabilidade de o time A ganhar 4 jogos?
n = 6 (tamanho da amostra)
x = 4 (nº sucessos da amostra) P(x) = 6! __ . 0,334 . 0,666–4 ≈ 0,0774
S = 0,33 ( = 1/3 a p de ganhar)* 4! (6-4)!
F = 0,66 (= 2/3 a p de não ganhar)
* 1/3 o time A pode ganhar, empatar ou perder. Logo, a probabilidade para cada evento é de 1/3
Exemplo 7. Em uma fábrica, 3 em cada 10 peças são defeituosas. Uma remessa a um determinado cliente possui 5
peças. Determine a probabilidade de que, nessa remessa:
DIFICULTANDO UM POUCO
Exemplo 8. Uma máquina produz parafusos, dos quais 12% apresentam algum tipo de defeito. Calcular a
probabilidade de, em um lote de 40 parafusos produzidos por essa máquina:
a) Entre 3 e 5 parafusos estejam defeituosos, inclusive (ou seja: P3 + P4 + P5)
Neste caso, calcularemos a probabilidade de 3, 4 e 5 parafusos defeituosos. Depois somamos as probabilidades. (Adição de Prob.)
P = 40! . 0,123 . 0,8840–3 ≈ 0,1507 P = 40!_ . 0,124. 0,8840–4 ≈ 0,1901 P = 40! _ . 0,125. 0,8840–5 ≈ 0,1867
3! (40-3)! 4! (40-4)! 5! (40-5)!
P (3 e 5, inclusive) = 0,1507 + 0,1901 + 0,1867 = 0,5275
b) Pelo menos dois parafusos defeituosos (ou seja: P2 + P3 + P4 + . . . + P40) Neste caso use: 1 - (P0 + P1)
Ao invés de calcularmos P2 + P3 + P4 +...+ P40 é mais conveniente usarmos o método do evento complementar (1 – p), pois dá menos
trabalho. Então, calculamos 1 – (P0 +P1 )
Além do BIOESTAT, você pode encontrar probabilidades Binomiais pelo EXCEL, bastando inserir os dados, conforme
demonstrado abaixo. A figura abaixo se refere ao exemplo 8 que acabamos de ver.
Resolução. Uma parte da tabela pode ser vista aqui. Usando o sucesso de 75% (ou 0,75), n do tamanho da amostra = 3 e com
número de sucessos 2, 1 e 0 das letras a), b) e c), respectivamente, você pode encontrar a probabilidade Binomial conforme
visto nas áreas destacadas na tabela abaixo.
Nota: Para Sucesso <= 0,50, considere as linhas e colunas verdes para a probabilidade e os sucessos e para Sucesso > 0,50
considere as linhas e colunas vermelhas para a probabilidade e os sucessos. Para valores de Sucessos "quebrados", use a
fórmula DISTRBINOM (sucessos;n;p;0) no Excel.
DISTRIBUIÇÃO HIPERGEOMÉTRICA
É um experimento de probabilidade para os quais os resultados de cada tentativa podem ser reduzidos a
dois resultados: SUCESSO ou FRACASSO, MAS SEM REPOSIÇÃO DA AMOSTRA.
; Da mesma maneira que a distribuição Binomial, a distribuição Hipergeométrica tem dois resultados possíveis:
SUCESSO ou FRACASSO. A diferença é que ao experimento Binomial exige que a amostragem seja feita COM
REPOSIÇÃO, pois cada resultado deve ser independente dos outros, enquanto que o experimento Hipergeométrico
exige que a amostragem seja feita SEM REPOSIÇÃO, pois cada resultado deve ser dependente dos outros.
; O experimento Hipergeométrico é aplicado para Eventos dependentes. A amostra é sem reposição.
EQUAÇÃO DA PROBABILIDADE HIPERGEOMÉTRICA
F = nº fracassos da população
S = nº sucessos da população
f = nº fracassos da amostra
s = nº sucessos da amostra
N tamanho da população
n tamanho da amostra
Exemplo Binomial
Uma caixa contém 50 bolas, sendo 40 brancas e 10 pretas. Tirando-se 5 bolas, COM REPOSIÇÃO, qual P(x) de saírem:
a) 2 bolas pretas P(x) = n! . S x . F n - x
b) 4 bolas brancas x! (n - x)!
Exemplo Hipergeométrico
Uma caixa contém 50 bolas, sendo 40 brancas e 10 pretas. Tirando-se 5 bolas, SEM REPOSIÇÃO, qual P(x) de saírem:
a) 2 bolas pretas
b) 4 bolas brancas
SEM REPOSIÇÃO. Se as bolas são extraídas sem reposição, isto é, extraem-se as 5 bolas sem que nenhuma delas retorne à caixa.
Os eventos – cor de cada bola – já não são mais independentes, pois a probabilidade de uma bola ser branca ou preta depende
de que cor tenham saído as demais bolas.
Você pode usar o software BIOESTAT para calcular probabilidades Hipergeométricas. Siga o caminho abaixo
Uma caixa contém 50 bolas, sendo 40 brancas e 10 pretas. Tirando-se 5 bolas, SEM REPOSIÇÃO, qual P(x) de saírem:
a) 2 bolas pretas
S = 10
s=2
F = 40
f=3
N = 50
n=5
resposta
Observe que não é necessário incluir os dados do Fracasso. O próprio software já reconhece que o Fracasso será o valor restante. Ex.:
Se Sucesso = 10 e 2, então Fracasso = 40 e 3 (omitido), já que a população é 50 e 5. A resposta será o valor que está no quadro azul.
DISTRIBUIÇÃO GEOMÉTRICA
É um experimento de probabilidades para os quais os resultados de cada tentativa podem ser reduzidos
a dois resultados: SUCESSO ou FRACASSO, sendo realizado até que apareça o PRIMEIRO SUCESSO
; Sucesso corresponde à probabilidade procurada enquanto que Fracasso à probabilidade não procurada, ou seja, o evento
complementar. A palavra sucesso como usada aqui é arbitrária e não representa, necessariamente, algo bom. Qualquer uma das duas
categorias pode ser chamada de sucesso, desde que seja a probabilidade procurada.
; Da mesma maneira que a distribuição Binomial, a distribuição Geométrica tem dois resultados possíveis: SUCESSO ou FRACASSO. Uma
particularidade da distribuição Geométrica é que são necessárias inúmeras tentativas até o aparecimento do PRIMEIRO SUCESSO.
; A distribuição Geométrica é aplicada para Eventos independentes. A amostra é feita com reposição.
Exemplo. Uma máquina produz parafusos dos quais 12% apresentam algum tipo de defeito. Um analista deseja
coletar uma amostra de 40 parafusos. Encontre a probabilidade de que:
a) na 6ª amostra apareça o primeiro parafuso defeituoso. b) na 4ª amostra apareça o primeiro parafuso perfeito.
n=6 n=4
6 –1 4 -1
S = 0,12 P(x) = 0,88 . 0,12 = 0,0633 ou 6,33% S = 0,88 P(x) = 0,12 . 0,88 = 0,0015 ou 0,15%
F = 0,88 F = 0,12
...Que, pela lógica do evento independente é a mesma coisa ...Que, pela lógica do evento independente é a mesma coisa
5 3
que FFFFFS, ou seja, 0,88 . 0,12 (É como se fosse PPPPPD) que FFFS, ou seja, 0,12 . 0,88 (É como se fosse DDDP)
1º sucesso 1º sucesso
DISTRIBUIÇÃO DE PASCAL
É um experimento de probabilidades para os quais os resultados de cada tentativa podem ser reduzidos
a dois resultados: SUCESSO ou FRACASSO, sendo realizado até que apareça o K-ÉSIMO SUCESSO
; Sucesso corresponde à probabilidade procurada enquanto que Fracasso à probabilidade não procurada, ou seja, o evento
complementar. A palavra sucesso como usada aqui é arbitrária e não representa, necessariamente, algo bom. Qualquer uma das duas
categorias pode ser chamada de sucesso, desde que seja a probabilidade procurada.
; Da mesma maneira que a distribuição Binomial e Geométrica, a distribuição de Pascal tem dois resultados possíveis: SUCESSO ou
FRACASSO. Uma particularidade da distribuição de Pascal é que são necessárias inúmeras tentativas até o aparecimento do K-ÉSIMO
SUCESSO.
; A distribuição de Pascal é aplicada para Eventos independentes. A amostra é feita com reposição.
Exemplo. Uma máquina produz parafusos dos quais 12% apresentam algum tipo de defeito. Um analista deseja
coletar uma amostra de 40 parafusos. Encontre a probabilidade de:
a) Na 9º amostra, apareça o terceiro parafuso defeituoso. b) na 25ª amostra apareça o 21º parafuso perfeito.
n=9 n = 25
k=3 3 9-3 k = 21
(9-1)! __ . 0,12 . 0,88 = 0,0224 (25-1)! __ . 0,8821 . 0,1225-21 = 0,1503
S = 0,12 S = 0,88
(3-1)! . (9-3)! (21-1)! . (25-21)!
F = 0,88 F = 0,12
...Como exemplo, é como se fosse FSFFFSFFS ...Como exemplo, é como se fosse FSFF...FSSFF...FS
Também chamada de Binomial negativa. Na científica: Ex a) (9-1)! : ((3-1)! x (9-3)!) x 0,12^3 x 0,88^9-3
Na TechCalc --> procurar "Distribuição Binomial, negativo". Entradas: ex. a) 3|6|0,12| = 0,0225 ex b) 21|4|0,88| = 0,1503
Ou seja: entrada de | k | n-k, em que esta diferença é o numero de falhas | S
; Na distribuição Multinomial, todos os resultados possíveis são independentes uns dos outros.
EQUAÇÃO DA PROBABILIDADE MULTINOMIAL
n tamanho da amostra
x tamanho de cada sucesso
P(x) = n! _ . p1x1. p2x2 . p3x3... P probabilidades associadas ao sucesso
x1! x2! x3! ...
Exemplo 1. Uma máquina produz parafusos dos quais 12% apresentam algum tipo de defeito, sendo 4% do tipo A e
8% do tipo B. Um analista deseja coletar uma amostra de 40 parafusos. Encontre a probabilidade de:
a) Sair 35 parafusos perfeitos, 3 com defeitos tipo A e 2 com defeitos tipo B?
n = 40
P(x) = 40! . 0,8835. 0,043 . 0,082 = 0,0307
x1= 35 ; p1= 0,88
35! 3! 2!
x2= 3 ; p2= 0,04
x3= 2 ; p3= 0,08
Exemplo 2. Um caixa tem 4 bolas vermelhas (V), 3 brancas (B) e 3 azuis. Retiram-se 5 bolas, com reposição. Qual a
probabilidade de saírem 2V, 1B e 2A?
n=5
P(x) = 5! . 0,402. 0,301 . 0,302 = 0,1296
x1= 2 ; p1= 0,40 (4/10)
2! 1! 2!
x2= 1 ; p2= 0,30 (3/10)
x3= 2 ; p3= 0,30 (3/10)
nº de ocorrências
1 2 3 4... do evento
x x x x
← Intervalo de tempo, distância, área ou volume →
; Regras: É aplicada caso os eventos ocorram com uma MÉDIA conhecida e cada evento seja independente.
; São exemplos: número de consultas a uma base de dados por minuto; número de falhas de um equipamento por hora;
número de erros de tipografia em um formulário; número de defeitos em um m2 de piso cerâmico; número de buracos
em um asfalto por km; número de acidentes por mês em uma rodovia etc.
EQUAÇÃO DA PROBABILIDADE DE POISSON
P(x) = μ x *
e -μ
x!
μ = letra grega mi = Média Constante de Euler Venn 2,7182
Nota: Algumas literaturas usam nº de ocorrências procurada
λ (lambda) no lugar de μ Média do nº de ocorrências (baseada em histórico)
Exemplo 1. A Média do número de acidentes por mês na rodovia Barra Mansa-Angra é de 3 acidentes por mês.
Determine a probabilidade de que, em qualquer mês dado:
a) 4 acidentes ocorram na rodovia
b) 2 acidentes ocorram na rodovia
c) Nenhum acidente ocorra na rodovia
a) 4 acidentes ocorram na rodovia b) 2 acidentes ocorram na rodovia c) Nenhum acidente ocorra na rodovia
34 .
2,7182 -3 = 0,168 P(x) = 3 2 .
2,7182 -3 = 0,224 P(x) = 3 0 .
P(x) = 2,7182 -3 = 0,0498
4! 2! 0!
Exemplo 2. Supondo que a Média do número de pessoas que acessam um caixa eletrônico de um banco durante
uma hora é 5. Determine a probabilidade de, no mesmo período, ocorrerem:
a) Menos de 2 acessos ao caixa eletrônico P(x) = μ x .
e -μ
b) Pelo menos 3 acessos ao caixa eletrônico x!
b) Pelo menos 3 acessos ao caixa eletrônico (ou seja P3+P4+P5 +P6+P7+P8 ...)
“pelo menos 3 acessos ao caixa” é o mesmo que “no mínimo 3 acessos ao caixa”. Ao invés de calcularmos P3+P4+P5+... é mais
conveniente usarmos método do evento complementar (1 – p). Então, calculamos 1 – (P0 + P1 + P2)
Nenhum acesso 1 acesso ao caixa 2 acessos ao caixa eletrônico Evento complementar
ao caixa eletrônico
μ=5 P (x ≥ 3) = 1 – (P0 + P1 + P2)
e = 2,7182
P0 = 0,0067 P1= 0,0337
x=2 P = 1 – (0,0067+0,0337+0,0842)
2 . -5
P2 = 5 2,7182 = 0,0842 P = 0,8753
2!
Exemplo 3. Numa central telefônica chegam em média 300 telefonemas por hora. Qual a probabilidade de que:
a) 2 telefonemas ocorram em dois minutos?
Nota: São 300 telefonemas/hora, em média.
b) 3 telefonemas ocorram em quatro minutos? 300
Então são em média 5 telefonemas/minuto. ( /60 = 5)
c) Nenhum telefonema ocorra em um minuto?
μ= 10 telefonemas (5+5 em dois min) μ= 20 telefonemas (5*4 em quatro min) μ = 5 telefonemas (em um min)
e= 2,7182 e = 2,7182 e = 2,7182
x= 2 telefonemas x=3 x=0
Nota: Para valores não disponíveis na tabela, use POISSON(sucessos; λ ; 0) no Excel. ( λ é a mesma coisa que µ)
Note que substituímos a média µ da equação de Poisson pela média da distribuição Binomial (n . s). Para melhor entender o
modelo de aproximação vamos ver os exemplos 1 e 2, que comparam os dois métodos:
Exemplo 1. Uma máquina produz parafusos, dos quais 12% apresentam algum tipo de defeito. Calcular a
probabilidade de, em um lote de 40 parafusos produzidos por essa máquina:
a) 3 parafusos estejam defeituosos
Pela distribuição Binomial Poisson como aproximação da distribuição Binomial
n = 40
x=3 n = 40
S = 0,12 x=3
F = 0,88 S = 0,12
3 40–3
Pbin = 40! . 0,12 . 0,88 ≈ 0,1507 PPoisson ≈ bin = (40 * 0,12) 3 * 2,7182 –(40 * 0,12) ≈ 0,1517
3! (40-3)! 3!
Análise dos resultados: Perceba pelo comparativo que a distribuição de Poisson pode ter uma boa aproximação da Distribuição
Binomial. A aproximação vai melhorando à medida que n vai se tornando maior e S vai se tornando menor.
Exemplo 2. Uma máquina produz parafusos, dos quais 1% apresentam algum tipo de defeito. Calcular a
probabilidade de, em um lote de 900 parafusos produzidos por essa máquina:
a) 9 parafusos estejam defeituosos
Pela distribuição Binomial Poisson como aproximação da distribuição Binomial
n = 900
x=9 n = 900
S = 0,01 x=9
F = 0,99 S = 0,01
9 900 – 9
Pbin = 900! . 0,01 . 0,99 ≈ ‘Math ERROR’ PPoisson ≈ bin = (900*0,01) 9 * 2,7182 –(900 * 0,01) ≈ 0,1317
9! (900-9)! (0,1324 pelo Excel) 9!
Análise dos resultados: Observe que o cálculo do exemplo 2 pelo método Binomial usando uma calculadora científica torna-se
impraticável. Pelo Excel o resultado Binomial é 0,1324, bem aproximado pelo método de Poisson. É importante ressaltar que
a variável aleatória de Poisson teoricamente se estende desde 0 até ∞ (infinito). No entanto, quando você utiliza a distribuição
de Poisson como uma aproximação para a distribuição binomial, a variável aleatória de Poisson — o número de sucessos dentre
n observações — não pode ser maior do qdue o tamanho da amostra, n.
DISTRIBUIÇÃO UNIFORME
É aquela na qual as variáveis aleatórias se espalham uniformemente sobre a faixa de valores possíveis, ou
seja, todos os valores ocorrem com a mesma probabilidade.
; Representa o análogo continuo dos resultados igualmente prováveis. É usada nas situações em que não há razão para
atribuir probabilidades diferentes a um conjunto possíveis de valores em um determinado intervalo.
; A área sob o gráfico de uma distribuição uniforme é igual a 1. O gráfico resulta em uma forma retangular.
; Há uma correspondência entre área e probabilidade. Se a probabilidade de x assumir valores num subintervalo é a
mesma para qualquer outro subintervalo de mesmo comprimento, então, esta variável tem distribuição uniforme.
; A distribuição uniforme, embora apresentada como contínua, pode também abranger casos discretos. É o caso do
lançamento de um dado, como mostrado abaixo.
A distribuição de probabilidade do lançamento de um dado, por exemplo, tem distribuição uniforme pois seus
resultados são igualmente prováveis:
Probabilidades no
P(x) lançar um dado lançamento de um dado
“x” P(x) DISTRIBUIÇÃO
1 UNIFORME
1 /6
Probabilidade
1 1 1 1 1 1
2 1
/6 /6 /6 /6 /6 /6 /6
1
1 /6
3 /6
1
4 /6 Área = 1
1
5 /6
1
6 /6
∑=1 ou 100% 1 2 3 4 5 6
Faces do dado
a b
D–C 0, caso contrário
Em que:
Área P(x) procurada Área do intervalo definido
a – menor valor C – menor valor
C D b – maior valor D – maior valor
Variável aleatória
Exemplo 1. Com base em históricos, o tempo de vôo de Chicago - Nova York pode ter qualquer valor no intervalo de
120 a 140 minutos. Considerando que cada um dos intervalos de 1 minuto é igualmente provável, determine:
a) A P(x) do avião chegar entre 126 e 131 minutos b) A P(x) do avião chegar em 136 minutos ou mais.
126 131
Probabilidade
120 125 130 135 140 120 125 130 135 140
É usada para distribuições SIMÉTRICAS e possui diversas aplicações, como calcular as probabilidades de
PESOS e ALTURAS das pessoas, diâmetro e comprimento de peças em linhas de produção, tempo de vida
útil de produtos e diversas outras medições de pesquisas científicas.
; Aplicado para distribuições SIMÉTRICAS (Média=Moda=Mediana). Possui como parâmetro a MÉDIA e DESVIO PADRÃO.
; Também chamada de Curva Normal, Curva de Gauss e Curva em forma de Sino.
Para entender o conceito de uma Distribuição Normal, tomemos como exemplo a distribuição da vida útil de 340
lâmpadas produzidas pela PHILIPS:
80
70 70
60
40 40
40
20
10 10
0
700 800 900 1000 1100 1200 1300
Horas
Observe pela Distribuição Normal que o tempo de vida útil das lâmpadas:
; Possui uma elevação em seu centro e pontas que vão tanto para direita quanto para a esquerda;
; A Média, Mediana e Moda (1000 horas) encontram-se exatamente no meio da distribuição;
; A distribuição de valores menores que a Média (700, 800, 900) e maiores que a Média (1100, 1200, 1300) é
simétrica, o que significa que se você dobrá-la ao meio, suas partes serão como imagens refletidas por um espelho;
; Como a curva é simétrica em torno da Média, os valores maiores que a média e os valores menores do que a Média
ocorrem com igual probabilidade;
; A maioria dos dados é centralizada ao redor da média, de modo que quanto mais longe da média você se mover,
cada vez menos pontos de dados você vai encontrar em ambos os lados.
Analisando a variabilidade
Analise a figura abaixo. Veja que a maior parte da vida útil das lâmpadas produzidas pela PHILIPS varia de 700
horas até 1300 horas, com uma boa parte das lâmpadas com vida útil de 900 a 1100 horas. Pensando como
consumidor, você gostaria de se deparar com tamanha variabilidade quando for comprar um pacote de lâmpadas?
Veja que uma concorrente (OSRAM) irá tentar fabricar lâmpadas com vida útil menos variável; a vida útil terá
uma média de 1000 horas, mas suas lâmpadas terão uma vida útil mais consistente, variando de 920 a 1080
horas, com boa parte das lâmpadas com duração entre 980 e 1020 horas.
OSRAM
D istribuição da vida útil de 340 lâm padas Menor variação
produzidas pela OSRAM 920 a 1080 horas
OSRAM
120
100
100
PHILIPS
Quantidade
40 40
40
20
10 10
0
700 800 900 1000 1100 1 2 00 1 3 00
Horas
Em uma distribuição Normal, o Desvio padrão tem um significado especial, pois determina a distância da Média
até um ponto dentro da distribuição, cada um com a mesma distância da Média. No caso abaixo, supomos (por
fins didáticos) que o Desvio padrão do tempo de vida útil das lâmpadas é s=100 horas.
99,74%
A regra empírica
Na distribuição normal é possível determinar a posição
95,44% s=100 da maioria dos valores, usando as distâncias de 1, 2 ou 3
Desvios padrões da Média para estabelecer alguns
68,26% marcos. A regra que lhe permite fazer isso se chama
120
Regra empírica, que diz o seguinte:
100 Espera-se que cerca de 68,26% dos valores encontram-
100
se dentro de 1 desvio padrão da média;
Quantidade
Probabilidade procurada
P(1000 < Z < 1150)
P= 0,4332
Z= 1,50
1º PASSO. Calcule o número de desvios padrão que o valor “1150” se distancia da média “1000”. Para isto,
utilizamos a equação abaixo, chamada “escore Z”.
2º PASSO. Com o escore Z de “1,50”, use a Tabela de Distribuição Normal Padrão para encontrar a
probabilidade, como explicado abaixo:
Na 1ª coluna encontramos “1,5”. Em seguida, encontramos na 1ª linha “0”, que é o último algarismo de “1,50”. Na intersecção
da linha e coluna encontramos 0,4332, o que indica que a probabilidade P(1000 < z < 1150) = 0,4332 ou 43,32%.
Interpretação: espera-se que 43,32% das lâmpadas tenham vida útil entre 1000 e 1150 horas.
Área = 0,5
-z +z
Exemplo 2. Continuando com os dados do exemplo 1, ache P(900 < z < 1000).
Quando partimos da média calculamos apenas um escore Z. Para lado esquerdo o escore Z sempre terá sinal
negativo, que não será considerado, pois os dois lados são iguais em termos de probabilidades.
Probabilidade procurada EQUAÇÃO ESCORE Z
P(900 < Z < 1000)
P= 0,3413 z= x - x
s
Calculando, temos:
Interpretação: Espera-se que 34,13% das lâmpadas tenham vida útil entre 1000 e 1100 horas.
Exemplo 3. Continuando com os dados do exemplo 1, ache P(900 < z < 1050).
Z1= -1,00
Interpretação: Espera-se que 53,28% das lâmpadas tenham vida útil entre 900 e 1050 horas.
Exemplo 4. Continuando com os dados do exemplo 1, ache P(1050 < z < 1150).
Neste caso, calculamos dois escores Z (de 1000 a 1150; e de 1000 a 1050). Depois subtraímos as probabilidades:
Z2= 0,50
Interpretação: Espera-se que 24,17% das lâmpadas tenham vida útil entre 1050 e 1150 horas.
PZ2=0,0668
--
Z2 = 850 - 1000 = -1,50
100 0,4332
Z1= -1,50 Subtração probabilidades = 0,0668
Interpretação: Espera-se que 6,68% das lâmpadas tenham vida útil abaixo de 850 horas.
Exemplo 6. Sabe-se que a Média de vida útil das lâmpadas produzidas pela PHILIPS é de 1000 horas com Desvio
padrão de 100 horas. O fabricante oferece uma garantia de 800 horas, isto é, trocar as lâmpadas que apresentem
falhas nesse período ou inferior. Fabrica 15.000 lâmpadas mensalmente. Quantas lâmpadas deverá trocar pelo uso da
garantia, mensalmente? (adaptado de Morettin, pág 143 e 144)
Interpretação: Constatamos que 2,28% (0,0228) das lâmpadas não atenderão a garantia. Então o fabricante deverá substituir
mensalmente: 15.000 x 0,0228 = 342 lâmpadas.
Observando a Tabela de Distribuição Normal Padrão encontramos z-escore de 0,56 conforme destacado abaixo.
Exemplo 8. Sabe-se que a Média de vida útil das lâmpadas produzidas pela PHILIPS é de 1000 horas com Desvio
padrão de 100 horas. Encontre o tempo de vida útil “x” que corresponda a:
Exemplo 9. Sabe-se que a Média de vida útil das lâmpadas produzidas pela PHILIPS é de 1000 horas com Desvio
padrão de 100 horas. O fabricante deseja fixar prazo de garantia, em horas, de tal modo que, se a duração da
lâmpada for inferior à garantia, a lâmpada seja trocada. De quantas horas deve ser este prazo para que somente 4%
das lâmpadas sejam trocadas?
0,04
x = x + zs → x = 1000 + (-1,75)(100) = 825 horas.
-1,75
Exemplo 10. As pontuações para um teste de Engenheiro em uma empresa são normalmente distribuídas, com uma
média de 7,5 com e um desvio padrão de 0,5. Para ser adequado ao emprego, você deve ter pontuação dentro dos
9% primeiros. Qual é a menor pontuação que você pode conseguir e ainda ser adequado ao emprego?
,
6,0 6,5 7,0 7,5 8,0 8,5 9,0
+1,34
Exemplo 11 Sabe-se que a Média de vida útil das lâmpadas produzidas pela PHILIPS é de 1000 horas com Desvio
padrão de 100 horas. Dentro de que limite, de ambos os lados da média, ficará 95% das lâmpadas?
0,95 Resolução
0,95
Passo 1 → /2 = 0,4750 (para cada lado da média).
Passo 2 → Procurar 0,4750 na tabela. Encontramos Z = 1,96 (neste
caso teremos Z1= -1,96 e Z2 = +1,96).
Passo 3. Logo:
X1 = 1000 + (-1,96)(100) = 804 horas.
x = x + zs X2 = 1000 + (+1,96)(100) = 1.196 horas.
- 0,4750 + 0,4750 Interpretação: 95% das lâmpadas ficará entre 804 horas e 1196 horas, ou
seja, P 95% ( 804 < z < 1196)
z= - 1,96 x̄ z= + 1,96
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
DISTRIBUIÇÃO NORMAL PADRÃO
ACUMULADA
(Informativo) Distribuição acumulada de 0% a 100%
Esta tabela que tem o seguinte princípio:
Exemplo de aplicação. Sabe-se que a Média de vida útil das lâmpadas produzidas pela PHILIPS é de 1000 horas com
Desvio padrão de 100 horas. Encontre P (900 < z < 1050) usando a tabela de distribuição normal padrão acumulada.
Probabilidade procurada
P(900 < Z < 1050) P= 0,5328 SUBTRAÇÃO DE PROBABILIDADE
Z1 = 900 - 1000 = -1,00*
100 0,1587
Z2 = 0,50 → 0,6915 *Considere o sinal negativo
; Mas e se coletarmos 150 parafusos e queremos encontrar a probabilidade que menos de 40 parafusos sejam
defeituosos? Teríamos que usar a equação binomial 40 vezes e encontrar a soma das probabilidades (P0+P1+P2+...+P39).
Esse método não é prático, claro. A solução é usarmos a distribuição normal para aproximar da distribuição binomial.
Regras para aproximar a Normal para Binomial:
Regra 1. AMOSTRAS GRANDES. À medida que o tamanho da amostra aumenta, a distribuição Binomial é aproximada e
normalmente distribuída. Para ver que esse resultado é válido, veja as distribuições binomiais da produção de parafusos de
uma máquina, dos quais 12% apresentam defeito (Sucesso), com dois diferentes de tamanhos amostrais: n = 10 e n = 40.
Probabilidade
0.27
1 0,37 0.3 2 0,08 0.15
0.23
2 0,23 3 0,15
3 0,08 0.2 4 0,19 0.1
4 0,003 5 0,18
0.1 0.08 6 0,14 0.05
7 0,09
0.003 8 0,05
0 9 0,02 0
0 1 2 3 4 10 0,01 0 1 2 3 4 5 6 7 8 9 10
Perceba que à medida que o tamanho da amostra aumenta, o histograma aproxima-se de uma curva normal. Então, para
amostras grandes podemos fazer uma aproximação da Normal para Binomial (desde que S não seja muito próximo de 0 ou 1).
Regra 2: CORREÇÃO DE CONTINUIDADE. Para obter aproximações mais precisas utilizamos um ajuste chamado correção de
continuidade. A razão para isto é que a distribuição Binomial é discreta e assume valores inteiros (0, 1, 2, 3...) enquanto que a
distribuição Normal é contínua, podendo assumir qualquer valor dentro de um intervalo (0,5, 1,5, 2,5...). Como exemplo,
suponha que dos 40 parafusos produzidos você queira saber a probabilidade de encontrar 3 defeituosos. Enquanto o modelo
Binomial apresenta somente um único valor (como exemplo 3), a distribuição normal pode assumir qualquer valor dentro dos
limites de um intervalo em torno daquele valor específico, como exemplo “2,5 e 3,5 parafusos”, conforme ilustrado abaixo.
Normal
A aplicação da correção da continuidade prevê o ajuste de -0,5 ou + 0,5 ao valor de x, conforme as situações listadas abaixo.
a) b)
Pelo menos/ No máximo
no mínimo 100 (inclui) 100 (inclui)
99,5 100,5
Exatamente
100
c) d) e)
Maior que Menor que
100 100
99,5 100,5
100,5 99,5
Exemplo 1. Uma máquina produz parafusos, dos quais 12% apresentam algum tipo de defeito. Calcular a
probabilidade de, em um lote de 40 parafusos produzidos por essa máquina, 4 sejam defeituosos:
a) Pelo método Binomial
n = 40
P(x) = n! . S x . F n - x P= 40! . 0,12 4 . 0,88 40–4 ≈ 0,1901
x=4
x! (n - x)! 4! (40 - 4)!
S = 0,12
F = 0,88
b) Pelo método de aproximação da Normal pela Binomial
1º passo – Encontre a média e o desvio padrão da distribuição Binomial:
3º passo - Desenhe o gráfico Normal com a média e desvio padrão Binomial; e com valor de x procurado
(corrigido) e aplique a equação do escore Z:
SUBTRAÇÃO DE PROBABILIDADE
0.25 Produção damáquina (TABELA ACUMULADA)
3,5 < x < 4,5
Com as probabilidades da tabela acumulada:
0.2
Z1 = 3,5 - 4,8 = - 0,63
0.15 2,05 0,2843
Comparação de resultados: Binomial = 0,1901 versus Normal = 0,1918, sendo bastante aproximados.
Exemplo 2. Uma máquina produz parafusos, dos quais 12% apresentam algum tipo de defeito. Calcular a
probabilidade de, em um lote de 150 parafusos produzidos por essa máquina, no máximo 20 sejam defeituosos.
20,5
Perceba que pelo método Binomial você teria que calcular P0+P1+P2+...+P20, sendo muito trabalhoso. Com auxílio de recursos
computacionais, como o Excel, o resultado é 0,7413. Calculando manualmente pelo método de aproximação da Normal para
Binomial o resultado é 0,7324, tendo uma aproximação satisfatória.
Mas e se quiséssemos encontrar a probabilidade de que ocorresse no máximo 12 acidentes em qualquer mês dado? Teríamos
que usar a equação de Poisson 13 vezes e encontrar a soma de probabilidades (P0+P1+P2+...+P12). Esse método não é prático,
claro. A solução é usarmos a Normal para aproximar da Distribuição de Poisson.
Regra 1
Para uma melhor aproximação, use a correção de continuidade (+0,5 ou -0,5) nos mesmos moldes estudados na Normal como
aproximação da Binomial, visto que o modelo de Poisson também é uma distribuição Discreta.
Regra 2
À medida que a média µ de Poisson cresce, mais se aproxima da Distribuição Normal. Em geral, fazemos a aproximação da
Normal para Poisson quando µ ≥ 15.
Exemplo 1. A Média do número de acidentes por mês na rodovia Barra Mansa-Angra é de 15 acidentes por mês.
Determine a probabilidade de que, em qualquer mês dado, ocorram no máximo 12 acidentes
1º passo – Encontre a média e o desvio padrão da distribuição de Poisson:
3º passo - Desenhe o gráfico Normal (com correção continuidade) e aplique a equação escore Z:
SUBTRAÇÃO DE PROBABILIDADE
x = 15
S = 3,873
X = 12,5 Z1 = 0,5
Z=? -
Z2 = 12,5 - 15 = - 0,6455
3,873 0,2389
12,5 15 = 0,2311
Comparação de resultados: Poisson (Excel) = 0,2676 versus Normal = 0,2611, sendo bastante aproximados.
Exemplo 2. Uma máquina produz 1200 peças por hora. Determine a probabilidade de a máquina produzir mais de
136 peças em 8 minutos.
Nota: São 1200 peças por hora, em média. Logo, são 20 peças por minuto (1200/60 = 20)
1º passo – Encontre a média e o desvio padrão da distribuição de Poisson:
3º passo - Desenhe o gráfico Normal (com correção continuidade) e aplique a equação escore Z:
ADIÇÃO DE PROBABILIDADE
x = 160
S = 12,64
X = 136,5 Z1 = 0,5
Z=? +
Z2 = 136,5 - 160 = - 1,85
12,64 0,4678
136,5 160
= 0,9678
Comparação de resultados: Poisson (Excel) = 0,9708 versus Normal = 0,9678, sendo bastante aproximados.
DISTRIBUIÇÃO EXPONENCIAL
É um experimento de probabilidade que calcula o INTERVALO até a PRÓXIMA OCORRÊNCIA EM UM
PROCESSO DE POISSON em um intervalo de tempo, distância, área, volume ou unidade similar.
; Existe uma relação entre o modelo de Poisson e o Exponencial. A distribuição de Poisson é usada para calcular o número
de ocorrências em um período; a distribuição Exponencial calcula o intervalo ate a próxima ocorrência. Veja abaixo:
; É aplicada caso os eventos ocorram com uma MÉDIA conhecida e cada evento seja independente.
; Como a exponencial é utilizada na modelagem de tempos decorridos entre dois eventos, tem ampla aplicação em
estudos de confiabilidade na modelagem do tempo até a falha de um equipamento e tempo de vida de materiais.
Equação 1 ⎛1 ⎞ Equação 2 ⎛1 ⎞
− ⎜⎜ * x ⎟⎟ − ⎜⎜ * x ⎟⎟
μ μ
P= e ⎝ ⎠ P = 1− e ⎝ ⎠
Exemplo 1. O tempo médio que as pessoas acessam um caixa eletrônico de um banco é de 25 minutos. Determine
a probabilidade de que o próximo acesso a este caixa : Dados: e = 2,7182
⎛ 1 ⎞ ⎛ 1 ⎞ ⎛ 1 ⎞
− ⎜ * 40 ⎟ − ⎜ * 90 ⎟ − ⎜ * 10 ⎟
P = e ⎝ 25 ⎠ = 0,2019 P = e ⎝ 25 ⎠ = 0,0273 P = 1 − e ⎝ 25 ⎠ = 0,3296
P(x) = 0,2019
(próximo acesso ao caixa
Probabilidade
x
0 15 30 45 60 75 90
Tempo em minutos
Exemplo 2. O tempo médio entre ocorrências de acidentes na rodovia Barra Mansa - Angra é de 10 dias. Se um
acidente acabou de acontecer, qual a probabilidade de que o próximo ocorra um em período:
a) inferior a 15 dias b) Entre 20 e 25 dias (para esses casos use sempre eq. 1)
P < 15 dias, use a equação 2
μ = 10 dias μ = 10 dias
μ = 10 dias x = 20 x = 25
x = 15
⎛ 1 ⎞ ⎛ 1 ⎞
⎛ 1 ⎞ − ⎜ * 20 ⎟ − ⎜ * 25 ⎟
− ⎜ * 15 ⎟ P(x) = e ⎝ 10 ⎠ = 0,1353 P(x) = e ⎝ 10 ⎠ = 0,0820
P(x) = 1 − e ⎝ 10 ⎠ = 0,7769
P(x) = 0,7769
(próximo acidente ocorrer em
período inferior a 15 dias)
Probabilidade
x
0 10 20 30 40 50 60
Tempo em dias
Exemplo 3. A média do número de ocorrências de falhas em algum componente de um motor é de 6 falhas por dia.
Qual a probabilidade de que a próxima falha de um componente ocorra um em período:
24 horas
Nota: Ocorrem 6 falhas por dia. Logo, o tempo médio entre as ocorrências de falhas é de 4 horas. ( /6)
a) inferior a 3 horas b) Inferior a 30 minutos b) superior a 140 minutos
P < 3 horas, use a equação 2 P < 30min, use a equação 2 P >140 minutos, use a equação 1
⎛1 ⎞ ⎛1 ⎞ ⎛1 ⎞
− ⎜ * 3⎟ − ⎜ * 0,5 ⎟ − ⎜ * 2,33 ⎟
P(x) = 1 − e ⎝ 4 ⎠ = 0,5276 P(x) = 1 − e ⎝ 4 ⎠ = 0,1175 P(x) = e ⎝ 4 ⎠ = 0,5585
Você pode usar o microsoft Excel para calcular probabilidades Exponenciais. Veja abaixo .
Já a distribuição de Weibull é adequada toda vez que o sistema (um motor, por exemplo) for composto de vários componentes
e as falhas sejam aleatórias e devida à “mais grave” falha dentre um grande número de imperfeições no sistema.
As falhas não constantes significam que, depois que a
Intervalo não constante entre ocorrências de falhas (Weibull) peça estiver em uso, sua probabilidade de falhar se
x x x x altera. O número de falhas pode aumentar com o
tempo, como exemplo, o rolamento de um motor se
Falha mais desgastará ao longo do uso.
4 hs 5 hs 6 hs grave
β Equação 2 β
Equação 1 ⎛x⎞ ⎛x⎞
− ⎜⎜ ⎟⎟ − ⎜⎜ ⎟⎟
η η
P= e ⎝ ⎠ P= 1 − e ⎝ ⎠
Exemplo 1. O rolamento de um motor segue uma variável aleatória de Weibull, com vida útil de 200 horas e fator
de qualidade de 0,8. Determine a probabilidade de o rolamento:
9 A distribuição de Weibull é utilizada para representar falha: Devido à mortalidade infantil (dominada pelos pontos fracos de fabricação e
erros de partida, instalação e manutenção); Aleatórias (dominada pelas falhas inesperadas causadas por esforços repentinos, condições
extremas, erros humanos); e por desgaste (dominado pelo fim da vida de uso do equipamento). Esta informação ajuda na determinação
de uma estratégia de manutenção adequada. A análise dos dados de falha, utilizando a Distribuição de Weibull, vai nos ajudar no
estabelecimento do intervalo para certos tipos de tarefas de manutenção.
Saiba
mais
Clique aqui
www.udemy.com
Junte-se a milhões de estudantes na maior plataforma on-line
de cursos curtos e práticos do mundo.
Com mais de 45.000 cursos virtuais disponíveis, o Udemy é uma plataforma global de
ensino on-line onde 15 milhões de alunos estão dominando novas habilidades.
Sumário
Engenharia de Produção - 55 -
CAPÍTULO 4
INTRODUÇÃO À ESTATÍSTICA
INFERENCIAL
ESTATÍSTICA INFERENCIAL
O objetivo da Estatística Inferencial é tirar conclusões com base em amostras de tal modo que as
informações possam ser expandidas para toda a população.
AMOSTRA Uma amostra constitui numa redução da população a dimensões menores,
(uma parte da população) sem perda das características essenciais. Examina-se, então, a amostra. Se
essa amostra for bastante representativa, os resultados obtidos
poderão ser generalizados para toda a população. As conclusões
fundamentadas em uma amostra não serão exatamente as mesmas que
POPULAÇÃO
(todos os elementos em estudo)
você encontraria se estudasse toda a população, em função da variabilidade.
Então, toda conclusão tirada por uma amostragem virá acompanhada de um
grau de incerteza. A estatística inferencial possui técnicas que permitem dar
ao pesquisador um grau de confiabilidade, de confiança, nas afirmações que
Média = ? faz com a população, baseadas nos resultados amostrais. O problema
Desvio padrão = ? Média = a fundamental da estatística inferencial é, portanto, medir o grau de
Desvio padrão = b incerteza dessas generalizações. Conhecer a probabilidade de variação do
processo de inferência é importante. Com que probabilidade se pode confiar
nos resultados obtidos dos dados amostrais?
PARÂMETROS E ESTATÍSTICAS
Sempre que as relações forem calculadas com base em dados da população, chamamos de “PARÂMETROS”; e sempre que
essas relações se referirem à amostra serão chamadas de “ESTATÍSTICAS”.
EXEMPLO:
PARÂMETRO (População) ESTATÍSTICA (amostra)
Considerando o salário anual dos 2.500 gerentes da Considerando uma amostra do salário anual de 30
empresa XTPO, temos: gerentes da empresa XTPO, temos:
x1 = R$ 47.874 x1 = R$ 47.874
x2 = R$ 51.896 x2 = R$ 51.896
x3 = R$ 49.567 µ = R$ 51.800 x3 = R$ 49.567 x̄ = R$ 51.927
. .
σ = R$ 4.000 S = R$ 3.348
. .
x2500 = R$ 53.456 x30 = R$ 50.301
Os resultados amostrais serão sempre diferentes da população. Essa diferença chama-se erro.
EXEMPLO. Uma empresa pecuária possui uma população de novilhos de tamanho N = 80 e precisa retirar
amostras de tamanho n = 12 (15% da população) para fazer exame de uma doença. Utilize o método de
amostragem aleatória simples, considerando a tabela, a partir da 4ª linha, coluna D, sentido horizontal, da
esquerda para direita (→).
SOLUÇÃO. Como a população N=80 tem dois algarismos, combinamos dois algarismos na tabela,
descartando os números repetidos e os números que não pertencem a população (Ex.: 81, 95,...).
Este procedimento é repetido até a amostra de tamanho n=12 ser escolhida. Então:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l
1 9 3 3 1 2 1 6 6 3 3 9 0 7 0 4 0 4 4 1 3 8 1 6 5 8 8 9 8 6 5 0 6 3 3 1 2 4 8
2 0 7 6 8 1 4 5 0 5 8 6 6 1 4 2 6 7 5 6 0 5 7 7 9 6 3 2 6 3 4 5 9 8 6 5 2 1 1
3 6 5 1 5 3 4 4 2 3 7 9 1 4 8 5 8 7 2 4 7 3 7 0 6 2 2 1 3 5 0 8 9 4 7 1 6 4 4
4 9 7 0 2 6 7 3 2 6 7 4 9 1 6 2 7 7 8 6 8 4 7 8 1 5 7 1 2 6 6 6 3 5 6 0 8 2 1
5 5 5 6 5 1 6 4 8 3 3 1 5 3 8 8 2 3 8 8 7 7 4 5 0 4 5 1 8 7 2 3 2 9 6 4 7 7 9
6 8 3 4 8 8 3 8 0 6 4 8 2 3 5 2 5 3 7 1 7 6 8 2 9 5 3 4 3 7 0 3 9 7 0 1 5 7 2
Amostras escolhidas
n= 26 73 74 62 77 78 15 71 66 35 60 56
Descartadas por repetição: Descartadas por não pertencer à população:
26 26 15 91 86 84 82
Às vezes, a população é heterogênea (ex.: sexo masculino e feminino; peça A, B e C) e a amostra aleatória simples não
apresentaria esta heterogeneidade. Seria, então, necessário homogeneizar as amostras em grupos, estratos. Neste caso
recorremos à amostragem aleatória estratificada. “Estratificar” sugere “formar-se em camadas”.
Exemplo. A estratificação mais simples que encontramos na população do rebanho de tamanho N=80 é a divisão
entre novilhos e novilhas. Supondo que haja 35 novilhos e 45 novilhas, teremos a seguinte formação dos estratos:
População (80)
Estrato 1 Estrato 2
São, portanto, dois estratos (novilhos e novilhas). Como queremos uma amostra de tamanho n=12 (15% da população), por
estrato, temos:
O próximo passo é extrair as amostras dentro de cada estrato. Então, numeramos o rebanho de 01 a 80, sendo que de 01 a 35
correspondem novilhos e de 36 a 80, as novilhas. Tomando na tabela de números aleatórios, a partir da 4ª linha, coluna D,
sentido horizontal, da esquerda para direita (→), obtemos os seguintes números:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l
1 9 3 3 1 2 1 6 6 3 3 9 0 7 0 4 0 4 4 1 3 8 1 6 5 8 8 9 8 6 5 0 6 3 3 1 2 4 8
2 0 7 6 8 1 4 5 0 5 8 6 6 1 4 2 6 7 5 6 0 5 7 7 9 6 3 2 6 3 4 5 9 8 6 5 2 1 1
3 6 5 1 5 3 4 4 2 3 7 9 1 4 8 5 8 7 2 4 7 3 7 0 6 2 2 1 3 5 0 8 9 4 7 1 6 4 4
4 9 7 0 2 6 7 3 2 6 7 4 9 1 6 2 7 7 8 6 8 4 7 8 1 5 7 1 2 6 6 6 3 5 6 0 8 2 1
5 5 5 6 5 1 6 4 8 3 3 1 5 3 8 8 2 3 8 8 7 7 4 5 0 4 5 1 8 7 2 3 2 9 6 4 7 7 9
6 8 3 4 8 8 3 8 0 6 4 8 2 3 5 2 5 3 7 1 7 6 8 2 9 5 3 4 3 7 0 3 9 7 0 1 5 7 2
Temos, então:
1 a 35 → Novilhos n =5 26 15 35 31 23
36 a 80 → Novilhas n =7 73 74 62 77 78 71 66
Descartados
; Como é provável que a variável em estudo apresente, de estrato para estrato, um comportamento heterogêneo
e, dentro de cada estrato, um comportamento homogêneo, convém que a amostragem seja feita por estratos.
Portanto, a amostragem estratificada é, em geral, usada para reduzir a variação nos resultados.
Notas importantes
; A amostragem estratificada é mais eficiente do que a amostragem aleatória simples, uma vez que fica
sobre este tipo de assegurada a representatividade de elementos ao longo de toda a extensão da população. A homogeneidade de
amostragem itens dentro de cada estrato proporciona maior precisão. Da mesma maneira, em um sistema produtivo,
podemos estratificar as amostras em, por exemplo, peça A, peça B, peça C e assim por diante.
Normalmente usado para amostras grandes. É um método muito usado por motivos de ordem econômica e prática.
Imagine uma população de 8.000 na qual se queira uma amostra de 400 elementos. É inviável usar os outros métodos pois
implicaria em muito trabalho enumerar e escolher um a um.
Exemplo. Na população de 8.000 novilhos, divida em 10 conglomerados e extraia uma amostra de tamanho 2.400,
Partindo da 1ª linha, coluna A, sentido horizontal e da esquerda para direita (→) da tabela aleatória.
8000
1º passo. Determine o número de elementos para cada conglomerado: / 10 = 800 novilhos por conglomerado
População (8.000)
800 novilhos para cada conglomerado
Agora, é só coletar todos os elementos desses conglomerados selecionados e estudar todos os itens.
Uma amostra por conglomerado é uma amostra aleatória simples na qual cada unidade de amostragem é um grupo de
elementos. Uma das principais aplicações da amostragem por conglomerados é a amostragem por áreas geográficas,
como cidades, municípios, setores de uma empresa, quarteirões de cidades, domicílios, território de vendas etc. Segundo
Levine et al (2008, p. 222) e Anderson et al (2009, p.263) a amostragem por conglomerados têm as seguintes
características:
Segundo Triola (2008, p. 23) outro exemplo de amostra por conglomerado pode ser encontrado nas pesquisas eleitorais,
onde selecionamos aleatoriamente 30 zonas eleitorais dentre um grande número de zonas e, em seguida,
entrevistamos todos os eleitores daquelas seções (zonas selecionadas). Isso é muito mais rápido e muito menos
dispendioso do que selecionar uma pessoa de cada uma das zonas na área populacional.
É fácil confundir amostragem estratificada com a amostragem por conglomerado, porque ambas envolvem
ATENÇÃO! a formação de grupos. Porém, a amostragem por conglomerado usa todos os elementos de um grupo
selecionado, enquanto a amostragem estratificada usa amostras de elementos de todos os estratos.
Figura. Amostragem
por Conglomerados
em quarteirões de um
bairro.
Utilizamos este tipo de amostragem quando os elementos de uma população se encontram ordenados, por exemplo, a coleta
de amostras de um determinado produto em uma linha de produção.
Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador.
Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra
da produção diária. Neste caso, estaríamos fixando o tamanho amostral de 10% da população.
Uma amostragem é sistemática quando a retirada dos elementos da população é feita periodicamente, sendo o intervalo de
seleção calculado, por meio da divisão do tamanho da população pelo tamanho da amostra a ser selecionada, ou seja: N / n
EXEMPLO. Deseja-se retirar uma amostra de n = 10 unidades de peças de uma população de tamanho N = 800. O
800
intervalo de seleção é, então, /10 = 80. Desse modo, escolhemos um número de 1 a 80, o qual indicaria o primeiro
elemento sorteado para amostra; os demais seriam periodicamente considerados de 80 em 80. Partindo da 1ª linha,
coluna A, sentido horizontal e da esquerda para direita (→) da tabela aleatória:
o primeiro elemento será 31 (tabela aleatória) e os demais obtidos por progressão aritmética: 111, 191, 271, 351, 431, 511,
591, 671 e 751.
Amostra 1 2 3 4 5 6 7 8 9 10
Amostragem por conveniência – a amostra é identificada primeiramente por conveniência (cômodo, útil, favorável). Como
exemplo estudantes de uma universidade voluntários para compor uma amostra de uma determinada pesquisa escolar.
AMOSTRA. Calcule a média (µ x̄) e o desvio padrão (σx̄ ) das médias das amostras:
µ x̄ = ∑x → 1+2+3+4+2+3+4+5+3+4+5+6+4+5+6+7 = 4
N 16
σ2x̄ = ∑(x - µx̄)2 → (1 - 4)2 + (2 - 4)2 + . . . + (6 - 4)2 + (7 - 4)2 = 2,5 σx̄ = 2,5 → 1,581
N
16
Se aplicarmos σ o resultado é o mesmo: 2,236 → 1,581 (erro padrão da
n 2 média)
CONCLUSÃO: A média das médias das amostras é igual a média da população: µx̄ = µ. Isso não é uma coincidência, sendo uma propriedade
da distribuição amostral das médias das amostras. O desvio padrão das médias das amostras é menor que o desvio padrão da população e a
equação σ / n é denominada erro padrão da média, pois mede a variação entre as médias amostrais e dá uma idéia do erro que se comete
ao se substituir a média da população pela média da amostra.
19 22 25 28 31 34 37
Interpretação: Espera-se que 25,86% dos clientes tenham idade entre 27 e 29 anos.
b) O gerente seleciona uma amostra aleatória de 32 clientes. Ache a probabilidade de que a idade média dos
clientes esteja entre 27 e 29 anos.
Eis aqui um ponto realmente importante. Não estamos lidando com probabilidades para valores individuais. Agora, o que estamos
procurando é a probabilidade de que a média amostral caia em determinado intervalo. Estão, usaremos a regra do teorema central do
limite. Não usamos o desvio padrão de 3 do exemplo a), mas sim o erro padrão da média s n. Veja a diferença no gráfico abaixo.
σx̄ 3 = 0,53
z = x σ-
=
x Neste caso, calculamos dois escores Z e somamos
32 as probabilidades:
Média amostral
n Z1 = 27 - 28 = 1,88 → 0,4699
procurada 3
32
+
27 29 Z1 = 27 - 28 = 1,88 → 0,4699
26,41
3
Z2 26,94 27,47 28 28,53 29,06 29,59
0,5
32
19 22 25 28 31 34 37 0,9398
Idade média dos clientes
Interpretação: Há uma probabilidade de 93,98% dos 32 clientes do restaurante terem idade média entre 27 e 29 anos.
Exemplo 2. Um auditor de banco declara que as contas de cartões de crédito são normalmente distribuídas, com uma
média de R$ 2.870 e um desvio padrão de R$900. Uma amostra de 25 cartões de crédito é selecionado ao acaso.
Qual a probabilidade de que a média da conta deles seja menor que R$2.600?
σx̄ =
900 = 180, então:
z = x σ- x
25
Probabilidade procurada n
P(Z < 2600) para amostra Neste caso, calculamos dois escores Z e
de 25 cartões subtraímos as probabilidades:
P1 = 0,5
-
Z2 = 2600 - 2870 =1,5 → 0,4332
900 1
25
0,0668
Interpretação: Espera-se que 6,68% dos cartões de crédito tenham média menor que R$2.600.
Nota: Os conceitos que vimos são aplicados quando a população é infinita, a amostragem é com reposição e as variáveis aleatórias são independentes. No exemplo
1 a população é infinita (quantos clientes são do restaurante?) as amostras são independentes ( aparecer um cliente com certa idade, independe da ocorrência
anterior). Quando a população é finita (pequena), a amostragem é sem reposição e as variáveis aleatórias são dependentes, aplicamos um fator de correção:
σ N − n onde N é o tamanho da população e n é o tamanho da amostra.
n N −1
Estimativa pontual. Fazemos uma única estimativa (um valor) para um determinado parâmetro populacional.
Exemplo conceitual Exemplo prático: Expectativa de vida de um brasileiro:
estimar estimar
Média amostral ⎯⎯ ⎯
⎯→ Média populacional Média amostral ⎯⎯ ⎯
⎯→ Média populacional
(x̄ = 70 anos) (µ = 70 anos)
Estimativa intervalar. Fazemos uma estimativa de um intervalo de valores possíveis, no qual se admite esteja o parâmetro
populacional.
Exemplo conceitual Exemplo prático: Expectativa de vida de um brasileiro:
estimar estimar
Média amostral x̄ ⎯→ Média populacional ± x̄
⎯⎯ ⎯ Média amostral ⎯⎯ ⎯
⎯→ Média populacional
(x̄ = 70 anos) (µ = 60 a 80 anos)
A melhor maneira de estimar o parâmetro é por meio de uma estatística com margem de erro para mais ou para menos. A finalidade de uma
estimativa por intervalo é fornecer informações sobre quão próximo a estimativa pontual, produzido pela amostra, está do valor do parâmetro.
INTERVALOS DE CONFIANÇA - IC
Um intervalo de confiança é uma faixa (ou um intervalo) de valores usada para se estimar o verdadeiro
valor de um parâmetro populacional, com certa probabilidade. Geralmente é abreviado por “IC”.
A palavra intervalo é usada porque seu resultado se torna um intervalo. A palavra confiança é usada porque você possui certa confiança no
processo pelo qual você chegou ao intervalo. Isso se chama nível de confiança (ou credibilidade). O intervalo de confiança associa-se a um nível
de confiança, geralmente 95%., que é a probabilidade de que o intervalo estimado contenha o parâmetro populacional. Usamos o Intervalo de
confiança porque a estimativa pontual não indica quão boa é nossa melhor estimativa. Como a estimativa pontual tem a séria falha de não
revelar quão boa ela é, os estatísticos desenvolveram o IC.
Mas, de onde vem 0,4750 e 1,96? Observe na tabela de Distribuição Normal Padrão que, se queremos ter 95% de confiança,
basta encontrar a probabilidade de 0,4750 (0,95/2). Então, identificamos o escore z, que é de 1,96.
Z = 1,96 para
95% de confiança
Se queremos ter 90% de confiança, basta encontrar 0,4500 (0,90/2) na tabela. Como não temos 0,4500, então identificamos a
probabilidade mais próxima, que é 0,4505. Observe que o escore z é de 1,65.
Exemplos de cálculos de Intervalos de Confiança - IC
1. De uma amostra de 40 clientes que frequentam um restaurante, constatou-se que a idade média é de 28 anos com
desvio padrão de 9 anos. Construa um intervalo de confiança de 95% para a idade média da população.
n = 40 25,21 30,79
x̄ = 28 s = 28 ± 1,96 9 = 28 ± 2,79
- 2,79 +2,79
ICμ = x ± z
s=9 n 40 24 25 26 27 28 29 30 31 32
z = 1,96
Interpretação: Você está 95% confiante que a idade média dos clientes que frequentam o restaurante está entre 25,21 anos e 31,79 anos.
2. Um analista de produção deseja estimar a média do tempo de vida útil das lâmpadas produzidas. Para tanto,
coletou uma amostra de 60 lâmpadas e verificou que a média de vida útil é de 1000 horas, com desvio padrão de 100
horas. Construa um intervalo de confiança de 90% para a média populacional.
n = 60 978,70 1021,30
x̄ = 1000 s = 1000 ± 1,65 100 = 1000 ± 21,30 - 21,30 +21,30
ICμ = x ± z
s = 100 n 60
z = 1,65 970 980 990 1000 1010 1020 1030
Interpretação: Você está 90% confiante que a média do tempo de vida útil das lâmpadas produzidas está entre 978,70 horas e 1021,30 horas.
Nota: Quando a população for finita a equação precisa ser ajustada. Se n ≥ 0,05N, a equação é s N − n , onde N = população.
IC = x ± z
n N −1
Uma maneira de aumentar a precisão de uma estimativa sem decrescer o nível de confiança é aumentar o tamanho da
amostra. Mas, qual o tamanho da amostra necessário para garantir certo nível de confiança para uma margem de erro E dada?
A margem de erro foi E=21,30. O analista deseja aumentar a precisão do Intervalo de Confiança com uma
margem de erro E = 15. Quantas lâmpadas devem ser incluídas na amostra se ele quer estar 90% confiante?
n=?
2 2
z = 1,65 ⎛ z •s ⎞ → ⎛⎜
1,65*100⎞ = 121 lâmpadas. Interpretação: 60 lâmpadas já foram
s = 100 n =⎜ ⎟ ⎟ coletadas, então o analista precisa de mais 61.
⎝ E ⎠ ⎝ 15 ⎠
E = 15
9 Cada tamanho amostral possui sua própria distribuição t, ou seja, ao contrário da distribuição normal, a distribuição t não tem forma
fixa, mas sim uma família de curvas. Cada curva é determinada por um parâmetro chamado grau de liberdade, encontrado pelo
tamanho da amostra menos um. A idéia aqui é que o preço a ser pago por se ter uma amostra muito pequena, como 5, é mais alto do
que o preço por se ter uma amostra de tamanho um pouco maior, como 10 ou 20.
g.l. = n - 1. Graus de liberdade Portanto, a distribuição t varia de acordo com o tamanho da amostra.
9 O grau de liberdade se refere ao número de valores que são livres para variar após estabelecerem algumas restrições de dados. Por
exemplo, se uma amostra de tamanho 4 produz uma média de 87, sabemos que a soma dos números é 4 * 87 = 348; isso não diz nada
sobre os valores individuais da amostra – há números infinitos de formas para se obter 4 números que somem 348; mas quando
escolhemos três deles, o quarto é determinado. O primeiro número pode ser 84, o segundo 98 e o terceiro 81, então o quarto tem de ser
85, o único número que produzirá a média amostral conhecida, ou seja, existe n - 1 ou 3 graus de liberdade nesse exemplo.
9 Conforme os graus de liberdade aumentam, a distribuição t se aproxima da distribuição normal. Depois de 30 g.l., a distribuição t está
muito próxima à distribuição normal.
Observe que, no exemplo anterior com amostra de 60 lâmpadas e usando a curva normal, o IC foi mais preciso: 1000 ± 21,30 .
Observe que a população é constituída por elementos de dois tipos, isto é, cada elemento pode ser interpretado como Sucesso e
Fracasso, além dos eventos ser independentes. Nestas condições, a variável aleatória segue uma distribuição Binomial.
De acordo com Teorema do Limite Central, para amostra suficientemente grande (n > 30), a distribuição Binomial aproxima-se a uma
distribuição Normal. Daí é imediato verificar que a proporção amostral p também aproxima-se da distribuição normal.
Ocorre que, da mesma forma que o intervalo de confiança para média, frequentemente estamos interessados em estimar um intervalo
de confiança para proporções populacionais.
Exemplo. Um Analista Industrial deseja estimar a proporção de lâmpadas defeituosas produzidas. Coletou uma
amostra de 400 lâmpadas e verificou que 15% estão defeituosas. Construa um Intervalo de Confiança de 95%
para a proporção populacional.
Interpretação: Você está 95% confiante que a proporção de lâmpadas defeituosas está entre 11,6% e 18,4%.
(Continuação exemplo anterior). Um Analista Industrial coletou uma amostra de 400 lâmpadas e verificou que
15% estão defeituosas. Construiu um IC com 95% de Confiança e margem de erro E = 0,034. Determine o
tamanho da amostra para aumentar a precisão com margem de erro E = 0,02, e com a mesma confiança.
p̂ = 0,15 n=? 2 2
⎛z⎞ ⎛ 1,96 ⎞
z = 1,96 n = ˆp(1− ˆp) ⎜ ⎟ → 0,15(1− 0,15) ⎜ ⎟ = 1.224 lâmpadas.
E = 0,02 ⎝ E⎠ ⎝ 0,02⎠
Segundo Spiegel (1977, p. 262,310), podemos usar a distribuição Normal para encontrar intervalos de confiança para o desvio
padrão, desde que a amostra seja maior que 30.
EQUAÇÃO do Intervalo de Confiança para o Desvio padrão
s S = desvio padrão
IC σ = s ± z Z = escore Z da distribuição Normal
2n n = tamanho da amostra
Exemplo 1. Um analista deseja estimar o desvio padrão do tempo de vida útil das lâmpadas produzidas. Para
tanto, coletou uma amostra de 60 lâmpadas e verificou que a média de vida útil é de 1000 horas, com desvio
padrão de 100 horas. Construa um intervalo de confiança de 90% para o desvio padrão populacional.
84,94 115,06
S = 100 100 - 15,06 +15,06
Z = 1,65 IC σ = 100 ± 1,65 → 100 ± 15,06
2 • 60
n = 60
80 90 100 110 120
Interpretação: Você está 90% confiante que o desvio padrão populacional está entre 84,94 horas e 115,06 horas.
g.l. = n - 1. Graus de liberdade Portanto, a distribuição χ2 varia de acordo com o tamanho da amostra.
2 2
9 A distribuição χ tem a forma assimétrica positiva (à direita). Conforme os graus de liberdade aumentam, a distribuição χ se aproxima
2
da distribuição normal. Depois de 30 g.l., a distribuição χ está muito próxima à distribuição normal.
gl = 5 2
Família de curvas da Distribuição χ :
- Curvas assimétricas positivas
- Quanto menor o tamanho da amostra, maior o erro.
gl = 10
gl = 15 2
Curva χ com g.l = 30 aproxima-se da
curva normal.
gl = 30
Nível de confiança
χ2L χ2R
Exemplo. Encontre os valores χ2L e χ2R e um intervalo de confiança de 90%, quando o tamanho da amostra for 20.
1º - Ache o grau de liberdade – g.l. 2º - encontrar as áreas de χ2L e χ2R
Como n = 20, os graus de liberdade são: Em razão da confiança c ser 90%, temos:
χ2L = 1+c χ2R = 1 - c
g.l. = n – 1
2 2
20 – 1 = 19
χ2L = 1 + 0,90 = 0,950 χ2R = 1 - 0,90 = 0,050
2 2
3º - encontrar os valores críticos na tabela χ2
Parte da tabela χ2 é exibida abaixo. Usando g.l.=19 e as áreas 0,95 e 0,05 encontramos os valores críticos, como destacado:
2 2
Por meio da tabela você pode ver que: χ L = 10,1170 e χ R = 30,1435.
Interpretação: Então, 90% da área sob a curva está situada entre 10,1170 e 30,1435
Exemplo 2. Um analista deseja estimar o desvio padrão do tempo de vida útil das lâmpadas produzidas. Para
tanto, coletou uma amostra de 15 lâmpadas e verificou que a média de vida útil é de 1000 horas, com desvio
padrão de 100 horas. Construa um intervalo de confiança de 95% para o desvio padrão populacional.
CAPÍTULO 5
TESTE DE HIPÓTESE
É possível testar
afirmativas acerca de
populações?
Conceitos introdutórios
TESTE DE HIPÓTESE é um procedimento usado para testar se a afirmação acerca de uma população é
verdadeira ou não, com base em dados amostrais.
Uma hipótese é uma suposição quanto ao valor de um parâmetro populacional. O teste de hipótese é tão somente uma regra de
decisão para ACEITAR ou REJEITAR uma hipótese qualquer (uma suposição, uma afirmação), com base nos elementos amostrais.
EXEMPLO. A FIAT afirma que o consumo de combustível do Pálio Fire é, em média, de 18 km/L. Uma revista
decide testar essa afirmação e analisa 50 veículos obtendo uma média de 17 km/L, que é diferente da informada
pelo fabricante.
9 O resultado de 17km/L não garante que a afirmação do fabricante seja falsa, pois você está se baseando em dados amostrais. Para
haver esta garantia só realizando um censo (toda a população), o que é teoricamente impossível.
9 O que devemos avaliar, com auxílio do Teste de Hipótese, é se a afirmação é verdadeira ou não, com base nos dados amostrais.
Nível de significância α. Note que o erro Tipo I é pior pois condenar um inocente é algo terrível, e este erro o pesquisador deve evitar a todo
o custo! Porém, há sempre uma probabilidade de cometê-lo. Esta probabilidade é chamada de Nível de Significância α (alfa). Portanto:
O NÍVEL DE SIGNIFICÂNCIA α é a PROBABILIDADE de se cometer um ERRO TIPO I, devendo ser sempre a menor possível.
Normalmente, usamos um Nível de Significância de 10% (0,10); 5% (0,05); ou 1% (0,01). Mas pode-se usar qualquer α.
Tipos de Testes.
Usamos a curva normal (ou t) para realizar os testes, sendo três tipos possíveis, e o que será usado depende do sinal presente na hipótese alternativa Ha.
Teste Unilateral à esquerda Teste Unilateral à direita Teste Bilateral
H0 : µ = 18 km/L H0 : µ = 18 km/L H0 : µ = 18 km/L
Ha : µ < 18 km/L Ha : µ > 18 km/L Ha : µ ≠ 18 km/L
α → 5% α → 5% α → 5%
Região de Região de
Região de aceitação
Região de aceitação aceitação Região de Região de
rejeição 0,95 Região de rejeição
0,95 rejeição
α → 0,05 rejeição α →0,025 0,95 α → 0,025
α → 0,05 2 2
Este teste será usado quando se tem um valor Este teste será usado quando se tem um valor Será usado quando se tem um valor dentro de um
mínimo aceitável. Sinal usado em Ha: <. máximo aceitável. Sinal usado em Ha: >. intervalo aceitável. Sinal usado em Ha: ≠.
TOMANDO A DECISÃO: A Região de rejeição (demonstrada no gráficos) é o conjunto de todos os valores da estatística de teste que nos fazem rejeitar a Hipótese
Nula (H0). Se a estatística de teste cair nesta região, diremos que a afirmativa do fabricante é falsa, o que fará com que rejeitemos a Hipótese Nula (H0).
Mas, se a estatística de teste cair na Região de aceitação, diremos que a afirmativa é verdadeira. O termo “estatística de teste” é feito por meio de cálculos que
serão apresentados a seguir. O nível de significância α → 5% (demonstrado nos gráficos) é apenas um exemplo, pois podemos usar também outros níveis.
Teste de Hipótese para média (amostras grandes n > 30) (Distribuição Normal z)
Usamos a Distribuição Normal (z) para realizar o teste de hipótese para amostra maior que 30. Quando o desvio padrão é
conhecido, mesmo com amostra menor que 30, também podemos usar a Normal. Embora tenha 3 tipos de testes, na prática
aplicamos um ou outro, nunca os três conjuntamente. Mostraremos a aplicação dos três testes em problemas diferentes.
EXEMPLO 2. TESTE UNILATERAL À DIREITA A FIAT afirma que o consumo de combustível do Pálio Fire é, em média, de 18 km/L. Uma
revista decide testar a afirmação e analisa 35 veículos da mesma marca, obtendo uma média de 18,5 km/L com desvio padrão de 2,5
km/L.. Testar a hipótese, contra a alternativa de que o consumo é maior que 18km/L, com Nível de Significância de 4%.
1º passo: Formular as hipóteses: 4º passo: Desenhar as Regiões de Rejeição e de 5º passo: Calcular a
H0 : µ = 18 km/L Aceitação, em função do escore z (nível α) : estatística de teste:
Ha : µ > 18 km/L
x −μ
2º passo: Definir o tipo de teste a ser usado: Região de z=
Como a média amostral foi 18,5km/L, temos um valor máximo
aceitação
0,96
s
Região de
aceitável. O sinal é >, logo, usamos o unilateral à direita. rejeição n
α → 0,04
3º passo: Encontrar escore z que estabelece os limites de
18,5 − 18 = +1,18
Rejeição/Aceitação: α=4%(0,04) | 0,5 – 0,04 = 0,46 → z = +1,75 z=
18km/L
2,5
Ao procurar 0,46 na tabela Normal, encontramos z = +1,75 (como o z=+1,75
teste é “unilateral à direita”, z será positivo). 35
EXEMPLO 3. TESTE BILATERAL. A FIAT afirma que o consumo de combustível do Pálio Fire é, em média, de 18 km/L. Uma revista
decide testar a afirmação e analisa 42 veículos da mesma marca, obtendo uma média de 16,8 km/L com desvio padrão de 2 km/L.
Testar a hipótese, contra a alternativa de que o consumo não é de 18km/L, com Nível de Significância de 10%.
1º passo: Formular as hipóteses: 4º passo: Desenhar as Regiões de Rejeição e de 5º passo: Calcular a
H0 : µ = 18 km/L Aceitação, em função do escore z (nível α) : estatística de teste:
Ha : µ ≠ 18 km/L
Região de x −μ
2º passo: Definir o tipo de teste a ser usado: aceitação z=
A idéia não é testar se é menor ou maior. Queremos testar um Região de Região de s
rejeição rejeição
intervalo aceitável. O sinal é ≠, logo, usamos o Bilateral. α →0,05 0,90 α → 0,05 n
2 2
3º passo: Encontrar escore z que estabelece os limites de
16,8 − 18 = -3,88
Rejeição/Aceitação: α=10% | 0,90/2 = 0,45 → z = -1,65 e +1,65 z=
18km/L 2
Ao procurar 0,45 na tabela Normal, encontramos z = ±1,65 (como o Z=-1,65 Z=+1,65 (0,90/2 = 0,45)
teste é “Bilateral”, usamos z positivo e negativo). 42
p − p0 p = proporção amostral
A estatística de teste z= p0 = proporção Hipotética (H0)
usada para p0( 1 − p0) n = tamanho da amostra
Proporções é: n z = Estatística de teste z (Normal)
EXEMPLO 5. Inspeciona-se uma amostra de 200 peças de uma grande remessa, encontrando-se 8% de peças defeituosas (200 x 0,08 =
16 peças defeituosas). O fornecedor garante que não haverá mais de 6% de peças defeituosas em toda a remessa. Testar a hipótese de
que a proporção de peças defeituosas é maior que 6%, com Nível de Significância de 5%.
1º passo: Formular as hipóteses: 4º passo: Desenhar as Regiões de Rejeição e 5º passo: Calcular a
H0 : p0 = 6% de Aceitação, em função do escore z (nível α) estatística de teste z:
Ha : p > 6%
p − p0
2º passo: Definir o tipo de teste a ser usado: Região de z=
Como a proporção amostral foi 8%, temos um valor máximo aceitação p0( 1 − p0)
0,95 Região de
aceitável. O sinal é >, logo, usamos unilateral à direita.
rejeição
n
3º passo: Encontrar escore z que estabelece os limites de α → 0,05
0,08 − 0,06
Rejeição/Aceitação: α=5% | 0,5 – 0,05= 0,45 → z=+1,65 z= = +1,19
0,06( 1 − 0,06)
Ao procurar 0,45 na tabela Normal, encontramos z = +1,65 (como o z=+1,65
teste é “unilateral à direita”, usamos z positivo). 200
EXEMPLO 6. TESTE BILATERAL. A FIAT afirma que o consumo de combustível do Pálio Fire é, em média, de 18 km/L., com desvio
padrão de 1,2 km/L Uma revista decide testar essa afirmação e analisa 20 veículos da mesma marca, obtendo uma média de 17,4
km/L com desvio padrão de 1,7km/L. Testar a hipótese de que o desvio padrão não é de 1,2 km/L, com Nível Significância 10%.
1º passo: Formular as hipóteses: 2º passo: Definir o tipo de teste a ser usado:
H0 : S0 = 1,2 km/L A idéia não é testar se é menor ou maior. Queremos testar um intervalo
Ha : S ≠ 1,2 km/L aceitável. O sinal é ≠, logo, usamos o Bilateral.
3º passo: encontrar os valores χ2L e χ2R com nível de significância α =10% (90% de confiança), quando o tamanho da amostra for 20.
2 2
1º - Ache o grau de liberdade – g.l. 2º - encontrar as áreas de χ L e χ R
Como n = 20, os graus de liberdade são: Em razão da confiança c ser 90%, temos:
2 2
χ L = 1+c χ = 1-c
R
g.l. = n – 1 2 2
20 – 1 = 19 2
χ L = 1 + 0,90 = 0,950 χ
2
= 1 - 0,90 = 0,050
R
2 2
2
3º - encontrar os limites de Rejeição e Aceitação na tabela χ
2
Parte da tabela χ é exibida abaixo. Usando g.l.=19 e as áreas 0,95 e 0,05 encontramos os valores críticos, como destacado:
Região de
5º passo:Tomada de decisão: rejeição 0,05 Região de
Observe que 38,13 caiu na Região de rejeição. rejeição 0,05
Portanto, deve-se REJEITAR A HIPÓTESE NULA
2 2
Para testes unilaterais à esquerda, usamos χ L como limite de Rejeição. Para testes unilaterais à direita, usamos χ R como limite de Rejeição.
2 2
Para unilateral à esquerda (χ L ) use sempre 1 – α Para unilateral à direita (χ R) use sempre α
EXEMPLO. TESTE UNILATERAL À ESQUERDA. Encontre χ2L quando o tamanho da amostra for 23, com nível de significância 10%
g.l. = n – 1 → 23 – 1 = 22 Usando g.l. = 22 com α = 0,90, encontramos 14,0415 na tabela χ2
2
1 – α → 1 – 0,10 = 0,90 Nota: para testes χ L use sempre 1 – α
Região de
aceitação 0,90
Região de
rejeição 0,10
χ2L = 14,0415
EXEMPLO. TESTE UNILATERAL À DIREITA. Encontre χ2R quando o tamanho da amostra for 41, com nível de significância 5%
g.l. = n – 1 → 41 – 1 = 40 Usando g.l. = 40 com α = 0,05, encontramos 55,7585 na tabela χ2
2
α → 0,05 Nota: para testes χ R use sempre α
Região de
aceitação 0,95
Região de
rejeição 0,05
χ2R = 55,7585
d ⎡ (∑ d )2 ⎤
∑d = ∑ d2 − ⎢ ⎥
d= Sd ⎣ n ⎦
n n Sd =
n −1
“d” é a diferença de cada dado,
2
encontrado por X2-X1 “d ” é a diferença de cada dado, ao quadrado
t = distribuição t de Student. Use a Normal Z se n>30. n = tamanho da amostra.
Exemplo 1. Dez cobaias adultas foram submetidas ao tratamento com certa ração para engordar, durante uma
semana. Os animais foram perfeitamente identificados, tendo sido mantidos, para tanto, em gaiolas individuais. Os
pesos, em gramas, no princípio e no fim de semana, designados respectivamente por X1 e X2 são dados a seguir.
Ao nível de 1% de significância, podemos concluir que o uso da ração contribuiu para o aumento do peso médio dos
animais? (Moretim)
Resolução: A tabela com os dados da experiência é mostrada abaixo, juntamente com os cálculos do 1º e 2º passos.
1º passo: Encontrar d (X2-X1) e ∑d (para permitir cálculo de d , que é a média das diferenças).
2º passo: Encontrar d2 e ∑d2 (para permitir cálculo de Sd, que é o desvio padrão das diferenças).
Dados da experiência
diferença d 3º passo: Calcular d
Cobaia X1 X2 d2
(X2-X1) ∑ d → 66 = 6,6
1 635 640 5 25 d= n é o tamanho da amostra
n 10
2 704 712 8 64
3 662 681 19 361
4 560 558 -2 4
5 603 610 7 49
6 745 740 -5 25 4º passo: Calcular Sd
7 698 707 9 81 ⎡ (∑ d )2 ⎤ ⎡ (66 )2 ⎤
8 575 585 10 100 ∑ d2 − ⎢ ⎥ 882 − ⎢ ⎥
⎣ n ⎦ → ⎣ 10 ⎦ = 7,043
9 633 635 2 4 Sd =
10 669 682 13 169 n −1 10 − 1
∑d=66 ∑d2=882
z=-2,05 z=+2,05
z=-3,38
6
CORRELAÇÃO E REGRESSÃO
Existem situações nas quais interessa estudar a relação entre duas variáveis,
coletadas como pares ordenados (x,y), para resolver questões do tipo
“Existe relação entre o número de horas de estudo e as notas obtidas?”.
Problemas como esses são estudados pela análise de correlação linear
simples, onde determinamos o grau de relação entre duas variáveis. Se as
variáveis variam juntas, diz-se que as mesmas estão correlacionadas.
Saiba
mais
Clique aqui
www.udemy.com
Junte-se a milhões de estudantes na maior plataforma on-line
de cursos curtos e práticos do mundo.
Com mais de 45.000 cursos virtuais disponíveis, o Udemy é uma plataforma global de
ensino on-line onde 15 milhões de alunos estão dominando novas habilidades.
Existem situações nas quais interessa estudar a relação entre duas variáveis, coletadas como pares ordenados
(x,y), para resolver questões do tipo:
Variável x Variável y
Existe relação entre o número de horas de estudo... ...e as notas obtidas?
Quanto maior for a produção... ...maior será o custo total?
Existe relação entre o tabagismo... ...e a incidência de câncer?
Quanto maior a idade de uma casa... ...menor será seu preço de venda?
Existe relação entre o número de horas de treino... ...e os gols obtidos em uma partida de futebol?
Existe relação entre o nível de pressão arterial... ...com a idade das pessoas?
; Problemas como esses são estudados pela análise de correlação linear simples, onde determinamos o grau de
relação entre duas variáveis. Se as variáveis variam juntas, diz-se que as mesmas estão correlacionadas.
Correlação linear simples é uma técnica usada para analisar a relação entre duas variáveis.
DIAGRAMA DE DISPERSÃO
EXEMPLO 1. Consideremos na tabela abaixo uma amostra formada por 8 alunos de uma classe, pelo número de
horas de estudo (x) e as notas obtidas (y). Verifique se existe correlação por meio do diagrama de dispersão.
Diagrama de Dispersão
Número de horas de estudo
versus notas obtidas H o r as estud ad as ver sus Notas o b tid as
10
Aluno X Y 9
(horas de estudo) (notas obtidas) Ponto de interseção
8
(Aluno D)
A 8h 9,0
Y (Notas obti das )
7
B 2h 3,0 6
5
C 3h 4,0
4
D 4h 5,0 3
E 4,5h 6,0 2
F 6h 7,0 1
0
G 5h 7,0 0 1 2 3 4 5 6 7 8 9
H 7h 7,5 x (Horas de es tudo)
FONTE: dados fictícios
Representando os pares ordenados (x,y), obtemos diversos pontos grafados que denominamos diagrama de dispersão. Para
construí-lo, basta pontuar a interseção de cada eixo x,y. Por exemplo, o aluno D estudou 4h (eixo x) e obteve a nota 5,0 (eixo
y). Observe no diagrama uma linha vermelha pontilhada e o ponto de interseção. Esse diagrama nos fornece uma idéia
grosseira, porém útil, da correlação existente. Ao observar o diagrama como um todo, podemos afirmar que existe uma
correlação entre as variáveis x,y pois, quando x cresce, y também tende a crescer.
CORRELAÇÃO LINEAR
H o r as estud ad as ver sus No tas o b tid as
10
Os pontos grafados, vistos em conjunto, 9
formam uma elipse (trajetória, distribuição 8
dos pontos) em diagonal.
Y (Notas obti das )
7
6
Podemos imaginar que, quanto mais fina for 5
Uma direção para cima sugere que se: Uma direção para baixo sugere que se:
- x aumenta, - x aumenta,
- y tende a aumentar. - y tende a diminuir.
EXEMPLO 2. Consideremos na tabela abaixo os meses de Jan a Set, o aumento mensal do preço das refeições (x)
e a média do número de clientes ao mês (y). Verifique se existe correlação por meio do diagrama de dispersão.
Diagrama de Dispersão
Aumento do preço da refeição
versus média de clientes por mês Aumento do p r eço da r efeição ver su s média clientes p/dia
Mês X Y 180
Ago R$ 21,90 80 0
0,00 5,00 10,00 15,00 20,00 25,00 30,00
Set R$ 24,90 67 x ( P reç o ref ei ç ão)
FONTE: dados fictícios
Onde:
r = coeficiente de correlação e n = tamanho da amostra
EXEMPLO DE APLICAÇÃO. Consideremos na tabela abaixo uma amostra formada por 8 alunos de uma classe, pelo
número de horas de estudo (x) e as notas obtidas (y), calcule o coeficiente de correlação r.
Cálculo do r:
Número de horas de estudo
versus notas obtidas
Aluno X Y X2 Y2 XY
(horas de estudo) (notas obtidas)
A 8h 9,0 64 81 72
B 2h 3,0 4 9 6
C 3h 4,0 9 16 12
D 4h 5,0 16 25 20
E 4,5h 6,0 20,25 36 27
F 6h 7,0 36 49 42
G 5h 7,0 25 49 35
H 7h 7,5 49 56,25 52,5
∑=39,5 ∑=48,5 ∑=223,25 ∑=321,25 ∑=266,5
Interpretação:
O coeficiente de correlação r = 0,975 indica que o grau de relação entre as duas variáveis é “Muito forte”,
além de ser “Positiva” (pois x aumenta, y também aumenta). Então, podemos afirmar que, conforme
aumentam as horas de estudo, as notas obtidas também aumentam. Veja mais detalhes abaixo:
O grau de relação r pode variar de -1 até +1, conforme ilustrado abaixo:
Perfeita Nula Perfeita
-1 0 +1
-0,9 -0,6 -0,3 0,3 0,6 0,9
Muito Forte Fraca Muito Fraca Muito Fraca Fraca Forte Muito
forte forte
x x
r=0,975
Positiva e “Muito forte”
Notas:
Correlação e causalidade.
O fato de duas variáveis serem fortemente correlacionadas não implica uma relação de causa e efeito entre elas. Um estudo
mais profundo é usualmente necessário para determinar se há uma relação causal entre as variáveis. As seguintes questões
devem ser consideradas ao pesquisador:
- Há uma relação direta de causa e efeito entre as variáveis?
- É possível que a relação entre duas variáveis seja uma coincidência?
Mais informações em Larson, 2010, capítulo 9.
Após verificar se a correlação linear entre duas variáveis é significante, o próximo passo é determinar a equação
da linha que melhor modela os pontos grafados. Essa linha é chamada de linha de regressão (ou linha de melhor
ajuste). Portanto, a análise de regressão linear simples tem por objetivo obter a equação matemática do ajuste da
reta que representa o melhor relacionamento numérico linear entre as duas variáveis em estudo.
A Regressão Linear
H o r as estud ad as ver sus No tas o b tid as determina o
10
ajuste da reta,
9
chamada de “Linha de
8
Regressão”
Y (Notas obti das )
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9
x (Horas de es tudo)
Ao se construir um diagrama de dispersão, não sabemos o comportamento da reta em relação aos pontos
grafados. Para tanto, devemos calcular o “ajustamento da reta aos pontos”. Eis alguns exemplos de diagramas de
dispersão com o ajustamento da reta aos pontos:
Para ajustar a reta aos pontos grafados em um diagrama de dispersão, os estatísticos usam as seguintes equações:
b = - a = aX + b
Onde: Onde:
b = Coeficiente linear
= Ajustamento da reta
Onde: = Média de y a = Coeficiente angular
a = Coeficiente angular a = Coeficiente angular
n = tamanho da amostra X = É um valor arbitrário. (Ex.: nº 5)
= Média de x b = Coeficiente linear
EXEMPLO DE APLICAÇÃO. Consideremos na tabela abaixo uma amostra formada por 8 alunos de uma classe, pelo
número de horas de estudo (x) e as notas obtidas (y), calcule a reta ajustada nos pontos grafados.
Número de horas de estudo
versus notas obtidas
1º - Calcular o Coeficiente angular a:
Aluno X Y X2 XY
(horas de estudo) (notas obtidas)
A 8h 9,0 64 72
B 2h 3,0 4 6
C 3h 4,0 9 12
D 4h 5,0 16 20
E 4,5h 6,0 20,25 27 a = 266,5 - (39,5) . (48,5)
F 6h 7,0 36 42 8
G 5h 7,0 25 35 223,25 - (39,5)2
H 7h 7,5 49 52,5 8
∑=39,5 ∑=48,5 ∑=223,25 ∑=266,5 a = 0,958
b = - a = aX + b
Note que os pontos grafados estão muito próximos da reta. Isso significa que existe uma correlação
muito forte entre as duas variáveis em estudo
REFERÊNCIAS BIBLIOGRÁFICAS
ANDERSON, David R.; SWEENEY, Dennis J.; WILLIANS, Thomas A. Estatística aplicada à administração e economia. 2
ed. São Paulo: Cengage Learning, 2009. 597 p.
BARBETTA et al. Estatística para cursos de engenharia e informática. 2 ed. São Paulo: Atlas, 2008.
COSTA NETO, Pedro Luiz de Oliveira; CYMBALISTA, Melvin. Probabilidades. 2 ed. São Paulo: Edgard Blucher, 2005.
CRESPO, Antônio Arnot. Estatística fácil. 17 ed. São Paulo: Saraiva, 1999. 224 p.
FARIAS, Alfredo Alves et al. Introdução à estatística. 2 ed. Rio de Janeiro: LTC, 2003. 340 p.
GIOVANNI José Ruy; BONJORNO, José Roberto; GIOVANNI JR., José Rui. Matemática fundamental: uma nova
abordagem – volume único. São Paulo: FTD, 2002. 712 p.
HAZZAN, Samuel. Fundamentos da matemática elementar: combinatória e probabilidade. 7 ed. São Paulo: Atual
editora, 2004. 184p.
LAPPONI, Juan Carlos. Estatística usando o Excel. 4 ed. Rio de Janeiro: Elsevier, 2005. 476 p.
LARSON, Ron; FARBER, Betsy. Estatística aplicada. 4 ed. São Paulo: Pearson, 2010. 637 p.
LEVINE, David M. et al. Estatística: teoria e aplicações. 5 ed. Rio de Janeiro: LTC, 2008. 752 p.
LOPES, Paulo Afonso. Probabilidade e estatística: conceitos, modelos e aplicações em Excel. Ernesto Reichmann, 1999.
MEYER, Paul L. Probabilidade: aplicações à estatística. 2 ed.. Rio de Janeiro: LTC, 1983. 426 p.
MONTGOMERY, Douglas C.; RUNGER, George C. Estatística aplicada e probabilidade para engenheiros. 2 ed. Rio de
Janeiro: LTC, 2003. 465 p.
MORETTIN, Luiz Gonzaga. Estatística básica: probabilidade e inferência. São Paulo: Pearson, 2010. 375 p.
ROSS, Sheldon. Probabilidade: um curso moderno com aplicações. 8 ed.Porto Alegre: Bookman,2010. 826p.
RUMSEY, Deborah. Estatística para leigos. Rio de Janeiro: Alta books, 2009. 350 p.
SILVA, Ermes Medeiros et al. Estatística: para os cursos de Economia, Administração e Ciências Contábeis - volume 1. 2
ed. São Paulo: Atlas, 1996. 189 p.
SMOLE, Kátia Stocco; DINIZ, Maria Ignez. Matemática–ensino médio. 5 ed. São Paulo: Saraiva, 2005. 558p.
SPIEGEL, Murray R. Estatística. Coleção Shaum. São Paulo: McGraw-Hill do Brasil, 1977. 580 p.
TRIOLA, Mario F. Introdução à estatística. 10 ed. Rio de Janeiro: LTC, 2008. 696 p.
URBANO, João. Estatística: uma nova abordagem. Rio de Janeiro: Ciência Moderna, 2010.530 p.
VASCONCELLOS, Maria José Couto; SCORDAMAGLIO, Maria Terezinha; CÂNDIDO, Suzana Laino. Coleção
Matemática. 1ª e 3ª série do ensino médio. São Paulo: Editora do Brasil, 2004. 232 p.
Onde comprar:
Você poderá adquiri-los pelo site www.submarino.com.br. Basta se cadastrar e pagar por meio de boleta
ou cartão de crédito. A compra é segura.
Existem inúmeros recursos tecnológicos para a análise estatística de dados, que vão desde
calculadoras, a exemplo da TI – 83 PLUS, a aplicativos específicos, tais como o STATDISK e o
MINITAB (TRIOLA, 2005). Assim, buscando-se recursos computacionais que facilitassem o
tratamento de dados, vários aplicativos e softwares estatísticos foram pesquisados, dos quais se
destacam a planilha Excel, o STATDISK, o MINITAB, o BioEstat, o SPSS e algumas páginas na
Internet que oferecem programas em Javascript para cálculos on-line, a exemplo da página na
Internet www.stat.ucla.edu.
Após análise de pós e contras de cada aplicativo pesquisado, selecionou-se o pacote estatístico
BioEstat, disponível para download no site www.mamiraua.org.br, por possuir as seguintes
características positivas: i) serventia tanto para a Estatística descritiva como para testes estatísticos
não-paramétricos; ii) ser em português; iii) possuir manual em PDF com diversos exemplos; iv) ser
de fácil utilização; v) ser gratuito; vi) ser referenciado em vários livros, sites e entidades de
pesquisa – conforme Siegel & Castellan Junior (2006), o BioEstat é o melhor programa disponível
na atualidade para o cálculo do qui-quadrado; vii) possuir apoio do CNPQ; e viii) estar na versão 5.0
e possuir mais de 20 anos de criação.
INTERFACE BIOESTAT
Baixar software:
www.mamiraua.org.br
2Revista
FONTE:
70 |⎯ 80
Coleta
N Conglomera
Número
População
Novilhos
Novilhas
éde de
FONTE:
8Amostras
Conglo
xEstrato
novilhos
Aprovação
Involução 1 -de
=(as)
da1
das
30VARIÁVEL
Anos
$500
$6.000
São
Espírito
Ponto
Classes
Média
8
24
4
16
70 X-1,0
Grande
Média
SUL
CENTRO-
NORTE
SUDESTE acidentes
Distribuição
Podemos
Bimodal
Média
Ponto
“N”
“n”José
resentação
para
NR’s
-3,5
Brasil,
11.039
Moda
2,5
2,0
Proteção
Santo
central
Velocidade
NORDESTENenhuma
Pequena
exigida
Adaptado
QUANTIDADE cada
variação
de80
central
Kelly
9,0
participando
acidentes
deno Da
da
(Km/h
daPerD
70 ⎯ classe
designado
•OESTE
Amostras
=Maria (Km/h)
amostras
avariação
partir
do
do
(80)
(35)
(45)
Acidentes:
ponderada
Maria
90 quantidade
visualizar da a2
109
8
7
6
4
5
3
100Média
partir
19.117
49.010 eo8072, 7
(4%
4,0
aparada
simples
75Km/h
Minas
(10%
80
112.425
279.689
edoGerais
Revista
conglomerado
de
com 7,0
70
181.705,
do total)
total)
(23%
(57%
João
70,
+10
12Proteção
2.000
ACIDENTES .000
-7000
71,
o 12
7000
do que
1010,0
30
10,0 ,0
70 |⎯ da Média
•estratificada
para
110Acidentes:
porcentagem
conceito e do
80 acidentes
80 31.470
12070,
aIBGE
+10 71,
de9072, 7
o de alunos
Mário
José
corresponde
52.335
DO Kátia 37%
veículos
•total)
deveículos
PIB:do13,1%
5% 10 de de 10
6000
70 |⎯|
(6% (www.ibge.gov.
80 total) 6000
70, 71, ,072, 7
e8,0
88,0
População
%
s
s e pesos
130
do
Rio dedeacidentes
população
TRABALHO
•Kelly
participação
PIB: 120
Janeiro
total;
1.750
16,6%
56,5% +10
.000
de - no 130
por
70 ⎯|Mário
Lúcio
• PIB:808,9% José
de70,→seubr)
71, 72, 7
ntagem
conseguinte
34.610 acidentes o
5000 8
n
PIBéPaulo
de trabalho
amostra
Brasil
participação- 1970
8 no20
na
a6,0
idade
5000
Notas
é6 ,0
de
participação
→
Lúcio
Kelly
Amodal
São tambémModa
- → José =o6,0
2005. 1.500por .000 6
POPU
figuraBrasil
designado doao lado.
de
da
maior
181 705 acidentes 4000
6País4000 com
→i éd d l ll
Para saber mais, basta adquirir o livro “Estatística usando o excel”, de Juan Carlos
Lapponi. WWW.SUBMARINO.COM.BR
4ª Edição, Edição 2005, 496 págs. Editora Elsevier Campus - Acompanha CD-ROM com Planilhas, Modelos,
Simuladores etc. para Excel.
O conteúdo deste livro é útil para: Estudantes que cursam Estatística nas diversas áreas do conhecimento e
em diferentes níveis de graduação como, em ordem alfabética, Administração, Biologia, Contabilidade,
Economia, Engenharia, Finanças, Marketing, Medicina, etc. Estudantes que necessitam aprimorar ou
complementar seus conhecimentos de Estatística utilizando o Excel. Profissionais das diversas áreas que
utilizam os conceitos de Estatística e necessitam, ou gostariam, de utilizar as funções estatísticas, as
ferramentas de análise, planilhas, modelos e simuladores de estatística em Excel. Todos aqueles que poderão
utilizar as planilhas, modelos e simuladores de estatística em Excel da forma como estão no CD-Rom, ou
modificando-os, para atender às suas necessidades. Alunos de áreas correlatas que utilizarão estatística e
desejam antecipar seu aprendizado e agregar valor ao seu conhecimento visando o mercado de trabalho. Usuários de Excel que desejam
conhecer e aprender a utilizar os recursos de Estatística disponíveis.
TÓPICOS
• DADOS, VARIÁVEIS E AMOSTRAS
• DESCRIÇÃO DE AMOSTRAS COM TABELAS E GRÁFICOS
• MEDIDAS DE TENDÊNCIA CENTRAL
• MEDIDAS DE DISPERSÃO/VARIAÇÃO
• PROBABILIDADE
• CORRELAÇÃO
• VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS
• DISTRIBUIÇÕES CONTÍNUAS
• COMBINAÇÃO LINEAR DE VARIÁVEIS ALEATÓRIAS
• DISTRIBUIÇÃO AMOSTRAL
• ESTIMAÇÃO
• TESTE DE HIPÓTESES
• TESTES DE HIPÓTESES COM DUAS AMOSTRAS
• ANÁLISE DA VARIÂNCIA
• REGRESSÃO LINEAR
• AJUSTE NÃO LINEAR
Sumário