You are on page 1of 102

Engenharia de Produção -2-

Engenharia de Produção

UANDERSON REBULA DE OLIVEIRA


Mestrado em Engenharia de Produção pela UNESP
Pós-graduado em Controladoria e Finanças-Universidade Federal de Lavras-
UFLA Pós-graduado em Logística Empresarial-Universidade Estácio de Sá-UNESA
Graduado em Ciências Contábeis-Universidade Barra Mansa-UBM
Técnico em Metalurgia-Escola Técnica Pandiá Calógeras-ETPC
Técnico em Segurança, Saúde e Higiene do Trabalho-ETPC
Operador Siderúrgico e Industrial-ETPC
Professor na UNIFOA para o curso de Pós graduação em Engenharia de Segurança do Trabalho. Professor na
Associação Educacional Dom Bosco - AEDB para os cursos de Administração e Engenharia de Produção nas
disciplinas de Segurança do Trabalho e Estatística. Professor da Universidade Estácio de Sá - UNESA nas disciplinas
de Gestão Financeira de Empresas, Fundamentos da Contabilidade e Matemática Financeira, Probabilidade e
Estatística, Ergonomia, Higiene e Segurança do Trabalho, Gestão de Segurança e Análise de Processos Industriais,
Gestão da Qualidade: programa 5S (curso de férias). Ex-professor na Universidade Barra Mansa – UBM para os
cursos de Engenharia de Produção e de Petróleo na disciplina de Segurança do Trabalho. Ex-professor Conteudista
na UNESA (elaboração de Planos de Ensino e de Aula, a nível nacional). Ex - professor na Escola Técnica Bom Pastor
nas disciplinas de Estatística Aplicada, Estatística de Acidentes do Trabalho, Probabilidades, Contabilidade Básica de
Custos, Metodologia de Pesquisa Científica, Segurança na Engenharia de Construção Civil e Higiene do Trabalho.
Ex-professor do SENAI. Desenvolvedor e instrutor de diversos cursos corporativos na CSN, a níveis Estratégicos,
Táticos e Operacionais. Membro do IBS–Instituto Brasileiro de Siderurgia.

ESTATÍSTICA APLICADA - 2017

EMENTA:
Probabilidades e seus eventos. Probabilidade condicional. Eventos independentes. Teorema de Bayes.
Variáveis aleatórias: distribuição, esperança e variabilidade. Distribuições de probabilidades discretas e
contínuas. Inferência: População e amostra. Métodos de amostragem. Distribuição amostral. Intervalos
de confiança. Teste de hipóteses. Correlação e Regressão.

OBJETIVO:
Possibilitar aos estudantes o acesso a conceitos e procedimentos fundamentais da metodologia
estatística, como ferramenta de suporte à tomada de decisão e à abordagem cientifica de populações,
sistemas e processos, nas áreas de engenharia, indústria, comercio e serviços.

Uanderson Rebula de Oliveira Estatística Aplicada


“Atualmente, todos – estudantes e professores – procuram o Udemy porque é a
plataforma onde todos estão”.
Fonte: Jornal do Brasil

Faça o curso online na Udemy


Estatística I (para leigos):
aprenda fácil e rápido!
Com o Prof. MSc. Uanderson Rébula
"O livro digital Estatística I para leigos possui uma linguagem fácil e ao mesmo tempo dinâmica. O
conteúdo do livro está ordenado de forma a facilitar a aprendizagem dos alunos, mesmo aquelas
pessoas que não tenham noção nenhuma de estatística aprenderão com esse livro. Você pode
estudar sozinho para concursos pois o livro é auto explicativo ou até mesmo em grupos, no meu
caso faço isso com meus alunos. Eu super recomendo esse livro!!! NOTA 1000"
Maria Eunice Souza Madriz
Professora de estatística da rede estadual de ensino da Bahia
Avaliação do livro pelo cliente na amazon.com.br

Saiba
mais
Clique aqui

www.udemy.com
Junte-se a milhões de estudantes na maior plataforma on-line
de cursos curtos e práticos do mundo.

Com mais de 45.000 cursos virtuais disponíveis, o Udemy é uma plataforma global de
ensino on-line onde 15 milhões de alunos estão dominando novas habilidades.

O foco do Udemy são os conhecimentos práticos e úteis para o mercado de trabalho. Há


cursos gratuitos e pagos. São cursos curtos e com valores bem acessíveis.
Prof. MSc. Uanderson Rébula de Oliveira

Uma mensagem do Prof. MSc Uanderson Rébula. CLIQUE NO VÍDEO

CLIQUE AQUI E INSCREVA-SE NO CURSO JÁ

Sumário
Engenharia de Produção -3-

APRESENTAÇÃO
DA DISCIPLINA
Uma das ferramentas mais utilizadas hoje em dia
pelos cientistas, analistas financeiros, médicos, engenheiros,
jornalistas etc. é a Estatística, que descreve os dados observados e
desenvolve a metodologia para a tomada de decisão em presença
da incerteza. O verbete estatística foi introduzido no século XVIII,
tendo origem na palavra latina status (Estado), e serviu
inicialmente a objetivos ligados à organização político-social, como
o fornecimento de dados ao sistema de poder vigente. Hoje em dia,
os modelos de aplicação da Teoria Estatística se estendem por todas
as áreas do conhecimento, como testes educacionais, pesquisas
eleitorais, análise de riscos ambientais, finanças, controle de
qualidade, análises clínicas, índices de desenvolvimento,
modelagem de fenômenos atmosféricos etc. Podemos
informalmente dizer que a Teoria Estatística é uma ferramenta que
ajuda a tomar decisões com base na evidência disponível, decisões
essas afetadas por margens de erro, calculadas através de modelos
de probabilidade.

No entanto, a probabilidade se desenvolveu muito


antes de ser usada em aplicações da Teoria Estatística. Um dos
marcos consagrados na literatura probabilística foi a
correspondência entre B. Pascal (1623-1662) e P. Fermat (1601-
1665), onde o tema era a probabilidade de ganhar em um jogo
com dois jogadores, sob determinadas condições. Isso mostra que o
desenvolvimento da teoria de probabilidades começou com uma
paixão humana, que são os jogos de azar, mas evoluiu para uma
área fortemente teórica, em uma perspectiva de modelar a
incerteza, derivando probabilidades a partir de modelos
matemáticos.

A análise combinatória deve grande parte de seu


desenvolvimento à necessidade de resolver problemas
probabilísticos ligados à contagem, mas hoje há diversas áreas em
que seus resultados são fundamentais para o desenvolvimento de
teorias, como, por exemplo, a área de sistemas de informação.

Nesta apostila encontraremos as definições de


Probabilidades, esperança e variabilidade de probabilidades e
distribuições contínuas e discretas de probabilidades. Inferência:
Intervalos de confiança e muito mais.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção -4-

Falou mais o Senhor a Moisés, no deserto de Sinai, na tenda da


congregação, no primeiro dia do mês segundo, no segundo ano da sua
saída da terra do Egito, dizendo:
Tomai a soma de toda a congregação dos filhos de Israel, segundo as
suas gerações, segundo a casa dos seus pais, conforme o número dos
nomes de todo o varão, cabeça por cabeça;
Da idade de vinte anos e para cima, todos os que saem à guerra em
Israel; a estes contareis segundo os seus exércitos, tu e Aarão.
Estará convosco, de cada tribo, um homem que seja cabeça da casa dos
seus pais.
Todos os contados, pois, foram seiscentos e três mil, quinhentos e
cinquenta.

Números 1: 1-4; 46

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção -5-

Sumário
1 – INTRODUÇÃO À PROBABILIDADE (REVISÃO) ESTIMATIVAS E TAMANHOS AMOSTRAIS
Estimativa pontual e intervalar, 64
PROBABILIDADE BÁSICA Intervalos de confiança – IC, 64
Revisão de Contagem e Probabilidade, 7 Intervalos de confiança para média (amostras grandes), 64
Probabilidade com eventos complementares, 8 Determinação do tamanho da amostra, 66
ADIÇÃO DE PROBABILIDADES Intervalos de confiança para média (amostras pequenas), 66
Probabilidade com eventos mutuamente exclusivos, 9 Intervalos de confiança para Proporções P, 68
Probabilidade com eventos NÃO mutuamente exclusivos, 9 Determinação do tamanho da amostra para P, 68
PROBABILIDADE CONDICIONAL E MULTIPLICAÇÃO DE Intervalos de confiança para o Desvio padrão, 69
PROBABILIDADES
Probabilidade com eventos dependentes, 10 5 – TESTE DE HIPÓTESE
Multiplicação de probabilidade com eventos dependentes, 12
Conceitos introdutórios, 73
Multiplicação de probabilidade com eventos independentes, 13
Teste de hipótese para média (amostras grandes),74
Teorema de Bayes, 14
Teste de hipótese para média (amostras pequenas), 75
Apêndice A – Quadro resumo de probabilidades, 15
Teste de hipótese para proporção, 76
2 – VARIÁVEIS ALEATÓRIAS Teste de hipótese para o desvio padrão, 77
Teste para duas amostras – conceitos introdutórios, 80
VARIÁVEL ALEATÓRIA E DISTRIBUIÇÕES DE PROBABILIDADES, 17 Teste para diferença de duas médias (dependente),80
VALOR ESPERADO, 19 Teste para diferença de duas médias (independente), 82
VARIÂNCIA E DESVIO PADRÃO, 20

3 – DISTRIBUIÇÕES DE PROBABILIDADES 6 – CORRELAÇÃO E REGRESSÃO


CORRELAÇÃO LINEAR SIMPLES
DISTRIBUIÇÕES DISCRETAS Introdução e Diagrama de Dispersão, 84
Distribuição Binomial, 22 Correlação Linear, 84
Distribuição Hipergeométrica, 30 Coeficiente de correlação de Pearson, 85
Distribuição Geométrica, 32
Distribuição de Pascal, 32 REGRESSÃO LINEAR SIMPLES
Distribuição Multinomial, 33 Introdução, 87
Distribuição de Poisson, 34 Ajustamento da reta aos pontos grafados, 87
Poisson como aproximação para a Binomial, 38
DISTRIBUIÇÕES CONTÍNUAS REFERÊNCIAS BIBLIOGRÁFICAS, 89
Distribuição Uniforme, 39
Distribuição Normal, 40
ANEXO I – LIVROS RECOMENDADOS, 89
Normal como aproximação para a Binomial, 49
ANEXO II – Software BIOESTAT , 91
Normal como aproximação para a Poisson, 51
Distribuição Exponencial, 52 ANEXO III – ESTATÍSTICA NO EXCEL, 92

Distribuição de Weibull, 54

4 – INTRODUÇÃO À ESTATÍSTICA INFERENCIAL


CONCEITOS BÁSICOS EM ESTATÍSTICA INFERENCIAL
Estatística inferencial, 56
Parâmetros e estatísticas, 56
TÉCNICAS DE AMOSTRAGEM PROBABILÍSTICAS
Amostragem aleatória simples, 57
Amostragem estratificada, 58
Amostragem por conglomerado, 59
Amostragem sistemática, 61
DISTRIBUIÇÃO AMOSTRAL DA MÉDIA, 62

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção -6-

CAPÍTULO 1

INTRODUÇÃO À
PROBABILIDADE

É possível quantificar o
acaso?

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção -7-

Revisão de Contagem e Probabilidade


Princípio Fundamental da Contagem
Um projeto de ampliação da capacidade produtiva da empresa ABC divide-se em duas etapas seqüenciais: etapa 1
(projeto – em 2, 3 ou 4 meses) e etapa 2 (construção – em 6,7 ou 8 meses). Quais os resultados possíveis? Qual o
prazo mais provável para conclusão total do projeto?

Etapa 2-Construção Espaço amostral

Etapa 1-Projeto 6 meses (2,6) = 8 meses

2 meses 7 meses (2,7) = 9 meses

8 meses (2,8) = 10 meses

6 meses (3,6) = 9 meses


Projeto 3 meses 7 meses (3,7) = 10 meses

8 meses (3,8) = 11 meses

6 meses (4,6) = 10 meses

4 meses 7 meses (4,7) = 11 meses


É mais provável que o projeto
seja concluído dentro de 8 meses (4,8) = 12 meses
prazo de 10 meses.
3 x 3 = 9

Probabilidade
figuras

Naipes Observe o baralho abaixo (Total de 52 cartas) Valete Dama Reis Ás

(Paus)
13 cartas

(Ouros)
13 cartas

(Espadas)
13 cartas

(Copas)
13 cartas

Quando retiramos uma carta de um baralho de 52 cartas, qual a probabilidade de o resultado:

Sair um Ás de Ouros: Como temos somente 1 Ás de Ouros no baralho, então:

A = {Ás} → A= 1 Logo: P(A) = 1 = 0,019 = 1,9%


S = {52 cartas} → S = 52 52
O resultado permite afirmar que existe a chance dela sair um “Ás de Ouros” em 1,9%.

Sair um Reis: Como temos 4 Reis no baralho (um de Paus, um de Ouros, um de Espadas e um de Copas). Então:

A = {R,R,R,R} → A= 4 Logo: P(A) = 4 = 0,076 = 7,6%


S = {52 cartas} → S = 52 52
O resultado permite afirmar que existe a chance de sair um Rei em 7,6%.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção -8-

Interpretação de valores probabilísticos


Os valores probabilísticos sempre são atribuídos em uma escala de 0 a 1 (ou 0% a 100%)

Uma probabilidade próxima de 0 indica que é pouco provável que um evento ocorra, enquanto que próxima de 1 revela que um
evento é quase certo. Outras probabilidades entre 0 e 1 representam o grau de possibilidade de um evento vir a ocorrer. A figura
abaixo retrata a imagem da probabilidade como uma medida numérica da possibilidade de um evento ocorrer.

A probabilidade como uma medida numérica da possibilidade de ocorrência de um evento


Possibilidade crescente de ocorrência
Números que não
podem representar 0 0,5 1
probabilidade: 0% 50% 100%
10
/5 120% -0,456
Impossível improvável provável Certo

Chance 50-50

Por exemplo, o meteorologista diz que a probabilidade de chover amanhã é de 0,4 (ou 40%). Assim, os 0,4 (ou 40%) de chances de
chover amanhã podem significar que se você observar os dados obtidos a partir de um grande número de dias semelhantes ao tipo
de dia esperado para amanhã, vai descobrir que choveu em 40% desses dias.

Probabilidade com Eventos complementares


É a probabilidade com todos os RESULTADOS que NÃO FAZEM PARTE DO EVENTO (A).

Eventualmente, queremos determinar a probabilidade de um EVENTO NÃO OCORRER. Portanto, é o evento


formado pelos resultados que não pertencem ao evento A. Sendo P( A ) a probabilidade de que ele não ocorra e P(A)
a probabilidade de que ele ocorra, para um mesmo evento existe sempre a relação:

Probabilidade com Evento complementar

Probabilidade do P( A ) = 1 – P(A)
evento não ocorrer Probabilidade clássica

EXEMPLO

No lançamento de um dado, qual a probabilidade de o resultado:


Pela probabilidade clássica Probabilidade com evento complementar
ser o número 2 NÃO ser o número 2

A={2} →A=1 P(A) = 1 = 0,1666 P( A ) = 1 – P(A)


S={1,2,3,4,5,6} →S=6 6 = 1 – 0,1666 → 0,8333 ou 83,33%
Aplicada para valores na forma unitária (ex.: 0,1666).

O diagrama e Venn abaixo ilustra a relação entre o espaço amostral, o evento A e seu complemento A :
P(A) = 16,66% P( A ) = 83,33%
Probabilidade A S Probabilidade com
1
Clássica Evento
2 3 Complementar
5
6
4 A

AAA equação 1- P( A ) fundamenta-se na


interpretação dos valores probabilísticos:
0 1
0,1666 A = 0,8333

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção -9-

ADIÇÃO DE PROBABILIDADES
Probabilidade com Eventos mutuamente exclusivos
É a probabilidade com eventos que não ocorrem ao mesmo tempo. Ou ocorre A ou ocorre B (A ou B).
A ocorrência de um evento impossibilita a ocorrência do outro.
Dois eventos são mutuamente exclusivos quando a ocorrência de um evento exclui a ocorrência de outro. É impossível ocorrer os eventos A
e B ao mesmo tempo. Então, o termo “ou” indicará “adição de probabilidades”. Para encontrar a probabilidade de um evento ou outro
ocorrer, adicionamos as probabilidades de cada evento: P(A ou B) = P(A) + P(B).

Exemplo 1. Ao lançar um dado, a probabilidade de se tirar o 2 ou 5 é:


3 S
A B 6 “ou” indica Adição de probabilidades. P(A ou B) = P(A) + P(B)
5 A = {2} → A=1 P(A ou B) = 1 + 1 = 2 = 0,3333
2 ou 4
1 B = {5} → B=1 6 6 6
S = {1,2,3,4,5,6} → S=6

Exemplo 2. Ao retirar uma carta de um baralho de 52 cartas, a Exemplo 3. Numa urna estão 10 bolas, sendo 2 pretas
probabilidade de sair um Rei ou uma Dama é: (P), 5 amarelas (A) e 3 verdes (V). Pegando-se uma bola,
qual a probabilidade de ela ser preta ou verde?
A = {R,R,R,R } → A=4 P(AouB) = 4 + 4 = 8 = 0,1538 A = {P,P } → A=2 P(AouB) = 2 + 3 = 5 = 0,5
B = {D,D,D,D} → B=4 52 52 52 B= {V,V,V} → B=3 10 10 10
S = {52 cartas → S = 52
S = {10} → S = 10

Probabilidade com Eventos NÃO mutuamente exclusivos


É a probabilidade com Eventos que podem ocorrer ao mesmo tempo. Ou ocorre A ou B ou AMBOS (A e B).
A ocorrência de um NÃO impossibilita a ocorrência do outro.

Dois eventos NÂO são mutuamente exclusivos quando a ocorrência de um evento não exclui a ocorrência de outro. É possível ocorrer os
eventos A e B ao mesmo tempo. O termo “ou”, indicará “adição” e “e” indicará “ambos”
Exemplo 1 Ao lançar um dado, a probabilidade de obter um número ímpar ou menor que 3 é:

ímpar Menor que 3 Os eventos A e B não são mutuamente exclusivos, pois “1” ocorre em A e B (ambos).
B S
A 3 2 5
Se aplicarmos P(AouB) = P(A) + P(B) teremos: /6 + /6 = /6. Observe no diagrama que
3 4
este resultado está incorreto, pois P(AouB) = /6. Este erro foi provocado pela dupla
1 6
5 2 contagem de “1”.
4
Neste caso, ajustaremos a regra da soma para evitar a dupla contagem. A equação será:

A e B (Ambos) P(AouB) = P(A) + P(B) – P(A e B)

Então, a probabilidade de lançar um número ímpar ou menor que 3 será:


A = {1,3,5} → A=3
B = {1,2} → B=2 P(AouB) = 3 + 2 - 1 = 4 = 0,6666
A e B = {1} → AeB=1 6 6 6 6
S = {1,2,3,4,5,6} → S=6
Exemplo 2 Numa pesquisa sobre a preferência de dois jornais, consultamos 470 pessoas, sendo que 250 lêem o jornal A, 180
lêem o jornal B e 60 lêem os jornais A e B. Escolhendo uma pessoa ao acaso, qual a probabilidade de que seja:

Jornal a) Leitor dos jornais A ou B? P(A ou B) = P(A) + P(B) – P(A e B)


Jornal A B A = {250} 250 + 180 – 60 = 370 = 0,7872
B = {180} 470 470 470 470
60 A e B = {60}
S = {470}

AeB

* Regra da soma para três eventos: P(A ou B ou C) = P(A) + P(B) + P(C) - P(A e B) - P(B e C) + P(A e B e C)

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 10 -

PROBABILIDADE CONDICIONAL E MULTIPLICAÇÃO DE PROBABILIDADES


Probabilidade com Eventos dependentes

É a probabilidade do Evento B ocorrer, dado que o evento A já tenha ocorrido.

; Diz-se probabilidade condicional quando a ocorrência de um evento está condicionada à ocorrência do outro.
Portanto, os eventos são dependentes. A probabilidade de um é alterada pela existência do outro.

A probabilidade condicional do Evento B, dado que A ocorreu é denotada por:

ocorreu (lê-se “probabilidade de B, dado que A ocorreu”)


P(B|A) = P(A e B)
P(A) → espaço amostral de A, “reduzido”

Ao calcular P(B|A) tudo se passa como se P(A) fosse o novo espaço amostral “reduzido” dentro do qual, queremos
calcular a probabilidade de B. Não utilizamos o espaço amostral original.

Exemplo 1. Ao lançar um dado, observou-se um número maior que 2 (evento A ocorreu). Qual a probabilidade de esse
número ser o “5” (evento B)?
O evento A ocorreu e queremos saber o B (dentro de A):
Maior que 2 Ser o 5
A B A = {3, 4, 5, 6}
4 3
B = {5}
Novo espaço 6 5
P(B|A) será a probabilidade de ocorrer o número 5 no novo espaço
amostral
amostral reduzido de A. Então:

1 A e B = {5} → 1 P(B|A) = P(A e B) → 1 = 0,25


A = {3,4,5,6} → 4 P(A) 4
2
Espaço amostral original S = {1,2,3,4,5,6} Observe que não usamos o espaço amostral original S.

EXEMPLO 2 Ao lançar um dado, observou-se um número maior que 1 (evento A ocorreu). Qual é a probabilidade de esse
número ser ímpar (Evento B)?

ímpar O evento A ocorreu e queremos saber o B (dentro de A):


Maior que 1
A B A = {2, 3, 4, 5, 6}
2
4 B = {3, 5}
3
Novo espaço 6 5 P(B|A) será a probabilidade de ocorrer número ímpar no novo espaço
amostral amostral reduzido de A. Então:
A e B = {3,5} → 2 P(B|A) = P(A e B) → 2 = 0,40
1 A = {2,3,4,5,6} → 5 P(A) 5
Observe que não usamos o espaço amostral original S
Espaço amostral original S = {1,2,3,4,5,6}

EXEMPLO 3 Duas cartas são selecionadas em sequência em um baralho. Qual a probabilidade de que a 2ª
carta seja uma dama, dado que a 1ª seja um rei. (assuma que o rei está sem reposição).

Solução. Em razão de a primeira carta ser um rei e não ser a resposta, P (B|A) = 4 = 0,078
o baralho restante tem 51 cartas, 4 das quais são dama. Então: 51

EXEMPLO 4 Cinco cartas são selecionadas em sequência em um baralho. Qual a probabilidade de que a 5ª carta seja uma
dama. Dado que a 1ª = rei; 2ª = dama; 3ª = 8 ; 4ª = Ás. (assuma que não há reposição).

Solução. Em razão de a 1ª = rei; 2ª = dama; 3ª = 8 ; 4ª = Ás, o baralho P (E|A,B,C,D) = 3 = 0,062


restante tem 48 (52-4) cartas, 3 das quais são dama. Então: 48
Note que o espaço amostral original foi reduzido

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 11 -

EXEMPLO 5 Numa pesquisa sobre a preferência de dois jornais, consultamos 470 pessoas e o resultado foi o seguinte: 250
lêem o jornal A, 180 lêem o jornal B, 60 lêem os jornais A e B. Escolhendo uma pessoa ao acaso, qual a probabilidade de:

a) Um leitor do jornal A, também ser leitor do B? b) Um leitor do jornal B, também ser leitor do A?

Jornal Jornal
Jornal A B Jornal A B
Novo espaço
190 60 190 60
amostral
Novo espaço
amostral 120 120

O evento A ocorreu e queremos saber o B. Então, denotamos O evento B ocorreu e queremos saber o A. Então, denotamos
P(B|A). Dentre os leitores do Jornal A, devemos destacar os que P(A|B). Dentre os leitores do Jornal B, devemos destacar os que
lêem B; logo, o espaço amostral desse evento é A (190+60=250). lêem A; logo, o espaço amostral desse evento é B (120+60=180).
Então, a probabilidade é: Então, a probabilidade é:

A e B = {60} → 60 P(A|B)=P(A e B) → 60 = 0,33


A e B = {60} → 60 P(B|A)=P(A e B) → 60 = 0,24
B= {120+60} → 180 P(B) 180
A= {190+60} → 250 P(A) 250

EXEMPLO 6. O quadro abaixo mostra os resultados de um estudo no qual os pesquisadores examinaram o QI de uma criança
e a presença de um gene específico nela.
Gene Gene não A probabilidade de que a criança tenha um QI alto (Evento B), dado que
presente presente a criança tenha o gene (Evento A) é?
QI alto 33 19 52 Solução. Há 72 crianças que têm o gene. Então, o espaço amostral consiste
QI normal 39 11 50 dessas 72 crianças. Dessas, 33 tem QI alto. Então:

72 30 102 P (B|A) = 33 = 0,458


72

EXEMPLO 7 Em um lote de 12 peças, 8 são de “qualidade” e 4 são “defeituosas”. Ao selecionar duas peças em sequência, sem
reposição, qual a probabilidade de:

a 2ª peça ser “defeituosa”, dado que a 1ª é “defeituosa”.

Solução. Em razão de a 1ª peça ser defeituosa, o lote restante tem 11 P (B|A) = 3 = 0,2727
peças, 3 das quais são defeituosas. Então: 11

a 2ª peça ser “defeituosa”, dado que a 1ª é de “qualidade”.


Solução. Em razão de a 1ª peça ser de qualidade, o lote restante tem 11 P (B|A) = 4 = 0,3636
peças, 4 das quais são defeituosas. Então: 11

a 2ª peça ser de “qualidade”, dado que a 1ª é “defeituosa”.


Solução. Em razão de a 1ª peça ser defeituosa, o lote restante tem 11 P (B|A) = 8 = 0,7272
peças, 8 das quais são de qualidade 11

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 12 -

Multiplicação de probabilidade com eventos dependentes ...ache P(A e B) , dado P(B|A) e P(A)

Uma consequência matemática importante da definição de probabilidade condicional é a seguinte:


P(B|A) = P(A e B) se quero achar: P(B|A) = ? então → P(A e B) = P(A) x P(B|A)
P(A) P(A e B) P(A)
Isto é, a probabilidade dos eventos (A e B) é o produto da probabilidade de um deles pela probabilidade do outro, dado o primeiro.

EXEMPLO 1 Duas cartas são selecionadas em sequência em um baralho de 52 cartas. Qual a probabilidade de
selecionar um Rei e uma Dama? (não há reposição).
A probabilidade de a 1ª carta ser um Rei é /52. A
4 P(A e B) = ? P(A e B) = P(A) x P(B|A)
4
4
2ª carta ser uma Dama é /51, pois o baralho P(A) = /52 4 x 4 → 16 = 0,006
4
restante tem 51 cartas, 4 das quais são dama. P(B|A) = /51 52 51 2652

EXEMPLO 2 Em um lote de 12 peças, 8 são de “qualidade” e 4 são “defeituosas”. Sendo retiradas duas peças em sequência,
qual a probabilidade de que: (não há reposição)
a) Ambas sejam “defeituosas” b) Ambas sejam de “qualidade”
P(A e B) = ? P(A e B) = ?
4 4 x 3 = 0,090 8 8 x 7 = 0,4242
P(A) = /12 P(A) = /12
3 12 11 7 12 11
P(B|A) = /11 P(B|A) = /11
4 3 8 7
A probabilidade de a 1ª peça ser defeituosa é /12 e a 2ª é /11, pois o A probabilidade de a 1ª peça ser de qualidade é /12 e a 2ª é /11,
lote restante tem 11 peças, 3 das quais são defeituosas. pois o lote restante tem 11 peças, 7 das quais são de qualidade.

EXEMPLO 3 Uma urna contém 7 bolas brancas (B) e 3 pretas (P). Extraindo-se três bolas em sequência, qual a probabilidade
de que: (não há reposição).
a) As duas primeiras sejam brancas e a terceira seja preta (ou seja, BBP)
7 6 7
A probabilidade de a 1ª bola ser branca é /10 e a 2ª é /9. A P(A) = /10
3 6 7 x 6 x 3 = 0,175
probabilidade de a 3ª bola ser preta é /8, pois a urna restante P(B|A) = /9
3 10 9 8
tem 8 peças, 3 das quais são pretas. P(C|B) = /8

b) Duas sejam brancas e uma seja preta (ou seja: BBP, BPB ou PBB) = 3[BBP]
O evento sair “duas brancas e uma preta” pode ocorrer de três maneiras que 7
P(A) = /10
diferem apenas pela ordem de aparecimento das bolas: (BBP, BPB, PBB). Logo, a ⎛ 7 6 3⎞
probabilidade será a soma dessas maneiras. Então, basta calcular a probabilidade de
6
P(B|A) = /9 3 • ⎜ x x ⎟ = 0,525
3
P(C|B) = /8 ⎝ 10 9 8 ⎠
uma dessas maneiras (por exemplo, a primeira) e multiplicar por 3. Então: 3(BBP).

c) Pelo menos duas sejam brancas (ou seja: 3[BBP] + [BBB])


2 brancas 3 brancas
3[BBP] [BBB]
“Pelo menos duas brancas“ é a mesma coisa que “no 7
P(A) = /10
7
P(A) = /10 ⎛ 7 6 3⎞ ⎛ 7 6 5⎞
mínimo duas brancas”, ou seja, duas ou três brancas. 6 6 3 • ⎜ x x ⎟ + ⎜ x x ⎟ = 0,8166
Então, calculamos duas brancas + três brancas.
P(B|A) = /9
3
P(B|A) = /9
5
⎝ 10 9 8 ⎠ ⎝ 10 9 8 ⎠
P(C|B) = /8 P(C|B) = /8

d) No máximo uma seja branca (ou seja: [PPP] + 3[PPB])


0 branca 1 branca
[PPP] 3[PPB]
No máximo uma branca é a mesma coisa que “ou P(A) =
3
/10 P(A) =
3
/10 ⎛ 3 2 1⎞ ⎛ 3 2 7⎞
nenhuma branca ou uma branca”. Então, calculamos 2 2 ⎜ x x ⎟ + 3 • ⎜ x x ⎟ = 0,1833
nenhuma branca (todas pretas) + uma branca.
P(B|A) = /9
1
P(B|A) = /9
7
⎝ 10 9 8 ⎠ ⎝ 10 9 8 ⎠
P(C|B) = /8 P(C|B) = /8

e) Pelo menos uma seja preta. (ou seja: 3[PBB] + 3[PPB] + [PPP])
1 preta 2 pretas 3 pretas
3[PBB] 3[PPB] [PPP]
3 3 3
P(A) = /10 P(A) = /10 P(A) = /10 ⎛ 3 7 6⎞ ⎛ 3 2 7⎞ ⎛ 3 2 1⎞
7
P(B|A) = /9
2
P(B|A) = /9
2
P(B|A) = /9
3 • ⎜ x x ⎟ + 3 • ⎜ x x ⎟ + ⎜ x x ⎟ = 0,7083
6 7 1 ⎝ 10 9 8 ⎠ ⎝ 10 9 8 ⎠ ⎝ 10 9 8 ⎠
P(C|B) = /8 P(C|B) = /8 P(C|B) = /8

MÉTODO ALTERNATIVO: [BBB]


7
É mais prático usar o P(A) = /10 ⎛ 7 6 5⎞
evento complementar: 6
P(B|A) = /9
1 − ⎜ x x ⎟ = 0,7083
5 ⎝ 10 9 8 ⎠
1 – BBB (nenhuma preta) P(C|B) = /8
f) Todas sejam da mesma cor:
[PPP]+[BBB] = 0,30

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 13 -

Multiplicação de Probabilidade com Eventos independentes


É quando a ocorrência do Evento A não afeta a probabilidade da ocorrência do B. Não existe dependência.
A e B podem ocorrer simultaneamente (ao mesmo tempo). São independentes.
; A regra da multiplicação é usada para achar P(A e B) para eventos independentes. Aqui associaremos a palavra “e”
com “multiplicação”. O termo chave usado é “simultâneo”. A equação é : P(A e B) = P(A) x P(B). Existe reposição
1 ( 1, 1 )
2 ( 1, 2 ) Exemplo 1. Ao lançar dois dados simultaneamente, qual a
1 3 ( 1, 3 ) probabilidade de:
4 ( 1, 4 )
5 ( 1, 5 ) Obter o número 2 e ímpar ?
6 ( 1, 6 )

1 ( 2, 1 )
Pelo Diagrama de árvore: Então, a probabilidade é:
2 ( 2, 2 )
3 ( 2, 3 ) (2,1), (2,3), (2,5) 3 = 8,33%
2
4 ( 2, 4 ) 36
5 ( 2, 5 ) Se aplicarmos a regra da multiplicação, temos:
6 ( 2, 6 )

1 ( 3, 1 ) A={2} → A=1 P(A e B) = P(A) x P(B)


2 ( 3, 2 ) B={1,3,5} → B=3 1 x 3 = 3 = 8,33%
3 3 ( 3, 3 )
Lançar dois dados 4 ( 3, 4 ) S={1,2,3,4,5,6} → S = 6 6 6 36
5 ( 3, 5 )
6 ( 3, 6 ) Obter um número par e ímpar ?
1 ( 4, 1 ) Pelo Diagrama de árvore Então, a probabilidade é:
2 ( 4, 2 )
4 3 ( 4, 3 ) 9 = 25%
4 ( 4, 4 )
(2,1), (2,3), (2,5)
5 ( 4, 5 ) (4,1), (4,3), (4,5) 36
6 ( 4, 6 )
(6,1), (6,3), (6,5)
1 ( 5, 1 )
2 ( 5, 2 ) Aplicando a regra da multiplicação, temos:
5 3 ( 5, 3 )
4 ( 5, 4 ) A={2,4,6} → A=3 P(A e B) = P(A) x P(B)
5 ( 5, 5 ) B={1,3,5} → B=3 3 x 3 = 9 = 25%
6 ( 5, 6 )
S={1,2,3,4,5,6} → S=6 6 6 36
1 ( 6, 1 )
2 ( 6, 2 )
3 ( 6, 3 ) Esta regra pode ser estendida para qualquer número de eventos
6
4 ( 6, 4 ) independentes: P (A e B e C) = P(A) x P(B) x P(C)...
5 ( 6, 5 )
6 ( 6, 6 ) O resultado do evento B independe do resultado de A.
Evento A e Evento B “São independentes”
S = {36}

Exemplo 2. Cirurgias de microfraturas no joelho têm 75% de chance de Sucesso em pacientes com joelhos
degenerativos (25% é de fracasso). A cirurgia é realizada em 3 pacientes. Calcule a probabilidade de que:
Nota: A probabilidade de que cada cirurgia seja um sucesso é de 0,75. A chance de um sucesso para uma cirurgia é
independente das chances para as outras cirurgias. Portanto, os eventos são independentes.
a) As três cirurgias sejam um sucesso. ou seja:[SSS] b) As três cirurgias sejam um fracasso. ou seja:[FFF]

[SSS] P (A e B e C) = P(A) x P(B) x P(C) [FFF] P (A e B e C) = P(A) x P(B) x P(C)


P(A) = 0,75 P(A) = 0,25
P(B) = 0,75 0,75 x 0,75 x 0,75 = 0,4218 P(B) = 0,25 0,25 x 0,25 x 0,25 = 0,0156
P(C) = 0,75 P(C) = 0,25

c) Duas cirurgias sejam um sucesso (ou seja: SSF, SFS, FSS) = 3[SSF]
O evento “Duas cirurgias” pode ocorrer de três maneiras que diferem apenas pela
P(A) = 0,75
ordem dos resultados das cirurgias: (SSF, SFS, FSS). Logo, a probabilidade será a
soma dessas maneiras. Então, basta calcular a probabilidade de uma dessas
P(B) = 0,75 3 * (0,75*0,75*0,25) = 0,4218
P(C) = 0,25
maneiras (por exemplo, a primeira) e multiplicar por 3. Então: 3(SSF).

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 14 -

Teorema de Bayes (THOMAZ BAYES – 1701-1761 – MATEMÁTICO)


É uma extensão da probabilidade condicional, que procura responder a pergunta: sabendo-se que o
evento A ocorreu, qual a probabilidade de que esse evento tenha provindo de X?
; Usamos o Teorema de Bayes para rever probabilidades com base em informação adicional obtida posteriormente. Uma idéia-chave
para se entender a essência do teorema é reconhecer que estamos trabalhando com eventos sequenciais, pelos quais novas
informações são obtidas para se rever a probabilidade do evento inicial. Nesse contexto, os termos probabilidade a priori e
probabilidade a posteriori são comumente usados.
; Uma probabilidade a priori é um valor de probabilidade inicial originalmente obtido antes que seja obtida qualquer informação
adicional. Uma probabilidade a posteriori é um valor de probabilidade que foi revisto usando-se informação adicional obtida
posteriormente. O teorema de Bayes pode ser obtido por meio de tabelas, diagrama de árvore e pela equação de Bayes.

Exemplo 1. Usando um Diagrama de Árvore e a Equação de Bayes


As máquinas A e B são responsáveis por 65% e 35%, respectivamente, da produção de uma empresa. Os índices de
peças defeituosas na produção destas respectivas máquinas valem 2% e 5%. Se uma peça defeituosa foi selecionada
da produção desta empresa, qual é a probabilidade de que tenha sido produzida pela máquina A?
Resolução: Portanto, ao selecionar uma peça, atribuímos as probabilidades iniciais: P(A) = 0,65 e P(B) = 0,35, incluindo as peças
perfeitas e defeituosas. Denotamos P = peça perfeita e D = peça defeituosa

A probabilidade da peça sair defeituosa,


Pelo Diagrama de Árvore Peça seja da máquina A ou B, é 0,0305
0,98 perfeita P(A) * (P|A) = 0,6370 (0,0130+0,0175), que é a probabilidade
total da peça sair defeituosa.
máquina
A Se queremos saber a probabilidade de a
0,65 0,02 peça defeituosa ter sido produzida pela
Peça máquina A, será:
Peça defeituosa P(A) *(D|A) = 0,0130
0,0130 = 0,4262
fabricada
0,0305
Peça
P(B) * (P|B) = 0,3325 Enquanto que ter sido produzida pela
0,35 0,95 perfeita
máquina + máquina B será:
B
0,05 0,0175 = 0,5738
Peça 0,0305
defeituosa P(B) * (D|B) = 0,0175

Pela equação de Bayes


A equação de Bayes é dada por Usando a equação de Bayes e as probabilidades do exemplo 1,
referente ao cálculo da peça defeituosa ter sido produzida pela
P(A1) . P(B|A1) máquina A, temos:
P(x) =
P(A1) . P(B|A1) + P(A2) . P(B|A2)
P(A1) = 0,65 (peça ser produzida pela máquina A)
Sendo o numerador a probabilidade condicionada P(B|A1) = 0,02 (peça ser defeituosa, dado ser produzida pela máquina A)
procurada, o denominador a probabilidade total P(A2) = 0,35 (peça ser produzida pela máquina B)
condicionada, podendo estender a P(An) . P(B|An). P(B|A2) = 0,05 (peça ser defeituosa, dado ser produzida pela máquina B)

(0,65) . (0,02)
P(x) = = 0,4262
(0,65) . (0,02) + (0,35) . (0,05)

Exemplo 2. As máquinas A e B são responsáveis por 400 e 150, respectivamente, da produção de peças de uma
empresa. A quantidade de peças defeituosas produzidas pelas respectivas máquinas são 10 e 20. Se uma peça
defeituosa foi selecionada da produção, qual a probabilidade de que tenha sido produzida pela máquina B?

O total de peças produzidas é igual a 550 (400+150), logo:


P(A1) = 0,727 (400/550) (peça ser produzida pela máquina A)
A
P(B|A1) = 0,025 (10/400) (peça ser defeituosa, dado ser produzida pela máquina A)
P(A2) = 0,272 (150/550) (peça ser produzida pela máquina B)
B
P(B|A2) = 0,133 (20/150) (peça ser defeituosa, dado ser produzida pela máquina B)
Logo, a probabilidade da peça ser defeituosa e ter sido produzida pela máquina B será:

P(A2) . P(B|A2) (0,272) . (0,133)


P(x) = P(x) = = 0,6661
P(A2) . P(B|A2) + P(A1) . P(B|A1) (0,272) . (0,133) + (0,727) . (0,025)

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 15 -

APÊNDICE A - QUADRO RESUMO DE PROBABILIDADES -

Probabilidade Clássica
P(A) = _n(A)_ → número de elementos no evento A___
S → espaço amostral

Probabilidade com Eventos complementares


É a probabilidade com todos os RESULTADOS que NÃO FAZEM PARTE DO EVENTO A.

P( A ) = 1 – P(A) P( A ) – Probabilidade do evento não ocorrer


P(A) – Probabilidade do evento ocorrer

ADIÇÃO DE PROBABILIDADES
Probabilidade com Eventos mutuamente exclusivos
É a probabilidade com Eventos que não podem ocorrer ao mesmo tempo. A ocorrência de um impossibilita
a ocorrência do outro. Ou ocorre A ou ocorre B. (A ou B)
Ao lançar um dado, a probabilidade de se tirar o 3 ou 5 é:
A = {2} → A=1 P(A ou B)= 1 + 1 = 2 = 33,33%
B = {5} → B=1 6 6 6
S = {1,2,3,4,5,6} → S=6

Probabilidade com Eventos NÃO mutuamente exclusivos


É a probabilidade com Eventos que podem ocorrer ao mesmo tempo. A ocorrência de um NÃO impossibilita a
ocorrência do outro. Ou ocorre A ou B ou ocorre AMBOS (A e B).

PROBABILIDADE CONDICIONAL E MULTIPLICAÇÃO DE PROBABILIDADES


Probabilidade com Eventos dependentes
É a probabilidade do Evento B ocorrer, dado que o A já tenha ocorrido.

P(B|A) = P(A e B) Multiplicação: P(A e B) = P(A) x P(B|A)


P(A)
Probabilidade com Eventos independentes
É quando a ocorrência do Evento A não afeta a probabilidade da ocorrência do B.
Ocorre A e B. Os dois ocorrem simultaneamente. São independentes. P(A e B) = P(A) x P(B)
1 ( 1, 1 )
2 ( 1, 2 ) Ao lançar dois dados simultaneamente, qual a probabilidade de:
1 3 ( 1, 3 )
4 ( 1, 4 )
5
6
( 1, 5 )
( 1, 6 )
Obter o número 2 e ímpar?
Pelo Diagrama de árvore, temos:
1 ( 2, 1 )
2 ( 2, 2 ) (2,1), (2,3), (2,5)
2 3 ( 2, 3 )
4 ( 2, 4 ) Então, a probabilidade é:
5 ( 2, 5 )
6 ( 2, 6 )
3 = 16,66%
1 ( 3, 1 )
36
2 ( 3, 2 ) ao aplicarmos a regra da multiplicação o resultado é o mesmo!
3 3 ( 3, 3 )
Lançar dois dados 4 ( 3, 4 ) A={2} → A=1 P(AeB) = P(A) x P(B)
5 ( 3, 5 )
6 ( 3, 6 ) B={1,3,5} → B=3 1 x 3 = 3 = 16,66%
1 ( 4, 1 )
S={1,2,3,4,5,6} → S = 6 6 6 36
2 ( 4, 2 )
4 3 ( 4, 3 )
4 ( 4, 4 )
5 ( 4, 5 )
6 ( 4, 6 )

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 16 -

CAPÍTULO 2

VARIÁVEIS ALEATÓRIAS

1 ( 1, 1 )
2 ( 1, 2 )
1 3
4
( 1, 3 )
( 1, 4 ) Construindo modelos teóricos...
5 ( 1, 5 )
6 ( 1, 6 )

1
2
( 2, 1 )
( 2, 2 )
É possível criar um modelo teórico
2 3
4
( 2, 3 )
( 2, 4 )
que descreva como se espera que o
5
6
( 2, 5 )
( 2, 6 ) experimento se comporte?
1 ( 3, 1 )
2 ( 3, 2 )
3 3 ( 3, 3 )
Lançar dois dados 4 ( 3, 4 )
5 ( 3, 5 )
6 ( 3, 6 )

1 ( 4, 1 )
2 ( 4, 2 )
4 3 ( 4, 3 )
4 ( 4, 4 )
5 ( 4, 5 )
6 ( 4, 6 )

6
1 ( 5, 1 ) /36 6
2 ( 5, 2 )
5 5 5
5 3 ( 5, 3 ) /36
4 ( 5, 4 ) 4 4
4
5 ( 5, 5 ) /36
6 ( 5, 6 ) 3 3
3
/36
2 2
1 ( 6, 1 ) 2
/36
2 ( 6, 2 ) 1 1
6 3 ( 6, 3 ) 1
/36
4 ( 6, 4 )
5 ( 6, 5 )
2 3 4 5 6 7 8 9 10 11 12
6 ( 6, 6 )
Soma dos dados

Uanderson Rebula de Oliveira Estatística Aplicada


“Atualmente, todos – estudantes e professores – procuram o Udemy porque é a
plataforma onde todos estão”.
Fonte: Jornal do Brasil

Faça o curso online na Udemy


Estatística I (para leigos):
aprenda fácil e rápido!
Com o Prof. MSc. Uanderson Rébula
"O livro digital Estatística I para leigos possui uma linguagem fácil e ao mesmo tempo dinâmica. O
conteúdo do livro está ordenado de forma a facilitar a aprendizagem dos alunos, mesmo aquelas
pessoas que não tenham noção nenhuma de estatística aprenderão com esse livro. Você pode
estudar sozinho para concursos pois o livro é auto explicativo ou até mesmo em grupos, no meu
caso faço isso com meus alunos. Eu super recomendo esse livro!!! NOTA 1000"
Maria Eunice Souza Madriz
Professora de estatística da rede estadual de ensino da Bahia
Avaliação do livro pelo cliente na amazon.com.br

Saiba
mais
Clique aqui

www.udemy.com
Junte-se a milhões de estudantes na maior plataforma on-line
de cursos curtos e práticos do mundo.

Com mais de 45.000 cursos virtuais disponíveis, o Udemy é uma plataforma global de
ensino on-line onde 15 milhões de alunos estão dominando novas habilidades.

O foco do Udemy são os conhecimentos práticos e úteis para o mercado de trabalho. Há


cursos gratuitos e pagos. São cursos curtos e com valores bem acessíveis.
Engenharia de Produção - 17 -

VARIÁVEL ALEATÓRIA E DISTRIBUIÇÕES DE PROBABILIDADE

Uma variável aleatória “X” representa um valor numérico associado a cada resultado de um
experimento de probabilidade.

Exemplo 1. A tabela e o gráfico abaixo representam um modelo de probabilidade para a soma de dois dados
lançados simultaneamente:
Variáveis aleatórias(X)
Valor numérico de cada Distribuição de
experimento
frequências probabilidades
É a lista de cada valor de
1 ( 1, 1 )
2 ( 1, 2 ) uma variável aleatória “X”
1 3 ( 1, 3 ) Soma dos Probabilidade
4 ( 1, 4 ) f
dados “X” “P(x)”
5 ( 1, 5 ) 1
6 ( 1, 6 ) 2 1 /36
2
3 2 /36
1 ( 2, 1 ) 3
2 ( 2, 2 )
4 3 /36
4
2 3 ( 2, 3 ) 5 4 /36
4 ( 2, 4 ) 5
6 5 /36
5 ( 2, 5 ) 6
6 ( 2, 6 ) 7 6 /36
5
8 5 /36
1 ( 3, 1 ) 4
2 ( 3, 2 ) 9 4 /36
3
3 3 ( 3, 3 ) 10 3 /36
Lançar dois dados 4 ( 3, 4 ) 2
11 2 /36
5 ( 3, 5 )
1
6 ( 3, 6 ) 12 1 /36
- ∑=36 ∑=1
1 ( 4, 1 )
2 ( 4, 2 )
4 3 ( 4, 3 )
4 ( 4, 4 ) 6
/36 6
5 ( 4, 5 )
6 ( 4, 6 ) 5
/36 5 5 Representação
1 ( 5, 1 )
4 4
gráfica da
2 ( 5, 2 ) /36 4
5 3 ( 5, 3 ) distribuição
4 ( 5, 4 ) 3 3 3
/36
5 ( 5, 5 )
6 ( 5, 6 ) 2 2 2
/36
1 ( 6, 1 ) 1 1 1
2 ( 6, 2 ) /36
6 3 ( 6, 3 )
4 ( 6, 4 )
5 ( 6, 5 ) 2 3 4 5 6 7 8 9 10 11 12
6 ( 6, 6 )
Soma dos dados

Notas e comentários

A palavra “aleatório” indica que “X” é determinado pelo acaso. A variável aleatória é uma regra que associa um valor
numérico a cada resultado experimental possível.

A distribuição de probabilidades de uma variável aleatória descreve como as probabilidades estão distribuídas sobre os
valores da variável aleatória. Para uma variável “X”, a distribuição de probabilidade é definida por uma função probabilidade,
denotada por f(x). A função probabilidade fornece a probabilidade correspondente a cada um dos valores da variável aleatória.

A principal vantagem de definir uma variável aleatória “X” e sua distribuição de probabilidade é que, uma vez que a
distribuição seja conhecida, torna-se relativamente fácil determinar a probabilidade de uma série de eventos que podem ser
do interesse de um tomador de decisões.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 18 -

Exemplo 2. Um projeto de ampliação da capacidade produtiva da empresa ABC divide-se em duas etapas
seqüenciais: etapa 1 (projeto – em 2, 3 ou 4 meses) e etapa 2 (construção – em 6, 7 ou 8 meses).

Definindo a variável aleatória “X” como o prazo para


conclusão do projeto e, usando a Regra da Adição com as
probabilidades no diagrama de árvore, você poderá
determinar a probabilidade de ocorrência dos meses para
conclusão do projeto. Então, poderá usar essa informação
para estabelecer as distribuições de probabilidades:

Conclusão do projeto Probabilidade “P(x)”


f
(em meses) “X”
8 1 1
/9 = 0,11
9 2 2
/9 = 0,22
10 3 3
/9 = 0,33
11 2 2
/9 = 0,22
12 1 1
/9 = 0,11
- ∑=9 ∑=1

Prazo para conclusão do projeto


1

Probabilidade
0.8
Assim, podemos responder rapidamente alguns questionamentos:
Qual a probabilidade de o projeto ser concluído em 8 meses? R.: 11% 0.6
Qual a probabilidade de o projeto ser concluído em 9 meses? R.: 22% 0.33
Qual a probabilidade de o projeto ser concluído em 10 meses? R.: 33% 0.4
0.22 0.22
Qual a probabilidade de o projeto ser concluído em 10 ou 11 meses? R.: 55%
0.2 0.11 0.11
Qual a probabilidade de o projeto ser concluído entre 9 e 11 meses? R.: 77%

0
8 9 10 11 12
meses
Exemplo 3. Uma pesquisa entrevistou 200 casas de um bairro sobre quantas televisões possuem. Os dados mostram
que 3 casas não possuem televisão, 38 casas possuem 1 televisão, 95 casas possuem 2 televisões, 52 casas possuem 3
televisões e 12 casas possuem 4 televisões.

Definimos a variável aleatória de interesse como “X” o número de televisões. A partir dos dados, sabemos que X é uma variável
aleatória que pode assumir 0, 1, 2, 3, ou 4. Temos, então, a distribuição de probabilidades e o gráfico abaixo:

Casas com televisões em um bairro


Nº de f Probabilidade 1
televisões “X” (casas) “P(x)”
Probabilidade

3
0 3 /200 = 0,015 0.8
38
1 38 /200 = 0,190
95 0.6 0.475
2 95 /200 = 0,475
52
3 52 /200 = 0,260
12 0.4
4 12 /200 = 0,060 0.26
0.19
- ∑=200 ∑=1 0.2
0.015 0.06
0
0 1 2 3 4
Número de televisões
Assim, podemos responder rapidamente alguns questionamentos:
Ao selecionar aleatoriamente uma casa, qual a probabilidade de ela não possuir televisão? R.: 1,5%
Ao selecionar aleatoriamente uma casa, qual a probabilidade de ela possuir 1 televisão? R.: 19%
Ao selecionar aleatoriamente uma casa, qual a probabilidade de ela possuir 2 televisões? R.: 47,5%
Ao selecionar aleatoriamente uma casa, qual a probabilidade de ela possuir 2 ou 3 televisões? R.: 73,5%
Ao selecionar aleatoriamente uma casa, qual a probabilidade de ela possuir televisão? R.: 98,5%

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 19 -

VALOR ESPERADO E(X)


O Valor esperado de variáveis aleatórias “X” é um valor que você esperaria acontecer em vários testes.

Podemos considerar o Valor esperado no sentido de que é o valor médio que esperaríamos se o experimento fosse feito diversas vezes.
Então, podemos dizer que o conceito de Valor esperado aplicado em uma variável aleatória é equivalente à Média ponderada dos
possíveis valores que “X” pode receber, onde os pesos são as probabilidades associadas. É semelhante ao cálculo da Média de uma
Distribuição de frequência. Obtemos, então, a seguinte fórmula:

EQUAÇÃO DO VALOR ESPERADO


Valor esperado de “X”

E (X) = ∑ X . P(x)
Probabilidades associadas
Variáveis Aleatórias

Cada valor de X é multiplicado por sua probabilidade e os produtos são adicionados. O Valor esperado, representado por
E(X), também é chamado de Média de uma Variável Aleatória, Esperança matemática, Esperança ou Expectância.

Exemplo 1. Um projeto de ampliação da capacidade produtiva da empresa ABC divide-se em duas etapas
seqüenciais: etapa 1 (projeto – em 2, 3 ou 4 meses) e etapa 2 (construção – em 6, 7 ou 8 meses). Qual o prazo
esperado para conclusão do projeto?

Conclusão do projeto P(x) X . P(x)


(em meses) X
8 x 0,11 = 0,88
9 0,22 1,98
10 0,33 3,30
11 0,22 2,42
12 0,11 1,32
- ∑=1 ∑ X.P(x) = 10

Valor esperado E(X)


Interpretação: Espera-se que o projeto seja concluído em 10 meses

NOTA: Posso fazer também da seguinte forma:


E(X) = 8(0,11) + 9(0,22) + 10(0,33) + 11(0,22) + 12(0,11) = 10 meses

Exemplo 2. A tabela abaixo representa um modelo de probabilidade para a soma de dois dados lançados
simultaneamente. Qual o valor esperado para a soma dos dados?
3
1
2
( 1, 1 )
( 1, 2 )
Soma dos Probabilidade X . P(x)
1 3
4
( 1, 3 )
( 1, 4 )
dados “X” “P(x)”
5 ( 1, 5 ) 2 x 0,0278 = 0,0556
6 ( 1, 6 )
3 0,0556 0,1667
1 ( 2, 1 )
2 ( 2, 2 ) 4 0,0833 0,3333
3 ( 2, 3 )
2
4 ( 2, 4 ) 5 0,1111 0,5556
5 ( 2, 5 )
6 ( 2, 6 ) 6 0,1389 0,8333
1 ( 3, 1 ) 7 0,1667 1,1667
2 ( 3, 2 )
3 3 ( 3, 3 ) 8 0,1389 1,1111
Lançar dois dados 4
5
( 3, 4 )
( 3, 5 )
9 0,1111 1,0000
6 ( 3, 6 )
10 0,0833 0,8333
1
2
( 4, 1 )
( 4, 2 )
11 0,0556 0,6111
4 3
4
( 4, 3 )
( 4, 4 )
12 0,0278 0,3333
5
6
( 4, 5 )
( 4, 6 )
- ∑=1 ∑ X.P(x) = 7
1 ( 5, 1 )

5
2
3
( 5, 2 )
( 5, 3 )
Valor esperado E(X)
4 ( 5, 4 )
5
6
( 5, 5 )
( 5, 6 )
Interpretação: Espera-se que a soma dos dados seja 7.
1
2
( 6, 1 )
( 6, 2 )
NOTA: Posso fazer também da seguinte forma:
6 3
4
( 6, 3 )
( 6, 4 )
E(X) = 2(0,0278) + 3(0,0556) + 4(0,0833) + 5(0,1111) 6(0,1389) + 7(0,1667) +
5
6
( 6, 5 )
( 6, 6 )
8(0,1389) + 9(0,1111) + 10(0,0833) + 11(0,0556) + 12(0,0278) = 7

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 20 -

VARIÂNCIA E DESVIO PADRÃO


Podemos aplicar os conceitos de Variância e Desvio Padrão para o Valor esperado E (X).

; Embora o Valor esperado de uma distribuição de probabilidades da variável aleatória descreva um resultado
comum, ela não dá informações sobre a maneira que os resultados variam. Para estudar a variação dos resultados,
você pode usar a variância e o desvio padrão de uma distribuição de probabilidades da variável aleatória. Então:
FÓRMULA DA VARIÂNCIA E DESVIO PADRÃO DO VALOR ESPERADO

VARIÂNCIA DESVIO PADRÃO


S 2 =
∑ (x – EX) . P(x)
2
S= s2
Probabilidades associadas
Valor esperado Variância
Variáveis Aleatórias

Exemplo Um projeto de ampliação da capacidade produtiva da empresa ABC divide-se em duas etapas seqüenciais:
etapa 1 (projeto – em 2, 3 ou 4 meses) e etapa 2 (construção – em 6, 7 ou 8 meses). Qual o prazo esperado para
conclusão do projeto, a variância e o desvio padrão?

Conclusão do projeto P(x) X . P(x) (X – EX)2 . P(x)


(em meses) X
8 0,11 0,88 ( 8–10)2 . (0,11) = 0,44
9 0,22 1,98 ( 9–10)2 . (0,22) = 0,22
(10–10)2 .
10 0,33 3,30 (0,33) = 0
11 0,22 2,42 (11–10)2 .
(0,22) = 0,22
(12–10)2 .
12 0,11 1,32 (0,11) = 0,44
Total ∑= 1 EX = 10 ∑ = 1,32

2
Então, a Variância é: S = 1,32 e o Desvio padrão é: S = s2 → S = 1,32 → 1,15 meses

Podemos calcular também, sem montagem de tabela, da seguinte forma:


S2 = ∑ (x – EX)2.P(x) → (8-10)2. (0,11) + (9-10)2. (0,22) + (10-10)2. (0,33) + (11-10)2. (0,22) + (12-10)2. (0,11) = 1,32
S = 1,32 → 1,15 meses

Interpretação do desvio padrão:


O Desvio padrão indica que a maioria dos valores de dados difere do Valor esperado não mais que 1,15 meses, para mais ou
para menos. Então, podemos afirmar que os valores esperados estão dentro dos limites de:

8,85 11,15

8 meses 9 meses 10 meses 11 meses 12 meses


E(X)

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 21 -

CAPÍTULO 3

DISTRIBUIÇÕES DE
PROBABILIDADES

As variáveis aleatórias podem ser discretas ou contínuas, conforme mostra o esquema abaixo.

Em Probabilidade, existem as chamadas “distribuições de probabilidades” criadas por diversos estudiosos no tema,
que podem ser discretas ou contínuas. As principais são listadas abaixo:

DISTRIBUIÇÕES DISCRETAS
Distribuição Binomial
Distribuição Hipergeométrica
Distribuição de Poisson
DISTRIBUIÇÕES CONTÍNUAS
Distribuição Uniforme
Distribuição Normal
Distribuição Exponencial
Distribuição de Erlang
Distribuição de Weibull

Veremos cada uma delas adiante.

Uanderson Rebula de Oliveira Estatística Aplicada


Prof. MSc. Uanderson Rébula de Oliveira

Uma mensagem do Prof. MSc Uanderson Rébula. CLIQUE NO VÍDEO

CLIQUE AQUI E INSCREVA-SE NO CURSO JÁ

Sumário
Engenharia de Produção - 22 -

DISTRIBUIÇÃO BINOMIAL (JAKOB BERNOULLI 1654-1705)

É um experimento de probabilidades para os quais os resultados de cada tentativa podem ser


reduzidos a dois resultados: SUCESSO ou FRACASSO.
; Sucesso corresponde à probabilidade procurada enquanto que Fracasso à probabilidade não procurada, ou seja, o
evento complementar. A palavra sucesso como usada aqui é arbitrária e não representa, necessariamente, algo bom.
Qualquer uma das duas categorias pode ser chamada de sucesso, desde que seja a probabilidade procurada.
; A probabilidade Binomial é aplicada para Eventos independentes. A amostra é feita com reposição.

Revisão de FATORIAL (O fatorial é usado na equação binomial, por isso a importância da revisão)
FATORIAL é um procedimento matemático utilizado para calcular o produto de uma multiplicação cujos
fatores são números naturais consecutivos, denotado por x!. Exemplos:

5! = 5.4.3.2.1 = 120 5! = 5.4.3! = 20 5! = 5.4.3! = 5 5! = 5.4.3! = 10


30! = 30.29.28 . ... .1 3! 3! 3! 4 3! 4 3! (5-3)! 3! (2)!
0! = 1
Para calcular 5! use a calculadora na tecla x! . Procedimento: Introduza 5 x! = 120
Há várias formas de encontrar probabilidade Binomial. Uma forma é usar um Diagrama de Árvore e a regra de multiplicação.
Outra forma é usar a equação de probabilidade Binomial, onde usamos Fatorial. Podemos também usar tabelas.
EQUAÇÃO DA PROBABILIDADE BINOMIAL
P(x) = n! . S x . F n-x
x! (n - x)!
F = probabilidade de Fracasso
n tamanho da amostra (evento complementar)
x nº sucessos na amostra
S = probabilidade de Sucesso
Nota: p e q foram substituídos por S e F por fins didáticos. (evento procurado)

Exemplo 1. Usando um Diagrama de Árvore (evento independente) e a equação da probabilidade Binomial


Cirurgias de microfaturas no joelho têm 75% de chance de sucesso em pacientes com joelhos degenerativos. A
cirurgia é realizada em 3 pacientes. Encontre a probabilidade de a cirurgia ser um sucesso em 2 pacientes.

Pelo Diagrama de Árvore ou Pela equação Binomial

1ª 2ª 3ª Resultado Sucessos Probabilidade (ev. indepen)


S (S,S,S) 3 0,75 . 0,75 . 0,75 = 0,422 P(x) = n! . S x . F n - x
0,75
x! (n - x)!
0,75 S F (S,S,F) 2 0,75 . 0,75 . 0,25 = 0,141 +
S n=3
0,25 S (S,F,S) 2 0,75 . 0,25 . 0,75 = 0,141 + x=2
F S = 0,75
(S,F,F) 1 0,75 . 0,25 . 0,25 = 0,047 F = 0,25 (evento complementar)
F
S (F,S,S) 2 0,25 . 0,75 . 0,75 = 0,141 + P(x)= 3! . 0,75 2 . 0,25 3 - 2
0,75
0,25 S F (F,S,F) 1 0,25 . 0,75 . 0,25 = 0,047
2! (3-2)!
F
0,25 S (F,F,S) 1 0,25 . 0,25 . 0,75 = 0,047 P(x)= 0,422
F
F (F,F,F) 0 0,25 . 0,25 . 0,25 = 0,016

Há três resultados que têm dois sucessos e cada um tem uma probabilidade de Usando a equação Binomial obtemos
0,141. Aplicando a Regra da Adição, a probabilidade de a cirurgia ser um sucesso o mesmo resultado pelo método do
com dois pacientes é 0,422. (0,141 + 0,141 + 0,141) Diagrama de árvore, de 0,422.

A probabilidade de sucesso em 1 paciente será: A probabilidade de não ter sucesso será:

P(x)= 3! . 0,75 1 . 0,25 3 – 1 ≈ 0,141 P(x)= 3! . 0,75 0 . 0,25 3 – 0 ≈ 0,016


1! (3-1)! 0! (3-0)!
Pelo Diagrama será (0,047+0,047+0,047)
Nota: x0 = 1

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 23 -

Exemplo 2. Um levantamento estatístico realizado pelo IBGE constatou que a taxa de desemprego na cidade de
Resende é da ordem de 13%. Ao tomarmos uma amostra de 30 pessoas, com reposição, qual a probabilidade de:
a) 5 estarem desempregados 13% desemprego(Sucesso) 87% emprego(Fracasso)
b) 28 estarem empregados Sucesso é o que se deseja estudar;
c) 27 estarem empregados 87% emprego(Sucesso) 13% desemprego(Fracasso) Fracasso é o que não se deseja estudar

P(x) = n! . S x . F n-x
x! (n - x)!

a) 5 estarem desempregados b) 28 estarem empregados c) 27 estarem empregados

n = 30 n = 30 n = 30
x=5 x = 28 x = 27
S = 0,13 S = 0,87 S = 0,87
F = 0,87 F = 0,13 F = 0,13

P(x)= 30! . 0,13 5 . 0,87 30 - 5 P(x)= 30! . 0,87 28 . 0,13 30-28 P(x)= 30! . 0,87 27 . 0,13 30-27
5! (30-5)! 28! (30-28)! 27! (30-27)!

P(x)= 142506 . 0,000037 . 0,0307 P(x)= 435 . 0,0202 . 0,0169 P(x)= 4060 . 0,0232 . 0,0021

P(x) ≈ 0,1627 P(x) ≈ 0,1489 P(x) ≈ 0,1978

Para calcular 0,135 use a tecla Xy ou ^ . Introduza 0,13 Xy 5 = 3,7-05 que é o mesmo que 0,000037
Exemplo 3. Uma caixa contém 50 bolas, sendo 40 brancas e 10 pretas. Tirando-se 5 bolas, COM REPOSIÇÃO, qual a
probabilidade de saírem:
a) 2 bolas pretas
b) 4 bolas brancas

a) 2 bolas pretas b) 4 bolas brancas


n=5 n=5
x=2 x=4 P = 5! . 0,804 . 0,205 –4 ≈ 0,4096
P = 5! . 0,202 . 0,805–2 ≈ 0,2048
S = 0,20 (10/50) S = 0,80 (40/50) 4! (5-4)!
2! (5-2)!
F = 0,80 (40/50) F = 0,20 (10/50)

Você pode usar o software BIOESTAT para calcular probabilidades Binomiais. Siga o caminho abaixo

R resposta

Para usar o Bioestat, basta incluir “n” tamanho da amostra e “x” nº sucessos na amostra. Observe que não é necessário incluir os dados
do Fracasso. O próprio software já entende que o Fracasso será o valor restante. Ex.: Se Sucesso = 20%, então Fracasso = 80% (omitido no
software). A resposta será o valor que está destacada no quadro azul.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 24 -

Exemplo 4. Uma moeda é lançada 5 vezes. Qual a probabilidade de obter “3 caras” nessas cinco provas?
n = 5 (tamanho da amostra)
x = 3 (nº sucessos da amostra) P(x) = n! . S x . F n - x P(x) = 5! __ . 0,503 . 0,505–3 ≈ 0,3125
S = 0,50 ( = ½ a p de obter cara) 3! (5-3)!
x! (n - x)!
F = 0,50 (= ½ a p de obter coroa)

Exemplo 5. Um dado é lançado 6 vezes. Qual a probabilidade de que a “face 4” apareça 2 vezes?
n = 6 (tamanho da amostra)
x = 2 (nº sucessos da amostra) P(x) = 6! __ . 0,172 . 0,836–2 ≈ 0,2057
1
S = 0,17 ( = /6 a p de obter “4”) 2! (6-2)!
5
F = 0,83 (= /6 a p de não obter “4”)

Exemplo 6. Dois times de futebol, A e B, jogam entre si 6 vezes. Qual a probabilidade de o time A ganhar 4 jogos?
n = 6 (tamanho da amostra)
x = 4 (nº sucessos da amostra) P(x) = 6! __ . 0,334 . 0,666–4 ≈ 0,0774
S = 0,33 ( = 1/3 a p de ganhar)* 4! (6-4)!
F = 0,66 (= 2/3 a p de não ganhar)
* 1/3 o time A pode ganhar, empatar ou perder. Logo, a probabilidade para cada evento é de 1/3
Exemplo 7. Em uma fábrica, 3 em cada 10 peças são defeituosas. Uma remessa a um determinado cliente possui 5
peças. Determine a probabilidade de que, nessa remessa:

2 estejam defeituosas 4 estejam perfeitas


n = 5 (tamanho da amostra) n = 5 (tamanho da amostra)
x = 2 (nº sucessos da amostra) x = 4 (nº sucessos da amostra)
S = 0,30 ( = 3/10 a p peça ser defeituosa) S = 0,70 ( = 7/10 a p peça ser perfeita)
F = 0,70 (= 7/10 a p peça ser perfeita) F = 0,30 (= 3/10 a p peça ser defeituosa)

P(x) = 5! __ . 0,302 . 0,705–2 ≈ 0,3087 P(x) = 5! __ . 0,704 . 0,305–4 ≈ 0,3602


2! (5-2)! 4! (5-4)!

DIFICULTANDO UM POUCO

Exemplo 8. Uma máquina produz parafusos, dos quais 12% apresentam algum tipo de defeito. Calcular a
probabilidade de, em um lote de 40 parafusos produzidos por essa máquina:
a) Entre 3 e 5 parafusos estejam defeituosos, inclusive (ou seja: P3 + P4 + P5)
Neste caso, calcularemos a probabilidade de 3, 4 e 5 parafusos defeituosos. Depois somamos as probabilidades. (Adição de Prob.)

3 parafusos defeituosos 4 parafusos defeituosos 5 parafusos defeituosos


n = 40 n = 40 n = 40
x=3 x=4 x=5
S = 0,12 S = 0,12 S = 0,12
F = 0,88 F = 0,88 F = 0,88

P = 40! . 0,123 . 0,8840–3 ≈ 0,1507 P = 40!_ . 0,124. 0,8840–4 ≈ 0,1901 P = 40! _ . 0,125. 0,8840–5 ≈ 0,1867
3! (40-3)! 4! (40-4)! 5! (40-5)!
P (3 e 5, inclusive) = 0,1507 + 0,1901 + 0,1867 = 0,5275

b) Pelo menos dois parafusos defeituosos (ou seja: P2 + P3 + P4 + . . . + P40) Neste caso use: 1 - (P0 + P1)
Ao invés de calcularmos P2 + P3 + P4 +...+ P40 é mais conveniente usarmos o método do evento complementar (1 – p), pois dá menos
trabalho. Então, calculamos 1 – (P0 +P1 )

nenhum parafuso defeituoso 1 parafuso defeituoso Evento complementar


n = 40 (tamanho da amostra) n = 40 (tamanho da amostra)
P (x ≥ 2) = 1 – (P0 + P1)
x = 0 (nº sucessos da amostra) x = 1 (nº sucessos da amostra)
S = 0,12 S = 0,12 P = 1 – (0,0060 + 0,0328)
F = 0,88 F = 0,88 P = 0,9612

P0 = 40! . 0,120 . 0,8840–0 ≈ 0,0060 P1 = 40! . 0,121. 0,8840–1 ≈ 0,0328


0! (40-0)! 1! (40-1)!

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 25 -

c) No máximo 3 parafusos defeituosos (ou seja: P0 + P1 + P2 + P3)


Neste caso, somamos as probabilidades de : P0 + P1 + P2 + P3, Ou seja, aplicamos o método de adição de probabilidades.
nenhum parafuso 1 parafuso 2 parafusos 3 parafusos Adição
defeituoso defeituoso defeituosos defeituosos
P (x ≤ 3) = 0,0060+0,0328+0,0872+0,1507 = 0,2768
P0 = 0,0060 P1 = 0,0328 P2 = 0,0872 P3 = 0,1507

d) Pelo menos 39 parafusos de qualidade (ou seja: ... P39 + P40)


Ou seja, no mínimo 39 parafusos de qualidade. Então, somamos P39 + P40

39 parafusos de qualidade 40 parafusos de qualidade Adição


n = 40 n = 40
x = 39 x = 40 P = P39 + P40
S = 0,88 S = 0,88 P = (0,0328 + 0,0060)
F = 0,12 F = 0,12
P = 0,0388
P39 = 40! . 0,8839 . 0,1240–39 ≈ 0,0328 P1 = 40! . 0,8840. 0,1240–40 ≈ 0,0060
39! (40-39)! 40! (40-40)!

e) No máximo 39 parafusos de qualidade (ou seja: ...P0 + P1 + P2 + ... + P39)


Neste caso, somaríamos as probabilidades de : P0 + P1 + P2 + ... + P39, Mas são muitos cálculos. Então, é mais conveniente usar o
método de evento complementar (1 – p). Então, calculamos 1 – P40

P (x ≤ 39) = 1 – P40 → P= 1 – 0,0060 = 0,9940

Encontrando probabilidades Binomiais por meio do Excel

Além do BIOESTAT, você pode encontrar probabilidades Binomiais pelo EXCEL, bastando inserir os dados, conforme
demonstrado abaixo. A figura abaixo se refere ao exemplo 8 que acabamos de ver.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 26 -

Encontrando probabilidades Binomiais por meio de tabelas.


Repetindo o exemplo 1. Cirurgias de microfaturas no joelho têm 75% de chance de sucesso em pacientes com
joelhos degenerativos. A cirurgia é realizada em 3 pacientes. Encontre a probabilidade de a cirurgia
a) ser um sucesso em 2 pacientes.
b) Ser um sucesso em 1 paciente.
c) Não ter sucesso.

Resolução. Uma parte da tabela pode ser vista aqui. Usando o sucesso de 75% (ou 0,75), n do tamanho da amostra = 3 e com
número de sucessos 2, 1 e 0 das letras a), b) e c), respectivamente, você pode encontrar a probabilidade Binomial conforme
visto nas áreas destacadas na tabela abaixo.

Nota: Para Sucesso <= 0,50, considere as linhas e colunas verdes para a probabilidade e os sucessos e para Sucesso > 0,50
considere as linhas e colunas vermelhas para a probabilidade e os sucessos. Para valores de Sucessos "quebrados", use a
fórmula DISTRBINOM (sucessos;n;p;0) no Excel.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 27 -

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 28 -

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 29 -

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 30 -

DISTRIBUIÇÃO HIPERGEOMÉTRICA
É um experimento de probabilidade para os quais os resultados de cada tentativa podem ser reduzidos a
dois resultados: SUCESSO ou FRACASSO, MAS SEM REPOSIÇÃO DA AMOSTRA.
; Da mesma maneira que a distribuição Binomial, a distribuição Hipergeométrica tem dois resultados possíveis:
SUCESSO ou FRACASSO. A diferença é que ao experimento Binomial exige que a amostragem seja feita COM
REPOSIÇÃO, pois cada resultado deve ser independente dos outros, enquanto que o experimento Hipergeométrico
exige que a amostragem seja feita SEM REPOSIÇÃO, pois cada resultado deve ser dependente dos outros.
; O experimento Hipergeométrico é aplicado para Eventos dependentes. A amostra é sem reposição.
EQUAÇÃO DA PROBABILIDADE HIPERGEOMÉTRICA

F = nº fracassos da população
S = nº sucessos da população
f = nº fracassos da amostra
s = nº sucessos da amostra

N tamanho da população
n tamanho da amostra

Exemplo Binomial
Uma caixa contém 50 bolas, sendo 40 brancas e 10 pretas. Tirando-se 5 bolas, COM REPOSIÇÃO, qual P(x) de saírem:
a) 2 bolas pretas P(x) = n! . S x . F n - x
b) 4 bolas brancas x! (n - x)!

a) 2 bolas pretas b) 4 bolas brancas


n=5 n=5
x=2 x=4 P(x) = 5! . 0,80 4 . 0,20 5 –4
S = 0,20 (10/50)
P(x) = 5! . 0,20 2 . 0,80 5–2 S = 0,80 (40/50)
40 2! (5-2)! 4! (5-4)!
F = 0,80 ( /50) F = 0,20 (10/50) ≈ 0,4096
≈ 0,2048
COM REPOSIÇÃO. Se as bolas são extraídas com reposição, isto é, retira-se uma bola, verifica-se a cor, coloca-se novamente a
bola na caixa, retira-se novamente uma bola, verifica-se a cor, coloca-se de volta na caixa, até que se completem as 5 extrações.

Exemplo Hipergeométrico
Uma caixa contém 50 bolas, sendo 40 brancas e 10 pretas. Tirando-se 5 bolas, SEM REPOSIÇÃO, qual P(x) de saírem:
a) 2 bolas pretas
b) 4 bolas brancas

a) 2 bolas pretas b) 4 bolas brancas


10! 40! 40! 10!
S = 10 x S = 40 x
s=2 2! (10 − 2)! 3! (40 − 3)! s=4 4! (40 − 4)! 1! (10 − 1)!
P= P=
F = 40 50! F = 10 50!
f=3 f=1
N = 50
5! (50 − 5)! N = 50 5! (50 − 5)!
n=5 n=5
P(x) ≈ 0,2098 P(x) ≈ 0,4313

SEM REPOSIÇÃO. Se as bolas são extraídas sem reposição, isto é, extraem-se as 5 bolas sem que nenhuma delas retorne à caixa.
Os eventos – cor de cada bola – já não são mais independentes, pois a probabilidade de uma bola ser branca ou preta depende
de que cor tenham saído as demais bolas.

Na científica --> ((10! : 2!(10-2)! x 40! : 3!(40-3)! : (50! : 5!(50-5)!)

Na TechCalc --> N=50 | n=5 | S=10 | s=2 |

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 31 -

Você pode usar o software BIOESTAT para calcular probabilidades Hipergeométricas. Siga o caminho abaixo

Uma caixa contém 50 bolas, sendo 40 brancas e 10 pretas. Tirando-se 5 bolas, SEM REPOSIÇÃO, qual P(x) de saírem:
a) 2 bolas pretas
S = 10
s=2
F = 40
f=3
N = 50
n=5

resposta

Observe que não é necessário incluir os dados do Fracasso. O próprio software já reconhece que o Fracasso será o valor restante. Ex.:
Se Sucesso = 10 e 2, então Fracasso = 40 e 3 (omitido), já que a população é 50 e 5. A resposta será o valor que está no quadro azul.

Você pode usar o software EXCEL para calcular probabilidades Hipergeométricas.

Demonstrando o exemplo anterior, temos:

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 32 -

DISTRIBUIÇÃO GEOMÉTRICA
É um experimento de probabilidades para os quais os resultados de cada tentativa podem ser reduzidos
a dois resultados: SUCESSO ou FRACASSO, sendo realizado até que apareça o PRIMEIRO SUCESSO
; Sucesso corresponde à probabilidade procurada enquanto que Fracasso à probabilidade não procurada, ou seja, o evento
complementar. A palavra sucesso como usada aqui é arbitrária e não representa, necessariamente, algo bom. Qualquer uma das duas
categorias pode ser chamada de sucesso, desde que seja a probabilidade procurada.
; Da mesma maneira que a distribuição Binomial, a distribuição Geométrica tem dois resultados possíveis: SUCESSO ou FRACASSO. Uma
particularidade da distribuição Geométrica é que são necessárias inúmeras tentativas até o aparecimento do PRIMEIRO SUCESSO.
; A distribuição Geométrica é aplicada para Eventos independentes. A amostra é feita com reposição.

EQUAÇÃO DA PROBABILIDADE GEOMÉTRICA


n tamanho da amostra
P(x) = Fn - 1 . S S probabilidade de Sucesso
t (evento procurado)
Nota: p e q foram substituídos F probabilidade de Fracasso(evento complementar)
por S e F por fins didáticos.

Exemplo. Uma máquina produz parafusos dos quais 12% apresentam algum tipo de defeito. Um analista deseja
coletar uma amostra de 40 parafusos. Encontre a probabilidade de que:
a) na 6ª amostra apareça o primeiro parafuso defeituoso. b) na 4ª amostra apareça o primeiro parafuso perfeito.
n=6 n=4
6 –1 4 -1
S = 0,12 P(x) = 0,88 . 0,12 = 0,0633 ou 6,33% S = 0,88 P(x) = 0,12 . 0,88 = 0,0015 ou 0,15%
F = 0,88 F = 0,12
...Que, pela lógica do evento independente é a mesma coisa ...Que, pela lógica do evento independente é a mesma coisa
5 3
que FFFFFS, ou seja, 0,88 . 0,12 (É como se fosse PPPPPD) que FFFS, ou seja, 0,12 . 0,88 (É como se fosse DDDP)

1º sucesso 1º sucesso

DISTRIBUIÇÃO DE PASCAL
É um experimento de probabilidades para os quais os resultados de cada tentativa podem ser reduzidos
a dois resultados: SUCESSO ou FRACASSO, sendo realizado até que apareça o K-ÉSIMO SUCESSO
; Sucesso corresponde à probabilidade procurada enquanto que Fracasso à probabilidade não procurada, ou seja, o evento
complementar. A palavra sucesso como usada aqui é arbitrária e não representa, necessariamente, algo bom. Qualquer uma das duas
categorias pode ser chamada de sucesso, desde que seja a probabilidade procurada.
; Da mesma maneira que a distribuição Binomial e Geométrica, a distribuição de Pascal tem dois resultados possíveis: SUCESSO ou
FRACASSO. Uma particularidade da distribuição de Pascal é que são necessárias inúmeras tentativas até o aparecimento do K-ÉSIMO
SUCESSO.
; A distribuição de Pascal é aplicada para Eventos independentes. A amostra é feita com reposição.

EQUAÇÃO DA PROBABILIDADE DE PASCAL


n tamanho da amostra
k n-k k k-ésimo sucesso da amostra
P(x) = (n -1)! __ . S . F x nº sucessos na amostra
(k - 1)! . (n - k)! S probabilidade de Sucesso
F probabilidade de Fracasso

Exemplo. Uma máquina produz parafusos dos quais 12% apresentam algum tipo de defeito. Um analista deseja
coletar uma amostra de 40 parafusos. Encontre a probabilidade de:
a) Na 9º amostra, apareça o terceiro parafuso defeituoso. b) na 25ª amostra apareça o 21º parafuso perfeito.
n=9 n = 25
k=3 3 9-3 k = 21
(9-1)! __ . 0,12 . 0,88 = 0,0224 (25-1)! __ . 0,8821 . 0,1225-21 = 0,1503
S = 0,12 S = 0,88
(3-1)! . (9-3)! (21-1)! . (25-21)!
F = 0,88 F = 0,12

...Como exemplo, é como se fosse FSFFFSFFS ...Como exemplo, é como se fosse FSFF...FSSFF...FS

3º sucesso 21º sucesso

Também chamada de Binomial negativa. Na científica: Ex a) (9-1)! : ((3-1)! x (9-3)!) x 0,12^3 x 0,88^9-3

Na TechCalc --> procurar "Distribuição Binomial, negativo". Entradas: ex. a) 3|6|0,12| = 0,0225 ex b) 21|4|0,88| = 0,1503
Ou seja: entrada de | k | n-k, em que esta diferença é o numero de falhas | S

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 33 -

DISTRIBUIÇÃO MULTINOMIAL (OU POLINOMIAL)


É um experimento de probabilidades para os quais os resultados de cada tentativa podem ter VÁRIOS
RESULTADOS POSSÍVEIS, e não só Sucesso ou Fracasso. É uma generalização da distribuição Binomial.

; Na distribuição Multinomial, todos os resultados possíveis são independentes uns dos outros.
EQUAÇÃO DA PROBABILIDADE MULTINOMIAL
n tamanho da amostra
x tamanho de cada sucesso
P(x) = n! _ . p1x1. p2x2 . p3x3... P probabilidades associadas ao sucesso
x1! x2! x3! ...

Exemplo 1. Uma máquina produz parafusos dos quais 12% apresentam algum tipo de defeito, sendo 4% do tipo A e
8% do tipo B. Um analista deseja coletar uma amostra de 40 parafusos. Encontre a probabilidade de:
a) Sair 35 parafusos perfeitos, 3 com defeitos tipo A e 2 com defeitos tipo B?
n = 40
P(x) = 40! . 0,8835. 0,043 . 0,082 = 0,0307
x1= 35 ; p1= 0,88
35! 3! 2!
x2= 3 ; p2= 0,04
x3= 2 ; p3= 0,08

Exemplo 2. Um caixa tem 4 bolas vermelhas (V), 3 brancas (B) e 3 azuis. Retiram-se 5 bolas, com reposição. Qual a
probabilidade de saírem 2V, 1B e 2A?

n=5
P(x) = 5! . 0,402. 0,301 . 0,302 = 0,1296
x1= 2 ; p1= 0,40 (4/10)
2! 1! 2!
x2= 1 ; p2= 0,30 (3/10)
x3= 2 ; p3= 0,30 (3/10)

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 34 -

DISTRIBUIÇÃO DE POISSON (DENIS POISSON 1781-1840) (LÊ-SE POASSÓN)

É um experimento de probabilidade que calcula o NÚMERO DE OCORRÊNCIAS de um evento em um


DADO INTERVALO de TEMPO, DISTÂNCIA, ÁREA, VOLUME ou unidade similar.
; O esquema abaixo ajuda a melhor interpretar o experimento de Poisson.

nº de ocorrências
1 2 3 4... do evento
x x x x
← Intervalo de tempo, distância, área ou volume →

; Regras: É aplicada caso os eventos ocorram com uma MÉDIA conhecida e cada evento seja independente.
; São exemplos: número de consultas a uma base de dados por minuto; número de falhas de um equipamento por hora;
número de erros de tipografia em um formulário; número de defeitos em um m2 de piso cerâmico; número de buracos
em um asfalto por km; número de acidentes por mês em uma rodovia etc.
EQUAÇÃO DA PROBABILIDADE DE POISSON
P(x) = μ x *
e -μ
x!
μ = letra grega mi = Média Constante de Euler Venn 2,7182
Nota: Algumas literaturas usam nº de ocorrências procurada
λ (lambda) no lugar de μ Média do nº de ocorrências (baseada em histórico)

Exemplo 1. A Média do número de acidentes por mês na rodovia Barra Mansa-Angra é de 3 acidentes por mês.
Determine a probabilidade de que, em qualquer mês dado:
a) 4 acidentes ocorram na rodovia
b) 2 acidentes ocorram na rodovia
c) Nenhum acidente ocorra na rodovia
a) 4 acidentes ocorram na rodovia b) 2 acidentes ocorram na rodovia c) Nenhum acidente ocorra na rodovia

μ=3 μ=3 μ=3


e = 2,7182 e = 2,7182 e = 2,7182
x=4 x=2 x=0

34 .
2,7182 -3 = 0,168 P(x) = 3 2 .
2,7182 -3 = 0,224 P(x) = 3 0 .
P(x) = 2,7182 -3 = 0,0498
4! 2! 0!

Para calcular e - μ use a mesma tecla Xy ou ^ . Introduza 2,7182 Xy - 3 = 0,0497


Encontre e na calculadora
Você pode usar o microsoft Excel para calcular probabilidades de Poisson. Veja abaixo (do exemplo 1)

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 35 -

Exemplo 2. Supondo que a Média do número de pessoas que acessam um caixa eletrônico de um banco durante
uma hora é 5. Determine a probabilidade de, no mesmo período, ocorrerem:
a) Menos de 2 acessos ao caixa eletrônico P(x) = μ x .
e -μ
b) Pelo menos 3 acessos ao caixa eletrônico x!

a) Menos de 2 acessos ao caixa eletrônico (ou seja nenhum acesso ou um acesso: P0 + P1 )


Neste caso, calcularemos a probabilidade de P0 e P1. Depois somamos as probabilidades. (Adição de Probabilidades)
Nenhum acesso ao caixa 1 acesso ao caixa eletrônico Adição de Probabilidades
μ=5 μ=5
e = 2,7182 e = 2,7182
P(x < 2) = P0 + P1
x=0 x=1
P0 = 5 0 .
2,7182 -5 = 0,0067 51 .
P1 = 2,7182 -5 = 0,0337 P = 0,0067 + 0,0337 = 0,0404
0! 1!

b) Pelo menos 3 acessos ao caixa eletrônico (ou seja P3+P4+P5 +P6+P7+P8 ...)
“pelo menos 3 acessos ao caixa” é o mesmo que “no mínimo 3 acessos ao caixa”. Ao invés de calcularmos P3+P4+P5+... é mais
conveniente usarmos método do evento complementar (1 – p). Então, calculamos 1 – (P0 + P1 + P2)
Nenhum acesso 1 acesso ao caixa 2 acessos ao caixa eletrônico Evento complementar
ao caixa eletrônico
μ=5 P (x ≥ 3) = 1 – (P0 + P1 + P2)
e = 2,7182
P0 = 0,0067 P1= 0,0337
x=2 P = 1 – (0,0067+0,0337+0,0842)
2 . -5
P2 = 5 2,7182 = 0,0842 P = 0,8753
2!

Exemplo 3. Numa central telefônica chegam em média 300 telefonemas por hora. Qual a probabilidade de que:
a) 2 telefonemas ocorram em dois minutos?
Nota: São 300 telefonemas/hora, em média.
b) 3 telefonemas ocorram em quatro minutos? 300
Então são em média 5 telefonemas/minuto. ( /60 = 5)
c) Nenhum telefonema ocorra em um minuto?

a) 2 telefonemas ocorram em dois b) 3 telefonemas ocorram em quatro c) Nenhum telefonema ocorra em


minutos? minutos? um minuto?

μ= 10 telefonemas (5+5 em dois min) μ= 20 telefonemas (5*4 em quatro min) μ = 5 telefonemas (em um min)
e= 2,7182 e = 2,7182 e = 2,7182
x= 2 telefonemas x=3 x=0

P = 10 2 * 2,7182 -10 = 0,002270 P = 20 3 .


2,7182 –20 = 0,0000274 P= 50 .
2,7182 -5 = 0,00673
2! 3! 0!

Encontrando probabilidades de Poisson por meio de tabelas


Repetindo o Exemplo 1. A Média do número de acidentes por mês na rodovia Barra Mansa-Angra é de 3
acidentes/mês. Determine a probabilidade de que, em qualquer mês dado:
a) 4 acidentes ocorram na rodovia
Resolução. Uma parte da tabela pode ser vista aqui. Usando a média µ=3 e x=4, você pode encontrar a probabilidade de
Poisson conforme visto nas áreas destacadas na tabela abaixo. (compare o resultado com a letra a) do exemplo1 ).

Tabela de Poisson (parcial)

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 36 -

TABELA COMPLETA DE POISSON

Nota: Para valores não disponíveis na tabela, use POISSON(sucessos; λ ; 0) no Excel. ( λ é a mesma coisa que µ)

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 37 -

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 38 -

Poisson como aproximação para a distribuição Binomial


Você pode utilizar a Distribuição de Poisson para fazer uma aproximação da Distribuição Binomial
quando n (tamanho da amostra) é grande e S (sucesso) é pequeno.
; Quando n é muito grande (acima de 100, por exemplo), as probabilidades binomiais ficam difíceis de serem calculadas,
como exemplo 0,12 100. 0,88 100 - 5. O cálculo direto é impraticável. Apelamos então para a aproximação de Poisson.

EQUAÇÃO DE POISSON COMO APROXIMAÇÃO DA BINOMIAL


x * - (n . s)
P(x) = (n.s) e
Constante de Euler
x! Venn 2,7182
n = tamanho da amostra
x = nº de sucessos da amostra
s = Probabilidade de sucesso

Note que substituímos a média µ da equação de Poisson pela média da distribuição Binomial (n . s). Para melhor entender o
modelo de aproximação vamos ver os exemplos 1 e 2, que comparam os dois métodos:
Exemplo 1. Uma máquina produz parafusos, dos quais 12% apresentam algum tipo de defeito. Calcular a
probabilidade de, em um lote de 40 parafusos produzidos por essa máquina:
a) 3 parafusos estejam defeituosos
Pela distribuição Binomial Poisson como aproximação da distribuição Binomial
n = 40
x=3 n = 40
S = 0,12 x=3
F = 0,88 S = 0,12
3 40–3
Pbin = 40! . 0,12 . 0,88 ≈ 0,1507 PPoisson ≈ bin = (40 * 0,12) 3 * 2,7182 –(40 * 0,12) ≈ 0,1517
3! (40-3)! 3!

Análise dos resultados: Perceba pelo comparativo que a distribuição de Poisson pode ter uma boa aproximação da Distribuição
Binomial. A aproximação vai melhorando à medida que n vai se tornando maior e S vai se tornando menor.

Exemplo 2. Uma máquina produz parafusos, dos quais 1% apresentam algum tipo de defeito. Calcular a
probabilidade de, em um lote de 900 parafusos produzidos por essa máquina:
a) 9 parafusos estejam defeituosos
Pela distribuição Binomial Poisson como aproximação da distribuição Binomial
n = 900
x=9 n = 900
S = 0,01 x=9
F = 0,99 S = 0,01
9 900 – 9
Pbin = 900! . 0,01 . 0,99 ≈ ‘Math ERROR’ PPoisson ≈ bin = (900*0,01) 9 * 2,7182 –(900 * 0,01) ≈ 0,1317
9! (900-9)! (0,1324 pelo Excel) 9!

Análise dos resultados: Observe que o cálculo do exemplo 2 pelo método Binomial usando uma calculadora científica torna-se
impraticável. Pelo Excel o resultado Binomial é 0,1324, bem aproximado pelo método de Poisson. É importante ressaltar que
a variável aleatória de Poisson teoricamente se estende desde 0 até ∞ (infinito). No entanto, quando você utiliza a distribuição
de Poisson como uma aproximação para a distribuição binomial, a variável aleatória de Poisson — o número de sucessos dentre
n observações — não pode ser maior do qdue o tamanho da amostra, n.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 39 -

DISTRIBUIÇÃO UNIFORME
É aquela na qual as variáveis aleatórias se espalham uniformemente sobre a faixa de valores possíveis, ou
seja, todos os valores ocorrem com a mesma probabilidade.
; Representa o análogo continuo dos resultados igualmente prováveis. É usada nas situações em que não há razão para
atribuir probabilidades diferentes a um conjunto possíveis de valores em um determinado intervalo.
; A área sob o gráfico de uma distribuição uniforme é igual a 1. O gráfico resulta em uma forma retangular.
; Há uma correspondência entre área e probabilidade. Se a probabilidade de x assumir valores num subintervalo é a
mesma para qualquer outro subintervalo de mesmo comprimento, então, esta variável tem distribuição uniforme.
; A distribuição uniforme, embora apresentada como contínua, pode também abranger casos discretos. É o caso do
lançamento de um dado, como mostrado abaixo.

A distribuição de probabilidade do lançamento de um dado, por exemplo, tem distribuição uniforme pois seus
resultados são igualmente prováveis:

Probabilidades no
P(x) lançar um dado lançamento de um dado
“x” P(x) DISTRIBUIÇÃO
1 UNIFORME
1 /6
Probabilidade

1 1 1 1 1 1
2 1
/6 /6 /6 /6 /6 /6 /6
1
1 /6
3 /6
1
4 /6 Área = 1
1
5 /6
1
6 /6
∑=1 ou 100% 1 2 3 4 5 6
Faces do dado

Probabilidade na distribuição uniforme


Para encontrar probabilidades na distribuição uniforme usamos a seguinte equação:

Gráfico da distribuição uniforme EQUAÇÃO DA PROBABILIDADE UNIFORME ACUMULADA


P(x) = b– a P(x), se D ≤ x ≤ C
Probabilidade

a b
D–C 0, caso contrário
Em que:
Área P(x) procurada Área do intervalo definido
a – menor valor C – menor valor
C D b – maior valor D – maior valor
Variável aleatória

Exemplo 1. Com base em históricos, o tempo de vôo de Chicago - Nova York pode ter qualquer valor no intervalo de
120 a 140 minutos. Considerando que cada um dos intervalos de 1 minuto é igualmente provável, determine:
a) A P(x) do avião chegar entre 126 e 131 minutos b) A P(x) do avião chegar em 136 minutos ou mais.

Gráfico da distribuição do vôo Gráfico da distribuição do vôo


136 140
Probabilidade

126 131
Probabilidade

120 125 130 135 140 120 125 130 135 140

Tempo de vôo em minutos Tempo de vôo em minutos

P(x) = b – a → 131 – 126 = 0,25 P(x) = b – a → 140 – 136 = 0,20


D–C 140 – 120 D–C 140 – 120

Ex. O tempo esperado de vôo entre Chicago – Nova York é:


O Valor esperado (média) da Ex=D + C
Ex = 140+120 = 130 minutos.
distribuição uniforme é: 2
2

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 40 -

DISTRIBUIÇÃO NORMAL (ABRAHAM DE MOIVRE 1667 - 1754 )

É usada para distribuições SIMÉTRICAS e possui diversas aplicações, como calcular as probabilidades de
PESOS e ALTURAS das pessoas, diâmetro e comprimento de peças em linhas de produção, tempo de vida
útil de produtos e diversas outras medições de pesquisas científicas.
; Aplicado para distribuições SIMÉTRICAS (Média=Moda=Mediana). Possui como parâmetro a MÉDIA e DESVIO PADRÃO.
; Também chamada de Curva Normal, Curva de Gauss e Curva em forma de Sino.

Para entender o conceito de uma Distribuição Normal, tomemos como exemplo a distribuição da vida útil de 340
lâmpadas produzidas pela PHILIPS:

Distribuição da vida útil de 340 lâmpadas


produzidas pela PHILIPS Curva NORMAL ou
Curva de GAUSS ou
Média = Curva em forma de SINO
120
Moda = 1000 horas
Mediana = 100
100
Quantidade

80
70 70
60

40 40
40
20
10 10
0
700 800 900 1000 1100 1200 1300
Horas
Observe pela Distribuição Normal que o tempo de vida útil das lâmpadas:

; Possui uma elevação em seu centro e pontas que vão tanto para direita quanto para a esquerda;
; A Média, Mediana e Moda (1000 horas) encontram-se exatamente no meio da distribuição;
; A distribuição de valores menores que a Média (700, 800, 900) e maiores que a Média (1100, 1200, 1300) é
simétrica, o que significa que se você dobrá-la ao meio, suas partes serão como imagens refletidas por um espelho;
; Como a curva é simétrica em torno da Média, os valores maiores que a média e os valores menores do que a Média
ocorrem com igual probabilidade;
; A maioria dos dados é centralizada ao redor da média, de modo que quanto mais longe da média você se mover,
cada vez menos pontos de dados você vai encontrar em ambos os lados.

Analisando a variabilidade
Analise a figura abaixo. Veja que a maior parte da vida útil das lâmpadas produzidas pela PHILIPS varia de 700
horas até 1300 horas, com uma boa parte das lâmpadas com vida útil de 900 a 1100 horas. Pensando como
consumidor, você gostaria de se deparar com tamanha variabilidade quando for comprar um pacote de lâmpadas?
Veja que uma concorrente (OSRAM) irá tentar fabricar lâmpadas com vida útil menos variável; a vida útil terá
uma média de 1000 horas, mas suas lâmpadas terão uma vida útil mais consistente, variando de 920 a 1080
horas, com boa parte das lâmpadas com duração entre 980 e 1020 horas.
OSRAM
D istribuição da vida útil de 340 lâm padas Menor variação
produzidas pela OSRAM 920 a 1080 horas
OSRAM
120

100
100
PHILIPS
Quantidade

80 PHILIPS Maior variação


70 70 700 a 1300
60

40 40
40
20
10 10
0
700 800 900 1000 1100 1 2 00 1 3 00
Horas

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 41 -

Em uma distribuição Normal, o Desvio padrão tem um significado especial, pois determina a distância da Média
até um ponto dentro da distribuição, cada um com a mesma distância da Média. No caso abaixo, supomos (por
fins didáticos) que o Desvio padrão do tempo de vida útil das lâmpadas é s=100 horas.
99,74%
A regra empírica
Na distribuição normal é possível determinar a posição
95,44% s=100 da maioria dos valores, usando as distâncias de 1, 2 ou 3
Desvios padrões da Média para estabelecer alguns
68,26% marcos. A regra que lhe permite fazer isso se chama
120
Regra empírica, que diz o seguinte:
100 Espera-se que cerca de 68,26% dos valores encontram-
100
se dentro de 1 desvio padrão da média;
Quantidade

80 (no exemplo, 240 lâmpadas (70+100+70).


70 70 Espera-se que 95,44% dos valores encontram-se dentro
60
de 2 desvios padrões da média;
S=100 S=100 (no exemplo, 320 lâmpadas: 40+70+100+70+40)
40 40
40
Espera-se que 99,74% dos valores encontram-se dentro
20
10 10 de 3 desvios padrões da média;
0 (no exemplo, 340 lâmpadas: 10+40+70+100+70+40+10)
700 800 900 1000 1100 1200 1300
Estes resultados são aproximações. A regra empírica
Horas não pode ser aplicada às distribuições que não possuam
uma forma de montanha em seu centro.
-3S -2S -1S x 1S 2S 3S
ENCONTRANDO PROBABILIDADES NA DISTRIBUIÇÃO NORMAL
Quando se tem uma variável aleatória com distribuição normal pode-se obter a probabilidade de essa variável
assumir um valor em determinado intervalo, pela área sob a curva dentro dos limites do intervalo.
Exemplo 1. Seja X a variável aleatória que representa os tempos de vida útil das lâmpadas produzidas pela
PHILIPS Sendo a Média de vida útil das lâmpadas de 1000 horas com Desvio padrão de 100 horas, ache a
probabilidade de a lâmpada ter vida útil entre 1000 e 1150 horas, isto é, P(1000 < z < 1150).

Probabilidade procurada
P(1000 < Z < 1150)

P= 0,4332

Z= 1,50

700 800 900 1000 1100 1200 1300

PARA ACHAR A PROBABILIDADE, SIGA 2 PASSOS:

1º PASSO. Calcule o número de desvios padrão que o valor “1150” se distancia da média “1000”. Para isto,
utilizamos a equação abaixo, chamada “escore Z”.

EQUAÇÃO ESCORE Z Calculando o escore Z, temos:

Média z = 1150 - 1000 = 1,50


z= x - x
s
100

O resultado indica que 1150 está distante 1,50 desvios


Desvio padrão padrão da média. Use sempre 2 casas decimais. Veja
Escore Z demonstração da área de Z no gráfico acima.
Variável aleatória procurada
O escore Z é uma medida que indica o número de desvios padrão de um valor a partir da média.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 42 -

2º PASSO. Com o escore Z de “1,50”, use a Tabela de Distribuição Normal Padrão para encontrar a
probabilidade, como explicado abaixo:
Na 1ª coluna encontramos “1,5”. Em seguida, encontramos na 1ª linha “0”, que é o último algarismo de “1,50”. Na intersecção
da linha e coluna encontramos 0,4332, o que indica que a probabilidade P(1000 < z < 1150) = 0,4332 ou 43,32%.
Interpretação: espera-se que 43,32% das lâmpadas tenham vida útil entre 1000 e 1150 horas.

TABELA DE DISTRIBUIÇÃO NORMAL PADRÃO


Z Último dígito
0 1 2 3 4 5 6 7 8 9

A área constante na tabela corresponde a área à direita (sinal positivo):

Área = 0,5

-z +z

-3S -2S -1S 0 1S 2S 3S


motivo da qual desconsideramos o sinal negativo no z-escore nas áreas à esquerda, pois a curva é simétrica em torno da
Média, ou seja, os valores maiores que a média e os valores menores do que a Média ocorrem com igual probabilidade. . A
tabela não é de distribuição acumulada. Vamos ver alguns exemplos adiante.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 43 -

Exemplo 2. Continuando com os dados do exemplo 1, ache P(900 < z < 1000).
Quando partimos da média calculamos apenas um escore Z. Para lado esquerdo o escore Z sempre terá sinal
negativo, que não será considerado, pois os dois lados são iguais em termos de probabilidades.
Probabilidade procurada EQUAÇÃO ESCORE Z
P(900 < Z < 1000)

P= 0,3413 z= x - x
s
Calculando, temos:

z = 900 - 1000 = -1,00 *


100
Probabilidade: na tabela temos: 0,3413
Z= -1,00
*Desconsidere o sinal negativo do escore Z

700 800 900 1000 1100 1200 1300

Interpretação: Espera-se que 34,13% das lâmpadas tenham vida útil entre 1000 e 1100 horas.

Exemplo 3. Continuando com os dados do exemplo 1, ache P(900 < z < 1050).

Neste caso, calculamos dois escores Z e somamos as probabilidades:


ADIÇÃO DE PROBABILIDADES
Probabilidade procurada P= 0,5328
z1 = 900 - 1000 = - 1,00*
. P(900 < Z < 1050)
00 0,3413
P1=0,3413 P2=0,1915
+
z2 = 1050 - 1000 = 0,50
100 0,1915
Soma de probabilidades = 0,5328
Z2
=0,50

Z1= -1,00

700 800 900 1000 1100 1200 1300

Interpretação: Espera-se que 53,28% das lâmpadas tenham vida útil entre 900 e 1050 horas.

Exemplo 4. Continuando com os dados do exemplo 1, ache P(1050 < z < 1150).

Neste caso, calculamos dois escores Z (de 1000 a 1150; e de 1000 a 1050). Depois subtraímos as probabilidades:

Probabilidade procurada P= 0,2417 SUBTRAÇÃO DE PROBABILIDADES


P(1050 < Z < 1150) Z1 = 1150 - 1000 = 1,50
100 0,4332
PZ2=0,1915 PZ1=0,4332 --
Z2 = 1050 - 1000 = 0,50
100 0,1915
Z1=1,5 0
Subtração probabilidades = 0,2417

Z2= 0,50

700 800 900 1000 1100 1200 1300

Interpretação: Espera-se que 24,17% das lâmpadas tenham vida útil entre 1050 e 1150 horas.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 44 -

Exemplo 5. Continuando com os dados do exemplo 1, ache P( z < 850 horas)


Ou seja, ache a probabilidade de a vida útil da lâmpada ser menor que 850 horas. Neste caso, P1 = 0,5 (meia área). Daí,
calculamos Z2 e subtraímos as probabilidades:

Probabilidade procurada P= 0,0668


P( Z < 850)
Área = 0,5 SUBTRAÇÃO DE PROBABILIDADES

P1=0,4332 P1 = (meia área)


0,5

PZ2=0,0668
--
Z2 = 850 - 1000 = -1,50
100 0,4332
Z1= -1,50 Subtração probabilidades = 0,0668

700 800 900 1000 1100 1200 1300

Interpretação: Espera-se que 6,68% das lâmpadas tenham vida útil abaixo de 850 horas.
Exemplo 6. Sabe-se que a Média de vida útil das lâmpadas produzidas pela PHILIPS é de 1000 horas com Desvio
padrão de 100 horas. O fabricante oferece uma garantia de 800 horas, isto é, trocar as lâmpadas que apresentem
falhas nesse período ou inferior. Fabrica 15.000 lâmpadas mensalmente. Quantas lâmpadas deverá trocar pelo uso da
garantia, mensalmente? (adaptado de Morettin, pág 143 e 144)

Probabilidade procurada SUBTRAÇÃO DE PROBABILIDADES


P( Z < 800)
P1 = (meia área)
0,5
Garantia de --
800 horas Z2 = 800 - 1000 = - 2,00
00 0,4772
Subtração de probabilidades = 0,0228

700 800 900 1000 1100 1200 1300

Interpretação: Constatamos que 2,28% (0,0228) das lâmpadas não atenderão a garantia. Então o fabricante deverá substituir
mensalmente: 15.000 x 0,0228 = 342 lâmpadas.

Z-ESCORE E VALOR DE “X” NA DISTRIBUIÇÃO NORMAL


Na seção anterior você encontrou a probabilidade que x pudesse estar em um dado intervalo ao calcular a área sob a curva
normal para um dado intervalo. Mas, e se lhe fosse dado uma probabilidade e você quisesse encontrar o valor de x?
Encontrando o Z-ESCORE dada uma PROBABILIDADE
Exemplo 7. Encontre o z- escore que corresponda à área de 0,2123 (21,23%) da área à direita?

Observando a Tabela de Distribuição Normal Padrão encontramos z-escore de 0,56 conforme destacado abaixo.

TABELA DE DISTRIBUIÇÃO NORMAL PADRÃO


Z Último dígito
0 1 2 3 4 5 6 7 8 9

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 45 -

Encontrando VALOR DE “X” que corresponda a um Z-ESCORE


Da equação do Z-ESCORE podemos formar a equação do VALOR DE “X”, conforme demonstrado abaixo:
Equação para encontrar valor de “x”
x = variável procurada
z= x - x
s ∴ zs = x − x ∴ x + zs = x x = x + zs x = média
z = escore Z
s = desvio padrão
Importante. Para encontrar valores de “x” vamos considerar os sinais dos Z-escore (negativo ou positivo)

Exemplo 8. Sabe-se que a Média de vida útil das lâmpadas produzidas pela PHILIPS é de 1000 horas com Desvio
padrão de 100 horas. Encontre o tempo de vida útil “x” que corresponda a:

a) Z = 1,5: x = x + zs → x = 1000 + 1,5 (100) = 1.150 horas.


a) Z-escore de 1,5 Interpretação: Para z escore de 1,5 o tempo de vida útil das lâmpadas é de 1.150 horas. Você pode confirmar o
resultado consultando o exemplo 1.

b) Z = -2: x = x + zs → x = 1000 + (-2)(100) = 800 horas.


b) Z-escore de -2 Interpretação: Para z escore de -2 o tempo de vida útil das lâmpadas é de 800 horas. Você pode confirmar o
resultado consultando o exemplo 6.

Encontrando VALOR DE “X” que corresponda a uma PROBABILIDADE

Exemplo 9. Sabe-se que a Média de vida útil das lâmpadas produzidas pela PHILIPS é de 1000 horas com Desvio
padrão de 100 horas. O fabricante deseja fixar prazo de garantia, em horas, de tal modo que, se a duração da
lâmpada for inferior à garantia, a lâmpada seja trocada. De quantas horas deve ser este prazo para que somente 4%
das lâmpadas sejam trocadas?

Passo 1 → 0,5 – 0,04 = 0,46


0,5 Passo 2 → Procurando na tabela P(x)=0,46 (0,4599 é mais
próximo), encontramos Z = -1,75. (negativo pois é à esquerda)
-Z
Passo 3. Logo:

0,04
x = x + zs → x = 1000 + (-1,75)(100) = 825 horas.

Interpretação: O prazo de horas para que seja trocado 4% das lâmpadas


deve ser de 825 horas.

700 800 900 1000 1100 1200 1300

-1,75

TABELA DE DISTRIBUIÇÃO NORMAL PADRÃO


Z Último dígito
0 1 2 3 4 5 6 7 8 9

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 46 -

Exemplo 10. As pontuações para um teste de Engenheiro em uma empresa são normalmente distribuídas, com uma
média de 7,5 com e um desvio padrão de 0,5. Para ser adequado ao emprego, você deve ter pontuação dentro dos
9% primeiros. Qual é a menor pontuação que você pode conseguir e ainda ser adequado ao emprego?

Passo 1 → 0,5 - 0,09 = 0,41


0,5
Passo 2 → Procurando na tabela P(x)=0,41 (0,4099 é mais próximo)
+Z encontramos Z = 1,34 (positivo pois é à direita).
Passo 3
x = x + zs → x = 7,5 + (1,34)(0,5) = 8,17.
0,09
Interpretação: A menor pontuação que você pode conseguir e ainda
assim ser adequado ao emprego é 8,17.

,
6,0 6,5 7,0 7,5 8,0 8,5 9,0
+1,34

TABELA DE DISTRIBUIÇÃO NORMAL PADRÃO


Z Último dígito
0 1 2 3 4 5 6 7 8 9

Exemplo 11 Sabe-se que a Média de vida útil das lâmpadas produzidas pela PHILIPS é de 1000 horas com Desvio
padrão de 100 horas. Dentro de que limite, de ambos os lados da média, ficará 95% das lâmpadas?

0,95 Resolução
0,95
Passo 1 → /2 = 0,4750 (para cada lado da média).
Passo 2 → Procurar 0,4750 na tabela. Encontramos Z = 1,96 (neste
caso teremos Z1= -1,96 e Z2 = +1,96).
Passo 3. Logo:
X1 = 1000 + (-1,96)(100) = 804 horas.
x = x + zs X2 = 1000 + (+1,96)(100) = 1.196 horas.
- 0,4750 + 0,4750 Interpretação: 95% das lâmpadas ficará entre 804 horas e 1196 horas, ou
seja, P 95% ( 804 < z < 1196)

z= - 1,96 x̄ z= + 1,96

TABELA DE DISTRIBUIÇÃO NORMAL PADRÃO


Z Último dígito
0 1 2 3 4 5 6 7 8 9

USANDO UMA TABELA DE

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 47 -

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
DISTRIBUIÇÃO NORMAL PADRÃO
ACUMULADA
(Informativo) Distribuição acumulada de 0% a 100%
Esta tabela que tem o seguinte princípio:

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 48 -

Exemplo de aplicação. Sabe-se que a Média de vida útil das lâmpadas produzidas pela PHILIPS é de 1000 horas com
Desvio padrão de 100 horas. Encontre P (900 < z < 1050) usando a tabela de distribuição normal padrão acumulada.

Probabilidade procurada
P(900 < Z < 1050) P= 0,5328 SUBTRAÇÃO DE PROBABILIDADE
Z1 = 900 - 1000 = -1,00*
100 0,1587
Z2 = 0,50 → 0,6915 *Considere o sinal negativo

Z2 = 1050 - 1000 = 0,50


100 0,6915

Z1= -1,00 → 0,1587 P(x)= Z2 – Z1 → 0,6915 – 0,1587= 0,5328

700 800 900 1000 1100 1200 1300


-3z -2z -1z 0 +1z +2z +3z
Veja o Z-escore destacado na tabela acumulada acima. Confronte o resultado com o exemplo 3.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 49 -

Normal como aproximação para a distribuição Binomial


; Na distribuição Binomial vimos que, se uma máquina produz parafusos dos quais 12% apresentam defeito, é fácil
calcular a probabilidade de, em um lote de 40 parafusos produzidos, 3 sejam defeituosos. Veja abaixo.
Distribuição Binomial n = 40
x=3 P = 40! . 0,123 . 0,8840–3 ≈ 0,15
x n-x 3! (40-3)!
P(x) = n! . S . F S = 0,12
x! (n - x)! F = 0,88

; Mas e se coletarmos 150 parafusos e queremos encontrar a probabilidade que menos de 40 parafusos sejam
defeituosos? Teríamos que usar a equação binomial 40 vezes e encontrar a soma das probabilidades (P0+P1+P2+...+P39).
Esse método não é prático, claro. A solução é usarmos a distribuição normal para aproximar da distribuição binomial.
Regras para aproximar a Normal para Binomial:

Regra 1. AMOSTRAS GRANDES. À medida que o tamanho da amostra aumenta, a distribuição Binomial é aproximada e
normalmente distribuída. Para ver que esse resultado é válido, veja as distribuições binomiais da produção de parafusos de
uma máquina, dos quais 12% apresentam defeito (Sucesso), com dois diferentes de tamanhos amostrais: n = 10 e n = 40.

0.5 Produção da máquina n = 40 0.25 Produção da máquina


n = 10 S = 0,12
S = 0,12 0.37 X P(x) Curva
0.4 0.2
X P(x) 0 0,006 normal
0 0,27 1 0,03
Probabilidade

Probabilidade
0.27
1 0,37 0.3 2 0,08 0.15
0.23
2 0,23 3 0,15
3 0,08 0.2 4 0,19 0.1
4 0,003 5 0,18
0.1 0.08 6 0,14 0.05
7 0,09
0.003 8 0,05
0 9 0,02 0
0 1 2 3 4 10 0,01 0 1 2 3 4 5 6 7 8 9 10

Número de paraf usos def eituosos Número de parafusos def eituosos

Perceba que à medida que o tamanho da amostra aumenta, o histograma aproxima-se de uma curva normal. Então, para
amostras grandes podemos fazer uma aproximação da Normal para Binomial (desde que S não seja muito próximo de 0 ou 1).

Regra 2: CORREÇÃO DE CONTINUIDADE. Para obter aproximações mais precisas utilizamos um ajuste chamado correção de
continuidade. A razão para isto é que a distribuição Binomial é discreta e assume valores inteiros (0, 1, 2, 3...) enquanto que a
distribuição Normal é contínua, podendo assumir qualquer valor dentro de um intervalo (0,5, 1,5, 2,5...). Como exemplo,
suponha que dos 40 parafusos produzidos você queira saber a probabilidade de encontrar 3 defeituosos. Enquanto o modelo
Binomial apresenta somente um único valor (como exemplo 3), a distribuição normal pode assumir qualquer valor dentro dos
limites de um intervalo em torno daquele valor específico, como exemplo “2,5 e 3,5 parafusos”, conforme ilustrado abaixo.

parafusos parafusos parafusos


Binomial

Normal

A aplicação da correção da continuidade prevê o ajuste de -0,5 ou + 0,5 ao valor de x, conforme as situações listadas abaixo.

a) b)
Pelo menos/ No máximo
no mínimo 100 (inclui) 100 (inclui)

99,5 100,5
Exatamente
100
c) d) e)
Maior que Menor que
100 100

99,5 100,5

100,5 99,5

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 50 -

Exemplo 1. Uma máquina produz parafusos, dos quais 12% apresentam algum tipo de defeito. Calcular a
probabilidade de, em um lote de 40 parafusos produzidos por essa máquina, 4 sejam defeituosos:
a) Pelo método Binomial
n = 40
P(x) = n! . S x . F n - x P= 40! . 0,12 4 . 0,88 40–4 ≈ 0,1901
x=4
x! (n - x)! 4! (40 - 4)!
S = 0,12
F = 0,88
b) Pelo método de aproximação da Normal pela Binomial
1º passo – Encontre a média e o desvio padrão da distribuição Binomial:

Médiabin = n . S → 40 . 0,12 = 4,8 | DPBin = n .S. F → 40 . 0,12 . 0,88 = 2,05

2º passo – Aplique a correção de continuidade para o valor de x procurado:


x = 4 parafusos defeituosos. Observando as situações listadas → 3,5 < x < 4,5

3º passo - Desenhe o gráfico Normal com a média e desvio padrão Binomial; e com valor de x procurado
(corrigido) e aplique a equação do escore Z:
SUBTRAÇÃO DE PROBABILIDADE
0.25 Produção damáquina (TABELA ACUMULADA)
3,5 < x < 4,5
Com as probabilidades da tabela acumulada:
0.2
Z1 = 3,5 - 4,8 = - 0,63
0.15 2,05 0,2843

0.1 Z2 = 4,5 - 4,8 = - 0,14


2,05 0,4761
0.05
P(x)= Z2 – Z1 → 0,4761 – 0,2843= 0,1918
0
0 1 2 3 4 5 6 7 8 9 10
2,75 4,8 6,85

Comparação de resultados: Binomial = 0,1901 versus Normal = 0,1918, sendo bastante aproximados.

Exemplo 2. Uma máquina produz parafusos, dos quais 12% apresentam algum tipo de defeito. Calcular a
probabilidade de, em um lote de 150 parafusos produzidos por essa máquina, no máximo 20 sejam defeituosos.

1º Médiabin = n . S → 150 . 0,12 = 18 | DPBin = n .S . F → 150 . 0,12 . 0,88 = 3,98


2º x = no máximo 20 parafusos defeituosos → 20,5
ADIÇÃO DE PROBABILIDADES

No máximo P1 = (meia área)


20 parafusos defeituosos 0,5
+
Z2 = 20,5 - 18 = 0,62
3,98 0,2324
Adição de probabilidades = 0,7324
14,02 18 21,98

20,5

Perceba que pelo método Binomial você teria que calcular P0+P1+P2+...+P20, sendo muito trabalhoso. Com auxílio de recursos
computacionais, como o Excel, o resultado é 0,7413. Calculando manualmente pelo método de aproximação da Normal para
Binomial o resultado é 0,7324, tendo uma aproximação satisfatória.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 51 -

Normal como aproximação para a distribuição de Poisson.


Na distribuição de Poisson vimos que, se a média do número de acidentes na rodovia Barra Mansa-Angra é de 15
acidentes/mês, é fácil calcular a probabilidade de que 12 acidentes ocorram na rodovia, em qualquer mês dado:
µ = 15
e = 2,7182 P(x) = µx x
e-µ → 1512 x
2,7182 -15 = 0,0829
x = 12 x! 12!

Mas e se quiséssemos encontrar a probabilidade de que ocorresse no máximo 12 acidentes em qualquer mês dado? Teríamos
que usar a equação de Poisson 13 vezes e encontrar a soma de probabilidades (P0+P1+P2+...+P12). Esse método não é prático,
claro. A solução é usarmos a Normal para aproximar da Distribuição de Poisson.

Regra 1
Para uma melhor aproximação, use a correção de continuidade (+0,5 ou -0,5) nos mesmos moldes estudados na Normal como
aproximação da Binomial, visto que o modelo de Poisson também é uma distribuição Discreta.
Regra 2
À medida que a média µ de Poisson cresce, mais se aproxima da Distribuição Normal. Em geral, fazemos a aproximação da
Normal para Poisson quando µ ≥ 15.

Exemplo 1. A Média do número de acidentes por mês na rodovia Barra Mansa-Angra é de 15 acidentes por mês.
Determine a probabilidade de que, em qualquer mês dado, ocorram no máximo 12 acidentes
1º passo – Encontre a média e o desvio padrão da distribuição de Poisson:

μPoisson = x → 15 | DPPoisson = x → 15 = 3,873

2º passo – Aplique a correção de continuidade para x: máximo 12 acidentes → 12,5

3º passo - Desenhe o gráfico Normal (com correção continuidade) e aplique a equação escore Z:
SUBTRAÇÃO DE PROBABILIDADE
x = 15
S = 3,873
X = 12,5 Z1 = 0,5
Z=? -
Z2 = 12,5 - 15 = - 0,6455
3,873 0,2389

12,5 15 = 0,2311

Comparação de resultados: Poisson (Excel) = 0,2676 versus Normal = 0,2611, sendo bastante aproximados.

Exemplo 2. Uma máquina produz 1200 peças por hora. Determine a probabilidade de a máquina produzir mais de
136 peças em 8 minutos.
Nota: São 1200 peças por hora, em média. Logo, são 20 peças por minuto (1200/60 = 20)
1º passo – Encontre a média e o desvio padrão da distribuição de Poisson:

São 20 peças por minuto. Logo, são 160


μPoisson = x → 160 | DPPoisson = 160 = 12,64
peças em 8 minutos, em média (20 x 8).

2º passo – Aplique a correção de continuidade para x: mais de 136 peças → 136,5

3º passo - Desenhe o gráfico Normal (com correção continuidade) e aplique a equação escore Z:
ADIÇÃO DE PROBABILIDADE
x = 160
S = 12,64
X = 136,5 Z1 = 0,5
Z=? +
Z2 = 136,5 - 160 = - 1,85
12,64 0,4678
136,5 160
= 0,9678
Comparação de resultados: Poisson (Excel) = 0,9708 versus Normal = 0,9678, sendo bastante aproximados.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 52 -

DISTRIBUIÇÃO EXPONENCIAL
É um experimento de probabilidade que calcula o INTERVALO até a PRÓXIMA OCORRÊNCIA EM UM
PROCESSO DE POISSON em um intervalo de tempo, distância, área, volume ou unidade similar.
; Existe uma relação entre o modelo de Poisson e o Exponencial. A distribuição de Poisson é usada para calcular o número
de ocorrências em um período; a distribuição Exponencial calcula o intervalo ate a próxima ocorrência. Veja abaixo:

1 2 3 4. nº de ocorrências do evento (Poisson)


x x x x
Intervalo até a próxima ocorrência (Exponencial)
← Intervalo de tempo e distância →

Exemplo Poisson Exemplo Exponencial


9 número de acidentes em uma rodovia por mês; 9 tempo até ocorrer o próximo acidente na rodovia;
9 número de acessos a um caixa eletrônico/hora; 9 tempo até ocorrer próximo acesso ao caixa eletrônico;
9 número de defeitos em uma rodovia por Km. 9 comprimento até o próximo defeito na rodovia.

; É aplicada caso os eventos ocorram com uma MÉDIA conhecida e cada evento seja independente.
; Como a exponencial é utilizada na modelagem de tempos decorridos entre dois eventos, tem ampla aplicação em
estudos de confiabilidade na modelagem do tempo até a falha de um equipamento e tempo de vida de materiais.

EQUAÇÃO DA DISTRIBUIÇÃO EXPONENCIAL


Para P > x (obter valor superior) Para P ≤ x (Obter valor igual ou inferior)

Equação 1 ⎛1 ⎞ Equação 2 ⎛1 ⎞
− ⎜⎜ * x ⎟⎟ − ⎜⎜ * x ⎟⎟
μ μ
P= e ⎝ ⎠ P = 1− e ⎝ ⎠

e = constante de Euller 2,7182 μ = média do intervalo x = variável procurada


1
Adaptamos a equação de Poisson. O valor /µ da equação exponencial corresponde a média do intervalo entre as ocorrências. Por
1
exemplo, se a média de acidentes em uma rodovia é igual a 3 por mês, então o tempo médio entre os acidentes é /3 = 0,33 mês
(ou 10 dias (0,33 x 30 dias). Da mesma maneira, se a média de atendimentos no caixa de uma loja é de 6 clientes/min, então o
1
tempo médio entre atendimentos é /6 = 0,166 min. (ou 10 segundos (0,1666 x 60seg).

Exemplo 1. O tempo médio que as pessoas acessam um caixa eletrônico de um banco é de 25 minutos. Determine
a probabilidade de que o próximo acesso a este caixa : Dados: e = 2,7182

a) Seja superior a 40 minutos b) Seja superior a 90 minutos c) Seja inferior a 10 minutos


P >40min, use a equação 1 P > 90min, use a equação 1 P <10min, use a equação2
μ = 25 μ = 25 μ = 25
x = 40 x = 90 x = 10

⎛ 1 ⎞ ⎛ 1 ⎞ ⎛ 1 ⎞
− ⎜ * 40 ⎟ − ⎜ * 90 ⎟ − ⎜ * 10 ⎟
P = e ⎝ 25 ⎠ = 0,2019 P = e ⎝ 25 ⎠ = 0,0273 P = 1 − e ⎝ 25 ⎠ = 0,3296

P(x) = 0,2019
(próximo acesso ao caixa
Probabilidade

A área sob o gráfico da distribuição


superior a 40 minutos)
exponencial é igual a 1 e resulta em uma forma
assimétrica à direita (positiva), se estendendo
de zero até ∞ (infinito).

x
0 15 30 45 60 75 90

Tempo em minutos

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 53 -

Exemplo 2. O tempo médio entre ocorrências de acidentes na rodovia Barra Mansa - Angra é de 10 dias. Se um
acidente acabou de acontecer, qual a probabilidade de que o próximo ocorra um em período:

a) inferior a 15 dias b) Entre 20 e 25 dias (para esses casos use sempre eq. 1)
P < 15 dias, use a equação 2
μ = 10 dias μ = 10 dias
μ = 10 dias x = 20 x = 25
x = 15
⎛ 1 ⎞ ⎛ 1 ⎞
⎛ 1 ⎞ − ⎜ * 20 ⎟ − ⎜ * 25 ⎟
− ⎜ * 15 ⎟ P(x) = e ⎝ 10 ⎠ = 0,1353 P(x) = e ⎝ 10 ⎠ = 0,0820
P(x) = 1 − e ⎝ 10 ⎠ = 0,7769

Calcule a probabilidade de 20 e 25...


... e subtraia as probabilidades → P = 0,1353 – 0,0820 = 0,0533

P(x) = 0,7769
(próximo acidente ocorrer em
período inferior a 15 dias)
Probabilidade

x
0 10 20 30 40 50 60

Tempo em dias
Exemplo 3. A média do número de ocorrências de falhas em algum componente de um motor é de 6 falhas por dia.
Qual a probabilidade de que a próxima falha de um componente ocorra um em período:
24 horas
Nota: Ocorrem 6 falhas por dia. Logo, o tempo médio entre as ocorrências de falhas é de 4 horas. ( /6)
a) inferior a 3 horas b) Inferior a 30 minutos b) superior a 140 minutos
P < 3 horas, use a equação 2 P < 30min, use a equação 2 P >140 minutos, use a equação 1

μ = 4 horas μ = 4 horas μ = 4 horas


30 140
x = 3 horas X1 = 0,5 horas ( /60) x = 2,33 horas ( /60)

⎛1 ⎞ ⎛1 ⎞ ⎛1 ⎞
− ⎜ * 3⎟ − ⎜ * 0,5 ⎟ − ⎜ * 2,33 ⎟
P(x) = 1 − e ⎝ 4 ⎠ = 0,5276 P(x) = 1 − e ⎝ 4 ⎠ = 0,1175 P(x) = e ⎝ 4 ⎠ = 0,5585

Você pode usar o microsoft Excel para calcular probabilidades Exponenciais. Veja abaixo .

Exemplo 2, letra a) inferior a 15 dias

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 54 -

DISTRIBUIÇÃO DE WEIBULL (WALODDI WEIBULL – 1887-1979)

É um a extensão do processo exponencial que calcula o INTERVALO até a OCORRÊNCIA de FALHA


“MAIS GRAVE” DE UM PROCESSO DE POISSON em um intervalo de tempo, distância, área ou volume.
; A distribuição de Weibull, como a Exponencial, é amplamente usada na modelagem de tempo de vida de equipamentos e
estimativas de falhas, além de determinação do tempo de vida de produtos industriais.
Na distribuição exponencial, se o tempo médio entre ocorrências de falhas de algum componente de um motor é de 4 horas,
então, o intervalo entre as falhas é constante, como pode ser visto no esquema abaixo:
O intervalo constante significa que, depois que a peça
Intervalo constante entre ocorrências de falha (Exponencial) estiver em uso, sua probabilidade de falhar não altera ao
longo do tempo. Por exemplo, admitimos que um fusível
x x x x é “tão bom quanto novo” enquanto estiver funcionando.
Isto é, se o fusível não tiver fundido, estará
4 hs 4 hs 4 hs praticamente novo.

Já a distribuição de Weibull é adequada toda vez que o sistema (um motor, por exemplo) for composto de vários componentes
e as falhas sejam aleatórias e devida à “mais grave” falha dentre um grande número de imperfeições no sistema.
As falhas não constantes significam que, depois que a
Intervalo não constante entre ocorrências de falhas (Weibull) peça estiver em uso, sua probabilidade de falhar se
x x x x altera. O número de falhas pode aumentar com o
tempo, como exemplo, o rolamento de um motor se
Falha mais desgastará ao longo do uso.
4 hs 5 hs 6 hs grave

EQUAÇÃO DA DISTRIBUIÇÃO DE WEIBULL . A probabilidade de falhar um componente é dada por:


Para P > x (obter valor superior) Para P ≤ x (Obter valor igual ou inferior)

β Equação 2 β
Equação 1 ⎛x⎞ ⎛x⎞
− ⎜⎜ ⎟⎟ − ⎜⎜ ⎟⎟
η η
P= e ⎝ ⎠ P= 1 − e ⎝ ⎠

e = constante 2,7182 η – vida útil de um componente (lê-se eta)


x = variável procurada β – fator de qualidade de um componente (lê-se beta) (parâmetro de forma)

Exemplo 1. O rolamento de um motor segue uma variável aleatória de Weibull, com vida útil de 200 horas e fator
de qualidade de 0,8. Determine a probabilidade de o rolamento:

a) Durar 300 horas ou mais b) Durar 70 horas ou menos


p >300 horas, use a equação 1 p < 70 horas, use a equação 2
η = 200 0,8 η = 200 0,8
⎛ 300 ⎞ ⎛ 70 ⎞
β = 0,8 −⎜ ⎟ β = 0,8 −⎜ ⎟
x = 300 P = e ⎝ 200 ⎠ ≈ 0,2507 x = 70 P = 1 − e ⎝ 200 ⎠ = 0,3506

NOTAS TEÓRICAS SOBRE A DISTRIBUIÇÃO DE WEIBULL


9 A taxa de falha da distribuição exponencial apresenta um mesmo nível de falhas dentro de um intervalo de tempo para toda a vida do
componente, fornecendo estimativa de longo prazo bastante precisa, mas não é capaz de representar as mudanças na taxa de falha
durante o tempo de operação. Já a distribuição de Weibull tende a refletir mais precisamente a distribuição de falha real de campo.
9 Embora a equação de Weibull aparenta ser de fácil aplicação, a deteminação dos parâmetros β e η exige conhecimentos de Engenharia
de Confiabilidade/ Manutenção, não abordados nesta apostila. A Engenharia de Confiabilidade objetiva estabelecer, através de modelos
estatísticos, o tempo no qual um sistema estará disponível, informação fundamental tanto para a proposição do tempo de garantia de um
determinado produto quanto para a gestão da manutenção de um ambiente industrial.

9 A distribuição de Weibull é utilizada para representar falha: Devido à mortalidade infantil (dominada pelos pontos fracos de fabricação e
erros de partida, instalação e manutenção); Aleatórias (dominada pelas falhas inesperadas causadas por esforços repentinos, condições
extremas, erros humanos); e por desgaste (dominado pelo fim da vida de uso do equipamento). Esta informação ajuda na determinação
de uma estratégia de manutenção adequada. A análise dos dados de falha, utilizando a Distribuição de Weibull, vai nos ajudar no
estabelecimento do intervalo para certos tipos de tarefas de manutenção.

Uanderson Rebula de Oliveira Estatística Aplicada


“Atualmente, todos – estudantes e professores – procuram o Udemy porque é a
plataforma onde todos estão”.
Fonte: Jornal do Brasil

Faça o curso online na Udemy


Estatística I (para leigos):
aprenda fácil e rápido!
Com o Prof. MSc. Uanderson Rébula
"O livro digital Estatística I para leigos possui uma linguagem fácil e ao mesmo tempo dinâmica. O
conteúdo do livro está ordenado de forma a facilitar a aprendizagem dos alunos, mesmo aquelas
pessoas que não tenham noção nenhuma de estatística aprenderão com esse livro. Você pode
estudar sozinho para concursos pois o livro é auto explicativo ou até mesmo em grupos, no meu
caso faço isso com meus alunos. Eu super recomendo esse livro!!! NOTA 1000"
Maria Eunice Souza Madriz
Professora de estatística da rede estadual de ensino da Bahia
Avaliação do livro pelo cliente na amazon.com.br

Saiba
mais
Clique aqui

www.udemy.com
Junte-se a milhões de estudantes na maior plataforma on-line
de cursos curtos e práticos do mundo.

Com mais de 45.000 cursos virtuais disponíveis, o Udemy é uma plataforma global de
ensino on-line onde 15 milhões de alunos estão dominando novas habilidades.

O foco do Udemy são os conhecimentos práticos e úteis para o mercado de trabalho. Há


cursos gratuitos e pagos. São cursos curtos e com valores bem acessíveis.
Prof. MSc. Uanderson Rébula de Oliveira

Uma mensagem do Prof. MSc Uanderson Rébula. CLIQUE NO VÍDEO

CLIQUE AQUI E INSCREVA-SE NO CURSO JÁ

Sumário
Engenharia de Produção - 55 -

CAPÍTULO 4
INTRODUÇÃO À ESTATÍSTICA
INFERENCIAL

O objetivo da Estatística Inferencial é tirar conclusões sobre a população


com base em dados amostrais.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 56 -

CONCEITOS BÁSICOS EM ESTATÍSTICA INFERENCIAL

ESTATÍSTICA INFERENCIAL
O objetivo da Estatística Inferencial é tirar conclusões com base em amostras de tal modo que as
informações possam ser expandidas para toda a população.
AMOSTRA Uma amostra constitui numa redução da população a dimensões menores,
(uma parte da população) sem perda das características essenciais. Examina-se, então, a amostra. Se
essa amostra for bastante representativa, os resultados obtidos
poderão ser generalizados para toda a população. As conclusões
fundamentadas em uma amostra não serão exatamente as mesmas que
POPULAÇÃO
(todos os elementos em estudo)
você encontraria se estudasse toda a população, em função da variabilidade.
Então, toda conclusão tirada por uma amostragem virá acompanhada de um
grau de incerteza. A estatística inferencial possui técnicas que permitem dar
ao pesquisador um grau de confiabilidade, de confiança, nas afirmações que
Média = ? faz com a população, baseadas nos resultados amostrais. O problema
Desvio padrão = ? Média = a fundamental da estatística inferencial é, portanto, medir o grau de
Desvio padrão = b incerteza dessas generalizações. Conhecer a probabilidade de variação do
processo de inferência é importante. Com que probabilidade se pode confiar
nos resultados obtidos dos dados amostrais?

Exemplo de Estatística Inferencial:


Em 2002, estudo baseado numa amostra de Engenheiros e Gerentes de diversas empresas de
Construção Civil, acredita-se que o salário médio dos cargos desse ramo são:

CARGOS MÍNIMO (R$) MÉDIO (R$) MÁXIMO (R$)


Gerente de Engenharia Civil 4.976 5.951 7.738
Engenheiro Civil Sênior 3.694 4.146 4.517
Engenheiro Civil Pleno 2.122 2.296 3.206
Engenheiro Civil Júnior 1.671 1.872 2.042
Fonte: A REMUNERAÇÃO DE PROFISSIONAIS DA ÁREA DE CONSTRUÇÃO CIVIL – Seu Salário - Jornal Carreira e Sucesso
Observe que esse estudo generalizou os resultados da amostra para a população.

PARÂMETROS E ESTATÍSTICAS
Sempre que as relações forem calculadas com base em dados da população, chamamos de “PARÂMETROS”; e sempre que
essas relações se referirem à amostra serão chamadas de “ESTATÍSTICAS”.

PARÂMETROS Notação para PARÂMETRO e ESTATÍSTICA:


AMOSTRA
(uma parte da população) Notação
Nome da
relação PARÂMETRO ESTATÍSTICA
POPULAÇÃO (POPULAÇÃO) (AMOSTRA)
(todos os elementos em estudo) Tamanho N n
Média µ x̄
Variância σ2 S2
Desvio Padrão σ S
ESTATÍSTICAS
µ (lê-se mi) σ (lê-se sigma minúsculo)

EXEMPLO:
PARÂMETRO (População) ESTATÍSTICA (amostra)
Considerando o salário anual dos 2.500 gerentes da Considerando uma amostra do salário anual de 30
empresa XTPO, temos: gerentes da empresa XTPO, temos:
x1 = R$ 47.874 x1 = R$ 47.874
x2 = R$ 51.896 x2 = R$ 51.896
x3 = R$ 49.567 µ = R$ 51.800 x3 = R$ 49.567 x̄ = R$ 51.927
. .
σ = R$ 4.000 S = R$ 3.348
. .
x2500 = R$ 53.456 x30 = R$ 50.301
Os resultados amostrais serão sempre diferentes da população. Essa diferença chama-se erro.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 57 -

TÉCNICAS DE AMOSTRAGEM PROBABILÍSTICAS


São técnicas de seleção dos elementos de uma população, de modo a se obter uma amostra representativa da população.
Devem ser utilizadas para assegurar que as inferências sobre a população sejam válidas.
Amostragem Aleatória Simples – É aquela na qual todos os elementos da população tem a mesma chance de
ser selecionado.
; Essa técnica usa mecanismos de casualidade para escolher os elementos da população, como a tabela de números
aleatórios. O método é semelhante a um sorteio.
Tabela de números aleatórios
; A tabela de números aleatórios consiste em uma série de números listados em uma
sequência aleatoriamente gerada. Essa tabela tem duas características que a tornam adequada: primeiro, os números
estão dispostos de tal maneira que a chance de qualquer um deles aparecer em determinada sequência é igual à chance
do aparecimento em qualquer outra posição; segundo, cada uma de todas as combinações de algarismos tem a mesma
chance de ocorrência. O Excel dispõe da função “ALEATÓRIO” para gerar números aleatórios (veja figura). A tabela de
números aleatórios abaixo foi construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso, pelo Excel,
identificadas pelas linhas (1, 2, 3, 4...) e colunas (A, B, C, D ...):
Tabela de números aleatórios
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l
1 9 3 3 1 2 1 6 6 3 3 9 0 7 0 4 0 4 4 1 3 8 1 6 5 8 8 9 8 6 5 0 6 3 3 1 2 4 8
2 0 7 6 8 1 4 5 0 5 8 6 6 1 4 2 6 7 5 6 0 5 7 7 9 6 3 2 6 3 4 5 9 8 6 5 2 1 1
3 6 5 1 5 3 4 4 2 3 7 9 1 4 8 5 8 7 2 4 7 3 7 0 6 2 2 1 3 5 0 8 9 4 7 1 6 4 4
4 9 7 0 2 6 7 3 2 6 7 4 9 1 6 2 7 7 8 6 8 4 7 8 1 5 7 1 2 6 6 6 3 5 6 0 8 2 1
5 5 5 6 5 1 6 4 8 3 3 1 5 3 8 8 2 3 8 8 7 7 4 5 0 4 5 1 8 7 2 3 2 9 6 4 7 7 9
6 8 3 4 8 8 3 8 0 6 4 8 2 3 5 2 5 3 7 1 7 6 8 2 9 5 3 4 3 7 0 3 9 7 0 1 5 7 2
7 3 1 2 7 5 4 7 1 3 5 2 4 1 5 1 3 1 8 0 5 8 8 6 0 6 6 9 5 5 5 3 5 8 5 6 7 1 2
8 3 6 3 1 1 7 6 9 5 3 3 5 3 5 6 3 3 3 4 3 6 8 4 5 5 8 8 1 9 2 5 7 8 7 7 5 8 7
9 4 2 0 4 7 2 7 9 3 3 3 3 3 2 8 7 1 8 0 6 1 5 3 4 0 6 3 2 8 3 3 0 7 2 7 2 4 2
10 6 8 7 0 3 9 9 9 8 6 8 2 1 5 8 7 4 5 5 2 6 3 4 1 1 2 2 1 2 9 4 0 5 8 7 0 6 8
11 7 9 1 6 5 8 1 4 3 7 9 1 2 5 3 4 1 6 3 1 6 3 2 5 1 9 5 7 7 5 6 6 8 4 6 5 7 1
12 8 1 4 6 3 8 8 4 7 1 3 6 3 7 7 5 2 6 2 4 8 6 3 2 1 4 8 3 1 7 0 8 1 9 4 1 2 3
13 8 1 7 9 3 4 3 6 9 5 9 2 1 7 3 8 7 5 2 2 7 6 0 6 1 8 1 2 1 4 8 5 2 7 3 3 8 5
14 2 8 8 4 4 0 4 3 2 2 8 1 1 0 2 8 1 8 1 4 5 1 8 1 8 3 3 4 5 6 6 8 1 4 7 4 3 3
15 3 3 7 2 0 0 2 9 5 5 6 8 2 4 5 7 4 0 6 7 3 2 6 3 7 6 7 2 7 2 2 7 6 4 1 6 1 1
16 0 2 7 8 1 7 7 6 0 4 3 4 5 8 7 8 3 0 3 1 2 7 8 5 2 3 2 5 7 5 7 4 3 5 2 9 4 6
17 1 1 0 5 9 6 6 2 7 2 2 7 1 8 5 5 2 7 5 9 5 0 3 7 0 3 1 5 4 2 9 7 4 4 2 6 0 5
18 1 9 0 4 1 1 4 3 3 1 5 6 7 0 1 2 2 2 4 4 9 2 2 1 9 7 1 5 9 1 1 5 8 9 7 2 2 2
19 6 9 7 4 5 0 1 0 6 6 2 1 5 2 1 8 8 2 5 2 2 2 8 1 2 3 8 1 3 5 7 6 7 8 1 6 7 1
20 2 7 1 2 1 6 3 1 1 7 1 2 3 4 8 8 1 1 7 1 1 1 3 6 2 1 1 7 9 2 2 5 3 2 2 2 7 6
21 9 5 5 5 2 2 0 1 3 6 9 6 5 3 2 2 6 3 1 4 4 4 3 1 6 7 0 5 5 1 0 7 3 1 2 1 5 3
22 4 2 4 9 7 3 1 8 3 4 8 3 7 1 3 1 1 6 4 8 2 3 3 1 4 7 3 8 6 3 1 8 0 2 8 1 0 8
23 5 8 3 1 1 3 8 2 5 3 8 6 2 2 7 8 1 1 1 3 4 4 8 8 6 4 2 3 1 8 6 1 8 4 9 1 5 6
24 8 4 3 2 1 3 5 7 6 7 3 3 6 1 9 4 7 6 5 6 6 7 2 6 5 7 0 8 2 6 4 9 1 4 7 7 3 4
25 1 2 8 1 0 5 4 3 8 5 1 1 8 9 1 3 8 7 4 5 0 4 7 0 8 3 8 9 6 2 3 7 1 4 6 2 9 4
26 7 7 5 7 9 2 4 5 7 8 7 1 4 8 4 1 6 4 9 7 5 9 4 1 4 4 3 2 2 5 8 0 2 3 4 5 4 2
27 7 2 8 8 8 3 8 5 5 4 4 5 9 4 9 2 3 1 1 1 2 7 6 3 5 1 4 0 6 2 7 7 7 7 7 7 0 4
28 8 7 7 1 9 6 7 6 6 5 5 9 1 6 5 6 1 2 2 3 2 5 7 5 6 9 5 0 3 1 7 1 1 5 5 2 6 6
29 1 4 8 2 2 1 9 5 2 6 6 3 4 0 1 3 0 5 5 6 9 1 7 8 8 8 2 7 7 9 7 5 0 3 6 2 4 4
30 7 6 1 9 0 5 1 4 4 4 1 0 1 6 4 3 7 3 7 1 0 7 4 1 6 8 9 9 7 9 6 2 7 6 3 7 0 1
31 1 5 8 1 0 4 3 9 2 4 5 6 6 8 2 2 3 1 2 8 4 5 9 1 7 4 7 6 7 1 6 1 8 0 4 6 2 9
32 3 2 2 2 1 1 4 5 8 0 2 4 5 8 3 3 0 9 3 9 8 9 6 9 8 8 4 5 9 8 1 3 3 5 8 9 0 6
33 6 5 4 6 5 9 5 1 0 0 1 4 2 7 7 7 7 8 0 3 2 7 7 2 8 7 5 8 1 3 8 7 6 4 0 0 2 6
34 5 0 8 7 8 1 3 5 1 4 6 1 5 5 6 6 0 3 5 5 0 3 6 5 4 1 4 1 4 0 6 9 5 2 2 0 5 5

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 58 -

Como usar a tabela de números aleatórios


; 1º Numerar todos os elementos da população N;
; 2º Determinar as combinações dos algarismos. Exemplo: se o último número da população for 80, devem ser lidos
números de dois algarismos; se o último for 456, devem ser lidos números de três algarismos, e assim por diante;
; 3º Escolher um ponto de partida arbitrário da tabela. A leitura pode ser feita horizontalmente →← (da direita para a
esquerda ou vice-versa), verticalmente ↓↑ (de cima para baixo ou vice-versa), diagonalmente ↗↙↖↘ (no sentido
ascendente ou descendente) ou formando uma letra. A opção, porém, deve ser feita antes de iniciado o processo;
; 4º Descartar os números maiores que o tamanho da população e/ou numeral repetido;
; 5º Usar os números escolhidos para identificar os elementos da população.

EXEMPLO. Uma empresa pecuária possui uma população de novilhos de tamanho N = 80 e precisa retirar
amostras de tamanho n = 12 (15% da população) para fazer exame de uma doença. Utilize o método de
amostragem aleatória simples, considerando a tabela, a partir da 4ª linha, coluna D, sentido horizontal, da
esquerda para direita (→).
SOLUÇÃO. Como a população N=80 tem dois algarismos, combinamos dois algarismos na tabela,
descartando os números repetidos e os números que não pertencem a população (Ex.: 81, 95,...).
Este procedimento é repetido até a amostra de tamanho n=12 ser escolhida. Então:

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l
1 9 3 3 1 2 1 6 6 3 3 9 0 7 0 4 0 4 4 1 3 8 1 6 5 8 8 9 8 6 5 0 6 3 3 1 2 4 8
2 0 7 6 8 1 4 5 0 5 8 6 6 1 4 2 6 7 5 6 0 5 7 7 9 6 3 2 6 3 4 5 9 8 6 5 2 1 1
3 6 5 1 5 3 4 4 2 3 7 9 1 4 8 5 8 7 2 4 7 3 7 0 6 2 2 1 3 5 0 8 9 4 7 1 6 4 4
4 9 7 0 2 6 7 3 2 6 7 4 9 1 6 2 7 7 8 6 8 4 7 8 1 5 7 1 2 6 6 6 3 5 6 0 8 2 1
5 5 5 6 5 1 6 4 8 3 3 1 5 3 8 8 2 3 8 8 7 7 4 5 0 4 5 1 8 7 2 3 2 9 6 4 7 7 9
6 8 3 4 8 8 3 8 0 6 4 8 2 3 5 2 5 3 7 1 7 6 8 2 9 5 3 4 3 7 0 3 9 7 0 1 5 7 2
Amostras escolhidas
n= 26 73 74 62 77 78 15 71 66 35 60 56
Descartadas por repetição: Descartadas por não pertencer à população:
26 26 15 91 86 84 82

Amostragem Estratificada – É aquela na qual dividimos a população em subgrupos (estratos) de idênticas


características e retiramos amostras aleatórias simples dos subgrupos.

Às vezes, a população é heterogênea (ex.: sexo masculino e feminino; peça A, B e C) e a amostra aleatória simples não
apresentaria esta heterogeneidade. Seria, então, necessário homogeneizar as amostras em grupos, estratos. Neste caso
recorremos à amostragem aleatória estratificada. “Estratificar” sugere “formar-se em camadas”.
Exemplo. A estratificação mais simples que encontramos na população do rebanho de tamanho N=80 é a divisão
entre novilhos e novilhas. Supondo que haja 35 novilhos e 45 novilhas, teremos a seguinte formação dos estratos:

População (80)

Estrato 1 Estrato 2

Novilhos (35) Novilhas (45)

São, portanto, dois estratos (novilhos e novilhas). Como queremos uma amostra de tamanho n=12 (15% da população), por
estrato, temos:

Rebanho População 15% Amostra Número de


Novilho (estrato 1) 35 35*0,15 = 5,25 5 amostras
Novilha (estrato 2) 45 45*0,15= 6,75 7 estratificadas
TOTAL 80 80*0,15 = 12 12

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 59 -

O próximo passo é extrair as amostras dentro de cada estrato. Então, numeramos o rebanho de 01 a 80, sendo que de 01 a 35
correspondem novilhos e de 36 a 80, as novilhas. Tomando na tabela de números aleatórios, a partir da 4ª linha, coluna D,
sentido horizontal, da esquerda para direita (→), obtemos os seguintes números:

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l
1 9 3 3 1 2 1 6 6 3 3 9 0 7 0 4 0 4 4 1 3 8 1 6 5 8 8 9 8 6 5 0 6 3 3 1 2 4 8
2 0 7 6 8 1 4 5 0 5 8 6 6 1 4 2 6 7 5 6 0 5 7 7 9 6 3 2 6 3 4 5 9 8 6 5 2 1 1
3 6 5 1 5 3 4 4 2 3 7 9 1 4 8 5 8 7 2 4 7 3 7 0 6 2 2 1 3 5 0 8 9 4 7 1 6 4 4
4 9 7 0 2 6 7 3 2 6 7 4 9 1 6 2 7 7 8 6 8 4 7 8 1 5 7 1 2 6 6 6 3 5 6 0 8 2 1
5 5 5 6 5 1 6 4 8 3 3 1 5 3 8 8 2 3 8 8 7 7 4 5 0 4 5 1 8 7 2 3 2 9 6 4 7 7 9
6 8 3 4 8 8 3 8 0 6 4 8 2 3 5 2 5 3 7 1 7 6 8 2 9 5 3 4 3 7 0 3 9 7 0 1 5 7 2
Temos, então:
1 a 35 → Novilhos n =5 26 15 35 31 23
36 a 80 → Novilhas n =7 73 74 62 77 78 71 66
Descartados

; Como é provável que a variável em estudo apresente, de estrato para estrato, um comportamento heterogêneo
e, dentro de cada estrato, um comportamento homogêneo, convém que a amostragem seja feita por estratos.
Portanto, a amostragem estratificada é, em geral, usada para reduzir a variação nos resultados.
Notas importantes
; A amostragem estratificada é mais eficiente do que a amostragem aleatória simples, uma vez que fica
sobre este tipo de assegurada a representatividade de elementos ao longo de toda a extensão da população. A homogeneidade de
amostragem itens dentro de cada estrato proporciona maior precisão. Da mesma maneira, em um sistema produtivo,
podemos estratificar as amostras em, por exemplo, peça A, peça B, peça C e assim por diante.

Amostragem por Conglomerado- É aquela em que dividimos a população em pequenos grupos


(conglomerados), e retiramos amostras aleatórias simples dos conglomerados.

Normalmente usado para amostras grandes. É um método muito usado por motivos de ordem econômica e prática.
Imagine uma população de 8.000 na qual se queira uma amostra de 400 elementos. É inviável usar os outros métodos pois
implicaria em muito trabalho enumerar e escolher um a um.

Exemplo. Na população de 8.000 novilhos, divida em 10 conglomerados e extraia uma amostra de tamanho 2.400,
Partindo da 1ª linha, coluna A, sentido horizontal e da esquerda para direita (→) da tabela aleatória.

8000
1º passo. Determine o número de elementos para cada conglomerado: / 10 = 800 novilhos por conglomerado

População (8.000)
800 novilhos para cada conglomerado

Conglomerado 1 Conglomerado 2 Conglomerado 3 Conglomerado 4 Conglomerado 5

Conglomerado 6 Conglomerado 7 Conglomerado 8 Conglomerado 9 Conglomerado 10

2º passo: Determine o número de algarismos que serão usados na tabela aleatória:


Como são 10 conglomerados, a contagem pela tabela aleatória será 1 - 10

3º passo: Determinar o número de conglomerados amostrados


Como queremos 2.400 novilhos, então serão 3 conglomerados , pois 800 + 800 + 800 = 2.400 novilhos

4º passo. Usar a tabela e selecionar as amostras. Então:


Partindo da 1ª linha, coluna A, sentido horizontal e da esquerda para direita (→) da tabela aleatória, temos, então:
Conglomerados selecionados: 06 07 02

Agora, é só coletar todos os elementos desses conglomerados selecionados e estudar todos os itens.
Uma amostra por conglomerado é uma amostra aleatória simples na qual cada unidade de amostragem é um grupo de
elementos. Uma das principais aplicações da amostragem por conglomerados é a amostragem por áreas geográficas,

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 60 -

como cidades, municípios, setores de uma empresa, quarteirões de cidades, domicílios, território de vendas etc. Segundo
Levine et al (2008, p. 222) e Anderson et al (2009, p.263) a amostragem por conglomerados têm as seguintes
características:

; Todos os elementos contidos em cada conglomerado amostrado formam a amostra;


; Cada conglomerado é uma versão representativa em pequena escala da população inteira;
; Tende a produzir melhores resultados quando os elementos neles contidos não são similares;
; De um modo geral, é mais eficaz em termos de custo do que a amostragem aleatória simples, particularmente se a
população estiver dispersa ao longo de uma extensa área geográfica. Entretanto, a amostragem por conglomerado
geralmente demanda um maior tamanho de amostra para que sejam produzidos resultados tão precisos quanto
aqueles que seriam obtidos da amostragem aleatória simples ou estratificada.

Segundo Triola (2008, p. 23) outro exemplo de amostra por conglomerado pode ser encontrado nas pesquisas eleitorais,
onde selecionamos aleatoriamente 30 zonas eleitorais dentre um grande número de zonas e, em seguida,
entrevistamos todos os eleitores daquelas seções (zonas selecionadas). Isso é muito mais rápido e muito menos
dispendioso do que selecionar uma pessoa de cada uma das zonas na área populacional.

É fácil confundir amostragem estratificada com a amostragem por conglomerado, porque ambas envolvem
ATENÇÃO! a formação de grupos. Porém, a amostragem por conglomerado usa todos os elementos de um grupo
selecionado, enquanto a amostragem estratificada usa amostras de elementos de todos os estratos.

Figura. Amostragem
por Conglomerados
em quarteirões de um
bairro.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 61 -

Amostragem Sistemática - É a técnica de amostragem em que retiramos os elementos da população


periodicamente, definida pelo pesquisador.

Utilizamos este tipo de amostragem quando os elementos de uma população se encontram ordenados, por exemplo, a coleta
de amostras de um determinado produto em uma linha de produção.

Coleta de Amostras Amostras

Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador.
Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra
da produção diária. Neste caso, estaríamos fixando o tamanho amostral de 10% da população.

Uma amostragem é sistemática quando a retirada dos elementos da população é feita periodicamente, sendo o intervalo de
seleção calculado, por meio da divisão do tamanho da população pelo tamanho da amostra a ser selecionada, ou seja: N / n

EXEMPLO. Deseja-se retirar uma amostra de n = 10 unidades de peças de uma população de tamanho N = 800. O
800
intervalo de seleção é, então, /10 = 80. Desse modo, escolhemos um número de 1 a 80, o qual indicaria o primeiro
elemento sorteado para amostra; os demais seriam periodicamente considerados de 80 em 80. Partindo da 1ª linha,
coluna A, sentido horizontal e da esquerda para direita (→) da tabela aleatória:

o primeiro elemento será 31 (tabela aleatória) e os demais obtidos por progressão aritmética: 111, 191, 271, 351, 431, 511,
591, 671 e 751.

O ESQUEMA ABAIXO PERMITE UM MELHOR ENTENDIMENTO:

População = 800 800 = 80 1 - 80


Amostra = 10 10

Amostra 1 2 3 4 5 6 7 8 9 10

+80 +80 +80 +80 +80 +80 +80 +80 +80


Nº da peça 31 111 191 271 351 431 511 591 671 751

Outros métodos de amostragens (não probabilísticos)


Amostragem por julgamento – A pessoa que conhece mais profundamente o tema do estudo escolhe os elementos que julga
serem mais representativos da população. Por exemplo, um repórter pode tomar como amostra dois ou três senadores,
julgando que eles refletem a opinião geral de todos os senadores. A qualidade dos resultados depende do julgamento da
pessoa que a seleciona.

Amostragem por conveniência – a amostra é identificada primeiramente por conveniência (cômodo, útil, favorável). Como
exemplo estudantes de uma universidade voluntários para compor uma amostra de uma determinada pesquisa escolar.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 62 -

DISTRIBUIÇÕES AMOSTRAL DA MÉDIA


Nesta seção, você vai estudar a relação entre uma Média da população e as Médias das amostras tiradas da população. Uma distribuição
amostral é uma distribuição de probabilidade de uma estatística (tal como a média e o desvio padrão) de uma amostra, que é formada quando
amostras de tamanho n são repetidamente colhidas de uma população.

Distribuição amostral de média das amostras


Exemplo 1. Seja uma população com os seguintes elementos: N = {1,3,5,7}. Ao listar todas as amostras possíveis desta
população de n = 2 elementos, e calcular a média de cada amostra, teremos:
Amostra x̄ Amostra x̄ Amostra x̄ Amostra x̄
N=4 n=2
1,1 1 3,1 2 5,1 3 7,1 4
1,3 2 3,3 3 5,3 4 7,3 5
Nn = 42 = 16 amostras
1,5 3 3,5 4 5,5 5 7,5 6
possíveis.
1,7 4 3,7 5 5,7 6 7,7 7

POPULAÇÃO. Calcule a média (µ) e o desvio padrão (σ) da população:


µ = ∑x → 1+ 3 + 5 + 7 = 4
N 4

σ2 = ∑(x - µ)2 → (1 - 4)2 + (3 - 4)2 + (5 - 4)2 + (7 - 4)2 = 5 σ= 5 → 2,236


N 4

AMOSTRA. Calcule a média (µ x̄) e o desvio padrão (σx̄ ) das médias das amostras:
µ x̄ = ∑x → 1+2+3+4+2+3+4+5+3+4+5+6+4+5+6+7 = 4
N 16

σ2x̄ = ∑(x - µx̄)2 → (1 - 4)2 + (2 - 4)2 + . . . + (6 - 4)2 + (7 - 4)2 = 2,5 σx̄ = 2,5 → 1,581
N
16
Se aplicarmos σ o resultado é o mesmo: 2,236 → 1,581 (erro padrão da
n 2 média)

CONCLUSÃO: A média das médias das amostras é igual a média da população: µx̄ = µ. Isso não é uma coincidência, sendo uma propriedade
da distribuição amostral das médias das amostras. O desvio padrão das médias das amostras é menor que o desvio padrão da população e a
equação σ / n é denominada erro padrão da média, pois mede a variação entre as médias amostrais e dá uma idéia do erro que se comete
ao se substituir a média da população pela média da amostra.

média da amostra erro padrão da média (ou margem de erro E)


σx̄ σ ou s (caso não tenha σ)
=
x̄ = µ n n
O erro padrão da média tem o mesmo conceito de um desvio padrão; ambos representam uma distância da média. Os valores da população
original desviam-se uns dos outros graças a um fenômeno natural (as pessoas têm diferentes alturas, pesos, etc.), portanto temos o desvio
padrão para medir sua variabilidade. As médias amostrais variam por causa do erro que ocorre por não sermos capazes de realizar um censo e
temos que coletar amostras, portanto temos o erro padrão da média para medir a variação das médias amostrais.

Distribuição normal e a distribuição amostral (Teorema Central do Limite)


Elaborando a distribuição de probabilidade para a média das amostras acima e representando-as por um histograma, percebe-se que tem o
formato de uma curva normal. De acordo com o Teorema Central do Limite, amostras n < 30 se aproximam da distribuição normal, enquanto
que amostras n > 30 tem distribuição normal. Estatísticos chegaram a esta conclusão após investigações/simulações de uma grande
variedade de populações e de tamanhos de amostras.

x̄ f P(x̄) Então, podemos usar a Distribuição Normal.


Podemos encontrar a probabilidade de que a
1 1 0,06 MÉDIA DA AMOSTRA caia em um dado
2 2 0,12 intervalo da distribuição amostral. Para
3 3 0,18 transformar x em um z-escore, use a equação:
4 4 0,25
5 3 0,18
6 2 0,12
7 1 0,06
∑f =16

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 63 -

Diferenciando Distribuição Normal e o Teorema Central do Limite


Exemplo 1. Após vários anos de estudos, um gerente concluiu que a idade dos clientes que frequentam um
restaurante é normalmente distribuída, com média de 28 anos e desvio padrão de 3 anos.
a) Ache a probabilidade de um cliente ter idade entre 27 e 29 anos, isto é, P(27 < z < 29).
Ao lidar com um valor individual de uma população normalmente distribuída, use os métodos da distribuição normal já estudados. Então:
P(x) procurada
P(27 < Z < 29) P= 0,2586 Neste caso, calculamos dois escores Z e somamos
z= x - x as probabilidades:
0,1293 0,1293 s
Z1 = 27 - 28 = 0,33 → 0,1293
3
Z2 +
0,33
Z2 = 29 - 28 = 0,33 → 0,1293
Z1
0,33 3
= 0,2586

19 22 25 28 31 34 37

Interpretação: Espera-se que 25,86% dos clientes tenham idade entre 27 e 29 anos.
b) O gerente seleciona uma amostra aleatória de 32 clientes. Ache a probabilidade de que a idade média dos
clientes esteja entre 27 e 29 anos.
Eis aqui um ponto realmente importante. Não estamos lidando com probabilidades para valores individuais. Agora, o que estamos
procurando é a probabilidade de que a média amostral caia em determinado intervalo. Estão, usaremos a regra do teorema central do
limite. Não usamos o desvio padrão de 3 do exemplo a), mas sim o erro padrão da média s n. Veja a diferença no gráfico abaixo.

σx̄ 3 = 0,53
z = x σ-
=
x Neste caso, calculamos dois escores Z e somamos
32 as probabilidades:

Média amostral
n Z1 = 27 - 28 = 1,88 → 0,4699
procurada 3
32
+
27 29 Z1 = 27 - 28 = 1,88 → 0,4699
26,41
3
Z2 26,94 27,47 28 28,53 29,06 29,59
0,5
32
19 22 25 28 31 34 37 0,9398
Idade média dos clientes
Interpretação: Há uma probabilidade de 93,98% dos 32 clientes do restaurante terem idade média entre 27 e 29 anos.
Exemplo 2. Um auditor de banco declara que as contas de cartões de crédito são normalmente distribuídas, com uma
média de R$ 2.870 e um desvio padrão de R$900. Uma amostra de 25 cartões de crédito é selecionado ao acaso.
Qual a probabilidade de que a média da conta deles seja menor que R$2.600?

σx̄ =
900 = 180, então:
z = x σ- x
25
Probabilidade procurada n
P(Z < 2600) para amostra Neste caso, calculamos dois escores Z e
de 25 cartões subtraímos as probabilidades:

P1 = 0,5
-
Z2 = 2600 - 2870 =1,5 → 0,4332
900 1
25
0,0668

2.330 2.510 2.690 2.870 3.770 3.950 4.130

Interpretação: Espera-se que 6,68% dos cartões de crédito tenham média menor que R$2.600.
Nota: Os conceitos que vimos são aplicados quando a população é infinita, a amostragem é com reposição e as variáveis aleatórias são independentes. No exemplo
1 a população é infinita (quantos clientes são do restaurante?) as amostras são independentes ( aparecer um cliente com certa idade, independe da ocorrência
anterior). Quando a população é finita (pequena), a amostragem é sem reposição e as variáveis aleatórias são dependentes, aplicamos um fator de correção:
σ N − n onde N é o tamanho da população e n é o tamanho da amostra.
n N −1

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 64 -

ESTIMATIVAS E TAMANHOS AMOSTRAIS


ESTIMAÇÃO PONTUAL E INTERVALAR
Uma das maiores utilidades da estatística é chutar um valor (o termo estatístico é estimação), como exemplo: qual é a renda
média de uma família brasileira? Qual a expectativa de vida média de um brasileiro? Qual a eficácia de um novo remédio?
Todas essas perguntas necessitam de algum tipo de estimativa numérica para respondê-las. São dois tipos de estimação, onde
utilizamos dados estatísticos da amostra como estimadores dos parâmetros populacionais: Estimativa pontual e Intervalar.

Estimativa pontual. Fazemos uma única estimativa (um valor) para um determinado parâmetro populacional.
Exemplo conceitual Exemplo prático: Expectativa de vida de um brasileiro:
estimar estimar
Média amostral ⎯⎯ ⎯
⎯→ Média populacional Média amostral ⎯⎯ ⎯
⎯→ Média populacional
(x̄ = 70 anos) (µ = 70 anos)

Estimativa intervalar. Fazemos uma estimativa de um intervalo de valores possíveis, no qual se admite esteja o parâmetro
populacional.
Exemplo conceitual Exemplo prático: Expectativa de vida de um brasileiro:
estimar estimar
Média amostral x̄ ⎯→ Média populacional ± x̄
⎯⎯ ⎯ Média amostral ⎯⎯ ⎯
⎯→ Média populacional
(x̄ = 70 anos) (µ = 60 a 80 anos)
A melhor maneira de estimar o parâmetro é por meio de uma estatística com margem de erro para mais ou para menos. A finalidade de uma
estimativa por intervalo é fornecer informações sobre quão próximo a estimativa pontual, produzido pela amostra, está do valor do parâmetro.

INTERVALOS DE CONFIANÇA - IC

Um intervalo de confiança é uma faixa (ou um intervalo) de valores usada para se estimar o verdadeiro
valor de um parâmetro populacional, com certa probabilidade. Geralmente é abreviado por “IC”.
A palavra intervalo é usada porque seu resultado se torna um intervalo. A palavra confiança é usada porque você possui certa confiança no
processo pelo qual você chegou ao intervalo. Isso se chama nível de confiança (ou credibilidade). O intervalo de confiança associa-se a um nível
de confiança, geralmente 95%., que é a probabilidade de que o intervalo estimado contenha o parâmetro populacional. Usamos o Intervalo de
confiança porque a estimativa pontual não indica quão boa é nossa melhor estimativa. Como a estimativa pontual tem a séria falha de não
revelar quão boa ela é, os estatísticos desenvolveram o IC.

Intervalos de Confiança para média (amostras grandes) (amostra n > 30)


O intervalo de confiança baseia-se na hipótese de que a distribuição das médias amostrais é normal. Então, o nível de confiança
pode ser determinado com base nas probabilidades da distribuição normal:

Nível de confiança 0,95 A equação do intervalo de confiança para


média é dado por:
s
ICμ = x ± z
0,95
/2 n
Ao usar o nível de confiança de 95%, temos:
0,95
/2 = ± 0,4750 → Z= ±1,96
- 0,4750 + 0,4750
s
Logo: IC μ = x ± 1,96
n
z= - 1,96 x̄ z= + 1,96

Pode-se usar outros níveis de confiança:


Confiança desejada Escore “Z” (da tabela padrão) Equação
s
90% P= 0,4500 → z = 1,65 ICμ = x ± 1,65
n
s
99% P= 0,4950 → z = 2,58 ICμ = x ± 2,58
n

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 65 -

Mas, de onde vem 0,4750 e 1,96? Observe na tabela de Distribuição Normal Padrão que, se queremos ter 95% de confiança,
basta encontrar a probabilidade de 0,4750 (0,95/2). Então, identificamos o escore z, que é de 1,96.

TABELA DE DISTRIBUIÇÃO NORMAL PADRÃO


Z Último dígito
0 1 2 3 4 5 6 7 8 9

Z = 1,96 para
95% de confiança

Se queremos ter 90% de confiança, basta encontrar 0,4500 (0,90/2) na tabela. Como não temos 0,4500, então identificamos a
probabilidade mais próxima, que é 0,4505. Observe que o escore z é de 1,65.
Exemplos de cálculos de Intervalos de Confiança - IC
1. De uma amostra de 40 clientes que frequentam um restaurante, constatou-se que a idade média é de 28 anos com
desvio padrão de 9 anos. Construa um intervalo de confiança de 95% para a idade média da população.

n = 40 25,21 30,79
x̄ = 28 s = 28 ± 1,96 9 = 28 ± 2,79
- 2,79 +2,79
ICμ = x ± z
s=9 n 40 24 25 26 27 28 29 30 31 32
z = 1,96
Interpretação: Você está 95% confiante que a idade média dos clientes que frequentam o restaurante está entre 25,21 anos e 31,79 anos.

2. Um analista de produção deseja estimar a média do tempo de vida útil das lâmpadas produzidas. Para tanto,
coletou uma amostra de 60 lâmpadas e verificou que a média de vida útil é de 1000 horas, com desvio padrão de 100
horas. Construa um intervalo de confiança de 90% para a média populacional.

n = 60 978,70 1021,30
x̄ = 1000 s = 1000 ± 1,65 100 = 1000 ± 21,30 - 21,30 +21,30
ICμ = x ± z
s = 100 n 60
z = 1,65 970 980 990 1000 1010 1020 1030

Interpretação: Você está 90% confiante que a média do tempo de vida útil das lâmpadas produzidas está entre 978,70 horas e 1021,30 horas.
Nota: Quando a população for finita a equação precisa ser ajustada. Se n ≥ 0,05N, a equação é s N − n , onde N = população.
IC = x ± z
n N −1

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 66 -

Determinação do tamanho da amostra


Para a mesma amostra estatística, conforme o nível de confiança aumenta, o intervalo de confiança fica mais largo. Como
consequência, a precisão da estimativa decresce. Veja comparação abaixo:
Do exemplo 2 (página anterior) com 90% de confiança Do exemplo 2 (página anterior) mas com 95% de confiança
100 = 1000 ± 21,30 100 = 1000 ± 25,30
1000 ± 1,65 1000 ± 1,96
60 60
974,70 1025,30
- 25,30 +25,30
978,70 1021,30
- 21,30 +21,30 970 980 990 1000 1010 1020 1030
970 980 990 1000 1010 1020 1030 Quanto maior a confiança, maior será o intervalo

Uma maneira de aumentar a precisão de uma estimativa sem decrescer o nível de confiança é aumentar o tamanho da
amostra. Mas, qual o tamanho da amostra necessário para garantir certo nível de confiança para uma margem de erro E dada?

Da equação do intervalo de confiança, podemos formar a equação da determinação do tamanho da amostra.


s ∴ s ∴ E n = z*s ∴ z*s Equação da determinação do tamanho da amostra
ICμ = x ± z E=z n=
n E 2 n = tamanho da amostra
⎛ z •s ⎞
n
n =⎜ ⎟
z = escore desejado “normal”
E = margem de erro
⎝ E ⎠ s = desvio padrão
E = margem de erro
Calculando o tamanho da amostra.
(Mesmo exemplo anterior) Um analista de produção deseja estimar a média do tempo de vida útil das lâmpadas
produzidas. Para tanto, coletou uma amostra de 60 lâmpadas e verificou que a média de vida útil é de 1000 horas,
com desvio padrão de 100 horas. Construa um intervalo de confiança de 90% para a média populacional.
n = 60 s = 1000 ± 1,65 100 = 1000 ± 21,30 978,70 1021,30
ICμ = x ± z - 21,30 +21,30
x̄ = 1000 n 60
s = 100 E = margem de erro
z = 1,65 970 980 990 1000 1010 1020 1030

A margem de erro foi E=21,30. O analista deseja aumentar a precisão do Intervalo de Confiança com uma
margem de erro E = 15. Quantas lâmpadas devem ser incluídas na amostra se ele quer estar 90% confiante?
n=?
2 2
z = 1,65 ⎛ z •s ⎞ → ⎛⎜
1,65*100⎞ = 121 lâmpadas. Interpretação: 60 lâmpadas já foram
s = 100 n =⎜ ⎟ ⎟ coletadas, então o analista precisa de mais 61.
⎝ E ⎠ ⎝ 15 ⎠
E = 15

Intervalos de Confiança para média (amostras pequenas) (amostra n ≤ 30)


Para amostras pequenas (n ≤ 30), a distribuição Normal apresenta valores menos precisos, o que nos leva a utilizar um
modelo melhor, a Distribuição t de Student (veja tabela próxima página), proposta pelo pesquisador Willian Gosset em 1908.
9 A distribuição t também tem a forma normal e é simétrica sobre a média. A principal diferença é que a distribuição t tem mais áreas nas
caudas, fazendo com que seus valores críticos sejam maiores que os da distribuição Normal. Como consequência, o intervalo de
confiança usando a distribuição t ficará mais largo se usa-se a distribuição Normal. A idéia aqui é que você deve pagar um preço por
trabalhar com pequenas amostras.
Intervalo mais
Normal n = 15 t de Student n = 15 largo com t

9 Cada tamanho amostral possui sua própria distribuição t, ou seja, ao contrário da distribuição normal, a distribuição t não tem forma
fixa, mas sim uma família de curvas. Cada curva é determinada por um parâmetro chamado grau de liberdade, encontrado pelo
tamanho da amostra menos um. A idéia aqui é que o preço a ser pago por se ter uma amostra muito pequena, como 5, é mais alto do
que o preço por se ter uma amostra de tamanho um pouco maior, como 10 ou 20.

g.l. = n - 1. Graus de liberdade Portanto, a distribuição t varia de acordo com o tamanho da amostra.
9 O grau de liberdade se refere ao número de valores que são livres para variar após estabelecerem algumas restrições de dados. Por
exemplo, se uma amostra de tamanho 4 produz uma média de 87, sabemos que a soma dos números é 4 * 87 = 348; isso não diz nada
sobre os valores individuais da amostra – há números infinitos de formas para se obter 4 números que somem 348; mas quando
escolhemos três deles, o quarto é determinado. O primeiro número pode ser 84, o segundo 98 e o terceiro 81, então o quarto tem de ser
85, o único número que produzirá a média amostral conhecida, ou seja, existe n - 1 ou 3 graus de liberdade nesse exemplo.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 67 -

9 Conforme os graus de liberdade aumentam, a distribuição t se aproxima da distribuição normal. Depois de 30 g.l., a distribuição t está
muito próxima à distribuição normal.

Curva t: quanto menor a amostra,


Família de curvas da Distribuição t: mais achatada e larga nas
- Quanto menor o tamanho da amostra, maior o erro. extremidades, em função do erro
- Quando amostra >30, aproxima-se da distribuição normal

Encontrando valores de t na tabela TABELA DISTRIBUIÇÃO t DE STUDENT (PARCIAL)


Nível de confiança
Exemplo. Encontre o valor de t para uma confiança de 95%, g.l.
quando o tamanho da amostra é 15. 50% 80% 90% 95% 98% 99%
1 1,000 3,078 6,314 12,71 31,82 63,66
1º - Determine o grau de liberdade – g.l.
2 0,816 1,886 2,920 4,303 6,965 9,925
em razão de n=15, os graus de liberdade são:
3 0,765 1,638 2,353 3,182 4,541 5,841
g.l. = n – 1 → 15 – 1 = 14 4 0,741 1,533 2,132 2,776 3,747 4,604
5 0,727 1,476 2,015 2,571 3,365 4,032
2º - encontrar o g.l. = 14 na tabela t.
6 0,718 1,440 1,943 2,447 3,143 3,707
Usando g.l.=14 e confiança de 95%, Você pode ver que t = 2,145,
como destacado na tabela. 7 0,711 1,415 1,895 2,365 2,998 3,499
8 0,706 1,397 1,860 2,306 2,896 3,355
Construindo Intervalo de Confiança - IC. 9 0,703 1,383 1,833 2,262 2,821 3,250
Construir um IC usando a Distribuição t é similar a construir um IC 10 0,700 1,372 1,812 2,228 2,764 3,169
usando a Distribuição Normal – ambos usam uma estimativa 11 0,697 1,363 1,796 2,201 2,718 3,106
pontual e uma margem de erro. Sua equação é dada por: 12 0,695 1,356 1,782 2,179 2,681 3,055
EQUAÇÃO DISTRIBUIÇÃO t 13 0,694 1,350 1,771 2,160 2,650 3,012
s Onde substituimos
14 0,692 1,345 1,761 2,145 2,624 2,977
ICμ = x ± t 15 0,691 1,341 1,753 2,131 2,602 2,947
n z por t
16 0,690 1,337 1,746 2,120 2,583 2,921
17 0,689 1,333 1,740 2,110 2,567 2,898
Exemplo. Um analista deseja estimar a média do tempo de
vida útil das lâmpadas produzidas. Coletou uma amostra de 18 0,688 1,330 1,734 2,101 2,552 2,878
20 lâmpadas e verificou que a média de vida útil é de 1000 19 0,688 1,328 1,729 2,093 2,539 2,861
horas, com desvio padrão de 100 horas. Construa um 20 0,687 1,325 1,725 2,086 2,528 2,845
Intervalo de Confiança de 90% para a média populacional. 21 0,686 1,323 1,721 2,080 2,518 2,831
Solução: 22 0,686 1,321 1,717 2,074 2,508 2,819
g.l = n – 1 → 20 - 1 = 19. Usando g.l.=19 e confiança de 90%, o 23 0,685 1,319 1,714 2,069 2,500 2,807
valor t será 1,729 (destacado na tabela). Ao se calcular o IC, 24 0,685 1,318 1,711 2,064 2,492 2,797
teremos, então: 25 0,684 1,316 1,708 2,060 2,485 2,787
n = 20 100 26 0,684 1,315 1,706 2,056 2,479 2,779
x̄ = 1000 IC = 1000 ± 1,729 27 0,684 1,314 1,703 2,052 2,473 2,771
20
s = 100 28 0,683 1,313 1,701 2,048 2,467 2,763
t = 1,729
IC = 1000 ± 38,66
29 0,683 1,311 1,699 2,045 2,462 2,756
961,34 1038,66 0,674 1,282 1,645 1,960 2,326 2,576
- 38,66 +38,66
Nota: Para n > 30, você pode usar a distribuição normal. Quando o
desvio padrão populacional for conhecido (σ), mesmo com amostra
970 960 980 1000 1020 1040 1060 menor que 30, você pode usar a distribuição normal. A distribuição t
também pode ser usada para amostra maior que 30.
Interpretação: Você está 90% confiante que a média do tempo de vida útil
das lâmpadas produzidas está entre 961,34 horas e 1038,66 horas.

Observe que, no exemplo anterior com amostra de 60 lâmpadas e usando a curva normal, o IC foi mais preciso: 1000 ± 21,30 .

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 68 -

Intervalos de Confiança para Proporções P


O termo PROPORÇÕES tem relação com PORCENTAGENS. É a parte de um todo, em comparação com esse todo; fração.
Exemplo:
Um Analista Industrial fez estudo para determinar a proporção de lâmpadas defeituosas produzidas. Coletou
uma amostra de 400 lâmpadas e 60 apresentaram defeitos. Neste caso, temos as seguintes proporções:
Lâmpadas defeituosas (60) Lâmpadas perfeitas (restantes = 340)

ˆp = 60 = 0,15 ˆp = 340 = 0,85


400 400
Então, 15% das lâmpadas estão defeituosas... ...e 85% das lâmpadas estão perfeitas

Observe que a população é constituída por elementos de dois tipos, isto é, cada elemento pode ser interpretado como Sucesso e
Fracasso, além dos eventos ser independentes. Nestas condições, a variável aleatória segue uma distribuição Binomial.
De acordo com Teorema do Limite Central, para amostra suficientemente grande (n > 30), a distribuição Binomial aproxima-se a uma
distribuição Normal. Daí é imediato verificar que a proporção amostral p também aproxima-se da distribuição normal.
Ocorre que, da mesma forma que o intervalo de confiança para média, frequentemente estamos interessados em estimar um intervalo
de confiança para proporções populacionais.

Construindo Intervalo de Confiança para Proporções p


Construir um intervalo de confiança para uma proporção populacional p é similar a construir um intervalo de confiança para a média
populacional. Você começa com um ponto estimado e calcula a margem de erro E.
Equação do Intervalo de Confiança para Proporção p
z = escore z da distribuição normal
ˆp( 1 − ˆp )
IC p = ˆp ± z
n = tamanho da amostra
n p̂ - proporção estimada.
A formação desta equação tem como princípio o método “Normal como
aproximação da Binomial”

Exemplo. Um Analista Industrial deseja estimar a proporção de lâmpadas defeituosas produzidas. Coletou uma
amostra de 400 lâmpadas e verificou que 15% estão defeituosas. Construa um Intervalo de Confiança de 95%
para a proporção populacional.

p̂ = 0,15 11,6% 18,4%


0,15( 1 − 0,15 ) - 3,4% +3,4%
n = 400 IC p = 0,15 ± 1,96 = 0,15 ± 0,034
400
z = 1,96 11% 13% 15% 17% 19%

Interpretação: Você está 95% confiante que a proporção de lâmpadas defeituosas está entre 11,6% e 18,4%.

Determinação do tamanho da amostra para P


Uma forma de aumentar a precisão do intervalo de confiança sem diminuir o nível de confiança é aumentar o número da
amostra. Dado o intervalo de confiança IC e a margem de erro E, o tamanho mínimo da amostra n necessário para estimar p é:
Equação da determinação do tamanho da amostra para estimar p
n = tamanho da amostra
2
⎛ z ⎞ z = escore desejado da distribuição normal
n = ˆp(1− ˆp) ⎜ ⎟ p̂ = proporção estimada
⎝ E⎠
E = margem de erro

(Continuação exemplo anterior). Um Analista Industrial coletou uma amostra de 400 lâmpadas e verificou que
15% estão defeituosas. Construiu um IC com 95% de Confiança e margem de erro E = 0,034. Determine o
tamanho da amostra para aumentar a precisão com margem de erro E = 0,02, e com a mesma confiança.

p̂ = 0,15 n=? 2 2
⎛z⎞ ⎛ 1,96 ⎞
z = 1,96 n = ˆp(1− ˆp) ⎜ ⎟ → 0,15(1− 0,15) ⎜ ⎟ = 1.224 lâmpadas.
E = 0,02 ⎝ E⎠ ⎝ 0,02⎠

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 69 -

Intervalos de Confiança para o Desvio Padrão


Na produção industrial, é necessário controlar o tamanho da variação de um processo. Um fabricante de peças deve produzir, por
exemplo, milhares de peças para serem usadas no processo de fabricação. É importante que essas partes variem muito pouco ou nada.
Como medir e, consequentemente, controlar o tamanho da variação nas peças?
Para amostra n > 30 (Use a Distribuição Normal)

Segundo Spiegel (1977, p. 262,310), podemos usar a distribuição Normal para encontrar intervalos de confiança para o desvio
padrão, desde que a amostra seja maior que 30.
EQUAÇÃO do Intervalo de Confiança para o Desvio padrão
s S = desvio padrão
IC σ = s ± z Z = escore Z da distribuição Normal
2n n = tamanho da amostra

Exemplo 1. Um analista deseja estimar o desvio padrão do tempo de vida útil das lâmpadas produzidas. Para
tanto, coletou uma amostra de 60 lâmpadas e verificou que a média de vida útil é de 1000 horas, com desvio
padrão de 100 horas. Construa um intervalo de confiança de 90% para o desvio padrão populacional.
84,94 115,06
S = 100 100 - 15,06 +15,06
Z = 1,65 IC σ = 100 ± 1,65 → 100 ± 15,06
2 • 60
n = 60
80 90 100 110 120
Interpretação: Você está 90% confiante que o desvio padrão populacional está entre 84,94 horas e 115,06 horas.

Para amostra n ≤ 30 (Use a distribuição χ2)


Para amostras pequenas (n ≤ 30), a distribuição Normal apresenta valores menos precisos, o que nos leva a utilizar um
modelo melhor, a distribuição χ2 (lê-se qui-quadrado), proposta por Karl Pearson. É importante salientar que muitos autores
usam o modelo χ2 para qualquer tamanho amostral, mesmo maior que 30, sem mencionar o método opcional (acima).
2 2
9 Cada tamanho amostral possui sua própria distribuição χ , ou seja, ao contrário da distribuição normal, a distribuição χ não tem forma
fixa, mas sim uma família de curvas. Cada curva é determinada por um parâmetro chamado grau de liberdade, encontrado pelo
tamanho da amostra menos um. A idéia aqui é que o preço a ser pago por se ter uma amostra muito pequena, como 5, é mais alto do
que o preço por se ter uma amostra de tamanho um pouco maior, como 10 ou 20.

g.l. = n - 1. Graus de liberdade Portanto, a distribuição χ2 varia de acordo com o tamanho da amostra.
2 2
9 A distribuição χ tem a forma assimétrica positiva (à direita). Conforme os graus de liberdade aumentam, a distribuição χ se aproxima
2
da distribuição normal. Depois de 30 g.l., a distribuição χ está muito próxima à distribuição normal.

gl = 5 2
Família de curvas da Distribuição χ :
- Curvas assimétricas positivas
- Quanto menor o tamanho da amostra, maior o erro.
gl = 10

gl = 15 2
Curva χ com g.l = 30 aproxima-se da
curva normal.
gl = 30

Encontrando valores de χ2 na tabela


Há dois valores a serem considerados para o nível de confiança. O valor χ2L representa o valor crítico da cauda esquerda e o
valor χ2R representa o valor crítico da cauda direita.

Nível de confiança

χ2L χ2R

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 70 -

Exemplo. Encontre os valores χ2L e χ2R e um intervalo de confiança de 90%, quando o tamanho da amostra for 20.
1º - Ache o grau de liberdade – g.l. 2º - encontrar as áreas de χ2L e χ2R
Como n = 20, os graus de liberdade são: Em razão da confiança c ser 90%, temos:
χ2L = 1+c χ2R = 1 - c
g.l. = n – 1
2 2
20 – 1 = 19
χ2L = 1 + 0,90 = 0,950 χ2R = 1 - 0,90 = 0,050
2 2
3º - encontrar os valores críticos na tabela χ2
Parte da tabela χ2 é exibida abaixo. Usando g.l.=19 e as áreas 0,95 e 0,05 encontramos os valores críticos, como destacado:

χ2L χ2R 0,90

2 2
Por meio da tabela você pode ver que: χ L = 10,1170 e χ R = 30,1435.

Interpretação: Então, 90% da área sob a curva está situada entre 10,1170 e 30,1435

χ2L = 10,1170 χ2R = 30,1435


Calculando o IC para o desvio padrão
Usamos os valores críticos de χ2L e χ2R para construir o intervalos de confiança para o desvio padrão populacional.

( n − 1)s 2 ( n − 1)s 2 S = desvio padrão


< σ < n = tamanho da amostra
χ 2R χ 2L χ2R e χ2L = valores críticos da tabela do χ2

Exemplo 2. Um analista deseja estimar o desvio padrão do tempo de vida útil das lâmpadas produzidas. Para
tanto, coletou uma amostra de 15 lâmpadas e verificou que a média de vida útil é de 1000 horas, com desvio
padrão de 100 horas. Construa um intervalo de confiança de 95% para o desvio padrão populacional.

1º - Ache o grau de liberdade – g.l. 2º - encontrar as áreas de χ2L e χ2R


Como n = 15, os graus de liberdade são: Em razão da confiança c ser 95%, temos:
χ2L = 1+c χ2R = 1 - c
g.l. = n – 1 2 2
15 – 1 = 14 χ2L = 1 + 0,95 = 0,975 χ2R = 1 - 0,95 = 0,025
2 2

3º - encontrar valores críticos na tabela χ2 4º - Use a equação do desvio padrão


Usando g.l.=14 e as áreas 0,975 e 0,025, os S = 100
valores críticos são (ver tabela próxima página): (15 − 1)1002 (15 −1)1002
n = 15 < σ <
χ 2R = 26,1189 26,1189 5,6287
χ2L = 5,6287 e χ 2R = 26,1189
χ2L = 5,6287 73,21 < σ < 157,71
Interpretação: Com 95% de confiança, podemos dizer que o desvio padrão populacional está entre 73,21 horas e 157,71 horas

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 71 -

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 72 -

CAPÍTULO 5

TESTE DE HIPÓTESE

É possível testar
afirmativas acerca de
populações?

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 73 -

Conceitos introdutórios
TESTE DE HIPÓTESE é um procedimento usado para testar se a afirmação acerca de uma população é
verdadeira ou não, com base em dados amostrais.
Uma hipótese é uma suposição quanto ao valor de um parâmetro populacional. O teste de hipótese é tão somente uma regra de
decisão para ACEITAR ou REJEITAR uma hipótese qualquer (uma suposição, uma afirmação), com base nos elementos amostrais.

EXEMPLO. A FIAT afirma que o consumo de combustível do Pálio Fire é, em média, de 18 km/L. Uma revista
decide testar essa afirmação e analisa 50 veículos obtendo uma média de 17 km/L, que é diferente da informada
pelo fabricante.
9 O resultado de 17km/L não garante que a afirmação do fabricante seja falsa, pois você está se baseando em dados amostrais. Para
haver esta garantia só realizando um censo (toda a população), o que é teoricamente impossível.
9 O que devemos avaliar, com auxílio do Teste de Hipótese, é se a afirmação é verdadeira ou não, com base nos dados amostrais.

Organização das hipóteses, Erros de decisão, Nível de significância e Tipos de testes


Organização das hipóteses. Com base no exemplo, podemos formular duas hipóteses: “Nula” e “Alternativa”. Na Hipótese Nula , diremos
que a média populacional é igual aquela que se supõe verdadeira; e na Hipótese Alternativa, que nasce de uma desconfiança, diremos que a
média populacional não será igual àquela tida como verdadeira. Ora, quando um valor A não é igual a um valor B, haverá três possibilidades:
1ª) A ≠ B ou 2ª) A > B ou 3ª) A < B. Estamos falando, obviamente, da Hipótese Alternativa (Ha). Então, resumindo, temos:

Hipótese Nula: H0 → sugere que a afirmação é verdadeira. No exemplo, H0 : µ = 18 km/L


Hipótese Alternativa: Ha → sugere que a afirmação é falsa. temos que: Ha : µ < 18 km/L
As hipóteses Nula e Alternativa sempre serão confrontadas. De todo o exposto, já podemos tirar algumas conclusões:

H0 será sempre de igualdade: Ha será sempre de desigualdade:


Nota: O que definirá se Ha trará um
Ha : µ ≠ 18 km/L
H0 : µ = 18 km/L sinal ≠ ou > ou < será o resultado
Ha: µ < 18 km/L
obtido na amostra.
...e é aquela que será testada. Ha : µ > 18 km/L
Erros de decisão. Uma vez realizado o teste com a Hipótese Nula (H0), poderão advir dois resultados:

Decisão H0 é verdadeira, sendo, portanto, ACEITA.


correta H0 é falsa, devendo, pois, ser REJEITADA. → (ao rejeitar H0, obviamente aceitamos a Hipótese Alternativa Ha).
Entretanto, ao realizar um teste, o pesquisador pode errar de duas formas:

H0 é verdadeira, mas será REJEITADA. → Chamamos de ERRO TIPO I.


Erros de (é o mesmo que condenar um inocente! O réu disse a verdade, mas seus argumentos foram rejeitados).
decisão H0 é falsa, mas será ACEITA. → Chamamos de ERRO TIPO II.
(é o mesmo que inocentar um culpado! O réu mentia, mas seus argumentos foram aceitos).

Nível de significância α. Note que o erro Tipo I é pior pois condenar um inocente é algo terrível, e este erro o pesquisador deve evitar a todo
o custo! Porém, há sempre uma probabilidade de cometê-lo. Esta probabilidade é chamada de Nível de Significância α (alfa). Portanto:

O NÍVEL DE SIGNIFICÂNCIA α é a PROBABILIDADE de se cometer um ERRO TIPO I, devendo ser sempre a menor possível.
Normalmente, usamos um Nível de Significância de 10% (0,10); 5% (0,05); ou 1% (0,01). Mas pode-se usar qualquer α.
Tipos de Testes.
Usamos a curva normal (ou t) para realizar os testes, sendo três tipos possíveis, e o que será usado depende do sinal presente na hipótese alternativa Ha.
Teste Unilateral à esquerda Teste Unilateral à direita Teste Bilateral
H0 : µ = 18 km/L H0 : µ = 18 km/L H0 : µ = 18 km/L
Ha : µ < 18 km/L Ha : µ > 18 km/L Ha : µ ≠ 18 km/L
α → 5% α → 5% α → 5%
Região de Região de
Região de aceitação
Região de aceitação aceitação Região de Região de
rejeição 0,95 Região de rejeição
0,95 rejeição
α → 0,05 rejeição α →0,025 0,95 α → 0,025
α → 0,05 2 2

18km/L 18km/L 18km/L


(0,5-0,05=0,45) → Z=-1,65 Z=+1,65 → (0,5-0,05=0,45) Z=-1,96 Z=+1,96 → (0,95/2 = 0,4750)

Este teste será usado quando se tem um valor Este teste será usado quando se tem um valor Será usado quando se tem um valor dentro de um
mínimo aceitável. Sinal usado em Ha: <. máximo aceitável. Sinal usado em Ha: >. intervalo aceitável. Sinal usado em Ha: ≠.

TOMANDO A DECISÃO: A Região de rejeição (demonstrada no gráficos) é o conjunto de todos os valores da estatística de teste que nos fazem rejeitar a Hipótese
Nula (H0). Se a estatística de teste cair nesta região, diremos que a afirmativa do fabricante é falsa, o que fará com que rejeitemos a Hipótese Nula (H0).

Mas, se a estatística de teste cair na Região de aceitação, diremos que a afirmativa é verdadeira. O termo “estatística de teste” é feito por meio de cálculos que
serão apresentados a seguir. O nível de significância α → 5% (demonstrado nos gráficos) é apenas um exemplo, pois podemos usar também outros níveis.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 74 -

Teste de Hipótese para média (amostras grandes n > 30) (Distribuição Normal z)
Usamos a Distribuição Normal (z) para realizar o teste de hipótese para amostra maior que 30. Quando o desvio padrão é
conhecido, mesmo com amostra menor que 30, também podemos usar a Normal. Embora tenha 3 tipos de testes, na prática
aplicamos um ou outro, nunca os três conjuntamente. Mostraremos a aplicação dos três testes em problemas diferentes.

x −μ x = média amostral z = Estatística de teste


A estatística de teste z= µ = média Hipotética (H0)
usada para média é: s
s = desvio padrão
(n > 30)
n n = tamanho da amostra
EXEMPLO 1. TESTE UNILATERAL À ESQUERDA. A FIAT afirma que o consumo de combustível do Pálio Fire é, em média, de 18 km/L.
Uma revista decide testar essa afirmação e analisa 50 veículos da mesma marca, obtendo uma média de 17 km/L com desvio padrão
de 3km/L. Testar a hipótese, contra a alternativa de que o consumo é menor que 18km/L, com Nível de Significância de 6%.
1º passo: Formular as hipóteses: 4º passo: Desenhar as Regiões de Rejeição e de 5º passo: Calcular a
H0 : µ = 18 km/L Aceitação, em função do escore z (nível α) : estatística de teste:
Ha : µ < 18 km/L
x −μ
2º passo: Definir o tipo de teste a ser usado: Região de z=
Como a média amostral foi 17km/L, temos um valor mínimo aceitação
s
Região de
aceitável. O sinal é <, logo, usamos o unilateral à esquerda. rejeição
α → 0,06
0,94 n
3º passo: Encontrar escore z que estabelece os limites de
17 − 18 = -2,35
Rejeição/Aceitação: α=6% (0,06) | 0,5 – 0,06 = 0,44 → z = -1,56 z=
18km/L 3
Ao procurar 0,44 na tabela Normal, encontramos z = - 1,56 (como o -1,56
teste é “unilateral à esquerda”, o escore z será negativo). 50

6º passo: Verifique se a estatística de teste z caiu 7º e último passo: Tomada de decisão:


na Região de rejeição: Note que a estatística de teste z caiu na Região
de rejeição. Então, você deverá REJEITAR A
Região de
estatística de teste aceitação HIPÓTESE NULA (Ho).
Região de
(obtido no 5º passo) rejeição 0,94
α → 0,06 Ou seja, não se pode aceitar que o consumo médio de
combustível do Pálio Fire 1.0 é de 18 km/L, contra a
hipótese de que seja menor que este valor, com uma
18km/L probabilidade de erro de 6%.
-2,35 -1,56
-3z -2z -1z 0 +1z +2z +3z

EXEMPLO 2. TESTE UNILATERAL À DIREITA A FIAT afirma que o consumo de combustível do Pálio Fire é, em média, de 18 km/L. Uma
revista decide testar a afirmação e analisa 35 veículos da mesma marca, obtendo uma média de 18,5 km/L com desvio padrão de 2,5
km/L.. Testar a hipótese, contra a alternativa de que o consumo é maior que 18km/L, com Nível de Significância de 4%.
1º passo: Formular as hipóteses: 4º passo: Desenhar as Regiões de Rejeição e de 5º passo: Calcular a
H0 : µ = 18 km/L Aceitação, em função do escore z (nível α) : estatística de teste:
Ha : µ > 18 km/L
x −μ
2º passo: Definir o tipo de teste a ser usado: Região de z=
Como a média amostral foi 18,5km/L, temos um valor máximo
aceitação
0,96
s
Região de
aceitável. O sinal é >, logo, usamos o unilateral à direita. rejeição n
α → 0,04
3º passo: Encontrar escore z que estabelece os limites de
18,5 − 18 = +1,18
Rejeição/Aceitação: α=4%(0,04) | 0,5 – 0,04 = 0,46 → z = +1,75 z=
18km/L
2,5
Ao procurar 0,46 na tabela Normal, encontramos z = +1,75 (como o z=+1,75
teste é “unilateral à direita”, z será positivo). 35

6º passo: Verifique se a estatística de teste z caiu 7º e último passo: Tomada de decisão:


na Região de rejeição: Note que a estatística de teste z não caiu na
Região de Rejeição. Então, você deverá ACEITAR
Região de
aceitação A HIPÓTESE NULA (Ho).
estatística de teste 0,96 Região de
(obtido no 5º passo) rejeição Ou seja, pode-se aceitar que o consumo médio de
α → 0,04
combustível do Pálio Fire 1.0 é de 18 km/L, contra a
hipótese de que seja maior que este valor, com uma
18km/L
z=+1,75 probabilidade de erro de 4%.
z=+1,18
-3z -2z -1z 0 +1z +2z +3z

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 75 -

EXEMPLO 3. TESTE BILATERAL. A FIAT afirma que o consumo de combustível do Pálio Fire é, em média, de 18 km/L. Uma revista
decide testar a afirmação e analisa 42 veículos da mesma marca, obtendo uma média de 16,8 km/L com desvio padrão de 2 km/L.
Testar a hipótese, contra a alternativa de que o consumo não é de 18km/L, com Nível de Significância de 10%.
1º passo: Formular as hipóteses: 4º passo: Desenhar as Regiões de Rejeição e de 5º passo: Calcular a
H0 : µ = 18 km/L Aceitação, em função do escore z (nível α) : estatística de teste:
Ha : µ ≠ 18 km/L
Região de x −μ
2º passo: Definir o tipo de teste a ser usado: aceitação z=
A idéia não é testar se é menor ou maior. Queremos testar um Região de Região de s
rejeição rejeição
intervalo aceitável. O sinal é ≠, logo, usamos o Bilateral. α →0,05 0,90 α → 0,05 n
2 2
3º passo: Encontrar escore z que estabelece os limites de
16,8 − 18 = -3,88
Rejeição/Aceitação: α=10% | 0,90/2 = 0,45 → z = -1,65 e +1,65 z=
18km/L 2
Ao procurar 0,45 na tabela Normal, encontramos z = ±1,65 (como o Z=-1,65 Z=+1,65 (0,90/2 = 0,45)
teste é “Bilateral”, usamos z positivo e negativo). 42

6º passo: Verifique se a estatística de teste z caiu 7º e último passo: Tomada de decisão:


na Região de rejeição: Note que a estatística de teste z caiu na Região
de Rejeição. Então, você deverá REJEITAR A
Região de HIPÓTESE NULA (Ho).
estatística de teste aceitação
Região de Região de
(obtido no 5º passo) rejeição rejeição Ou seja, não se pode aceitar que o consumo médio de
α →0,05 0,90 α → 0,05 combustível do Pálio Fire 1.0 é de 18 km/L, contra a
2 2 hipótese de que seja diferente deste valor, com uma
probabilidade de erro de 10%.
18km/L
Z=-1,65 Z=+1,65
z=-3,88
-3z -2z -1z 0 +1z +2z +3z

Teste de Hipótese para média (amostras pequenas n ≤ 30) (Distribuição t de Student)


Usamos a Distribuição t de Student (t) para realizar o teste de hipótese para amostra menor ou igual a 30.
x = média amostral Efetuar o Teste usando a Distribuição t de Student
x −μ
A estatística de teste t= µ = média Hipotética (H0) é similar a efetuar o Teste com a Normal z. Difere-
usada para média é: s s = desvio padrão se apenas no 3º passo, onde usamos n - 1 graus
(n ≤ 30) n = tamanho da amostra de liberdade e a tabela t para encontrar o limite
n
t = Estatística de teste t Student de Rejeição/Aceitação.
EXEMPLO 4. A FIAT afirma que o consumo de combustível do Pálio Fire é, em média, de 18 km/L. Uma revista decide testar essa
afirmação e analisa 22 veículos da mesma marca, obtendo uma média de 17,4 km/L com desvio padrão de 1,7km/L. Testar a hipótese
de que o consumo é menor que 18km/L, com Nível de Significância de 5%.
1º passo: Formular as hipóteses: 4º passo: Desenhar as Regiões de Rejeição e de 5º passo: Calcular a
H0 : µ = 18 km/L Aceitação, em função de t (nível α) : estatística de teste:
Ha : µ < 18 km/L
x −μ
2º passo: Definir o tipo de teste a ser usado: Região de t=
Como a média amostral foi 17,4km/L, temos um valor mínimo aceitação
s
Região de
aceitável. O sinal é <, logo, usamos o unilateral à esquerda. rejeição 0,95 n
α → 0,05
3º passo: Encontrar t que estabelece os limites de
17,4 − 18 = -1,65
Rejeição/Aceitação: gl=n-1→ 22–1=21 → -1,721 | α=5% (0,05) t=
18km/L 1,7
Analise a tabela t de Student na próxima página: -1,721
Usando Unilateral, α=0,05 com g.l.= 21, encontramos t = 1,721. 22
(como o teste é “unilateral à esquerda”, t será negativo).

6º passo: Verifique se a estatística de teste t caiu 7º e último passo: Tomada de decisão:


na Região de rejeição: Note que a estatística de teste z não caiu na
Região de rejeição. Então, você deverá ACEITAR
Região de
aceitação
A HIPÓTESE NULA (Ho).
Região de
rejeição 0,95
A única diferença α → 0,05 Ou seja, pode-se aceitar que o consumo médio de
da t para z está combustível do Pálio Fire 1.0 é de 18 km/L, contra a
no 3º passo. hipótese de que seja menor que este valor, com uma
18km/L probabilidade de erro de 5%.
-1,721
-1,65
-3z -2z -1z 0 +1z +2z +3z

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 76 -

TABELA DISTRIBUIÇÃO t DE STUDENT (PARCIAL)


Confiança, c 50% 80% 90% 95% 98% 99%
Níveis de Unilateral, α 0,25 0,10 0,05 0,025 0,01 0,005
Significância, α Bilateral, α 0,50 0,20 0,10 0,05 0,02 0,01
g.l. 1 1,000 3,078 6,314 12,71 31,82 63,66
2 0,816 1,886 2,920 4,303 6,965 9,925
3 0,765 1,638 2,353 3,182 4,541 5,841
4 0,741 1,533 2,132 2,776 3,747 4,604
5 0,727 1,476 2,015 2,571 3,365 4,032
6 0,718 1,440 1,943 2,447 3,143 3,707
7 0,711 1,415 1,895 2,365 2,998 3,499
8 0,706 1,397 1,860 2,306 2,896 3,355
9 0,703 1,383 1,833 2,262 2,821 3,250
10 0,700 1,372 1,812 2,228 2,764 3,169
11 0,697 1,363 1,796 2,201 2,718 3,106
12 0,695 1,356 1,782 2,179 2,681 3,055
13 0,694 1,350 1,771 2,160 2,650 3,012
14 0,692 1,345 1,761 2,145 2,624 2,977
15 0,691 1,341 1,753 2,131 2,602 2,947
16 0,690 1,337 1,746 2,120 2,583 2,921
17 0,689 1,333 1,740 2,110 2,567 2,898
18 0,688 1,330 1,734 2,101 2,552 2,878
19 0,688 1,328 1,729 2,093 2,539 2,861
20 0,687 1,325 1,725 2,086 2,528 2,845
21 0,686 1,323 1,721 2,080 2,518 2,831
22 0,686 1,321 1,717 2,074 2,508 2,819
23 0,685 1,319 1,714 2,069 2,500 2,807
24 0,685 1,318 1,711 2,064 2,492 2,797
25 0,684 1,316 1,708 2,060 2,485 2,787
26 0,684 1,315 1,706 2,056 2,479 2,779
27 0,684 1,314 1,703 2,052 2,473 2,771
28 0,683 1,313 1,701 2,048 2,467 2,763
29 0,683 1,311 1,699 2,045 2,462 2,756
0,674 1,282 1,645 1,960 2,326 2,576
Teste de Hipótese para Proporções P (Distribuição Normal)
Quando lidamos com Proporções, a população é constituída por elementos de dois tipos, isto é, cada elemento pode ser interpretado como
Sucesso e Fracasso, além dos eventos ser independentes. Nestas condições, a variável aleatória segue uma distribuição Binomial. De acordo
com Teorema do Limite Central, para amostra suficientemente grande (n > 30), a distribuição Binomial aproxima-se a uma distribuição Normal.
Daí é imediato verificar que a proporção amostral p também aproxima-se da distribuição normal. Ocorre que, da mesma forma que o Teste de
Hipótese para média, frequentemente estamos interessados em Testar Hipóteses para proporções populacionais.

p − p0 p = proporção amostral
A estatística de teste z= p0 = proporção Hipotética (H0)
usada para p0( 1 − p0) n = tamanho da amostra
Proporções é: n z = Estatística de teste z (Normal)
EXEMPLO 5. Inspeciona-se uma amostra de 200 peças de uma grande remessa, encontrando-se 8% de peças defeituosas (200 x 0,08 =
16 peças defeituosas). O fornecedor garante que não haverá mais de 6% de peças defeituosas em toda a remessa. Testar a hipótese de
que a proporção de peças defeituosas é maior que 6%, com Nível de Significância de 5%.
1º passo: Formular as hipóteses: 4º passo: Desenhar as Regiões de Rejeição e 5º passo: Calcular a
H0 : p0 = 6% de Aceitação, em função do escore z (nível α) estatística de teste z:
Ha : p > 6%
p − p0
2º passo: Definir o tipo de teste a ser usado: Região de z=
Como a proporção amostral foi 8%, temos um valor máximo aceitação p0( 1 − p0)
0,95 Região de
aceitável. O sinal é >, logo, usamos unilateral à direita.
rejeição
n
3º passo: Encontrar escore z que estabelece os limites de α → 0,05
0,08 − 0,06
Rejeição/Aceitação: α=5% | 0,5 – 0,05= 0,45 → z=+1,65 z= = +1,19
0,06( 1 − 0,06)
Ao procurar 0,45 na tabela Normal, encontramos z = +1,65 (como o z=+1,65
teste é “unilateral à direita”, usamos z positivo). 200

Calculadora: 0,02 ÷ ( ( 0,06x0,94) ÷ 200) = 1,19

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 77 -

6º passo: Verifique se a estatística de teste z caiu 7º e último passo: Tomada de decisão:


na Região de rejeição: Note que a estatística de teste z não caiu na
Região de Rejeição. Então, você deverá ACEITAR
Estatística de teste Região de
aceitação A HIPÓTESE NULA (Ho).
(obtida no 5º passo) 0,95 Região de
rejeição Ou seja, pode-se aceitar que a proporção de peças
α → 0,05
defeituosas seja de 6%, contra a hipótese de que seja
maior que este valor, com uma probabilidade de erro
z=+1,65 de 5%.
z=+1,19
-3z -2z -1z 0 +1z +2z +3z

Teste de Hipótese para o Desvio padrão (Distribuição χ 2)


Usamos a Distribuição χ 2 (qui-quadrado) para realizar o teste de hipótese para o desvio padrão. (qualquer tamanho amostral)
2
n = tamanho da amostra Efetuar o Teste usando a Distribuição χ é
A estatística de ( n − 1) •( S) 2
S = desvio padrão amostral similar a efetuar o Teste com t. Difere-se
teste usada para o χ2 = S0 = desvio padrão Hipotético (H0) apenas no 3º passo, onde usamos n - 1
desvio padrão é: ( S0 ) 2 2
graus de liberdade e a tabela χ para
χ2=Estatística teste (qui-quadrado)
encontrar o limite de Rejeição/Aceitação.

EXEMPLO 6. TESTE BILATERAL. A FIAT afirma que o consumo de combustível do Pálio Fire é, em média, de 18 km/L., com desvio
padrão de 1,2 km/L Uma revista decide testar essa afirmação e analisa 20 veículos da mesma marca, obtendo uma média de 17,4
km/L com desvio padrão de 1,7km/L. Testar a hipótese de que o desvio padrão não é de 1,2 km/L, com Nível Significância 10%.
1º passo: Formular as hipóteses: 2º passo: Definir o tipo de teste a ser usado:
H0 : S0 = 1,2 km/L A idéia não é testar se é menor ou maior. Queremos testar um intervalo
Ha : S ≠ 1,2 km/L aceitável. O sinal é ≠, logo, usamos o Bilateral.
3º passo: encontrar os valores χ2L e χ2R com nível de significância α =10% (90% de confiança), quando o tamanho da amostra for 20.
2 2
1º - Ache o grau de liberdade – g.l. 2º - encontrar as áreas de χ L e χ R
Como n = 20, os graus de liberdade são: Em razão da confiança c ser 90%, temos:
2 2
χ L = 1+c χ = 1-c
R
g.l. = n – 1 2 2
20 – 1 = 19 2
χ L = 1 + 0,90 = 0,950 χ
2
= 1 - 0,90 = 0,050
R
2 2
2
3º - encontrar os limites de Rejeição e Aceitação na tabela χ
2
Parte da tabela χ é exibida abaixo. Usando g.l.=19 e as áreas 0,95 e 0,05 encontramos os valores críticos, como destacado:

Por meio da tabela você pode ver os


χ2L χ2R limites de Rejeição/Aceitação:
2 2
4º passo: Calcular a estatística de teste χ2 χ L = 10,1170 e χ R = 30,1435.
( n − 1) •( S) 2 ( 20 − 1) •( 1,7) 2 Região de
χ2 = χ 2= = 38,13 0,90
( S0 ) 2 ( 1,2) 2 aceitação

Região de
5º passo:Tomada de decisão: rejeição 0,05 Região de
Observe que 38,13 caiu na Região de rejeição. rejeição 0,05
Portanto, deve-se REJEITAR A HIPÓTESE NULA

χ2L = 10,1170 χ2R = 30,1435


38,13

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 78 -

2 2
Para testes unilaterais à esquerda, usamos χ L como limite de Rejeição. Para testes unilaterais à direita, usamos χ R como limite de Rejeição.

2 2
Para unilateral à esquerda (χ L ) use sempre 1 – α Para unilateral à direita (χ R) use sempre α

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 79 -

EXEMPLO. TESTE UNILATERAL À ESQUERDA. Encontre χ2L quando o tamanho da amostra for 23, com nível de significância 10%
g.l. = n – 1 → 23 – 1 = 22 Usando g.l. = 22 com α = 0,90, encontramos 14,0415 na tabela χ2
2
1 – α → 1 – 0,10 = 0,90 Nota: para testes χ L use sempre 1 – α

Região de
aceitação 0,90

Região de
rejeição 0,10

χ2L = 14,0415
EXEMPLO. TESTE UNILATERAL À DIREITA. Encontre χ2R quando o tamanho da amostra for 41, com nível de significância 5%
g.l. = n – 1 → 41 – 1 = 40 Usando g.l. = 40 com α = 0,05, encontramos 55,7585 na tabela χ2
2
α → 0,05 Nota: para testes χ R use sempre α

Região de
aceitação 0,95

Região de
rejeição 0,05

χ2R = 55,7585

TABELA DE DISTRIBUIÇÃO NORMAL PADRÃO


Z Último dígito
0 1 2 3 4 5 6 7 8 9

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 80 -

Teste para duas amostras - Conceitos introdutórios


Nos capítulos anteriores, mostramos como determinar INTERVALOS DE CONFIANÇA e realizar TESTES DE HIPÓTESES para
situações que envolvem UMA ÚNICA AMOSTRA de dados extraída de UMA ÚNICA POPULAÇÃO.
Agora, você ESTENDERÁ o TESTE DE HIPÓTESE e INTERVALOS DE CONFIANÇA para procedimentos que COMPARAM
estatísticas oriundas de DUAS AMOSTRAS de dados extraídas de DUAS POPULAÇÕES.

Justificativas e exemplos (adaptado de Farias et al, 2003):


Em muitas áreas da atividade humana há uma busca contínua por novos métodos, novos procedimentos que superem
ou melhorem, em certo sentido, aqueles já existentes:
9 No setor de transportes, procuramos motores de maior rendimento e de menor ruído.
9 A medicina procura drogas com maior poder de cura e o mínimo possível de efeitos colaterais.
9 Na agricultura, buscamos variedades mais adequadas e mais produtivas de cereais.
9 Um produtor quer saber se o novo cimento-e-cola para fixar azulejos tem maior grau de aderência que o atual.
Em todas essas situações, é preciso comparar as técnicas usuais com os métodos alternativos. A comparação da
eficiência de duas drogas, de dois métodos de produção de cimento-e-cola ou, em geral, de dois tratamentos é, pois, uma
questão importante que surge frequentemente no trabalho de pesquisa e desenvolvimento.
A escolha entre dois tratamentos diferentes não é uma tarefa tão simples como, a princípio, possa parecer. É necessário
realizar experimentos, coletar informações e fazer inferências (julgar) a partir da evidência experimental.
Tomemos o caso de duas terapias alternativas. Se todos os portadores de determinada doença se comportassem de
maneira idêntica em relação aos tratamentos utilizados, bastaria examinar o comportamento de um frente às
alternativas existentes; a decisão sobre qual é o melhor deles seria óbvia. Nenhuma análise estatística seria necessária.
Tal, entretanto, não é o caso. A reação a um tratamento varia de indivíduo para indivíduo, e, via de regra, não há
tratamento ótimo para todos. Como, em geral, não se conhece a reação de cada indivíduo, prescreve-se o tratamento
que, em média, dá os melhores resultados.
O procedimento para determinar qual dos dois tratamentos é, em média, o mais eficiente envolve a seleção de duas
amostras e a comparação dos resultados obtidos. Neste capítulo, discutiremos como comparar os efeitos médios de dois
tratamentos.

Teste de Hipótese para a diferença de duas médias


Para amostras dependentes (dados emparelhados)
Duas amostras são dependentes se cada membro de uma amostra corresponde a “Antes” “Depois”
um membro de outra amostra. Amostras dependentes envolvem duplas idênticas,
“antes e depois” de resultados para a mesma pessoa ou objeto. Veja ao lado.
9 Para cada par definido, o valor da primeira amostra está claramente associado ao
respectivo valor da segunda amostra.
9 Nestes casos as duas amostras serão de mesmo tamanho.
9 Amostras dependentes também são chamadas de amostras relacionadas ou dados amostra 1 amostra 2
emparelhados.

A equação para resolução de dados emparelhados é mostrada abaixo.

EQUAÇÃO DADOS EMPARELHADOS (use t ou z)


d = média das diferenças, dada por Estatística de teste Sd = desvio padrão das diferenças, dado por
t

d ⎡ (∑ d )2 ⎤
∑d = ∑ d2 − ⎢ ⎥
d= Sd ⎣ n ⎦
n n Sd =
n −1
“d” é a diferença de cada dado,
2
encontrado por X2-X1 “d ” é a diferença de cada dado, ao quadrado
t = distribuição t de Student. Use a Normal Z se n>30. n = tamanho da amostra.

Exemplo 1. Dez cobaias adultas foram submetidas ao tratamento com certa ração para engordar, durante uma
semana. Os animais foram perfeitamente identificados, tendo sido mantidos, para tanto, em gaiolas individuais. Os
pesos, em gramas, no princípio e no fim de semana, designados respectivamente por X1 e X2 são dados a seguir.

Ao nível de 1% de significância, podemos concluir que o uso da ração contribuiu para o aumento do peso médio dos
animais? (Moretim)

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 81 -

Resolução: A tabela com os dados da experiência é mostrada abaixo, juntamente com os cálculos do 1º e 2º passos.
1º passo: Encontrar d (X2-X1) e ∑d (para permitir cálculo de d , que é a média das diferenças).
2º passo: Encontrar d2 e ∑d2 (para permitir cálculo de Sd, que é o desvio padrão das diferenças).
Dados da experiência
diferença d 3º passo: Calcular d
Cobaia X1 X2 d2
(X2-X1) ∑ d → 66 = 6,6
1 635 640 5 25 d= n é o tamanho da amostra
n 10
2 704 712 8 64
3 662 681 19 361
4 560 558 -2 4
5 603 610 7 49
6 745 740 -5 25 4º passo: Calcular Sd
7 698 707 9 81 ⎡ (∑ d )2 ⎤ ⎡ (66 )2 ⎤
8 575 585 10 100 ∑ d2 − ⎢ ⎥ 882 − ⎢ ⎥
⎣ n ⎦ → ⎣ 10 ⎦ = 7,043
9 633 635 2 4 Sd =
10 669 682 13 169 n −1 10 − 1
∑d=66 ∑d2=882

5º passo: Executar o Teste de Hipótese.


5.1 Formular as hipóteses
Em termos da diferença ”d”, as hipóteses são descritas como:
H0 : µ = 0
Ha : µ > 0
5.2 Definir o tipo de teste a ser usado
TABELA DISTRIBUIÇÃO t DE STUDENT (PARCIAL) O sinal é >. Então o teste será unilateral à direita.
Confiança, c 50% 80% 90% 95% 98% 99%
Unilateral, α 0,25 0,10 0,05 0,025 0,01 0,005 5.3 Encontrar t que estabelece limites de Aceitação/Rejeição
Bilateral, α 0,50 0,20 0,10 0,05 0,02 0,01 gl=n-1→ 10-1=9 → 2,821 | α=1% (0,01)
g.l. 1 1,000 3,078 6,314 12,71 31,82 63,66 Usando Unilateral, α=0,01 com g.l.= 9, encontramos t = 2,821 (veja na
2 0,816 1,886 2,920 4,303 6,965 9,925 tabela t ao lado). Como o teste é “unilateral à direita”, t será positivo.
3 0,765 1,638 2,353 3,182 4,541 5,841 5.4 Desenhe as regiões de Aceitação/Rejeição
4 0,741 1,533 2,132 2,776 3,747 4,604
5 0,727 1,476 2,015 2,571 3,365 4,032 Região de
6 0,718 1,440 1,943 2,447 3,143 3,707 aceitação
0,99 Região de
7 0,711 1,415 1,895 2,365 2,998 3,499
rejeição
8 0,706 1,397 1,860 2,306 2,896 3,355 α → 0,01
9 0,703 1,383 1,833 2,262 2,821 3,250
10 0,700 1,372 1,812 2,228 2,764 3,169
11 0,697 1,363 1,796 2,201 2,718 3,106 t=+2,821
12 0,695 1,356 1,782 2,179 2,681 3,055 5.5 Calcular a estatística de teste:
13 0,694 1,350 1,771 2,160 2,650 3,012
14 0,692 1,345 1,761 2,145 2,624 2,977 d → 6,6 = 2,96
15 0,691 1,341 1,753 2,131 2,602 2,947 t=
Sd 7,043
16 0,690 1,337 1,746 2,120 2,583 2,921 n 10
17 0,689 1,333 1,740 2,110 2,567 2,898
18 0,688 1,330 1,734 2,101 2,552 2,878 5.6 Verifique se t caiu na região de Rejeição
19 0,688 1,328 1,729 2,093 2,539 2,861
20 0,687 1,325 1,725 2,086 2,528 2,845 Região de
21 0,686 1,323 1,721 2,080 2,518 2,831 aceitação
0,99 Região de
22 0,686 1,321 1,717 2,074 2,508 2,819 rejeição
23 0,685 1,319 1,714 2,069 2,500 2,807 α → 0,01
24 0,685 1,318 1,711 2,064 2,492 2,797
25 0,684 1,316 1,708 2,060 2,485 2,787
+2,821
26 0,684 1,315 1,706 2,056 2,479 2,779
27 0,684 1,314 1,703 2,052 2,473 2,771 +2,96
5.7 Conclusão:
28 0,683 1,313 1,701 2,048 2,467 2,763
A estatística de teste t caiu na Região de Rejeição. Então, você
29 0,683 1,311 1,699 2,045 2,462 2,756
deverá REJEITAR A HIPÓTESE NULA (Ho). Ho é falsa.
0,674 1,282 1,645 1,960 2,326 2,576
Não se pode aceitar que o peso se manteve. Então, concluímos que o
uso da ração contribui para o aumento do peso médio dos animais.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 82 -

Para amostras independentes (dados não emparelhados)


Duas amostras são independentes se a amostra selecionada de uma das populações
não é relacionada à amostra selecionada da segunda população. Veja ao lado.
9 Em muitas situações em que desejamos comparar as médias dos efeitos de dois tratamentos,
não se utiliza o esquema de dados emparelhados, seja porque o emparelhamento não é
possível, seja porque não é a maneira mais conveniente de se fazer a comparação. Dividem-se
então os indivíduos em estudo em dois grupos separados.
9 Neste caso as duas amostras podem ser de tamanhos diferentes.
amostra 1 amostra 2
9 Se os dados não são emparelhados, não terá sentido calcular as diferenças “d” entre os valores das duas amostras, e o teste deverá ser
baseado na diferença X1 - X2 entre as médias das duas amostras. Temos dois casos para amostras independentes: teste Z para amostras
grandes (n>30, ou se o desvio padrão for conhecido) e teste t para amostras pequenas (n≤30, ou se o desvio padrão for desconhecido).

Teste Z para amostras grandes (n>30)


EQUAÇÃO TESTE Z DADOS NÃO EMPARELHADOS (n>30)
Estatística de teste X1 =média da amostra população 1
X1 − X 2 X 2 = média da amostra população 2
A estatística de teste z segue uma z= S1 = desvio padrão da população 1
(S1) 2 (S2) 2
distribuição normal. + S2 = desvio padrão da população 2
n1 n2 n1 = tamanho da amostra população 1
n2 = tamanho da amostra população 2
Exemplo 1: Um fabricante produz dois tipos de pneus, A e B. Uma grande companhia de taxi testou a durabilidade de 50
pneus do tipo A, obtendo média de 24.000km e desvio padrão de 2.500km, e 40 pneus do tipo B, obtendo média de
26.000km e desvio padrão de 3.000km. Ao nível de 4% de significância, testar a hipótese de que a duração média dos dois
tipos de pneus é diferente (ou seja, não é a mesma).

1º passo: Formular as hipóteses 4º passo: Desenhar as Regiões de Rejeição e 5º passo: Calcular a


H0 : X1 = X2 de Aceitação, em função de z (nível α) estatística de teste
Ha : X1 ≠ X2
X1 − X 2
2º passo: Definir o tipo de teste a ser usado Região de z=
Queremos testar se a média de A e B é diferente. O aceitação (S1) 2 (S2) 2
Região de Região de +
sinal é ≠. Usamos o Bilateral, pois testaremos um rejeição rejeição n1 n2
intervalo aceitável. α →0,02 0,96 α → 0,02
2 2
3º passo: Encontrar escore z que estabelece os 24.000 − 26.000
z= = −3,38
limites de Rejeição/Aceitação: ( 2.500) 2 (3.000) 2
0,96 Z=-2,05 Z=+2,05 (0,96/2 = 0,48) +
α=4% | /2 = 0,48 → z = -2,05 e +2,05 50 40
Ao procurar 0,48 na tabela Normal, encontramos z = ±2,05
(pois 0,4798 é mais próximo. Como o teste é “Bilateral”,
usamos z positivo e negativo).

6º passo: Verifique se a estatística de teste caiu 7º e último passo: Tomada de decisão:


na Região de rejeição: A estatística de teste caiu na Região de Rejeição.
Então, deve-se REJEITAR A HIPÓTESE NULA (Ho).
Região de
estatística de teste aceitação
Região de Região de Ou seja, Não se pode aceitar que a durabilidade média
(obtido no 5º passo) rejeição dos pneus é a mesma. Concluímos que os pneus tem
rejeição
α →0,02 0,96 α → 0,02 durabilidade média diferente.
2 2

z=-2,05 z=+2,05
z=-3,38

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 83 -

6
CORRELAÇÃO E REGRESSÃO

Existem situações nas quais interessa estudar a relação entre duas variáveis,
coletadas como pares ordenados (x,y), para resolver questões do tipo
“Existe relação entre o número de horas de estudo e as notas obtidas?”.
Problemas como esses são estudados pela análise de correlação linear
simples, onde determinamos o grau de relação entre duas variáveis. Se as
variáveis variam juntas, diz-se que as mesmas estão correlacionadas.

Uanderson Rebula de Oliveira Estatística Aplicada


“Atualmente, todos – estudantes e professores – procuram o Udemy porque é a
plataforma onde todos estão”.
Fonte: Jornal do Brasil

Faça o curso online na Udemy


Estatística I (para leigos):
aprenda fácil e rápido!
Com o Prof. MSc. Uanderson Rébula
"O livro digital Estatística I para leigos possui uma linguagem fácil e ao mesmo tempo dinâmica. O
conteúdo do livro está ordenado de forma a facilitar a aprendizagem dos alunos, mesmo aquelas
pessoas que não tenham noção nenhuma de estatística aprenderão com esse livro. Você pode
estudar sozinho para concursos pois o livro é auto explicativo ou até mesmo em grupos, no meu
caso faço isso com meus alunos. Eu super recomendo esse livro!!! NOTA 1000"
Maria Eunice Souza Madriz
Professora de estatística da rede estadual de ensino da Bahia
Avaliação do livro pelo cliente na amazon.com.br

Saiba
mais
Clique aqui

www.udemy.com
Junte-se a milhões de estudantes na maior plataforma on-line
de cursos curtos e práticos do mundo.

Com mais de 45.000 cursos virtuais disponíveis, o Udemy é uma plataforma global de
ensino on-line onde 15 milhões de alunos estão dominando novas habilidades.

O foco do Udemy são os conhecimentos práticos e úteis para o mercado de trabalho. Há


cursos gratuitos e pagos. São cursos curtos e com valores bem acessíveis.
Engenharia de Produção - 84 -

CORRELAÇÃO LINEAR SIMPLES


INTRODUÇÃO

Existem situações nas quais interessa estudar a relação entre duas variáveis, coletadas como pares ordenados
(x,y), para resolver questões do tipo:

Variável x Variável y
Existe relação entre o número de horas de estudo... ...e as notas obtidas?
Quanto maior for a produção... ...maior será o custo total?
Existe relação entre o tabagismo... ...e a incidência de câncer?
Quanto maior a idade de uma casa... ...menor será seu preço de venda?
Existe relação entre o número de horas de treino... ...e os gols obtidos em uma partida de futebol?
Existe relação entre o nível de pressão arterial... ...com a idade das pessoas?

; Problemas como esses são estudados pela análise de correlação linear simples, onde determinamos o grau de
relação entre duas variáveis. Se as variáveis variam juntas, diz-se que as mesmas estão correlacionadas.

Correlação linear simples é uma técnica usada para analisar a relação entre duas variáveis.

DIAGRAMA DE DISPERSÃO

EXEMPLO 1. Consideremos na tabela abaixo uma amostra formada por 8 alunos de uma classe, pelo número de
horas de estudo (x) e as notas obtidas (y). Verifique se existe correlação por meio do diagrama de dispersão.

Diagrama de Dispersão
Número de horas de estudo
versus notas obtidas H o r as estud ad as ver sus Notas o b tid as
10
Aluno X Y 9
(horas de estudo) (notas obtidas) Ponto de interseção
8
(Aluno D)
A 8h 9,0
Y (Notas obti das )

7
B 2h 3,0 6
5
C 3h 4,0
4
D 4h 5,0 3
E 4,5h 6,0 2
F 6h 7,0 1
0
G 5h 7,0 0 1 2 3 4 5 6 7 8 9
H 7h 7,5 x (Horas de es tudo)
FONTE: dados fictícios

Representando os pares ordenados (x,y), obtemos diversos pontos grafados que denominamos diagrama de dispersão. Para
construí-lo, basta pontuar a interseção de cada eixo x,y. Por exemplo, o aluno D estudou 4h (eixo x) e obteve a nota 5,0 (eixo
y). Observe no diagrama uma linha vermelha pontilhada e o ponto de interseção. Esse diagrama nos fornece uma idéia
grosseira, porém útil, da correlação existente. Ao observar o diagrama como um todo, podemos afirmar que existe uma
correlação entre as variáveis x,y pois, quando x cresce, y também tende a crescer.

CORRELAÇÃO LINEAR
H o r as estud ad as ver sus No tas o b tid as
10
Os pontos grafados, vistos em conjunto, 9
formam uma elipse (trajetória, distribuição 8
dos pontos) em diagonal.
Y (Notas obti das )

7
6
Podemos imaginar que, quanto mais fina for 5

a elipse, mais ela se aproximará de uma reta. 4 Reta imaginária


3
Dizemos então, que a correlação de forma
2
elíptica tem como “imagem” uma reta, sendo,
1
por isso, denominada correlação linear. 0
0 1 2 3 4 5 6 7 8 9
x (Horas de es tudo)

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 85 -

Assim, uma correlação é:

Uma direção para cima sugere que se: Uma direção para baixo sugere que se:
- x aumenta, - x aumenta,
- y tende a aumentar. - y tende a diminuir.

EXEMPLO 2. Consideremos na tabela abaixo os meses de Jan a Set, o aumento mensal do preço das refeições (x)
e a média do número de clientes ao mês (y). Verifique se existe correlação por meio do diagrama de dispersão.

Diagrama de Dispersão
Aumento do preço da refeição
versus média de clientes por mês Aumento do p r eço da r efeição ver su s média clientes p/dia

Mês X Y 180

(preço refeição) (média clientes) 160


Y (médi a de c l i entes p/di a)

Jan R$ 5,90 154 140


120
Fev R$ 8,50 139
100
Mar R$ 10,90 133 80
Abr R$ 13,20 128 60
Jun R$ 15,90 115 40
Jul R$ 18,50 99 20

Ago R$ 21,90 80 0
0,00 5,00 10,00 15,00 20,00 25,00 30,00
Set R$ 24,90 67 x ( P reç o ref ei ç ão)
FONTE: dados fictícios

COEFICIENTE DE CORRELAÇÃO DE PEARSON


Interpretar a correlação usando um diagrama de dispersão pode ser subjetivo (pessoal). Uma maneira mais precisa
de se medir o tipo e o grau de uma correlação linear entre duas variáveis é calcular o coeficiente de correlação.

Coeficiente de correlação é uma medida do grau de relação entre duas variáveis.


Os estatísticos criaram a equação ao lado para obter o grau de
correlação. Na verdade é chamado de coeficiente de Pearson, em
homenagem ao estatístico inglês Karl Pearson (1857-1936).

Onde:
r = coeficiente de correlação e n = tamanho da amostra

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 86 -

EXEMPLO DE APLICAÇÃO. Consideremos na tabela abaixo uma amostra formada por 8 alunos de uma classe, pelo
número de horas de estudo (x) e as notas obtidas (y), calcule o coeficiente de correlação r.
Cálculo do r:
Número de horas de estudo
versus notas obtidas

Aluno X Y X2 Y2 XY
(horas de estudo) (notas obtidas)
A 8h 9,0 64 81 72
B 2h 3,0 4 9 6
C 3h 4,0 9 16 12
D 4h 5,0 16 25 20
E 4,5h 6,0 20,25 36 27
F 6h 7,0 36 49 42
G 5h 7,0 25 49 35
H 7h 7,5 49 56,25 52,5
∑=39,5 ∑=48,5 ∑=223,25 ∑=321,25 ∑=266,5
Interpretação:
O coeficiente de correlação r = 0,975 indica que o grau de relação entre as duas variáveis é “Muito forte”,
além de ser “Positiva” (pois x aumenta, y também aumenta). Então, podemos afirmar que, conforme
aumentam as horas de estudo, as notas obtidas também aumentam. Veja mais detalhes abaixo:
O grau de relação r pode variar de -1 até +1, conforme ilustrado abaixo:
Perfeita Nula Perfeita
-1 0 +1
-0,9 -0,6 -0,3 0,3 0,6 0,9

Muito Forte Fraca Muito Fraca Muito Fraca Fraca Forte Muito
forte forte

Correlação linear NEGATIVA Correlação linear POSITIVA


( x aumenta, y diminui ) ( x aumenta, y aumenta )
r=0
y r = - 0,813 y r = 0,824

x x

r=0,975
Positiva e “Muito forte”

Notas:
Correlação e causalidade.
O fato de duas variáveis serem fortemente correlacionadas não implica uma relação de causa e efeito entre elas. Um estudo
mais profundo é usualmente necessário para determinar se há uma relação causal entre as variáveis. As seguintes questões
devem ser consideradas ao pesquisador:
- Há uma relação direta de causa e efeito entre as variáveis?
- É possível que a relação entre duas variáveis seja uma coincidência?
Mais informações em Larson, 2010, capítulo 9.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 87 -

REGRESSÃO LINEAR SIMPLES


INTRODUÇÃO

Após verificar se a correlação linear entre duas variáveis é significante, o próximo passo é determinar a equação
da linha que melhor modela os pontos grafados. Essa linha é chamada de linha de regressão (ou linha de melhor
ajuste). Portanto, a análise de regressão linear simples tem por objetivo obter a equação matemática do ajuste da
reta que representa o melhor relacionamento numérico linear entre as duas variáveis em estudo.
A Regressão Linear
H o r as estud ad as ver sus No tas o b tid as determina o
10
ajuste da reta,
9
chamada de “Linha de
8
Regressão”
Y (Notas obti das )

7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9
x (Horas de es tudo)

Ao se construir um diagrama de dispersão, não sabemos o comportamento da reta em relação aos pontos
grafados. Para tanto, devemos calcular o “ajustamento da reta aos pontos”. Eis alguns exemplos de diagramas de
dispersão com o ajustamento da reta aos pontos:

AJUSTAMENTO DA RETA AOS PONTOS GRAFADOS

Para ajustar a reta aos pontos grafados em um diagrama de dispersão, os estatísticos usam as seguintes equações:

1º - Calcular o Coeficiente angular a: 2º - Calcular o Coeficiente linear b: 3º - Calcular o ajustamento da reta :


(dá a inclinação da reta) (ordena o ponto em que a reta corta o eixo)

b = - a = aX + b

Onde: Onde:
b = Coeficiente linear
= Ajustamento da reta
Onde: = Média de y a = Coeficiente angular
a = Coeficiente angular a = Coeficiente angular
n = tamanho da amostra X = É um valor arbitrário. (Ex.: nº 5)
= Média de x b = Coeficiente linear

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 88 -

EXEMPLO DE APLICAÇÃO. Consideremos na tabela abaixo uma amostra formada por 8 alunos de uma classe, pelo
número de horas de estudo (x) e as notas obtidas (y), calcule a reta ajustada nos pontos grafados.
Número de horas de estudo
versus notas obtidas
1º - Calcular o Coeficiente angular a:

Aluno X Y X2 XY
(horas de estudo) (notas obtidas)
A 8h 9,0 64 72
B 2h 3,0 4 6
C 3h 4,0 9 12
D 4h 5,0 16 20
E 4,5h 6,0 20,25 27 a = 266,5 - (39,5) . (48,5)
F 6h 7,0 36 42 8
G 5h 7,0 25 35 223,25 - (39,5)2
H 7h 7,5 49 52,5 8
∑=39,5 ∑=48,5 ∑=223,25 ∑=266,5 a = 0,958

2º - Calcular o Coeficiente linear b: 3º - Calcular o ajustamento da reta :

b = - a = aX + b

Calculando as Médias e , temos:


= 0,958 . 5 + 1,33
= 48,5 = 6,063 = 39,5 = 4,937 = 6,12
8 8
Então: Nota: 5 é um valor arbitrário.
b = 6,063 – 0,958 x 4,937
b = 1,33

Para traçar a reta no diagrama de dispersão, basta determinar os pontos b, e o arbitrário:

Note que os pontos grafados estão muito próximos da reta. Isso significa que existe uma correlação
muito forte entre as duas variáveis em estudo

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 89 -

REFERÊNCIAS BIBLIOGRÁFICAS

ANDERSON, David R.; SWEENEY, Dennis J.; WILLIANS, Thomas A. Estatística aplicada à administração e economia. 2
ed. São Paulo: Cengage Learning, 2009. 597 p.

BARBETTA et al. Estatística para cursos de engenharia e informática. 2 ed. São Paulo: Atlas, 2008.

COSTA NETO, Pedro Luiz de Oliveira; CYMBALISTA, Melvin. Probabilidades. 2 ed. São Paulo: Edgard Blucher, 2005.

CRESPO, Antônio Arnot. Estatística fácil. 17 ed. São Paulo: Saraiva, 1999. 224 p.

FARIAS, Alfredo Alves et al. Introdução à estatística. 2 ed. Rio de Janeiro: LTC, 2003. 340 p.

GIOVANNI José Ruy; BONJORNO, José Roberto; GIOVANNI JR., José Rui. Matemática fundamental: uma nova
abordagem – volume único. São Paulo: FTD, 2002. 712 p.

HAZZAN, Samuel. Fundamentos da matemática elementar: combinatória e probabilidade. 7 ed. São Paulo: Atual
editora, 2004. 184p.

LAPPONI, Juan Carlos. Estatística usando o Excel. 4 ed. Rio de Janeiro: Elsevier, 2005. 476 p.

LARSON, Ron; FARBER, Betsy. Estatística aplicada. 4 ed. São Paulo: Pearson, 2010. 637 p.

LEVINE, David M. et al. Estatística: teoria e aplicações. 5 ed. Rio de Janeiro: LTC, 2008. 752 p.

LOPES, Paulo Afonso. Probabilidade e estatística: conceitos, modelos e aplicações em Excel. Ernesto Reichmann, 1999.

MANDIN, Daniel. Estatística descomplicada. 9 ed. Brasília: Vestcon, 2002. 227 p.

MEYER, Paul L. Probabilidade: aplicações à estatística. 2 ed.. Rio de Janeiro: LTC, 1983. 426 p.

MONTGOMERY, Douglas C.; RUNGER, George C. Estatística aplicada e probabilidade para engenheiros. 2 ed. Rio de
Janeiro: LTC, 2003. 465 p.

MORETTIN, Luiz Gonzaga. Estatística básica: probabilidade e inferência. São Paulo: Pearson, 2010. 375 p.

ROSS, Sheldon. Probabilidade: um curso moderno com aplicações. 8 ed.Porto Alegre: Bookman,2010. 826p.

RUMSEY, Deborah. Estatística para leigos. Rio de Janeiro: Alta books, 2009. 350 p.

SILVA, Ermes Medeiros et al. Estatística: para os cursos de Economia, Administração e Ciências Contábeis - volume 1. 2
ed. São Paulo: Atlas, 1996. 189 p.

SMOLE, Kátia Stocco; DINIZ, Maria Ignez. Matemática–ensino médio. 5 ed. São Paulo: Saraiva, 2005. 558p.

SPIEGEL, Murray R. Estatística. Coleção Shaum. São Paulo: McGraw-Hill do Brasil, 1977. 580 p.

TRIOLA, Mario F. Introdução à estatística. 10 ed. Rio de Janeiro: LTC, 2008. 696 p.

URBANO, João. Estatística: uma nova abordagem. Rio de Janeiro: Ciência Moderna, 2010.530 p.

VASCONCELLOS, Maria José Couto; SCORDAMAGLIO, Maria Terezinha; CÂNDIDO, Suzana Laino. Coleção
Matemática. 1ª e 3ª série do ensino médio. São Paulo: Editora do Brasil, 2004. 232 p.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 90 -

ANEXO I - LIVROS RECOMENDADOS

Este livro diferencia-se dos tradicionais livros, materiais


de referência e manuais de estatísticas, pois possui:
Explicações intuitivas e práticas sobre conceitos
estatísticos, ideias, técnicas, fórmulas e cálculos. Passo a
passo conciso e claro de procedimentos que
intuitivamente explicam como lidar com problemas
estatísticos. Exemplos interessantes do mundo real
relacionados ao cotidiano pessoal e profissional.
Um livro introdutório de estatística que inclui um estilo de Respostas honestas e sinceras para perguntas como “O
escrita amigável, conteúdo que reflete as características que isso realmente significa?” e “Quando e como eu
importantes de um curso introdutório moderno de estatística, o vou usar isso?”
uso da tecnologia computacional mais recente, de conjuntos de
dados interessantes e reais, e abundância de componentes Neste livro você encontrará:
pedagógicos. O CD-ROM inclui os conjuntos de dados do • Explicações em português de fácil entendimento.
Apêndice B do livro. Esses conjuntos de dados encontram-se • Informações fáceis de localizar e passo-a-passo.
armazenados em formato texto, planilhas do Minitab, planilhas • Ícones e recursos de identificação e memorização.
do Excel e uma aplicação para a calculadora TI-83. Inclui •Folha de cola para destacar com informações práticas.
também programas para a calculadora gráfica TI-83 Plus®, o • Listas dos 10 melhores relacionados ao assunto.
Programa Estatístico STATDISK (Versão 9.1) e um suplemento • Um toque de humor e diversão.
do Excel, desenvolvido para aumentar os recursos dos
programas estatísticos do Excel.

Onde comprar:
Você poderá adquiri-los pelo site www.submarino.com.br. Basta se cadastrar e pagar por meio de boleta
ou cartão de crédito. A compra é segura.

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 91 -

ANEXO II - SOFTWARE BIOESTAT

Texto extraído da tese de doutorado em Engenharia de Ualison Rebula de Oliveira

Existem inúmeros recursos tecnológicos para a análise estatística de dados, que vão desde
calculadoras, a exemplo da TI – 83 PLUS, a aplicativos específicos, tais como o STATDISK e o
MINITAB (TRIOLA, 2005). Assim, buscando-se recursos computacionais que facilitassem o
tratamento de dados, vários aplicativos e softwares estatísticos foram pesquisados, dos quais se
destacam a planilha Excel, o STATDISK, o MINITAB, o BioEstat, o SPSS e algumas páginas na
Internet que oferecem programas em Javascript para cálculos on-line, a exemplo da página na
Internet www.stat.ucla.edu.

Após análise de pós e contras de cada aplicativo pesquisado, selecionou-se o pacote estatístico
BioEstat, disponível para download no site www.mamiraua.org.br, por possuir as seguintes
características positivas: i) serventia tanto para a Estatística descritiva como para testes estatísticos
não-paramétricos; ii) ser em português; iii) possuir manual em PDF com diversos exemplos; iv) ser
de fácil utilização; v) ser gratuito; vi) ser referenciado em vários livros, sites e entidades de
pesquisa – conforme Siegel & Castellan Junior (2006), o BioEstat é o melhor programa disponível
na atualidade para o cálculo do qui-quadrado; vii) possuir apoio do CNPQ; e viii) estar na versão 5.0
e possuir mais de 20 anos de criação.

INTERFACE BIOESTAT

Baixar software:
www.mamiraua.org.br

Uanderson Rebula de Oliveira Estatística Aplicada


Engenharia de Produção - 92 -

Anexo III - ESTATÍSTICA NO EXCEL


O Excel dispõe da função “Estatística”. Assim, tudo que vimos poderá ser desenvolvido pelo
excel, bastando inserir os valores da variável de interesse.

2Revista
FONTE:
70 |⎯ 80
Coleta
N Conglomera
Número
População
Novilhos
Novilhas
éde de
FONTE:
8Amostras
Conglo
xEstrato
novilhos
Aprovação
Involução 1 -de
=(as)
da1
das
30VARIÁVEL
Anos
$500
$6.000
São
Espírito
Ponto
Classes
Média
8
24
4
16
70 X-1,0
Grande
Média
SUL
CENTRO-
NORTE
SUDESTE acidentes
Distribuição
Podemos
Bimodal
Média
Ponto
“N”
“n”José
resentação
para
NR’s
-3,5
Brasil,
11.039
Moda
2,5
2,0
Proteção
Santo
central
Velocidade
NORDESTENenhuma
Pequena
exigida
Adaptado
QUANTIDADE cada
variação
de80
central
Kelly
9,0
participando
acidentes
deno Da
da
(Km/h
daPerD
70 ⎯ classe
designado
•OESTE
Amostras
=Maria (Km/h)
amostras
avariação
partir
do
do
(80)
(35)
(45)
Acidentes:
ponderada
Maria
90 quantidade
visualizar da a2
109
8
7
6
4
5
3
100Média
partir
19.117
49.010 eo8072, 7
(4%
4,0
aparada
simples
75Km/h
Minas
(10%
80
112.425
279.689
edoGerais
Revista
conglomerado
de
com 7,0
70
181.705,
do total)
total)
(23%
(57%
João
70,
+10
12Proteção
2.000
ACIDENTES .000
-7000
71,
o 12
7000
do que
1010,0
30
10,0 ,0
70 |⎯ da Média
•estratificada
para
110Acidentes:
porcentagem
conceito e do
80 acidentes
80 31.470
12070,
aIBGE
+10 71,
de9072, 7
o de alunos

Mário
José
corresponde
52.335
DO Kátia 37%
veículos

•total)
deveículos

PIB:do13,1%
5% 10 de de 10
6000
70 |⎯|
(6% (www.ibge.gov.
80 total) 6000
70, 71, ,072, 7
e8,0
88,0
População
%

s
s e pesos

130
do
Rio dedeacidentes
população
TRABALHO
•Kelly
participação
PIB: 120
Janeiro
total;
1.750
16,6%
56,5% +10
.000
de - no 130
por
70 ⎯|Mário
Lúcio
• PIB:808,9% José
de70,→seubr)
71, 72, 7
ntagem

conseguinte
34.610 acidentes o
5000 8
n
PIBéPaulo
de trabalho
amostra
Brasil
participação- 1970
8 no20
na
a6,0
idade

5000
Notas

é6 ,0
de

participação

Lúcio
Kelly
Amodal
São tambémModa
- → José =o6,0
2005. 1.500por .000 6
POPU
figuraBrasil
designado doao lado.
de

da

maior
181 705 acidentes 4000
6País4000 com
→i éd d l ll

Para saber mais, basta adquirir o livro “Estatística usando o excel”, de Juan Carlos
Lapponi. WWW.SUBMARINO.COM.BR

4ª Edição, Edição 2005, 496 págs. Editora Elsevier Campus - Acompanha CD-ROM com Planilhas, Modelos,
Simuladores etc. para Excel.

O conteúdo deste livro é útil para: Estudantes que cursam Estatística nas diversas áreas do conhecimento e
em diferentes níveis de graduação como, em ordem alfabética, Administração, Biologia, Contabilidade,
Economia, Engenharia, Finanças, Marketing, Medicina, etc. Estudantes que necessitam aprimorar ou
complementar seus conhecimentos de Estatística utilizando o Excel. Profissionais das diversas áreas que
utilizam os conceitos de Estatística e necessitam, ou gostariam, de utilizar as funções estatísticas, as
ferramentas de análise, planilhas, modelos e simuladores de estatística em Excel. Todos aqueles que poderão
utilizar as planilhas, modelos e simuladores de estatística em Excel da forma como estão no CD-Rom, ou
modificando-os, para atender às suas necessidades. Alunos de áreas correlatas que utilizarão estatística e
desejam antecipar seu aprendizado e agregar valor ao seu conhecimento visando o mercado de trabalho. Usuários de Excel que desejam
conhecer e aprender a utilizar os recursos de Estatística disponíveis.

TÓPICOS
• DADOS, VARIÁVEIS E AMOSTRAS
• DESCRIÇÃO DE AMOSTRAS COM TABELAS E GRÁFICOS
• MEDIDAS DE TENDÊNCIA CENTRAL
• MEDIDAS DE DISPERSÃO/VARIAÇÃO
• PROBABILIDADE
• CORRELAÇÃO
• VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS
• DISTRIBUIÇÕES CONTÍNUAS
• COMBINAÇÃO LINEAR DE VARIÁVEIS ALEATÓRIAS
• DISTRIBUIÇÃO AMOSTRAL
• ESTIMAÇÃO
• TESTE DE HIPÓTESES
• TESTES DE HIPÓTESES COM DUAS AMOSTRAS
• ANÁLISE DA VARIÂNCIA
• REGRESSÃO LINEAR
• AJUSTE NÃO LINEAR

Uanderson Rebula de Oliveira Estatística Aplicada


LIVROS PUBLICADOS POR
Uanderson Rébula de Oliveira
QUERO Esses ebooks estão disponíveis na livraria Saraiva por
COMPRAR preços bem acessíveis.

OS LIVROS Além disso, você pode imprimir, desenhar,


esquematizar ou usar qualquer leitor pdf,
pois a maioria deles encontra-se
desbloqueado.

Prof. Uanderson Rébula. Doutorando em


Ver amostras Engenharia. Professor universitário. Vivência
de 21 anos em ambiente industrial.
dos livros
uanderson.rebula@yahoo.com.br
http://lattes.cnpq.br/1039175956271626
https://br.linkedin.com/in/uandersonrebula
Prof. MSc. Uanderson Rébula de Oliveira

Uma mensagem do Prof. MSc Uanderson Rébula. CLIQUE NO VÍDEO

CLIQUE AQUI E INSCREVA-SE NO CURSO JÁ

Sumário

You might also like