Professional Documents
Culture Documents
1a NOTA DE AULA
1 Introdução à Probabilidade
Nesta disciplina, serão abordados tópicos referentes à Teoria das Probabilidades, a
qual tem como principal objetivo construir modelos matemáticos que procuram explicar
fenômenos não-determinísticos ou probabilísticos; isto é; fenômenos que estão sujeitos à
fatores casuais. A Teoria das Probabilidades também é de fundamental importância para a
solução de problemas relacionados à Inferência Estatística.
1.1 Introdução
Ao lançar uma moeda e observar a face superior, de modo geral, não podemos afirmar
se ocorrerá cara ou coroa. Da mesma forma, quando lançamos um dado não sabemos qual
das faces 1, 2, 3, 4, 5, ou 6 ocorrerá. No campo dos negócios e do governo há numerosos
exemplos de tais situações. Por exemplo, a incerteza existe quando desejamos realizar uma
previsão sobre a procura de um novo produto, a opinião pública em relação a determinado
assunto, o sucesso de um novo plano econômico, etc - tudo isso contém algum elemento
de acaso.
Na Estatística, a incerteza existe quando se quer fazer alguma afirmação a respeito de
alguma característica populacional baseada em informações extraídas de dados amostrais.
Neste caso, a aplicação da Teoria das Probabilidades é de fundamental importância
para a solução de problemas de Inferência Estatística.
Independente de qual seja a aplicação em particular, a utilização das probabilidades
indica que existe um elemento de acaso, ou de incerteza, quanto à ocorrência ou não de um
possível resultado. Assim é que em muitos casos, pode ser virtualmente impossível afirmar
com antecipação o que ocorrerá. No entanto, é possível dizer o que pode ocorrer.
O ponto central em todas essas situações é a possibilidade de quantificar quão provável
é determinado evento.
Em suma, podemos dizer que, as probabilidades são utilizadas para exprimir a chance
de ocorrência de determinado evento.
1
1.1.1 Definições Básicas
Notação: E.
Exemplos:
E1 : Lançar uma moeda e observar a face superior.
E2 : Lançar um dado e observar o número da face superior.
E3 : Ao fabricar uma lâmpada, observar o tempo de vida útil da mesma.
Observações:
a) Cada experimento poderá ser repetido um grande número de vezes sob as mesmas
condições;
b) Não podemos afirmar que resultado particular ocorrerá, porém podemos descrever
o conjunto de todos os possíveis resultados do experimento;
c) Quando o experimento é repetido um grande número de vezes, surgirá uma regular-
idade nos resultados. Esta regularidade, chamada de regularidade estatística, é que torna
possível construir um modelo matemático preciso com o qual se analisará o experimento.
Definição 1.2 (Espaço Amostral). É um conjunto que contém todos os possíveis re-
sultados de um experimento aleatório.
Notação: S
Exemplos:
Alguns espaços amostrais associados aos experimentos aleatórios E1 , E2 e E3 são:
S1 =
S2 =
S3 =
2
Definição 1.3 (Evento). Dado um espaço amostral S associado a um experimento E,
definimos como evento, qualquer subconjunto desse espaço amostral, ou seja, é qualquer
coleção de resultados do experimento E.
Notação: A, B, C, D, etc.
Exemplos:
Observação:
3
(Desenhar os Diagramas de Venn, para cada evento)
Exemplos:
a) C d) B g) A j) A ∩ B m) B − A
b) D e) A ∪ B h) B k) A ∪ B n) A − B
c) A f) A ∩ B i) A ∪ B l) A ∩ B
(i) A ∪ B = A ∩ B
(ii) A ∩ B = A ∪ B
4
1.2 Abordagens para Definir Probabilidade
1.2.1 Aproximação da Probabilidade pela Freqüência Relativa - (Lei dos
Grandes Números)
Observação: Esta aproximação será tanto melhor quanto maior for o número de
repetições do experimento.
Exemplos:
1 - Ao lançar uma moeda honesta 5 vezes, ocorreram 4 caras. Baseado neste resultado,
qual a probabilidade (aproximada) do evento A : ocorrer cara?
2 - Considere as seguintes situações:
(i) Numa pesquisa de mercado, 5 pessoas foram entrevistadas das quais 4 disseram
que comprariam um novo produto a ser lançado.
(ii) Numa outra pesquisa de mercado, 300 pessoas foram entrevistadas das quais
140 disseram que comprariam um novo produto a ser lançado.
5
1.2.2 Definição Clássica de Probabilidade
Definição 1.6 (Evento Simples e Evento Composto). Cada um dos possíveis resulta-
dos que compõe o espaço amostral e1 , e2 , ... é um evento simples, enquanto um evento
composto, A, é uma coleção de eventos simples.
Exemplo: Ao lançar um dado, os eventos simples serão: {1}, {2}, {3}, {4}, {5} e {6}
e um evento composto seria A : número par = {2, 4, 6}.
Observações:
(1) Nesta definição é fundamental que os eventos simples sejam igualmente prováveis,
e, neste caso, é evidente que:
(2) Espaços amostrais com as características acima descritas são conhecidos como
Espaços Amostrais Finitos e Equiprováveis.
Exemplos:
6
1.2.3 Definição Axiomática de Probabilidade
Observações:
1) A probabilidade de um evento A, denotada por P (A) , indica a chance de ocorrência
do evento A. Quanto mais próxima de 1 é P (A), maior é a chance de ocorrência do evento
A, e quanto mais próxima de zero, menor é a chance de ocorrência do evento A.
Principais Propriedades:
Demonstrações:
7
1.3 Métodos de Enumeração ou Técnicas de Contagem
Nem sempre a tarefa de calcular a probabilidade de um evento aleatório, da forma
P (A) = r/n, é simples. Em algumas situações é necessário alguns procedimentos sis-
temáticos de contagem ou enumeração para se obter o número de maneiras, r, pelas quais
A pode ocorrer, bem como o número total de maneiras, n, pelas quais o espaço amostral
S pode ocorrer.
É no contexto descrito acima, que as técnicas de contagem são de fundamental im-
portância. Neste curso, veremos algumas das principais técnicas.
Suponha que um experimento possa ser realizado em k etapas, de modo que, para a
primeira etapa existem n1 resultados possíveis, para a segunda etapa n2 resultados possíveis,
e assim sucessivamente, até que para a k − ésima etapa existem nk resultados possíveis.
Então, existe um total de
n1 × n2 × .... × nk
resultados possíveis para este experimento.
Exemplos:
1 - Ao lançar um dado e uma moeda, quantos resultados possíveis podem ser obtidos?
2 - Uma companhia produz fechaduras que usam segredos numéricos para serem abertas.
Se cada segredo consiste de três números distintos, escolhidos dentre os inteiros de
0 a 9, quanto segredos diferentes poderão ser fabricados?
8
1.3.3 Permutação e Arranjo
nPn = n!
n!
nAr = .
(n − r)!
Exemplos:
a) com reposição;
b) sem reposição.
1.3.4 Combinação
9
Agora, note que o número de maneiras possíveis para realizar simultaneamente os
procedimentos 1 e 2 é igual ao número de arranjos, de modo que, pelo PFC, tem-se
n!
nCr × r! = nAr = .
(n − r)!
P (A ∩ B) = P (A)P (B).
10
1a LISTA DE EXERCÍCIOS
1 - Uma caixa com N lâmpadas contém r lâmpadas (r < N ) com filamento partido.
Essas lâmpadas são verificadas uma a uma, até que uma lâmpada defeituosa seja en-
contrada. Descreva um espaço amostral para este experimento. Suponha agora, que
as lâmpadas são verificadas até que todas as defeituosas sejam encontrdas. Descreva
um espaço amostral para este experimento.
2 - O seguinte grupo de pessoas está numa sala: 5 homens maiores de 21 anos; 4 homens
com menos de 21 anos de idade; 6 mulheres maiores de 21 anos, e 3 mulheres menores.
Uma pessoa é escolhida ao acaso. Definem-se os seguintes eventos:
A: A pessoa é maior de 21 anos
B: A pessoa é menor de 21 anos
C: A pessoa é homem
D: A pessoa é mulher
Calcule:
a) P (B ∪ D)
b) P (A ∩ C)
8 - Um dado é viciado de tal forma que a probabilidade de sair um certo ponto é propor-
cional ao seu valor (por exemplo, o ponto 6 é 3 vezes mais provável de sair do que o
ponto 2). Calcular a probabilidade de tirar um número par, sabendo-se que saiu um
número maior que 3.
11
9 - Mostre que se A, B e C são eventos tais que P (A ∩ B ∩ C) 6= 0 e P (C | A ∩ B) =
P (C | B), então P (A | B ∩ C) = P (A | B).
10 - Uma caixa tem três moedas: uma não viciada, outra com duas caras e uma terceira
viciada, de modo que a probabilidade de ocorrer cara nesta moeda é de 15 . Uma
moeda é selecionada ao acaso na caixa. Saiu cara. Qual a probabilidade de que a
moeda viciada tenha sido a selecionada?
11 - Uma urna contém 4 bolas brancas e 6 bolas vermelhas; outra urna contém 3 bolas
brancas e 6 vermelhas. Passa-se uma bola, escolhida ao acaso, da primeira para a
segunda urna, e em seguida, retiram-se três bolas desta última, sem reposição. Qual
a probabilidade de que ocorram três bolas da mesma cor?
13 - Uma companhia de seguros analisou a freqüência com que 2000 segurados usaram o
hospital. Os resultados são apresentados na tabela:
homens mulheres
usaram o hospital 100 150
não usaram o hospital 900 850
12
19 - João e Maria marcam um encontro no Iguatemi entre 17 horas e 18 horas com a
seguinte condição: Um espera pelo outro no máximo 15 minutos. Qual a probabili-
dade de que o encontro aconteça?
23 - Suponhamos agora que queiramos estender este resultado ao caso de três moedas.
Qual a probabilidade de três caras?
24 - Pedro tem dois automóveis velhos. Se nas manhãs frias, há 20% de probabilidade de
um deles não funcionar e 30% de outro não funcionar,
13
27 - Ao escolher entre diversos fornecedores de computadores, um comprador deseja saber
a probabilidade de um computador falhar durantes os dois primeiros anos. Sabendo-se
que só existem duas possibilidades; ou o computador falha durante os dois primeiros
anos ou não falha, qual é essa probabilidade? Agora se você conhecesse o resultado
de uma pesquisa do PC World feita com 4000 usuários de computadores, na qual
revela que 992 computadores falham durantes os dois primeiros anos, qual será a
probabilidade estimada?
29 - Uma urna contém duas bolas brancas e cinco pretas. Qual a probabilidade de sair
duas bolas pretas supondo que os sorteios são feitos com reposição?
32 - Uma urna contém duas bolas brancas, três pretas e cinco azuis.
14
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Introdução à Probabilidade Período 2012.1
Professora: Amanda dos Santos Gomes
Aluno(a): .
2a NOTA DE AULA
B=
E, portanto,
P (A) =
P (B) =
15
Suponha, agora, que soubéssemos da ocorrência de B e que quiséssemos calcular a
probabilidade de A. Iremos denotar essa probabilidade como P (A | B). Assim,
P (A | B) =
P (B | A) =
Note que, no cálculo das probabilidades condicionais, o espaço amostral foi reduzido
ao evento B e A, respectivamente.
Formalmente definimos probabilidade condicional da maneira a seguir.
P (A ∩ B) = P (A)P (B | A).
Observação:
Note que, se A e B são independentes, então
P (A ∩ B) P (A)P (B)
P (A | B) = = = P (A).
P (B) P (B)
16
2.2 Teorema da Probabilidade Total
Definição 2.2 (Partição do Espaço Amostral). Dizemos que os eventos B1 , B2 , ..., Bk
representam uma partição do espaço amostral S, quando
a) Bi ∩ Bj = φ, para todo i 6= j,
b) ∪ki=1 Bi = S,
c) P (Bi ) > 0, para todo i.
A = (A ∩ B1 ) ∪ (A ∩ B2 ) ∪ (A ∩ B3 ) ∪ ... ∪ (A ∩ Bk ).
Logo,
P (A) = P (A ∩ B1 ) + P (A ∩ B2 ) + P (A ∩ B3 ) + ... + P (A ∩ Bk ).
Este resultado é o que chamamos de Teorema de Bayes. Esse teorema é útil quando
conhecemos as probabilidades dos Bi ’s e a probabilidade condicional de A dado Bi , mas
não conhecemos diretamente a probabilidade de A.
17
2a LISTA DE EXERCÍCIOS
1 - Suponha que a probabilidade de que ambas crianças gêmeas sejam meninos é 0,30 e
que a probabilidade de que sejam meninas é 0,26. Dado que a probabilidade de uma
criança seja menino é 0.52, qual é a probabilidade de que:
2 - A proporção de peças produzidas pelas máquinas I, II e III é 30%, 30% e 40%, re-
spectivamente. Dentre estas peças, 4%, 3% e 2%, respectivamente, são defeituosas.
Uma peça escolhida aleatoriamente, foi testada e verificou-se ser defeituosa. Qual é
a probabilidade de que a peça tenha sido produzida pela máquina I? E pela máquina
II? E pela III?
a) Qual a probabilidade de que ele sabia a resposta dado que a pergunta foi re-
spondida corretamente?
b) Calcule o limite da probabilidade do item anterior quando m → ∞ com p fixo.
Interprete este resultado.
5 - Uma urna contém duas bolas brancas, três verdes e cinco azuis. Se três bolas são
retiradas ao acaso, sem reposição, determine a probabilidade de:
18
8 - Empregados de certa firma são submetidos a um teste de aptidão quando empregados
pela primeira vez. A experiência mostrou que dos 60 por cento que passaram no teste,
80 por cento deles eram bons trabalhadores, enquanto dos 40 por cento dos que não
conseguiram passar só 30 por cento foram avaliados como bons trabalhadores. Qual
a probabilidade de que um empregado escolhido ao acaso seja um bom trabalhador?
Use aqui a técnica da árvore. Resp.: 0,60.
9 - Suponhamos que seja p a probabilidade de que o tempo (com sol ou nublado) seja o
mesmo do dia anterior. Se hoje for dia de sol, qual a probabilidade de que depois de
amanhã tenhamos também um dia de sol? Resp.: 2p2 − 2p + 1
19
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Introdução à Probabilidade Período 2012.1
Professora: Amanda dos Santos Gomes
Aluno(a): .
3a NOTA DE AULA
3.1 Introdução
Ao descrever um espaço amostral S associado a um experimento E, podemos obser-
var que os resultados possíveis não são, necessariamente, núméricos. Consideremos, por
exemplo, o seguinte experimento:
E1 : Lançar duas moedas e observar a face superior de cada uma.
Neste experimento, temos S = {CC, CK, KC, KK} e, na prática, o que realmente
podemos estar interessados em observar é, por exemplo, o número de vezes que ocorre
cara (K), ou seja, temos interesse num número real que está associado a cada resultado do
espaço amostral S.
Esquematicamente, temos:
20
Exemplo: Mostre (esquematicamente) que: Se X é o número de vezes que ocorre
cara(K) ao lançar duas moedas, então, X é uma variável aleatória.
A = {s ∈ S; X(s) ∈ B}.
Exemplo: A partir do exemplo anterior, temos RX = {0, 1, 2}, onde cada um desses
valores ocorre com as seguintes probabilidades:
21
3.2 Variáveis Aleatórias Discretas
Definição 3.4 (Variável Aleatória Discreta). Dizemos que uma variável aleatória é
discreta se o conjunto formado pelos possíveis valores que essa variável assume for
finito ou infinito enumerável, de maneira que podemos listar todos os resultados como
x1 , x2 , x3 , ....
1. p(xi ) ≥ 0, ∀i;
2. Σ∞
i=1 p(xi ) = 1
O conjunto de todos os pares [xi , p(xi )], i = 1, 2, ..., n, ... é definido como a Dis-
tribuição de Probabilidades da variável aleatória X.
Exemplos:
2 ) Uma urna contém duas bolas brancas (B) e três vermelhas (V). Suponha que duas
bolas sejam retiradas ao acaso, sem reposição. Se a v.a. X é o número de bolas
vermelhas nas duas retiradas, qual é a distribuição de X? Represente graficamente
a distribuição de X.
22
3.3 Variáveis Aleatórias Contínuas
Definição 3.6 (Variável Aleatória Contínua). A variável aleatória X é contínua se
existir uma função f , denominada função densidade de probabilidade (f.d.p.) de X
que satisfaça às seguintes condições:
a) f (x) ≥ 0 para todo x;
R +∞
b) −∞ f (x)dx = 1.
P (a ≤ X ≤ b) = P (a < X ≤ b)
= P (a ≤ X < b)
= P (a < X < b)
Z b
= f (x)dx.
a
Probabilidade essa, que pode ser representada pela área sob o gráfico da função f no
intervalo [a, b], tal como ilustrado abaixo:
Rb
(Esboçar o gráfico representando a área definida por P (a < X < b) = a
f (x)dx)
Exemplos:
1 - Suponha que estamos atirando dardos em um alvo circular de raio de 10 cm, e seja
X a distância do ponto atingido pelo dardo ao centro do alvo. A f.d.p. de X é
½
kx, 0 ≤ x ≤ 10
f (x) =
0, c.c
a) Qual a probabilidade de acertar a mosca, se ela é um círculo de raio 1 cm?
b) Mostre que a probabilidade de acertar qualquer círculo concêntrico é propor-
cional a sua área.
2 - Uma variável aleatória contínua X é dita ter distribuição uniforme se a sua f.d.p. é
da forma ½
k, se a < x < b
f (x) =
0, caso contrário
23
a) Encontre o valor de k para que a função f seja realmente uma f.d.p.
b) Esboce o gráfico da distribuição de X.
Observação:
a) Se a variável aleatória X for discreta, então a função de distribuição será dada por
X
F (x) = P (X ≤ x) = p(xi ),
i ; xi ≤x
b) Se a variável aleatória X for contínua, então a função de distribuição será dada por
Z x
F (x) = P (X ≤ x) = f (t)dt.
−∞
Exemplos:
1 - Suponhamos que a variável aleatória X tome os três valores 0,1 e 2, com proba-
bilidades 1/3, 1/6 e 1/2, respectivamente. Encontre a função de distribuição F e
represente-a graficamente.
24
3.4.1 Propriedades da Função de Distribuição
Teorema 3.1. Seja X uma variável aleatória discreta, com valores possíveis x1 , x2 , ...,
e suponha-se que esses valores tenham sido indexados de modo que x1 < x2 < .... Seja
F a função de distribuição de X. Então,
onde F (x−
i ) ≡ limh→0− F (xi + h).
Observações:
25
Exemplos:
1 - Sabendo-se que a v.a. X assume os valores 1,2 e 3 e que sua função de distribuição
F (x) é tal que
F (1) − F (1− ) = 1/4,
F (2) − F (2− ) = 1/2,
F (3) − F (3− ) = 1/4.
Obter a distribuição de X, a função de distribuição acumulada e seu respectivo
gráfico.
26
3a LISTA DE EXERCÍCIOS
1 - Considere uma urna contendo três bolas vermelhas e cinco pretas. Retire três bolas,
sem reposição, e defina a v.a. X igual ao número de bolas pretas. Obtenha a
distribuição de X.
2 - Repita o problema anterior, mas considerando extrações com reposição.
3 - Generalize o problema 1, considerando uma urna contendo N bolas, dentre as quais
k são pretas e as demais são vermelhas, e, além disso, considerando a retirada, sem
reposição, de n bolas. Descreva o conjunto de valores que a variável aleatória X
pode assumir.
Obs.: A variável aleatória X, neste caso, é dita ter Distribuição Hipergeométrica
com parâmetros N , r e n.
4 - Uma moeda perfeita é lançada quatro vezes. Seja Y o número de caras obtidas.
Calcule a distribuição de Y .
5 - Repita o problema anterior, considerando agora que a moeda é viciada, sendo a
probabilidade de cara dada por p, 0 < p < 1, p 6= 1/2.
6 - Generalize o problema 5, para n lançamentos da moeda.
Obs.: A variável aleatória Y , neste caso, é dita ter Distribuição Binomial com
parâmetros n e p.
7 - Suponhamos que uma válvula eletrônica seja posta em um soquete e ensaiada. Ad-
mitamos que a probabilidade de que o teste seja positivo seja 34 ; daí, a probabilidade
de que seja negativo é igual a 14 . Adimitamos também que estejamos ensaiando uma
partida grande dessas válvulas. Os ensaios continuam até que a primeira válvula
positiva apareça. Considere a variável aleatória X: no de testes necessários para
concluir o experimento. Assim
S=
P (X = n) =
8 - Dada a função ½
2e−2x , x ≥ 0
f (x) =
0, x < 0,
a) Mostre que esta função é uma f.d.p. e represente-a através de um gráfico.
b) Obtenha a função de distribuição de X e calcule a probabilidade de X > 10.
9 - Seja X o tempo até a desintegração de alguma partícula radioativa e suponha que a
função de distribuição de X seja dada por
½
0, x < 0,
F (x) = −λx
1 − e , x > 0.
Suponha que λ seja tal que P (X ≥ 0, 01) = 1/2. Obtenha um número t tal que
P (X ≥ t) = 0, 9.
27
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Introdução à Probabilidade Período 2012.1
Professora: Amanda dos Santos Gomes
Aluno(a): .
4a NOTA DE AULA
4.1 Introdução
No estudo de variáveis aleatórias algumas características numéricas podem nos
fornecer uma idéia sobre o comportamento da distribuição de probabilidades. Estas
características são conhecidas como parâmetros da distribuição.
Pode acontecer que esta integral (imprópria) não convirja. Conseqüentemente, diremos
que E(X) existirá se, e somente se,
Z +∞
|x| f (x)dx < ∞.
−∞
28
Exemplos:
1 - Um fabricante produz peças tais que 10% delas são defeituosas e 90% delas são
não-defeituosas. Se uma peça defeituosa for produzida, o fabricante perde R$ 1,00,
enquanto uma peça não-defeituosa lhe dá um lucro de R$ 5,00. Se X for o lucro
líquido por peça, qual o valor esperado de X?
2 - Uma variável aleatória contínua X definida num intervalo [a, b] é dita ter distribuição
uniforme se possui a seguinte f.d.p.
½ 1
b−a
, a ≤ x ≤ b,
f (x) =
0, c.c.
3 - Suponha que a variável aleatória X represente o tempo (em minutos) durante o qual
um equipamento elétrico é utilizado em carga máxima. Suponha ainda, que X seja
uma variável aleatória contínua com a seguinte f.d.p.:
x
15002 , 0 ≤ x ≤ 1500,
−(x−3000)
f (x) = , 1500 < x ≤ 3000,
15002
0, c.c.
Definição 4.2 (Esperança de uma Função de Variável Aleatória). Seja X uma variável
aleatória e seja Y = H(X) uma função contínua. Então,
(a) Se Y for uma variável aleatória discreta com valores possíveis y1 , y2 , ... e se
p(yi ) = P (Y = yi ), o valor esperado de Y é definido por
E(Y ) = Σ∞
i=1 yi p(yi ).
29
(b) Se Y for uma variável aleatória contínua com f.d.p. fY , o valor esperado de
Y é definido por Z +∞
E(Y ) = yfY (y)dy.
−∞
E(Y ) = E[H(X)] = Σ∞
j=1 H(xj )p(xj ).
(b) Se X for uma variável aleatória contínua com f.d.p. fX , tem-se que o valor
esperado de Y será dado por
Z +∞
E(Y ) = E[H(X)] = H(x)fX (x)dx.
−∞
1. E[k] = k.
2. E[X + k] = E(X) + k.
3. E[kX] = kE(X).
Demonstrações:
30
Exemplos:
1 - Um fabricante produz peças tais que 10% delas são defeituosas e 90% delas são
não-defeituosas. Se uma peça defeituosa for produzida, o fabricante perde R$ 1,00,
enquanto uma peça não-defeituosa lhe dá um lucro de R$ 5,00. Se X for o lucro
líquido por peça, determine:
a) O valor esperado de X?
b) Se houver um aumento de 10% nos valores de X, qual será o lucro líquido
esperado?
c) E Se houver um acréscimo de R$ 0,10 nos valores de X, em média, quanto será
o lucro líquido?
onde µ = E(X).
31
Exercício:
1 - Mostre que
Exemplos:
1 - Se X é uma variável aleatória uniforme num intervalo [a, b], ou seja, X ∼ U (a, b),
qual é o valor de V ar(X)?
2 - Seja V a velocidade do vento (em milhas por hora) e suponha que V seja uniforme-
mente distribuída sobre o intervalo [0, 10]. A pressão, digamos W (em libras/pé
quadrado), na superfície da asa de um avião é dada pela relação W = 0, 003V 2 .
Encontre o valor esperado de W .
Obtenha a variância de X.
1. V ar(k) = 0.
2. V ar(X + k) = V ar(X).
3. V ar(kX) = k 2 V ar(X).
Demonstrações:
32
4a LISTA DE EXERCÍCIOS
X=x 0 1 2 3 4 5 6 7 8 9 10
P (X = x) 0,05 0,15 0,15 0,06 0,06 0,06 0,06 0,06 0,15 0,15 0,05
2 - Uma urna contém 4 bolas brancas e 6 pretas. 3 bolas são retiradas com reposição.
Seja X : o número de bolas brancas. Calcular E(X) e V ar(X). Resp.: E(X) = 1, 2
e V ar(X) =?.
a) E(X + 3)2 ;
b) V ar(3X − 2).
Resp.: a) 38 b) 18.
4 - Um banco pretende aumentar a eficiência de seus caixas. Para isto, o banco está
oferecendo um prêmio de R$ 150,00 para cada cliente atendido, além de 42 clientes
por dia. O banco tem um ganho operacional de R$ 100,00 para cada cliente atendido
além de 41. As probabilidades de atendimento são:
no de clientes Até 41 42 43 44 45 46
Probabilidade 0,88 0,06 0,04 0,01 0,006 0,004
Qual o ganho esperado do banco, se este novo sistema for implantado? O sistema é
vantajoso para o banco? Resp.: E(X) = 7, 30.
5 - Suponhamos que dez cartas estejam numeradas de 1 até 10. Das dez cartas, retira-se
uma de cada vez, ao acaso e sem reposição, até retirar-se o primeiro número par. Se
X é uma variável aleatória que expressa o número de retiradas necessárias.
33
6 - Um vendedor de equipamentos pesado pode visitar, num dia, um ou dois clientes,
com probabilidade de 1/3 ou 2/3, respectivamente. De cada contato, pode resultar
a venda de um equipamento por R$ 50.000,00(com probalidade 1/10) ou nenhuma
venda (com probabilidade 9/10). Indicando por Y o valor total de vendas diárias
desse vendedor:
T =t 2 3 4 5 6 7
P (T = t) 0,1 0,1 0,3 0,2 0,2 0,1
9 - A percentagem de álcool (100X) em certo composto pode ser considerada uma va-
riável aleatória, onde X, tem a seguinte função densidade:
34
T 3 4 5 6 7 8 9
pi 0,1 0,1 0,2 0,2 0,2 0,1 0,1
11 - Suponha que a demanda por certa peça, numa loja de autopeças, siga o seguinte
modelo:
a2k
P (X = k) = , k = 1, 2, 3, 4.
k!
a) Encontre o valor de a.
b) Calcule a F.d.a de X.
c) Calcule a demanda esperada.
d) Qual é a variabilidade da demanda?
14 - Considere uma variável aleatória X com resultados possíveis: 0,1,2,... Suponha que
P (X = j) = (1 − a)aj , j = 0, 1, 2, ...
a) Para que valores de a o modelo acima tem sentido?
b) Verifique que essa expressão representa uma legítima distribuição de probabilidade.
c) Mostre que, para quaisquer dois inteiros positivos s e t,
35
16 - A variável aleatória contínua tem f.d.p. f (x) = 3x2 , −1 ≤ x ≤ 0. Se b for um
número que satisfaça a −1 < b < 0, calcule P (X > b | X < b/2).
18 - O diâmetro X de um cabo elétrico supõe-se ser uma variável aleatória contínua com
f.d.p. f (x) = 6x(1 − x), 0 ≤ x ≤ 1.
a) Verifique que essa expressão é uma f.d.p. e esboce seu gráfico.
b) Obtenha uma expressão par a F.d.a. da variável X.
c) Determine um número b tal que P (X < b) = 2P (X > b).
d) Calcule P (X ≤ 1/2 | 1/3 < X < 2/3).
19 - Uma variável aleatória X pode tomar quatro valores, com probabilidades (1+3x)/4, (1−
x)/4, (1 + 2x)/4 e (1 − 4x)/4. Para que valores de x é essa uma distribuição de
probabilidade?
a)Calcule a F.d.a.
b) Para um fóssil encontrado nessa região, determine a probabilidade do comprimento
ser inferior a 6 cm? E de ser superior a 5 mas inferior a 10,5 cm.
c)Encontre o valor esperado para o comprimento dos fósseis da região.
36
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Introdução à Probabilidade Período 2012.1
Professora: Amanda dos Santos Gomes
Aluno(a): .
5a NOTA DE AULA
Definição: Seja X uma variável aleatória cujos possíveis valores são representados por
x1 , x2 , ..., xk . Dizemos que X segue o modelo Uniforme Discreto se atribui a mesma pro-
babilidade 1/k a cada um desses k valores, isto é, sua função de probabilidade é dada por
1
P (X = xj ) = , ∀j = 1, 2, ..., k.
k
Exemplo: Uma rifa tem 100 bilhetes numerados de 1 a 100. Tenho 5 bilhetes consec-
utivos numerados de 21 a 25, e meu colega tem outros 5 bilhetes, com os números 1, 11,
29, 68 e 93. Quem tem maior possibilidade de ser sorteado?
Propriedades
É fácil verificar que: Pk
xi
E(X) = i=1 ,
k
" k P #
1 X 2 ( ki=1 xi )2
V ar(X) = x − .
k i=1 i k
37
Nessas Condições a variável aleatória X segue o modelo de Bernoulli, e sua função de
probabilidade é dada por:
P (X = x) = px (1 − p)1−x , x = 0, 1.
Teorema 5.1. Seja X uma variável aleatória binomial com parâmetros n e p. Então
µ ¶
n
P (X = k) = pk (1 − p)n−k
k
Teorema 5.2. Seja X uma variável aleatória binomial com parâmetros n e p. Então
E(X) = np e V ar(X) = np(1 − p).
Considere um experimento cujos resultados podem ser classificados como sucesso ou fra-
casso. Seja p a probabilidade de sucesso, logo 1−p é a probabilidade de fracasso. Considere
a variável aleatória X: número de ensaios até ocorrer o primeiro sucesso. Suponha que os
ensaios são independentes. Dessa forma,
P (X = x) = (1 − p)x−1 p, x = 1, 2, ...
38
1
(i) E(X) = p
1−p
(ii) V ar(X) = p2
Exemplo: Se a probablidade de que um certo ensaio dê reação positiva for igual a 0,4,
qual será a probabilidade de que menos de 5 reações negativas ocorram antes da primeira
positiva?
Teorema 5.4. Se X :Geométrica(p) então, para dois quaisquer inteiros positivos s e
t,
P (X ≥ s + t | X > s) = P (X > t)
Consideremos uma população com N elementos, dos quais r têm uma determinada carac-
terística (sucesso). Retiramos dessa população, sem reposição, uma amostra de tamanho
n.
Seja X: número de sucessos na amostra.
Dessa forma a distribuição de probabilidade da variável aleatória X é dada por
µ ¶µ ¶
r N −r
k n−k
P (X = k) = µ ¶ , 0 ≤ k ≤ n, k ≤ r.
N
n
Uma variável aleatória X tem distribuição de Poisson com parâmetro λ > 0, se sua função
de probabilidade é dada por
e−λ λk
P (X = k) = , k = 0, 1, 2, ...,
k!
39
com o parâmetro λ sendo usualmente referido como a taxa de ocorrência. A notação
utilizada será X : P o(λ).
E(X) = λ
e
V ar(X) = λ.
Exemplo 1: Num livro de 800 páginas há 800 erros de impressão. Qual a probabilidade
de que uma página contenha pelo menos 3 erros?
Exemplo 2: Numa central telefônica chegam 300 telefonemas por hora. Qual a prob-
abilidade de que:
a) num minuto não haja nenhum chamado;
b) em 2 minutos haja 2 chamados;
c) em t minutos não haja chamados.
Definição: Uma variável aleatória contínua X tem distribuição uniforme no intervalo [a, b],
se sua f.d.p. for dada por:
½ 1
b−a
, a ≤ x ≤ b,
f (x) =
0, c.c.
a+b
(i) E[X] = 2
;
(b−a)2
(ii) V ar[X] = 12
.
40
5.2.2 Distribuição Exponencial
Definição: Uma variável aleatória contínua X, assumindo valores não negativos, terá dis-
tribuição exponencial com parâmetro α > 0, se sua f.d.p. é dada por
½
αe−αx , x > 0
f (x) =
0, c.c.
Notação: X : Exp(α).
Propriedades:
1 1
a) E (X) = α
e V ar (X) = α2
.
b) (Falta de memória) Para todo s, t > 0, teremos
Exemplos:
1) O intervalo de tempo em minutos entre emissões consecutivas de uma fonte radioa-
tiva é uma variável aleatória com distribuição exponencial de parâmetro α = 0, 2. Vamos
calcular a probabilidade de haver uma emissão em um intervalo inferior a 2 minutos.
2) Considerando a distribuição do exemplo anterior, calculemos agora, a probabilidade
do intervalo ser superior ou igual a 7, sabendo-se que ele é superior ou igual a 5 minutos.
Definição: Dizemos que a variável aleatória X tem distribuição normal com parâmetros µ
e σ 2 , −∞ < µ < ∞ e 0 < σ 2 < ∞, se sua f.d.p. é dada por
1 1 x−µ 2
f (x) = √ e− 2 ( σ ) , −∞ < x < ∞.
σ 2π
Notação: X : N (µ, σ 2 ) .
Propriedades
41
(v) Seja X : N (µ, σ 2 ), considere a variável Z = X−µ
σ
. Mostra-se que Z também tem
distribuição normal. Z é chamada de variável normal padrão ou reduzida. É fácil ver
que E(Z) = 0 e V ar(Z) = 1. Logo, a f.d.p. de Z é dada por
1 1 2
f (z) = √ e 2 z , −∞ < z < ∞.
2π
Exemplos:
a) P (100 ≤ X ≤ 106)
b) P (89 ≤ X ≤ 107)
c) P (112 ≤ X ≤ 116)
d) P (X ≥ 108)
a) P (X ≤ xα ) = 0, 05
b) P (X ≥ xα ) = 0, 99
42
5a LISTA DE EXERCÍCIOS
4 - O número de partículas Gama emitidas por segundo, por certa substância radioativa,
é uma variável aleatória com distribuição de Poisson com parâmetro λ = 3. Se
um instrumento registrador torna-se inoperante quando há mais de 4 partículas por
segundo, qual a probabilidade de isto acontecer em qualquer dado segundo?
6 - Uma moeda não viciada é lançada sucessivamente, de modo independente, até que
ocorra a primeira cara. Seja X a variável aleatória que conta o número de lançamentos
anteriores à ocorrência de cara. Determine:
a) P (X ≤ 2);
b) P (X > 1);
c) E(X) e V ar(X)
d) Quantas vezes deve, no mínimo, ser lançada a moeda para garantir a ocorrência
de cara com pelo menos 0,8 de probabilidade?
43
8 - Uma urna tem 10 bolas brancas e 40 pretas.
a) Qual a probabilidade de que a sexta bola retirada com reposição seja a primeira
branca?
b) Qual a probabilidade de que em 16 bolas retiradas sem reposição ocorram 3
brancas?
c) Qual a probabilidade de que em 30 bolas retiradas com reposição ocorram no
máximo 2 brancas?
10 - Admite-se que uma pane pode ocorrer em qualquer ponto de uma rede elétrica de 10
km com a mesma probabilidade.
a) Qual a probabilidade da pane ocorrer nos primeiros 500 metros? E de ocorrer nos
3 quilômetros centrais da rede? Resp. 1/20 e 3/10
b) O custo de reparo da rede depende da distância do centro de serviço ao local da
pane. Considere que o centro de serviço está na origem da rede e que o custo é de
R$ 200,00 para distâncias até 3quilômetros, de R$400,00 entre 3 e 8 quilômetros e
de R$ 1000,00 para as distâncias acima de 8 quilômetros. Qual é o custo médio do
conserto? Resp. 460
11 - Suponha que o valor esperado de uma variável aleatória com distribuição uniforme é
1 e a variância é igual a 1/12. Encontre a probabilidade da variável assumir valores
menores que 3/4. Resp. 1/4
13 - Suponha que o tempo de vida T de um vírus exposto ao meio ambiente segue uma
distribuição Exponencial com parâmetro λ = 1/20 s. Calcule a probabilidade condi-
cional P (T > 15 | T > 10) . Resp. 0,779
44
b) P (4 < X < 5) Resp. 0,3413
c) P (2 ≤ X < 5) Resp. 0,8187
d) P (5 ≤ X < 7) Resp. 0,1574
e) P (X ≤ 1) Resp. 0,0013
f) P (0 < X < 2) Resp. 0,0228
17 - Uma clínica de emagrecimento recebe pacientes adultos com peso seguindo uma
distribuição normal de média 130 kg e desvio padrão 20 kg. Para efeito de determinar
o tratamento mais adequado, os 25% pacientes de menor peso são classificados de
“magros”, enquanto os 25% de maior peso de “obesos”. Determine os valores que
delimitam cada uma dessas classificações. Resp. Magros: 116,6 kg Obesos: 143,4
kg
45
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Introdução à Probabilidade Período 2012.1
Professora: Amanda dos Santos Gomes
Aluno(a): .
6a NOTA DE AULA
6 Introdução à Estatística
Dentro dessa idéia, podemos considerar a Ciência Estatística como dividida basica-
mente em duas partes:
46
6.2.1 População e Amostra
Podemos citar como exemplo de população finita o conjunto formado pelos alunos
que cursam a disciplina de estatística num determinado semestre da UFCG. Um exemplo de
população infinita seria o conjunto formado por todos os alunos de estatística do Brasil,
pois este conjunto é composto por um número incontável de elementos.
Definição 6.3 (Amostra). A amostra é apenas uma parte da população, ou seja, é um
subconjunto da população.
Exemplos de algumas medidas numéricas são: proporção, média, moda, índices, etc.
47
6.2.3 Variáveis (ou Dados) e Tipos de Variáveis
Definição 6.6 (Variável). Uma Variável nada mais é que uma característica (ou dado)
associada a cada elemento da população ou amostra. A variável apresenta diferentes
valores, quando sujeita a mensurações sucessivas, e, em geral, é denotada pelas letras
maiúsculas: X, Y ou Z.
Tipos de Variáveis
Basicamente, as variáveis podem ser classificadas como sendo Qualitativas ou Quan-
titativas.
1. Variáveis Qualitativas - quando os valores que elas podem receber são referentes
à qualidade, atributo ou categoria. Exemplos são:
2. Variáveis Quantitativas - quando os valores que ela pode assumir são numéricos,
os quais podem ser obtidos através de uma contagem ou mensuração.
As variáveis quantitativas podem ser classificadas de acordo com o processo de
obtenção; podendo ser: Discreta ou Contínua.
48
(b) As variáveis quantitativas contínuas - são variáveis numéricas cujos valores
são obtidos por um procedimento de mensuração, podendo assumir quaisquer
valores num intervalo dos números reais, como por exemplo, a temperatura,
altura, salário, etc..
Observação 1. O fato de uma variável ser expressa por números não significa que ela
seja necessariamente quantitativa, por que a classificação da variável depende de como
foi medida, e não do modo como se manifesta. Por exemplo, para a variável peso de
um lutador de boxe, se for anotado o peso marcado na balança, a variável é quantitativa
contínua; por outro lado, se esse peso for classificado segundo as categorias do boxe, a
variável é qualitativa ordinal.
5. Relatar as conclusões de maneira que sejam facilmente entendidas por quem as for
usar na tomada de decisões.
49
6a LISTA DE EXERCÍCIOS
1 - Defina e/ou explique com suas próprias palavras, o que você entende por Ciência
Estatística e quais os principais ramos (partes) da Estatística.
2 - Através de um exemplo, defina: População e Amostra.
3 - Considere as seguintes situações:
1) Em uma pesquisa, feita pela EMPETUR com 1015 pousadas escolhidas aleato-
riamente, 269 (ou 26,5%) possuíam Home-page na Internet para divulgação e
prestação de serviços ao turista.
2) Outra pesquisa feita entre as 50 Agências de Viagens de uma certa localidade
mostra que 42 (ou 84%) prestam serviços pela Internet.
Identifique em qual das situações nós temos um exemplo de Parâmetro e outro de
Estatística (no sentido de medida). Justifique sua resposta.
4 - O que você entende por variável? Justifique a sua resposta por intermédio de um
exemplo.
5 - Como você diferencia uma variável discreta de uma variável contínua? Utilize um
exemplo para melhor ilustrar.
6 - Defina e/ou explique com suas próprias palavras, o que você entende por amostragem.
7 - Qual é o principal objetivo de qualquer plano de amostragem?
8 - As estatísticas geradas por intermédio de uma amostra devem ser representativas
desta amostra ou da população de origem? Justifique a sua resposta.
9 - Para que uma amostra seja representativa, é necessário apenas que a mesma tenha
um tamanho apropriado? Justifique a sua resposta.
10 - A Revista dos Eventos, N 13, tentando sanar, ao menos parcialmente, a carência
de informações precisas sobre a indústria de eventos, promoveu a 1a PESQUISA -
O Mercado de Congressos no Brasil. Os resultados desta pesquisa se baseiam em
40 questionários respondidos sobre um total de 1000, os quais foram encaminhados
por entrega pessoal a dirigentes de entidades integrantes do cadastro da própria
Revista dos Eventos. Qual é o problema ou a limitação desta pesquisa? Pelo menos
teoricamente, qual seria o melhor procedimento para este tipo de pesquisa, já que a
empresa possui um cadastro das entidades?
11 - Classifique cada uma das informações (variáveis) abaixo, de acordo com os tipos de
variáveis.
a) Nome
b) Nível de satisfação
c) Idade
d) Número de dias hospedado
50
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Introdução à Probabilidade Período 2012.1
Professora: Amanda dos Santos Gomes
Aluno(a): .
7a NOTA DE AULA
7 Estatística Descritiva
7.1 Introdução
A estatística pode ser considerada como um instrumento ou um conjunto de métodos
matemáticos que devem ser utilizados quando se pretende transformar dados em informação.
Para ilustrar este processo, veja a Figura 1:
12 15 18 Média
15 12 18 Moda
18 15 18 ⇒ Mediana
17 19 20 Proporção
Quantis
Conjunto de dados
Conjunto de informações
Figura 1:
No primeiro retângulo, tem-se um conjunto de observações da variável idade de um
grupo de 12 pessoas e, no segundo retângulo, as estatísticas (informações) que podem
representar esses números.
Desta maneira, fica fácil verificar a freqüência com que cada um dos dados foi obser-
vado, por exemplo: o valor 12 ocorreu 2 vezes; o valor 15 ocorreu 3 vezes, e assim por
diante.
51
Uma maneira adequada de apresentar os dados e suas respectivas freqüências é através
de uma Tabela de Freqüências, a qual é constituída por uma coluna referente aos
dados e outra referente às freqüências associadas a cada valor observado (ni ). Veja
como fica para o conjunto de dados da Figua 1:
52
Representação Gráfica
Neste gráfico, cada valor observado é representado por retângulos de mesma base
e alturas proporcionais às freqüências. Para ilustrar, veja como fica este gráfico para a
distribuição de freqüências da variável idade, utilizando a freqüência absoluta e relativa em
termos de porcentagem:
Figura 1:
3
3
2.5
2
2
1.5
1 1 1
1
0.5
0
12 15 17 18 19 20
Idade (anos)
Figura 2:
35.0% 33.3%
30.0%
25.0%
25.0%
20.0% 16.7%
15.0%
10.0% 8.3% 8.3% 8.3%
5.0%
0.0%
12 15 17 18 19 20
Idade (anos)
53
Exercício de Fixação
2 0 1 2 3 1 6 1 0 0
1 2 2 1 2 0 1 4 2 3
0 1 0 2 1 2 4 1 1 1
54
7.2.2 Distribuição de Frequências para Dados Agrupados em Classes
Código do aluno 1 2 3 4 5 6 7 8 9 10
Nota 7,5 8,0 9,0 7,3 6,0 5,8 10,0 3,5 4,0 6,0
Código do aluno 11 12 13 14 15 16 17 18 19 20
Nota 7,5 7,0 8,5 6,8 9,5 9,8 10,0 4,8 5,5 7,0
Note que, não haverá vantagem alguma se organizarmos estes dados numa tabela de
freqüências, uma vez que os dados pouco se repetem. Assim, torna-se útil o agrupamento
dos dados, que, de um modo geral, pode ser feito de acordo com os seguintes passos:
55
5. A partir do menor valor observado no conjunto de dados, ou de algum valor imediata-
mente inferior e adequadamente escolhido, delimitar as classes, ou seja, determinar
os limites inferiores e superiores de cada classe.
Neste momento, os seguintes símbolos são úteis:
(a) li − |Li - para indicar que o valor extremo inferior (li ) não pertence à i − sima
classe, enquanto que o valor extremo superior (Li ) pertence.
(b) li |−Li - para indicar que o valor extremo inferior (li ) pertence à i−sima classe,
enquanto que o valor extremo superior (Li ) não pertence.
De acordo com estes passos, o conjunto de dados anterior pode ser organizado como:
(Construir a tabela de freqüências para dados agrupados)
56
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Introdução à Probabilidade Período 2012.1
Professora: Amanda dos Santos Gomes
Aluno(a): .
8a NOTA DE AULA
3 2 1 2 5
5 3 2 1 2 5
(a) PM d = n+12
, se o total de observações, n, é ímpar. Assim, a mediana será
o valor observado na posição PM d ;
(b) P 1M d = n2 e P 2M d = n2 + 1, se o total de observações, n, é par. Pois, neste
caso, existem duas posições centrais e a mediana será a média aritmética dos
valores observados nestas duas posições.
Notação: M d ou M d(X).
57
Exemplo 1: A partir do conjunto de dados 1, pode-se obter o seguinte rol de dados:
1 2 2
|{z} 3 5
mediana
1 2 2|{z}3 5 5
dois valores centrais
58
2. Moda - é o valor (ou os valores) no conjunto de dados que ocorre(m) com maior
freqüência.
Notação: Mo ou Mo (X).
Exemplo 5: O primeiro conjunto de dados, 1 2 2 3 5, é dito ser unimodal,
tendo em vista que um único valor ocorre com maior frequência. Assim, a moda é
Mo = 2.
Exemplo 6: O segundo conjunto de dados, 1 2 2 3 5 5, é dito ser bimodal,
tendo em vista que, neste caso, dois valores ocorrem com maior frequência, assim,
os valores modais são: Mo = 2 e Mo = 5.
3. Média Aritmética (Média) - é obtida a partir da razão entre a soma dos valores
observados e o total de observações:
k
x1 + x2 + . . . + xk 1X
M e(X) = x = = xi
k k i=1
k
x1 .n1 + x2 .n2 + . . . + xk .nk 1X
M e(X) = x = = xi .ni (1)
n n i=1
k
X ni
= xi . (2)
i=1
n
Xk
= xi .fi . (3)
i=1
Onde:
59
• ni é freqüência absoluta do valor observado xi ,
P
• n = ki=1 ni é o total de observações, e,
• fi é freqüência relativa do valor observado xi .
k
1X 1 18
M e(X) = x = xi .ni = (1 × 1 + 2 × 2 + 3 × 1 + 5 × 2) = = 3.
n i=1 6 6
12 12 15 15 15 17 18 18 18 18 19 20
60
Solução:
Variável X : 3 4 5 6 7
Variável Y : 3 5 5 7
Note que a média M e(X) = M e(Y ) = 5, a qual nada informa sobre a variação dos
valores nos dois grupos. Assim, torna-se importante o conhecimento de uma medida que
forneça este tipo de informação.
Na prática, existem várias medidas que expessam a variabilidade de um conjunto de
dados, sendo que as mais utilizadas baseam-se na idéia que consiste em verificar a distância
de cada valor observado em relação à média. Estas distâncias são denominadas de desvios
em relação à média.
V ar(X) = s2
k
1X
= (xi − x)2 × ni
n i=1
k
X ni
= (xi − x)2 ×
i=1
n
61
k
X
= (xi − x)2 × fi
i=1
O uso do desvio padrão como medida de variabilidade é preferível pelo fato de ser
expresso na mesma unidade de medida dos valores observados. Pois, a variância pode
causar problemas de interpretação por ser expressa em termos quadráticos.
s
CV (X) = × 100 (expresso em porcentagem (%))
x
Exemplos:
√
a) O desvio padrão das variáveis X e Y é DP (X) = DP (Y ) = s = 2 = 1, 41.
62
7.3.4 Medidas de Posição: Quartis, Decis e Percentis
Assim como a mediana divide os dados em duas partes iguais, os três quartis, denota-
dos por Q1 , Q2 e Q3 , dividem as observações ordenadas (em ordem crescente) em quatro
partes iguais. A grosso modo:
- Q1 separa os 25% inferiores dos 75% superiores dos valores ordenados;
- Q2 separa os 50% inferiores dos 50% superiores, ou seja, é a mediana; e
- Q3 separa os 75% inferiores dos 25% superiores dos dados;
Analogamente, há nove decis, denotados por D1 , D2 , . . . , D9 , que dividem os dados
em 10 grupos com cerca de 10% deles em cada grupo. Finalmente, há 99 percentis que
dividem os dados em 100 grupos com cerca de 1% em cada grupo.
Basicamente, dois passos são necessários para se encontrar as medidas em questão.
Primeiro deve-se identificar a sua posição, e, em seguida, determinar o seu valor.
Veja a seguir, como obter os valores referentes aos percentis, quando se está traba-
lhando com dados brutos ou em distribuição de freqüências para dados não agrupados:
1 ◦ ) Identificar a posição do percentil que se deseja encontrar, através da seguinte
expressão: µ ¶
k
L= ×n
100
Onde:
- L é o valor que indica a posição do percentil de interesse;
- k é o k − ésimo percentil; e
- n é o total de dados observados.
2 ◦ ) Utilizar a seguinte regra:
Uma vez dominados os cálculos para os percentis, pode-se seguir o mesmo processo
para calcular
¡ ¢ os quartis e decis, tendo-se
¡ k ¢ o cuidado de calcular o valor de L, pelas fórmulas
L = k4 × n, k = 1, 2, 3 e L = 10 × n, k = 1, 2, . . . , 9, respectivamente. Pode-se,
ainda, obter os quartis e decis pelas seguintes relações existentes entre estas medidas e os
percentis:
63
Quartis Decis
Q1 = P25 D1 = P10
Q2 = P50 D2 = P20
..
Q3 = P75 .
D9 = P90
Intervalo interquartil = Q3 − Q1
Intervalo semi-interquartil = (Q3 − Q1 )/2
Amplitude de percentis 10-90 = P90 − P10
Eis as fórmulas para os cálculos dos quartis, decis e percentis para o caso de variáveis
agrupadas em classes.
Determinação do Q1 :
Passo 1: Calcula-se n4 .
Passo 2: Identifica-se a classe Q1 pela Ni .
Passo 3: Aplica-se a fórmula:
P
( n4 − f )h
Q1 = lQ1 +
nQ1
em que
lQ1 = limite inferior da classe Q1
n = tamanho da amostra ou número de elementos
P
f = soma das frequências anteriores à classe Q1
h = amplitude da classe Q1
nQ1 = frequência da classe Q1 .
Determinação do Q3 :
3n
Passo 1: Calcula-se 4
.
64
Passo 2: Identifica-se a classe Q3 pela Ni .
Passo 3: Aplica-se a fórmula:
P
( 3n
4
− f )h
Q3 = lQ3 +
nQ3
Determinação de um Decil:
in
Passo 1: Calcula-se 10
, em que i = 1, 2, 3, 4, 5, 6, 7, 8 e 9
Passo 2: Identifica-se a classe Di pela Ni .
Passo 3: Aplica-se a fórmula:
in
P
( 10 − f )h
Di = lDi +
nDi
Determinação de um percentil:
in
Passo 1: Calcula-se 100
, em que i = 1, 2, 3, . . . , 98 e 99
Passo 2: Identifica-se a classe Pi pela Ni .
Passo 3: Aplica-se a fórmula:
in
P
( 100 − f )h
Pi = lPi +
n Pi
Observação:
No caso de dados agupados em classes o histograma pode ser utilizado para se
obter o k − ésimo quartil, dercil ou percentil .
Para contornar estes problemas, 5 medidas foram sugeridas por Tukey (1977):
1 ◦ ) A mediana (M d);
2 ◦ ) Os extremos: o menor e o maior valor observado no conjunto de
dados (xmín e xmáx , respectivamente);
3 ◦ ) O primeiro e o terceiro quartil (ou junta).
65
7.4.1 Desenho Esquemático - Diagrama em Caixa ("Box-Plot")
As informações obtidas pelas 5 medidas podem ser representadas por um gráfico co-
nhecido por "Box-Plot"ou diagrama em caixa. Para construir este diagrama, consideremos
um retângulo onde estão representados a mediana e os quartis. A partir do retângulo, para
cima, segue uma linha até o ponto mais remoto que não exceda LS = Q3 + (1, 5)dp ,
chamado limite superior. De modo similar, da parte inferior do retângulo, para baixo, segue
uma linha até o ponto mais remoto que não seja menor do que LI = Q1 −(1, 5)dp , chamado
limite inferior. Os valores compreendidos entre esses dois limites são chamados valores
adjacentes. As observações que estiverem acima do limite superior ou abaixo do limite
inferior estabelecidos serão chamadas pontos exteriores e representadas por asteriscos.
Essas são observações destoantes das demais e podem ou não ser o que chamamos de
outliers ou valores atipicos.
O boxplot dá uma idéia da posição, dispersão, assimetria, caudas e dados discrepantes.
A posição central é dada pela mediana e a dispersão por dq . As posições relativas de q1 , q2 , q3
dão uma noção da assimetria da distribuição.
Veja, como fica o box-plot da variável Peso
Gráficos tipo box-plot também são úteis para detectar, descritivamente, diferenças
nos comportamentos de grupos de variáveis. Por exemplo, podemos considerar gráficos da
variável Peso para cada sexo. O resultado é apresentado na figura abaixo, em que podemos
notar que os homens apresentam peso mediano superior ao das mulheres, além de uma
maior variabilidade.
66
Figura 4: Box-plot da variável Peso para cada sexo
67
7a LISTA DE EXERCÍCIOS
Mostre
Pk que a soma dos desvios em relação à média é igual zero, ou seja, que
i=1 i − x) × ni = 0.
(x
20 30 40
3 - Mostre que:
³P ´2
k
k
X k
X i=1 xi ni k
X
2
(xi − x) × ni = x2i ni − = x2i ni − nx2
i=1 i=1
n i=1
E, por isso, a variância também pode ser obtida pela seguinte fórmula:
k
1X 22
V ar(X) = s = xi n i − x 2
n i=1
52 52 60 60 60 60 63 63 66 67
68 69 71 72 73 75 78 80 82 83
84 90
68
5 - O ROL de 50 notas de alunos de Estatística (dadas em créditos), estão relacionadas
abaixo:
33 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 81 71 67 63 64 53 73 81 50
67 68 53 75 65 58 80 60 63 53
7 - Em uma granja foi observada a distribuição do frangos em relação ao peso, que era
a seguinte:
P eso(gramas) ni
0960| − 0980 60
0980| − 1000 160
1000| − 1020 280
1020| − 1040 260
1040| − 1060 160
1060| − 1080 80
a) Construa o histograma;
b) Queremos dividir os frangos em quatro categorias, em relação ao peso, de modo
que: os 20% mais mais leves sejam da categoria D; os 30% seguintes sejam da
categoria C; os 30% seguintes sejam da categoria B; os 20% seguintes sejam da
categoria A. Quais os limites de peso entre as categorias A, B, C e D?
8 - Estudando-se o consumo diário de leite, verificou-se que, em certa região, 20% das
famílias consomem até um litro, 50% consomem entre um litro e dois litros, 20%
consomem entre dois e três litros e o restante consome entre três e cinco litros. Para
a variável em estudo:
69
a) Escreva as informações acima na forma de uma tabela de frequências.
b) Construa o histograma.
70
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE - Campus I
UNIDADE ACADÊMICA DE MATEMÁTICA E ESTATÍSTICA
Disciplina: Introdução à Probabilidade Período 2012.1
Professora: Amanda dos Santos Gomes
Aluno(a): .
9a NOTA DE AULA
8 Análise Bidimensional
8.1 Introdução
Em algumas situações, em análise de dados, surge a necessidade de um estudo sobre o
comportamento conjunto de duas ou mais variáveis. Para isso, a distribuição conjunta de
frequência será de grande utilidade. Iremos estudar apenas no caso de duas variáveis ou
dois conjuntos de dados. Nestes casos poderemos ter três situações:
As técnicas de análise de dados nas três situações são diferentes. Estudaremos apenas
os dois primeiros casos
Observações:
71
1. Cada célula do corpo da tabela apresenta o número de ocorrência simultânea dos
valores (x, y) de X e Y , constituindo a distribuição conjunta;
4. Assim como no caso de uma única variável, as frequências absolutas podem ser
expressas em termos de frequências relativas e/ou porcentagens, sendo que, de acordo
com o objetivo de cada análise, estas medidas podem ser obtidas em relação
1. Qual o percentual de pessoas que possuem o Ensino Médio e que são do interior?
72
2. Dentre os que possuem o Ensino Médio, qual é o percentual de pessoas provenientes
do interior?
73
Uma medida de dependência bastante utilizada para variáveis nominais é o coeficiente
de contingência, o qual é dado por:
s
χ2
C=
χ2 + n
O diagrama ou gráfico de dispersão nada mais é que a representação de pares dos valores
observados (x, y) num sistema cartesiano. Vejamos a ilustração de alguns gráficos que
podem surgir na prática:
74
40
35
30
Y
25
20
15
10
4 6 8 10 12
−30
−40
4 6 8 10 12
5
0
4 6 8 10 12
Ao ser observada uma associação entre as variáveis quantitativas, seria muito útil sabermos
sobre a intensidade desta associação e, como percebemos anteriormente (ver Gráficos de
75
800
600
V
400
200
0
4 6 8 10 12
5 a 8), existem vários tipos de associação. Aqui, veremos apenas uma medida referente
ao tipo de associação linear, ou seja, ao tipo de relação em que os pontos do gráfico de
dispersão aproximam-se de uma reta.
Definição - Dados n pares de valores (x1 , y1 ), (x2 , y2 ), ..., (xn , yn ), chama-se de coe-
ficiente de correlação entre as variáveis X e Y o valor obtido por
n
1 X xi − x y i − y
Corr(X, Y ) = ( )( ),
n i=1 dp(X) dp(Y )
ou seja, a média dos produtos dos valores reduzidos (ou padronizados) das variáveis.
Enquanto o coeficiente de contingência só assume valores entre 0 e 1, o coeficiente de
correlação pode assumir qualquer valor entre -1 e 1.
Uma fórmula alternativa e mais operacional para a correlação é dada por:
P
xi yi − nxy
Corr(X, Y ) = p P P .
( xi − nx2 )( yi2 − ny 2 )
2
cov(X, Y )
corr(X, Y ) =
dp(X)dp(Y )
76
8a LISTA DE EXERCÍCIOS
1 - Numa amostra de cinco operários de uma dada empresa foram observadas duas va-
riáveis: X: anos de experiência num dado cargo e Y : tempo, em minutos, gasto na
execução de uma certa tarefa relacionada a esse cargo. As observações são apresen-
tadas na tabela abaixo:
X 1 2 3 4 5
Y 7 8 3 2 2
Construa o diagrama de dispersão e calcule uma medida de dependência entre as
variáveis.
Homicidios 258 264 402 253 111 648 288 654 256 60 590
Populacao 4 6 9 6 3 29 15 38 20 6 81
4 - O número de horas (X) que 13 estudantes passam estudando para um teste e suas
notas (Y ) são mostrados na tabela abaixo. Calcule uma medida de dependência entre
as variáveis. O que você conclui? Explique.
X 0 1 2 4 4 5 5 5 6 6 7 7 8
Y 40 41 51 48 64 69 73 75 68 93 84 90 95
77