Professional Documents
Culture Documents
Eduardo Esteves
23 de Outubro de 2009
Departamento de Engenharia Alimentar, Instituto Superior de Engenharia da Universidade do Algarve, da Penha, 8005-139 Faro, Portugal. E-mail: eesteves@ualg.pt, URL:
http://w3.ualg.pt/~eesteves
Campus
Resumo
Este artigo constitui o segundo (grande) captulo das matrias leccionadas no mbito da disciplina de Estatstica Aplicada do 2 Ano do Curso de Engenharia Alimentar (cf. Esteves (2009) ). Pretende-se apresentar, explicar (ainda que de forma sucinta e relativamente informal) e exercitar os conceitos bsicos e as distribuies (tericas) de probabilidades mais relevantes.
Contedo
1 2 3 Introduo Perspectiva histrica (muito) resumida Conceitos bsicos
3.1 3.2 3.3 3.4 Provas aleatrias, acontecimentos possveis, evento e espao amostral . . . . . . . . . . . . . . . . . . Conceito de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Postulados das probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Teoremas das probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 2 2
2 3 4 4
Distribuio de probabilidades
4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 Varivel aleatria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Distribuies de probabilidades de variveis discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . Distribuio Binomial Distribuio de Poisson Distribuio Normal Distribuio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
6 7 9 11 12 16 19 20
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
t de Student
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Exerccios
21
Introduo
A ESTATSTICA diz respeito anlise e interpretao de dados (geralemente amostrais) com vista avaliao objectiva da validade das concluses que se obtiveram (relativamente populao). Os diversos MTODOS ESTATSTICOS que se empregam em ESTATSTICA APLICADA servem para colher, organizar, resumir, apresentar e/ou analisar dados de modo a obter concluses vlidas. A seleco criteriosa de amostras representativas duma populao ou a inferncia estatstica a partir dessas amostras baseiam-se em conceitos relacionados com probabilidades. Esta uma das aplicaes da teoria das probabilidades.
1 Esteves
E. (2009) Introduo aos Mtodos Estasticos e Estatstica Descritiva. Instituto Superior de Engenharia, Universidade do
http://w3.ualg.pt/~eesteves]
Tabela 1: Acontecimentos possveis no lanamento simultneo de dois dados honestos de seis faces. 1 1 2 3 4 5 6 11 21 31 41 51 61 2 12 22 32 42 2 62 3 13 23 33 43 53 63 4 14 24 34 44 54 64 5 15 25 35 45 55 65 6 16 26 36 46 56 66
Noes correntes de "possibilidade", "previsibilidade" ou "certeza" que vulgarmente no apresentam diculdade de compreenso ou de interpretao, so formalizadas e estudados pela TEORIA DAS PROBABILIDADES. Este ramo da matemtica desenvolveu-se sobretudo nos sculos XVII e XVIII, fruto do empenho dos franceses Blaise Pascal [1623-1662], Pierre de Fermat [1601-1665], Abraham de Moivre [1667-1754] e Pierre Simon Laplace [1749-1827] e do suo Jakob Bernoulli [1654-1705], com o intuito de "predizer" os resultados de jogos de azar, populares entre a nobreza francesa daquele tempo. Mais recentemente, na transio entre os sculos XIX e XX, o russo Andrei Nikolaevich Kolmogorov [1903-1987], entre outros, contribuiu muito para este ramo da matemtica. Ainda hoje se utilizam exemplos de jogos (dados e cartas) na apresentao deste tpico por causa das primeiras investigaes e aplicaes.
Conceitos bsicos
A ideia-base da Estatstica de que as observaes individuais so naturalmente variveis aleatrias, isto , os seus valores oscilam devido aos efeitos do Acaso. Quando assim no se verica, podemos pensar ou considerar que outras causas no-aleatrias esto a actuar (designados probabilidades.
inferncia estatstica, importante sistematizar alguns dos conceitos mais simples relacionados com a teoria das
3.1
Uma PROVA ALEATRIA uma actividade a que correspondem dois ou mais ACONTECIMENTOS POSSVEIS. Antes de realizar a prova aleatria incerto o seu resultado, isto , qual dos acontecimentos possveis ir ocorrer. Exemplo 1. Quando se lana um dado, diz-se que se realiza uma prova aleatria. Nesta prova existem seis acontecimentos possveis: "sair" a face com 1, ou 2, ou 3, ou 4, ou 5 ou 6 pontos. Exemplo 2. Quando um tcnico de controlo da qualidade selecciona uma lata de sardinha (com o
objectivo de vericar se a lata defeituosa), diz-se que est a realizar uma prova aleatria, em que existem dois acontecimentos possveis: a lata (classicada como) defeituosa, ou no. Exemplo 3. Lanamento simultneo de dois dados. Nesta provas aleatria existem 36 acontecimentos possveis. Designa-se por ESPAO AMOSTRAL, referido por prova aleatria (e.g.
ai , bi
ci
S = {1, 2, 3, 4, 5, 6}
ou genericamente
S = {a1 , a2 , a3 , a4 , a5 , a6 }.
ou em termos
S = {def eituosa, no def eituosa} a S = {11, 12, ..., 21, 22, ..., 66}
ou
Frequentemente, interessam sub-conjuntos do espao amostral. Cada sub-conjunto de acontecimentos possveis de um espao amostral desginado por EVENTO e usualmente representado por uma letra maiscula (A, etc.) diferente de
B, C,
S.
Tabela 2: Informao da tabela anterior, na qual os acontecimentos do evento favorvel soma dos pontos igual a 7 esto assinalados. 1 1 2 3 4 5 6 11 21 31 41 51 2 12 22 32 42 3 13 23 33 4 14 24 5 15 6
16
26 36 46 56 66
25
35 45 55 65
34
44 54 64
43
53 63
52
62
61
No lanamento nico de um dado (ver exemplos anteriores), considere-se o domnio do evento "nmeros pares"
A = {2, 4, 6}.
Usualmente, designa-se
A como evento favorvel. Pelo contrrio, os restantes A, referem-se por A (alguns autores utilizam a notao Ac )
1, o evento
B = "soma dos pontas igual a sete" o sub-conjunto de S constituido pelos acontecimentos favorveis
3.2
Conceito de probabilidade
A Teoria das probabilidades pretende formular modelos de fenmenos (naturais) em que se supe intervir o Acaso, isto , a partir do passado no se pode prever deterministicamente o futuro mas podem encontrar-se taxas de realizao constantes de certos fenmenos.
A PROBABILIDADE
P {A},
P (A),
denida classicamente:
P (A) =
em que
nA N N
o nmero de todos os acontecimenEsta denio de
nA
tos possveis, desde que todos os acontecimentos sejam igualmente possveis ou equiprovveis.
probabilidade (estabelecida por Pierre Laplace em 1812) e ambas as expresses salientam o seu carcter aplicao no geral.
a priori.
Todavia, nem sempre os acontecimentos so igualmente provveis (nem o espao amostral nito), pelo que a sua
Qual a probabilidade de ocorrer um nmero impar num nico lanamento de um dado no viciado? O nmero de acontecimentos possveis 6, enquanto o nmero de acontecimentos favorveis 3 (isto , faces 1, 3 e 5). Assim, P(A) = 3/6 = 1/2. Se o dado estivesse viciado em favor do 6, por exemplo, j se no poderia aplicar a "denio clssica" de probabilidade. Porqu?
denir a frequncia relativa de um evento como a proporo do nmero total de acontecimentos possveis que esse evento representa. Ou seja, por denio a PROBABILIDADE o limite da frequncia relativa de determinado evento, quando o nmero de observaes, isto , o nmero de provas aleatrias cresce innitamente:
P (A) = lim
2 Para alm das denies clssica e frequencista
nA n
que se desenvolveu a partir do Teorema de Bayes (devido a Thomas Bayes [1702-1761]). Por razes vrias no ser abordada neste documento embora se possa adiantar que a corrente bayesiana defende que h medida que se adquire (alguma) informao se deve proceder a uma reavaliao das probabilidades consideradas a priori. Neste contexto, a atribuio de probabilidade a um dado evento, principalmente numa primeira fase, como sendo subjectiva, e por isso encarada como uma medida de credibilidade - a probabilidade uma expresso do estado de conhecimento sobre um certo sistema (Maria de Ftima Brilhante, Universidade dos Aores,
//www.uac.pt/~fbrilhante/MedicinaPagWeb/probabilidade_v2.pdf
http:
como alterar as probabilidades a priori tendo em conta novas evidncias de forma a obter probabilidades a posteriori. Esta e as restantes denies aplicam-se, de forma natural, em certas e determinadas situaes contudo todas tm desvantagens.
em que
nA
uma denio
A ocorre e n o nmero total de provas aleatrias. Esta a posteriori de probabilidade. Genericamente, podemos descrever esta denio, recorrendo aos
e de frequncia absoluta
F FA n
fA = f = 529/1000 = 0, 529.
Por exemplo, em mil lances de uma moeda, obtm-se 529 "caras". A frequncia relativa deste evento Faam-se outros 1000 lances da moeda e obtm-se 493 "caras". A frequncia relativa do acontecimento "caras" ser:
de lances, mais prximo se estar da probabilidade de ocorrer "caras" num nico lanamento de uma moeda. Nota: Actualmente, considera-se esta probabilidade como sendo 0,5 (com um nico algarismo signicativo). FIGURA? A interpretao das probabilidades como frequncia-limite, corresponde ao Teorema de Bernoulli que, em resumo, diz o seguinte: num fenmeno aleatrio no se pode prever o resultado da prxima prova aleatria, mas pode prever-se globalmente a frequncia da sua observao numa longa srie de provas. De facto, a frequncia (de um evento) deve entender-se como uma medio fsica de uma grandeza terica, a PROBABILIDADE associada a esse evento.
tizao em 1933 por Andrei N. Kolmogorov, prefere-se fundamentar os teoremas das probabilidades na teoria dos conjuntos, pois recorre a menos e mais simples axiomas. Alis, os conceitos bsicos iniciais que se introduziram anteriormente derivam dessa abordagem ao problema (Fig. 1). Alguns dos axiomas e teoremas mais importantes so abordados na seco seguinte. Neste texto (e na aplicao prtica da Estatstica), sero utilizadas as vrias denies de probabilidades consoante o contexto do problema e a informao disponvel.
3.3
Os conceitos anteriores e a teoria das probabilidades baseiam-se em POSTULADOS , ou axiomas, que se exigem pragmticos e consistentes (ou coerentes e compatveis) dos quais trs so: 1. Para qualquer acontecimento
ai ,
0 P (ai ) 1
2. Para qualquer evento dos acontecimentos
do espao amostral
S,
ai
P (A) =
3. A probabilidade do espao amostral daqueles que ocorrem fora de
P (ai )
S,
em que
P (S) = 1 P () = 0
3.4
A utilizao prtica dos axiomas, permitiu o desenvolvimento de concluses fundamentais ou TEOREMAS , aux-
por postulado, ou axioma (um sinnimo relativamente cado em desuso), qualquer proposio aceite sem demonstrao
http://mathworld.wolfram.com/Axiom.html,
consultado
so proposies (ou armaes) que se podem provar como verdadeiras, usando operaes e argumentos matemticos, consultado em 21/10/2009).
http://mathworld.wolfram.com/Theorem.html,
5 Outros
numa determinada estrutura lgica (ou sistema axiomtico) (Weisstein, Eric W. Theorem." From MathWorldA Wolfram Web Resource teorema(s), relacionados com probabilidades condicionais por exemplo, no esto, ainda, contemplados neste texto.
ai ,
A.
Figura 2: Diagramas de Venn, representando eventos mutuamente exclusivos (A e B), eventos independentes (C e D) e complementares (E e ~E) nos respectivos espaos amostrais S. rea sombreada refere-se s probabilidades que se pretendem determinar de acordo com os Teoremas de probabilidade.
amostral
Teorema da adio Para dois eventos (ou acontecimentos) MUTUAMENTE EXCLUSIVOS A e B de um espao S, a probabilidade de ocorrer UM OU O OUTRO evento igual soma das respectivas probabilidades
individuais, ou seja:
P (A B) = P (A) + P (B)
em que
se l "ou".
Podemos extender este teorema a mais do que dois eventos mutuamente exclusivos. Entende-se
que eventos mutuamente exclusivos so aqueles que no ocorrem simultaneamente: se ocorre de outro modo, a interseco dos conjuntos (eventos) painel da esquerda).
Teorema da multiplicao
P (C D) = P (C) P (D)
em que
se l "e".
Teorema da complementaridade Para qualquer evento E de um espao amostral S, a probabilidade de no c ocorrer E, designado por P ( E) ou P (E ), igual a:
P ( E) = 1 P (E)
sendo que
P ( E),
Figura 3: Representao esquemtica do conceito de funo varivel aleatria, v.a. (linhas contnuas no topo da gura).
A - evento, ai
- acontecimento possvel, e
xi
- resultado possvel.
4
4.1
Distribuio de probabilidades
Varivel aleatria
A ligao entre a teoria das probabilidades e a estatstica aplicada materializada pela noo de varivel aleatria. At agora, tm-se considerado genericamente espaos de acontecimentos. Porm, certas experincias (ou provas) aleatrias podem dar origem a resultados numricos (por exemplo, nmero de reprovaes na disciplina por ano lectivo, durao do efeito de um desinfectante, volume duma embalagem, etc.). Noutros casos, substituem-se os resultados no-quantitativos por nmeros para simplicar ou facilitar a anlise desses resultados. Recordem-se os conceitos de varivel contnua e discreta, e de amostragem aleatria, como mtodo necessrio para a anlise estatsticamente vlida dos assuntos. Assim sendo, importante denir o que uma varivel aleatria e as suas principais caractersticas (ou propriedades): estatstica , mais ou menos, a seguinte: sejam desse espao amostral um nmero real (Fig. 3). A terminologia usada um tanto infeliz mas universalmente aceite. Torna-se claro que
uma VARIVEL ALEATRIA quando o seu valor (numrico) (l-se "psilon") uma prova aleatria (ou experincia) e
determinado pelo acontecimento possvel de uma prova aleatria. A denio que se encontra nos manuais de
um espao
ai
X(ai ),
ou mais simplesmente
xi ,
uma funo,
contudo denominamo-la varivel (aleatria)! evidente que nem todas as funes imaginrias se podem considerar variveis aleatrias. Um requisito importante que as probabilidades dos acontecimentos e respectivos resultados (da funo varivel) sejam bem denidos e consistentes com os axiomas bsicos (ver tpico anterior). Na maior parte das utilizaes no se indica a natureza funcional da varivel aleatria referir uma varivel aleatria). Geralmente, interessam mais os valores possveis da v.a.
Exemplo 1: Quando se lanam simultaneamente dois dados, existem 36 acontecimentos possveis diferentes (ver Tab. 1). Se interessar "a soma dos pontos" podem obter-se 36 resultados dos pontos"). acontecimentos possveis obtm-se outros resultados
xi
(v.a.
- "soma
Se, por outro lado, se pretender estudar o produto dos pontos, ento para os mesmos
yi
(agora da v.a.
Exemplo 2: Se se pretender estudar determinado sector de actividade, por exemplo a indstria conserveira, o espao amostral composto algumas das empresas do sector, seleccionadas com determinado critrio (p. ex. amostragem aletatria), ou seja por exemplo o n
empresa (acontecimento possvel) possvel estudar diferentes aspectos (qualidades ou caractersticas), de empregados (v.a. W), o volume de negcios (v.a. V), etc.
X,
i.e.
P (xi ),
Para esse m
4.2
que estabelece uma correspondncia entre o resultado da varivel aleatria denomina-se FUNO DENSIDADE DE PROBABILIDADE, e Consideremos uma varivel anda, o espao amostral Neste caso,
X que pode assumir os valores 0, 1 ou 2 (equiprovveis). Considere-se, S ={0,0,0,0,0,0,0,0,1,1,1,2}. A funo densidade da probabilidade P (X = xi )
xi (resultado do acontecimento possvel) uma probabilidade P (xi ). P (X = 0) = 8/12 = 0, 6667, P (X = 1) = 3/12 = 0, 2500 e P (X = 2) = 1/12 = 0, 0833.
Poderemos
A funo densidade de probabilidade (de variveis discretas) semelhante s frequncias relativas. representar gracamente esta funo atravs dum histograma de frequncias relativas (Fig. 4a).
Contudo, poderemos estudar outras questes relativas aos mesmos resultados, para alm de saber qual a probabilidade igual a
P (X = xi )
para determinado
xi .
xi
P (X xi )
PROBABILIDADE. Na prtica, esta funo similar s frequncias relativas acumuladas. Consideremos o exemplo anterior. A funo distribuio da probabilidade a cada valor de seja,
P (X xi ) faz corresponder xi (resultado possvel) o somatrio das probabilidades para os casos em que X xi , ou P (X 0) = 8/12 = 0, 6667, P (X 1) = 11/12 = 0, 9167 e P (X 2) = 12/12 = 1, 000.
Como anteriormente, podemos representar gracamente esta funo, agora por um polgono (de frequncias) (Fig. 4b).
xi ,
com
i = 1, 2, ..., n,
0 P (X = xi ) 1
b) O somatrio de todas as probabilidades dos resultados dos acontecimentos igual a um:
P (X = xi ) = 1
Propriedades da funo distribuio a)
P (X xi ),
com
i = 1, 2, ..., n,
0 P (X xi ) 1
b) A funo distribuio (das probabilidades) nunca decresce medida que
crescente.
xi
aumenta,
determinada varivel aleatria (v.a.), alguns "pontos" ou caractersticas com interesse estatstico. Estas caractersticas so similares a conceitos de estatstica descritiva que se abordaram anteriormente para amostras (medidas de localizao e de disperso), nomeadamente o valor mdio, a varincia e o desvio-padro duma distribuio de probabilidades. O VALOR MDIO da distribuio de probabilidades tambm designado por VALOR ESPERADO ou ESPERANA MATEMTICA, e representado por acontecimentos possveis
E{X}.
X,
xi ,
com
i = 1, 2, ..., n,
E{X} =
[xi P (X = xi )]
O valor mdio obtm-se a partir da importncia relativa do resultado de cada acontecimento possvel. Enquanto a mdia emprica, i.e. experimental, por se obter dos valores observados, o valor mdio uma noo terica visto ser calculado a partir da distribuio de probabilidades dos valores observveis (e no dos resultados observados!!). Pode interpretar-se como o valor terico (em geral desconhecido) de que as mdias so medies bastante prximas,
P (X = xi )
P (X xi )
se o nmero de observaes (ou provas aleatrias) for bastante grande. mdio no necessariamente um valor assumido pela v.a.
A variabilidade (ou a forma) da distribuio de probabilidades de uma v.a. discreta (ou descrita) pela VARINCIA,
V ar {X}
ou
V {X},
xi
por:
V {X} =
A raz quadrada positiva da varincia dades.
[(xi E{X})2 P (X = xi )]
designada por DESVIO-PADRO da distribuio de probabili-
V {X}
Aps o lanamento dum dado no-viciado, a varivel aleatria pode tomar os valores
P (X = 1) = P (X = 2) = ... = P (X = 6) = 1/6. Ento, teremos que o valor mdio6 ser: E {X} = 1(1/6) + 2(1/6) + 3(1/6) + 4(1/6) + 5(1/6) + 6(1/6) = 21/6 = 3, 5. Por outro lado, a varincia V {X} = (1 3, 5)2 (1/6) + (2 3, 5)2 (1/6) + (3 3, 5)2 (1/6) + (4 3, 5)2 (1/6) + (5 3, 5)2 (1/6) + (6 3, 5)2 (1/6) = 2, 92. Ento V {X} = 2, 92 = 1, 71 o desvio-padro.
As respectivas probabilidades so Existem casos de distribuies (tericas) de probabilidades de variveis discretas que merecem ateno especial e estudo particular, nomeadamente as distribuies Binomial (Seco 3.3) e de Poisson (Seco 3.4) - estas distribuies constituem o cenrio probabilstico de vrias tcnicas de controlo estatstico da qualidade por exemplo.
xi = 1, 2, 3, 4, 5, 6.
4.3
Distribuio Binomial
Considere-se uma prova (experincia) aleatria que tem apenas dois acontecimentos possveis: um que se designa por "sucesso" (a1 ) e o seu complementar designado por "insucesso" (a0 ). Em cada p.a. a probabilidade de ocorrer
a1
A distribuio independentes
binomial o modelo probabilstico adequado para os casos em que se consideram repetidas p.a. como a descrita. dados por(1 discreta que segue a distribuio binomial. De facto, as probabilidades de observar a v.a.
Nestes casos, o conjunto de resultados nas sucessivas provas constitui uma varivel aleatria
igual a
0, 1, 2, ..., n
so
...,
pn ,
em que
p a probabilidade de realizao do
acontecimento em cada prova. Aquelas quantidades correspondem ao desenvolvimento do binmio da a designao distribuio binomial. Na DISTRIBUIO BINOMIAL, devida a Jakob Bernoulli [1654-1705], numa sequncia de com reposio, a FUNO DENSIDADE DE PROBABILIDADE da v.a. discreta pode tomar os valores
[(1p)+p]n = 1,
n provas aleatrias
xi = 0, 1, 2, ..., n
dada por:
p a probabilidade de ocorrer o resultado favorvel (ou sucesso) em cada prova e se mantm constante n n o nmero mximo de tentativas (ou provas aleatrias) independentes e Cx
(designado por vezes como coeciente binomial) dado pela expresso de clculo combinatrio:
n Cx =
n! x!(n x)!
x "sucessos"7 . A funo densidade de
i.e. em
n Cx
probabilidades da distribuio binomial depende dos parmetros apenas dois acontecimentos possveis e de natureza qualitativa:
p e n, e usada quando cada prova aleatria tem a1 - sucesso ou 1; e a0 - insucesso ou 0. Uma v.a. X Binomial(n, p) ou X Binomial(n, p).
X
Em 3 lanamentos de um dado no-viciado (n = 3 provas aleatrias repetidas), a varivel aleatria - nmero faces com um ponto, pode tomar os valores
xi = 1, 2, 3
xi
das faces com um ponto. Vamos abordar a questo considerando que o resultado "sada da face com
6 Curiosamente,
podemos vericar que a designao valor esperado no faz muito sentido uma vez que 3,5 no pode realmente ocorrer Se se anotar o resultado aps cda lanamento, a mdia do conjunto dos
neste exemplo! Talvez seja mais adequado utilizar a designao valor mdio! Se se imaginar a situao de lanamentos sucessivos dum dado, em cada lanamento o resultado pode ser 1, 2, etc. resultados possveis aps muitas (innitas) p.a. ser o valor mdio.
7 Tambm
x n).
Figura 5: Representao esquemtica dos possveis resultados favorveis ("face com um ponto") no lanamento simultneo de trs dados no-viciados. No entanto, nos casos em que as situaes possveis, pois no?
xi = 1
xi = 2
Tabela 3: Casos possveis no exemplo da pgina anterior (cf. Fig. 5). Probabilidades calculadas por aproximao e recorrendo funo densidade de probabilidades da distribuio binomial
xi
0 1 2 3
Casos (acontecimentos) possveis 000 100 ou 010 ou 001 110 ou 101 ou 011 111
P (X = xi ). P (X = xi )
0,5787 0,3472 0,0694 0,0046
um ponto" consitui um sucesso e que todos os outros resultados possveis constituem um insucesso. Adicionalmente, vamos quanticar os sucessos com 1 e os insucessos com 0. Assim, para cada valor de
xi
(0, 1, 2 ou 3 faces com um ponto) o nmero total de casos possveis ser 1, 3, 3 e 1, respectivamente
(Fig. 5 e Tab. 3). Em cada uma das provas aleatrias sucessivas do exemplo anterior, a probabilidade de sair uma face com um ponto (um "sucesso") igual a
P (X = 1) = 1/6,
sendo que a
P (X = 1) = 1 1/6 = 5/6
n Cx
P (X = xi ) para cada um dos resultados possveis atravs da funo densidade de probabilidades P (X xi ) duma X xi .
v.a. com distribuio binomial obtm-se Existem tabelas com as probabilidades
As mquinas de calcular mais recentes e as folhas-de-clculo (e.g. Microsoft calcular as probabilidades com facilidade.
Na distribuio binomial, tambm podemos calcular o valor mdio e a varincia da distribuio de probabilidades para descrever teoricamente a sua "localizao" e "forma". O VALOR MDIO da distribuio binomial dado por:
E{X} = n p
em que
o nmero
provas aleatrias (independentes) realizadas (ou a realizar). possvel (com)provar a validade desta formulao recorrendo ao exemplo anterior. A VARINCIA da distribuio binomial pode calcular-se atravs de:
V {X} = n p (1 p)
10
Figura 6: Modicao da forma da funo de densidade de probabilidades da distribuio Binomial com a alterao de
p.
Varivel aleatria
xi = 1, 2, ..., 6.
E{X},
da distribuio binomial. Tente demonstrar esta armao! A distribuio binomial desviada para a esquerda
p < 0, 5,
simtrica quando
p = 0, 5
p > 0, 5
(Fig. 6).
Considere-se que o valor mdio da distribuio de probabilidades duma v.a. discreta dado por
[xi P (X = xi )], logo para 2(0, 0694) + 3(0, 0046) = 0, 5, exemplo, V {X} = 0, 4167.
4.4
E{X} = E{X} = 0(0, 5787) + 1(0, 3472) + E{X} = n p = 3(1/6) = 0, 5. Verique que, para este
Distribuio de Poisson
A distribuio de Poisson (devida a Simon Poisson [1781-1840]) pode entender-se como um caso particular da distribuio binomial e aplica-se nas situaes em que a probabilidade pequena ou quando
n > 30
estamos a estudar acontecimentos "raros" (vrios autores sugerem que, se distribuio em vez da binomial).
n p < 5,
autores, advm das primeiras aplicaes, do prncipio do sc. XX e devidas a von Bortkiewicz. Aquele matemtico utilizou a distribuio de Poisson para descrever o nmero anual de mortos por coice de cavalo nos regimentos Prussianos de cavalaria. A FUNO DENSIDADE DE PROBABILIDADE da distribuio de Poisson dada por:
P (X = xi ) =
em que ( l-se "lambda"), v.a.
xi e xi !
X,
probabilidades
> 0 e xi = 0, 1, ..., n (Fig. 7). Alguns autores referem-se a como valor mdio da X P oisson(). Como no caso da distribuio binomial, a funo distribuio de P (X xi ) obtm-se por adio das probabilidades dos resultados de X xi . E{X} = = n p = V {X}
Note-se que o valor mdio e a varincia so iguais. Esta uma propriedade muito interessante da distribuio de Poisson, se se atender s condies iniciais,
p 0.
11
= 3
(ver
= 0, 5,
em que
xi = 0, 1, 2, ..., 9
yi = 0, 1, 2, ..., 9.
distribuies de probabilidades.
x linhas e
colunas) e obter a probabilidade pretendida. Como no caso da distribuio binomial (e outras...) as calculadoras cientcas ou as folhas-de-clculo de uso comum permitem determinar as probabilidades com facilidade. O exemplo seguinte facilita a compreenso e sugere a utilidade desta distribuio terica. Uma fbrica de conservas produz, continua e cadenciadamente, cerca de 2330 latas de sardinha em molho de tomate por periodo de 8 horas de laborao e em mdia cerca de 7 latas so defeituosas. Qual a probabilidade de encontrarmos 3 latas defeituosas num lote de fbrica? Pode-se obter
p = 7/2330 = 0, 0030
n = 1000 latas adquiridas quela = n p = 1000(0, 003) = 3. Portanto a probabilidade x latas P (X = 3) = /x! e = 33 /3! e3 = 0, 2240. Para
e
calcular a probabilidade de ocorrerem at duas latas defeituosas nesse lote de 1000 latas, determina-se
P (X 2) = P (X = 0) + P (X = 1) + P (X = 2).
4.5 Distribuies de probabilidades de variveis contnuas
Em muitos problemas, torna-se necessrio ou matematicamente mais simples considerar um espao amostral para uma varivel aleatria
X, no qual todos os nmeros reais possveis (num intervalo especicado ou conjunto de interX contnua quando: (i) o seu valor numrico
(conjunto dos nmeros reais), ou seja,
valos) possam ser considerados como resultados possveis. Da ser necessrio utilizar variveis aleatrias contnuas. Em contraste com as v.a. discretas, diz-se que uma v.a. determinado pelo resultado de uma prova aleatria; e (ii)
xi
xi R
xi
pode
tomar qualquer um dos innitos (ou no-enumerveis) valores num certo intervalo em
R.
Exemplo 1. O consumo anual de energia elctrica para ns industriais, numa determinada regio (em
109
kW), v.a.
Exemplo 2. O tempo de prateleira (em dias) de determinado produto alimentar, v.a. v.a. contnua.
No caso das v.a. contnuas, a densidade de probabilidades est continuamente dispersa pelo espao amostral no caso de v.a.
ao
invs de se concentrar num conjunto discreto de resultados como acontece com as v.a. discretas (Fig. 8). Enquanto discretas a probabilidade do espao amostral "dividida" pelos resultados possveis, nas v.a. contnuas aquela probabilidade "est amassada" e distribuida pelos (no-enumerveis) resultados possveis esse motivo, a probabilidade da v.a. contnua acontecimento possvel (ou resultado)
xi .
Por
xi
xi
aleatria (ou experincia) obtm-se sempre um resultado e, por conseguinte, possvel obter
xi .
dizer que "a probabilidade pontual sempre nula" quer somente traduzir que nula a probabilidade de "acertar"
12
xi .
[x; x + x]
x,
[x; x + x],
f (x) =
Rigorosamente, para um intervalo innitesimal dada por:
f (x) = lim
P (x < X < x + x) dP (x < X < x + dx) = x0 x dx f (x) em vez de y = f (x), pelo eixo
Pr(X = xi ),
intervalo
genericamente uma funo matemtica para a qual a rea limitada pela curva
Y =x
Y = x + x
X assumir um valor do
[x; x + x]
8 de
f (x):
x+x
P (x < X < x + x) =
x
Um modo de calcular a probabilidade de primitivao, isto ,
f (x)dx [x; x + x]
resolver o integral por
P (x < X < x + x) =
x
em que 9b).
f (x)dx = F (x + x) F (x)
F (x + x) e F (x) constituem as solues da primitiva de f (x) para os limites do intervalo considerado (Fig. F (x)
em vez de
Pr(X xi ),
contnua
xi
e,
y=f(x) esquerda de
xi
x
(Fig. 9a).
F (x) = P (X xi ) =
f (u)du
x, no caso a varivel
u). P (X = xi ), em domnios
contnuos aquela funo calculada por integrao da funo densidade de probabilidades (Fig. 9). A f.d.p. duma v.a. contnua
dum determinado equipamento, dada por funcionar sem avarias por um periodo de
[e0,5 ]3 = e0,5 e1.5 = 0, 3834. A funo distribuio pode ser 1 t de f (x), ou seja: F (t) = 0, 5e0,5t du = [0, 5e0,5t ]t = 1 e0,5t . 0 0
dF (x) = f (x) , ou ento, dx concluses importantes:
1. 2.
f (t) = 0, 5e0,5t . Qual a probabilidade desse equipamento 3 3 f (t)dt = 1 0, 5e0,5t dt = 1 a 3 dias? P (1 < X < 3) = 1
obtida directamente por integrao
contnuas,
F (x) = f (x)
em que
F (x)
a derivada de
F (x).
f (x) 0
+
(equao no-negativa) e
0 F (x) 1
f (x)dx = 1
8O
integral
um objecto matemtico que se pode interpretar como uma rea, ou uma generalizao de uma rea. Juntamente
13
Figura 8: Ilustrao da "relao" entre distribuies de probabilidades de v.a. discretas e contnuas (e.g. funo densidade de probabilidades
f (x )).
14
y = 12x(1 x)2 ,
Y = x e Y = x + x corresponde
15
3. 4.
x+x x
P (X = x) = Pr(X = x + x) = 0. X
o
Como no caso das variveis aleatrias discretas, possvel caracterizar resumidamente a distribuio de probabilidades recorrendo aos conceitos de valor mdio e varincia das probabilidades. Assim, para uma v.a. contnua VALOR MDIO dado por
E{X} =
e a VARINCIA por
x f (x)dx
V {X} =
(x E{X})2 f (x)dx
Do ponto de vista formal, a passagem do caso discreto para o caso contnuo (ou vice-versa) faz-se por "dualidade", substituindo-se os somatrios por integrais e as probabilidades contnuo ao
P (x)
por densidades
continuum.
importante, como se fez no caso das probabilidades de v.a. discretas, estudar algumas distribuies tericas de probabilidades (para v.a. contnuas) de utilizao muito generalizada.
4.6
Distribuio Normal
Entre as distribuies tericas de probabilidades de v.a. contnuas destaca-se a DISTRIBUIO NORMAL, ou curva normal, ou curva de Gauss (em homenagem a Carl Friedrich Gauss [1777-1855] que foi pioneiro na sua utilizao, apesar da distribuio se dever a Abraham de Moivre [1667-1754] que a desenvolveu em 1733 como aproximao distribuio Binomial e a Pierre-Simon Laplace [1749-1827] que a formalizou). Curiosamente, verica-se que em muitas situaes amostrais, a distribuio das variveis aleatrias contnuas parece "concentrar-se" perto da mdia e "dispersar-se, diminuindo", em direco aos extremos, de acordo com esta distribuio terica. Por outro lado, a distribuio normal de manipulao matemtica fcil, o que tem contribuido para o nmero aprecivel de testes estatsticos dela derivados. A curva normal - FUNO DENSIDADE DE PROBABILIDADES DA DISTRIBUIO NORMAL (Fig. 11) - denida pela seguinte expresso:
2 1 e[(x)/2] 2
f (x) =
com os parmetros
e e em que < x < +, < < +, > 0, = 3, 141659... e e a funo exponencial. X tem distribuio normal usa-se X N (, ). Dado que a funo densidade de probabilidades f (x) da distribuio normal tem dois parmetros, mdia e desvio-padro , cada par de valores de e origina uma curva com "forma diferente". Contudo, f (x) da distribuio normal sempre simtrica, em forma de sino, centrada em (que determina a posio da distribuio no eixo das abcissas que corresponde ao "universo" de valores de X ), e dispersa relativamente a de acordo com o desvio-padro (Fig. 11).
No caso da distribuio normal, tambm se pode resumir a informao acerca das probabilidades recorrendo a "medidas de localizao e disperso", j referidas anteriormente - VALOR MDIO distribuio de probabilidades:
EX
e VARINCIA
VX
da
E{X} =
+
V {X} =
Existem algumas caractersticas com importncia nas funes densidade e distribuio de probabilidades de variveis normais, designadamente aquelas representados na Fig. 12. A mdia de 50%). Verica-se, anda, que os intervalos contnua
, 2
e 99,73% das possveis observaes duma varivel contnua normal. Por outras palavras, a probabilidade da v.a.
16
Figura 10: Representao esquemtica da funo densidade de probabilidade da distribuio normal parmetros com)
f (x ), com
Figura 11: Comparao entre a forma de trs curvas normais (funes densidade de probabilidades) com diferentes parmetros
As "curvas" (a) e (b) com mdia diferente mas com igual desvio-padro.
Pelo contrrio, as
17
Figura 12:
Pontos importantes das funes densidade e distribuio de probabilidades da distribuio normal Por exemplo, cerca de 68% dos resultados possveis dessa v.a. com distribuio
[ 1; + 1].
18
Figura 13: Ilustrao da relao entre a distribuio dos resultados possveis xi da v.a. contnua
X e os valores de
xi
9
correspondentes a
zi = 2
zi = 2.
4.7
O clculo da rea sob a curva normal para determinado intervalo da v.a. contnua, que se efectua por integrao da funo densidade para os valores de
e de
Um modo padronizar os resultados recorrendo transformao da varivel aleatria com mdia igual a zero e desvio-padro igual a um, ou seja, NORMAL REDUZIDA
Z transformando a v.a.
se dene a DISTRIBUIO
Esta transformao permite "reduzir" (ou sintetizar ou padronizar) qualquer distribuio normal desde que se conheam
ex /2 f (x) = 2
A tabulao da distribuio de probabilidades de com facilidade de
P (X xi )
X N (, ).
zi
Z (que geralmente apresenta a funo distribuio de probabilidades ou "probabilidades acumuladas") para o valor obtido (ver Tabela A). Por outro lado, a maioria das "calculadoras cientcas" e do software (folhas de clculo)
Z zi .
funo linear de uma varivel aleatria com distribuio normal , tambm, uma v.a. com distribuio normal, isto
Z N (0, 1)10 .
Por exemplo, a variao diria da temperatura de determinada cmara de refrigerao pode ser razoavelmente aproximada por uma distribuio normal com mdia de 0,2% e desvio-padro de 1,6%. a) Qual a probabilidade da variao da temperatura ultrapassar 1%? b) E qual a probabilidade dessa variao se situar entre 1% e 1,4%?
P (X > 1%) = P (Z > 0, 5) = 1 P (Z < 0, 5) = 1 (0, 5 + 0, 1915) = 0, 3085 porque, de acordo com 1%0,2% X = 0, 5 e da Tabela A pode-se obter X em Z, obtm-se que zi = = 1,6% P (Z < zi ).
a) a transformao de
9A
designao Standard Normal Curve foi usada pela primeira vez por W.F. Sheppard em 1899 mas s na dcada de 1950 se consultado em 7/10/2009).
banalizou (Miller J. Earliest Known Uses of Some of the Words of Mathematics disponvel em
mathword.html,
10 Observe-se
que:
http://members.aol.com/jeff570/
com maior ateno a equao associada a esta transformao. Se re-arranjarmos os termos daquela expresso, teremos ou seja, uma "equao da recta" do tipo
Z + = X,
bx + a = y .
19
b)
P (1% < X < 1, 4%) = P (0, 5 < Z < 0, 75) = P (Z < 0, 75)P (Z < 0, 5) = 0, 27340, 1915 = 0, 0819 zi = 1%0,2% = 0, 5 e zi = 1,4%0,2% = 0, 75 . Novamente, as respectivas probabilidades 1,6% 1,6%
4.8
Distribuio
de Student
At agora, consideraram-se como conhecidos os parmetros da distribuio normal com a populao, ou universo estatstico. Na realidade, raramente se conhece possvel recolher tantos dados que permitam assumir que as "estatsticas" da
sejam estimadores correctos dos parmetros da populao, pois geralmente o tamanho da amostra muito reduzido comparativamente dimenso da populao em estudo. Amostras de tamanho "pequenas amostras". O desenvolvimento da DISTRIBUIO por motivos prossionais/legais utilizou o pseudnimo
n < 30
t DE STUDENT, pelo ingls William Gosset [1876-1937] em 1908 (que Student para publicar os seus trabalhos), como alternativa a
Z,
constituiu um dos maiores avanos nas metodologias estatsticas. Aquele autor, props a transformao da v.a.
contnua
na varivel
da seguinte forma:
t=
em que
X x s
s=
o desvio-padro da amostra.
t depende dum nico parmetro, o nmero de GRAUS DE LIBERDADE (que se l "ni"), com = n 1. Como se prova para Z, tambm a varivel aleatria t se distribui "normalmente", ou seja, t N (). A cada valor de , corresponde uma curva diferente dentro da famlia das distribuies t de Student (Fig. 14). O procedimento para se obter t e consultar a respectiva tabela de probabilidades idntico ao descrito para Z ,
A distribuio de considerando-se, neste caso, Exemplo 1. A v.a. b) Qual a a)
=n1
> v0 ) = 1%;
v0 =2,998 (obtm-se directamente da tabela para p = 0,99); b) Uma vez que P (V < 2, 998) = 0, 99 e P (V < 0, 711) = P (V > 0, 711) = 0, 25, ento a probabilidade pretendida P = 0, 99 0, 25 = 0, 74.
Exemplo 2. O tempo (em minutos) que um grupo de operrios leva a executar determinada tarefa, v.a.
t0 = 1, 363.
Como
t = (X x)/s 1, 363 =
20
Exerccios
1. Determine a probabilidade de cada um dos seguintes eventos: a) surgir um nmero mpar num nico lance de um dado honesto; b) ocorrer, pelo menos, uma "cara" em dois lanamentos de uma moeda honesta; c) aparecer o total 7 num nico lanamento de dois dados; d) surgir um total diferente de 2 ou 6 ou 10 num nico lanamento de dois dados; e) aparecer o total 11 num nico lanamento de dois dados, em que um deles est viciado em favor do seis [P (1)
P (6) = 0, 20
em vez de
P (i) = 0, 166(6)].
2. Considere uma populao em que a varivel a) Represente gracamente as funes densidade e distribuio de probabilidades. b) Calcule
V {X}.
n = 2.
d) Calcule
Y.
yi P (Y = yi )
0 0,15
1 0,25
2 0,30
3 0,20
4 0,10
3. Duas mquinas A e B funcionam de forma independente uma da outra. trabalho. Calcule: a) a probabilidade do n
as probabilidades de se vericar o nmero referido de avarias para cada mquina, no decurso de um dia de de avarias em A ser superior a dois; b) a probabilidade do n total de avarias num dia de trabalho ser inferior a trs; e c) o n
de avarias registado em duas mquinas A e B. 1 0,20 0,32 2 0,30 0,10 3 0,30 0,08 4 0,09 0,10 5 0,07 0,05 6 0,04 0,05
Mquina A Mquina B
4. Uma empresa comercializa garrafas de vinho de 1 litro. Supe-se, no entanto, que 40% dessas garrafas contm realmente uma menor quantidade de lquido do que o volume indicado no rtulo. Tendo adquirido 6 dessas garrafas, qual a probabilidade de: a) Duas delas conterem menos de um litro? b) No mximo 2 conterem menos de um litro? c) Pelo menos 2 conterem menos de um litro? d) Todas conterem menos de um litro? e) Todas conterem o volume indicado no rtulo? f ) Represente a funo densidade de probabilidade da varivel em questo. 5. Uma fbrica de embalagens, utilizadas para determinado produto alimentar, sabe que em cada 1000 produz 20 defeituosas. a) Qual a probabilidade de um cliente ao comprar 100 embalagens receber todas sem defeito? b) Qual a probabilidade de receber, nessa mesma compra, pelo menos 3 embalagens defeituosas? 6. Calcule, com a ajuda da Tabela A (em anexo), a probabilidade de que 0; c) Menor do que +1,96; d)
e)
P {Z < 0, 84}. = 5
cm e varincia
2 = 5, 25.
Calcule: a) A probabilidade das ameixas terem dimetros compreendidos entre 3,5 cm e 8 cm.
b) A probabilidade das ameixas terem dimetro maior do que 9,5 cm. c) A probabilidade das ameixas terem dimetro menor do que 3,5 cm. d) O dimetro abaixo do qual se encontram 95% das ameixas. e) O dimetro acima do qual se situa metade da composio de tamanhos das ameixas. f ) O dimetro que corresponde ao quantil de ordem 28%. 8. Uma fbrica produz equipamento cujo tempo-de-vida uma v.a. com distribuio normal de parmetros
= 10
anos e
2 = 2
dos equipamentos tenham de ser substituidos. Qual dever ser o periodo de garantia mximo oferecido pela empresa? 9. Admite-se que o tempo de espera num determinado consultrio (v.a.
dia, seleccionado aleatoriamente, registaram-se os tempos de espera de onze utentes, calculando-se um tempo
21
mdio de
x = 41
min e
22