You are on page 1of 66

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof.

Mnica Barradas

ESTATSTICA BSICA
(Prof Mnica Barradas)

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

NDICE

1. Introduo Geral Compreenso Estatstica........................................................................3 2. Distribuio de Freqncia.................................................................................................10 3. Medidas de Centralidade ou de Tendncia Central............................................................14 4. Medidas de Assimetria e Curtose.......................................................................................23 5. Principais Tipos de Representao Grfica........................................................................25 6. Medidas de Disperso ou de Variabilidade........................................................................28 7. Correlao e Regresso.......................................................................................................32 8. Introduo Amostragem...................................................................................................47 9. Probabilidade......................................................................................................................53 10. Variveis Aleatrias Discretas ........................................................................................56 11. Distribuies de Variveis Aleatrias Discretas..............................................................60 12. Distribuies de Variveis Aleatrias Contnuas............................................................62

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

CAPTULO 1 INTRODUO A ESTATISTICA


1. Objeto da Estatstica Estatstica uma cincia exata que visa fornecer subsdios ao analista para coletar, organizar, resumir, analisar e apresentar dados. Trata de parmetros extrados da populao, tais como mdia ou desvio padro. A estatstica fornece-nos as tcnicas para extrair informao de dados, os quais so muitas vezes incompletos, na medida em que nos do informao til sobre o problema em estudo, sendo assim, objetivo da Estatstica extrair informao dos dados para obter uma melhor compreenso das situaes que representam. Quando se aborda uma problemtica envolvendo mtodos estatsticos, estes devem ser utilizados mesmo antes de se recolher amostra, isto , deve-se planejar a experincia que nos vai permitir recolher os dados, de modo que, posteriormente, se possa extrair o mximo de informao relevante para o problema em estudo, ou seja, para a populao de onde os dados provm. Quando de posse dos dados, procura-se agrupa-los e reduzi-los, sob forma de amostra, deixando de lado a aleatoriedade presente. Seguidamente o objetivo do estudo estatstico pode ser o de estimar uma quantidade ou testar uma hiptese, utilizando-se tcnicas estatsticas convenientes, as quais realam toda a potencialidade da Estatstica, na medida em que vo permitir tirar concluses acerca de uma populao, baseando-se numa pequena amostra, dando-nos ainda uma medida do erro cometido. 2. Ferramentas Estatsticas 2.1 - O que Estatstica? Segundo JURAN: 1. a cincia da tomada de deciso perante incertezas; 2. Coleta, anlise e interpretao de dados; 3. um kit de ferramentas que ajuda a resolver problemas; 4. Base para a maior parte das decises tomadas quanto ao controle da qualidade, assim como em quase todas as outras reas da atividade humana moderna. Vista dessa forma, a Estatstica no deve ser confundida como uma disciplina isolada, e sim, compreendida como uma ferramenta ou um conjunto de ferramentas, disponvel para a soluo de problemas em diversas reas do conhecimento. Segundo FEIGENBAUM: Preciso significativamente aumentada em produo de itens e produtos tem sido acompanhada pela necessidade de mtodos aperfeioados para medio, especificao e registro dela. A estatstica, denominada cincia das medies, representa uma das tcnicas mais valiosas utilizadas nas quatro tarefas, e isso tem ficado cada vez mais evidente.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

2.2 Onde se aplica a Estatstica na Engenharia? As aplicaes concentram-se fundamentalmente em dois campos de ao: o Controle Estatstico do Processo e o Controle Estatstico da Qualidade. Definies segundo JURAN: 1. Processo: qualquer combinao especfica de mquinas, ferramentas, mtodos, materiais e/ou pessoas empregadas para atingir qualidades especficas num produto ou servio. Estas qualidades so chamadas de caractersticas de qualidade, que podem ser uma dimenso, propriedade do material, aparncia, etc. 2. Controle: um ciclo de feedback (realimentao) atravs da qual medimos o desempenho real, comparando-o com o padro, e agimos sobre a diferena. 3. Controle Estatstico do Processo (CEP): aplicao de tcnicas estatsticas para medir e analisar a variao nos processos. 4. Controle Estatstico da Qualidade (CEQ): aplicao de tcnicas estatsticas para medir e aprimorar a qualidade dos processos. CEQ inclui CEP, ferramentas de diagnstico, planos de amostragem e outras tcnicas estatsticas. Segundo FEIGENBAUM, provavelmente, mais importante do que os prprios mtodos estatsticos tm sido o impacto causado sobre o pensamento industrial pela filosofia que representam. O ponto de vista estatstico resume-se essencialmente nisto: a variabilidade na qualidade do produto deve ser constantemente estudada: 1. Dentro de lotes de produto; 2. Em equipamentos de processo; 3. Entre lotes diferentes de um mesmo produto; 4. Em caractersticas crticas e em padres; 5. Em produo piloto, no caso de novos produtos. Esse ponto de vista, que enfatiza o estudo da variao, exerce efeito significativo sobre certas atividades no controle da qualidade. Ainda segundo FEIGENBAUM, cinco ferramentas estatsticas tornaram-se amplamente utilizadas nas tarefas de controle da qualidade: 1. Distribuio de freqncias; 2. Grficos de controle; 3. Aceitao por amostragem; 4. Mtodos especiais; 5. Confiabilidade. Na abordagem do papel dos mtodos estatsticos no gerenciamento de processos de produo, KUME tambm faz referncia variabilidade. Diz que, (...) independentemente dos tipos de produtos ou de mtodos de produo usados, as causas de produtos defeituosos so universais. Variao, esta a causa., Variaes nos materiais, na condio dos equipamentos, no mtodo de trabalho e na inspeo so as causas dos defeitos. Ainda segundo KUME, (...) os mtodos estatsticos so ferramentas eficazes para a melhoria do processo produtivo e reduo de seus defeitos. O primeiro passo na busca da verdadeira causa de um defeito a cuidadosa observao do fenmeno do defeito. Aps tal observao cuidadosa, a verdadeira causa torna-se evidente.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

As ferramentas estatsticas, diz KUME, conferem objetividade e exatido observao. As mximas da forma estatstica de pensar so: 1. Dar maior importncia aos fatos do que os conceitos abstratos; 2. No expressar fatos em termos de intuio ou idias. Usar evidncias obtidas a partir de resultados especficos da observao; 3. Os resultados da observao, sujeitos como so a erros e variaes, so partes de um todo obscuro. A principal meta da observao descobrir esse todo obscuro; 4. Aceitar o padro regular que aparece em grande parte dos resultados observados como uma informao confivel. 5. O conhecimento dominado ato o presente momento no nada mais que um embasamento para hipteses futuras. Uma vez que isso tenha sido compreendido, a forma de pensar mencionada pode ser aproveitada para aprofundar a compreenso do processo produtivo e dos meios para melhor-lo. 2.3 Definies Bsicas da Estatstica 1) FENMENO ESTATSTICO: qualquer evento que se pretenda analisar, cujo estudo seja possvel da aplicao do mtodo estatstico. So divididos em trs grupos: Fenmenos de massa ou coletivo: so aqueles que no podem ser definidos por uma simples observao. A estatstica dedica-se ao estudo desses fenmenos. Fenmenos individuais: so aqueles que iro compor os fenmenos de massa. Fenmenos de multido: quando as caractersticas observadas para a massa no se verificam para o particular. 2) DADO ESTATSTICO: um dado numrico e considerado a matria-prima sobre a qual iremos aplicar os mtodos estatsticos. 3) POPULAO: o conjunto total de elementos portadores de, pelo menos, uma caracterstica comum. 4) AMOSTRA: uma parcela representativa da populao que examinada com o propsito de tirarmos concluses sobre a essa populao. 5) PARMETROS: So valores singulares que existem na populao e que servem para caracteriz-la.Para definirmos um parmetro devemos examinar toda a populao. 6) ESTIMATIVA: um valor aproximado do parmetro e calculado com o uso da amostra. 7) ATRIBUTO: quando os dados estatsticos apresentam um carter qualitativo, o levantamento e os estudos necessrios ao tratamento desses dados so designados genericamente de estatstica de atributo. 8) VARIVEL: , convencionalmente, o conjunto de resultados possveis de um fenmeno. Varivel Qualitativa: Quando seus valores so expressos por atributos Varivel Quantitativa: Quando os dados so de carter nitidamente quantitativo, e o conjunto dos resultados possui uma estrutura numrica, trata-se, portanto da estatstica de varivel e se dividem em: Varivel Discreta ou Descontnua: Seus valores so expressos geralmente atravs de nmeros inteiros no negativos. Resulta normalmente de contagens. Ex: N de alunos presentes s aulas de introduo estatstica econmica no 1 semestre de 1997: mar = 18, abr = 30 , mai = 35 , jun = 36.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

Varivel Contnua: Resulta normalmente de uma mensurao, e a escala numrica de seus possveis valores corresponde ao conjunto R dos nmeros Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Ex.: Quando voc vai medir a temperatura de seu corpo com um termmetro de mercrio o que ocorre o seguinte: O filete de mercrio, ao dilatar-se, passar por todas as temperaturas intermedirias at chegar na temperatura atual do seu corpo. 2.4 Planejamento para Coleta e Anlise de Dados As ferramentas devem ser utilizadas de maneira eficiente para alcanar o sucesso. Para tanto, o processo deve incluir: 1. planejamento cuidadoso da coleta de dados; 2. anlise de dados para tirar concluses estatsticas e 3. transio para a resposta ao problema tcnico original. Segundo JURAN, alguns passos-chave so: 1. Coletar informaes anteriores suficientes para traduzir o problema de engenharia em problema especfico que possa ser avaliado por mtodos estatsticos; 2. Planejar a coleta de dados: a. Determinar o tipo de dados necessrios quantitativos (mais custo, mais til) e qualitativos; b. Determinar se quaisquer dados prvios esto disponveis e so aplicveis ao presente problema; c. Se o problema exigir uma avaliao de vrias decises alternativas, obter informaes sobre as conseqncias econmicas de uma deciso errada. d. Se o problema exigir a estimao de um parmetro, definir a preciso necessria para a estimativa; e. Determinar se o erro de medio grande o suficiente para influenciar o tamanho calculado da amostra ou o mtodo da anlise de dados; f. Definir as suposies necessrias para calcular o tamanho da amostra exigido; g. Calcular o tamanho da amostra necessrio considerando a preciso desejada do resultado, erro amostral, variabilidade dos dados, erros de medio e outros fatores; h. Definir quaisquer requisitos para preservar a ordem das medies quando o tempo for um parmetro chave; i.Determinar quaisquer requisitos para coletar dados em grupos definidos diferentes condies a serem avaliadas; j. Definir o mtodo de anlise de dados e quaisquer hipteses necessrias; k.Definir os requisitos para quaisquer programas de computador que venham a ser necessrios. 3. Coletar dados: a. Usar mtodos para assegurar que a amostra selecionada de forma aleatria; b. Registrar os dados e tambm as condies presentes no momento de cada observao; c. Examinar os dados amostrais para assegurar que o processo mostra estabilidade suficiente para se fazer previses vlidas para o futuro. 4. Analisar os dados: a. Selecionar os dados; b. Avaliar as hipteses previamente estabelecidas. Se necessrio, tomar atitudes corretivas (novas observaes); c. Aplicar tcnicas estatsticas para avaliar o problema original; d. Determinar se dados e anlises adicionais so necessrios;

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

e. Realizar anlises de sensibilidade variando estimativas amostrais importantes e outros fatores na anlise e observando o efeito sobre as concluses finais. 5. Rever as concluses da anlise de dados para determinar se o problema tcnico original foi avaliado ou se foi modificado para se enquadrar nos mtodos estatsticos. 6. Apresentar os resultados: a. Estabelecer as concluses de forma significativa, enfatizando os resultados nos termos do problema original, e no na forma dos ndices estatsticos usados na anlise; b. Apresentar graficamente os resultados quando apropriado. Usar mtodos estatsticos simples no corpo do relatrio e colocar as anlises complexas em um apndice. 7. Determinar se as concluses do problema especfico so aplicveis a outros problemas ou se os dados e clculos poderiam ser teis para outros problemas. 3. ESTATSTICA DESCRITIVA Viu-se anteriormente um roteiro para coleta e anlise de dados. As sries de dados, basicamente, so provenientes de duas fontes: os dados histricos e os dados de experimentos planejados. Os dados histricos so sries de dados existentes e, em geral, analisar estatisticamente esses dados mais econmico (tempo e despesas) se comparado com dados obtidos a partir de experimentos planejados. Mesmo com uma anlise estatstica complexa, em geral, pouco sucesso se obtm com tais dados. No controle de um processo, algumas razes para esse insucesso ocorrer so: 1.As variveis do processo podem estar altamente correlacionadas entre si, tornando impossvel distinguir a origem de um determinado efeito. 2.As variveis do processo podem ter sido manipuladas para controlar o resultado do processo. 3.As variveis do processo tm abrangncia pequena em relao ao intervalo de operao do processo. 4.Outras variveis que afetam o resultado do processo podem no ter sido mantidas constantes, e serem as reais causadoras dos efeitos observados no processo. Por essas razes, recomenda-se a anlise de sries de dados histricos apenas para a indicao de variveis importantes a serem observadas em um experimento planejado. Os dados de experimentos planejados so coletados com o objetivo estudar e analisar um problema. So dados reunidos em diversas sries de variveis com aparente importncia em um processo, enquanto se mantm constantes (com valores registrados) todas as outras variveis que possivelmente poderiam alterar o resultado. Aqui tratar-se- de mtodos prticos de organizao de dados. Segundo SPIEGEL4: A parte da estatstica que procura somente descrever e analisar um certo grupo, sem tirar quaisquer concluses ou inferncias sobre um grupo maior, chamada estatstica descritiva ou dedutiva. Freqentemente dois ou mais mtodos de organizao so utilizados para descrever com clareza dados coletados. Alguns desses mtodos so: grficos dos dados na ordem cronolgica, distribuio e histogramas de freqncia, caractersticas amostrais, medidas de tendncia central e medidas de disperso.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

4. SRIES ESTATSTICAS TABELA: Resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemtica. De acordo com a Resoluo 886 do IBGE, nas casas ou clulas da tabela devemos colocar:

um trao horizontal ( - ) quando o valor zero; trs pontos ( ... ) quando no temos os dados; zero ( 0 ) quando o valor muito pequeno para ser expresso pela unidade utilizada; um ponto de interrogao ( ? ) quando temos dvida quanto exatido de determinado valor.

Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto. "Salientamos que nestes documentos as tabelas no sero abertas devido a limitaes do editor html". qualquer tabela que apresenta a distribuio de um conjunto de dados estatsticos em funo da poca, do local ou da espcie. Sries Homgradas: so aquelas em que a varivel descrita apresenta variao discreta ou descontnua. Podem ser do tipo temporal, geogrfica ou especfica. a) Srie Temporal: Identifica-se pelo carter varivel do fator cronolgico. O local e a espcie (fenmeno) so elementos fixos. Esta srie tambm chamada de histrica ou evolutiva. ABC VECULOS LTDA. Vendas no 1 bimestre de 2002
PERODO UNIDADES VENDIDAS *

JAN/2002 FEV/2002 TOTAL * Em mil unidades .

20 10 30

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

b) Srie Geogrfica: Apresenta como elemento varivel o fator geogrfico. A poca e o fato (espcie) so elementos fixos. Tambm chamada de espacial, territorial ou de localizao. ABC VECULOS LTDA. Vendas no 1 bimestre de 2002
FILIAIS UNIDADES VENDIDAS *

So Paulo Rio de Janeiro TOTAL * Em mil unidades

13 17 30

c) Srie Especfica: O carter varivel apenas o fato ou espcie. Tambm chamada de srie categrica. ABC VECULOS LTDA. Vendas no 1 bimestre de 2002
MARCA UNIDADES VENDIDAS *

FIAT GM TOTAL * Em mil unidades

18 12 30

Sries Conjugadas: Tambm chamadas de tabelas de dupla entrada. So apropriadas apresentao de duas ou mais sries de maneira conjugada, havendo duas ordens de classificao: uma horizontal e outra vertical. O exemplo abaixo de uma srie geogrficatemporal. ABC VECULOS LTDA. Vendas no 1 bimestre de 2002 FILIAIS So Paulo Rio de Janeiro TOTAL Janeiro/2002 10 12 22 * Em mil unidades Obs: as sries hetergradas sero estudas no captulo 2 ( distribuio de frequncias ). Fevereiro/2002 3 5 8

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

10

CAPTULO 2 DISTRIBUIO DE FREQUNCIAS


uma ferramenta estatstica apropriada para a apresentao de grandes massas de dados numa forma que torna mais clara a tendncia central e a disperso dos valores ao longo da escala de medio, bem como a freqncia relativa de ocorrncia dos diferentes valores. Quando da anlise de dados, comum procurar conferir certa ordem aos nmeros tornandoos visualmente mais amigveis. O procedimento mais comum o de diviso por classes ou categorias, verificando-se o nmero de indivduos pertencentes a cada classe. um tipo de tabela que condensa uma coleo de dados conforme as frequncias (repeties de seus valores). Tabela primitiva ou dados brutos: uma tabela ou relao de elementos que no foram numericamente organizados. difcil formarmos uma idia exata do comportamento do grupo como um todo, a partir de dados no ordenados. Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 ROL: Tem-se um rol aps a ordenao dos dados (crescente ou decrescente). Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 Distribuio de frequncia sem intervalos de classe: a simples condensao dos dados conforme as repeties de seus valores. Para um tabela de tamanho razovel esta distribuio de frequncia inconveniente, j que exige muito espao. Veja exemplo abaixo: Tabela 1 Dados Frequncia 41 3 42 2 43 1 44 1 45 1 46 2 50 2 51 1 52 1 54 1 57 1 58 2 60 2 Total 20

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

11

Distribuio de frequncia com intervalos de classe:Quando o tamanho da amostra elevado mais racional efetuar o agrupamento dos valores em vrios intervalos de classe. Tabela 2 Classes Frequncias 41 |------- 45 7 45 |------- 49 3 49 |------- 53 4 53 |------- 57 1 57 |------- 61 5 Total 20

2.1 Elementos de uma Distribuio de Freqncia com classes CLASSE: so os intervalos da varivel simbolizada por i e o nmero total de classes simbolizada por k. Ex: na tabela anterior k=5 e 49 |------- 53 a 3 classe, onde i=3. Para a construo de uma tabela a partir de um dado bruto calcularemos o k atravs da Regra de Sturges" k=1+3,3logn (para n<25) ou k=n (para n>25). LIMITES DE CLASSE: so os extremos de cada classe. O menor nmero o limite inferior de classe (li) e o maior nmero, limite superior de classe (Ls). Ex: em 49 |--- 53 Li3= 49 e Ls3= 53. O smbolo |--- representa um intervalo fechado esquerda e aberto direita. O dado 53 no pertence classe 3 e sim a classe 4 representada por 53 |--- 57. AMPLITUDE DO INTERVALO DE CLASSE: obtida atravs da diferena entre o limite superior e inferior da classe simbolizada por a = Ls - li. Ex: na tabela anterior a= 53 49 = 4. Obs: Na distribuio de frequncia c/ classe o c ser igual em todas as classes. Para a construo de uma tabela a partir de um dado bruto temos: a=Ls-Li/K AMPLITUDE TOTAL DA DISTRIBUIO: a diferena entre o valor mximo e o valor mnimo da amostra. Onde At = Xmax - Xmin. Em nosso exemplo At = 60 - 41 = 19. PONTO MDIO DE CLASSE: o ponto que divide o intervalo de classe em duas partes iguais. Ex: em 49 |------- 53 o ponto mdio x3 = (53+49)/2 = 51, ou seja, x3=(Li+Ls)/2.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

12

Os dados brutos a seguir apresentam um conjunto de tempos para determinada operao.


5,1 6,3 6,7 7,3 7,8 8,5 9,4 10,4 5,3 6,3 6,8 7,4 7,9 8,5 9,4 10,6 5,3 6,3 6,8 7,5 7,9 8,6 9,5 10,8 5,6 6,4 6,9 7,5 8 8,7 9,5 10,9 5,8 6,4 6,9 7,6 8 8,8 9,6 11,2 5,9 6,4 7 7,6 8,1 8,8 9,8 11,5 6 6,5 7,1 7,6 8,2 8,9 9,9 11,8 6,1 6,5 7,1 7,7 8,3 9 10 12,3 6,2 6,6 7,2 7,7 8,3 9,1 10,2 12,7 6,2 6,7 7,2 7,8 8,4 9,2 10,2 14,9

2.2 Regras para a elaborao de uma distribuio de freqncias com classes 1 Organize os dados brutos em um ROL. 2 Calcule a amplitude total At. No nosso exemplo: At =14,9 5,1 = 9,8 3 Calcule o nmero de classes (K), que ser calculado usando K = . Obrigatoriamente deve estar compreendido entre 5 a 20. Neste caso, K igual a 8,94, aproximadamente, 8. No nosso exemplo: n = 80 dados, ento , k=n = 8,9 . 4 Conhecido o nmero de classes define-se a amplitude de cada classe:

No exemplo, a ser igual a:

5 Temos ento o menor n da amostra, o n de classes e a amplitude do intervalo. Podemos montar a tabela, com o cuidado para no aparecer classes com frequncia = 0 (zero). 6 Com o conhecimento da amplitude de cada classe, define-se os limites para cada classe (inferior e superior), onde limite Inferior ser 5,1 e o limite superior ser 15 + 1,23.
Freqncia Acu mul ada (Fi) 13 34 56 71 75 78 79 Freqncia Acumulada (Fr)

Intervalo de Classe 05,10 |---| 06,33 06,34 |---| 07,57 07,58 |---| 08,81 08,82 |---| 10,05 10,06 |---| 11,29 11,30 |---| 12,53 12,54 |---| 13,77

Freqncia Absoluta (fi) 13 21 22 15 4 3 1

Freqncia Relativa (fr) 16,25 26,25 27,50 18,75 5,00 3,75 1,25

16,25 42,50 70,00 88,75 93,75 97,50 98,75

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

13

13,78 |---| 15,01

Total

1 80

80

1,25 100

100 -

Obs: Agrupar os dados em classes uma importante ferramenta para resumir grandes massas de dados brutos, no entanto acarreta perda de alguns detalhes. Frequncias simples ou absolutas (fi): so os valores que realmente representam o nmero de dados de cada classe. A soma das frequncias simples igual ao nmero total dos dados da distribuio. Frequncias relativas (fr): so os valores das razes entre as frequncias absolutas de cada classe e a frequncia total da distribuio. A soma das frequncias relativas igual a 1 (100 %). Frequncia simples acumulada de uma classe (Fi): o total das frequncias de todos os valores inferiores ao limite superior do intervalo de uma determida classe. Frequncia relativa acumulada de um classe (Fr): a frequncia acumulada da classe, dividida pela frequncia total da distribuio.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

14

CAPTULO 3 MEDIDAS DE CENTRALIDADE


H vrias medidas de tendncia central, entretanto nesta apostila, ser abordado o estudo de apenas aquelas que so mais significativas. As mais importante medidas de tendncia central so: a mdia aritmtica, mdia aritmtica para dados agrupados, mdia aritmtica ponderada, mediana, moda.

3. Medidas de Centralidade 3.1 Mdia Aritmtica= Sendo a mdia uma medida to sensvel aos dados, preciso ter cuidado com a sua utilizao, pois pode dar uma imagem distorcida dos dados. A mdia possui uma particularidade bastante interessante, que consiste no seguinte: se calcularmos os desvios de todas as observaes relativamente mdia e somarmos esses desvios o resultado obtido igual a zero. A mdia tem uma outra caracterstica, que torna a sua utilizao vantajosa em certas aplicaes: Quando o que se pretende representar a quantidade total expressa pelos dados, utiliza-se a mdia. Na realidade, ao multiplicar a mdia pelo nmero total de elementos, obtemos a quantidade pretendida. igual ao quociente entre a soma dos valores do conjunto e o nmero total dos valores. ...onde xi so os valores da varivel e n o nmero de valores. .Dados no-agrupados: Quando desejamos conhecer a mdia dos dados no-agrupados em tabelas de frequncias, determinamos a mdia aritmtica simples. Exemplo: Os dados a seguir apresentam leituras de concentrao de um processo qumico feitas a cada duas horas 10, 14, 13, 15, 16, 18 e 12, temos, uma concentrao mdia de: .= (10+14+13+15+16+18+12) / 7 = 14 Desvio em relao mdia: a diferena entre cada elemento de um conjunto de valores e a mdia aritmtica, ou seja:.. di = Xi -

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

15

No exemplo anterior temos sete desvios:.d1 = 10 - 14 = - 4 ,.d2 = 14 - 14 = 0 , d3 = 13 - 14 = - 1 ,.d4 = 15 - 14 = 1 ,.d5 = 16 - 14 = 2 ,..d6 = 18 - 14 = 4 e.d7 = 12 - 14 = - 2. Propriedades da mdia 1 propriedade: A soma algbrica dos desvios em relao mdia nula. No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0 2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma varivel, a mdia do conjunto fica aumentada (ou diminuda) dessa constante. Se no exemplo original somarmos a constante 2 a cada um dos valores da varivel temos: Y = 12+16+15+17+18+20+14 / 7 = 16 ou Y= .+ 2 = 14 +2 = 16

3 propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante (c), a mdia do conjunto fica multiplicada (ou dividida) por essa constante. Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da varivel temos: Y = 30+42+39+45+48+54+36 / 7 = 42 ou Y=
.

x 3 = 14 x 3 = 42

Dados agrupados:

Sem intervalos de classe Consideremos a distribuio relativa de um canal de comunicao que est sendo monitorado pelo registro do n de erros em um conjunto de caracteres (string) 1.000 bits. Dados para 34 desses conjuntos so vistos a seguir. N de erros frequncia = fi 0 2 1 6 2 10 3 12 4 4 total 34

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

16

Como as frequncias so nmeros indicadores da intensidade de cada valor da varivel, elas funcionam como fatores de ponderao, o que nos leva a calcular a mdia aritmtica ponderada, dada pela frmula:

..xi. ..fi. ..xi.fi .


0 1 2 3 4 total 2 6 10 12 4 34 0 6 20 36 16 78

onde 78 / 34 = 2,3 erros Com intervalos de classe Neste caso, convencionamos que todos os valores includos em um determinado intervalo de classe coincidem com o seu ponto mdio, e determinamos a mdia aritmtica ponderada por meio da frmula: ..onde Xi o ponto mdio da classe. Exemplo: Calcular o nmero de molas fora de conformidade, em cada batelada de produo, com um tamanho igual a 40 conforme a tabela abaixo. N de molas frequncia = fi ponto mdio = xi ..xi.fi. 50 |---- 54 54 |---- 58 58 |---- 62 62 |---- 66 66 |---- 70 70 |---- 74 Total 4 9 11 8 5 3 40 52 56 60 64 68 72 208 504 660 512 340 216 2.440 = 61 molas

Aplicando a frmula acima temos: 2.440 / 40.= 61. logo...

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

17

MODA o valor que ocorre com maior frequncia em uma srie de valores. Mo o smbolo da moda. Desse modo, a fora modal de remoo para um conector a fora mais comum, isto , a fora de remoo medida em um teste de laboratrio para um conector. . A Moda quando os dados no esto agrupados

A moda facilmente reconhecida: basta, de acordo com definio, procurar o valor que mais se repete.

Exemplo: Na srie { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda igual a 10.

H sries nas quais no exista valor modal, isto , nas quais nenhum valor aparea mais vezes que outros.

Exemplo: { 3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal.

.Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos, ento, que a srie tem dois ou mais valores modais.

Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A srie bimodal. .A Moda quando os dados esto agrupados a) Sem intervalos de classe Uma vez agrupados os dados, possvel determinar imediatamente a moda: basta fixar o valor da varivel de maior frequncia. Exemplo: Qual a temperatura mais comum medida no ms abaixo: Temperaturas Frequncia 0 C 3 1 C 9 2 C 12 3 C 6 Resp: 2 C a temperatura modal, pois a de maior frequncia.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

18

. b) Com intervalos de classe A classe que apresenta a maior frequncia denominada classe modal. Pela definio, podemos afirmar que a moda, neste caso, o valor dominante que est compreendido entre os limites da classe modal. O mtodo mais simples para o clculo da moda consiste em tomar o ponto mdio da classe modal. Damos a esse valor a denominao de moda bruta. Mo = ( Li+ Ls) / 2 onde Li = limite inferior da classe modal e Ls= limite superior da classe modal. Exemplo: Calcule a resistncia modal dos 33 resistores conforme a tabela abaixo. Resistencia (em ohms) Frequncia 54 |---- 58 9 58 |---- 62 11 62 |---- 66 8 66 |---- 70 5 Resp: a classe modal 58|--- 62, pois a de maior frequncia. Li=58 e Ls=62 Mo = (58+62) / 2 = 60 cm (este valor estimado, pois no conhecemos o valor real da moda). Mtodo mais elaborado pela frmula de CZUBER: Mo = Li + ((fmo - fant) / ( 2fmo (fant + fpost))) x c Li= limite inferior da classe modal fmo = frequncia da classe modal fant =frequncia da classe anterior da classe modal fpost =frequncia da classe posterior da classe modal c = amplitude da classe modal Obs: A moda utilizada quando desejamos obter uma medida rpida e aproximada de posio ou quando a medida de posio deva ser o valor mais tpico da distribuio. J a mdia aritmtica a medida de posio que possui a maior estabilidade.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

19

MEDIANA A mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou decrescente), o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo nmero de elementos. Smbolo da mediana: Md .A mediana em dados no-agrupados Dada uma srie de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 } De acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 } O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9. Mtodo prtico para o clculo da Mediana Se a srie dada tiver nmero mpar de termos: O valor mediano ser o termo de ordem dado pela frmula : O elemento mediano ser:..EMd = n + 1 / 2 Exemplo: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 2, 5 } 1 - ordenar a srie { 0, 0, 1, 1, 2, 2, 3, 4, 5 } n = 9 logo (n + 1)/2 dado por (9+1) / 2 = 5, ou seja, o 5 elemento da srie ordenada ser a mediana. A mediana ser o 5 elemento, ou seja, Md = 2 Se a srie dada tiver nmero par de termos: O elemento mediano ser:..EMd = n / 2 Exemplo: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 } 1 - ordenar a srie { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 } n = 10 logo a frmula ficar: :..EMd = 10 / 2 = 5 Ser na realidade (5 termo + 6 termo) / 2

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

20

A mediana ser = (2+3) / 2, ou seja, Md = 2,5 . A mediana no exemplo ser a mdia aritmtica do 5 e 6 termos da srie. Notas:

Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia da mediana com um dos elementos da srie. Quando o nmero de elementos da srie estatstica for par, nunca haver coincidncia da mediana com um dos elementos da srie. A mediana ser sempre a mdia aritmtica dos 2 elementos centrais da srie. Em um srie a mediana, a mdia e a moda no tm, necessariamente, o mesmo valor. A mediana, depende da posio e no dos valores dos elementos na srie ordenada. Essa uma da diferenas marcantes entre mediana e mdia (que se deixa influenciar, e muito, pelos valores extremos). Vejamos:

Em { 5, 7, 10, 13, 15 } a mdia = 10 e a mediana = 10 Em { 5, 7, 10, 13, 65 } a mdia = 20 e a mediana = 10 Isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influncia dos valores extremos, ao passo que a mediana permanece a mesma. . A mediana em dados agrupados a) Sem intervalos de classe Neste caso, o bastante identificar a frequncia acumulada imediatamente superior metade da soma das frequncias. A mediana ser aquele valor da varivel que corresponde a tal frequncia acumulada. Exemplo conforme tabela abaixo: Varivel xi Frequncia fi Frequncia acumulada 0 2 2 1 6 8 2 9 17 3 13 30 4 5 35 Total 35 Quando o somatrio das frequncias for mpar o valor mediano ser o termo de ordem dado pela frmula :.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

21

Como o somatrio das frequncias = 35 a frmula ficar: ( 35+1 ) / 2 = 18 termo = 3.. Quando o somatrio das frequncias for par o valor mediano ser o termo de ordem dado pela frmula :.

Exemplo - Calcule Mediana da tabela abaixo: Varivel xi Frequncia fi Frequncia acumulada 12 1 1 14 2 3 15 1 4 16 2 6 17 1 7 20 1 8 Total 8 Aplicando a frmula acima teremos: [(8/2)+ (8/2+1)]/2 = (4 termo + 5 termo) / 2 = (15 + 16) / 2 = 15,5 b) Com intervalos de classe Devemos seguir os seguintes passos: 1) Determinamos as frequncias acumuladas ; 2) Calculamos ; 3) Marcamos a classe correspondente frequncia acumulada

imediatamente superior . Tal classe ser a classe mediana; 4) Calculamos a Mediana pela seguinte frmula:..Li + [(EMd - Fant) x c] / fMd Li = o limite inferior da classe mediana. Fant = a frequncia acumulada da classe anterior classe mediana. fMd= a frequncia simples da classe mediana. c = a amplitude do intervalo da classe mediana.

Exemplo:

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

22

classes frequncia = fi Frequncia acumulada 50 |---- 54 4 4 54 |---- 58 9 13 58 |---- 62 11 24 62 |---- 66 8 32 66 |---- 70 5 37 70 |---- 74 3 40 Total 40 = 40 / 2 =.20..logo.a classe mediana ser 58 |---- 62 Li = 58....... Fant = 13........... fMd = 11........... c = 4 Substituindo esses valores na frmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 OBS: Esta mediana estimada, pois no temos os 40 valores da distribuio. Emprego da Mediana

Quando desejamos obter o ponto que divide a distribuio em duas partes iguais. Quando h valores extremos que afetam de maneira acentuada a mdia aritmtica.

CAPTULO 4 - MEDIDAS DE ASSIMETRIA E CURTOSE

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

23

Denominamos curtose o grau de achatamento de uma distribuio em relao a uma distribuio padro, denominada curva normal (curva correspondente a uma distribuio terica de probabilidade).

Distribuies simtricas A distribuio das frequncias faz-se de forma aproximadamente simtrica, relativamente a uma classe mdia. Quando a distribuio simtrica, a mdia e a mediana coincidem.

Caso especial de uma distribuio simtrica Quando dizemos que os dados obedecem a uma distribuio normal, estamos tratando de dados que se distribuem em forma de sino. Distribuies Assimtricas A distribuio das freqncias apresenta valores menores num dos lados:

Distribuies com "caudas" longas

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

24

Observamos que nas extremidades h uma grande concentrao de dados em relao aos concentrados na regio central da distribuio.

A partir do exposto, deduzimos que se a distribuio dos dados: 1.for aproximadamente simtrica, a mdia aproxima-se da mediana 2.for enviesada para a direita (alguns valores grandes como "outliers"), a mdia tende a ser maior que a mediana 3. for enviesada para a esquerda (alguns valores pequenos como "outliers"), a mdia tende a ser inferior mediana. So representaes visuais dos dados estatsticos que devem corresponder, mas nunca substituir as tabelas estatsticas. Tm como caractersticas principais, o uso de escalas, a existncia de um sistema de coordenadas, a simplicidade, clareza e veracidade de sua representao.

CAPTULO 5 - REPRESENTAO GRFICA

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

25

Os grficos podem ser: 1. Grficos de informao: grficos destinados principalmente ao pblico em geral, objetivando proporcionar uma visualizao rpida e clara. So grficos tipicamente expositivos, dispensando comentrios explicativos adicionais. As legendas podem ser omitidas, desde que as informaes desejadas estejam presentes ou 2. Grficos de anlise: grficos que prestam-se melhor ao trabalho estatstico, fornecendo elementos teis fase de anlise dos dados, sem deixar de ser tambm informativos. Os grficos de anlise freqentemente vm acompanhados de uma tabela estatstica. Inclui-se, muitas vezes um texto explicativo, chamando a ateno do leitor para os pontos principais revelados pelo grfico. Mas o uso indevido de Grficos pode trazer uma idia falsa dos dados que esto sendo analisados, chegando mesmo a confundir o leitor, tratando-se, na realidade, de um problema de construo de escalas. . Os grficos pode ser classificados em: Diagramas, Estereogramas, Pictogramas e Cartogramas. . 4.1 - Diagramas So grficos geomtricos dispostos em duas dimenses. So os mais usados na representao de sries estatsticas. Eles podem ser : 1 - Grficos em barras horizontais. 2 - Grficos em barras verticais (colunas). Quando as legendas no so breves usa-se de preferncia o grfico em barras horizontais. Nesses grficos os retngulos tm a mesma base e as alturas so proporcionais aos respectivos dados. A ordem a ser observada a cronolgica, se a srie for histrica, e a decrescente, se for geogrfica ou categrica.

Fig 1. Grfico de barras de harmnicos da rede eltrica em uma determinada regio.

3 - Grficos em barras compostas.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

26

4 - Grficos em colunas superpostas. Eles diferem dos grficos em barras ou colunas convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou mais atributos. 5 - Grficos em linhas ou lineares. So freqentemente usados para representao de sries cronolgicas com um grande nmero de perodos de tempo. As linhas so mais eficientes do que as colunas, quando existem intensas flutuaes nas sries ou quando h necessidade de se representarem vrias sries em um mesmo grfico. Quando representamos, em um mesmo sistema de coordenadas, a variao de dois fenmenos, a parte interna da figura formada pelos grficos desse fenmeno denominada de rea de excesso. 6 - Grficos em setores. Este grfico construdo com base em um crculo, e empregado sempre que desejamos ressaltar a participao do dado no total. O total representado pelo crculo, que fica dividido em tantos setores quantas so as partes. Os setores so tais que suas reas so respectivamente proporcionais aos dados da srie. O grfico em setores s deve ser empregado quando h, no mximo, sete dados. Obs: As sries temporais geralmente no so representadas por este tipo de grfico. . 4.2 - Estereogramas So grficos geomtricos dispostos em trs dimenses, pois representam volume. So usados nas representaes grficas das tabelas de dupla entrada. Em alguns casos este tipo de grfico fica difcil de ser interpretado dada a pequena preciso que oferecem. 4.3 - Pictogramas So construdos a partir de figuras representativas da intensidade do fenmeno. Este tipo de grfico tem a vantagem de despertar a ateno do pblico leigo, pois sua forma atraente e sugestiva. Os smbolos devem ser auto-explicativos. A desvantagem dos pictogramas que apenas mostram uma viso geral do fenmeno, e no de detalhes minuciosos. Veja o exemplo abaixo:

4.4 - Cartogramas So ilustraes relativas a cartas geogrficas (mapas). O objetivo desse grfico o de figurar os dados estatsticos diretamente relacionados com reas geogrficas ou polticas.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

27

Dados obtidos de uma amostra servem como base para uma deciso sobre a populao. Quanto maior for o tamanho da amostra, mais informao obtemos sobre a populao. Porm, um aumento do tamanho da amostra tambm implica um aumento da quantidade de dados e isso torna difcil compreender a populao, mesmo quando esto organizados em tabelas. Em tal caso, precisa-se de um mtodo que possibilite conhecer a populao num rpido exame. Um histograma atende s necessidades, por meio da organizao de muitos dados num histograma, pode-se conhecer a populao de maneira objetiva. 4.5 - Grficos dos Dados na Ordem Cronolgica Representao grfica do resultado Y versus a ordem cronolgica de execuo do experimento (diagrama do resultado Y versus tempo t). Nesse tipo de grfico, alguns dos possveis fenmenos que podem ser observados so: 1.Curva de aprendizagem dos experimentadores (pontos no incio do experimento). 2.Tendncias dentro de um determinado perodo (horas, turnos, dias, etc.), freqentemente em funo de aquecimento, fadiga, e outros fatores relacionados com o tempo. 3.Aumento ou diminuio da variabilidade dos dados com o tempo, podendo representar curva de aprendizagem ou caractersticas relativas ao material. 4.6 - Histogramas de Freqncia ou Distribuio de Freqncias uma ferramenta estatstica apropriada para a apresentao de grandes massas de dados numa forma que torna mais clara a tendncia central e a disperso dos valores ao longo da escala de medio, bem como a freqncia relativa de ocorrncia dos diferentes valores.

CAPTULO 6 - MEDIDAS DE DISPERSO OU DE VARIABILIDADE


No captulo 3 vimos algumas medidas de localizao do centro de uma distribuio de dados. Veremos agora como medir a variabilidade presente num conjunto de dados.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

28

Um aspecto importante no estudo descritivo de um conjunto de dados o da determinao da variabilidade ou disperso desses dados, relativamente medida de localizao do centro da amostra.

DESVIO PADRO ( S ) a medida de disperso mais empregada, pois leva em considerao a totalidade dos valores da varivel em estudo. um indicador de variabilidade bastante estvel. O desvio padro baseia-se nos desvios em torno da mdia aritmtica e a sua frmula bsica pode ser traduzida como: a raiz quadrada da mdia aritmtica dos quadrados dos desvios e representada por S. Uma vez que a varincia envolve a soma de quadrados, a unidade em que se exprime no a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou disperso com as mesmas unidades que os dados, tomamos a raiz quadrada da varincia e obtemos o desvio padro.

O desvio padro uma medida que s pode assumir valores no negativos e quanto maior for, maior ser a disperso dos dados. A frmula acima empregada quando tratamos de uma populao de dados noagrupados.

Exemplo: Calcular o desvio padro da populao representada por - 4 , -3 , -2 , 3 , 5

Xi

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

29

-4 -3 -2 3 5
Total

- 0,2 - 0,2 - 0,2 - 0,2 - 0,2


-

- 3,8 - 2,8 - 1,8 3,2 5,2


-

14,44 7,84 3,24 10,24 27,04 62,8

Sabemos que n = 5 e 62,8 / 5 = 12,56. A raiz quadrada de 12,56 o desvio padro = 3,54 Quando os dados esto agrupados (temos a presena de frequncias) a frmula do desvio padro ficar:

ou
Exemplo: Calcule o desvio padro populacional da tabela abaixo: Xi f i Xi . f i 0 6 24 21 12 63 2,1 2,1 2,1 2,1 2,1 -2,1 -1,1 -0,1 0,9 1,9 4,41 1,21 0,01 0,81 3,61 8,82 7,26 0,12 5,67 10,83 32,70 .fi

0 2 1 6 2 12 3 7 4 3 Total 30

Sabemos que fi = 30 e 32,7 / 30 = 1,09. A raiz quadrada de 1,09 o desvio padro = 1,044 Se considerarmos os dados como sendo de uma amostra o desvio padro seria a raiz quadrada de 32,7 / (30 -1) = 1,062 Obs: Nas tabelas de frequncias com intervalos de classe a frmula a ser utilizada a mesma do exemplo anterior.

VARINCIA ( S2 )

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

30

Define-se a varincia, como sendo a medida que se obtm somando os quadrados dos desvios das observaes da amostra, relativamente sua mdia, e dividindo pelo nmero de observaes da amostra menos um.

S2 =

A varincia uma medida que tem pouca utilidade como estatstica descritiva, porm extremamente importante na inferncia estatstica e em combinaes de amostras.

MEDIDAS DE DISPERSO RELATIVA CVP: Coeficiente de Variao de Pearson Na estatstica descritiva o desvio padro por si s tem grandes limitaes. Assim, um desvio padro de 2 unidades pode ser considerado pequeno para uma srie de valores cujo valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito. Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais sries de valores, relativamente sua disperso ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ou variabilidade dos dados em termos relativos a seu valor mdio, medida essa denominada de CVP: Coeficiente de Variao de Pearson ( a razo entre o desvio padro e a mdia referente aos dados de uma mesma srie). A frmula do CVP = (S / ) x 100 (o resultado neste caso expresso em percentual, entretanto pode ser expresso tambm atravs de um fator decimal, desprezando assim o valor 100 da frmula).

Exemplo 1: Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivduos: Discriminao MDIA DESVIO PADRO

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

31

ESTATURAS PESOS

175 cm 68 kg

5,0 cm 2,0 kg

Qual das medidas (Estatura ou Peso) possui maior homogeneidade? Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado menor ser o de maior homogeneidade (menor disperso ou variabilidade). CVP estatura = ( 5 / 175 ) x 100 = 2,85 % CVP peso = ( 2 / 68 ) x 100 = 2,94 %. Logo, nesse grupo de indivduos, as estaturas apresentam menor grau de disperso que os pesos.

Exemplo 2: O risco de uma ao de uma empresa pode ser devidamente avaliado atravs da variabilidade dos retornos esperados. Portanto, a comparao das distribuies probabilsticas dos retornos, relativas a cada ao individual, possibilita a quem toma decises perceber os diferentes graus de risco. Analise, abaixo, os dados estatsticos relativos aos retornos de 5 aes e diga qual a menos arriscada?

Discriminao Ao A Ao B Ao C Ao D Ao E Valor esperado 15 % 12 % 5% 10 % 4% Desvio padro 6% 6,6 % 2,5 % 3% 2,6 % Coeficiente de variao 0,40 0,55 0,50 0,30 0,65

CAPTULO 7 CORRELAO E REGRESSO

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

32

7.1 DIAGRAMAS DE DISPERSO


Na prtica, muitas vezes essencial estudar a relao entre duas variveis associadas como, por exemplo, o grau a dimenso de uma pea de mquina ir variar em funo da mudana da velocidade de um torno. Para estudar a relao entre duas variveis, tais como dito acima, pode-se usar o chamado diagrama de disperso. Diagrama de Disperso uma forma de grfico onde simplesmente representa-se graficamente cada par de variveis de uma srie de dados em um sistema de eixos. Tomando como exemplo os dados da Tabela abaixo, pode-se construir um diagrama de disperso:

7.1.1 COMO CONSTRUIR UM DIAGRAMA DE DISPERSO

Um diagrama de disperso construdo conforme as seguintes etapas: Etapa 1 Coletar dados em pares (X,Y) entre os quais deseja-se estudar as relaes, e organize-os em uma tabela. desejvel que se tenha pelo menos 30 pares de dados. Etapa 2 Encontrar os valores mximo e mnimo, tanto para X como para Y. Defina as escalas dos eixos horizontal e vertical de forma que ambos os comprimentos sejam aproximadamente iguais; assim, o diagrama ficar mais fcil de interpretar. Determinar, para cada eixo, entre 3 e 10 divises para as unidades da escala de graduao, e utilize nmeros inteiros para torna-lo mais fcil de ler. Quando duas variveis consistirem em um fator e uma caracterstica da qualidade, use o eixo horizontal X para o fator e o eixo vertical Y para a caracterstica da qualidade. Etapa 3 Marcar os dados num papel milimetrado. Quando os mesmos valores de dados forem obtidos a partir de diferentes observaes, mostre estes pontos, desenhando crculos concntricos ou marcando o segundo ponto rente ao primeiro.

Etapa 4 Inserir todos os itens necessrios. Certificar de que os seguintes itens sejam includos para que qualquer pessoa, alm do autor do diagrama, possa entende-lo num rpido exame: a. Ttulo do diagrama;

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

33

b. Perodo de tempo; c. Quantidade de pares de dados; d. Denominao e unidade de medida de cada eixo; Exemplo 1: Um fabricante de tanques plsticos, que os fabricava pelo processo de moldagem a sopro, encontrou problemas de tanques defeituosos com paredes finas. Suspeitou-se que a variao da presso do ar, dia a dia, era a causa das paredes finas no-conformes. A Tabela a seguir mostra dados sobre a presso de sopro e a percentagem defeituosa. Tabela 1 Dados da Presso de Sopro e Percentagem Defeituosa de Tanques de Plstico

Conforme visto na Tabela acima, existem 30 pares de dados. Etapa 2 Neste exemplo, indicamos a presso de sopro por X (eixo horizontal) e a percentagem defeituosa por Y (eixo vertical). Assim: O valor mximo de x: xmx = 9,4 (kgf/cm) O valor mnimo de x: xmn = 8,2 (kgf/cm) O valor mximo de y: ymx = 0,928 (%) O valor mnimo de y: ymn = 0,864 (%) Marca-se divises para graduao: no eixo horizontal em intervalos de 0,5(kgf/cm) de 8,0 a 9,5(kgf/cm) no eixo vertical em intervalos de 0,01(%) de 0,85 a 0,93(%)

Etapa 3 Marca-se os pontos no grfico. Etapa 4

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

34

Anota-se o perodo de tempo a que se refere amostra coletada (1 de outubro a 9 de novembro), a quantidade de amostras (n = 30), o eixo horizontal (presso de sopro [kgf/cm]), o eixo vertical (percentagem defeituosa [%]), e o ttulo do diagrama (diagrama de disperso da presso do sopro e a percentagem defeituosa).

Figura 1 Exemplo de Diagrama de Disperso


7.1.2 Como Interpretar os Diagramas de Disperso

Assim como possvel avaliar o formato de uma distribuio em um histograma, a distribuio global dos pares de dados pode ser interpretada a partir de um diagrama de disperso. Ao proceder a leitura, a primeira coisa que se deve fazer examinar se h ou no pontos atpicos no diagrama. Geralmente, pode-se julgar que quaisquer pontos afastados do grupo principal (Figura 2) resultaram de erros na medio ou registro de dados, ou foram causados por alguma mudana nas condies de operao. necessrio excluir esses pontos para anlise da correlao. Contudo, ao invs de desprezar completamente estes pontos, deveria ser dada a devida ateno causa de tais irregularidades, pois muitas vezes, informaes inesperadas, porm muito teis, so obtidas descobrindo-se por que eles ocorreram. Existem muitos tipos de padres de disperso, e alguns destes so dados da Figura 3. Nesta figura, tanto na .1 como na .2, Y aumenta com X; este o caso da correlao positiva. E ainda, como a .1 mostra esta tendncia de forma notvel, diz-se que ela apresenta forte correlao positiva. As Figuras .4 e .5 mostram o oposto da correlao positiva, pois medida que X aumenta, Y diminui; este o caso da chamada correlao negativa. A Figura 4 indica uma forte correlao negativa. A Figura .3 mostra o caso em que X e Y no tm nenhuma relao especfica; portanto, dizemos que no h correlao. Na Figura .6, medida que X aumenta, Y varia num padro curvo. Isto ser explicado posteriormente.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

35

Figura 2 Exemplo de Pontos Suspeitos

.1 - Correlao Positiva .2 - Correlao Negativa .3 - Pode haver Correlao Positiva .4 - Pode haver Correlao Negativa .5 - No H Correlao .6 - No H Correlao

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

36

Figura 3 Exemplos de Correlao

7.2 Clculo de Coeficientes de Correlao

Para estudar a relao entre X e Y importante traar primeiro um diagrama de disperso, entretanto, a fim de conhecer a fora da relao em termos quantitativos, til calcular o coeficiente de correlao de acordo com a seguinte definio:

onde:

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

37

onde n a quantidade de pares de dados O coeficiente de correlao, r, est no intervalo 1 r +1. Se o valor absoluto de r for maior que 1, houve claramente um erro de clculo e deve-se refaze-lo. No caso de forte correlao positiva, ele atinge um valor prximo de +1 e, de forma anloga, numa forte correlao negativa, ele fica prximo de 1. Quando | r | est prximo de 1, ele indica uma forte correlao entre X e Y. Quando se aproxima de 0 (zero), implica numa correlao fraca. Quando | r | = 1, os dados estaro sobre uma linha reta. Exemplo 2 Calculemos o coeficiente de correlao para o Exemplo 1, dos tanques de plstico. A Tabela 2 abaixo apresenta os clculos, a partir dela obtm-se os resultados desejados.

O valor de r 0,59, existindo portanto uma correlao positiva entre a presso de sopro e a percentagem defeituosa de tanques de plstico.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

38

Tabela 2 Preparao para o clculo do coeficiente de correlao.

7.3 AJUSTAMENTO DE CURVAS E O MTODO DOS MNIMOS QUADRADOS Num diagrama de disperso possvel, freqentemente, visualizar uma curva regular que se aproxima dos dados. Essa curva denominada de ajustamento.

Figura 4 Exemplo de Curvas em Diagramas de Disperso

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

39

O problema geral da determinao das equaes de curvas que se acomodem a certos conjuntos de dados denominado AJUSTAMENTO DE CURVAS.
7.4 Equaes das Curvas de Ajustamento

Para fins de referncia, relaciona-se abaixo alguns tipos de curvas de ajustamento e suas equaes. Todas as letras, exceto X e Y, representam constantes. As letras X e Y referem-se, freqentemente, a variveis independentes e dependentes, respectivamente, embora esses papis possam ser permutados.

onde o segundo membro das equaes so denominados polinmios do 1, 2, 3, 4 e n-simo graus. As funes definidas pelas quatro primeiras equaes so, s vezes, denominadas Funes Linear, Quadrtica, Cbica e do 4 Grau, respectivamente. Como outras equaes possveis (entre muitas usadas na prtica), menciona-se as seguintes:

Para decidir qual a curva a adotar, conveniente a obteno de diagramas de disperso das variveis transformadas. Por exemplo, se o diagrama de disperso de log Y em funo de X apresentar uma relao linear, a equao ter o aspecto da (7), enquanto, se o de log Y em funo de log X for linear, a equao ter o formato de (8). Emprega-se, freqentemente, para tal finalidade, grficos no qual uma ou ambas as escalas so logartmicas (semilog ou log-log [dilog]).

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

40

7.5 O Mtodo dos Mnimos Quadrados

Antes, necessrio instituir uma definio da melhor reta de ajustamento, da melhor parbola de ajustamento, etc.

Figura 5 - A melhor curva de ajustamento Para conseguir uma definio possvel, considere-se a Figura 6.2 na qual os dados esto representados pelos pontos (X1,Y1), (X2,Y2), ..., (Xn,Yn). Para um valor dado de X, por exemplo X1, haver uma diferena entre y1 e p valor correspondente determinado na curva C. Como est representado na figura, essa diferena e1, que , muitas vezes, designada como desvio, erro ou resduo e pode ser positivo, negativo ou nulo. De modo semelhante, obtm-se os desvios e2, e3, ..., en. Uma medida de qualidade do ajustamentoda Curva C aos dados apresentados (aderncia) proporcionada pela quantidade e2 + e3 + ... + en. Se ela pequena, o ajustamento bom, se grande, o ajustamento est ruim. Portanto, uma definio pode ser feita: De todas as curvas que se ajustam a um conjunto de pontos, a que tem a propriedade de apresentar o mnimo valor de e2 + e3 + ... + en denominada a melhor curva de ajustamento. Diz-se que uma curva que apresenta essa propriedade ajusta os dados no sentido dos mnimos quadrados e denominada curva de mnimos quadrados.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

41

7.6 REGRESSO
Deseja-se, freqentemente, com base em dados amostrais estimar o valor de uma varivel Y, correspondente ao conhecido de uma varivel X. Isso pode ser alcanado mediante a avaliao do valor de Y, a partir de uma curva de mnimo quadrado que se ajuste aos dados amostrais. A curva resultante denominada de regresso de Y para X, visto que Y avaliado a partir de X. Se se desejar estimar o valor de X a partir de um atribudo a Y, usa-se uma curva de regresso de X para Y, o que importa em uma permutao das varveis no diagrama de disperso, de modo que X passa a ser a varivel dependente e Y a independente. Em geral, a reta ou curva de regresso de Y para X no igual de X para Y. Exemplo 3 No Exemplo 1, dos tanques plsticos com paredes finas defeituosas, constatou-se que havia uma correlao positiva entre a presso de sopro e a percentagem defeituosa. A fim de evitar esse problema, pergunta-se: - Quando a presso de sopro estiver em um certo valor, qual ser a espessura das paredes formadas? - Como a presso de sopro deve ser controlada para que as paredes do tanque no fiquem finas? Para realizar essa anlise e poder responder s perguntas feitas, necessrio compreender, quantitativamente, a relao entre a presso de sopro e a espessura da parede. A Tabela 3 mostra os dados de uma experincia na qual a presso de sopro foi mudada e, em cada vez, a espessura das paredes foi medida. A Figura 6 um diagrama de disperso baseado nestes dados. Tabela 3 Presso de Sopro x Espessura da Parede

Figura 6 Relao entre a Presso de Ar e a Espessura da Parede

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

42

Pode-se representar a presso do sopro por x e a espessura da parede por y, admitindo uma relao linear: onde: uma constante chamado de coeficiente de regresso Tal reta geralmente chamada de reta de regresso, onde y a varivel resposta (ou varivel dependente), e x a varivel explicativa (ou varivel independente). A forma quantitativa de entender a relao entre x e y, pela busca de uma forma de regresso entre x e y , chamada de Anlise de Regresso. Seja (Xi,Yi) (para 1 i n) um conjunto de n pares de dados observados. Sejam valores estimados e a e b, e seja ei o resduo entre , isto : os

Pelo mtodo dos mnimos quadrados, etapas:

so obtidos como os valores que minimizam

soma dos quadrados dos resduos. Esse mtodo aplicado atravs das seguintes

os valores de a e b obtidos dessas etapas minimizam a soma dos quadrados dos resduos. Agora, usando os dados da Tabela 4, pode-se calcular a reta de regresso.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

43

Tabela 4

A cada aumento de 1(kgf/cm) da presso do ar, a espessura da parede diminui de 1,28(mm).

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

44

Figura 7 - mostra a reta de regresso calculada acima.


7.8 Problemas que envolvem mais de duas variveis

Podem ser tratadas de maneira anloga aos de duas. Por exemplo, pode haver uma relao entre trs variveis X, Y e Z que pode ser descrita pela expresso: que denominada equao linear das variveis X, Y e Z. Em um sistema tridimensional de coordenadas retangulares, essa equao representa um plano e os pontos amostrais reais (X1,Y1), (X2,Y2), ..., (Xn,Yn) podem dispersar-se em posies no muito distantes desse plano, que pode ser denominado de ajustamento. Mediante a extenso do mtodo dos mnimos quadrados, pode-se falar de um plano de mnimos quadrados de ajustamento dos dados. Se o nmero de variveis exceder a trs, perde-se a intuio geomtrica porque, ento, seria necessrio considerar espaos de quatro ou mais dimenses. Os problemas que envolvem a avaliao de uma varivel a partir de duas ou mais outras so denominados problemas de regresso mltipla.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

45

Exerccios:
1) A quantidade de libras de vapor usadas por ms por uma planta qumica esta relacionada temperatura (F) mdia ambiente para aquele ms. O consumo do ano passado e a temperatura so mostrados na seguinte tabela: Meses Janeiro Fevereiro Maro Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro a) b) c) d) Temperatura 21 24 32 47 50 59 68 74 62 50 41 30 Consumo/1.000 185,79 214,47 288,03 424,84 454,58 539,03 621,55 675,06 562,03 452,93 369,95 273,98

Construa um diagrama de disperso Encontre a equao da reta Calcule a correlao Qual ser a estimativa do consumo esperado de vapor quando a temperatura mdia for de 55F?

2) Um artigo publicado numa revista (maro de 1986) apresentou dados sobre a concentrao de licor verde de Na2S e da produo de uma mquina de papel. Concentrao (g/l) de licor Produo (t/dia) verde de Na2S 1 40 825 2 42 830 3 49 890 4 46 895 5 44 890 6 48 910 7 46 915 8 43 960 9 53 990 10 52 1010 11 54 1012 12 57 1030 13 58 1050 a) Encontre o valor ajustado y, correspondente a x = 910 b) Encontre a correlao entre as variveis estudadas Nmero de observaes

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

46

3) A tabela a seguir representa o nmero de horas de estudo fora da sala de aula para determinada turma de alunos de Estatstica, ao longo de trs semanas e as notas obtidas numa prova aplicada ao final do perodo: Estudante Horas de Estudo Grau obtido 1 20 64 2 16 61 3 34 84 4 23 70 5 27 88 6 32 92 7 18 72 8 22 77

a. Trace o diagrama de disperso correspondente. b. Determine a equao de regresso dos mnimos quadrados para predizer o grau obtido na prova com base nas horas de estudo. Desenhe a reta do item anterior sobre o diagrama. c. Estime o grau que seria obtido na prova por algum que estudasse 30 horas fora da sala de aula. d. Calcule o coeficiente de correlao e interprete-o. e. Teste se o coeficiente de correlao populacional ( ) pode ser considerado nulo ao nvel de 5% de significncia? Interprete o resultado obtido.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

47

CAPTULO 8 INTRODUO AMOSTRAGEM

8- Definies 8.1 Populao e amostra Qualquer estudo cientfico enfrenta o dilema de estudo da populao ou da amostra. Obviamente teria-se uma preciso muito superior se fosse analisado o grupo inteiro, a populao, do que uma pequena parcela representativa, denominada amostra. Observa-se que impraticvel na grande maioria dos casos, estudar-se a populao em virtude de distncias, custo, tempo, logstica, entre outros motivos. A alternativa praticada nestes casos o trabalho com uma amostra confivel. Se a amostra confivel e proporciona inferir sobre a populao, chamamos de inferncia estatstica. Para que a inferncia seja vlida, necessria uma boa amostragem, livre de erros, tais como falta de determinao correta da populao, falta de aleatoriedade e erro no dimensionamento da amostra. Quando no possvel estudar, exaustivamente, todos os elementos da populao, estudamse s alguns elementos, a que damos o nome de Amostra. Quando a amostra no representa corretamente a populao diz-se enviesada e a sua utilizao pode dar origem a interpretaes erradas. 8.2 Recenseamento Recenseamento a contagem oficial e peridica dos indivduos de um Pas, ou parte de um Pas. Ele abrange, no entanto, um leque mais vasto de situaes. Assim, pode definir-se recenseamento do seguinte modo: Estudo cientfico de um universo de pessoas, instituies ou objetos fsicos com o propsito de adquirir conhecimentos, observando todos os seus elementos, e fazer juzos quantitativos acerca de caractersticas importantes desse universo.

8.3 Amostragem

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

48

Amostragem o processo que procura extrair da populao elementos que atravs de clculos probabilsticos ou no, consigam prover dados inferenciais da populao-alvo.

Tipos de Amostragem

No Probabilstica Acidental ou convenincia Intencional Quotas ou proporcional Desproporcional Probabilstica Aleatria Simples Aleatria Estratificada Conglomerado

8.3.1.No Probabilstica A escolha de um mtodo no probabilstico, via de regra, sempre encontrar desvantagem frente ao mtodo probabilstico. No entanto, em alguns casos, se faz necessrio a opo por este mtodo. Fonseca (1996), alerta que no h formas de se generalizar os resultados obtidos na amostra para o todo da populao quando se opta por este mtodo de amostragem. Acidental ou convenincia Indicada para estudos exploratrios. Freqentemente utilizados em super mercados para testar produtos. Intencional O entrevistador dirige-se a um grupo em especfico para saber sua opinio. Por exemplo, quando de um estudo sobre automveis, o pesquisador procura apenas oficinas. Quotas ou proporcional Na realidade trata-se de uma variao da amostragem intencional. Necessita-se ter um prvio conhecimento da populao e sua proporcionalidade. Por exemplo, desejase entrevistar apenas indivduos da classe A, que representa 12% da populao. Esta ser a quota para o trabalho. Comumente tambm subestratifica-se uma quota obedecendo a uma segunda proporcionalidade. Desproporcional Muito utilizada quando a escolha da amostra for desproporcional populao. Atribuem-se pesos para os dados, e assim obtm-se resultados ponderados representativos para o estudo.

8.3.2 Probabilstica

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

49

Para que se possa realizar inferncias sobre a populao, necessrio que se trabalhe com amostragem probabilstica. o mtodo que garante segurana quando investiga-se alguma hiptese. Normalmente os indivduos investigados possuem a mesma probabilidade de ser selecionado na amostra. Aleatria Simples

o mais utilizado processo de amostragem. Prtico e eficaz, confere preciso ao processo de amostragem. Normalmente utiliza-se uma tabela de nmeros aleatrios e nomeia-se os indivduos, sorteando-se um por um at completar a amostra calculada.

Uma variao deste tipo de amostragem a sistemtica. Em um grande nmero de exemplos, o pesquisador depara-se com a populao ordenada. Neste sentido, tem-se os indivduos dispostos em seqncia o que dificulta a aplicao exata desta tcnica. Quando se trabalha com sorteio de quadras de casas, por exemplo, h uma regra crescente para os nmeros das casas. Em casos como este, divide-se a populao pela amostra e obtm-se um coeficiente (y). A primeira casa ser a de nmero x, a segunda ser a de nmero x + y; a terceira ser a de nmero x + 3. y. Supondo que este coeficiente seja 6. O primeiro elemento ser 3. O segundo ser 3 + 6. O terceiro ser 3 + 2.6. O quarto ser 3 + 3.6, e assim sucessivamente. Aleatria Estratificada

Quando se deseja guardar uma proporcionalidade na populao heterognea. Estratifica-se cada subpopulao por intermdio de critrios como classe social, renda, idade, sexo, entre outros. Conglomerado

Em corriqueiras situaes, torna-se difcil coletar caractersticas da populao. Nesta modalidade de amostragem, sorteia-se um conjunto e procura-se estudar todo o conjunto. exemplo de amostragem por conglomerado, famlias, organizaes e quarteires.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

50

8.4 Tipos de dados

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

51

VARIVEL: , convencionalmente, o conjunto de resultados possveis de um fenmeno. Varivel Qualitativa: Quando seus valores so expressos por atributos: sexo, cor da pele, etc. Varivel Quantitativa: Quando os dados so de carter nitidamente quantitativo, e o conjunto dos resultados possui uma estrutura numrica, trata-se, portanto da estatstica de varivel e se dividem em: Varivel Discreta ou Descontnua: Seus valores so expressos geralmente atravs de nmeros inteiros no negativos. Resulta normalmente de contagens. Ex: N de alunos presentes s aulas de introduo estatstica econmica no 1 semestre de 1997: mar = 18, abr = 30, mai = 35, jun = 36. Varivel Contnua: Resulta normalmente de uma mensurao, e a escala numrica de seus possveis valores corresponde ao conjunto R dos nmeros Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Ex.: Quando voc vai medir a temperatura de seu corpo com um termmetro de mercrio o que ocorre o seguinte: O filete de mercrio, ao dilatar-se, passar por todas as temperaturas intermedirias at chegar na temperatura atual do seu corpo. De acordo com o que dissemos anteriormente, numa anlise estatstica distinguem-se essencialmente duas fases: Uma primeira fase em que se procura descrever e estudar a amostra: Estatstica Descritiva e uma segunda fase em que se procura tirar concluses para a populao: 1 Fase Estatstica Descritiva Procura-se descrever a amostra, pondo em evidncia as caractersticas principais e as propriedades. 2 Fase Estatstica Indutiva Conhecidas certas propriedades (obtidas a partir de uma anlise descritiva da amostra), expressas por meio de proposies, imaginam-se proposies mais gerais, que exprimam a existncia de leis (na populao). No entanto, ao contrrio das proposies deduzidas, no podemos dizer que so falsas ou verdadeiras, j que foram verificadas sobre um conjunto restrito de indivduos e, portanto no so falsas, mas no foram verificadas para todos os indivduos da Populao, pelo que tambm no podemos afirmar que so verdadeiras. Existe, assim, um certo grau de incerteza (percentagem de erro) que medido em termos de Probabilidade.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

52

Considerando o que foi dito anteriormente sobre a Estatstica Indutiva, precisamos aqui da noo de Probabilidade, para medir o grau de incerteza que existe, quando tiramos uma concluso para a populao, a partir da observao da amostra. 8.5 Espao Amostral A estatstica trabalha com os resultados dos experimentos. Quando algum experimento realizado, algum resultado ocorre; denota-se um resultado tpico pelo smbolo e. Tal resultado chamado evento simples. Se for feita uma lista de todos os possveis resultados de interesse do experimento, essa srie chamada de espao amostral. 8.6 Dimensionamento da amostra Plano Amostral Quando deseja-se dimensionar o tamanho da amostra, o procedimento desenvolve-se em trs etapas distintas:

Avaliar a varivel mais importante do grupo e a mais significativa; Analisar se ordinal, intervalar ou nominal; Verificar se a populao finita ou infinita;

Varivel intervalar e populao infinita Varivel intervalar e populao finita Varivel nominal ou ordinal e populao infinita Varivel nominal ou ordinal e populao finita Obs: A proporo (p) ser a estimativa da verdadeira proporo de um dos nveis escolhidos para a varivel adotada. Por exemplo, 60% dos telefones da amostra Nokia, ento p ser 0,60. A proporo (q) ser sempre 1 - p. Neste exemplo q, ser 0,4. O erro representado por d. Para casos em que no se tenha como identificar as propores confere-se 0,5 para p e q.

CAPTULO 9 PROBABILIDADE

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

53

9. Conceito de Probabilidade Chamamos de probabilidade de um evento A (sendo que A est contido no Espao amostral) o nmero real P(A), tal que: nmero de casos favorveis de A / nmero total de casos. 9.1 Eventos Equiprovveis OBS: Quando todos os elementos do Espao amostral tem a mesma chance de acontecer, o espao amostral chamado de conjunto equiprovvel. Ex: No lanamento de uma moeda qual a probabilidade de obter cara em um evento A? = { ca, co } = 2 A = {ca} = 1 P(A) = 1/2 = 0,5 = 50%

9.2 Probabilidade Condicional Se A e B so dois eventos, a probabilidade de B ocorrer, depois de A ter acontecido definida por: P (B/A), ou seja, chamada probabilidade condicional de B. Neste caso os eventos so dependentes e definidos pela frmula: P (A e B ) = P (A) x P(B/A) Ex: Duas cartas so retiradas de um baralho sem haver reposio. Qual a probabilidade de ambas serem COPAS ? P (Copas1 e Copas2) = P(Copas1) x P(Copas2/Copas1) = 13/52 x 12/51 = 0,0588 = 5,88 % P(Copas1) = 13/52 P(Copas2/Copas1) = 12/51 Obs: No exemplo anterior se a 1 carta retirada voltasse ao baralho o experimento seria do tipo com reposio e seria um evento independente. O resultado seria: P(Copas1) x P(Copas2) = 13/52 x 13/52 = 0,625 = 6,25 % Espao amostral do baralho de 52 cartas: Carta pretas = 26 Pus = 13 (s, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei) Espadas = 13 (s, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei) Cartas vermelhas = 26 Ouros = 13 (s, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

54

Copas = 13 (s, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei) 9.3 Eventos Independentes Quando a realizao ou no realizao de um dos eventos no afeta a probabilidade da realizao do outro e vice-versa. Ex: Quando lanamos dois dados, o resultado obtido em um deles independe do resultado obtido no outro. Ento qual seria a probabilidade de obtermos, simultaneamente, o n 4 no primeiro dado e o n 3 no segundo dado? Assim, sendo P1 a probabilidade de realizao do primeiro evento e P2 a probabilidade de realizao do segundo evento, a probabilidade de que tais eventos se realizem simultaneamente dada pela frmula: P(1 n 2) = P(1 e 2) = P(1) x P(2) P1 = P(4 dado1) = 1/6 P2 = P(3 dado2) = 1/6

P total = P (4 dado1) x P (3 dado2) = 1/6 x 1/6 = 1/36 9.3.1 Eventos Mutuamente Exclusivos - Eventos Dependentes Dois ou mais eventos so mutuamente exclusivos quando a realizao de um exclui a realizao do(s) outro(s). Assim, no lanamento de uma moeda, o evento "tirar cara" e o evento "tirar coroa" so mutuamente exclusivos, j que, ao se realizar um deles, o outro no se realiza. Se dois eventos so mutuamente exclusivos, a probabilidade de que um ou outro se realize igual soma das probabilidades de que cada um deles se realize: P(1 U 2) = P(1 ou 2) = P(1) + P(2) Ex: No lanamento de um dado qual a probabilidade de se tirar o n 3 ou o n 4 ? Os dois eventos so mutuamente exclusivos ento: P = 1/6 + 1/6 = 2/6 = 1/3 Obs: Na probabilidade da unio de dois eventos A e B, quando h elementos comuns, devemos excluir as probabilidades dos elementos comuns a A e B (elementos de A n B )

9.4 Teorema de Bayes ou Teorema da Probabilidade Total Sabemos que:

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

55

P(A) = E P(Bi) . P(A|Bi) P(A n Bi) = P(A) . P(Bi|A) logo P(Bi|A) = P(A n Bi) / P(A) ento substituindo teremos:

P (Bi|A) = P (Bi) . P (A|Bi) / E P(Bi) . P(A|Bi) que a frmula de Bayes Ex: Certo professor 4/5 das vezes vai trabalhar usando um fusca e usando um carro importado nas demais vezes. Quando ele usa o fusca, 75 % das vezes ele chega em casa antes das 23 horas e quando usa o carro importado s chega em casa antes das 23 horas em 60% das vezes. Ontem o professor chegou em casa aps s 23 horas. Qual a probabilidade de que ele, no dia de ontem, tenha usado o fusca ? B1 = usar o fusca P(B1) = 4/5 = 0,80 B2 = usar carro importado P(B2) = 1/5 = 0,20 P( A | B2) = 1 - 0,60 = 0,40 A = chegar em casa aps 23 horas

P( A | B1) = 1 - 0,75 = 0,25

P (B1 | A) = P (B1) . P( A | B1) / P (B1) . P( A | B1) + P (B2) . P( A | B2) P (B1 | A) = 0,80 x 0,25 /(0,80 x 0,25) + (0,20 x 0,40) = P (B1 | A) = 0,20 / (0,20 + 0,08) = 0,7143 ou 71,43 %

Exerccio: Em um lote de 12 peas, 4 s defeituosas. Sendo retirada uma pea, calcule: a) a probabilidade de essa pea ser defeituosa. b) a probabilidade de essa pea no ser defeituosa.

CAPTULO 10 VARIVEL ALEATRIA DISCRETA

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

56

10.1 Distribuio de Probabilidades Apresentaremos neste captulo trs modelos tericos de distribuio de probabilidade, aos quais um experimento aleatrio estudado possa ser adaptado, o que permitir a soluo de grande nmero de problemas prticos. 10.1.1 Varivel Aleatria Suponhamos um espao amostral S e que a cada ponto amostral seja atribudo um nmero. Fica, ento, definida uma funo chamada varivel aleatria. Muitas vezes no estamos interessados propriamente no resultado de um experimento aleatrio, mas em alguma caracterstica numrica a ele associada. Essa caracterstica ser chamada varivel aleatria. Assim, se o espao amostral relativo ao "lanamento simultneo de duas moedas" S={(ca,ca), (ca,co), (co,ca), (co,co)} e se X representa o "nmero de caras" que aparecem, a cada ponto amostral podemos associar um nmero para X, de acordo com a tabela abaixo (X a varivel aleatria associada ao nmero de caras observado): Ponto Amostral (ca,ca) (ca,co) (co,ca) (co,co) X 2 1 1 0

Logo podemos escrever: Nmero de caras (X) Probabilidade (X) 2 1/4 1 2/4 0 1/4 Total 4/4 = 1

Exemplo prtico de uma distribuio de probabilidade:

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

57

Consideremos a distribuio de frequncia relativa ao nmero de acidentes dirios em uma rodovia durante o ms de nov/2003: Nmero de Acidentes Frequncia 0 22 1 5 2 2 3 1 Podemos ento escrever a tabela de distribuio de probabilidade: Nmero de Acidentes (X) Probabilidade (X) 0 0,73 1 0,17 2 0,07 3 0,03 Total 1,00 Construmos acima uma tabela onde aparecem os valores de uma varivel aleatria X e as probabilidades de X ocorrer que a tabela de distribuio de probabilidades. Funes de probabilidades: f(X) = p(X= xi) Ao definir a distribuio de probabilidade, estabelecemos uma correspondncia unvoca entre os valores da varivel aleatria X e os valores da varivel P (probabilidade). Esta correspondncia define uma funo onde os valores xi formam o domnio da funo e os valores pi o seu conjunto imagem. Assim, ao lanarmos um dado, a varivel aleatria X, definida por "pontos de um dado", pode tomar os valores 1,2,3,4,5 e 6. Ento resulta a seguinte distribuio de probabilidade: P (X) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 T o t a l 6/6 = 1 X

10.2 Valor Esperado (Esperana Matemtica)

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

58

Valor esperado de uma varivel aleatria ou de funo de varivel aleatria corresponde mdia ponderada dos valores que esta varivel aleatria ou esta funo assume, usando-se como pesos para ponderao, as probabilidades correspondentes a cada valor. Para o caso de uma varivel aleatria discreta x, podemos escrever: E (x) = ( xi . pi ) Exemplo: Numa empresa, as previses de despesa para o prximo ano foram calculadas como; R$ 9, 10, 11 , 12 e 13 bilhes. Supondo que as despesas do ano corrente sejam desconhecidas, as seguintes probabilidades foram atribudas respectivamente: 30%, 20%, 25%, 5% e 20%. Qual a distribuio de probabilidade para o prximo ano?
DISTRIBUIO DE PROBABILIDADES ANO 1 2 3 4 5 DESPESA* (X) 9 10 11 12 13 total = P (X) 0,30 0,20 0,25 0,05 0,20 1,00

* em R$ bilhes

Qual o valor esperado das despesas para o prximo ano?


VALOR ESPERADO DAS DESPESAS ANO DESPESA* X 1 9 2 10 3 11 4 12 5 13 * em R$ bilhes P (X) 0,30 0,20 0,25 0,05 0,20 VALOR ESPERADO E(X) = X . P (X) 2,70 2,00 2,75 0,60 2,60 10,65

Qual a varincia das despesas para o prximo ano?


Var(X) =

[ E(X) - E(X) ]

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

59

VARINCIA DAS DESPESAS ANO 1 2 3 4 5 DESPESA* ( x) 9 10 11 12 13 P (x) 0,30 0,20 0,25 0,05 0,20 x . P (x) 2,70 2,00 2,75 0,60 2,60 10,65 * em R$ bilhes x . P (x) 24,30 20,00 30,25 7,20 33,80 115,55

VARINCIA DAS DESPESAS Var(x) = [E(X) E(X) ] = 113,42 115,55 = 2,13

Conseqentemente o Desvio Padro igual a: = Var(x) Caso as projees ao longo do ano tenham sido estimadas em R$ 12 bilhes, comente a posio financeira da empresa.

CAPTULO 11 DISTRIBUIES DE VARIVEL ALEATRIA DISCRETA

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

60

Segundo JURAN (1992, p.33), Uma distribuio de probabilidade uma frmula matemtica que relaciona os valores da caracterstica com a sua probabilidade de ocorrncia na populao. Quando a caracterstica que est sendo medida puder assumir qualquer valor (sujeito exatido do processo de medio), sua distribuio de probabilidade chamada distribuio contnua de probabilidade. A partir das conceituaes anteriores, apresenta-se a conceituao de distribuio de probabilidade e suas classificaes: distribuio contnua de probabilidade e distribuio discreta de probabilidade. Exemplo: a distribuio de freqncias dos dados de resistncias eltricas medidas. As distribuies discretas de probabilidade mais comuns so: (1) a Distribuio de Poisson; (2) a Distribuio Binomial; 11.1 Distribuio Binomial Vamos imaginar fenmenos cujos resultados s podem ser de dois tipos, um dos quais considerado como sucesso e o outro insucesso. Este fenmeno pode ser repetido tantas vezes quanto se queira (n vezes), nas mesmas condies. As provas repetidas devem ser independentes, isto , o resultado de uma no deve afetar os resultados das sucessivas. No decorrer do experimento, a probabilidade p do sucesso e a probabilidade de q (q = 1 - p) do insucesso manter-se-o constantes. Nessas condies X uma varivel aleatria discreta que segue uma distribuio binomial.

P(x) = P(x) = a probabilidade de que o evento se realize x vezes em n provas. p = a probabilidade de que o evento se realize em uma s prova = sucesso. q = a probabilidade de que o evento no se realize no decurso dessa prova = insucesso. OBS: O nome binomial devido frmula, pois representa o termo geral do desenvolvimento do binmio de Newton.

11.1.1 Parmetros da Distribuio Binomial

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

61

Mdia = n . p Varincia = n . p . q

Desvio padro = a raiz quadrada do produto de n . p . q

Exerccio: Seis parafusos so escolhidos ao acaso da produo de certa mquina, que apresenta 10% de peas defeituosas. Qual a probabilidade de serem defeituosos dois deles? 11.2 Distribuio de Poisson Distribuio de probabilidades aplicada para acontecimentos raros, entretanto o seu maior uso prtico como aproximao para a distribuio binomial. A P(x) calculada pela frmula abaixo:

Onde: a mdia da distribuio ( n . p) e representa a constante de valor igual a 2,718 x ! o fatorial de x OBS: 0 ! = 1 e qualquer nmero elevado a zero igual a 1 OBS: quando um acontecimento segue a distribuio binomial com um p (sucesso) muito pequeno de tal modo que temos que ter um n muito grande para que o sucesso ocorra. Podemos simplificar os clculos usando a distribuio de Poisson como aproximao para a distribuio binomial. Para que os resultados aproximados pela distribuio de Poisson sejam satisfatrios ns s devemos fazer a substituio da distribuio binomial pela de Poisson quando n for maior ou igual a 50 e p menor ou igual a 0,1 ou p maior ou igual a 0,9 ( p prximo de 0 ou prximo de 1). Ex: Se 2% dos fusveis so defeituosos.Qual a probabilidade de que uma amostra de 400 fusveis exatamente 6 sejam defeituosos? p = 0,02 n = 400 = n . p = 0,02 . 400 = 8

P (x = 6) = 0,1222 ou 12,24%

CAPTULO 12 - DISTRIBUIES DE VARIVEL CONTNUA

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

62

Distribuies Contnuas de Probabilidade so usadas para moldar situaes onde o resultado de interesse pode assumir valores numa escala contnua, por exemplo, os valores maiores que zero para o tempo de falha de um motor que est trabalhando continuamente. 12.1 Distribuio Normal Quando a variao de uma caracterstica gerada pela soma de um grande nmero de erros infinitesimais independentes devidos a diferentes fatores, a distribuio da caracterstica se torna, em muitos casos, aproximadamente uma distribuio normal. A Distribuio Normal pode ser simplesmente descrita como tendo a forma de um sino ou montanha, e numa descrio mais detalhada: a) a densidade de probabilidade mais alta no meio e diminui gradualmente em direo s caudas e b) ela simtrica. Entre as distribuies tericas de varivel aleatria contnua, uma das mais empregadas a distribuio Normal. Muitas das variveis analisadas na pesquisa scio-econmica correspondem distribuio normal ou dela se aproximam. Considerando a probabilidade de ocorrncia, a rea sob sua curva soma 100%. Isso quer dizer que a probabilidade de uma observao assumir um valor entre dois pontos quaisquer igual rea compreendida entre esses dois pontos.

68,26% => 1 desvio

95,44% => 2 desvios

99,73% => 3 desvios

Na figura acima, tem as barras na cor marrom representando os desvios padres. Quanto mais afastado do centro da curva normal, mais rea compreendida abaixo da curva haver. A um desvio padro, temos 68,26% das observaes contidas. A dois desvios padres, possumos 95,44% dos dados compreendidos e finalmente a trs desvios, temos 99,73%. Podemos concluir que quanto maior a variabilidade dos dados em relao mdia, maior a probabilidade de encontrarmos o valor que buscamos embaixo da normal. 12.2 Propriedades da distribuio normal

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

63

1 - A varivel aleatria X pode assumir todo e qualquer valor real. 2 - A representao grfica da distribuio normal uma curva em forma de sino, simtrica em torno da mdia, que recebe o nome de curva normal ou de Gauss. 3 - A rea total limitada pela curva e pelo eixo das abscissas igual a 1, j que essa rea corresponde probabilidade de a varivel aleatria X assumir qualquer valor real. 4 - A curva normal assinttica em relao ao eixo das abscissas, isto , aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcan-lo. 5 - Como a curva simtrica em torno da mdia, a probabilidade de ocorrer valor maior que a mdia igual probabilidade de ocorrer valor menor do que a mdia, isto , ambas as probabilidades so iguais a 0,5 ou 50%. Cada metade da curva representa 50% de probabilidade. Quando temos em mos uma varivel aleatria com distribuio normal, nosso principal interesse obter a probabilidade de essa varivel aleatria assumir um valor em um determinado intervalo. Exemplo: Seja X a varivel aleatria que representa os dimetros dos parafusos produzidos por certa mquina. Vamos supor que essa varivel tenha distribuio normal com mdia = 2 cm e desvio padro = 0,04 cm. Qual a probabilidade de um parafuso ter o dimetro com valor entre 2 e 2,05 cm ? P ( 2 < X < 2,05) = ? Com o auxlio de uma distribuio normal reduzida, isto , uma distribuio normal de mdia = 0 e desvio padro = 1. Resolveremos o problema atravs da varivel z, onde z = (X )/S

Utilizaremos tambm uma tabela normal reduzida, que nos d a probabilidade de z tomar qualquer valor entre a mdia 0 e um dado valor z, isto : P ( 0 < Z < z) Temos, ento, que se X uma varivel aleatria com distribuio normal de mdia desvio padro S, podemos escrever: P( < X < x ) = P (0 < Z < z) e

No nosso problema queremos calcular P(2 < X < 2,05) para obter essa probabilidade, precisamos, em primeiro lugar, calcular o valor de z que corresponde a x = 2,05 z = (2,05 - 2) / 0,04 = 1,25

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

64

Utilizao da Tabela Z Procuremos, agora, na tabela Z o valor de z = 1,25 Na primeira coluna encontramos o valor at uma casa decimal = 1,2. Em seguida, encontramos, na primeira linha, o valor 5, que corresponde ao ltimo algarismo do nmero 1,25. Na interseco da linha e coluna correspondentes encontramos o valor 0,3944, o que nos permite escrever: P (0 < Z < 1,25) = 0,3944 ou 39,44 %, assim a probabilidade de um certo parafuso apresentar um dimetro entre a mdia = 2cm e x = 2,05 cm de 39,44 %.

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

65

Tabela normal (distribuio z)


z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09

-4.0 0.00003 0.00003 0.00003 0.00003 0.00003 0.00003 0.00002 0.00002 0.00002 0.00002 -3.9 0.00005 0.00005 0.00004 0.00004 0.00004 0.00004 0.00004 0.00004 0.00003 0.00003 -3.8 0.00007 0.00007 0.00007 0.00006 0.00006 0.00006 0.00006 0.00005 0.00005 0.00005 -3.7 0.00011 0.00010 0.00010 0.00010 0.00009 0.00009 0.00008 0.00008 0.00008 0.00008 -3.6 0.00016 0.00015 0.00015 0.00014 0.00014 0.00013 0.00013 0.00012 0.00012 0.00011 -3.5 0.00023 0.00022 0.00022 0.00021 0.00020 0.00019 0.00019 0.00018 0.00017 0.00017 -3.4 0.00034 0.00032 0.00031 0.00030 0.00029 0.00028 0.00027 0.00026 0.00025 0.00024 -3.3 0.00048 0.00047 0.00045 0.00043 0.00042 0.00040 0.00039 0.00038 0.00036 0.00035 -3.2 0.00069 0.00066 0.00064 0.00062 0.00060 0.00058 0.00056 0.00054 0.00052 0.00050 -3.1 0.00097 0.00094 0.00090 0.00087 0.00084 0.00082 0.00079 0.00076 0.00074 0.00071 -3.0 0.00135 0.00131 0.00126 0.00122 0.00118 0.00114 0.00111 0.00107 0.00103 0.00100 -2.9 0.00187 0.00181 0.00175 0.00169 0.00164 0.00159 0.00154 0.00149 0.00144 0.00139 -2.8 0.00256 0.00248 0.00240 0.00233 0.00226 0.00219 0.00212 0.00205 0.00199 0.00193 -2.7 0.00347 0.00336 0.00326 0.00317 0.00307 0.00298 0.00289 0.00280 0.00272 0.00264 -2.6 0.00466 0.00453 0.00440 0.00427 0.00415 0.00402 0.00391 0.00379 0.00368 0.00357 -2.5 0.00621 0.00604 0.00587 0.00570 0.00554 0.00539 0.00523 0.00508 0.00494 0.00480 -2.4 0.00820 0.00798 0.00776 0.00755 0.00734 0.00714 0.00695 0.00676 0.00657 0.00639 -2.3 0.01072 0.01044 0.01017 0.00990 0.00964 0.00939 0.00914 0.00889 0.00866 0.00842 -2.2 0.01390 0.01355 0.01321 0.01287 0.01255 0.01222 0.01191 0.01160 0.01130 0.01101 -2.1 0.01786 0.01743 0.01700 0.01659 0.01618 0.01578 0.01539 0.01500 0.01463 0.01426 -2.0 0.02275 0.02222 0.02169 0.02118 0.02067 0.02018 0.01970 0.01923 0.01876 0.01831 -1.9 0.02872 0.02807 0.02743 0.02680 0.02619 0.02559 0.02500 0.02442 0.02385 0.02330 -1.8 0.03593 0.03515 0.03438 0.03362 0.03288 0.03216 0.03144 0.03074 0.03005 0.02938 -1.7 0.04456 0.04363 0.04272 0.04181 0.04093 0.04006 0.03920 0.03836 0.03754 0.03673 -1.6 0.05480 0.05370 0.05262 0.05155 0.05050 0.04947 0.04846 0.04746 0.04648 0.04551 -1.5 0.06681 0.06552 0.06425 0.06301 0.06178 0.06057 0.05938 0.05821 0.05705 0.05592 -1.4 0.08076 0.07927 0.07780 0.07636 0.07493 0.07353 0.07214 0.07078 0.06944 0.06811 -1.3 0.09680 0.09510 0.09342 0.09176 0.09012 0.08851 0.08691 0.08534 0.08379 0.08226 -1.2 0.11507 0.11314 0.11123 0.10935 0.10749 0.10565 0.10383 0.10204 0.10027 0.09852 -1.1 0.13566 0.13350 0.13136 0.12924 0.12714 0.12507 0.12302 0.12100 0.11900 0.11702 -1.0 0.15865 0.15625 0.15386 0.15150 0.14917 0.14686 0.14457 0.14231 0.14007 0.13786 -0.9 0.18406 0.18141 0.17878 0.17618 0.17361 0.17105 0.16853 0.16602 0.16354 0.16109 -0.8 0.21185 0.20897 0.20611 0.20327 0.20045 0.19766 0.19489 0.19215 0.18943 0.18673 -0.7 0.24196 0.23885 0.23576 0.23269 0.22965 0.22663 0.22363 0.22065 0.21769 0.21476 -0.6 0.27425 0.27093 0.26763 0.26434 0.26108 0.25784 0.25462 0.25143 0.24825 0.24509 -0.5 0.30853 0.30502 0.30153 0.29805 0.29460 0.29116 0.28774 0.28434 0.28095 0.27759 -0.4 0.34457 0.34090 0.33724 0.33359 0.32997 0.32635 0.32276 0.31917 0.31561 0.31206

Universidade de Pernambuco Escola Politcnica -Estatstica Bsica - Prof. Mnica Barradas

66

Exerccios: 1) Um fabricante de lmpadas verifica, atravs de uma distribuio de freqncias, que o tempo de queima de um determinado modelo de lmpada distribudo normalmente. Uma amostra de 50 lmpadas foi testada e o tempo mdio de vida encontrado foi 60 dias, com um desvio-padro de 20 dias. Quantas lmpadas, na populao total de lmpadas fabricadas por ele, pode se esperar que ainda estejam funcionando aps 100 dias de vida? O problema aqui dado encontrar a rea sob a curva alm dos 100 dias. A rea sob uma curva de distribuio entre dois limites estabelecidos representa a probabilidade de ocorrncia. Portanto, a rea alm dos 100 dias a probabilidade que uma lmpada tem de durar mais de 100 dias. 2) Um produto pesa, em mdia, 10g, com desvio-padro de 2 g. embalado em caixas com 50 unidades. Sabe-se que as caixas vazias pesam 500g, com desvio-padro de 25g. Admitindo-se uma distribuio normal dos pesos e independncia entre as variveis dos pesos do produto e da caixa, calcular a probabilidade de uma caixa cheia pesar mais de 1050g.

Utilize a figura acima para o desenvolvimento da questo, onde a primeira repartio, direita, representa a probabilidade da caixa pesar 1050g.

You might also like