You are on page 1of 102

APOSTILA DE ESTATSTICA

NDICE
1.0 DEFINIES DE ESTATSTICA ......................................................................... 1 1.1 POR QUE ESTUDAR ESTATSTICA? ......................................................... 1 1.2 A NATUREZA DOS DADOS ........................................................................ 1 1.3 TIPOS DE DADOS ....................................................................................... 2 1.4 TIPOS DE LEVANTAMENTOS .................................................................... 3 1.5 PLANEJAMENTO DE EXPERIMENTOS ..................................................... 4 EXERCCIOS: E-1...................................................................................................... 5 2.0 AMOSTRAGEM ................................................................................................... 6 2.1 DEFINIES................................................................................................ 6 2.2 AMOSTRAGEM ALEATRIA BASEADA EM NMEROS ALEATRIOS (RANDMICOS) ................................................................................................ 8 2.3 OUTROS PLANOS DE AMOSTRAGEM ...................................................... 9 2.4 AMOSTRAGEM POR JULGAMENTO (NO PROBABILSTICA) ................ 9 2.5 AMOSTRAGEM PROBABILSTICA ........................................................... 10 2.5.1 AMOSTRAGEM SISTEMTICA............................................................... 10 2.5.2 AMOSTRAGEM ESTRATIFICADA ......................................................... 11 2.5.3 AMOSTRAGEM POR CONGLOMERADO............................................. 11 RESUMO.......................................................................................................... 11 EXERCICIOS: E-2.................................................................................................... 13 3.0 ANLISE EXPLORATRIA DE DADOS........................................................... 14 4.0 DISTRIBUIO DE FREQNCIA ................................................................... 15 5.0 REPRESENTAO GRFICA DAS VARIVEIS QUANTITATIVAS ............... 19

6.0 APRESENTAO GRFICA ............................................................................ 20 6.1 DIAGRAMA DE ORDENADAS................................................................... 20 6.2 DIAGRAMA DE BARRAS........................................................................... 21 6.3 DIAGRAMA DE CRCULOS ....................................................................... 22 6.4 DIAGRAMA DE SETORES CIRCULARES ................................................ 23 6.5 DIAGRAMA LINEAR .................................................................................. 25

6.6 O PICTOGRAMA ................................................................................................ 26 7.0 MONTAGEM DE UMA DISTRIBUIO DE FREQNCIAS ........................... 27 7.1 HISTOGRAMA E POLIGONO DAS FREQNCIAS ................................. 31 7.2 HISTOGRAMA E POLIGONO DAS FREQNCIAS RELATIVAS ............ 32 7.3 POLIGONO DE FREQNCIA ACUMULADA OU OGIVA ........................ 33 7.4 POLIGONO DA FREQNCIA ACUMULADA RELATIVA ........................ 34 8.0 TIPOS DE DISTRIBUIO ................................................................................ 35 8.1 DISTRIBUIO SIMTRICA OU EM FORMA DE SINO ........................... 35 8.2 DISTRIBUIO ASSIMTRICA................................................................. 36 8.3 DISTRIBUIO MODAL, AMODAL, BIMODAL E MULTIMODAL ............. 37 8.4 APRESENTAO TIPO RAMO-E-FOLHAS .............................................. 38 9.0 MEDIDAS DE POSIO OU DE TENDNCIA CENTRAL ............................... 40 9.1 MDIA ARITMTICA SIMPLES ................................................................. 40 9.2 MDIA ARITMTICA PONDERADA .......................................................... 41 9.3 MEDIANA (x) .............................................................................................. 41 9.4 MODA (

) ............................................................................................... 43 x

10.0 MEDIDAS DE VARIABILIDADE (DISPERSO).............................................. 44 10.1 AMPLITUDE TOTAL (R.T.) ...................................................................... 44 10.2 DESVIO PADRO .................................................................................... 45 10.2.1 DESVIO PADRO AMOSTRAL (S) ....................................................... 45 10.2.2 DESVIO PADRO DA POPULAO () ............................................... 46 10.2.3 REPRESENTAO GRFICA DO DESVIO PADRO.......................... 46 10.2.4 SISTEMATIZAO PARA O CLCULO ................................................ 47 10.3 VARINCIA .............................................................................................. 48 11.0 DISTRIBUIO NORMAL .............................................................................. 49 EXERCCIOS: E-3.................................................................................................... 55 12.0 PROBABILIDADE............................................................................................ 56 12.1 ESPAO AMOSTRAL E EVENTOS......................................................... 57 12.2 TRS ORIGENS DA PROBABILIDADE ................................................... 58

12.3 A MATEMTICA DA PROBABILIDADE ................................................... 59 EXERCCIOS: E-4.................................................................................................... 62 13.0 TECNICAS DE CONTAGEM ........................................................................... 63 13.1 O PRINCIPIO DA MULTIPLICAO ........................................................ 64 13.2 PERMUTAO, ARRANJO E COMBINAO. ....................................... 65 13.3 REGRAS DE CONTAGEM ....................................................................... 68 EXERCCIOS: E-5.................................................................................................... 69 14.0 DISTRIBUIO DE PROBABILIDADES......................................................... 70 14.1 DISTRIBUIO BINOMIAL ...................................................................... 72 EXERCICIOS: E-6.................................................................................................... 76 14.2 DISTRIBUIO DE POISSON......................................................................... 77 EXERCICIOS: E-7.................................................................................................... 79 15.0 CORRELAO ................................................................................................ 80 15.1 INTRODUO ......................................................................................... 80 15.2 RELAO FUNCIONAL E RELAO ESTATSTICA ............................. 80 15.3 DIAGRAMA DE DISPERSO................................................................... 81 15.4 CORRELAO LINEAR.......................................................................... 82 15.5 COEFICIENTE DE CORRELAO LINEAR........................................... 85 15.6 CUDADOS COM OS ERROS COM A INTERPLETAO DE CORRELAO ................................................................................................ 87 EXERCICIOS: E-8.................................................................................................... 88 16.0 REGRESSO LINEAR .................................................................................... 91 16.1 AJUSTAMENTO DE CURVAS ................................................................. 91 16.2 MTODO DOS MNIMOS QUADRADOS ................................................ 92 16.3 ANLISE DE REGRESSO..................................................................... 95 EXERCCIOS E-9 ......................................................................................................98

ESTATSTICA
1.0 DEFINIES DE ESTATSTICA
Etimologicamente a palavra estatstica vem de status expresso latina que significa, sensu lato, o estudo do estado. Os primeiros a empregarem esse termo foram os Alemes seguidos pela Itlia, Frana, Inglaterra e ainda por outros paises. Para Levasseur a estatstica : O estudo numrico dos fatos sociais.

Yule define estatstica como: Dados quantitativos afetados marcadamente por uma multiplicidade de causas. Uma definio mais usual nos dias de hoje seria: Um mtodo cientifico que permite a anlise, em bases probabilstica, de dados coligados e condensados

Ou ainda podemos dizer que : A coleta, o processamento, a interpretao e a apresentao de dados numricos que pertencem ao domnio da estatstica 1.1 POR QUE ESTUDAR ESTATSTICA?

Por hora podemos dizer que o raciocnio estatstico largamente utilizado no governo e na administrao; assim, possvel que, no futuro, um empregador venha a contratar ou promover um profissional por causa do seu conhecimento de estatstica.

1.2 A NATUREZA DOS DADOS

O dados estatsticos constituem a matria prima das pesquisas estatsticas, eles surgem quando se fazem mensuraes ou se restringem observaes. Estatstica descritiva: Trata-se da descrio e resumo dos dados.

Probabilidade: um estudo que envolve o acaso.

Interferncia: a analise e interpretao de dados amostrais (Amostragem).

Modelo: So verses simplificadas (Abstraes) de algum problema ou situao real. 1.3 TIPOS DE DADOS

Quantitativos Contnuos Discretos Qualitativos Nominais Por postos As variveis contnuas podem assumir qualquer valor num intervalo contnuo. Os dados referentes a tais variveis dizem-se dados contnuos. Ex. Peso, comprimento, espessura onde usa-se a mensurao. As variveis discretas assumem valores inteiros de dados discretos so os resultados da contagem de nmeros de itens. Ex. alunos da sala de aula, nmero de defeitos num carro novo, acidentes de uma fbrica. Os dados nominais surgem quando se definem categorias e se conta o nmero de observaes pertencentes a cada categoria. Ex.: atuam dentro das variveis Qualitativas as quais devemos associar a valores numricos para que possamos processar estatisticamente. Ex.: cor dos olhos (azuis, verdes, castanhos), sexo (masculino e feminino), desempenho (excelente, bom, sofrvel, mau) etc. Os dados por postos consistem de valores relativos atribudos para denotar ordem: primeiro, segundo, terceiro, quarto, etc. Ex.: concurso de beleza se classificam em 1,2,3 colocadas.

TABELA: 1 A mesma populao pode originar diferentes tipos de dados.

TIPOS DE DADOS
POPULAES CONTNUOS DISCRETOS NOMINAIS POR POSTO

Alunos de administrao idade/peso

N. De classes Homens/Mulheres 3 grau

1.4 TIPOS DE LEVANTAMENTOS


Os levantamentos podem ser classificados em contnuos, peridicos e ocasionais: CONTNUO: Quando os eventos vo sendo registrados medida que ocorrem.Exemplos os registros civis dos fatos vitais (nascimento, bitos e casamentos).

PERIDICOS: Acontecem ciclicamente. Exemplo o rescenceamento, feito no Brasil a cada dez anos.

OCASIONAIS: So aqueles realizados sem a preocupao de continuidade ou periodicidade preestabelecidas, exemplos a maioria dos trabalhos de investigao cientifica. DADOS PRIMRIOS: Quando o investigador no encontra dados publicados adequados ao seu estudo, parte para a realizao de um inqurito, isto , os dados so levantados diretamente na populao no momento da investigao.

DADOS SECUNDRIOS: Quando o investigador para verificar as sua hipteses de trabalho utiliza- se de dados j existentes, arquivados, registrados ou publicados. Podem ser at mesmo dados gerados pelo Departamento de Estatsticas de Populaes da Fundao Instituto Brasileiro de Geografia e Estatstica (IBGE).

1.5 PLANEJAMENTO DE EXPERIMENTOS


1. Definio do problema: Um Estudo ou Uma Anlise

2. Formular plano para coleta de dados adequados

3. Coligir os dados

4. Analisar e interpretar os dados

5. Relatar as concluses

EXERCCIOS: E-1
1- Identifique os seguintes exemplos em termos de tipos de dados:

a- 17 gramas

b- 3 certos, 2 errados

c- 25 segundos

d- 25 alunos na classe

e- tamanho de camisa

f- Km/litro

g- O mais aprazvel

h- O mais lento

i- 5 acidentes no ms de maio

2- Responder as perguntas:

a- Defina o termo Estatstica.

b- Responder a pergunta: Por que estudar estatstica?

c- Dar exemplos de como um administrador pode se beneficiar do conhecimento de Estatstica?

2.0 AMOSTRAGEM
AMOSTRAGEM VERSUS SENSO: Uma amostra usualmente envolve o estudo de uma parcela dos tens de uma populao, enquanto que o censo requer o estudo de todos os tens. Restries ao Censo: Custo Populaes infinitas Dificuldade nos critrios (Preciso) Produtos de testes Destrutivos (fsforos, munies) Tempo despendido (atualizao) Tipos de informaes mais restritivas

Casos de excesso: Populaes pequenas Amostras grandes em relao a populao Se exige preciso completa Se j so disponveis informaes completas

2.1 DEFINIES
POPULAO: o conjunto de indivduos (ou objetos), que tem pelo menos uma varivel comum observvel. AMOSTRA: qualquer sub-conjunto da populao extrada para se realizar estudos estatsticos

. POPULAO

AMOSTRA

A estatstica indutiva a cincia que busca tirar concluses probabilsticas sobre a populao, com base em resultados verificados em amostras retiradas dessa populao. Entretanto no basta que saibamos descrever convenientemente os dados da amostra para que possamos executar, com xito, um trabalho estatstico completo. Antes de tudo preciso garantir que a amostra ou amostras que sero utilizadas sejam obtidas por processos adequados. - O que necessrio garantir, em suma, que a amostra seja Representativa da populao.

Dois aspectos nas amostras so fundamentais, e que do a sua representatividade em termos: - Qualitativos: Amostras que representem todas as sub-populaes, quando for o caso. - Quantitativos: Que possua quantidade de dados suficientes para representar a Populao.

Na indstria onde amostras so freqentemente retiradas para efeito de Controle da Qualidade dos produtos e materiais, em geral os problemas de amostragem so mais simples de resolver. Por outro lado, em pesquisas sociais, econmicas ou de opinio, a complexibilidade dos problemas de amostragem so normalmente bastante grandes. - Interferncia estatstica envolve a formulao de certos julgamentos sobre um todo aps examinar apenas uma parte, ou a amostra, dele.

A probabilidade e a amostragem esto estreitamente correlacionadas e juntas formam o fundamento da teoria de interferncia. - Amostragem o ato de retirar amostra, isto , a ao.

- Amostra a quantidade de dados especificado para representar a populao.

Amostragem aleatria permite estimar o valor do erro possvel, isto , dizer quo prxima est amostra da populao, em termos de representatividade.

Amostragem no aleatria no apresenta esta caracterstica. H vrios mtodos para extrair uma amostra talvez o mais importante seja a amostragem aleatria de modo geral, a amostragem aleatria exige que cada elemento tenha a mesma oportunidade de ser includo na amostra.

Nas Populaes discretas uma amostra aleatria aquela em que cada item da populao tem a mesma chance de ser includo na amostra. Nas Populaes contnuas, uma amostra aleatria aquela em que a probabilidade de incluir na amostra qualquer intervalo de valores igual percentagem da populao que est naquele intervalo.

Populaes finitas: quando, temos constitudo por nmeros finitos, ou fixos de elementos, medidas ou observaes. Ex.: Peso bruto de 3000 latas de tinta de um certo lote de produo.

Populaes infinitas: so aquelas que contm, pelo menos hipoteticamente, um nmero infinito de elementos. Ex. Produo de carros V.W. produzidos no Brasil e a serem produzidos (universo volkswagem), processo probabilstico.

2.2 AMOSTRAGEM ALEATRIA BASEADA EM NMEROS ALEATRIOS (RANDMICOS)

As tabelas de nmeros aleatrios contm os dez algarismos 0,1,2,3,4,......,9. Esses nmeros podem ser lidos isoladamente ou em grupos; podem ser lidos em qualquer ordem. A probabilidade de qualquer algarismo aparecer em qualquer ponto 1/10. Portanto todas as combinaes so igualmente provveis.

Conceitualmente, poderamos construir uma tabela de nmeros aleatrios numerando dez bolinhas com os algarismos de 0 a 9 , colocando-as numa urna, misturando bem e extraindo uma de cada vez, com reposio, anotando os valores obtidos. A titulo de ilustrao poderamos querer selecionar aleatoriamente 15 clientes de uma lista de 830 de um grande magazine, a finalidade poderia ser : Estimar a freqncia de compras; Determinar o valor mdio de cada compra; Registrar as queixas contra o sistema.

2.3 OUTROS PLANOS DE AMOSTRAGEM


Amostragem probabilstica versus Amostragem no probabilstica

Os planos de amostragem probabilstica so delineados de tal modo que se conhece a probabilidade de todas as combinaes amostrais possveis. Em razo disso, pode-se determinar a quantidade de varivel amostral numa amostra

aleatria e uma estimativa do erro amostral. A amostragem aleatria um exemplo da amostragem probabilstica.

A amostragem no probabilstica a amostragem subjetiva, ou por julgamento, onde a variabilidade amostral no pode ser estabelecida com preciso, conseqentemente, no possvel nenhuma estimativa do erro amostral.

A verdade que, sempre que possvel, deve-se usar a amostragem probabilstica.

2.4 AMOSTRAGEM POR JULGAMENTO (NO PROBABILSTICA)


Se o tamanho da amostra bem pequeno; digamos, de uns 5 itens, a amostragem aleatria pode dar resultados totalmente no representativos, ao passo que uma pessoa familiarizada com a populao pode especificar quais os itens mais representativos da populao.

Exemplo: Uma equipe mdica deve trabalhar com pacientes que se apresentem com voluntrios para testar um novo medicamento. Nenhum desses grupos podem ser considerados como uma amostra aleatria do pblico em geral, e seria perigoso tentar tirar concluses gerais com base em tal estudo. Todavia, os resultados poderiam proporcionar uma base para a elaborao de um plano de amostragem aleatrio para validar os resultados bsicos. Os perigos inerentes pesquisa mdica , bem como outro tipo de pesquisa, freqentemente obrigam a limitar a pesquisa inicial a um pequeno grupo de voluntrios.

Exemplo: A aplicao de hormnios em mulheres na menopausa, aps um perodo de tempo notou-se o aumento das chances de adquirirem cncer de mama, doenas cardacas etc.

2.5 AMOSTRAGEM PROBABILSTICA


SISTEMTICA ESTRATIFICADA CONGLOMERADO 2.5.1 AMOSTRAGEM SISTEMTICA muito parecida com a amostragem aleatria simples. Podemos ter uma amostragem realmente aleatria, escolhendo-se cada K-sima amostra, onde K obtem-se dividindo o tamanho da populao pelo tamanho da amostra.

K= N n

onde: N= Tamanho da Populao n= Tamanho da Amostra

EX. N= 200 e n=10

ento K=200/10 = 20

Significa que ser escolhido um item a cada seqncia de 20 de uma lista. Para iniciar pode-se usar uma tabela de nmeros aleatrios de 0 a 9 para iniciar os grupos. Por exemplo se der o 9, escolhemos o 9, 29, 39 ,49 , etc.

10

2.5.2 AMOSTRAGEM ESTRATIFICADA Pressupe a diviso da populao em sub-grupos Homogneos (Estratos), procedendo ento a amostragem de cada sub-grupo. Ex.: Para se fazer o inventrio do estoque, comum termos 10% dos itens representarem cerca de 60% do valor total em quanto que os 90% restantes representam s 40% do valor total (Curva A,B,C; Pareto; regra 80/20). 2.5.3 AMOSTRAGEM POR CONGLOMERADO

Pressupe a disposio dos itens de uma populao em sub-grupos heterogneos (sub-populaes) representativos da populao global. conglomerado pode ser encarado como uma minipopulao. Ex.: Estudo pr-eleitoral para medir a preferncia dos eleitores. (Sub-grupos: sexo, educao, faixa etria, poder aquisitivo, regio da habitao,etc). Neste caso cada

RESUMO
A finalidade da amostra permitir fazer interferncia sobre a populao aps inspeo de apenas parte dela. Fatores com custo, ensaios destrutivos e populaes infinitas, tornam a amostragem prefervel a um estudo completo (Censo) da populao.

Naturalmente espera-se que a amostra seja representativa da populao da qual foi extrada.

Potencialmente, este objetivo atingido quando a amostragem aleatria.

Para populaes discretas o termo Aleatrio significa que cada item da populao tem a mesma chance de participar na amostra. No caso de populaes contnuas, significa que a probabilidade de incluir qualquer valor de um dado intervalo de valores igual proporo com valores naquele intervalo. 11

As amostras aleatrias podem ser obtidas:

- Atravs de um processo de mistura, com o embaralhamento de cartas;

- Pela utilizao de um processo mecnico (Misturadores);

- Utilizando-se uma tabela de nmeros aleatrios para proceder seleo de uma lista. Em certas condies, podem ser mais eficientes variantes da amostragem aleatria simples, tais como amostragem sistemtica (peridica), estratificada (sub-grupos Homogneos), ou amostragem por aglomerados (sub-grupos convenientes e heterogneos). A principal vantagem da amostragem aleatria que se pode determinar o grau de variabilidade amostral, o que essencial na interferncia estatstica. amostragem no probabilstica falta esta caracterstica.

12

EXERCICIOS: E-2 QUESTES PARA RECAPITULAO


1- Em que circunstncia a amostragem prefervel a um censo completo?

2- Quando se deve preferir um censo a uma amostragem?

3- Defina Amostra Aleatria.

4- Descreva os vrios mtodos de obteno de uma amostra aleatria. Como escolher o mtodo a ser usado em determinada situao?

5- Explique rapidamente as caractersticas:

a. da amostragem por conglomerado; b. da amostragem estratificada; c. da amostragem sistemtica.

7- Que amostragem por julgamento e em que circunstncia deve ser usada?

8- Que amostragem probabilstica e quando deve ser usada?

9- Explique o significado de Amostra Aleatria quando a populao :

a. contnua

b. Discreta

13

3.0 ANLISE EXPLORATRIA DE DADOS


Em alguma fase de seu trabalho, o pesquisador se v s voltas com o problema de analisar e entender uma massa de dados, relevantes ao seu particular objeto de estudos.

De modo geral, podemos dizer que a essncia da cincia a observao e que seu objetivo bsico a interferncia. Esta parte da metodologia da cincia que tem por objetivos a coleta, reduo, anlise e modelagem dos dados, a partir do que, finalmente, faz-se a interferncia para uma populao, da qual os dados (amostras) foram obtidos.

14

4.0 DISTRIBUIO DE FREQNCIA


Para cada tipo de varivel existem tcnicas mais apropriadas para resumir as informaes. Porem podemos usar algumas tcnicas empregadas num caso, podemos adapt-las para outros.

Quando se estuda uma varivel, o maior interesse do pesquisador conhecer a distribuio dessa varivel atravs das possveis realizaes (valores) da mesma.

Exemplo 1: Dados relativos a uma amostra de 36 funcionrios de uma populao de 2000 funcionrios da empresa Milsa. Ver resultados anotados na tabela abaixo.

15

TABELA 1
N ESTADO CIVIL 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 solteiro casado casado solteiro solteiro casado solteiro solteiro casado solteiro casado solteiro solteiro casado casado solteiro casado casado solteiro solteiro casado solteiro solteiro casado casado casado solteiro casado casado casado solteiro casado casado solteiro casado casado 1 grau 2 grau 2 grau 2 grau superior 2 grau superior superior 2 grau superior 1 grau superior 2 grau 2 grau 1 grau superior 2 grau 2 grau 2 grau 1 grau 2 grau 2 grau 2 grau 1 grau 2 grau 1 grau 1 grau 1 grau 1 grau 2 grau 2 grau 2 grau GRAU DE N DE SALRIO IDADE REGIO DE INSTRUO FILHOS (X SAL. MIN) ANOS MESES PROCEDNCIA 1 grau 1 grau 1 grau 2 grau --1 2 ----0 ----1 --2 ----3 0 --1 2 ----1 ----0 2 2 --0 5 2 --1 3 --2 3 4 4,56 5,25 5,73 6,26 6,66 6,86 7,39 7,59 7,44 8,12 8,46 8,74 8,95 9,13 9,35 9,77 9,8 10,53 10,76 11,06 11,59 12,OO 12,79 13,23 13,6 13,85 14,69 14,71 15,99 16,22 16,61 17,26 18,75 19,4O 23,3O 26 32 36 20 40 28 41 43 34 23 33 27 37 44 30 38 31 39 25 37 30 34 41 26 32 35 46 29 40 35 31 36 43 33 48 42 03 10 05 10 07 00 00 04 10 06 06 11 05 02 05 08 07 07 08 04 09 02 00 01 05 00 07 08 06 10 05 04 07 07 11 02 interior capital capital outro outro interior interior capital capital outro interior capital outro outro interior outro capital outro interior interior outro capital outro outro interior outro outro interior interior capital outro interior capital capital capital interior

16

Exemplo 2: Freqncia e percentagem da amostra de 36 empregados da empresa Milsa segundo o grau de instruo.

TABELA 2
GRAU DE INSTRUO TABULAO FRQNCIA FREQ. RELATIVA F FR %

1 grau

IIIIIIIIIIII

12

33,33

2 grau

IIIIIIIIIIIIIIIIII

18

50,OO

superior I I I I I I
TOTAL

16,67

36

100

Exemplo 3: Freqncia e percentagem dos 2000 empregados (Populao) da empresa Milsa (Censo x Probabilidade)

TABELA 3
GRAU DE INSTRUO FRQNCIA F FREQ. RELATIVA FR % Censo FREQ. RELATIVA FR % Provvel

1 grau

650

32,50

33,33

2 grau

1020

51,00

50,OO

superior
TOTAL

330

15,50

16,67

2000

100

100

Exemplo 4: Freqncia e percentagens dos 36 empregados (Amostra) da empresa Milsa.

17

TABELA 4
CLASSE DE SALRIOS FRQNCIA FREQ. RELATIVA F FR %

4 I------- 8

10

27,78

8 I------- 12

12

33,33

12 I------- 16

22.22

16 I------- 20

13,89

20 I------- 24

2,78

TOTAL

36

100

Exemplo 5: Freqncias e percentagem dos empregados da empresa Milsa, segundo N de filhos.

TABELA 5
NMERO DE FILHOS Xi FREQNCIA FREQ. RELATIVA F FR %

20

25

35

15

TOTAL

20

100

EXERCCIO - Representar a distribuicao de frequencia para Idade e a Regiao de procedencia dos funcionarios da Empresa Milsa.

18

5.0 REPRESENTAO GRFICA DAS VARIVEIS QUANTITATIVAS


A representao grfica da distribuio de freqncias de uma varivel tem a vantagem de, rpida e concisamente, informar sobre a variabilidade da mesma. Podemos optar por vrios tipos de grficos, porem qualquer que seja ele, devemos especificar os elementos essenciais para a sua interpretao, que so: o ttulo; o corpo; o cabeario; as colunas indicadoras.

TTULO a indicao que, precedendo a tabela, colocado na parte superior da


mesma. Deve ser preciso, claro e conciso, indicando a natureza dos fatos estudados (o que), e a poca (quando) em que o mesmo foi observado.

CORPO da tabela o conjunto de linhas e colunas que contem respectivamente,


as sries Horizontais e verticais de informaes. Casa, cela ou clula o cruzamento de uma linha com uma coluna, onde se tem a freqncia com que a categoria (ou categorias) aparecem.

CABEARIO parte da tabela em que designada a natureza (as categorias,


as modalidades da varivel) do contedo de cada coluna.

COLUNA INDICADORA parte da tabela em que designada a natureza (as


categorias, as modalidades da varivel) do contedo de cada linha. Os elementos complementares de uma tabela so: Fontes; Notas.

FONTE o indicativo, no rodap da tabela, da entidade responsvel pela sua


organizao ou fornecedora dos dados primrios. A razo da presena da fonte no somente honestidade cientifica, mas tambm permitir ao leitor a possibilidade de consultar o trabalho original de onde procedem as informaes.

NOTAS so colocadas no rodap da tabela para esclarecimentos de ordem geral.


E so numeradas, podendo-se tambm usar smbolos grficos, sendo comum o asterisco.

19

6.0 APRESENTAO GRFICA


A apresentao grfica dos dados e respectivos resultados de sua anlise pode tambm ser feita sob forma de figuras, em geral grficos ou diagramas. Grficos devem ser auto-explicativos e de fcil compreenso, de preferncia sem comentrios inseridos.Devem ser simples, atrair a ateno do leitor e inspirar confiana.

6.1 DIAGRAMA DE ORDENADAS


Para sua construo traada uma reta horizontal (ou vertical) de sustentao; a partir de pontos eqidistantes na reta, traa-se perpendiculares cujos

comprimentos sejam proporcionais s freqncias.

freqncias

12

10

0 4 I-------8 8 I-------12 12 I-------16 16 I-------20 20 I-------24

Salrios 20

6.2 DIAGRAMA DE BARRAS


A mesma distribuio acima poderia ser representada por meio de diagrama que levasse em conta a magnitude da rea da figura geomtrica, j que a vista repousa melhor sobre uma superfcie do que sobre uma linha.

freqncias

12

10

0 4 I-------8 8 I-------12 12 I-------16 16 I------- 20 20 I-------24 Salrios

21

6.3 DIAGRAMA DE CRCULOS


Alem do retngulo, outra figura geomtrica utilizada o crculo ou conjunto de crculos. Lembrando que a rea do crculo o produto do nmero irracional = (3,1416) pelo quadrado do raio (r), isto ,

C= .r , e desde que as reas dos

diversos crculos devem ser proporcionais s magnitudes das freqncias, isto , C

= . f onde o fator de proporcionalidade, segue-se que:

. f = . r , ou seja,

r = .f

Se chamar

de `, tem-se

: r = `. f

portanto, os

raios dos crculos devem ser proporcionais a raiz quadrada das

freqncias das modalidades da varivel. Assim se quisermos representar graficamente a distribuio da tabela 1.4, os raios do crculo devero ser:

r1 = 27,78 . `= 5,27 . ` 5,27. 3 = 15.8 mm

r2 = 33,33 . `= 5.77 . ` 5,77. 3 = 17,3 mm

r3 =

22.22. `=

4,71. ` 4,71. 3 = 14,1 mm

r4 = 13,89 . `=

3.72. `

3,72. 3 = 11,1 mm

r5 =

2,78 . ` =

1,66 ` 1,66. 3 = 5,00 mm

A figura abaixo representa esta distribuio, com um ` adotado de 3 mm.

2,7 %

13,89 %

22,22

27,78 %

33,33 %

22

6.4 DIAGRAMA DE SETORES CIRCULARES


Outra opo seria atravs de setores circulares, na qual se divide a rea total de um crculo em subreas (setores) proporcionais as freqncias. Lembrando que o crculo compreende setores cujas reas (S) so produto do raio (r) pelo tamanho do arco (a), isto , S = r.a, e com S deve ser proporcional a freqncia f, tem-se S= .f , onde o fator de proporcionalidade; ento:

.f = r. a

a =

.f r

Se chamarmos

de `, tem-se S = `. f , isto , os arcos e os respectivos

ngulos centrais de um crculo igual a 360, e sendo F a freqncia total, tem-se

360 = `. F

ou seja: `= 360

Portanto a = 360. f

Assim, a distribuio de freqncia da tabela 4 representando faixas de salrios fica:

a1 = 360 x 27,78 = 100 100

a3 = 360 x 22,22 = 80 100

a2 = 360 x 33,33 = 120 100

a4 = 360 x 13,89 = 50 100

S5 = 360 x 2,78 = 10 100 23

Diagrama de Setores Circular

120 50 10

100
.

80

Diagrama de Setores Circular feito automaticamente pelo excel

33% 22%

28%

14% 3%

24

6.5 DIAGRAMA LINEAR


No diagrama linear deve-se plotar os pontos nos eixos como foi feito no diagrama de barras e em seguida unir esses pontos por semi-retas contituindo-se desta forma o diagrama linear. freqncias

12

10

x 8

6 x 4

2 x

0 4 I-------8 8 I-------12 2 12 I-------16 16 I-------20 20 I-------24

salrios

25

6.6 O PICTOGRAMA
A figura abaixo mostra um exemplo de apresentao pictogrfica de dados temporais (comumente encontrada em jornais, revistas e relatrios de vrios tipos), no caso abaixo representa a populao dos Estados Unidos.

1920 1930

1940 1950 1960 1970 1980 1990

Cada smbolo

= 10 milhes de pessoas

Pictograma da populao dos Estados Unidos

26

7.0 MONTAGEM DE UMA DISTRIBUIO DE FREQNCIAS


A anlise estatstica de dados relativos a uma amostra de uma populao, requer uma aglutinao organizada de informaes, conforme regras cuja prtica demonstrou serem eficientes. Consideremos uma relao de pesos de pacotes de manteiga, em gramas, de uma amostra de 100 pacotes extrados parcialmente de um processo automtico de empacotamento. A especificao de fabricao 215 15 gramas (200 a 230 gramas)

TABELA 6

AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 207 213 210 215 201 210 212 204 209 212 215 216 221 219 222 225 215 218 213 216 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 220 204 213 211 214 217 224 211 220 209 214 208 217 214 209 212 208 215 211 216 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 210 214 219 215 217 213 218 214 215 212 221 211 218 205 220 203 216 222 206 221 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 210 220 213 217 214 219 214 215 223 217 213 218 207 210 208 214 211 205 215 207 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 217 211 213 218 213 216 218 216 206 212 207 213 215 212 223 210 226 224 214 215

O agrupamento destes dados em sub-grupos feito com base nos seguintes conceitos: 27

Amplitude total (R.T.): a diferena entre a medida mxima e a medida mnima. No caso da amostra de pacotes de manteiga acima, temos: R.T. = 226 201 = 25 gramas Nmero de classes (d) : o nmero de divises que estipulamos para a Amplitude Total. Normalmente pode-se usar d = n onde n= nmero de itens na amostra para o

exerccio temos d = 100 10 classes, porem deve-se utilizar sempre que possvel nmero impar de classes no caso 9 classes.

Classe: o intervalo de variao das medidas.

Amplitude do intervalo de classe (R.I.): a diferena entre os valores mximos e mnimos de cada classe. Amplitude intervalo de cada classe R.I . = R.T Nmero de Classes No caso do exerccio temos:

Amplitude intervalo de cada classe R.I . = 25 = 2,7 aprox. 3 7 RI adotado = 3 RT adotado = 27 diferenca 2 comeca uma antes do menor e termina

um antes do maior valor.

As classes devem ser mutuamente exclusivas, para que no haja duvida na localizao dos valores das variveis, podemos dai utilizar as seguintes simbologias para os intervalos: 0 ----I 10 intervalo aberto & fechado, para significar que o intervalo compreende os valores da varivel maiores do que 0 (excludo) e at 10 (inclusive);

0 I---- 10 intervalo fechado & aberto, para significar que compreende os valores da varivel a partir de 0 (inclusive) e at 10 (exclusive); 0 ----- 10 Intervalo aberto & aberto, para significar que compreende valores maiores do que 0 e menores do que 10.

28

0 I----I 10 intervalo fechado & fechado, para significar que compreende os valores da varivel a partir de 0 (inclusive) e at 10 (inclusive).

TABELA de DISTRIBUIO das FREQNCIAS


Para a facilidade e metodizao do processo de anlise estatstica, monta-se um tabela que agrupe as informaes obtidas, de forma de Tabela de Freqncias. Para os pacotes em pauta, teremos a seguinte tabela de freqncias:

TABELA 7

VALOR COMPRIMENTO CLASSE CLASSE

FREQ. FREQUENCIA FREQUENCIA FREQUENCIA

TABULAO

RELATIVA %

ACUM.

ACUM. REL.%

1 2

200 ---I 203 I I 203 ---I 206 I I I I I I

2 6

2 6

2 8

2 8

3 4 5

206 ---I 209 I I I I I I I I I I 209 ---I 212 I I I I I I I I I I I I I I I I I I 212 ---I 215 I I I I I I I I I I I I I I I I I I I I I I I I I I I I

10 18 28

10 18 28

18 36 64

18 36 64

6 7 8 9

215 ---I 218 I I I I I I I I I I I I I I I I I I 218 ---I 221 I I I I I I I I I I 221 ---I 224 I I I I I I 224 ---I 227 I I

18 10 6 2

18 10 6 2

82 92 98 100

82 92 98 100

100

100%

29

Onde: Freqncia (F) = o numero de vezes que as medidas ocorrem no intervalo de classes

Freqncia relativa (FR) = a percentagem da freqncia de cada classe em relao ao total de elementos. FR = F d x 100 N Freqncia acumulada (FA) = considerado. Fa5 = F1+ F2 + F3 + F3 + F5 2+ 6+ 10+ 18+ 28 = 64 a soma das freqncias at o intervalo de classe

Ex.

Freqncia acumulada relativa (FAR) = a soma das freqncias relativas at o intervalo considerado

Far3 = Fr1 + Fr2 + Fr3 2 + 6 + 10 = 18

30

7.1 HISTOGRAMA E POLIGONO DAS FREQNCIAS

freqncias
28 POLIGONO DE FREQNCIAS

21

14

CLASSES

31

7.2 HISTOGRAMA E POLIGONO DAS FREQNCIAS RELATIVAS

%
28% POLIGONO DE FREQNCIA RELATIVA

21%

14%

7%

0 1 2 3 4 5 6 7 8 9 CLASSES

32

7.3 POLIGONO DE FREQNCIA ACUMULADA OU OGIVA

F.AC. 100 POLIGONO DE FREQNCIAS ACUMULADA 80

60

40

20

01

CLASSES

33

7.4 POLIGONO DA FREQNCIA ACUMULADA RELATIVA

%
100 %

F.AC REL.

80 %

POLIGONO DE FREQNCIAS ACUMULADA RELATIVA

60 %

40 %

20 %

0 %1

CLASSES

34

8.0 TIPOS DE DISTRIBUIO


As distribuies de freqncia podem se apresentar de diversas formas conforme as figuras a seguir:

8.1 DISTRIBUIO SIMTRICA OU EM FORMA DE SINO


A distribuio simtrica quando os valores se distribuem igualmente em torno da mdia (X)

A) Normal

B) Alongada

35

C) Achatada

8.2 DISTRIBUIO ASSIMTRICA


aquela em que as freqncias dos valores medidos, se distribuem de forma desigual em torno da mdia.

A) Assimtrica Positiva

36

B) Assimtrica Negativa

8.3 DISTRIBUIO MODAL, AMODAL, BIMODAL E MULTIMODAL


Chamamos de moda numa distribuio, ao valor da medida ou classe que corresponde freqncia mxima. Sob o critrio da moda as distribuies classificam-se em:

A) DISTRIBUIO MODAL Quando a distribuio tem freqncia mxima ela denominada modal.

mo

B) DISTRIBUIO AMODAL Quando a distribuio no tem moda

37

C) DISTRIBUIO BIMODAL Quando a distribuio tem duas modas.

mo

mo

D) DISTRIBUIO MULTIMODAL Quando a distribuio tem mais de duas modas

mo

mo

mo

8.4 APRESENTAO TIPO RAMO-E-FOLHAS


Uma alternativa para o uso da tabela de distribuio de freqncias usar o grfico do tipo ramo-e-folhas. Podermos estudar a partir de um exemplo prtico: Observamos os seguintes nmeros de passageiros em 50 viagens de um avio que faz ponte area Rio - So Paulo:

38

61

52

64

84

35

57

58

95

82

64

50

53

103

40

62

77

78

66

60

41

58

92

51

64

71

75

89

37

54

67

59

79

80

73

49

71

97

62

68

53

43

80

75

70

45

91

50

64

56

86

SOLUO:
F F.A. 2

12

19

11

30

39

45

49

10

50

A MEDIANA NESTE CASO SER X = 64

39

9.0 MEDIDAS DE POSIO OU DE TENDNCIA CENTRAL


Como o prprio nome indica, a medida de tendncia central visa a determinar o centro da distribuio. Esta determinao, porem, no bem definida da parece razovel chamarmos de tendncia central.

So medidas de tendncia central:

MDIA ARITMTICA SIMPLES/PONDERADA;

MEDIANA;

MODA.

9.1 MDIA ARITMTICA SIMPLES

Dada uma distribuio de freqncias, chama-se de mdia aritmtica desta destituio, e representa-se por variveis n. a soma de todos os valores da varivel, dividida pelo nmero de

x
n
n

Sendo:

x
i= 1

Exemplo: Calcular a mdia aritmtica simples de 8, 3, 5, 12, 10.

8 + 3 + 5 + 12 + 10 = 38 = 7,6 5 5

40

9.2 MDIA ARITMTICA PONDERADA

K xi .fi
i= 1

=
K

x
i= 1

fi

onde: f = freqncia dos nmeros

x = nmeros

Exemplo: Calcular a mdia ponderada dos nmeros 5, 8, 6, 2 freqncias 3, 2, 4 e 1, respectivamente

os quais ocorrem com as

Nmeros Freqncias

x = 5, 8, 6, 2 f = 3, 4, 2, 1

= 3x5 + 4x8 + 2x6 + 1x2 3+4+2+1

= 57 = 5,7 10

9.3 MEDIANA (x)

Se ordenarmos uma seqncia de nmeros do menor para o maior e se a quantidade desses nmeros for impar, ento a mediana ser o valor do meio, ou a mdia dos dois valores do meio caso a quantidade de nmeros seja par. O smbolo que usamos para representar a mediana x l-se x til.

No caso de calculo da mediana quando estamos trabalhando com distribuio de freqncia determinamos o valor mais provvel dessa distribuio a partir de:

= Freqncia acumulada total = 2

FA 2

(para nmeros pares)

41

Ou ainda A posio DA MEDIANA definida por

{ n+1 }
2

-simo elemento quando n

mpar temos um nmero inteiro e d a posio da mediana; Exemplo: Determine a posio da mediana para a) n=15 b) n=45 c)n=88

a)

n+1 = 15+1 = 8, e a mediana o valor do 8 elemento; 2 2

b)

n+1 = 45+1 = 23, e a mediana o valor do 23 elemento; 2 2 88 = 44 e a mediana o valor correspondente ao valor do 44elemento. 2

c) n 2

No caso do exerccio da distribuio dos 100 valores de peso de pacotes de manteiga temos: X = n 2 = 100 2 = 50, e a mediana o valor do 50 elemento

50 valor

FA

2 203

8 206

18 209

36 212

64 215

82 218

92 221

98 224

100 227

X 200

50
36 212 64 215

(64 36) (64 50)

(215 212)

42

14 x 3 = 1,5 28 logo, X = 212 + 1,5 = 213,5

portanto a mediana ser 212 +

9.4 MODA (

) x

Em um conjunto de nmeros a moda o valor que ocorre com maior freqncia, isto , o valor mais comum. Exemplos: 1) 2, 2, 3, 7, 8, 8, 8, 9, 10 moda=8 2) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10

moda = (no existe moda) 3) 2, 2, 4, 4, 4, 5, 6, 7, 8, 8, 8, 9 moda = 4 e 8

Para o exemplo do exerccio das distribuies de freqncias dos pacotes de manteiga temos que a moda o ponto mdio da classe modal, localiza-se a classe modal como sendo a classe com maior freqncia e em seguida determina-se seu ponto mdio.

Classe modal a 5 classe, portanto moda = 212 + 215 = 213,5 2

43

10.0 MEDIDAS DE VARIABILIDADE (DISPERSO)


As medidas de disperso indicam se os valores esto relativamente prximos uns dos outros, ou separados. Podemos dizer que disperso o grau com o qual os valores numricos de uma distribuio tendem a se distanciar em torno de um valor mdio. Em todos os casos, o valor zero indica ausncia de disperso; a disperso aumenta proporo que aumenta o valor da medida (amplitude,desvio-padrao, varincia).

xx x x x x xxx xxx xx x x

a) pequena disperso
xx x x xxx x x x x x x x x xx x x xxx x x x xx x x x x xx

b) grande disperso

10.1 AMPLITUDE TOTAL (R.T.)

a medida mais simples de disperso. a diferena entre o maior e o menor valor das observaes. R.T. = Xmax Xmin Embora exista simplicidade de clculo, existem duas restries ao seu generalizado:

1- Utiliza apenas uma parcela das informaes contidas nas observaes. O seu valor no se modifica mesmo que os valores das observaes variem, desde que conservem os seus valores Mximo e mnimo.

2- Depende do nmero de observaes na amostra. Em geral o valor da amplitude cresce quando cresce o tamanho da amostra. 44

X min.I R.T. = pequeno

I x max.

X min.

I R.T. = Grande

I X max.

10.2 DESVIO PADRO


medida que determina a variao dos valores observados em torno da mdia da distribuio, e representa a distncia do ponto de inflexo da curva at a linha da mdia.

10.2.1 DESVIO PADRO AMOSTRAL (S)

O desvio padro da amostra representa a disperso da amostra e dada pela equao:

S=

(X1-

) + (X2-

) + (X3n

) + ..... +(Xn-

45

Onde: Xi = Medidas individuais S=

( Xi n

) n = Nmero de elementos ou valores

10.2.2 DESVIO PADRO DA POPULAO ()

O desvio padro da populao representa a o grau de disperso da populao em torno da mdia representado por , tambm representa a distncia do ponto de inflexo, e dado pela expresso:

(X1-

) + (X2-

) + (X3n-1

) + ..... +(Xn-

( Xi n-1

10.2.3 REPRESENTAO GRFICA DO DESVIO PADRO

46

10.2.4 SISTEMATIZAO PARA O CLCULO

Para sistematizar o clculo do desvio padro de uma amostra utilizado o seguinte procedimento:

1- Calcular o valor da mdia; 2- Montar a tabela abaixo

observaes medidas

Xi

Xi -

(Xi -

1 2 3

X1 X2 X3

X1 X2 X3 -

(X1 (X2 (X3 -

) ) )

. . .
n

. . .
Xn Xn -

. . .
( Xn -

. . .
)

(Xi-

3-Aplicam-se as frmulas:

S=

( Xi n

( Xi n-1

47

10.3 VARINCIA

Varincia da populao a soma dos quadrados dos desvios de cada observao em relao mdia de x , divide-se por n 1. Indica-se a Varincia da Populao por . Podemos fazer a mesma analogia com a Varincia da Amostra dada por S.

Frmula da varincia da Amostra


n

( Xi
S=
i=1

Frmula da varincia da Populao


n

( Xi
=
i=1

) onde n 1 = nmero de graus de liberdade

n-1

Como medida de disperso, a Varincia tem a desvantagem de apresentar unidade de medida igual ao quadrado da unidade de medida dos dados. Se os dados esto em metros, a Varincia fica em metros quadrados. O desvio padro por sua vez, fica com valor na mesma da unidade da varivel.

48

11.0 DISTRIBUIO NORMAL


(ou de GAUSS, ou de LAPLACE, ou ainda, dos ERROS DAS OBSERVAES)
uma distribuio contnua e simtrica, cujo grfico tem a forma de um sino. A distribuio normal o resultado da atuao conjunta de causas aleatrias.

F (x)

x- 3

x- 2

x- 1

x +1 x+ 2 x+ 3

Parmetros da Distribuio Normal

Mdia da Populao Determinam o formato da curva Desvio padro da populao

Equao da Funo de Probabilidade A equao da funo de probabilidade dada pela expresso: - ( x - ) 2 f(x) = 1 2

Do estudo de estatstica conclumos que:

- a varivel x pode assumir qualquer valor real no intervalo

- < x < +
49

- a varivel x obedecer a uma Distribuio Normal, se a probabilidade de que um valor x seja menor ou igual a outro xo for: - ( x - ) x0 P( x < x0 ) = f(x0) = 1 2 - 2

dx

- a integral da expresso representa a rea compreendida entre


F (x)

xo.

-
X0

Portanto:

A probabilidade de ocorrncia de um valor menor ou igual rea abaixo da curva, entre os valores -

xo .

Os valores = 3,1416 e

e ( nmero

neperiano) = 2,718 so constantes numricas.

CARACTERISTICAS DA CURVA DE DISTRIBUIO NORMAL


A curva normal obedece necessariamente s seguintes caractersticas: a- A mdia o valor da varivel x para o qual a f(x) mxima. 50

b- O desvio Padro , a distncia entre a mdia e o ponto de inflexo da curva.

c- A rea total sob a curva normal igual a 1, pela prpria equao da probabilidade. d- Em virtude da simetria as reas direita e esquerda do valor so iguais

DISTRIBUIO NORMAL PADRONIZADA Se tomarmos a equao auxiliar:

Z=

o que significa adotar como origem dos z o ponto em que x =

e como unidade de

escalados z e o desvio padro , teremos transformado a expresso da funo das probabilidades na distribuio normal reduzida:

- z
2 f(z)= 1 2

Considerando, a partir da equao auxiliar: dz = dx dx 1 = . dz

Portanto a funo da probabilidade, em funo de Z, ser dada pela expresso:

51

- z
z f(z)= 1 2 2

e
-

dz

As reas sob a curva permanecem as mesmas, mas agora podem ser tabuladas em funo dos valores de Z (Ver figura abaixo, eixo dos Z). Basta construir a tbua das reas para os valores I(z), na tbua 1.

Por exemplo, a rea desde Z=0, at Z= 1,0 I(1,0) = 0,3413 ou 34,13% da rea total da curva; conseqentemente, dentro do intervalo 1 temos 68,26% da rea total da curva. Se procurarmos a probabilidade de encontrarmos um valor de x dentro do intervalo 0,95 onde a media, o desvio padro da populao, teremos:

P(- Z0 < Z < Z0) = P ( 0,95 < Z < + 0,95 ) Iz1 = 0,3289 It= 0,6578 ou 65,78%.

Apresentamos na tabela abaixo alguns dos mais importantes intervalos de distribuio normal para aplicaes em exerccios de probabilidade na curva normal.

TBUAS DE REAS DA CURVA NORMAL A partir da equao auxiliar Z=


X

podemos transformar valores de x em

valores de z e em seguida construir uma tabela com resultados das integrais, que corresponde rea sob a curva xo intervalo de 0 a Z0 identificada por Iz0.

52

F (x)

x- 3

x- 2

x- 1

x +1

x+ 2

x+ 3

-3

-2

-1

Transformao de X em Z

Xo

Z=

X -

Zo

+ 1 + 2 + 3 - 1 - 2 - 3 - + 1- + 2- + 3- -- - 2 - - 3 -
0 1 2 3 -1 -2 -3

53

I Zo

Zo

AREAS I ZO = P (0 z Z0) para Z0= (x - )/ I Z0 I Z0 I Z0 I Z0 I Z0 I Z0

Z0

Z0

Z0

Z0

Z0

Z0

0,00 0,0000 0,60 0,2257 1,20 0,3849 1,80 0,4641 2,40 0,4918 3,00 0,4987 0,05 0,0199 0,65 0,2422 1,25 0,3944 1,85 0,4678 2,45 0,4929 3,05 0,4989 0,10 0,0398 0,70 0,2580 1,30 0,4032 1,90 0,4713 2,50 0,4938 3,10 0,4990 0,15 0,0596 0,75 0,2734 1,35 0,4115 1,95 0,4744 2,55 0,4946 3,15 0,4992 0,20 0,0793 0,80 0,2881 1,40 0,4192 2,00 0,4772 2,60 0,4953 3,20 0,4993 0,25 0,0987 0,85 0,3051 1,45 0,4279 2,05 0,4798 2,65 0,4960 3,25 0,4994 0,30 0,1179 0,90 0,3159 1,50 0,4332 2,10 0,4821 2,70 0,4965 3,30 0,4995 0,35 0,1369 0,95 0,3289 1,55 0,4394 2,15 0,4842 2,75 0,4970 3,35 0,4996 0,40 0,1554 1,00 0,3413 1,60 0,4452 2,20 0,4861 2,80 0,4974 3,40 0,4997 0,45 0,1736 1,05 0,3531 1,65 0,4505 2,25 0,4878 2,85 0,4978 3,50 0,4998 0,50 0,1915 1,10 0,3643 1,70 0,4554 2,30 0,4893 2,90 0,4981 3,70 0,4999 0,55 0,2088 1,15 0,3749 1,75 0,4599 2,35 0,4906 2,95 0,4984 3,90 0,5000

54

EXERCCIOS: E-3
1- Trace uma curva normal e sombreie a rea desejada a partir das informaes:

a- rea direita de z=1,0 b- rea da esquerda de z= 1,0 c- rea entre z=0 e z=1,5 d- rea entre z=0 e z= - 2,9 e- rea entre z=1,0 e z= 2,0 f- rea entre z= -2,0 e z= 2,0 g- rea entre z= 2,5 e z=3,0

2- Ache os valores de z correspondentes as seguintes reas:

a- rea esquerda de para Iz = 0,0505 b- rea esquerda de para Iz = 0,0228 c- rea esquerda Iz= 0,4505 e rea da direita Iz = 0,4861

3- Uma distribuio normal tem media 50 e desvio padro 5. Que percentagem da populao estaria provavelmente dentro dos intervalos:

a- P ( x

60)

b- P ( 35 x 62) c- P ( 55 d- P ( x > x 65) 55)

e- P ( 35 x 45)

4- Suponha uma renda mdia de uma grande comunidade possa ser razoavelmente aproximada por uma distribuio normal com media anual de R$ 10.000,00 e desvio padro de R$ 2.000,00.

a- Que percentagem da populao ter renda superior a R$ 15.000,00? b- Numa amostra de 50 assalariados, quantos podemos esperar que tenham menos de R$ 8.000,00 de renda? 55

12.0 PROBABILIDADE
O problema fundamental da estatstica consiste em lidar com o acaso e a incerteza. Chama-se probabilidade de um acontecimento a razo entre o nmero de casos favorveis ao mesmo e o nmero total de acontecimentos possveis.

Assim quando se considera uma populao limitada de P indivduos, a probabilidade de cada um ser escolhido, ao acaso, de 1/P.

Laplace definiu probabilidade como: O quociente do nmero de casos favorveis sobre o nmero de casos igualmente possveis. Por exemplo, se jogarmos uma moeda no viciada para o ar, de modo geral no podemos afirmar se vai dar cara ou coroa. Porm existem apenas dois eventos possveis: sair cara ou coroa Nesse exemplo existe um caso favorvel a esse evento em dois casos possveis. A P (K) = ou 50%.

Considerando-se cara como sucesso e coroa como fracasso e representando-se o acontecimento favorvel como P e o no favorvel como Q, temos as razes:

P= Sendo Ento

Q=

P+Q = 1 P= (1 - Q) e Q = (1 - P)

A probabilidade de um evento A, denotada por P (A), um nmero de 0 a 1, que indica a chance de ocorrncia do evento A. Quanto mais prxima de 1,00 P(A), maior a chance de ocorrncia do evento A, e quanto mais prxima de Zero, menor a chance de ocorrncia do evento A.

Um evento impossvel atribui-se a probabilidade Zero.

Um evento certo tem probabilidade de 1. As probabilidades podem ser expressas, inclusive por valores decimais, fraes e percentagem como: 20%; 2 em 10; 0,2; ou ainda 1/5. 56

Alm do uso na interpretao de jogos de azar, usa-se ainda a probabilidade mediante determinada combinao de julgamento, experincia ou dados histricos, para predizer Quao Provvel a ocorrncia de determinado evento futuro. H numerosos exemplos de tais situaes no campo dos Negcios e do Governo. A previso da aceitao de um novo produto, o clculo dos custos de produo, a contratao de um novo empregado, o preparo do oramento, a avaliao do impacto de uma reduo de impostos sobre a inflao tudo isso contm algum elemento de Acaso.

12.1 ESPAO AMOSTRAL E EVENTOS

Consideremos o experimento que consiste em extrair uma carta de um baralho de 52 cartas. H 52 eventos elementares no espao amostral. Quanto aos eventos podemos classific-los em:

ESPAO AMOSTRAL

COMPLEMENTO

Cartas vermelhas e cartas pretas

No se interceptam cartas de MUTUAMENTE EXCLUDENTE

copas e cartas de paus

NAO SO MUTUAMENTE EXCLUDENTE

Cartas de copas e figuras, tem

elementos em comum.

Cartas de paus, ouro, copas e COLETIVAMENTE EXAUSTIVO A B C D espadas

57

12.2 TRS ORIGENS DA PROBABILIDADE


H trs maneiras diferentes de calcular ou estimar probabilidades, O mtodo Clssico, quando o espao amostral tem resultados igualmente provveis. O mtodo Emprico, que se baseia na freqncia relativa de ocorrncia de um evento num grande nmero de provas repetidas; e o mtodo Subjetivo, que utiliza estimativas pessoais baseadas num certo grau de crena.

OBJETIVO

SUBJETIVO

CLSSICO (resultados igualmente provveis) O Mtodo Clssico

EMPRICO (dados histricos)

Opinio Pessoal

Os jogos de azar (lanamento de moedas, jogo de dados, extrao de cartas) usualmente apresentam resultados igualmente provveis. Nestes casos temos:

P(cada resultado) =

1 Nmero de resultados possveis

Se cada carta de um baralho de 52 tem a mesma chance de ser escolhida, ento a probabilidade de extrair cada uma delas de 1/52 : P (A) = 1/52 1,92%.

Da mesma forma a probabilidade de termos uma cara no lanamento de uma moeda ou 50%. O mesmo ocorre com uma coroa, ou seja ou 50%. No caso de um dado temos a probabilidade de dar qualquer nmero: 1,2,3,4,5,6 de 1/6 ou de 16,66%.

De forma geral vale tambm a expresso:

58

P(A) = Nmero de resultados associados ao evento A Nmero total de resultados possveis

Por exemplo, a probabilidade de extrao de uma dama, de acordo com esta definio,

P (dama) =

4 damas = 4 52 cartas 52

= 1 = 7,69% 13

Analogamente, a probabilidade de obter nmero mpar no lance de um dado

P(mpar) =

3 faces 6 faces possveis

3 6

ou

50%

12.3 A MATEMTICA DA PROBABILIDADE

Muitas aplicaes de estatstica exigem a determinao

da probabilidade de

combinaes de eventos. H duas categorias de eventos de interesse, A e B, no espao amostral. Pode ser necessrio determinar P(A e B), isto ; a probabilidade de ocorrncia de ambos os eventos. Em outras situaes, podemos querer a probabilidade de ocorrncia de A ou B P(A ou B).

Clculo da Probabilidade da ocorrncia de dois eventos independentes P(A e B)

Se dois eventos so independentes, ento a probabilidade da ocorrncia de ambos igual ao produto de suas probabilidades individuais: P(A e B) = P(A) . P(B) Exemplo Jogam-se duas moedas equilibradas.Qual a probabilidade da ocorrncia de ambas darem cara? razovel admitir que os resultados das duas moedas sejam independentes um do outro. Alm disso, para moedas equilibradas, P(cara)= . Logo p(cara e cara) ser:

59

1 moeda x

2moeda = ou 25%

Clculo da Probabilidade da ocorrncia de dois eventos mutuamente excludente P(A ou B ocorrer)

Se dois eventos mutuamente excludentes, a probabilidade de ocorrncia de qualquer um deles a soma de suas probabilidades individuais. Para dois eventos A e B temos: P(A ou B) = P(A) + P(B) Exemplo, qual a probabilidade de aparecer cinco ou seis numa jogada de um dado equilibrado? P(cinco) ou P(seis) = P (5) + P(6) = 1 + 1 = 2 = 33,33% 6 6 6

Clculo da Probabilidade da ocorrncia de dois eventos no mutuamente excludente P(A ou B ou ambos ocorrero)

Suponhamos a probabilidade de extrao de uma carta de paus ou um dez de um baralho de 52 cartas . Como possvel que uma carta seja simultaneamente de paus e um dez, os eventos no so mutuamente excludentes. Assim devemos excluir a probabilidade de interseo. Ento temos:

P(paus) = 13 , 52

P(dez)=

4 , P( dez de paus) = 1 52 52

P(paus ou dez,ou ambos) = P(paus) + P(dez) - P(dez de paus)

= 13 + 52

4 52

- 1 52

= 16 52

60

NAIPE
PAUS PRETA OUROS VERMELHA K Q J 10 9 8 7 6 5 4 3 2 A COPAS VERMELHA ESPADA PRETA

K Q J 10 9 8 7 6 5 4 3 2 A

K Q J 10 9 8 7 6 5 4 3 2 A

K
Q J 10 9 8 7 6 5 4 3 2 A a carta um dez

Carta de paus Os eventos paus e dez se interceptam.

Regra de probabilidade
P (A e B), para eventos independentes (Multiplicao) P(A) x P(B)

P (A ou B), para eventos mutuamente excludentes (Soma) P(A) + P(B)

P (A ou B ou ambos ocorrero), para eventos no mutuamente excludentes P(A) + P(B) - P(A intercepta B)

61

EXERCCIOS: E-4
1- Extrai-se uma s carta de um baralho de 52. Determine a probabilidade de obter: a- Um valete b- Uma figura c- Uma carta vermelha d- Uma carta de ouros e- Um dez de paus f- Um nove vermelho ou um oito preto 2- Relacione os resultados possveis do lance de um s dado. Ache a probabilidade e adicione-as. 3- Joga-se uma vez um dado equilibrado; determine a probabilidade de obter: a- um seis b- cinco, seis ou sete c- um nmero par d- um nmero menor que quatro 4- Doze fichas so numeradas de 0 a 12 e colocadas numa urna. Escolhida uma aleatoriamente, determine a probabilidade de sair: a- o nmero 3 b- um nmero impar c- um nmero menor que quatro d- o nmero dez 5- Joga-se um par de dados equilibrados: a- Qual a probabilidade de ambas as faces serem seis? b- Qual a probabilidade de ambas as faces serem dois? c- Qual a probabilidade de ambas as faces serem pares? 6- Sejam P(A) = 0,30, P(B) = 0,80 e P(A e B) = 0,15. a- A e B so mutuamente excludentes? Explique. b- Determine P(A ou B). 7- Sejam A e B mutuamente excludentes, P(A) = 0,31 e P(B) = 0,29. a- A e b so coletivamente exaustivos? Explique. b- Determine P(A ou B). c- Determine P (A e B) 8- Joga-se uma moeda trs vezes. Qual a probabilidade de aparecer coroa trs vezes? Qual a probabilidade de no aparecer coroa nas trs vezes?

62

13.0 TECNICAS DE CONTAGEM


Para utilizar o mtodo clssico (A Priori) da probabilidade, preciso conhecer o nmero total de resultados possveis de um experimento.

Uma das possibilidades o uso das rvores de deciso, mas quando o numero de resultados grande, essa lista se torna muito trabalhosa; necessrio ento recorrer a formulas matemticas para determinar o numero total de resultados possveis.

Suponhamos que um estudante esteja fazendo um teste de 20 questes do tipo verdadeiro-ou-falso. Suponhamos ainda que ele, no tenha estudado nada, esteja dando todas as respostas na base do palpite. Qual a probabilidade de ele responder corretamente todo o teste? A primeira coisa a fazer determinar o numero total de resultados possveis.

Em segundo lugar devemos explorar suas diversas verses. Imaginemos que o teste consista de apenas:

Uma questo

temos V ou F

Duas questes temos VV, VF, FV, FF Trs questes temos VVV, VVF, VFF, VFV, FVF, FVV, FFV, FFF

Conclue-se: Numero de questes : 1 2 3 4 2 4 8 16

Numero de resultados :

Nota-se que se, o numero de itens for grande, a listagem se tornara praticamente impossvel. Em seguida podemos ver um diagrama de rvore para determinar todos os arranjos possveis.

63

QUESTO

N1

N2 V V F

N3 RESULTADOS V F V F V V F F V F VVV VVF VFV VFF FVV FVF FFV FFF

.
F

Alem disso, o que realmente necessario determinar o numero total de resultados; nada se tem a ganhar identificando cada resultado.

13.1 O PRINCIPIO DA MULTIPLICAO


O diagrama mostra que cada questo dobra o numero total de resultados possveis.(com duas alternativas V ou F) temos: NUMERO DE QUESTOES 1 2 3 4 TOTAL DE RESULTADOS 2=2 2 x 2 =4 2x2x2=8 2 x 2 x 2 x 2 = 16

Se fossem quatro escolha para cada questo: NMERO DE QUESTES 1 2 3 Para solucionar o exerccio do teste, teremos: TOTAL DE RESULTADOS 4=4 4 x 4 = 16 4 x 4 x 4 = 64

64

2x2x2x2x2x.......x2
1 2 3 4 5 . . . . . . . . . . 20

= 220

= 1.048.576 ou

1 1.048.576

De um modo geral, se ha n decises seqenciais, cada uma com m escolhas, o numero total de resultados

m n.

13.2 PERMUTAO, ARRANJO E COMBINAO.

Quando a ordem em que os elementos se dispem importante, o numero total de resultados possveis conhecido como Arranjo ou Permutao. Quando a ordem no interessa, o numero total de resultados possveis designado como Combinao. Para o uso na analise combinatria usaremos o numero fatorial representado pelo smbolo ! como por exemplo

4!

le-se Quatro Fatorial e significa 4 x 3 x 2 x 1 = 24.

Outros exemplos:

5! = 5 x 4 x 3 x 2 x 1 = 120 12! = 12 x 11 x 10 x 9 x 8 x 7 x ..............x 1 = 479.001.600


Os fatoriais crescem de modo extremamente rpido, medida que aumenta o numerobase. Felizmente, quase nunca necessrio utilizar-se completamente os fatoriais, pois eles aparecem em grupos, permitindo cancelamentos:

5! = 7!

5x4x3x2x1 7x6x5x4x3x2x1

5! 7 x 6 x 5!

1 7x6

1 42

4! = 2!

4 x 3 x 2 x 1 = 4 x 3 x 2! = 4 x 3 = 12 2x1 2!

5! 2! 3!

= 5 x 4 x 3! 2 x 1 x 3!

= 5 x 4 = 20 = 10 2x1 2

s vezes os fatoriais podem envolver soma e subtrao. Exemplos: 65

( 5 - 3 )! = 2! ( 9 - 2 )! = 7! ( 3 + 1)! 8! 3 ( 8 3 )! = 4! = 8! 3! . 5! =

e no ( 5! - 3! )

8 x 7 x 6 x 5! = 8 x 7 x 6 3 x 2 x 5! 3x2

= 56

O fatorial de zero igual a um O fatorial de 1 igual a um

0! = 1. 1! = 1.

ARRANJOS

So agrupamentos que podem variar pela ordem ou natureza dos elementos. Quando se consideram n elementos distintos tomados x a x chamamos arranjo ou agrupamentos enerios que se podem formar com esses n elementos, dispomos de todas as formas possveis de modo que dois arranjos quaisquer difiram ao menos pela ordem dos elementos.

Assim, os arranjos possveis com as letras A, B e C so A 3,2 (3 elementos dois a dois) A 3,2 = AB; BA; AC; CA, BC; CB.

E com os nmeros: 2, 6 e 8 podem ser feitos os seguintes arranjos A 3,2 A 3,2 = 26; 28; 62; 68; 82; 86.

Outro exemplo: Se ha sete cavalos num preo, quantos arranjos ha considerando 1,2 e 3 lugares?

A n,x =

n! ( n x )!

Ou seja, 7 elementos tomados 3 a 3

A 7,3 =

7! ( 7 3 )!

7! 4!

7 x 6 x 5 x 4! = 7 x 6 x 5 = 210 4!

PERMUTAO

66

Denomina-se permutao aos arranjos de objetos tomados n a n. Neste caso cada objeto entra s uma vez em todos os grupos.

Em geral o numero de permutaes distintas com n itens, dos quais n1 so indistinguveis de um tipo, n2 de outro tipo, etc, : n1, n2, ....nK

Pn =

n! (n1!) (n2!) (n3!) ......(nk!)

Exemplo: Quantas permutaes distintas de 3 letras podemos formar com as letras: RRRR UUU N
4 3 1

Soluo Ha 8 letras : 4Rs 3Us 1N dai:


4, 3, 1

P8 =

8! (4!) (3!) (1!)

= 280

COMBINAO

Chama-se combinao quando no interessa a ordem para denotar o numero de agrupamentos distintos possveis. Exemplo: a escolha de 2 tipos de vegetal de um cardpio com 5 tipos. A escolha de batata e cenoura a mesma que cenoura e batata.

De um modo geral, para agrupamentos de tamanho x extrados de uma lista de n itens, o numero de combinaes possveis :

C n,x =

n! x ! (n - x )!

n x

67

Quantos comits distintos, de 3 pessoas cada um, podemos formar com um grupo de 10 pessoas?

C10,3 =

10! 7! 3!

= 10 x 9 x 8 x 7! = 120 3 x 2 x 7!

De quantas maneiras podemos formar um comit de 1 mulher e 2 homens, de um total de 4 mulheres e 6 homens.

Mulheres ( C 4,1 )

Homens ( 6,2 )

4! 3! 1!

6! 4! 2!

= 4 x 15

= 60

13.3 REGRAS DE CONTAGEM


REGRA DA MULTIPLICAO: o produto do numero de escolhas para uma seqncia de decises m n onde m = numero de escolhas n = decises seqenciais

ARRANJOS: numero de agrupamentos em que interfere a ordem

A n,x =

n! ( n x )!

PERMUTAO COM REPETIES (OU DISTINGUIVEIS): alguns itens so idnticos, e a ordem importante.

n1, n2, ....nK

Pn =

n! (n1!) (n2!) (n3!) ......(nk!)

COMBINAES: a ordem no importa.

C n,x =

n! x ! (n - x )!

n x 68

EXERCCIOS: E-5
1- Calcule: a- 2! b- 3! c- 10! d- 1! e- 0!

2- Calcule: a3 2 b4 4 c5 1 d9 6

3- Determine o numero de arranjos: a- A 3,2 b- A 4,4 c- A 5,1 d- A 9,6 e- A 1,0

4- Um vendedor de automveis deseja impressionar os possveis compradores com o maior numero de combinaes diferentes possveis. Um modelo pode ser dotado de trs tipos de motor, dois tipos de transmisso, cinco cores externas e duas internas. Quantas so a escolhas possveis?

5- Em um determinado Estado, as placas de licena constam de trs letras e quatro algarismos. Quantas placas diferentes podemos formar admitindo-se o uso de todas as (26 letras) e os (10 algarismos)?

6- Quantas permutaes distintas podem ser feitas com as letras da palavra BLUEBEARD ?

7- Se um torneio de basquetebol consiste de 36 times, de quantas maneiras podem ser conquistados os trs primeiros lugares?

8- De quantas maneiras diferentes podemos escolher um comit de cinco pessoas dentre oito? 9- A Pizzaria do Joe oferece as seguintes escolhas de pizza: presunto, cogumelos, pimento, enchovas e muzzarella. De quantas maneiras podemos escolher dois tipos diferente de pizza?

69

14.0 DISTRIBUIO DE PROBABILIDADES


Introduzidas s noes fundamentais sobre a teoria das probabilidades, pode-se passar s chamadas Distribuies de Probabilidades. Uma distribuio de probabilidades uma distribuio de freqncia relativa para os resultados de um espao amostral (isto , para os resultados de uma varivel aleatria); que mostra a proporo das vezes em que a varivel aleatria tende a assumir cada um dos diversos valores. Consideremos a varivel aleatria Numero de caras em duas jogadas de uma moeda eis a lista dos pontos do espao amostral e os valores correspondentes a v.a.: (K = cara e C = coroa) Resultados CC Valor da v.a. 0

CK

KC

KK

Se a moeda equilibrada, P(K) = P(C) = .As probabilidades dos diversos resultados so: RESULTADOS PROBABILIDADE DO RESULTADO 1 CC 2 1 CK 2 1 KC 2 1 KK 2 2 . 2 1 = 4 70 . 2 1 = 4 1 2 0,25 . 2 1 = 4 0,50 1 1 0,25 . 1 = 4 1 1 0,25 1 0 0,25 NUMERO DE CARAS P(X)

Assim, pois, a distribuio de probabilidades para o numero de caras em duas jogadas de uma moeda so:

NUMERO DE CARAS

P(X)

0,25

0,50

0,25 1,00

Note-se que a soma de todas as probabilidades 1,00, como de esperar, pois os resultados apresentados so mutuamente excludentes e coletivamente exaustivos. A mesma distribuio pode ser apresentada em forma acumulada. NUMERO DE CARAS P(X ou menos)

0,25

0,75

1,00

71

Graficamente, as distribuies de probabilidade e acumulada se apresentam:


P R 1,00 O B A B I 0,75 L I D A D 0,5 E A C U 0,25 M U L A D 0 A

1,00

1,OO

P R 0,75 O B A B I 0,5 L I D A D 0,25 E

0,75

0,5

0,25

0,25

0,25

0 0 1 2 NUMERO DE CARAS

0 1 2 NUMERO DE CARAS

14.1 DISTRIBUIO BINOMIAL


Suponhamos agora o experimento E4= Lanamento de 4 moedas. A tabela abaixo mostra todas as possibilidades de combinaes cara/coroa, os eventos que estas combinaes originam e os valores correspondentes da varivel aleatria X : Numero de vezes que sai Cara.

72

POSSIBILIDADE N 1 2a 2b 2c 2d 3a 3b 3c 3d 3e 3f 4a 4b 4c 4d 5

MOEDA N 1, 2, 3, 4 CCCC CCCK CCKC CKCC KCCC CCKK CKKC KKCC CKCK KCKC KCCK KKKC KKCK KCKK CKKK KKKK

EVENTO

VALOR DE X ( N DE VEZ QUE SAI CARA)

0K e 4C 1K e 3C

0 1

2K e 2C

3K e 1C

4K e 0C

Utilizando as regras do produto para eventos independentes (e) e da adio para eventos mutuamente exclusivos (ou) possvel calcular as probabilidades associadas aos valores de X.

A probabilidade de X=0 obtida pelo conhecimento de termos 4 coroas, sabe-se que a probabilidade de sair coroa , a probabilidade final ser: 0,5x0,5x0,5x0,5 = 0,0625. -63Para o calculo da probabilidade X=1 deve-se trabalhar com o evento 1K e 3C como temos as opes a,b,c,d, que so mutuamente exclusiva, a regra da soma manda efetuar a adio 0,0625 +0,0625 +0,0625 +0,0625 ou, o que o mesmo de se efetuar o produto 4x 0,0625 = 0,25.

Desta forma analogamente temos:

73

X 0 1 2 3 4

EVENTO 0K e 4C 1K e 3C 2K e 2C 3K e 1C 4K e 0C

P(X = x)
0 4 0 4

O,0625 = 1 X 0,5 X 0,5


1 3

= 1p
1

q
3

O,2500 = 4 X 0,5 X 0,5


2 2

= 4p
2

q
2

O,3750 = 6 X 0,5 X 0,5


3 1

= 6p
3

q
1

O,0625 = 4 X 0,5 X 0,5


4 0

= 1p
4

q
0

O,0625 = 1 X 0,5 X 0,5

= 1p

TOTAL n = numero de moedas p = probabilidade de K = P(K) = 0,5 q = 1 p = probabilidade de C = P(C) = 0,5

1,00

Podemos usar a formula:

n! x ! (n x)!

n x

= combinaes de n individuais tomados x a x.

Generalizando temos;
x n-x

P(x) =

n! x! (n x)!

p . q

74

Distribuio binomial de x (numero de coroas) para n = 10 X Numero de Coroas em 10 jogadas n! x ! (n x) ! Distribuio Amostral P(X) probabilidade % de encontrar a Amostra

10

p(10) =

10! 10! (10 10)! 10! 9! (10 9) ! 10! 8! (10 8) ! 10! 7! (10 7) ! 10! 6! (10 6) ! 10! 5! (10 5) ! 10! 4! (10 4) ! 10! 3! (10 3) ! 10! 2! (10 2) ! 10! 1! (10 1) ! 10! 0! (10 0) !

1/1024 = 0,000976

p(9) =

10

1/1024 = 0,009760

p(8) =

45

1/1024 = 0,043940

p(7) =

120

1/1024 = 0,117180

p(6) =

210

1/1024 = 0,205070

p(5) =

252

1/1024 = 0,246090

p(4) =

210

1/1024 = 0,205070

p(3) =

120

1/1024 = 0,117180

p(2) =

45

1/1024 = 0,043940

p(1) =

10

1/1024 = 0,009760

p(0) =

1
10

1/1024 = 0,000976

TOTAL = 2

= 1024

75

EXERCICIOS: E-6
Use a formula binomial para responder s questes abaixo: 1- Um fabricante de mesas de bilhar suspeita que 2% de seu produto apresenta algum defeito. Se tal suspeita correta, determine a probabilidade de que, numa amostra de nove mesas: a- Haja ao menos uma defeituosa b- No haja nenhuma defeituosa

2- Dos estudantes de um colgio, 41% FUMAM CIGARROS. Escolhem-se seis ao acaso para darem sua opinio sobre o fumo. a- Determine a probabilidade de nenhuma das seis ser fumante. b- Determine a probabilidade de todos os seis ser fumante. c- Qual a probabilidade de ao menos a metade dos seis serem fumantes.

3- Doze por cento dos que reservam lugar num vo sistematicamente faltam ao embarque. O avio comporta 15 passageiros. a- determine a probabilidade de que todos os 15 que reservaram lugar compaream ao embarque b- Se houve 16 pedidos de reserva, determine a probabilidade de uma pessoa ficar de fora.

4- Um revendedor de automveis novos constatou que 80% dos carros vendidos so devolvidos ao departamento mecnico para corrigir defeitos de fabricao, nos primeiros 25 dias apos a venda. De 11 carros vendidos num perodo de 5 dias, qual a probabilidade de que: a- Todos voltem dentro de 25 dias para reparo. b- S um no volte

5- Suponha que 8% dos cachorros-quentes vendidos num estdio de futebol sejam pedidos sem mostarda. Se sete pessoas pedem cachorro, determine a probabilidade de que: a- Todos queiram mostarda b- Apenas um no a queira. 76

14.2 DISTRIBUIO DE POISSON

A chamada Distribuio de Poisson ou de Eventos Raros podem ser considerada um caso limite da distribuio binomial. Quando n grande e p pequeno podemos usar a aproximao de Poisson para a distribuio Binomial. difcil dar condies precisas para que se possa usar a aproximao de Poisson, ou seja, o que significa quando n grande e p pequeno. Como regra geral podemos usar:

> 100

n.p < 10

n = Elementos da Populao

p = Probabilidade

Exemplo: n = 150

p = 0,05

Temos a distribuio de Poisson com: n.p = 150 . (0,05) = 7,5 A formula a ser usada : x f (x) = (n.p) . e x! - n.p para x = 1, 2, 3, .......

e= 2,718

Exemplo: Sabe-se que 2% dos livros encadernados em uma certa livraria apresentam defeitos de encadernao. Utilize a aproximao de Poisson da distribuio Binomial para achar a probabilidade de que 5 entre 400 livros encadernados nessa livraria apresentam algum defeito de encadernao.

Temos: n = 400 -8 e = 0,000335

p = 2% = 0,02

x=5

n.p = 400 . 0,02 = 8

77

temos ento: x f (x) = (n.p) . e x! - n.p =

-8

8 . e 5!

= (32768). (0,000335) = 10,977 = 0,0915 120 -67120

Outro Exemplo: Supnhamos que os defeitos em fios para tear possam ser aproximados por um processo de Poisson com media de 0,2 defeitos por metro (p = 0,2) .Inspecionando-se pedaos de fio de 6 metros de comprimento, determine a probabilidade de menos de 2 (isto 0 ,1) defeitos. Temos : n = 6 p = 0,2 n . p = 6 . 0,2 = 1,2 x =1 e X=2

-1,2

f(0) =

1,2 0!
1

= 1 . 0,301 = 0,301 1

-1,2

f(1) =

1,2 1!

= 1,2 . 0,301 = 0,3612 1

P(x< 1) = P(0) + P(1)

(0,301 + 0,3612) = 0,6622

78

EXERCICIOS: E-7

1- Verifique, em cada caso, se os valores de n e p satisfazem as regras empricas para a utilizao de Poisson como aproximao da Binomial: abcn = 500 e n = 100 n = 60 e e p = 0,001 p = 0,12 p = 0,002

2- Se 0,6% dos detonadores fornecidos a um arsenal so defeituosos, utilize a aproximao de Poisson para a distribuio Binomial para determinar a probabilidade de que, em uma amostra aleatria de 500 detonadores, quatro sejam defeituosos. 3- Em uma certa cidade 3,2% dos habitantes se envolve em, ao menos, um acidente de carro em um ano. Com o auxilio da aproximao de Poisson para a distribuio Binomial, determine a probabilidade de que, dentre 200 motoristas escolhidos aleatoriamente nessa cidade. a- Exatamente seis se envolvam em ao menos um acidente em um ano; b- No Maximo oito se envolvam em ao menos um acidente em um ano; c- Cinco ou mais se envolvam em ao menos um acidente em um ano;

4- Suponha que, em media 2% das pessoas sejam canhotas. Encontre a probabilidade de 3 ou mais canhotos em 100 pessoas

79

15.0 CORRELAO
15.1 INTRODUO
At agora nossa preocupao era descrever a distribuio de valores de uma nica varivel. Com esse objetivo, aprendemos a calcular medidas de tendncia central e variabilidade. Quando porem, consideramos observaes de duas ou mais variveis, surge um novo problema: as relaes que podem existir entre duas ou mais variveis estudadas.

Assim, quando consideramos variveis como peso e altura de um grupo de pessoas, uso do cigarro e incidncia do cncer, a potencia gasta e a temperatura da gua no chuveiro, Procuramos verificar se existe alguma relao entre as variveis de cada um dos pares e qual o grau dessa relao.

Para isso, necessrio o conhecimento de novas medidas.

Sendo a relao entre as variveis de natureza quantitativa, a correlao o instrumento adequado para descobrir e medir essa relao.

Uma vez caracterizada a relao, procuramos descreve-la atravs de uma funo matemtica. A regresso o instrumento adequado par a determinao dos parmetros dessa funo.

15.2 RELAO FUNCIONAL E RELAO ESTATSTICA


Como sabemos, o permetro e o lado de um quadrado esto relacionados. A relao que liga perfeitamente definida e pode ser expressa por meio de uma sentena matemtica: P=4L P= PERIMETRO L= LADO DO QUADRADO 80

Atribuindo-se, ento, um valor qualquer de L, possvel determinar exatamente o valor do permetro.

Considerando, agora a relao que existe entre o peso e a estatura de um grupo de pessoas. evidente que essa relao no do mesmo tipo da anterior, ela bem menos precisa. Assim, pode acontecer que a estaturas diferentes correspondam a pesos iguais ou que estaturas iguais correspondam a pesos diferentes.

Porem, em mdia, quanto maior a estatura, maior o peso.

As relaes do tipo perimetro-lado so conhecidas como relaes funcionais. As relaes do tipo peso-estatura, como relaes estatsticas.

Quando duas variveis esto ligadas por uma Relao Estatstica, dizemos que existe uma correlao entre elas.

15.3 DIAGRAMA DE DISPERSO


Consideremos uma amostra aleatria, formada por 98 alunos de uma classe da Uniso e pelas notas obtidas por eles em Matemtica e Estatstica: NOTAS N MATEMATICA (xi) ESTATISTICA (yi)

01 08 24 38 44 58 59 72 80 92

5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0

6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0 81

Representando, em um sistema de coordenadas cartesiano ortogonal, os parmetros (xi ; yi), obtemos uma nuvem de pontos que denominamos DIAGRAMA DE DISPERSAO. Esse diagrama nos fornece uma idia grosseira, porem til, da correlao existente: yi 10 . .
o o

8 . . 6 . .
o

o o

4 . . 2 . . . . 2
o

. 4

. 6

. 8

. 10 xi

15.4 CORRELAO LINEAR


Os pontos obtidos, vistos em conjunto formam uma elipse em diagonal.

Podemos imaginar que, quanto mais fina for a elipse mais ela se aproximar de uma reta. Dizemos, ento, que a correlao de forma elptica tem como imagem uma reta, sendo, por isso denominada de Correlao Linear. 82

possvel verificar que cada correlao esta associada como imagem uma relao funcional. Por esse motivo, as relaes funcionais so chamadas Relaes Perfeitas.

yi 10 . .
o

RETA IMAGEM

8 . . 6 . .
o

o o

4 . . 2 . . . . 2
o

. 4

. 6

. 8

. 10 xi

Como a correlao em estudo tem como imagem uma reta ascendente, ela chamada de Correlao Linear Positiva.

Assim uma correlao : a- Linear Positiva se os pontos do diagrama tem com imagem uma reta ascendente; b- Linear negativa se os pontos tem como imagem uma reta descendentes; c- Nao-linear se os pontos tem como imagem uma curva.

Se os pontos apresentam-se dispersos, no oferecendo uma imagem definida, conclumos que no h relao alguma entre as variveis em estudo. 83

Temos:

Y
o oo ooo oo ooooo ooo ooooo oo o oo

correlao linear positiva

X Y
o oo ooo oo ooooo ooo ooooo oo o oo

correlao linear negativa

X
o o oo oo oooo ooo oo oo ooo ooooo o correlao no-linear ooo oooo ooooo ooo oo oo o oooo oo ooo

Y
oo o o o o o o o oooo ooo o ooo oo ooo oooo oooo oooo o o oo ooo ooooo o o ooo oo o ooooo

no h correlao

84

15.5 COEFICIENTE DE CORRELAO LINEAR


O instrumento empregado para a medida de Correlao Linear o Coeficiente de Correlao. Esse coeficiente deve indicar o grau de intensidade da correlao entre duas variveis e, ainda, o sentido dessa correlao (positivo ou negativo). Faremos uso do coeficiente de correlao de Person, que dado por :

r=

n xi yi (xi ) (yi)

Onde:

[ n xi (xi)] [ n yi (yi)]

n = nmero de observaes Os valores limites de r so -1 e +1, isto , o valor de r pertence ao intervalo [ -1 e +1]. Assim: A- Se a correlao entre duas variveis perfeita e positiva, ento r = +1.

B- Se a correlao perfeita e negativa, ento r = -1

C- Se no h correlao entre as variveis ou a relao por ventura no-linear, ento r = 0.

NOTAS -

Para que uma relao possa ser descrita por meio do Coeficiente de Correlao de Person imprescindvel que ela se aproxime de uma funo Linear. Uma maneira pratica de verificarmos a linearidade da relao a inspeo do Diagrama de Disperso: se a elipse apresenta salincias ou reentrncias muito acentuadas, provavelmente trata-se de uma relao curvilnea.

Para podermos tirar algumas concluses significativas sobre o comportamento simultneo das variveis analisadas, necessrio que: 0,6 | r | 1 | r | < 0,6, h uma correlao relativamente fraca entre as variveis.

Se

0,3

85

Se 0

< | r | < 0,3,

a correlao muito fraca e, praticamente, nada podemos

concluir sobre a relao entre as variveis em estudo. -81Em seguida vamos calcular o coeficiente de correlao relativos ao exerccio anterior. O modo mais pratico para obtermos r abrir, na tabela, colunas correspondentes aos valores de xi yi, xi e yi. Assim:

MATEMATICA (xi) 5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0 =65

ESTATISTICA (yi) 6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0 =65 xi yi 30 72 56 100 30 49 72 12 48 04 =473 xi 25 64 49 100 36 49 81 09 64 04 =481 yi 36 81 64 100 25 49 64 16 36 04 =475

Logo:

r=

10 x 473 65 x 65

505

550 4.554,18

= 0,911

(4.810 4.225)

(4.750 4.225)

585 x 525

Dai: r = 0,91 Resultado que indica uma correlao linear positiva altamente significativa entre as duas variveis.

86

15.6 CUDADOS COM OS ERROS COM A INTERPLETAO DE CORRELAO

Identificamos a seguir trs dos erros mais comuns cometidos na interpretao de resultados que envolvem correlao.

1- Devemos evitar a concluso de que a correlao implica em casualidade. Um estudo mostrou uma correlao entre salrios de professores de Estatstica e o consumo individual de cerveja. Porem essas duas variveis so afetadas pelas condies econmicas que envolvem no s o professor de Estatstica, aparece neste caso uma terceira varivel oculta.

2- Surge outra fonte de erro potencial quando os dados se baseiam em taxas ou mdias. Quando utilizamos taxas ou mdias para os dados, suprimimos a variao entre os indivduos ou elementos, e isto pode levar a um coeficiente de correlao inflacionado.

3- Um terceiro erro diz respeito propriedade de linearidade. A concluso de que no h correlao linear significativa no quer dizer que x e y no estejam relacionados de alguma forma provavelmente possa haver uma correlao no linear.

87

EXERCICIOS: E-8
1- Complete o esquema de clculo do coeficiente de correlao para os valores das variveis xi e yi :

xi yi

4 12

6 10

8 8

10 12

12 14

Temos: (xi) (yi) xi yi xi yi

4,0 . . .... 12,0 = =

12,0 . 14,0 = = =

Logo:

r=

.... x ... .... x ...

.........

........ .........

= ........

(..... .....) (..... ......)

..... x ......

ONDE: r =

88

2- Padronize cada conjunto de escores e calcule o coeficiente de correlao. A-

(xi) 34 30 40 34 39 35 42 45 43 = B=

(yi) 21 22 25 28 15 24 24 22 17

xi yi

xi

yi

(xi)

(yi)

xi yi

xi

yi

3,9 4,6 6,0 2,8 3,1 3,4 4,2 4,0 =

46 46 52 50 48 40 42 44 = = = =

89

3- Determine o coeficiente de correlao para os dois conjuntos de valores abaixo:


1 AVALIAO 2 AVALIAO

estudante 1 2 3 4 5 6 7 8 9 10 11

(xi) 82 84 86 83 88 87 85 83 86 85 87 =

(yi) 92 91 90 92 87 86 89 90 92 90 91 =

xi yi

xi

yi

4- Com os dados abaixo, sobre crimes violentos e a temperatura mdia entre 21 e 2 horas das noites de sbado numa grande comunidade, monte o grfico para os dados e calcule o coeficiente de correlao. Crimes Violentos/ 1000 residentes 5,0 2,2 4,1 5,4 2,8 3,0 3,6 4,9 4,1 4,2 2,0 2,7 3,1 temperatura mdia (F) 87 50 75 90 55 54 68 85 82 80 45 58 66 90

16.0 REGRESSO LINEAR


Sempre que desejamos estudar determinada varivel em funo de outra fazemos sempre uma anlise de regresso.

Podemos dizer que a analise de regresso tem por objetivo descrever, atravs de um modelo matemtico, a relao entre duas variveis, partindo de n observaes das mesmas.

16.1 AJUSTAMENTO DE CURVAS


A varivel sobre a qual desejamos fazer uma estimativa recebe o nome de varivel dependente e a outra recebe o nome de varivel independente.

Assim, supondo X a varivel independente e Y a dependente, vamos procurar determinar o ajustamento de uma reta a relao entre essa variveis, ou seja, vamos obter uma funo definida por: Y = ax + b onde a e b so parmetros.

Sejam duas variveis X e Y, entre as quais exista uma correlao acentuada, embora no perfeita, como, por exemplo, as do exerccio j apresentado: MATEMATICA (xi) 5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0 ESTATISTICA (yi) 6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0 91

Cujo Diagrama de Disperso dado por: yi 10 . .


o

RETA IMAGEM

8 . . 6 . .
o

o o

4 . . 2 . . . . 2
o

. 4

. 6

. 8

. 10 xi

Podemos concluir, pela forma do diagrama, que se trata de uma correlao retilnea, de modo a permitir o ajustamento de uma reta, imagem da funo definida por: Y = ax+ b

16.2 MTODO DOS MNIMOS QUADRADOS


Vamos ento, calcular os valores dos parmetros a e b com a ajuda das frmulas: a = n Xi Yi - xi . yi n Xi - (xi) e

b = Y - a X
92

Onde :

n o nmero de observaes

X mdia dos valores de Xi (X = Xi ) n Y mdia dos valores de Yi (Y = Yi ) n Nota: Como estamos fazendo uso de uma amostra para obtermos os valores dos parmetros, o resultado, na realidade, uma estimativa da verdadeira equao de regresso. Sendo assim, escrevemos: Y^ = a X + b

Onde Y^ o Y estimado

A tabela de valores: MATEMTICA (xi) ESTATSTICA (yi) xi yi xi

5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0 =65 Temos assim

6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0 =65

30 72 56 100 30 49 72 12 48 04 =473

25 64 49 100 36 49 81 09 64 04 =481

a = 10 x 473 65 x 65 = 4730 - 4225 = 505 = 0,8632 10 x 481 (65) 4810 - 4225 585 93

Como: X = 65 = 6,5 10 e Y = 56 = 6,5 10

Vem: b = 6,5 0,8632 x 6,5 = 6,5 - 5,6108 = 0,8892,

Donde: a = 0,86 e b = 0,89

Logo:

= 0,86 X + 0,89 Y

Para traarmos a reta no grfico, basta determinar dois de seus pontos: X=0 X=5 Y^ = 0,89 Y^ = 0,86 x 5 + 0,89 = 5,19

Assim temos: yi
10 . . 8 . . 6 . 5,19 . 4 . . 2 . o o o o o o o o o o Y^ = 0,86 X + 0,89

.
0,89

.
2

.
4

.
6

.
8

.
10

xi

94

16.3 ANLISE DE REGRESSO


Quando recorremos a uma reta de mnimos quadrados, precisamos saber qual a preciso dos valores obtidos para a e b na equao de mnimos quadrados? Qual a preciso da estimativa Y^?

Os valores calculados so apenas estimativas baseadas em dados amostrais e, se fundamentarmos nosso trabalho em outra amostra de mesmo tamanho n o mtodo de mnimo quadrado poderia gerar valores diferentes de para a poderia gerar valores para Y^ diferentes. e b , como tambm

Para prever essas diferenas possvel estabelecermos um intervalo para o qual possamos afirmar, com certo grau de confiana valores de Y^.

O clculo desses intervalos segue os mesmos raciocnios visto anteriormente para as mdias , propores, varincias e desvio padro, e analisaremos a seguir.

95

EXERCICIOS: E-9
1- Aps 6 horas de treinamento, um cachorro cometeu 5 erros em uma exposio canina, outro cachorro aps 12 horas cometeu 6 erros, e finalmente um outro

cachorro, apos 18 horas, cometeu apenas 1 erro. Denotando por x o nmero de horas de treinamento e por y o nmero de erros cometidos, qual das duas retas se ajusta melhor aos trs pontos, no sentido de mnimos quadrados?

a- y = 10 - x b- y = 8 1/3

2- A tabela a seguir mostra quantas semanas seis pessoas trabalharam em um posto de inspeo de automveis e quantos carros foram inspecionados entre 12 e 14 horas, em determinado dia:

Nmero de semanas Trabalhadas

Nmero de carros inspecionados

2 7 9 1 5 12

13 21 23 14 15 21

Para esses dados temos:

x = 36, x = 304, y = 107, y = 2001 e 3040

x.y =721

a- Estabelea a equao da reta de mnimos quadrados que permite predizermos y em termos de x.

b- Com o auxilio da parte a, estime quantos carros uma pessoa que venha trabalhando no posto de inspeo ha 8 semanas poder inspecionar? 96

3- Os dados abaixo se referem ao resduo de cloro em uma piscina em vrios momentos, aps ter sido tratada com produtos qumicos:

X Nmero de Horas

Y Resduo de cloro (P.P.M.)

0 2 4 6 8 10 12

2,2 1,8 1,5 1,4 1,1 1,1 0,9

Para esses dados temos:

x = 42, x = 364, y = 10, y = 15,52 e

x .y =48,6

A leitura de zero horas foi feita imediatamente aps completado o tratamento qumico.

a- Ajuste uma reta de mnimos quadrados que nos permita predizer o resduo de cloro em termos do nmero de horas aps a piscina ter sido tratada com produtos qumicos .

b- Com a equao da reta de mnimos quadrados, estime o resduo de cloro na piscina 5 horas aps ter sido tratada.

c- Com a equao da reta de mnimos quadrados, estime o resduo de cloro na piscina 8 horas aps ter sido tratada. Por que razo o resultado diverge do valor 1,1 da tabela.

97

BIBLIOGRAFIA
BIBLIOGRAFIA BSICA

FREUND, John E. e SIMON, Gary A. Estatstica aplicada economia, administrao e contabilidade. Porto Alegre: Bookman, 2000. TRIOLA, Mrio F. Introduo estatstica. Rio de Janeiro: LTC, 1999.

BIBLIOGRAFIA COMPLEMENTAR

KUME, Hitoshi, Mtodos Estatsticos para a Melhoria da Qualidade. So Paulo:Gente,1993. RAMOS A.W., CEP para Processos Contnuos e em Bateladas. So Paulo:E.Blucher, 2000. BUSSAB, Wilton O e MORETTIN, Pedro A. Estatstica bsica. So Paulo: Saraiva,2002. DOWNING Douglas e CLARK Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2000. MILONE, Giuseppe e ANGELINI, Flvio. Estatstica aplicada. So Paulo: Atlas, 1995. KAZMIER, L.B. Estatstica aplicada Economia e Administrao. So Paulo: McGraw-Hill, 1982. SPIEGEL, Murray R. Estatstica. So Paulo: Makron Books, 1993. (519.5 S734e)

98

You might also like