Professional Documents
Culture Documents
NDICE
1.0 DEFINIES DE ESTATSTICA ......................................................................... 1 1.1 POR QUE ESTUDAR ESTATSTICA? ......................................................... 1 1.2 A NATUREZA DOS DADOS ........................................................................ 1 1.3 TIPOS DE DADOS ....................................................................................... 2 1.4 TIPOS DE LEVANTAMENTOS .................................................................... 3 1.5 PLANEJAMENTO DE EXPERIMENTOS ..................................................... 4 EXERCCIOS: E-1...................................................................................................... 5 2.0 AMOSTRAGEM ................................................................................................... 6 2.1 DEFINIES................................................................................................ 6 2.2 AMOSTRAGEM ALEATRIA BASEADA EM NMEROS ALEATRIOS (RANDMICOS) ................................................................................................ 8 2.3 OUTROS PLANOS DE AMOSTRAGEM ...................................................... 9 2.4 AMOSTRAGEM POR JULGAMENTO (NO PROBABILSTICA) ................ 9 2.5 AMOSTRAGEM PROBABILSTICA ........................................................... 10 2.5.1 AMOSTRAGEM SISTEMTICA............................................................... 10 2.5.2 AMOSTRAGEM ESTRATIFICADA ......................................................... 11 2.5.3 AMOSTRAGEM POR CONGLOMERADO............................................. 11 RESUMO.......................................................................................................... 11 EXERCICIOS: E-2.................................................................................................... 13 3.0 ANLISE EXPLORATRIA DE DADOS........................................................... 14 4.0 DISTRIBUIO DE FREQNCIA ................................................................... 15 5.0 REPRESENTAO GRFICA DAS VARIVEIS QUANTITATIVAS ............... 19
6.0 APRESENTAO GRFICA ............................................................................ 20 6.1 DIAGRAMA DE ORDENADAS................................................................... 20 6.2 DIAGRAMA DE BARRAS........................................................................... 21 6.3 DIAGRAMA DE CRCULOS ....................................................................... 22 6.4 DIAGRAMA DE SETORES CIRCULARES ................................................ 23 6.5 DIAGRAMA LINEAR .................................................................................. 25
6.6 O PICTOGRAMA ................................................................................................ 26 7.0 MONTAGEM DE UMA DISTRIBUIO DE FREQNCIAS ........................... 27 7.1 HISTOGRAMA E POLIGONO DAS FREQNCIAS ................................. 31 7.2 HISTOGRAMA E POLIGONO DAS FREQNCIAS RELATIVAS ............ 32 7.3 POLIGONO DE FREQNCIA ACUMULADA OU OGIVA ........................ 33 7.4 POLIGONO DA FREQNCIA ACUMULADA RELATIVA ........................ 34 8.0 TIPOS DE DISTRIBUIO ................................................................................ 35 8.1 DISTRIBUIO SIMTRICA OU EM FORMA DE SINO ........................... 35 8.2 DISTRIBUIO ASSIMTRICA................................................................. 36 8.3 DISTRIBUIO MODAL, AMODAL, BIMODAL E MULTIMODAL ............. 37 8.4 APRESENTAO TIPO RAMO-E-FOLHAS .............................................. 38 9.0 MEDIDAS DE POSIO OU DE TENDNCIA CENTRAL ............................... 40 9.1 MDIA ARITMTICA SIMPLES ................................................................. 40 9.2 MDIA ARITMTICA PONDERADA .......................................................... 41 9.3 MEDIANA (x) .............................................................................................. 41 9.4 MODA (
) ............................................................................................... 43 x
10.0 MEDIDAS DE VARIABILIDADE (DISPERSO).............................................. 44 10.1 AMPLITUDE TOTAL (R.T.) ...................................................................... 44 10.2 DESVIO PADRO .................................................................................... 45 10.2.1 DESVIO PADRO AMOSTRAL (S) ....................................................... 45 10.2.2 DESVIO PADRO DA POPULAO () ............................................... 46 10.2.3 REPRESENTAO GRFICA DO DESVIO PADRO.......................... 46 10.2.4 SISTEMATIZAO PARA O CLCULO ................................................ 47 10.3 VARINCIA .............................................................................................. 48 11.0 DISTRIBUIO NORMAL .............................................................................. 49 EXERCCIOS: E-3.................................................................................................... 55 12.0 PROBABILIDADE............................................................................................ 56 12.1 ESPAO AMOSTRAL E EVENTOS......................................................... 57 12.2 TRS ORIGENS DA PROBABILIDADE ................................................... 58
12.3 A MATEMTICA DA PROBABILIDADE ................................................... 59 EXERCCIOS: E-4.................................................................................................... 62 13.0 TECNICAS DE CONTAGEM ........................................................................... 63 13.1 O PRINCIPIO DA MULTIPLICAO ........................................................ 64 13.2 PERMUTAO, ARRANJO E COMBINAO. ....................................... 65 13.3 REGRAS DE CONTAGEM ....................................................................... 68 EXERCCIOS: E-5.................................................................................................... 69 14.0 DISTRIBUIO DE PROBABILIDADES......................................................... 70 14.1 DISTRIBUIO BINOMIAL ...................................................................... 72 EXERCICIOS: E-6.................................................................................................... 76 14.2 DISTRIBUIO DE POISSON......................................................................... 77 EXERCICIOS: E-7.................................................................................................... 79 15.0 CORRELAO ................................................................................................ 80 15.1 INTRODUO ......................................................................................... 80 15.2 RELAO FUNCIONAL E RELAO ESTATSTICA ............................. 80 15.3 DIAGRAMA DE DISPERSO................................................................... 81 15.4 CORRELAO LINEAR.......................................................................... 82 15.5 COEFICIENTE DE CORRELAO LINEAR........................................... 85 15.6 CUDADOS COM OS ERROS COM A INTERPLETAO DE CORRELAO ................................................................................................ 87 EXERCICIOS: E-8.................................................................................................... 88 16.0 REGRESSO LINEAR .................................................................................... 91 16.1 AJUSTAMENTO DE CURVAS ................................................................. 91 16.2 MTODO DOS MNIMOS QUADRADOS ................................................ 92 16.3 ANLISE DE REGRESSO..................................................................... 95 EXERCCIOS E-9 ......................................................................................................98
ESTATSTICA
1.0 DEFINIES DE ESTATSTICA
Etimologicamente a palavra estatstica vem de status expresso latina que significa, sensu lato, o estudo do estado. Os primeiros a empregarem esse termo foram os Alemes seguidos pela Itlia, Frana, Inglaterra e ainda por outros paises. Para Levasseur a estatstica : O estudo numrico dos fatos sociais.
Yule define estatstica como: Dados quantitativos afetados marcadamente por uma multiplicidade de causas. Uma definio mais usual nos dias de hoje seria: Um mtodo cientifico que permite a anlise, em bases probabilstica, de dados coligados e condensados
Ou ainda podemos dizer que : A coleta, o processamento, a interpretao e a apresentao de dados numricos que pertencem ao domnio da estatstica 1.1 POR QUE ESTUDAR ESTATSTICA?
Por hora podemos dizer que o raciocnio estatstico largamente utilizado no governo e na administrao; assim, possvel que, no futuro, um empregador venha a contratar ou promover um profissional por causa do seu conhecimento de estatstica.
O dados estatsticos constituem a matria prima das pesquisas estatsticas, eles surgem quando se fazem mensuraes ou se restringem observaes. Estatstica descritiva: Trata-se da descrio e resumo dos dados.
Modelo: So verses simplificadas (Abstraes) de algum problema ou situao real. 1.3 TIPOS DE DADOS
Quantitativos Contnuos Discretos Qualitativos Nominais Por postos As variveis contnuas podem assumir qualquer valor num intervalo contnuo. Os dados referentes a tais variveis dizem-se dados contnuos. Ex. Peso, comprimento, espessura onde usa-se a mensurao. As variveis discretas assumem valores inteiros de dados discretos so os resultados da contagem de nmeros de itens. Ex. alunos da sala de aula, nmero de defeitos num carro novo, acidentes de uma fbrica. Os dados nominais surgem quando se definem categorias e se conta o nmero de observaes pertencentes a cada categoria. Ex.: atuam dentro das variveis Qualitativas as quais devemos associar a valores numricos para que possamos processar estatisticamente. Ex.: cor dos olhos (azuis, verdes, castanhos), sexo (masculino e feminino), desempenho (excelente, bom, sofrvel, mau) etc. Os dados por postos consistem de valores relativos atribudos para denotar ordem: primeiro, segundo, terceiro, quarto, etc. Ex.: concurso de beleza se classificam em 1,2,3 colocadas.
TIPOS DE DADOS
POPULAES CONTNUOS DISCRETOS NOMINAIS POR POSTO
PERIDICOS: Acontecem ciclicamente. Exemplo o rescenceamento, feito no Brasil a cada dez anos.
OCASIONAIS: So aqueles realizados sem a preocupao de continuidade ou periodicidade preestabelecidas, exemplos a maioria dos trabalhos de investigao cientifica. DADOS PRIMRIOS: Quando o investigador no encontra dados publicados adequados ao seu estudo, parte para a realizao de um inqurito, isto , os dados so levantados diretamente na populao no momento da investigao.
DADOS SECUNDRIOS: Quando o investigador para verificar as sua hipteses de trabalho utiliza- se de dados j existentes, arquivados, registrados ou publicados. Podem ser at mesmo dados gerados pelo Departamento de Estatsticas de Populaes da Fundao Instituto Brasileiro de Geografia e Estatstica (IBGE).
3. Coligir os dados
5. Relatar as concluses
EXERCCIOS: E-1
1- Identifique os seguintes exemplos em termos de tipos de dados:
a- 17 gramas
b- 3 certos, 2 errados
c- 25 segundos
d- 25 alunos na classe
e- tamanho de camisa
f- Km/litro
g- O mais aprazvel
h- O mais lento
i- 5 acidentes no ms de maio
2- Responder as perguntas:
2.0 AMOSTRAGEM
AMOSTRAGEM VERSUS SENSO: Uma amostra usualmente envolve o estudo de uma parcela dos tens de uma populao, enquanto que o censo requer o estudo de todos os tens. Restries ao Censo: Custo Populaes infinitas Dificuldade nos critrios (Preciso) Produtos de testes Destrutivos (fsforos, munies) Tempo despendido (atualizao) Tipos de informaes mais restritivas
Casos de excesso: Populaes pequenas Amostras grandes em relao a populao Se exige preciso completa Se j so disponveis informaes completas
2.1 DEFINIES
POPULAO: o conjunto de indivduos (ou objetos), que tem pelo menos uma varivel comum observvel. AMOSTRA: qualquer sub-conjunto da populao extrada para se realizar estudos estatsticos
. POPULAO
AMOSTRA
A estatstica indutiva a cincia que busca tirar concluses probabilsticas sobre a populao, com base em resultados verificados em amostras retiradas dessa populao. Entretanto no basta que saibamos descrever convenientemente os dados da amostra para que possamos executar, com xito, um trabalho estatstico completo. Antes de tudo preciso garantir que a amostra ou amostras que sero utilizadas sejam obtidas por processos adequados. - O que necessrio garantir, em suma, que a amostra seja Representativa da populao.
Dois aspectos nas amostras so fundamentais, e que do a sua representatividade em termos: - Qualitativos: Amostras que representem todas as sub-populaes, quando for o caso. - Quantitativos: Que possua quantidade de dados suficientes para representar a Populao.
Na indstria onde amostras so freqentemente retiradas para efeito de Controle da Qualidade dos produtos e materiais, em geral os problemas de amostragem so mais simples de resolver. Por outro lado, em pesquisas sociais, econmicas ou de opinio, a complexibilidade dos problemas de amostragem so normalmente bastante grandes. - Interferncia estatstica envolve a formulao de certos julgamentos sobre um todo aps examinar apenas uma parte, ou a amostra, dele.
A probabilidade e a amostragem esto estreitamente correlacionadas e juntas formam o fundamento da teoria de interferncia. - Amostragem o ato de retirar amostra, isto , a ao.
Amostragem aleatria permite estimar o valor do erro possvel, isto , dizer quo prxima est amostra da populao, em termos de representatividade.
Amostragem no aleatria no apresenta esta caracterstica. H vrios mtodos para extrair uma amostra talvez o mais importante seja a amostragem aleatria de modo geral, a amostragem aleatria exige que cada elemento tenha a mesma oportunidade de ser includo na amostra.
Nas Populaes discretas uma amostra aleatria aquela em que cada item da populao tem a mesma chance de ser includo na amostra. Nas Populaes contnuas, uma amostra aleatria aquela em que a probabilidade de incluir na amostra qualquer intervalo de valores igual percentagem da populao que est naquele intervalo.
Populaes finitas: quando, temos constitudo por nmeros finitos, ou fixos de elementos, medidas ou observaes. Ex.: Peso bruto de 3000 latas de tinta de um certo lote de produo.
Populaes infinitas: so aquelas que contm, pelo menos hipoteticamente, um nmero infinito de elementos. Ex. Produo de carros V.W. produzidos no Brasil e a serem produzidos (universo volkswagem), processo probabilstico.
As tabelas de nmeros aleatrios contm os dez algarismos 0,1,2,3,4,......,9. Esses nmeros podem ser lidos isoladamente ou em grupos; podem ser lidos em qualquer ordem. A probabilidade de qualquer algarismo aparecer em qualquer ponto 1/10. Portanto todas as combinaes so igualmente provveis.
Conceitualmente, poderamos construir uma tabela de nmeros aleatrios numerando dez bolinhas com os algarismos de 0 a 9 , colocando-as numa urna, misturando bem e extraindo uma de cada vez, com reposio, anotando os valores obtidos. A titulo de ilustrao poderamos querer selecionar aleatoriamente 15 clientes de uma lista de 830 de um grande magazine, a finalidade poderia ser : Estimar a freqncia de compras; Determinar o valor mdio de cada compra; Registrar as queixas contra o sistema.
Os planos de amostragem probabilstica so delineados de tal modo que se conhece a probabilidade de todas as combinaes amostrais possveis. Em razo disso, pode-se determinar a quantidade de varivel amostral numa amostra
aleatria e uma estimativa do erro amostral. A amostragem aleatria um exemplo da amostragem probabilstica.
A amostragem no probabilstica a amostragem subjetiva, ou por julgamento, onde a variabilidade amostral no pode ser estabelecida com preciso, conseqentemente, no possvel nenhuma estimativa do erro amostral.
Exemplo: Uma equipe mdica deve trabalhar com pacientes que se apresentem com voluntrios para testar um novo medicamento. Nenhum desses grupos podem ser considerados como uma amostra aleatria do pblico em geral, e seria perigoso tentar tirar concluses gerais com base em tal estudo. Todavia, os resultados poderiam proporcionar uma base para a elaborao de um plano de amostragem aleatrio para validar os resultados bsicos. Os perigos inerentes pesquisa mdica , bem como outro tipo de pesquisa, freqentemente obrigam a limitar a pesquisa inicial a um pequeno grupo de voluntrios.
Exemplo: A aplicao de hormnios em mulheres na menopausa, aps um perodo de tempo notou-se o aumento das chances de adquirirem cncer de mama, doenas cardacas etc.
K= N n
ento K=200/10 = 20
Significa que ser escolhido um item a cada seqncia de 20 de uma lista. Para iniciar pode-se usar uma tabela de nmeros aleatrios de 0 a 9 para iniciar os grupos. Por exemplo se der o 9, escolhemos o 9, 29, 39 ,49 , etc.
10
2.5.2 AMOSTRAGEM ESTRATIFICADA Pressupe a diviso da populao em sub-grupos Homogneos (Estratos), procedendo ento a amostragem de cada sub-grupo. Ex.: Para se fazer o inventrio do estoque, comum termos 10% dos itens representarem cerca de 60% do valor total em quanto que os 90% restantes representam s 40% do valor total (Curva A,B,C; Pareto; regra 80/20). 2.5.3 AMOSTRAGEM POR CONGLOMERADO
Pressupe a disposio dos itens de uma populao em sub-grupos heterogneos (sub-populaes) representativos da populao global. conglomerado pode ser encarado como uma minipopulao. Ex.: Estudo pr-eleitoral para medir a preferncia dos eleitores. (Sub-grupos: sexo, educao, faixa etria, poder aquisitivo, regio da habitao,etc). Neste caso cada
RESUMO
A finalidade da amostra permitir fazer interferncia sobre a populao aps inspeo de apenas parte dela. Fatores com custo, ensaios destrutivos e populaes infinitas, tornam a amostragem prefervel a um estudo completo (Censo) da populao.
Naturalmente espera-se que a amostra seja representativa da populao da qual foi extrada.
Para populaes discretas o termo Aleatrio significa que cada item da populao tem a mesma chance de participar na amostra. No caso de populaes contnuas, significa que a probabilidade de incluir qualquer valor de um dado intervalo de valores igual proporo com valores naquele intervalo. 11
- Utilizando-se uma tabela de nmeros aleatrios para proceder seleo de uma lista. Em certas condies, podem ser mais eficientes variantes da amostragem aleatria simples, tais como amostragem sistemtica (peridica), estratificada (sub-grupos Homogneos), ou amostragem por aglomerados (sub-grupos convenientes e heterogneos). A principal vantagem da amostragem aleatria que se pode determinar o grau de variabilidade amostral, o que essencial na interferncia estatstica. amostragem no probabilstica falta esta caracterstica.
12
4- Descreva os vrios mtodos de obteno de uma amostra aleatria. Como escolher o mtodo a ser usado em determinada situao?
a. contnua
b. Discreta
13
De modo geral, podemos dizer que a essncia da cincia a observao e que seu objetivo bsico a interferncia. Esta parte da metodologia da cincia que tem por objetivos a coleta, reduo, anlise e modelagem dos dados, a partir do que, finalmente, faz-se a interferncia para uma populao, da qual os dados (amostras) foram obtidos.
14
Quando se estuda uma varivel, o maior interesse do pesquisador conhecer a distribuio dessa varivel atravs das possveis realizaes (valores) da mesma.
Exemplo 1: Dados relativos a uma amostra de 36 funcionrios de uma populao de 2000 funcionrios da empresa Milsa. Ver resultados anotados na tabela abaixo.
15
TABELA 1
N ESTADO CIVIL 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 solteiro casado casado solteiro solteiro casado solteiro solteiro casado solteiro casado solteiro solteiro casado casado solteiro casado casado solteiro solteiro casado solteiro solteiro casado casado casado solteiro casado casado casado solteiro casado casado solteiro casado casado 1 grau 2 grau 2 grau 2 grau superior 2 grau superior superior 2 grau superior 1 grau superior 2 grau 2 grau 1 grau superior 2 grau 2 grau 2 grau 1 grau 2 grau 2 grau 2 grau 1 grau 2 grau 1 grau 1 grau 1 grau 1 grau 2 grau 2 grau 2 grau GRAU DE N DE SALRIO IDADE REGIO DE INSTRUO FILHOS (X SAL. MIN) ANOS MESES PROCEDNCIA 1 grau 1 grau 1 grau 2 grau --1 2 ----0 ----1 --2 ----3 0 --1 2 ----1 ----0 2 2 --0 5 2 --1 3 --2 3 4 4,56 5,25 5,73 6,26 6,66 6,86 7,39 7,59 7,44 8,12 8,46 8,74 8,95 9,13 9,35 9,77 9,8 10,53 10,76 11,06 11,59 12,OO 12,79 13,23 13,6 13,85 14,69 14,71 15,99 16,22 16,61 17,26 18,75 19,4O 23,3O 26 32 36 20 40 28 41 43 34 23 33 27 37 44 30 38 31 39 25 37 30 34 41 26 32 35 46 29 40 35 31 36 43 33 48 42 03 10 05 10 07 00 00 04 10 06 06 11 05 02 05 08 07 07 08 04 09 02 00 01 05 00 07 08 06 10 05 04 07 07 11 02 interior capital capital outro outro interior interior capital capital outro interior capital outro outro interior outro capital outro interior interior outro capital outro outro interior outro outro interior interior capital outro interior capital capital capital interior
16
Exemplo 2: Freqncia e percentagem da amostra de 36 empregados da empresa Milsa segundo o grau de instruo.
TABELA 2
GRAU DE INSTRUO TABULAO FRQNCIA FREQ. RELATIVA F FR %
1 grau
IIIIIIIIIIII
12
33,33
2 grau
IIIIIIIIIIIIIIIIII
18
50,OO
superior I I I I I I
TOTAL
16,67
36
100
Exemplo 3: Freqncia e percentagem dos 2000 empregados (Populao) da empresa Milsa (Censo x Probabilidade)
TABELA 3
GRAU DE INSTRUO FRQNCIA F FREQ. RELATIVA FR % Censo FREQ. RELATIVA FR % Provvel
1 grau
650
32,50
33,33
2 grau
1020
51,00
50,OO
superior
TOTAL
330
15,50
16,67
2000
100
100
17
TABELA 4
CLASSE DE SALRIOS FRQNCIA FREQ. RELATIVA F FR %
4 I------- 8
10
27,78
8 I------- 12
12
33,33
12 I------- 16
22.22
16 I------- 20
13,89
20 I------- 24
2,78
TOTAL
36
100
TABELA 5
NMERO DE FILHOS Xi FREQNCIA FREQ. RELATIVA F FR %
20
25
35
15
TOTAL
20
100
EXERCCIO - Representar a distribuicao de frequencia para Idade e a Regiao de procedencia dos funcionarios da Empresa Milsa.
18
19
freqncias
12
10
Salrios 20
freqncias
12
10
21
. f = . r , ou seja,
r = .f
Se chamar
de `, tem-se
: r = `. f
portanto, os
freqncias das modalidades da varivel. Assim se quisermos representar graficamente a distribuio da tabela 1.4, os raios do crculo devero ser:
r3 =
22.22. `=
r4 = 13,89 . `=
3.72. `
3,72. 3 = 11,1 mm
r5 =
2,78 . ` =
2,7 %
13,89 %
22,22
27,78 %
33,33 %
22
.f = r. a
a =
.f r
Se chamarmos
360 = `. F
ou seja: `= 360
Portanto a = 360. f
120 50 10
100
.
80
33% 22%
28%
14% 3%
24
12
10
x 8
6 x 4
2 x
salrios
25
6.6 O PICTOGRAMA
A figura abaixo mostra um exemplo de apresentao pictogrfica de dados temporais (comumente encontrada em jornais, revistas e relatrios de vrios tipos), no caso abaixo representa a populao dos Estados Unidos.
1920 1930
Cada smbolo
= 10 milhes de pessoas
26
TABELA 6
AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO AMOSTRA PESO 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 207 213 210 215 201 210 212 204 209 212 215 216 221 219 222 225 215 218 213 216 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 220 204 213 211 214 217 224 211 220 209 214 208 217 214 209 212 208 215 211 216 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 210 214 219 215 217 213 218 214 215 212 221 211 218 205 220 203 216 222 206 221 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 210 220 213 217 214 219 214 215 223 217 213 218 207 210 208 214 211 205 215 207 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 217 211 213 218 213 216 218 216 206 212 207 213 215 212 223 210 226 224 214 215
O agrupamento destes dados em sub-grupos feito com base nos seguintes conceitos: 27
Amplitude total (R.T.): a diferena entre a medida mxima e a medida mnima. No caso da amostra de pacotes de manteiga acima, temos: R.T. = 226 201 = 25 gramas Nmero de classes (d) : o nmero de divises que estipulamos para a Amplitude Total. Normalmente pode-se usar d = n onde n= nmero de itens na amostra para o
exerccio temos d = 100 10 classes, porem deve-se utilizar sempre que possvel nmero impar de classes no caso 9 classes.
Amplitude do intervalo de classe (R.I.): a diferena entre os valores mximos e mnimos de cada classe. Amplitude intervalo de cada classe R.I . = R.T Nmero de Classes No caso do exerccio temos:
Amplitude intervalo de cada classe R.I . = 25 = 2,7 aprox. 3 7 RI adotado = 3 RT adotado = 27 diferenca 2 comeca uma antes do menor e termina
As classes devem ser mutuamente exclusivas, para que no haja duvida na localizao dos valores das variveis, podemos dai utilizar as seguintes simbologias para os intervalos: 0 ----I 10 intervalo aberto & fechado, para significar que o intervalo compreende os valores da varivel maiores do que 0 (excludo) e at 10 (inclusive);
0 I---- 10 intervalo fechado & aberto, para significar que compreende os valores da varivel a partir de 0 (inclusive) e at 10 (exclusive); 0 ----- 10 Intervalo aberto & aberto, para significar que compreende valores maiores do que 0 e menores do que 10.
28
0 I----I 10 intervalo fechado & fechado, para significar que compreende os valores da varivel a partir de 0 (inclusive) e at 10 (inclusive).
TABELA 7
TABULAO
RELATIVA %
ACUM.
ACUM. REL.%
1 2
2 6
2 6
2 8
2 8
3 4 5
10 18 28
10 18 28
18 36 64
18 36 64
6 7 8 9
215 ---I 218 I I I I I I I I I I I I I I I I I I 218 ---I 221 I I I I I I I I I I 221 ---I 224 I I I I I I 224 ---I 227 I I
18 10 6 2
18 10 6 2
82 92 98 100
82 92 98 100
100
100%
29
Onde: Freqncia (F) = o numero de vezes que as medidas ocorrem no intervalo de classes
Freqncia relativa (FR) = a percentagem da freqncia de cada classe em relao ao total de elementos. FR = F d x 100 N Freqncia acumulada (FA) = considerado. Fa5 = F1+ F2 + F3 + F3 + F5 2+ 6+ 10+ 18+ 28 = 64 a soma das freqncias at o intervalo de classe
Ex.
Freqncia acumulada relativa (FAR) = a soma das freqncias relativas at o intervalo considerado
30
freqncias
28 POLIGONO DE FREQNCIAS
21
14
CLASSES
31
%
28% POLIGONO DE FREQNCIA RELATIVA
21%
14%
7%
0 1 2 3 4 5 6 7 8 9 CLASSES
32
60
40
20
01
CLASSES
33
%
100 %
F.AC REL.
80 %
60 %
40 %
20 %
0 %1
CLASSES
34
A) Normal
B) Alongada
35
C) Achatada
A) Assimtrica Positiva
36
B) Assimtrica Negativa
A) DISTRIBUIO MODAL Quando a distribuio tem freqncia mxima ela denominada modal.
mo
37
mo
mo
mo
mo
mo
38
61
52
64
84
35
57
58
95
82
64
50
53
103
40
62
77
78
66
60
41
58
92
51
64
71
75
89
37
54
67
59
79
80
73
49
71
97
62
68
53
43
80
75
70
45
91
50
64
56
86
SOLUO:
F F.A. 2
12
19
11
30
39
45
49
10
50
39
MEDIANA;
MODA.
Dada uma distribuio de freqncias, chama-se de mdia aritmtica desta destituio, e representa-se por variveis n. a soma de todos os valores da varivel, dividida pelo nmero de
x
n
n
Sendo:
x
i= 1
8 + 3 + 5 + 12 + 10 = 38 = 7,6 5 5
40
K xi .fi
i= 1
=
K
x
i= 1
fi
x = nmeros
Nmeros Freqncias
x = 5, 8, 6, 2 f = 3, 4, 2, 1
= 57 = 5,7 10
Se ordenarmos uma seqncia de nmeros do menor para o maior e se a quantidade desses nmeros for impar, ento a mediana ser o valor do meio, ou a mdia dos dois valores do meio caso a quantidade de nmeros seja par. O smbolo que usamos para representar a mediana x l-se x til.
No caso de calculo da mediana quando estamos trabalhando com distribuio de freqncia determinamos o valor mais provvel dessa distribuio a partir de:
FA 2
41
{ n+1 }
2
mpar temos um nmero inteiro e d a posio da mediana; Exemplo: Determine a posio da mediana para a) n=15 b) n=45 c)n=88
a)
b)
n+1 = 45+1 = 23, e a mediana o valor do 23 elemento; 2 2 88 = 44 e a mediana o valor correspondente ao valor do 44elemento. 2
c) n 2
No caso do exerccio da distribuio dos 100 valores de peso de pacotes de manteiga temos: X = n 2 = 100 2 = 50, e a mediana o valor do 50 elemento
50 valor
FA
2 203
8 206
18 209
36 212
64 215
82 218
92 221
98 224
100 227
X 200
50
36 212 64 215
(215 212)
42
9.4 MODA (
) x
Em um conjunto de nmeros a moda o valor que ocorre com maior freqncia, isto , o valor mais comum. Exemplos: 1) 2, 2, 3, 7, 8, 8, 8, 9, 10 moda=8 2) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
Para o exemplo do exerccio das distribuies de freqncias dos pacotes de manteiga temos que a moda o ponto mdio da classe modal, localiza-se a classe modal como sendo a classe com maior freqncia e em seguida determina-se seu ponto mdio.
43
xx x x x x xxx xxx xx x x
a) pequena disperso
xx x x xxx x x x x x x x x xx x x xxx x x x xx x x x x xx
b) grande disperso
a medida mais simples de disperso. a diferena entre o maior e o menor valor das observaes. R.T. = Xmax Xmin Embora exista simplicidade de clculo, existem duas restries ao seu generalizado:
1- Utiliza apenas uma parcela das informaes contidas nas observaes. O seu valor no se modifica mesmo que os valores das observaes variem, desde que conservem os seus valores Mximo e mnimo.
2- Depende do nmero de observaes na amostra. Em geral o valor da amplitude cresce quando cresce o tamanho da amostra. 44
I x max.
X min.
I R.T. = Grande
I X max.
S=
(X1-
) + (X2-
) + (X3n
) + ..... +(Xn-
45
( Xi n
O desvio padro da populao representa a o grau de disperso da populao em torno da mdia representado por , tambm representa a distncia do ponto de inflexo, e dado pela expresso:
(X1-
) + (X2-
) + (X3n-1
) + ..... +(Xn-
( Xi n-1
46
Para sistematizar o clculo do desvio padro de uma amostra utilizado o seguinte procedimento:
observaes medidas
Xi
Xi -
(Xi -
1 2 3
X1 X2 X3
X1 X2 X3 -
) ) )
. . .
n
. . .
Xn Xn -
. . .
( Xn -
. . .
)
(Xi-
3-Aplicam-se as frmulas:
S=
( Xi n
( Xi n-1
47
10.3 VARINCIA
Varincia da populao a soma dos quadrados dos desvios de cada observao em relao mdia de x , divide-se por n 1. Indica-se a Varincia da Populao por . Podemos fazer a mesma analogia com a Varincia da Amostra dada por S.
( Xi
S=
i=1
( Xi
=
i=1
n-1
Como medida de disperso, a Varincia tem a desvantagem de apresentar unidade de medida igual ao quadrado da unidade de medida dos dados. Se os dados esto em metros, a Varincia fica em metros quadrados. O desvio padro por sua vez, fica com valor na mesma da unidade da varivel.
48
F (x)
x- 3
x- 2
x- 1
x +1 x+ 2 x+ 3
Equao da Funo de Probabilidade A equao da funo de probabilidade dada pela expresso: - ( x - ) 2 f(x) = 1 2
- < x < +
49
- a varivel x obedecer a uma Distribuio Normal, se a probabilidade de que um valor x seja menor ou igual a outro xo for: - ( x - ) x0 P( x < x0 ) = f(x0) = 1 2 - 2
dx
xo.
-
X0
Portanto:
A probabilidade de ocorrncia de um valor menor ou igual rea abaixo da curva, entre os valores -
xo .
Os valores = 3,1416 e
e ( nmero
c- A rea total sob a curva normal igual a 1, pela prpria equao da probabilidade. d- Em virtude da simetria as reas direita e esquerda do valor so iguais
Z=
e como unidade de
escalados z e o desvio padro , teremos transformado a expresso da funo das probabilidades na distribuio normal reduzida:
- z
2 f(z)= 1 2
51
- z
z f(z)= 1 2 2
e
-
dz
As reas sob a curva permanecem as mesmas, mas agora podem ser tabuladas em funo dos valores de Z (Ver figura abaixo, eixo dos Z). Basta construir a tbua das reas para os valores I(z), na tbua 1.
Por exemplo, a rea desde Z=0, at Z= 1,0 I(1,0) = 0,3413 ou 34,13% da rea total da curva; conseqentemente, dentro do intervalo 1 temos 68,26% da rea total da curva. Se procurarmos a probabilidade de encontrarmos um valor de x dentro do intervalo 0,95 onde a media, o desvio padro da populao, teremos:
P(- Z0 < Z < Z0) = P ( 0,95 < Z < + 0,95 ) Iz1 = 0,3289 It= 0,6578 ou 65,78%.
Apresentamos na tabela abaixo alguns dos mais importantes intervalos de distribuio normal para aplicaes em exerccios de probabilidade na curva normal.
valores de z e em seguida construir uma tabela com resultados das integrais, que corresponde rea sob a curva xo intervalo de 0 a Z0 identificada por Iz0.
52
F (x)
x- 3
x- 2
x- 1
x +1
x+ 2
x+ 3
-3
-2
-1
Transformao de X em Z
Xo
Z=
X -
Zo
+ 1 + 2 + 3 - 1 - 2 - 3 - + 1- + 2- + 3- -- - 2 - - 3 -
0 1 2 3 -1 -2 -3
53
I Zo
Zo
Z0
Z0
Z0
Z0
Z0
Z0
0,00 0,0000 0,60 0,2257 1,20 0,3849 1,80 0,4641 2,40 0,4918 3,00 0,4987 0,05 0,0199 0,65 0,2422 1,25 0,3944 1,85 0,4678 2,45 0,4929 3,05 0,4989 0,10 0,0398 0,70 0,2580 1,30 0,4032 1,90 0,4713 2,50 0,4938 3,10 0,4990 0,15 0,0596 0,75 0,2734 1,35 0,4115 1,95 0,4744 2,55 0,4946 3,15 0,4992 0,20 0,0793 0,80 0,2881 1,40 0,4192 2,00 0,4772 2,60 0,4953 3,20 0,4993 0,25 0,0987 0,85 0,3051 1,45 0,4279 2,05 0,4798 2,65 0,4960 3,25 0,4994 0,30 0,1179 0,90 0,3159 1,50 0,4332 2,10 0,4821 2,70 0,4965 3,30 0,4995 0,35 0,1369 0,95 0,3289 1,55 0,4394 2,15 0,4842 2,75 0,4970 3,35 0,4996 0,40 0,1554 1,00 0,3413 1,60 0,4452 2,20 0,4861 2,80 0,4974 3,40 0,4997 0,45 0,1736 1,05 0,3531 1,65 0,4505 2,25 0,4878 2,85 0,4978 3,50 0,4998 0,50 0,1915 1,10 0,3643 1,70 0,4554 2,30 0,4893 2,90 0,4981 3,70 0,4999 0,55 0,2088 1,15 0,3749 1,75 0,4599 2,35 0,4906 2,95 0,4984 3,90 0,5000
54
EXERCCIOS: E-3
1- Trace uma curva normal e sombreie a rea desejada a partir das informaes:
a- rea direita de z=1,0 b- rea da esquerda de z= 1,0 c- rea entre z=0 e z=1,5 d- rea entre z=0 e z= - 2,9 e- rea entre z=1,0 e z= 2,0 f- rea entre z= -2,0 e z= 2,0 g- rea entre z= 2,5 e z=3,0
a- rea esquerda de para Iz = 0,0505 b- rea esquerda de para Iz = 0,0228 c- rea esquerda Iz= 0,4505 e rea da direita Iz = 0,4861
3- Uma distribuio normal tem media 50 e desvio padro 5. Que percentagem da populao estaria provavelmente dentro dos intervalos:
a- P ( x
60)
e- P ( 35 x 45)
4- Suponha uma renda mdia de uma grande comunidade possa ser razoavelmente aproximada por uma distribuio normal com media anual de R$ 10.000,00 e desvio padro de R$ 2.000,00.
a- Que percentagem da populao ter renda superior a R$ 15.000,00? b- Numa amostra de 50 assalariados, quantos podemos esperar que tenham menos de R$ 8.000,00 de renda? 55
12.0 PROBABILIDADE
O problema fundamental da estatstica consiste em lidar com o acaso e a incerteza. Chama-se probabilidade de um acontecimento a razo entre o nmero de casos favorveis ao mesmo e o nmero total de acontecimentos possveis.
Assim quando se considera uma populao limitada de P indivduos, a probabilidade de cada um ser escolhido, ao acaso, de 1/P.
Laplace definiu probabilidade como: O quociente do nmero de casos favorveis sobre o nmero de casos igualmente possveis. Por exemplo, se jogarmos uma moeda no viciada para o ar, de modo geral no podemos afirmar se vai dar cara ou coroa. Porm existem apenas dois eventos possveis: sair cara ou coroa Nesse exemplo existe um caso favorvel a esse evento em dois casos possveis. A P (K) = ou 50%.
Considerando-se cara como sucesso e coroa como fracasso e representando-se o acontecimento favorvel como P e o no favorvel como Q, temos as razes:
P= Sendo Ento
Q=
P+Q = 1 P= (1 - Q) e Q = (1 - P)
A probabilidade de um evento A, denotada por P (A), um nmero de 0 a 1, que indica a chance de ocorrncia do evento A. Quanto mais prxima de 1,00 P(A), maior a chance de ocorrncia do evento A, e quanto mais prxima de Zero, menor a chance de ocorrncia do evento A.
Um evento certo tem probabilidade de 1. As probabilidades podem ser expressas, inclusive por valores decimais, fraes e percentagem como: 20%; 2 em 10; 0,2; ou ainda 1/5. 56
Alm do uso na interpretao de jogos de azar, usa-se ainda a probabilidade mediante determinada combinao de julgamento, experincia ou dados histricos, para predizer Quao Provvel a ocorrncia de determinado evento futuro. H numerosos exemplos de tais situaes no campo dos Negcios e do Governo. A previso da aceitao de um novo produto, o clculo dos custos de produo, a contratao de um novo empregado, o preparo do oramento, a avaliao do impacto de uma reduo de impostos sobre a inflao tudo isso contm algum elemento de Acaso.
Consideremos o experimento que consiste em extrair uma carta de um baralho de 52 cartas. H 52 eventos elementares no espao amostral. Quanto aos eventos podemos classific-los em:
ESPAO AMOSTRAL
COMPLEMENTO
elementos em comum.
57
OBJETIVO
SUBJETIVO
Opinio Pessoal
Os jogos de azar (lanamento de moedas, jogo de dados, extrao de cartas) usualmente apresentam resultados igualmente provveis. Nestes casos temos:
P(cada resultado) =
Se cada carta de um baralho de 52 tem a mesma chance de ser escolhida, ento a probabilidade de extrair cada uma delas de 1/52 : P (A) = 1/52 1,92%.
Da mesma forma a probabilidade de termos uma cara no lanamento de uma moeda ou 50%. O mesmo ocorre com uma coroa, ou seja ou 50%. No caso de um dado temos a probabilidade de dar qualquer nmero: 1,2,3,4,5,6 de 1/6 ou de 16,66%.
58
Por exemplo, a probabilidade de extrao de uma dama, de acordo com esta definio,
P (dama) =
4 damas = 4 52 cartas 52
= 1 = 7,69% 13
P(mpar) =
3 6
ou
50%
da probabilidade de
combinaes de eventos. H duas categorias de eventos de interesse, A e B, no espao amostral. Pode ser necessrio determinar P(A e B), isto ; a probabilidade de ocorrncia de ambos os eventos. Em outras situaes, podemos querer a probabilidade de ocorrncia de A ou B P(A ou B).
Se dois eventos so independentes, ento a probabilidade da ocorrncia de ambos igual ao produto de suas probabilidades individuais: P(A e B) = P(A) . P(B) Exemplo Jogam-se duas moedas equilibradas.Qual a probabilidade da ocorrncia de ambas darem cara? razovel admitir que os resultados das duas moedas sejam independentes um do outro. Alm disso, para moedas equilibradas, P(cara)= . Logo p(cara e cara) ser:
59
1 moeda x
2moeda = ou 25%
Se dois eventos mutuamente excludentes, a probabilidade de ocorrncia de qualquer um deles a soma de suas probabilidades individuais. Para dois eventos A e B temos: P(A ou B) = P(A) + P(B) Exemplo, qual a probabilidade de aparecer cinco ou seis numa jogada de um dado equilibrado? P(cinco) ou P(seis) = P (5) + P(6) = 1 + 1 = 2 = 33,33% 6 6 6
Clculo da Probabilidade da ocorrncia de dois eventos no mutuamente excludente P(A ou B ou ambos ocorrero)
Suponhamos a probabilidade de extrao de uma carta de paus ou um dez de um baralho de 52 cartas . Como possvel que uma carta seja simultaneamente de paus e um dez, os eventos no so mutuamente excludentes. Assim devemos excluir a probabilidade de interseo. Ento temos:
P(paus) = 13 , 52
P(dez)=
4 , P( dez de paus) = 1 52 52
= 13 + 52
4 52
- 1 52
= 16 52
60
NAIPE
PAUS PRETA OUROS VERMELHA K Q J 10 9 8 7 6 5 4 3 2 A COPAS VERMELHA ESPADA PRETA
K Q J 10 9 8 7 6 5 4 3 2 A
K Q J 10 9 8 7 6 5 4 3 2 A
K
Q J 10 9 8 7 6 5 4 3 2 A a carta um dez
Regra de probabilidade
P (A e B), para eventos independentes (Multiplicao) P(A) x P(B)
P (A ou B ou ambos ocorrero), para eventos no mutuamente excludentes P(A) + P(B) - P(A intercepta B)
61
EXERCCIOS: E-4
1- Extrai-se uma s carta de um baralho de 52. Determine a probabilidade de obter: a- Um valete b- Uma figura c- Uma carta vermelha d- Uma carta de ouros e- Um dez de paus f- Um nove vermelho ou um oito preto 2- Relacione os resultados possveis do lance de um s dado. Ache a probabilidade e adicione-as. 3- Joga-se uma vez um dado equilibrado; determine a probabilidade de obter: a- um seis b- cinco, seis ou sete c- um nmero par d- um nmero menor que quatro 4- Doze fichas so numeradas de 0 a 12 e colocadas numa urna. Escolhida uma aleatoriamente, determine a probabilidade de sair: a- o nmero 3 b- um nmero impar c- um nmero menor que quatro d- o nmero dez 5- Joga-se um par de dados equilibrados: a- Qual a probabilidade de ambas as faces serem seis? b- Qual a probabilidade de ambas as faces serem dois? c- Qual a probabilidade de ambas as faces serem pares? 6- Sejam P(A) = 0,30, P(B) = 0,80 e P(A e B) = 0,15. a- A e B so mutuamente excludentes? Explique. b- Determine P(A ou B). 7- Sejam A e B mutuamente excludentes, P(A) = 0,31 e P(B) = 0,29. a- A e b so coletivamente exaustivos? Explique. b- Determine P(A ou B). c- Determine P (A e B) 8- Joga-se uma moeda trs vezes. Qual a probabilidade de aparecer coroa trs vezes? Qual a probabilidade de no aparecer coroa nas trs vezes?
62
Uma das possibilidades o uso das rvores de deciso, mas quando o numero de resultados grande, essa lista se torna muito trabalhosa; necessrio ento recorrer a formulas matemticas para determinar o numero total de resultados possveis.
Suponhamos que um estudante esteja fazendo um teste de 20 questes do tipo verdadeiro-ou-falso. Suponhamos ainda que ele, no tenha estudado nada, esteja dando todas as respostas na base do palpite. Qual a probabilidade de ele responder corretamente todo o teste? A primeira coisa a fazer determinar o numero total de resultados possveis.
Em segundo lugar devemos explorar suas diversas verses. Imaginemos que o teste consista de apenas:
Uma questo
temos V ou F
Duas questes temos VV, VF, FV, FF Trs questes temos VVV, VVF, VFF, VFV, FVF, FVV, FFV, FFF
Numero de resultados :
Nota-se que se, o numero de itens for grande, a listagem se tornara praticamente impossvel. Em seguida podemos ver um diagrama de rvore para determinar todos os arranjos possveis.
63
QUESTO
N1
N2 V V F
.
F
Alem disso, o que realmente necessario determinar o numero total de resultados; nada se tem a ganhar identificando cada resultado.
Se fossem quatro escolha para cada questo: NMERO DE QUESTES 1 2 3 Para solucionar o exerccio do teste, teremos: TOTAL DE RESULTADOS 4=4 4 x 4 = 16 4 x 4 x 4 = 64
64
2x2x2x2x2x.......x2
1 2 3 4 5 . . . . . . . . . . 20
= 220
= 1.048.576 ou
1 1.048.576
De um modo geral, se ha n decises seqenciais, cada uma com m escolhas, o numero total de resultados
m n.
Quando a ordem em que os elementos se dispem importante, o numero total de resultados possveis conhecido como Arranjo ou Permutao. Quando a ordem no interessa, o numero total de resultados possveis designado como Combinao. Para o uso na analise combinatria usaremos o numero fatorial representado pelo smbolo ! como por exemplo
4!
Outros exemplos:
5! = 7!
5x4x3x2x1 7x6x5x4x3x2x1
5! 7 x 6 x 5!
1 7x6
1 42
4! = 2!
4 x 3 x 2 x 1 = 4 x 3 x 2! = 4 x 3 = 12 2x1 2!
5! 2! 3!
= 5 x 4 x 3! 2 x 1 x 3!
= 5 x 4 = 20 = 10 2x1 2
( 5 - 3 )! = 2! ( 9 - 2 )! = 7! ( 3 + 1)! 8! 3 ( 8 3 )! = 4! = 8! 3! . 5! =
e no ( 5! - 3! )
8 x 7 x 6 x 5! = 8 x 7 x 6 3 x 2 x 5! 3x2
= 56
0! = 1. 1! = 1.
ARRANJOS
So agrupamentos que podem variar pela ordem ou natureza dos elementos. Quando se consideram n elementos distintos tomados x a x chamamos arranjo ou agrupamentos enerios que se podem formar com esses n elementos, dispomos de todas as formas possveis de modo que dois arranjos quaisquer difiram ao menos pela ordem dos elementos.
Assim, os arranjos possveis com as letras A, B e C so A 3,2 (3 elementos dois a dois) A 3,2 = AB; BA; AC; CA, BC; CB.
E com os nmeros: 2, 6 e 8 podem ser feitos os seguintes arranjos A 3,2 A 3,2 = 26; 28; 62; 68; 82; 86.
Outro exemplo: Se ha sete cavalos num preo, quantos arranjos ha considerando 1,2 e 3 lugares?
A n,x =
n! ( n x )!
A 7,3 =
7! ( 7 3 )!
7! 4!
7 x 6 x 5 x 4! = 7 x 6 x 5 = 210 4!
PERMUTAO
66
Denomina-se permutao aos arranjos de objetos tomados n a n. Neste caso cada objeto entra s uma vez em todos os grupos.
Em geral o numero de permutaes distintas com n itens, dos quais n1 so indistinguveis de um tipo, n2 de outro tipo, etc, : n1, n2, ....nK
Pn =
Exemplo: Quantas permutaes distintas de 3 letras podemos formar com as letras: RRRR UUU N
4 3 1
P8 =
= 280
COMBINAO
Chama-se combinao quando no interessa a ordem para denotar o numero de agrupamentos distintos possveis. Exemplo: a escolha de 2 tipos de vegetal de um cardpio com 5 tipos. A escolha de batata e cenoura a mesma que cenoura e batata.
De um modo geral, para agrupamentos de tamanho x extrados de uma lista de n itens, o numero de combinaes possveis :
C n,x =
n! x ! (n - x )!
n x
67
Quantos comits distintos, de 3 pessoas cada um, podemos formar com um grupo de 10 pessoas?
C10,3 =
10! 7! 3!
= 10 x 9 x 8 x 7! = 120 3 x 2 x 7!
De quantas maneiras podemos formar um comit de 1 mulher e 2 homens, de um total de 4 mulheres e 6 homens.
Mulheres ( C 4,1 )
Homens ( 6,2 )
4! 3! 1!
6! 4! 2!
= 4 x 15
= 60
A n,x =
n! ( n x )!
PERMUTAO COM REPETIES (OU DISTINGUIVEIS): alguns itens so idnticos, e a ordem importante.
Pn =
C n,x =
n! x ! (n - x )!
n x 68
EXERCCIOS: E-5
1- Calcule: a- 2! b- 3! c- 10! d- 1! e- 0!
2- Calcule: a3 2 b4 4 c5 1 d9 6
4- Um vendedor de automveis deseja impressionar os possveis compradores com o maior numero de combinaes diferentes possveis. Um modelo pode ser dotado de trs tipos de motor, dois tipos de transmisso, cinco cores externas e duas internas. Quantas so a escolhas possveis?
5- Em um determinado Estado, as placas de licena constam de trs letras e quatro algarismos. Quantas placas diferentes podemos formar admitindo-se o uso de todas as (26 letras) e os (10 algarismos)?
6- Quantas permutaes distintas podem ser feitas com as letras da palavra BLUEBEARD ?
7- Se um torneio de basquetebol consiste de 36 times, de quantas maneiras podem ser conquistados os trs primeiros lugares?
8- De quantas maneiras diferentes podemos escolher um comit de cinco pessoas dentre oito? 9- A Pizzaria do Joe oferece as seguintes escolhas de pizza: presunto, cogumelos, pimento, enchovas e muzzarella. De quantas maneiras podemos escolher dois tipos diferente de pizza?
69
CK
KC
KK
Se a moeda equilibrada, P(K) = P(C) = .As probabilidades dos diversos resultados so: RESULTADOS PROBABILIDADE DO RESULTADO 1 CC 2 1 CK 2 1 KC 2 1 KK 2 2 . 2 1 = 4 70 . 2 1 = 4 1 2 0,25 . 2 1 = 4 0,50 1 1 0,25 . 1 = 4 1 1 0,25 1 0 0,25 NUMERO DE CARAS P(X)
Assim, pois, a distribuio de probabilidades para o numero de caras em duas jogadas de uma moeda so:
NUMERO DE CARAS
P(X)
0,25
0,50
0,25 1,00
Note-se que a soma de todas as probabilidades 1,00, como de esperar, pois os resultados apresentados so mutuamente excludentes e coletivamente exaustivos. A mesma distribuio pode ser apresentada em forma acumulada. NUMERO DE CARAS P(X ou menos)
0,25
0,75
1,00
71
1,00
1,OO
0,75
0,5
0,25
0,25
0,25
0 0 1 2 NUMERO DE CARAS
0 1 2 NUMERO DE CARAS
72
POSSIBILIDADE N 1 2a 2b 2c 2d 3a 3b 3c 3d 3e 3f 4a 4b 4c 4d 5
MOEDA N 1, 2, 3, 4 CCCC CCCK CCKC CKCC KCCC CCKK CKKC KKCC CKCK KCKC KCCK KKKC KKCK KCKK CKKK KKKK
EVENTO
0K e 4C 1K e 3C
0 1
2K e 2C
3K e 1C
4K e 0C
Utilizando as regras do produto para eventos independentes (e) e da adio para eventos mutuamente exclusivos (ou) possvel calcular as probabilidades associadas aos valores de X.
A probabilidade de X=0 obtida pelo conhecimento de termos 4 coroas, sabe-se que a probabilidade de sair coroa , a probabilidade final ser: 0,5x0,5x0,5x0,5 = 0,0625. -63Para o calculo da probabilidade X=1 deve-se trabalhar com o evento 1K e 3C como temos as opes a,b,c,d, que so mutuamente exclusiva, a regra da soma manda efetuar a adio 0,0625 +0,0625 +0,0625 +0,0625 ou, o que o mesmo de se efetuar o produto 4x 0,0625 = 0,25.
73
X 0 1 2 3 4
EVENTO 0K e 4C 1K e 3C 2K e 2C 3K e 1C 4K e 0C
P(X = x)
0 4 0 4
= 1p
1
q
3
= 4p
2
q
2
= 6p
3
q
1
= 1p
4
q
0
= 1p
1,00
n! x ! (n x)!
n x
Generalizando temos;
x n-x
P(x) =
n! x! (n x)!
p . q
74
Distribuio binomial de x (numero de coroas) para n = 10 X Numero de Coroas em 10 jogadas n! x ! (n x) ! Distribuio Amostral P(X) probabilidade % de encontrar a Amostra
10
p(10) =
10! 10! (10 10)! 10! 9! (10 9) ! 10! 8! (10 8) ! 10! 7! (10 7) ! 10! 6! (10 6) ! 10! 5! (10 5) ! 10! 4! (10 4) ! 10! 3! (10 3) ! 10! 2! (10 2) ! 10! 1! (10 1) ! 10! 0! (10 0) !
1/1024 = 0,000976
p(9) =
10
1/1024 = 0,009760
p(8) =
45
1/1024 = 0,043940
p(7) =
120
1/1024 = 0,117180
p(6) =
210
1/1024 = 0,205070
p(5) =
252
1/1024 = 0,246090
p(4) =
210
1/1024 = 0,205070
p(3) =
120
1/1024 = 0,117180
p(2) =
45
1/1024 = 0,043940
p(1) =
10
1/1024 = 0,009760
p(0) =
1
10
1/1024 = 0,000976
TOTAL = 2
= 1024
75
EXERCICIOS: E-6
Use a formula binomial para responder s questes abaixo: 1- Um fabricante de mesas de bilhar suspeita que 2% de seu produto apresenta algum defeito. Se tal suspeita correta, determine a probabilidade de que, numa amostra de nove mesas: a- Haja ao menos uma defeituosa b- No haja nenhuma defeituosa
2- Dos estudantes de um colgio, 41% FUMAM CIGARROS. Escolhem-se seis ao acaso para darem sua opinio sobre o fumo. a- Determine a probabilidade de nenhuma das seis ser fumante. b- Determine a probabilidade de todos os seis ser fumante. c- Qual a probabilidade de ao menos a metade dos seis serem fumantes.
3- Doze por cento dos que reservam lugar num vo sistematicamente faltam ao embarque. O avio comporta 15 passageiros. a- determine a probabilidade de que todos os 15 que reservaram lugar compaream ao embarque b- Se houve 16 pedidos de reserva, determine a probabilidade de uma pessoa ficar de fora.
4- Um revendedor de automveis novos constatou que 80% dos carros vendidos so devolvidos ao departamento mecnico para corrigir defeitos de fabricao, nos primeiros 25 dias apos a venda. De 11 carros vendidos num perodo de 5 dias, qual a probabilidade de que: a- Todos voltem dentro de 25 dias para reparo. b- S um no volte
5- Suponha que 8% dos cachorros-quentes vendidos num estdio de futebol sejam pedidos sem mostarda. Se sete pessoas pedem cachorro, determine a probabilidade de que: a- Todos queiram mostarda b- Apenas um no a queira. 76
A chamada Distribuio de Poisson ou de Eventos Raros podem ser considerada um caso limite da distribuio binomial. Quando n grande e p pequeno podemos usar a aproximao de Poisson para a distribuio Binomial. difcil dar condies precisas para que se possa usar a aproximao de Poisson, ou seja, o que significa quando n grande e p pequeno. Como regra geral podemos usar:
> 100
n.p < 10
n = Elementos da Populao
p = Probabilidade
Exemplo: n = 150
p = 0,05
Temos a distribuio de Poisson com: n.p = 150 . (0,05) = 7,5 A formula a ser usada : x f (x) = (n.p) . e x! - n.p para x = 1, 2, 3, .......
e= 2,718
Exemplo: Sabe-se que 2% dos livros encadernados em uma certa livraria apresentam defeitos de encadernao. Utilize a aproximao de Poisson da distribuio Binomial para achar a probabilidade de que 5 entre 400 livros encadernados nessa livraria apresentam algum defeito de encadernao.
p = 2% = 0,02
x=5
77
-8
8 . e 5!
Outro Exemplo: Supnhamos que os defeitos em fios para tear possam ser aproximados por um processo de Poisson com media de 0,2 defeitos por metro (p = 0,2) .Inspecionando-se pedaos de fio de 6 metros de comprimento, determine a probabilidade de menos de 2 (isto 0 ,1) defeitos. Temos : n = 6 p = 0,2 n . p = 6 . 0,2 = 1,2 x =1 e X=2
-1,2
f(0) =
1,2 0!
1
= 1 . 0,301 = 0,301 1
-1,2
f(1) =
1,2 1!
78
EXERCICIOS: E-7
1- Verifique, em cada caso, se os valores de n e p satisfazem as regras empricas para a utilizao de Poisson como aproximao da Binomial: abcn = 500 e n = 100 n = 60 e e p = 0,001 p = 0,12 p = 0,002
2- Se 0,6% dos detonadores fornecidos a um arsenal so defeituosos, utilize a aproximao de Poisson para a distribuio Binomial para determinar a probabilidade de que, em uma amostra aleatria de 500 detonadores, quatro sejam defeituosos. 3- Em uma certa cidade 3,2% dos habitantes se envolve em, ao menos, um acidente de carro em um ano. Com o auxilio da aproximao de Poisson para a distribuio Binomial, determine a probabilidade de que, dentre 200 motoristas escolhidos aleatoriamente nessa cidade. a- Exatamente seis se envolvam em ao menos um acidente em um ano; b- No Maximo oito se envolvam em ao menos um acidente em um ano; c- Cinco ou mais se envolvam em ao menos um acidente em um ano;
4- Suponha que, em media 2% das pessoas sejam canhotas. Encontre a probabilidade de 3 ou mais canhotos em 100 pessoas
79
15.0 CORRELAO
15.1 INTRODUO
At agora nossa preocupao era descrever a distribuio de valores de uma nica varivel. Com esse objetivo, aprendemos a calcular medidas de tendncia central e variabilidade. Quando porem, consideramos observaes de duas ou mais variveis, surge um novo problema: as relaes que podem existir entre duas ou mais variveis estudadas.
Assim, quando consideramos variveis como peso e altura de um grupo de pessoas, uso do cigarro e incidncia do cncer, a potencia gasta e a temperatura da gua no chuveiro, Procuramos verificar se existe alguma relao entre as variveis de cada um dos pares e qual o grau dessa relao.
Sendo a relao entre as variveis de natureza quantitativa, a correlao o instrumento adequado para descobrir e medir essa relao.
Uma vez caracterizada a relao, procuramos descreve-la atravs de uma funo matemtica. A regresso o instrumento adequado par a determinao dos parmetros dessa funo.
Considerando, agora a relao que existe entre o peso e a estatura de um grupo de pessoas. evidente que essa relao no do mesmo tipo da anterior, ela bem menos precisa. Assim, pode acontecer que a estaturas diferentes correspondam a pesos iguais ou que estaturas iguais correspondam a pesos diferentes.
As relaes do tipo perimetro-lado so conhecidas como relaes funcionais. As relaes do tipo peso-estatura, como relaes estatsticas.
Quando duas variveis esto ligadas por uma Relao Estatstica, dizemos que existe uma correlao entre elas.
01 08 24 38 44 58 59 72 80 92
5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0
6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0 81
Representando, em um sistema de coordenadas cartesiano ortogonal, os parmetros (xi ; yi), obtemos uma nuvem de pontos que denominamos DIAGRAMA DE DISPERSAO. Esse diagrama nos fornece uma idia grosseira, porem til, da correlao existente: yi 10 . .
o o
8 . . 6 . .
o
o o
4 . . 2 . . . . 2
o
. 4
. 6
. 8
. 10 xi
Podemos imaginar que, quanto mais fina for a elipse mais ela se aproximar de uma reta. Dizemos, ento, que a correlao de forma elptica tem como imagem uma reta, sendo, por isso denominada de Correlao Linear. 82
possvel verificar que cada correlao esta associada como imagem uma relao funcional. Por esse motivo, as relaes funcionais so chamadas Relaes Perfeitas.
yi 10 . .
o
RETA IMAGEM
8 . . 6 . .
o
o o
4 . . 2 . . . . 2
o
. 4
. 6
. 8
. 10 xi
Como a correlao em estudo tem como imagem uma reta ascendente, ela chamada de Correlao Linear Positiva.
Assim uma correlao : a- Linear Positiva se os pontos do diagrama tem com imagem uma reta ascendente; b- Linear negativa se os pontos tem como imagem uma reta descendentes; c- Nao-linear se os pontos tem como imagem uma curva.
Se os pontos apresentam-se dispersos, no oferecendo uma imagem definida, conclumos que no h relao alguma entre as variveis em estudo. 83
Temos:
Y
o oo ooo oo ooooo ooo ooooo oo o oo
X Y
o oo ooo oo ooooo ooo ooooo oo o oo
X
o o oo oo oooo ooo oo oo ooo ooooo o correlao no-linear ooo oooo ooooo ooo oo oo o oooo oo ooo
Y
oo o o o o o o o oooo ooo o ooo oo ooo oooo oooo oooo o o oo ooo ooooo o o ooo oo o ooooo
no h correlao
84
r=
n xi yi (xi ) (yi)
Onde:
[ n xi (xi)] [ n yi (yi)]
n = nmero de observaes Os valores limites de r so -1 e +1, isto , o valor de r pertence ao intervalo [ -1 e +1]. Assim: A- Se a correlao entre duas variveis perfeita e positiva, ento r = +1.
NOTAS -
Para que uma relao possa ser descrita por meio do Coeficiente de Correlao de Person imprescindvel que ela se aproxime de uma funo Linear. Uma maneira pratica de verificarmos a linearidade da relao a inspeo do Diagrama de Disperso: se a elipse apresenta salincias ou reentrncias muito acentuadas, provavelmente trata-se de uma relao curvilnea.
Para podermos tirar algumas concluses significativas sobre o comportamento simultneo das variveis analisadas, necessrio que: 0,6 | r | 1 | r | < 0,6, h uma correlao relativamente fraca entre as variveis.
Se
0,3
85
Se 0
concluir sobre a relao entre as variveis em estudo. -81Em seguida vamos calcular o coeficiente de correlao relativos ao exerccio anterior. O modo mais pratico para obtermos r abrir, na tabela, colunas correspondentes aos valores de xi yi, xi e yi. Assim:
MATEMATICA (xi) 5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0 =65
ESTATISTICA (yi) 6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0 =65 xi yi 30 72 56 100 30 49 72 12 48 04 =473 xi 25 64 49 100 36 49 81 09 64 04 =481 yi 36 81 64 100 25 49 64 16 36 04 =475
Logo:
r=
10 x 473 65 x 65
505
550 4.554,18
= 0,911
(4.810 4.225)
(4.750 4.225)
585 x 525
Dai: r = 0,91 Resultado que indica uma correlao linear positiva altamente significativa entre as duas variveis.
86
Identificamos a seguir trs dos erros mais comuns cometidos na interpretao de resultados que envolvem correlao.
1- Devemos evitar a concluso de que a correlao implica em casualidade. Um estudo mostrou uma correlao entre salrios de professores de Estatstica e o consumo individual de cerveja. Porem essas duas variveis so afetadas pelas condies econmicas que envolvem no s o professor de Estatstica, aparece neste caso uma terceira varivel oculta.
2- Surge outra fonte de erro potencial quando os dados se baseiam em taxas ou mdias. Quando utilizamos taxas ou mdias para os dados, suprimimos a variao entre os indivduos ou elementos, e isto pode levar a um coeficiente de correlao inflacionado.
3- Um terceiro erro diz respeito propriedade de linearidade. A concluso de que no h correlao linear significativa no quer dizer que x e y no estejam relacionados de alguma forma provavelmente possa haver uma correlao no linear.
87
EXERCICIOS: E-8
1- Complete o esquema de clculo do coeficiente de correlao para os valores das variveis xi e yi :
xi yi
4 12
6 10
8 8
10 12
12 14
12,0 . 14,0 = = =
Logo:
r=
.........
........ .........
= ........
..... x ......
ONDE: r =
88
(xi) 34 30 40 34 39 35 42 45 43 = B=
(yi) 21 22 25 28 15 24 24 22 17
xi yi
xi
yi
(xi)
(yi)
xi yi
xi
yi
46 46 52 50 48 40 42 44 = = = =
89
estudante 1 2 3 4 5 6 7 8 9 10 11
(xi) 82 84 86 83 88 87 85 83 86 85 87 =
(yi) 92 91 90 92 87 86 89 90 92 90 91 =
xi yi
xi
yi
4- Com os dados abaixo, sobre crimes violentos e a temperatura mdia entre 21 e 2 horas das noites de sbado numa grande comunidade, monte o grfico para os dados e calcule o coeficiente de correlao. Crimes Violentos/ 1000 residentes 5,0 2,2 4,1 5,4 2,8 3,0 3,6 4,9 4,1 4,2 2,0 2,7 3,1 temperatura mdia (F) 87 50 75 90 55 54 68 85 82 80 45 58 66 90
Podemos dizer que a analise de regresso tem por objetivo descrever, atravs de um modelo matemtico, a relao entre duas variveis, partindo de n observaes das mesmas.
Assim, supondo X a varivel independente e Y a dependente, vamos procurar determinar o ajustamento de uma reta a relao entre essa variveis, ou seja, vamos obter uma funo definida por: Y = ax + b onde a e b so parmetros.
Sejam duas variveis X e Y, entre as quais exista uma correlao acentuada, embora no perfeita, como, por exemplo, as do exerccio j apresentado: MATEMATICA (xi) 5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0 ESTATISTICA (yi) 6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0 91
RETA IMAGEM
8 . . 6 . .
o
o o
4 . . 2 . . . . 2
o
. 4
. 6
. 8
. 10 xi
Podemos concluir, pela forma do diagrama, que se trata de uma correlao retilnea, de modo a permitir o ajustamento de uma reta, imagem da funo definida por: Y = ax+ b
b = Y - a X
92
Onde :
n o nmero de observaes
X mdia dos valores de Xi (X = Xi ) n Y mdia dos valores de Yi (Y = Yi ) n Nota: Como estamos fazendo uso de uma amostra para obtermos os valores dos parmetros, o resultado, na realidade, uma estimativa da verdadeira equao de regresso. Sendo assim, escrevemos: Y^ = a X + b
Onde Y^ o Y estimado
5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0 =65 Temos assim
6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0 =65
30 72 56 100 30 49 72 12 48 04 =473
25 64 49 100 36 49 81 09 64 04 =481
a = 10 x 473 65 x 65 = 4730 - 4225 = 505 = 0,8632 10 x 481 (65) 4810 - 4225 585 93
Logo:
= 0,86 X + 0,89 Y
Para traarmos a reta no grfico, basta determinar dois de seus pontos: X=0 X=5 Y^ = 0,89 Y^ = 0,86 x 5 + 0,89 = 5,19
Assim temos: yi
10 . . 8 . . 6 . 5,19 . 4 . . 2 . o o o o o o o o o o Y^ = 0,86 X + 0,89
.
0,89
.
2
.
4
.
6
.
8
.
10
xi
94
Os valores calculados so apenas estimativas baseadas em dados amostrais e, se fundamentarmos nosso trabalho em outra amostra de mesmo tamanho n o mtodo de mnimo quadrado poderia gerar valores diferentes de para a poderia gerar valores para Y^ diferentes. e b , como tambm
Para prever essas diferenas possvel estabelecermos um intervalo para o qual possamos afirmar, com certo grau de confiana valores de Y^.
O clculo desses intervalos segue os mesmos raciocnios visto anteriormente para as mdias , propores, varincias e desvio padro, e analisaremos a seguir.
95
EXERCICIOS: E-9
1- Aps 6 horas de treinamento, um cachorro cometeu 5 erros em uma exposio canina, outro cachorro aps 12 horas cometeu 6 erros, e finalmente um outro
cachorro, apos 18 horas, cometeu apenas 1 erro. Denotando por x o nmero de horas de treinamento e por y o nmero de erros cometidos, qual das duas retas se ajusta melhor aos trs pontos, no sentido de mnimos quadrados?
a- y = 10 - x b- y = 8 1/3
2- A tabela a seguir mostra quantas semanas seis pessoas trabalharam em um posto de inspeo de automveis e quantos carros foram inspecionados entre 12 e 14 horas, em determinado dia:
2 7 9 1 5 12
13 21 23 14 15 21
x.y =721
b- Com o auxilio da parte a, estime quantos carros uma pessoa que venha trabalhando no posto de inspeo ha 8 semanas poder inspecionar? 96
3- Os dados abaixo se referem ao resduo de cloro em uma piscina em vrios momentos, aps ter sido tratada com produtos qumicos:
X Nmero de Horas
0 2 4 6 8 10 12
x .y =48,6
A leitura de zero horas foi feita imediatamente aps completado o tratamento qumico.
a- Ajuste uma reta de mnimos quadrados que nos permita predizer o resduo de cloro em termos do nmero de horas aps a piscina ter sido tratada com produtos qumicos .
b- Com a equao da reta de mnimos quadrados, estime o resduo de cloro na piscina 5 horas aps ter sido tratada.
c- Com a equao da reta de mnimos quadrados, estime o resduo de cloro na piscina 8 horas aps ter sido tratada. Por que razo o resultado diverge do valor 1,1 da tabela.
97
BIBLIOGRAFIA
BIBLIOGRAFIA BSICA
FREUND, John E. e SIMON, Gary A. Estatstica aplicada economia, administrao e contabilidade. Porto Alegre: Bookman, 2000. TRIOLA, Mrio F. Introduo estatstica. Rio de Janeiro: LTC, 1999.
BIBLIOGRAFIA COMPLEMENTAR
KUME, Hitoshi, Mtodos Estatsticos para a Melhoria da Qualidade. So Paulo:Gente,1993. RAMOS A.W., CEP para Processos Contnuos e em Bateladas. So Paulo:E.Blucher, 2000. BUSSAB, Wilton O e MORETTIN, Pedro A. Estatstica bsica. So Paulo: Saraiva,2002. DOWNING Douglas e CLARK Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2000. MILONE, Giuseppe e ANGELINI, Flvio. Estatstica aplicada. So Paulo: Atlas, 1995. KAZMIER, L.B. Estatstica aplicada Economia e Administrao. So Paulo: McGraw-Hill, 1982. SPIEGEL, Murray R. Estatstica. So Paulo: Makron Books, 1993. (519.5 S734e)
98