You are on page 1of 97

Probabilidade e Estatstica

Anlise exploratria de dados


Daniel Henrique Breda Binoti

Centro Universitrio So Camilo. Todos os direitos reservados


O que analisar dados estatisticamente?

Identificar Comportamentos mdios, comportamentos


discrepantes, comparar comportamentos, investigar a
interdependncia entre variveis, revelar tendncias etc;
A partir de uma massa de dados, e com o auxlio de
recursos computacionais, separar o que essencial (estrutura)
do que eventual (rudo);
Resumir, de forma eficiente, a informao contida nos dados
e assim permitir que, por meio desse conhecimento, as
decises sejam tomadas de forma mais consistente.

Centro Universitrio So Camilo. Todos os direitos reservados


O que anlise exploratria de
dados?

Trata-se de um conjunto de tcnicas de tratamento de


dados que, sem implicar em uma fundamentao
matemtica mais rigorosa, nos ajuda a fazer uma
sondagem do terreno, ou seja, tomar um primeiro
contato com a informao disponvel.

Essas tcnicas nos ajudaro na compreenso do


fenmeno em estudo, e nos guiaro na escolha do
modelo probabilstico adequado.

Centro Universitrio So Camilo. Todos os direitos reservados


Tipologia das Variveis

Caracterstica que pode ser observada (ou mensurada) nos


elementos da populao, devendo ter pelo menos um
resultado para cada elemento observado.
Nominal
Qualitativa
Ordinal
Varivel
Discreta
Quantitativa
Contnua

Centro Universitrio So Camilo. Todos os direitos reservados


Variveis Qualitativas

Varivel Qualitativa nominal ou categrica Seus valores


possveis so diferentes categorias no ordenadas,
conforme as quais cada observao pode ser classificada.
Exemplos: rea de atividade, marca de um produto,
qualidade do produto (perfeito ou defeituoso).
Varivel Qualitativa Ordinal Seus valores possveis so
diferentes categorias ordenadas, conforme as quais cada
observao pode ser classificada. Exemplos: Resposta a
uma pesquisa sobre a qualidade de um servio (bom,
regular, ruim), Nvel de instruo, classe social.

Centro Universitrio So Camilo. Todos os direitos reservados


Variveis Quantitativas

Varivel Quantitativa Discreta Seus valores possveis so


em geral resultantes de um processo de contagem. Exemplos:
nmero de empregados de uma empresa, nmero de peas
defeituosas em um lote.

Varivel Quantitativa Contnua Seus valores possveis podem


ser expressos por meio de nmeros reais e varrem uma
escala contnua de medio. Exemplos: dimetro de seo
circular de um pisto, durao da carga de uma bateria.

Centro Universitrio So Camilo. Todos os direitos reservados


Nmero da Observao Bairro Tipo Nmero de Quartos Preo
1 Barra Apto 2 165
2 Barra Apto 3 240
3 Barra Cobt 0 158
4 Barra Sala 0 150
5 Botafogo Apto 2 59
6 Catete Apto 1 54
7 Centro Sala 0 35
8 Copacabana Apto 2 83
9 Copacabana Apto 3 180
10 Copacabana Apto 4 85
11 Flamengo Apto 1 58
12 Flamengo Cobt 0 120
13 Gvea Apto 4 250
14 Ipanema Apto 3 130
15 Jacarepagua Apto 3 90
16 Lagoa Apto 2 130
17 Laranjeiras Apto 2 68
18 Laranjeiras Apto 4 360
19 Leblon Apto 3 300
20 Leblon Apto 4 600
21 Maracan Apto 3 137
22 Recreio Cobt 0 240
23 So Conrado Casa 4 650
24 Tijuca Apto 2 49
25 Tijuca Apto 2 95
26 Tijuca Casa 4 170
27 Vila Isabel Apto 2 57

Centro Universitrio So Camilo. Todos os direitos reservados


Tabelas de frequncias para variveis qualitativas

Frequncia Frequncia
Categoria
Absoluta Relativa
Apto 20 74%
Casa 2 7%
Cobt 3 11%
Sala 2 7%

Total Geral 27 100%

Centro Universitrio So Camilo. Todos os direitos reservados


Grfico de Colunas

80%

70%

60%

50%

40%

30%

20%

10%

0%
Apto Casa Cobt Sala

Centro Universitrio So Camilo. Todos os direitos reservados


Grfico de Barras

Sala

Cobt

Casa

Apto

0% 10% 20% 30% 40% 50% 60% 70% 80%

Centro Universitrio So Camilo. Todos os direitos reservados


Grfico de Setores

Sala

Cobt

Casa

Apto

Centro Universitrio So Camilo. Todos os direitos reservados


Tabelas de frequncias para variveis Quantitativas

Exemplo Carga de ruptura de cabos nuticos


Uma companhia produz cabos nuticos de um
determinado tipo, que podem ser usados em barcos a
vela. A medio da carga de ruptura, em Kg, para 30
espcimes de cabos desse tipo resultou nas observaes
abaixo:

Centro Universitrio So Camilo. Todos os direitos reservados


Tabelas de frequncias para variveis Quantitativas

83 96 73 102 Carga (Kg) Frequncia Percentuais


93 94 99 85 70-79 2 7%
80-89 8 27%
91 118 93 103
90-99 13 43%
87 95 102 84 100-109 6 20%
100 95 90 81 110-120 1 3%
102 98 94 89 Total Geral 30 100%
91 78 85 83
105 96

Centro Universitrio So Camilo. Todos os direitos reservados


Tabelas de frequncias para variveis Quantitativas

14

12

10
Contagem

0
70-79 80-89 90-99 100-109 110-120
Carga

Centro Universitrio So Camilo. Todos os direitos reservados


Tabelas de frequncias para variveis Quantitativas

50%

45%

40%

35%

30%

25%

20%

15%

10%

5%

0%
70-79 80-89 90-99 100-109 110-120
Carga

Centro Universitrio So Camilo. Todos os direitos reservados


Tabelas de frequncias para variveis Quantitativas

120%

100%

80%

60%

40%

20%

0%
70-79 80-89 90-99 100-109 110-120

Centro Universitrio So Camilo. Todos os direitos reservados


Construo de tabelas de distribuio de frequncia

Objetivo: construir tabelas de distribuio de frequncia a partir de


dados brutos (n observaes).
1 Passo: determinar a amplitude total;

2 Passo: estimar o nmero de intervalos;

3 Passo: estimar a amplitude dos intervalos;

4 Passo: esquematizar a tabela de acordo com as informaes dos passos


anteriores.

Centro Universitrio So Camilo. Todos os direitos reservados


Exemplo

Tempo em segundos para carga de um aplicativo num sistema


compartilhado (50 observaes):

5,2 6,4 5,7 8,3 7,0 5,4 4,8 9,1 5,5 6,2 4,9 5,7 6,3 5,1 8,4 6,2 8,9 7,3
5,4 4,8 5,6 6,8 5,0 6,7 8,2 7,1 4,9 5,0 8,2 9,9 5,4 5,6 5,7 6,2 4,9 5,1
6,0 4,7 18,1 5,3 4,9 5,0 5,7 6,3 6,0 6,8 7,3 6,9 6,5 5,9

Centro Universitrio So Camilo. Todos os direitos reservados


1 Passo: Determinar a amplitude total (range)

5,2 6,4 5,7 8,3 7,0 5,4 4,8 9,1 5,5 6,2 4,9 5,7
6,3 5,1 8,4 6,2 8,9 7,3 5,4 4,8 5,6 6,8 5,0 6,7
8,2 7,1 4,9 5,0 8,2 9,9 5,4 5,6 5,7 6,2 4,9 5,1
6,0 4,7 18,1 5,3 4,9 5,0 5,7 6,3 6,0 6,8 7,3 6,9
6,5 5,9
Menor tempo
Maior tempo

Amplitude total R = 18,1 4,7 = 13,4


Centro Universitrio So Camilo. Todos os direitos reservados
2 Passo: estimar o n de intervalos (classes)

O nmero de intervalos = , para > 25


= 5 , para < 25;

= 50 = 7,07

Ou pode usar a frmula de Sturges = 1 + 3,22 log


= 1 + 3,22 log 50 = 7

n o tamanho da amostra.

Centro Universitrio So Camilo. Todos os direitos reservados


3 Passo: estimar a amplitude dos intervalos

Amplitude dos intervalos

13,4
= = 1,914 = 1,92
7

Centro Universitrio So Camilo. Todos os direitos reservados


4 Passo: montar a tabela
4,70 + h
Tempo Frequncia Frequncia
Valor absoluta relativa
mnimo 4,70 |-- 6,62 34 68%

6,62 |-- 8,54 12 24%

8,54 |-- 10,46 3 6%

10,46 |-- 12,38 0 0%

12,38 |-- 14,30 0 0%

14,30 |-- 16,22 0 0%

16,22 |-- 18,14 1 2%

Total 50 100%

Centro Universitrio So Camilo. Todos os direitos reservados


Diagramas de Disperso

Serve para saber se existe alguma correlao (forte, fraca,


moderada, positiva, negativa) entre duas variveis.

Centro Universitrio So Camilo. Todos os direitos reservados


Grficos de Curvas

Usados em processos para se acompanhar a evoluo de uma varivel em


relao a um ou mais limites existentes.

Centro Universitrio So Camilo. Todos os direitos reservados


Consideraes

Tipo de varivel ou Mtodo mais usado ou


Comentrio
srie adequado
Grfico de barras, colunas ou
Dados qualitativos
circulares (tipo torta)
Medidas intervalares. Grfico de
Variveis discretas
hastes
Grficos em forma de O uso de polgonos de frequncia
Variveis contnuas histogramas e polgonos de induz o leitor a aceitar a continuidade
frequncia da varivel apresentada.
Grfico de colunas, curvas ou
Sries cronolgicas
barras
O grfico tipo setor permite uma
Sries especficas e Grfico de colunas, barra ou
maior visualizao das partes frente
geogrficas setor
do todo.
Centro Universitrio So Camilo. Todos os direitos reservados
Exemplo

Uma pea aps fundida sob presso a alta temperatura recebe um


furo com dimetro especificado em 12,00 mm e tolerncia de 0,25
mm: (11,75 12,25).

Deseja-se DESCREVER as seguintes Variveis de Resposta:

X: nmero de defeitos por pea fundida

Y: dimetro do furo

Para tanto, coletou-se dados de uma Amostra de 25 peas


Centro Universitrio So Camilo. Todos os direitos reservados
Exemplo

Pea i Xi: nmero de defeitos Yi: dimetro do Furo (mm) Pea i Xi: nmero de defeitos Yi: dimetro do Furo (mm)
1 2 12,21 14 0 11,99
2 0 11,73 15 2 12,27
3 1 11,94 16 1 12,11
4 2 11,86 17 6 11,80
5 1 12,31 18 3 12,02
6 0 12,10 19 0 12,23
7 1 12,19 20 1 12,08
8 0 11,78 21 0 11,88
9 2 12,20 22 1 11,76
10 1 12,05 23 2 12,05
11 1 11,81 24 0 12,07
12 3 12,00 25 0 12,20
13 1 12,34

Centro Universitrio So Camilo. Todos os direitos reservados


Exemplo

Frequncia Frequncia Frequncia


Ordem Nmero de Defeitos
Absoluta Relativa Acumulada
1 0 8 32% 32%
2 1 9 36% 68%
3 2 5 20% 88%
4 3 2 8% 96%
5 4 0 0% 96%
6 5 0 0% 96%
7 6 1 4% 100%
25 100%

Centro Universitrio So Camilo. Todos os direitos reservados


Exemplo

10

0
1 2 3 4 5 6 7
Nmero de Defeitos

Centro Universitrio So Camilo. Todos os direitos reservados


Exemplo Histograma

Amplitude da amostra:
R Y max Y min 12,34 11,73 0,61
Nmero de classes:

k n 25 5

Amplitude das classes:


R 0,61
h 0,122
k 5

Centro Universitrio So Camilo. Todos os direitos reservados


Exemplo

7
Bloco Freqncia % cumulativo 6

11.73 1 4.00% 5

11.852 4 20.00% 4

3
11.974 3 32.00% 2
12.096 7 60.00% 1

12.218 6 84.00% 0
11.73 11.852 11.974 12.096 12.218 Mais
Mais 4 100.00% DIMETRO DO FURO

Centro Universitrio So Camilo. Todos os direitos reservados


Exemplo

Acima da abaixo da
especificao especificao

Dimetro
classe Categoria absoluta relativa
do Furo

1 < 11,75 abaixo da especificao 1 4%


11,75 at
2 dentro da especificao 21 84%
12,25 dentro da
especificao
3 > 12,25 Acima da especificao 3 12%

Centro Universitrio So Camilo. Todos os direitos reservados


DIAGRAMA DE CAULE E FOLHAS
(Steam and Leaf Diagram)

11,7 3 6 8
11,8 0 1 6 8
11,9 4 9
12.0 0 2 5 5 7 8
12,1 0 1 9
12,2 0 0 1 3 7
12,3 1 4

Centro Universitrio So Camilo. Todos os direitos reservados


Medidas Descritivas

As medidas so ferramentas bsicas importantes para a medio e


descrio de diferentes caractersticas de um conjunto de dados;
Estudaremos:
Medidas de Posio Central;
Medidas de Disperso;
Medidas de Posio;
Medidas de Assimetria e Curtose.

Centro Universitrio So Camilo. Todos os direitos reservados


Estatsticas ou medidas amostrais

Estatstica ou medida amostral: uma medida numrica que


descreve alguma caracterstica de uma amostra.
habitualmente representada por letras latinas.

Por exemplo: (mdia), s (desvio padro), r (coeficiente de
correlao)

Centro Universitrio So Camilo. Todos os direitos reservados


Parmetros

Parmetro: uma medida numrica que descreve alguma


caracterstica de uma populao. habitualmente representado
por letras gregas. Por exemplo: (mdia), (desvio padro),
(coeficiente de correlao)

Centro Universitrio So Camilo. Todos os direitos reservados


Medidas de Posio Central

Definio
Representam os fenmenos pelos seus valores mdios, em torno dos quais
tendem a concentrar-se os dados.

Dentre todas as medidas de tendncia central, veremos:


1.1. Mdia;
1.2. Mediana;
1.3. Moda

Centro Universitrio So Camilo. Todos os direitos reservados


Mdia

Definio
o valor mdio de uma distribuio, determinado segundo uma
regra estabelecida a priori e que se utiliza para representar todos
os valores da distribuio. Representada por
Pode ser:
Aritmtica;
Ponderada;
Harmnica;
Geomtrica.

Centro Universitrio So Camilo. Todos os direitos reservados


Mdia Aritmtica

a mais utilizada dentre todas as mdias.


dada pela frmula:

1 1
= = 1 + +

=1
Onde:
n o nmero de valores em uma amostra;
xi cada varivel que representa os valores individuais dos
dados.

Centro Universitrio So Camilo. Todos os direitos reservados


Mdia Aritmtica

Exemplo: um aluno tirou as notas 5, 7, 9 e 10 em 4 provas. Sua


mdia ser:
5 + 7 + 9 + 10
= = 7,75
4

Centro Universitrio So Camilo. Todos os direitos reservados


Mdia Aritmtica para Dados Agrupados

calculada quando a informao disponvel o valor mdio do


intervalo i (Xi) e a frequncia de intervalo i (fi):

1 1 + + =1
= =
1 + + =1

Centro Universitrio So Camilo. Todos os direitos reservados


Exemplo

Considere os seguintes dados:


12,58 12,97 13,45 13,53 13,59 13,61 13,62 13,78 13,97 14,21
14,47 14,51 14,53 14,58 14,65 14,78 14,83 14,97 15,06 15,13
15,17 15,23 15,29 15,37 15,40 15,45 15,51 15,62 15,67 15,73
15,83 15,98 16,01 16,11 16,17 16,23 16,35 16,43 16,49 16,52
16,67 16,83 16,97 17,05 17,13 17,22 17,30 17,48 17,80 18,47

Centro Universitrio So Camilo. Todos os direitos reservados


...continuando

Intervalos de classes Frequncia absoluta


12,51 a 13,50 3
13,51 a 14,50 8
14,51 a 15,50 15
15,51 a 16,50 13
16,51 a 17,50 9
17,51 a 18,50 2

3 13 + 8 14 + 15 15 + 13 16 + 9 17 + 2 18
= = 15,46
30

Centro Universitrio So Camilo. Todos os direitos reservados


Mdia Ponderada

Nos clculos envolvendo mdia aritmtica simples, todas as


ocorrncias tm exatamente a mesma importncia ou o mesmo
peso.
No entanto, existem casos onde as ocorrncias tm importncia
relativa ou pesos relativos diferentes. Nestes casos, o clculo da
mdia deve levar em conta esta importncia relativa ou peso
relativo.
Este tipo de mdia chama-se mdia aritmtica ponderada.

Centro Universitrio So Camilo. Todos os direitos reservados


Mdia Ponderada

dada por:

=1 1 1 + 2 2 + +
= =
=1 1 + 2 + +

Onde wi o peso de cada xi.

Centro Universitrio So Camilo. Todos os direitos reservados


Mdia Ponderada

Exemplo
O exame de seleo pode ser composto de 3 provas onde as duas
primeiras tem peso 1 e a terceira tem peso 2. Um candidato com
notas 70, 75 e 90 ter mdia final:

1 70 + 1 75 + 2 90
= = 81,25
4

Centro Universitrio So Camilo. Todos os direitos reservados


Mdia Harmnica

A mdia harmnica equivale ao inverso da mdia aritmtica dos


inversos de n valores.

= =
1 1 1 1
=1 + ++
1 2

Exemplo: a mdia harmnica de 12, 14 e 16 :


3
= = 13,81
1 1 1
+ +
12 14 16

Centro Universitrio So Camilo. Todos os direitos reservados


Mdia Geomtrica

a raiz de ordem n do produto dos valores da amostra:


1


= = 1 2
=1

Exemplo: a mdia geomtrica de 12, 14 e 16 :

3
= 12 14 16 = 13,90

Centro Universitrio So Camilo. Todos os direitos reservados


Relao entre Mdias

A mdia geomtrica e a mdia harmnica so menores, ou no


mximo, iguais, aritmtica.
A igualdade s ocorre no caso em que todos os valores da amostra
so idnticos.
Quanto maior a variabilidade, maior ser a diferena entre as
mdias harmnica e geomtrica e a mdia aritmtica.

Exemplo: Para a amostra 12, 14, 16 temos:

13,81 < 13,90 < 14,00


Centro Universitrio So Camilo. Todos os direitos reservados
Mediana

um nmero que caracteriza as observaes de uma determinada


varivel de tal forma que este nmero de um grupo de dados
ordenados separa a metade inferior da amostra, populao ou
distribuio de probabilidade, da metade superior. Representada
por ou Md.

Isto , da populao ter valores inferiores ou iguais mediana e da


populao ter valores superiores ou iguais mediana (a mdia no
garante essa propriedade)

Centro Universitrio So Camilo. Todos os direitos reservados


Mediana

Para valores ordenados crescentemente, dois modos de calcular:

Se n mpar, mediana o valor central:


Na amostra 30 32 35 48 76 a mediana 35

Se n par, mediana a mdia simples entre os dois valores


centrais:
34+48
Na amostra 30 32 35 48 76 81 a mediana = 41,5
2

Centro Universitrio So Camilo. Todos os direitos reservados


Mediana para dados agrupados

1. Calcula-se n/2;
2. Achar qual das classes esse valor se encontra a partir das frequncias
absolutas;
3. Usar a frmula


= + 2

Aonde:
o limite inferior da classe;
a frequncia da classe da mediana;
a Soma das frequncias anteriores a classe da mediana;
a amplitude da classe da mediana.

Centro Universitrio So Camilo. Todos os direitos reservados


Exemplo

Intervalos de classe Freqncia absoluta Freqncia acumulada


12,51 a 13,50 3 3
13,51 a 14,50 8 11
14,51 a 15,50 15 26
15,51 a 16,50 13 39
16,51 a 17,50 9 48
17,51 a 18,50 2 50

1. Calcula-se n/2 50/2


2. Identifica-se a classe da mediana - Terceira classe

Centro Universitrio So Camilo. Todos os direitos reservados


...continuando

3. Utiliza-se a frmula:


= + 2

= 14,51
= 15
= 11
= 0,99
25 11 0,99
= 14,51 + = 15,434
15

Centro Universitrio So Camilo. Todos os direitos reservados


Moda

Definio
o valor que ocorre com mais frequncia. Representada por Mo.
Numa amostra, Mo pode no existir ou ser mltipla (amostra
multimodal).

Exemplos:
Na amostra 21 24 27 27 28 28 31 31 31 Mo = 31
Na amostra 45 46 49 52 52 60 60 76 79 tem moda 52 e 60

Centro Universitrio So Camilo. Todos os direitos reservados


Moda para Dados Agrupados

Utiliza-se a frmula de King:


1
= +
1 + 2
Aonde:
o limite inferior da classe modal = 14,51
1 a diferena entre a frequncia da classe e a anterior = 7
2 a diferena entre a frequncia da classe e a posterior = 2
a amplitude da classe modal = 0,99

Centro Universitrio So Camilo. Todos os direitos reservados


Moda para Dados Agrupados

Notas Nmero de Alunos


0 |- 20 2
20 |- 40 7
40 |- 60 23
60 |- 80 16
80 |- 100 3
Total 51

Determinar a classe modal pela maior frequncia absoluta. Na tabela, a terceira, utilizando
a frmula:
1
= +
1 + 2

Centro Universitrio So Camilo. Todos os direitos reservados


...continuando

Onde:
- limite inferior da classe modal = 40
1 - diferena entre a frequncia da classe e a anterior = 16
2 - diferena entre a frequncia da classe e a posterior = 7
- amplitude da classe modal = 20

1 16
= + = 40 + 20 = 53,91
1 + 2 16 + 7

Centro Universitrio So Camilo. Todos os direitos reservados


Comparao

Para distribuies simtricas, a mdia, mediana e moda so


aproximadamente iguais;

Para assimtricas, observa-se o seguinte:

Centro Universitrio So Camilo. Todos os direitos reservados


Relaes Empricas entre Medidas de Posio

Exemplo
A relao entre mdia e mediana para as amostras a seguir :

A Distribuio Simtrica 10 12 14 16 18 = 14 = = 14
B Distribuio Assimtrica direita 10 12 14 16 23 = 15 > = 14

C Distribuio Assimtrica esquerda 05 12 14 16 18 = 13 < = 14

Centro Universitrio So Camilo. Todos os direitos reservados


Medidas de Disperso

Definio
um valor que busca quantificar o quanto os valores da amostra
esto afastados ou dispersos relativos mdia amostral;
As medidas utilizadas para representar disperso so:
2.1 Amplitude Total
2.2 Desvio Padro;
2.3 Varincia;
2.4 Amplitude Interquartlica.

Centro Universitrio So Camilo. Todos os direitos reservados


Amplitude Total

Definio
Tambm chamado simplesmente de Amplitude, a diferena
entre o maior e o menor valor de um conjunto de dados.

= ( )

A amplitude muito fcil de ser calculada, mas como depende


apenas dos valores maior e menor, no to til quanto as outras
medidas de variao que usam todos os valores.

Centro Universitrio So Camilo. Todos os direitos reservados


Amplitude Total

Exemplo

8,5 8,7 8,9 10,1 10,5 10,7 11,5 11,9

A amplitude total: = 11,9 8,5 = 3,4

Centro Universitrio So Camilo. Todos os direitos reservados


Desvio Padro

Definio
uma medida da variao dos valores em torno da mdia em um
conjunto de valores amostrais.
Representado por s (para amostral) e (para populacional).

Centro Universitrio So Camilo. Todos os direitos reservados


Desvio Padro

Para uma populao de N indivduos:


1
= =1 2 ;;

Para uma amostra de n observaes, x1, ..., xn :
1 1 2
= =1 2; =
2
1 1 =1

Aonde:
o valor de cada varivel;
a mdia amostral e a mdia populacional.

Centro Universitrio So Camilo. Todos os direitos reservados


Desvio Padro

Exemplo
Para a amostra 10 12 14 16 18:
A mdia 14 e o desvio-padro calculado:
Os desvios de cada valor em relao mdia totalizam zero, pois a mdia
o valor central:
10 14 = 4
12 14 = 2
14 14 = 0
16 14 = +2
18 14 = +4
1014 2 + 1214 2 + 1414 2 + 1614 2 + 1814 2
= = 3,16
1

Centro Universitrio So Camilo. Todos os direitos reservados


Desvio padro: dados agrupados

12,58 12,97 13,45 13,53 13,59 13,61 13,62 13,78 13,97 14,21 Intervalos de Frequncia
Classe Absoluta
14,47 14,51 14,53 14,58 14,65 14,78 14,83 14,97 15,06 15,13
12,50 a 13,50 3
15,17 15,23 15,29 15,37 15,40 15,45 15,51 15,62 15,67 15,73
13,51 a 14,50 8
15,83 15,98 16,01 16,11 16,17 16,23 16,35 16,43 16,49 16,52 14,51 a 15,50 15 Ponto mdio do intervalo
16,67 16,83 16,97 17,05 17,13 17,22 17,3 17,48 17,8 18,47 15,51 a16,50 13
16,51 a 17,50 9
17,51 a 18,50 2

3 13 15,46 2 + 8 14 15,46 2 +15 15 15,46 2 + 13 16 15,46 2 +9 17 15,46 2 + 2 18 15,46 2


= = 1,308
50

Centro Universitrio So Camilo. Todos os direitos reservados


Coeficiente de Variao

Definio
Para um conjunto de dados amostrais ou populacionais, expresso
como um percentual, descreve o desvio padro relativo mdia, e
dado pelo seguinte:

Para populao: =


Para amostra: =

Centro Universitrio So Camilo. Todos os direitos reservados


Coeficiente de Variao

uma medida dimensional, til para comparar resultados de


amostras ou populaes cujas unidades podem ser diferentes;

Uma desvantagem do coeficiente de variao que ele deixa de


ser til quando a mdia prxima de zero.

Centro Universitrio So Camilo. Todos os direitos reservados


Varincia

Definio
uma medida da variao igual ao quadrado do desvio padro. Representada
por s2 ou 2;
1
Para a populao: 2 = =1 2

1
Para a amostra: s 2 = =1 2
1

Aonde:
o valor de cada varivel;
a mdia amostral e a populacional.

Centro Universitrio So Camilo. Todos os direitos reservados


Varincia

Uma dificuldade que a varincia no expressa nas mesmas


unidades dos dados originais;
Exemplo
Em uma amostra o desvio padro de 7,0 minutos; a varincia
dada em unidade de min2;
varincia amostral = s2 = 7,02 = 49,0 min2

Centro Universitrio So Camilo. Todos os direitos reservados


Amplitude Interquartlica

Definio
a amplitude do intervalo entre o primeiro e o terceiro quartil.
Representada por Q;

= 3 1

s vezes tambm usada a semiamplitude interquartlica, que a


metade da anterior.

Centro Universitrio So Camilo. Todos os direitos reservados


Amplitude Interquartlica

Trata-se de uma medida de variabilidade bastante robusta, que


pouco afetada pela presena de dados atpicos;

Guarda a seguinte relao aproximada com o desvio-padro:


4 4
= ou =
3 3

Centro Universitrio So Camilo. Todos os direitos reservados


Medida de Posio

Definio
So medidas que dividem a rea de uma distribuio de
frequncias em regies de reas iguais.

As principais medidas de posio so:


Quartil;
Percentil.

Centro Universitrio So Camilo. Todos os direitos reservados


Quartil

qualquer um dos trs valores que divide o conjunto ordenado de


dados em quatro partes iguais, e assim cada parte representa da
amostra ou populao.

Centro Universitrio So Camilo. Todos os direitos reservados


Quartil

Valores que dividem o conjunto em quatro partes iguais so representados por


Q1, Q2, Q3 e denominam-se primeiro, segundo e terceiro quartis,
respectivamente:
Q1 separa os 25% inferiores dos 75% dos superiores;
Q2 a mediana;
Q3 separa os 75% inferiores dos 25% dos superiores.

Centro Universitrio So Camilo. Todos os direitos reservados


Quartil

Para dados agrupados:

Determinao de Q1:
1 Passo: calcula-se n/4
2 Passo: Identifica-se a classe Q1 pela Fac


Aplica-se a frmula: 1 = 1 + 4
1

Centro Universitrio So Camilo. Todos os direitos reservados


Quartil

Para dados agrupados:

Determinao de Q3:
1 Passo: calcula-se 3n/4
2 Passo: Identifica-se a classe Q3 pela Fac
3

Aplica-se a frmula: 3 = 3 + 4
3

Centro Universitrio So Camilo. Todos os direitos reservados


Percentil

um valor que divide o conjunto ordenado de dados em cem


partes iguais, e assim cada parte representa 1/100 da amostra ou
populao.
O k-simo percentil Pk corresponde a frequncia cumulativa de N
k/100, onde N o tamanho amostral.


=
100
(arredondar para o inteiro mais prximo)

Centro Universitrio So Camilo. Todos os direitos reservados


Percentil

Para dados agrupados:




= + 100

{1,2,3,4, , 96,97,98,99,100}
Aonde:
o limite inferior de
a soma das frequncias anteriores de
a amplitude da classe de
a frequncia da classe

Centro Universitrio So Camilo. Todos os direitos reservados


Percentis: Exemplo com Dados Agrupados

Intervalos de classe Frequncia absoluta Frequncia acumulada


12,51 a 13,50 3 0,06
13,51 a 14,50 8 0,22
14,51 a 15,50 15 0,52
15,51 a 16,50 13 0,78
16,51 a 17,50 9 0,96
17,51 a 18,50 2 1

1 Quartil = 25 Percentil
25 50
11 1,01
100
25 = 14,51 + = 14,51 + 0,1 = 14,52
15
Centro Universitrio So Camilo. Todos os direitos reservados
Relaes

1 quartil = 25 percentil;
Mediana = 5 decil = 50 percentil;
3 quartil = 75 percentil.

Centro Universitrio So Camilo. Todos os direitos reservados


Diagrama de caixa e bigode (Box-plot)

Centro Universitrio So Camilo. Todos os direitos reservados


Diagrama de caixa e bigode (Box-plot)

BS: Barreira Superior = Mximo

Q3: Terceiro Quartil


Q2: Segundo Quartil = Mediana

Q1: Primeiro Quartil

BI: Barreira Inferior = Mnimo

Centro Universitrio So Camilo. Todos os direitos reservados


Diagrama de caixa e bigode (Box-plot)

BS: Barreira Superior = Q 3 1,5 ( Q 3 Q 1 )

Q3: Terceiro Quartil


Q2: Segundo Quartil = Mediana

Q1: Primeiro Quartil

BI: Barreira Inferior = Q 1 1,5 ( Q 3 Q 1 )

PE: Pontos Extremos (outliers)

Centro Universitrio So Camilo. Todos os direitos reservados


Medida de Assimetria e Curtose

As medidas de assimetria possibilitam analisar uma distribuio


de acordo com as relaes entre suas medidas de moda, mdia
e mediana, quando observadas graficamente ou analisando
apenas os valores;

Uma distribuio dita simtrica quando apresenta o mesmo valor


para a moda, a mdia e a mediana;

dita assimtrica quando essa igualdade no ocorre.

Centro Universitrio So Camilo. Todos os direitos reservados


Medida de Assimetria e Curtose

Para o clculo de assimetria, usa-se o coeficiente de assimetria de


Pearson:

Valores entre -1 e +1.

Centro Universitrio So Camilo. Todos os direitos reservados


Medida de Assimetria e Curtose

Quando a cauda da curva da distribuio declina para direita, temos uma


distribuio com curva assimtrica positiva;
Coeficiente > 0.

Centro Universitrio So Camilo. Todos os direitos reservados


Medida de Assimetria e Curtose

Quando a cauda da curva da distribuio declina para esquerda, temos uma


distribuio com curva assimtrica negativa;
Coeficiente < 0;

Centro Universitrio So Camilo. Todos os direitos reservados


Medida de Assimetria e Curtose

Assimetria positiva Simetria Assimetria negativa

Centro Universitrio So Camilo. Todos os direitos reservados


Medida de Assimetria e Curtose

Definio
Curtose o grau de achatamento da distribuio. Ou o quanto uma curva de
frequncia ser achatada em relao a uma curva normal de referncia.

Para o clculo da curtose, usa-se o coeficiente de curtose de Pearson:


4 4
4 = , onde 4 = ;
4
Pode ser:
Mesocrtica (4 = 3);
Leptocrtica (4 > 3);
Platocrtica (4 < 3);

Centro Universitrio So Camilo. Todos os direitos reservados


Medida de Assimetria e Curtose

Mesocrtica

Platocrtica

Leptocrtica

Centro Universitrio So Camilo. Todos os direitos reservados


Formas de distribuies

Os grficos de frequncias, histogramas, diagramas do-nos


informao quanto forma da distribuio dos dados (e
consequentemente da populao de onde foram retirados)
Existem distribuies de vrios tipos:
unimodais, bimodais e multimodais

Centro Universitrio So Camilo. Todos os direitos reservados


Formas de distribuies

Centro Universitrio So Camilo. Todos os direitos reservados


Exerccios

1) Foram feitas coletas do tempo (ms) de acesso de uma pgina na


internet e obteve-se os valores:

85,3 84,3 79,5 82,5 80,2 84,6 79,2 70,9 78,6 86,2 74,0 83,7

Calcule:
a) Mdia
b) Mediana
c) Desvio Padro

Centro Universitrio So Camilo. Todos os direitos reservados


Exerccios

2) Dada a amostra:
28 33 27 30 31 30 33 30 33 29 27 33 31 27 31 28 27 29 31 24 31 33 30
32 30 33 27 33 31 33 23 29 30 24 28 34 30 30 18 17 18 15 16 17 17 18
19 19 20 29

a) Construir a tabela com a distribuio de frequncia;


b) Calcular a mdia;
c) Moda;
d) Mediana;
e) O coeficiente de variao;
f) Determinar a curtose.

Centro Universitrio So Camilo. Todos os direitos reservados


Exerccios

3) O Sr. Malaquias, respondeu a 2 anncios de oferta de emprego. As


empresas trabalham no mesmo ramo, pelo que o servio que o Sr.
Malaquias iria fazer seria semelhante em qualquer das empresas. Resolveu
saber alguma coisa sobre os ordenados processados nos dois stios, tendo
obtido a seguinte informao:
Empresa A Empresa B
Mdia R$ 445 R$ 475
Mediana R$ 400 R$ 350
Desvio padro R$ 160 R$ 190

Qual das empresas aconselharia o Sr. Malaquias a escolher? Explique porqu.

Centro Universitrio So Camilo. Todos os direitos reservados

You might also like