You are on page 1of 9

Estatstica Descritiva: tabelas, grficos e medidas descritivas

Curso: Especializao em Administrao Financeira Disciplina: Mtodos Quantitativos Aplicados a Finanas Tabelas de frequncias Tabelas de contingncia Grficos Medidas de localizao Medidas de disperso Medidas de assimetria Medidas de achatamento (curtose)
FEAAC-UFC Slvia Pedro Rebouas 2

2. Estatstica Descritiva
Professora Adjunta Slvia Pedro Rebouas smdpedro@gmail.com
2013

TABELAS DE FREQUNCIAS
Estabelecem correspondncias entre os valores observados da varivel estatstica e as respetivas frequncias (distribuio de frequncias). Notao utilizada: ni = frequncia absoluta de ordem i fi = frequncia relativa de ordem i Ni = frequncia absoluta acumulada de ordem i Fi = frequncia relativa acumulada de ordem i n = dimenso da amostra k = nmero de classes ou categorias (k n)
FEAAC-UFC Slvia Pedro Rebouas 3

Como organizar dados qualitativos?


Os dados qualitativos so, por definio, caracterizados por categorias. simples a forma de os organizarmos. A ttulo de exemplo, vejamos como organizar respostas dadas por 110 clientes a algumas questes integrantes de um questionrio:

FEAAC-UFC

Slvia Pedro Rebouas

3 Como classifica a sua qualidade de vida? 1 Qual o seu sexo?


Feminino Masculino
Categoria Feminino Masculino Total ni 64 46 110 fi 0,58 0,42 1

Muito boa: no podia ser melhor Boa Mais ou menos: boa e m em partes iguais M Muito m: no podia ser pior
Categoria Muito boa Boa Mais ou menos M Muito m Total
5 FEAAC-UFC

2 Qual o seu estado civil? Categoria


Casado Solteiro Divorciado Vivo
Casado Solteiro Divorciado Vivo Total
Slvia Pedro Rebouas

ni 52 32 18 8 110

fi 0,47 0,29 0,16 0,07 1

ni 10 28 47 20 5 110

Ni 10 38 85 105 110

fi 0,09 0,25 0,43 0,18 0,05 1

Fi 0,09 0,35 0,77 0,95 1,00

FEAAC-UFC

Slvia Pedro Rebouas

Exemplo: Como organizar dados quantitativos?


Em tabelas de frequncias: no agrupadas; agrupadas. Para estudar a mobilidade da nossa sociedade, uma empresa de consultoria inquiriu 47 indivduos e perguntou-lhes quantas vezes, nos ltimos 3 anos, mudaram de residncia. As respostas foram:
5 0 2 0 4 1
7 FEAAC-UFC

1 0 4 0 5 4

0 1 0 3 0 3

1 1 2 0 2 0

1 1 4 0 3 7

1 1 0 6 0 2

5 3 0 1 4 0

3 0 3 2 0

FEAAC-UFC

Slvia Pedro Rebouas

Slvia Pedro Rebouas

Agrupamento de dados em classes


Tabela de frequncias no agrupada:
Resposta 0 1 2 3 4 5 6 7 Total ni 16 10 5 6 5 3 1 1 47 Ni 16 26 31 37 42 45 46 47 fi 0,34 0,21 0,11 0,13 0,11 0,06 0,02 0,02 1 Fi 0,34 0,55 0,66 0,79 0,89 0,96 0,98 1,00

Qual o nmero apropriado de classes? Regra de Sturges: k I(log2 n) + 1


sendo n a dimenso da amostra e I(x) a parte inteira de x, ou seja o arredondamento de x, por defeito, s unidades.

log 2 n =

ln n ln 2

PESTANA, D.; VELOSA, S. Introduo Probabilidade e Estatstica. Volume 1, Lisboa: Fundao Calouste Gulbenkian, 2002.

Qual a amplitude de cada classe?


h=
9

Amplitude de Variao Amostral Mximo Mnimo = k k


Slvia Pedro Rebouas 10

FEAAC-UFC

Slvia Pedro Rebouas

FEAAC-UFC

Exemplo
Mediram-se as alturas (em cm) de 20 adolescentes.

Para n = 20, k = 5 (Regra de Sturges) Amplitude de variao amostral = 174 149 = 25 cm Amplitude de cada classe: h = 25/5 = 5 cm Tabela de frequncias:
Classe [149; 154[ [154; 159[ [159; 164[ [164; 169[ [169; 174] Total
11 FEAAC-UFC

ni 4 4 4 3 5 20

Ni 4 8 12 15 20

fi 0,20 0,20 0,20 0,15 0,25 1

Fi 0,20 0,40 0,60 0,75 1,00

Os resultados obtidos foram:


174 151 163 173
FEAAC-UFC

157 170 150 166

158 172 149 165


Slvia Pedro Rebouas

156 171 162 160

160 164 153 158

Slvia Pedro Rebouas

12

EXEMPLO 2:

TABELAS DE CONTINGNCIA
Usam-se para cruzar a informao de duas variveis. So tabelas de dupla entrada, sendo cada entrada relativa a uma das variveis. Podem conter: frequncias absolutas; frequncias relativas.
FEAAC-UFC Slvia Pedro Rebouas 13

Populao residente em Portugal, segundo o sexo, por distribuio geogrfica (NUTS II)
Sexo Distribuio geogrfica (NUTS II) Masculino Feminino Norte Centro Lisboa e Vale do Tejo Alentejo Algarve Aores Madeira TOTAL 856 627 262 396 195 725 119 486 115 211 925 551 273 357 199 493 122 277 129 800 TOTAL

1 782 931 1 904 362 3 687 293 1 782 178 535 753 395 218 241 763 245 011 1 667 765 1 801 136 3 468 901

5 000 141 5 355 976 10 356 117


Slvia Pedro Rebouas 14

Fonte: XIV Recenseamento da Populao (INE, 2001)


FEAAC-UFC

Grupos de Complexidade Organizacional Quantidade Baixa complexidade % Mdia baixa complexidade Mdia alta complexidade Quantidade % Quantidade % Quantidade Alta complexidade % Quantidade Total %

Nvel de Governana Corporativa MT 4 16,7% 5 21,7% 3 12,5% 7 N1 1 4,2% 1 4,3% 2 8,3% 11 N2 3 12,5% 3 13,0% 2 8,3% 1 4,2% 9 9,5% NM 16 66,7% 14 60,9% 17 70,8% 5 20,8% 52 54,7%

Total 24 100,0% 23 100,0% 24 100,0% 24

GRFICOS
Grfico circular ou de setores
Grfico circular da imagem que os clientes tm de uma instituio bancria
Mau Excelente 13,45% Regular 19,34% 8,20%

29,2% 45,8% 19 15

100,0% 95 100,0%

Muito bom 21,18%

20,0% 15,8%

Bom 37,83%

Fonte: De Luca, M.M.; Assuno, R.R.; Vasconcelos, A.C. & Rebouas, S.P. Complexidade organizacional e governana corporativa nas maiores companhias abertas do Brasil, trabalho no publicado, 2013.
FEAAC-UFC Slvia Pedro Rebouas 15 FEAAC-UFC

Slvia Pedro Rebouas

16

Histograma
Para o construir, desenham-se barras rectangulares. As bases so iguais aos intervalos de classe e as alturas so as respectivas frequncias (absolutas ou relativas). Histograma do ndice de satisfao dos clientes com a instituio bancria

Diagrama de barras
Utilizam-se para apresentar variveis qualitativas ou quantitativas discretas.
Diagramas de barras dos indicadores da satisfao dos pacientes com uma internao hospitalar, referentes ao pessoal mdico
35 30 25 20 (%) 15 10 5 0 Ateno prestada Disponibilidade ao seu estado de sade Excelente Cuidados e carinho Aspectos tcnicos Informao fornecida Coordenao

Muito Bom

Bom

Regular

Mau

FEAAC-UFC

Slvia Pedro Rebouas

17

FEAAC-UFC

Slvia Pedro Rebouas

18

Diagrama de disperso
Frana Holanda Cuba

MEDIDAS DE LOCALIZAO Tendncia Central


Tm como objetivo comum a determinao do centro do conjunto dos dados. Conforme a interpretao que damos palavra centro assim usamos diferentes medidas . As medidas de localizao incluem: A mdia; A mediana; A moda.
19 FEAAC-UFC Slvia Pedro Rebouas 20

80

Esperana de vida feminina

Equador Tailndia Turquia Marrocos

70

China Botswana

60
Camares Somlia

50

R Sq Linear = 0,918

Tanznia Zmbia

10,0

20,0

30,0

40,0

50,0

Taxa de nascimento por 1000 pessoas

FEAAC-UFC

Slvia Pedro Rebouas

Mdia aritmtica
EXEMPLO 1:

x
x=
i =1

EXEMPLO 2:

Considere-se o tempo, em minutos, que 12 funcionrios demoram a realizar determinada tarefa:


50 86 66 55 62 60 77 82 70 64 58 74

Pretende-se estimar o tempo mdio de vida (em horas) de determinado tipo de bactrias. Para uma amostra de 9 observaes, obtiveram-se os seguintes dados:
12,4 11,2 12,4 13,5 15,1 14,3 13,6 10,6 113,5

A mdia aritmtica dos dados apresentados :

A mdia aritmtica :

x=
FEAAC-UFC

50 + 86 + L + 74 804 = = 67 min 12 12
Slvia Pedro Rebouas 21

x=
FEAAC-UFC

12,4 + 13,5 + L + 113,5 216,6 = = 24,07 horas 9 9


Slvia Pedro Rebouas 22

Comentrios:
Todos os valores observados excepo de um, esto no intervalo [10,6; 15,1]. A mdia aritmtica (24,07 horas) est muito afastada deste intervalo. O valor 113,5 horas inflacionou bastante a mdia! Ter sido realmente observado? Ter ocorrido um erro de digitao? Se o valor correcto for 13,5, a mdia passa a ser de 12,96 horas (bastante mais razovel). A mdia uma medida muito sensvel a outliers.
FEAAC-UFC Slvia Pedro Rebouas 23

EXEMPLO 3:

Os dados que se seguem dizem respeito ao nmero de eventos em que participaram, nos ltimos 5 anos, 6 professores:
8 5 7 4 3 6

A mdia aritmtica dos dados apresentados :

x=
FEAAC-UFC

8 + 7 + L + 6 33 = = 5,5 eventos 6 6
Slvia Pedro Rebouas 24

A tabela seguinte apresenta os valores observados e os respectivos desvios em relao mdia:


xi 8 7 3 5 4 6 33
FEAAC-UFC

EXEMPLO 4: dados organizados numa tabela de frequncias (no agrupados) Registou-se o n. de deslocaes superiores a 100 km realizadas no ltimo semestre pelos funcionrios de uma empresa, representado pela varivel X e caracterizada por: xi ni Ni fi Fi ni xi
3 4 7 8 12 Total
k

di 8 - 5,5 = 2,5 7 - 5,5 = 1,5 3 - 5,5 = -2,5 5 - 5,5 = -0,5 4 - 5,5 = -1,5 6 - 5,5 = 0,5 0

PROPRIEDADE: A soma dos desvios em relao mdia nula (os desvios positivos e os negativos anulam-se).

2 5 8 4 7 26
i i

2 7 15 19 26

0,08 0,19 0,31 0,15 0,27 1

0,08 0,27 0,58 0,73 1,00

6 20 56 32 84 198

(x
i =1

x) = 0
x=
25 FEAAC-UFC

n x
i =1

x=

198 = 7,6 deslocaes 26


26

Slvia Pedro Rebouas

Slvia Pedro Rebouas

EXEMPLO 5: dados organizados numa tabela de frequncias (em classes)


Classe [149; 154[ [154; 159[ [159; 164[ [164; 169[ [169; 174] Total
k

Mdia ponderada
Utiliza-se quando se pretende atribuir uma ponderao (peso) diferente a cada um dos valores observados.

ni 4 4 4 3 5 20

Ni 4 8 12 15 20

fi 0,20 0,20 0,20 0,15 0,25 1

Fi 0,20 0,40 0,60 0,75 1,00

mi 151,5 156,5 161,5 166,5 171,5 807,5

ni mi 606 626 646 499,5 857,5 3235

w
x=
i =1 n i =1

xi
i

n m
i

x
FEAAC-UFC

i =1

= f i mi
i =1

3235 = 161,75 cm 20
27

Um exame 3 vezes mais importante do que um teste. Se uma aluno tiver 17 valores no exame e 2 testes de 14 e 15 valores, qual ser a classificao mdia?
x=
FEAAC-UFC

114 + 115 + 3 17 80 = = 16 valores 5 5


Slvia Pedro Rebouas 28

Slvia Pedro Rebouas

Mediana
A mediana (Me) o valor da observao da varivel estatstica que divide a amostra em dois grupos com igual nmero de elementos. mais resistente do que a mdia face presena de valores anmalos (outliers). O seu clculo requer a prvia ordenao dos valores numricos, seguidamente: se n mpar, a mediana o elemento mdio; se n par, a mediana a mdia aritmtica das duas observaes centrais.
FEAAC-UFC Slvia Pedro Rebouas 29

EXEMPLOS: Considerem-se os seguintes dados: 1, 4, 5, 9, 28. Qual a mediana dos dados? Resposta: A mediana 5. Qual a mediana dos dados: 4, 10, 2, 7? Resposta: Para se calcular a mediana, os dados tm que estar ordenados. Considere-se ento a ordenao crescente: 2, 4, 7, 10. A mediana (4+7)/2 = 5,5.
FEAAC-UFC Slvia Pedro Rebouas 30

Moda
Chama-se moda (Mo) de um conjunto de n observaes de uma varivel estatstica, observao que ocorre com maior frequncia. A moda apenas leva em conta o valor com maior frequncia e no a posio desse valor no conjunto dos dados. Um conjunto de dados pode ser amodal (no tem moda), unimodal (tem 1 moda), bimodal (tem 2 modas) e assim sucessivamente.
FEAAC-UFC Slvia Pedro Rebouas 31

EXEMPLOS: Se tivermos o seguinte conjunto de dados: 1, 4, 1, 0, 2, 1, 1, 3, 2, 9, 1, 2 O elemento que ocorre com maior frequncia o nmero 1, que aparece 5 vezes. A moda o valor 1. Considerem-se os valores observados para o nmero de camas existentes em cada um dos quartos de um hospital: 3, 4, 9, 8, 2, 6, 7, 3, 4, 3, 7, 5, 3 A moda 3 camas.
FEAAC-UFC Slvia Pedro Rebouas 32

MEDIDAS DE LOCALIZAO Tendncia No Central: Quantis


Dividem as observaes em conjuntos com igual nmero de elementos. Mediana: divide os dados em 2 partes iguais. Quartis: dividem os dados em 4 partes iguais. Decis: dividem os dados em 10 partes iguais. Percentis: dividem os dados em 100 partes iguais.

Clculo dos quantis


xnp + xnp +1 quantil = 2 x[ np ]+1 se np for inteiro se np no for inteiro

onde [np] = caracterstica de np p = 0,25 para o clculo de Q1 p = 0,20 para o clculo de D2 p = 0,75 para o clculo de P75

Quartis - Exemplos
Considere-se a amostra: 2, 5, 6, 9, 10, 13, 15 Q1 = x 2 = 5 (p = 0,25 np = 1,75) Me = Q2 = D5 = P50 = x4 = 9 (p = 0,50 np = 3,5) Q3 = P75 = x6 = 13 (p = 0,75 np = 5,25) Para a amostra: 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 Q1 = (x3+x4)/2 = (2+3)/2 = 2,5 (p = 0,25 np = 3) Q2 = (x6+x7)/2 = (5+6)/2 = 5,5 (p = 0,50 np = 6) Q3 = (x9+x10)/2 = (9+9)/2 = 9 (p = 0,75 np = 9)

MEDIDAS DE DISPERSO
Amplitude de variao amostral

A = max( X i ) min( X i )
EXEMPLO: Para os seguintes nmeros de cotistas de 7 fundos de investimento: {2, 5, 6, 9, 10, 13, 15} A = 15 2 = 13 cotistas
FEAAC-UFC Slvia Pedro Rebouas 36

Amplitude inter-quartil

Varincia amostral
Para medir a disperso dos dados em torno da mdia usa-se, ento, a varincia amostral, que leva em considerao o tamanho da amostra:

Amplitude Inter Quartil = Q3 Q1


EXEMPLOS: Para a amostra: {2, 5, 6, 9, 10, 13, 15}, temos: Q1 = 5 Q3 = 13 Amplitude Inter-Quartil = 13 5 = 8 Para a amostra: {1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13}: Q1 = 2,5 Q3 = 9 Amplitude Inter-Quartil = 9 2,5 = 6,5
FEAAC-UFC Slvia Pedro Rebouas 37

(x x)
i

x
=
i =1

s2 =

i =1

x2

Uma vez que a varincia envolve a soma de quadrados, a unidade em que se exprime no a mesma que a dos dados. O desvio padro veio resolver este problema.
FEAAC-UFC Slvia Pedro Rebouas 38

Varincia amostral Desvio padro amostral


O desvio padro amostral permite medir a variabilidade dos dados em relao mdia e dado pela raz quadrada da varincia amostral:
n n

Desvio padro amostral


2

(x x)
i

x
=
i =1

s =

i =1

(x x)
i

x
=
i =1

s=

i =1

x2

Para 6 funcionrios, o nmero de faltas num trimestre foi:


x 1 3 2 0 7 5 18
39 FEAAC-UFC

EXEMPLO:
d -2 0 -1 -3 4 2 0

(x x)
i

x
=
i =1

s=
FEAAC-UFC

i =1

d 4 0 1 9 16 4 34

x=

1 + 3 + 2 + 0 + 7 + 5 18 = = 3 dias 6 6

s2 =
s=

34 = 5,67 dias 2 6
34 = 2,38 dias 6
40

Slvia Pedro Rebouas

Slvia Pedro Rebouas

Para dados em tabelas no agrupados:

Para dados agrupados em k classes:

n (x x)
i i

n x
=
i =1

2 i i

EXEMPLO:
x 55 65 75 85 95 105 115 595
FEAAC-UFC

s=
nx 440 650 1 200 1 190 950 525 230 5 185

i =1

x2

n (m x )
i i

n m
i

2 i

s=

i =1

EXEMPLO:
Classe [0; 30[ [30; 60[ [60; 90[ [90; 120[ [120; 150[ [150; 180[ 0
FEAAC-UFC

n
2

i =1

x2

n 8 10 16 14 10 5 2 65

nx2 24 200 42 250 x= 90 000 101 150 90 250 55 125 s= 26 450 429 425
Slvia Pedro Rebouas

n x
i =1

i i

5185 = 79,769 65

429 425 79,769 2 = 15,60 65


41

n 3 9 20 22 13 8 75

m 15 45 75 105 135 165 540

nm 45 405 1 500 2 310 1 755 1 320 7 335

6 nm ni mi 675 7 335 i =1 x = = = 97,8 18 225 n 75 112 500 242 550 236 925 s = 828 675 97,8 2 = 38,525 75 217 800 828 675

Slvia Pedro Rebouas

42

Volatilidade
A volatilidade pode ser definida como uma medida de disperso. A forma convencionada para mensurar e comparar a volatilidade das diferentes variveis por meio do clculo dos desvios padro das variveis. Por exemplo, a volatilidade dos diferentes preos unitrios (PUs) de negociao de um ttulo pblico em determinado dia ser o desvio padro das diferentes cotaes do ttulo.
http://www.derivativoserisco.com.br/download/revisaoestatistica.pdf
FEAAC-UFC Slvia Pedro Rebouas 43 FEAAC-UFC

Desvio mdio

| x x | | d
i

Desvio mdio =
EXEMPLO:
xi 8 7 3 5 4 6 33

i =1

n
di |d i | 2.5 1.5 2.5 0.5 1.5 0.5 9

i =1

2.5 1.5 -2.5 -0.5 -1.5 0.5 0

Desvio mdio =

9 = 1,5 6

Slvia Pedro Rebouas

44

EXEMPLO 1:

Coeficiente de variao amostral


O coeficiente de variao dado pelo quociente(razo) entre o desvio padro e a mdia aritmtica: s cv = x Este coeficiente uma medida de disperso relativa, ao contrrio do desvio padro que uma mediada de disperso absoluta. uma medida adimensional, til para comparar a disperso entre dois grupos de dados.
FEAAC-UFC Slvia Pedro Rebouas 45

Considerem-se os valores observados para as estaturas e os pesos de um grupo de indivduos:


Estatura (cm ) Peso (kg ) Mdia 176 68 Desvio Padro 5 2 cv 0.028 0.029

As estaturas apresentam uma disperso relativa ligeiramente menor do que os pesos (o que no se verifica se compararmos a disperso absoluta). Como as duas variveis so expressas em unidades diferentes, a disperso que se deve comparar a relativa e no a absoluta.
FEAAC-UFC Slvia Pedro Rebouas 46

EXEMPLO 2: Imaginem-se dois grupos de empresas: No primeiro grupo, as empresas tm idades: 3, 1 e 5. No segundo grupo, as empresas tm idades: 55, 57 e 53. No primeiro grupo, a mdia de idade 3 anos e, no segundo grupo, a mdia de idade 55 anos. Nos dois grupos a disperso absoluta dos dados, medida pelo desvio padro 2 anos. Mas, as diferenas de 2 anos so muito mais importantes no primeiro grupo, que tem mdia 3, do que no segundo grupo, que tem mdia 55.
FEAAC-UFC Slvia Pedro Rebouas 47

No primeiro grupo: cv = 2/3 = 0,6667 No segundo grupo: cv = 2/55 = 0,0364 Um coeficiente de variao igual a 0,6667 indica que a disperso dos dados em relao mdia muito grande, ou seja, a disperso relativa alta. Um coeficiente de variao de 0,0364 indica que a disperso dos dados em relao mdia pequena. O coeficiente de variao mede em termos relativos a disperso em relao mdia.
FEAAC-UFC Slvia Pedro Rebouas 48

ASSIMETRIA
O mtodo mais simples para se medir o grau de assimetria de uma distribuio consiste na comparao de 3 medidas de tendncia central: a mdia, a mediana e a moda.

Grfico Box-and-Whisker (Caixa de bigodes)

FEAAC-UFC

Slvia Pedro Rebouas

49

Estudo da assimetria da distribuio por observao da caixa de bigodes


Assimetria positiva Simetria Assimetria negativa

CURTOSE
As medidas de achatamento (ou curtose) indicam a intensidade das frequncias na vizinhana dos valores centrais.

FEAAC-UFC

Slvia Pedro Rebouas

52

You might also like