You are on page 1of 20

Estatstica e Probabilidades

INDCE
INTRODUO .......................................................................................................................................... 2 1. QUADRO DE FREQUNCIA PARA DADOS ORGANIZADOS EM CLASSES OU INTERVALO ...................... 3 1.1. Dados Agrupados em Classes .................................................................................................... 3 1.2. Distribuio de frequncias de dados agrupados em classes. .................................................... 4 2. REPRESENTAO GRFICA (HISTOGRAMA) ...................................................................................... 6 3. Medidas de Tendncia Central: Mdia, moda e mediana ................................................................. 8 3.1. Mdia ....................................................................................................................................... 8 3.2. Moda ...................................................................................................................................... 10 3.3. Mediana ................................................................................................................................. 10 4. MEDIDAS DE DISPERSO (MEDIDAS DE VARIABILIDADE) ................................................................ 12 4.1. Raze que justificam o calculo de uma medida de disperso ................................................... 12 4.2. Amplitude do intervalo de variao ......................................................................................... 13 4.3. Amplitude do intervalo interquartis ........................................................................................ 13 4.4. Desvio absoluto mdio (dm).................................................................................................... 13 4.5. Coeficiente de variao (cv) .................................................................................................... 14 5. MEDIDAS DE TENDNCIA NO - CENTRAL (Quartis, Decis, Percentis) ............................................ 15 5.1. Quartis (Qi).............................................................................................................................. 15 5.2. Decis(Di): ................................................................................................................................ 16 5.3. Percentis ( Pi ).......................................................................................................................... 18 CONCLUSO .......................................................................................................................................... 19 BIBLIOGRAFIA ........................................................................................................................................ 20

Electrica II 2012

Pag. 1

Estatstica e Probabilidades

INTRODUO A utilizao da Estatstica cada vez mais acentuada em qualquer atividade profissional da vida Moderna onde pretende organizar, sintetizar e analisar os dados obtidos no estudo de variveis relativas a uma populao de modo a permitir caracterizar a populao e conhecer o seu comportamento sendo assim so compilada e sintetizada em tabelas e grficos e atravs do clculo de indicadores numricos. O desafio da Estatstica Descritiva consiste no na prpria construo das tabelas ou dos grficos mas na escolha mais adequada destas ferramentas de modo a caracterizar correctamente as variveis em estudo No clculo de medidas que possibilitem representar um conjunto de dados relativos observao de determinado fenmeno de forma resumida.

Electrica II 2012

Pag. 2

Estatstica e Probabilidades

1. QUADRO DE FREQUNCIA PARA DADOS ORGANIZADOS EM CLASSES OU INTERVALO Constituem-se num caso particular das sries estatsticas, nas quais todos os elementos so fixos. Agora os dados referentes ao fenmeno so apresentados atravs de gradaes, onde feita a correspondncia entre categorias ou valores possveis e as frequncias respectivas.

1.1.Dados Agrupados em Classes 1. Dados Brutos - o conjunto dos dados numricos obtidos aps a coleta dos dados. Isto e nao foram numericamente organizados. Ex: Idade dos alunos selesionado para do curso de engenharia naval, no ano de 1850. 14 - 13 - 12 - 18 - 25 - 11 - 13 - 23 - 24 -14 11 -15 - 26 - 16 - 12 - 20 - 22 - 15 -16 - 23 24 -11 - 21 - 15 - 21 - 16 - 15 - 25 - 23 - 21

2. Rol - o arranjo dos dados brutos em uma determinada ordem crescente ou decrescente. Ex: Utilizando os mesmos dados anteriores: 11 - 11 - 11 - 12 - 12 - 13 - 13 - 14 - 15 - 15 15 - 15 - 16 - 16 - 16 - 18 - 20 - 21 - 21 - 21 22 - 23 - 23 -23 - 24 - 24 - 24 - 25 - 25 - 26 3. Amplitude total ou range (A) - a diferena entre o maior e o menor valor observado da varivel em estudo. Ex: Utilizando os mesmos dados anteriores: A = 26 - 11 = 15.

4. Frequncia absoluta simples (fi) - o nmero de vezes que o elemento aparece na amostra ou onmero de elementos pertencentes a uma classe.

Electrica II 2012

Pag. 3

Estatstica e Probabilidades

5. Frequncia total (ft) - a soma das frequncias simples absolutas de todos os elementos observados

Para melhor os dados, aconselhvel a elaborao de distribuies de frequncia. As tabelas de frequncias podem representar tanto valores individuais como valores agrupados em classes.

1.2.Distribuio de frequncias de dados agrupados em classes. Muitas vezes com o objetivo de resumir os dados originais em uma distribuio de frequncias, utilizaremos os dados agrupados em classes e no mais individualmente. Classe pode ser definida como sendo os subintervalos da Amplitude Total de uma varivel (grupo de valores).

Quando a varivel objeto de estudo for contnua geralmente ser conveniente agrupar os valores observados em classes. Se, por outro lado, a varivel for discreta e o nmero de valores representativos dessa varivel for muito grande, recomenda-se o agrupamento dos dados em classes. Nesse ltimo caso, o procedimento visa a evitar certos inconvenientes, como: Grande extenso da tabela, dificultando, tanto quanto os dados brutos, a leitura e a interpretao dos resultados apurados. O aparecimento de diversos valores da varivel com frequncia nula. Impossibilidade ou dificuldade de visualizao do comportamento do fenmeno como um todo, bem como de sua variao.

Este tipo de tabela informa, de imediato, a tendncia de a srie se concentrar em torno de um valor central, alm de proporcionar uma viso panormica do comportamento da varivel, o que seria impossvel de se fazer a partir da lista dos dados brutos.

Electrica II 2012

Pag. 4

Estatstica e Probabilidades

Ex: Utilizando os mesmos dados anteriores, temos:

I 1 2 3 4 5

Idade 11 | 14 14 | 17 17 | 20 20 | 23 23 | 26 Total

Frequncia ( fi ) 7 8 1 5 9 30

O smbolo | indica a incluso do limite inferior do intervalo naquela classe.

1. Definio do nmero de classes - representado por k. importante que a distribuio conte com um nmero adequado de classes. Se esse nmero for escasso, os dados originais ficaro to comprimidos que pouca informao poder ser extrada desta tabela.

Para determinar o nmero de classes h diversos mtodos. (a) k = 5, para n 25 e k = n , para n > 25.

(b) Frmula de Sturges: K = 1+3, 3 log10 n, onde n o tamanho da amostra

Mesmo tendo outros critrios de determinao do nmero de classes, o que se deve ter em mente que a escolha depender sobretudo da natureza dos dados e da unidade de medida em que eles se encontram, e no somente de regras muitas vezes arbitrrias e pouco flexveis.

Electrica II 2012

Pag. 5

Estatstica e Probabilidades

2. Limites de Classe - Os limites de classe so seus valores extremos. No exemplo anterior de distribuio de frequncia, o valor 11 denominado limite inferior da primeira classe, enquanto o valor 14 denominado limite superior da primeira classe.

3. Amplitude do Intervalo de Classe (h) - A amplitude de um intervalo de classe corresponde ao comprimento desta classe. Numericamente, sua amplitude pode ser definida como a diferena existente entre os limites superior (ou inferior) de duas classes consecutivas.

Ex: Utilizando os mesmos dados anteriores: h = 14 11 = 3

4. Pontos Mdios ou Centrais da Classe (xj) - a mdia aritmtica simples entre o limite superior e o inferior de uma mesma classe. Ex: Utilizando os mesmos dados anteriores:

2. REPRESENTAO GRFICA (HISTOGRAMA) Representao grfica dos dados tem por finalidade representar os resultados obtidos, permitindo chegar-se a concluses sobre a evoluo do fenmeno ou sobre como se relacionam seus valores. A escolha do grfico mais apropriado fica a critrio do analista.

Histograma - um grfico formado por um conjunto de retngulos justapostos, de forma que a rea de cada retngulo seja proporcional frequncia da classe que ele representa.

O tamanho da amostra dado pelo nmero de elementos (ou itens ou observaes) que a compem e pode ser arbitrariamente considerado como pequeno, mdio ou grande, a depender das caractersticas da varivel.

Electrica II 2012

Pag. 6

Estatstica e Probabilidades

Para as amostras mdias e grandes, conveniente classific-las ou agrup-las em subconjuntos, de modo a se ter uma melhor compreenso do padro de variabilidade da varivel em questo.

Esse expediente d origem a diversos tipos de grficos, entre os quais destaca-se o histograma. Para se construir um histograma, necessrio, primeiramente, agrupar as observaes em classes e, em seguida, contar o nmero de ocorrncias, ou seja, a freqncia absoluta em cada classe. O nmero de classes a ser considerado, representado por NC, depende do tamanho da amostra; O essencial para a construo do histograma elaborao da tabela de freqncias, cujo tamanho N = 30. De acordo com as recomendaes mencionadas, o nmero de classes deve estar compreendido entre 5 e 6; tomemos NC = 5. A Tabela abaixo apresenta um resumo do clculo das freqncias absolutas, obtidas pelo nmero de ocorrncias em cada classe,das freqncias relativas, resultantes da diviso das freqncias absolutas por N= 30 e das freqncias relativas acumuladas.

Tabela de Frequncia Idade dos alunos selesionado para do curso de engenharia naval, no ano de 1850.

NC

Intervalo classe (Idade) 11 | 14 14 | 17 17 | 20 20 | 23 23 | 26

de Frequncia Absoluta (fi)

Frequncia relativas (fri)

Freqncias acumuladas(Fri).

1 2

7 8

0,23 0,27

0,23 0,5

0,03

0,53

4 5 Total

5 9 30

0,17 0,30 1,00

0,7 1,00 ----------------

-------------------

Electrica II 2012

Pag. 7

Estatstica e Probabilidades

Com base nos elementos da Tabela, pode-se construir o histograma,o qual um simples grfico de barras tendo, em abscissas, os intervalos de classes e, em ordenadas, as freqncias absolutas e/ou relativas.

importante ressaltar, entretanto, que a forma do histograma muito sensvel ao nmero, largura e aos limites dos intervalos de classe.

3. MEDIDAS DE TENDNCIA CENTRAL: MDIA, MODA E MEDIANA

As medidas de posio so nmeros que resumem e representam caractersticas importantes da distribuio de frequncias e podem apresentar-se de vrias formas, dependendo daquilo que se pretende conhecer a respeito dos dados. As medidas de posio so chamadas de medidas de tendncia central, devido tendncia de os dados observados se concentrarem em torno desses valores centrais que se localizam em torno do meio ou centro de uma distribuio. 3.1.Mdia A mdia uma medida de localizao de tendncia central, sendo representada por X ou por conforme se trate, respectivamente, da mdia amostral (estatstica) ou da mdia populacional (parmetro). A mdia de um conjunto de dados quantitativos obtm-se somando todos os valores e dividindo o resultado pelo n total de valores.
Electrica II 2012 Pag. 8

Estatstica e Probabilidades

3.1.1. Mdia aritmtica para dados agrupados Se o valor da varivel forem agrupados em uma distribuio de frequncias ser usa a mdia aritmtica dos valores x1 x2 x3, , xn ponderadas pelas respectivas frequncias absolutas: f1, f2, f3, , fn. No caso dos dados estarem agrupados em classes a mdia ser dada por:

Onde: xi valores observados da varivel ou ponto mdio das classes f i - frequncia simples absoluta f i = n nmero de elementos da amostra Determinar a media aritmtica da tabela aseguir. I(xi) Idade 1 2 3 4 5 11 | 14 14 | 17 17 | 20 20 | 23 23 | 26 Total Frequncia ( fi ) 7 8 1 5 9 30 7 16 3 20 45 91

Electrica II 2012

Pag. 9

Estatstica e Probabilidades

3.2.Moda Tambm chamada de norma, valor dominante ou valor tpico. Moda de um conjunto de valores o valor que ocorre com maior frequncia, sua aplicao no depende do nvel de mensurao da varivel, sendo aplicada tanto a fenmenos qualitativos quanto quantitativos. Se todos os valores forem diferentes no h moda, por outro lado, um conjunto pode ter mais do que uma moda: bimodal, trimodal ou multimodal

Moda para dados agrupados com classes Para este caso a passos a tomar-se em conta tais como:

1) Identifica-se a classe (a de maior frequncia) 2) Passo: aplica-se a frmula: 1) Processo: Moda bruta :

Sendo, li -.limite inferior da classe modal ls limite superior de classe modal

2) Processo: Frmula de Czuber

3.3.Mediana

A mediana o valor que ocupa a posio central de um conjunto de valores ordenados, ou seja, medida divide a distribuio de valores em duas partes iguais: 50% acima e 50% abaixo do seu valor, por isso a mediana e considerada uma medida separatriz. Quando o conjunto possui quantidade par de valores, h dois valores centrais, neste caso, a mediana o valor mdio dos dois valores centrais do conjunto de dados ordenados.

Electrica II 2012

Pag. 10

Estatstica e Probabilidades

3.3.1. Mediana para dados agrupados em classe 1) Calcula-se a posio; 2) Pela fi identifica-se a classe que contem a Md; 3) Aplica-se a frmula:

Onde, LMd limite inferior da Md = 16 n tamanho da amostra Fa - frequncia acumulada anterior classe da Md H intervalo da classe da Md FMd frequncia simples absoluta da classe da Md 3.3.2. Propriedades da mediana Unicidade. Existe somente uma mediana para um conjunto de dados. Simplicidade. A mediana fcil de ser calculada. A mediana no to afectada pelos valores extremos como a mdia aritmtica, por isso, se diz que a mediana uma medida robusta.

Electrica II 2012

Pag. 11

Estatstica e Probabilidades

4. MEDIDAS DE DISPERSO (MEDIDAS DE VARIABILIDADE)

So medidas utilizadas paa medir o grau de variabilidade, ou disperso dos valores observados em torno da media aritmtica. Servem para verificarmos a representatividade das medidas de localizao (media) e proporcionam conhecer o nvel de homogeneidade ou heterogeneidade dentro de cada grupo analisado. Pois muito comum encontrarmos variveis que, apesar de terem a mesma media, so compostas de valores bem distintos. Estas medidas podem ser divididas em duas categorias. Uma primeira categoria inclui as medidas de distncia, cujos valores se apresentam na mesma unidade de medida dos valores originais e no recorrem, ao clculo prvio de uma medida de localizao. So exemplos de medidas de distncia: o intervalo de variao e o intervalo interquartis. A segunda categoria de medidas de disperso utiliza uma medida de localizao como termo de comparao. o caso do desvio absoluto mdio, da varincia e do desvio- padro. Quando se pretende comparar a disperso entre dois ou mais conjuntos de dados pode ainda utilizar-se uma terceira categoria uma medida de disperso relativa como por exemplo, o coeficiente de variao. 4.1. Raze que justificam o calculo de uma medida de disperso

Como os prprios termos disperso e variao o indicam, este tipo de medidas de estatstica descritiva indicam o modo como os valores observados se afastam das medidas de tendncia central. Existem duas razes importantes que justificam o calculo uma medida de disperso a saber: A primeira consiste na necessidade de se obter um instrumento que nos permita avaliar a representatividade do valor mdio num conjunto de dados. Se existir uma grande variao dos valores observados, uma medida de tendncia central por si so pouco informao nos d.

Electrica II 2012

Pag. 12

Estatstica e Probabilidades

A segunda razo pretende-se com a necessidade de conhecer a disperso dos valores com o objectivo de serem tomadas medidas concretas para a controlar.

4.2. Amplitude do intervalo de variao

A amplitude do intervalo de variao (R) a diferena entre os valores mximo e mnimo da varivel. A sua utilizao tem como principal desvantagem o facto de ter em conta apenas os valores extremos que a varivel toma e, portanto, no ser sensvel aos valores intermdios. Calcula-se pela formula:

4.3. Amplitude do intervalo interquartis

definida como a diferena entre o terceiro e o primeiro quartis e corresponde ao intervalo que engloba 50% das observaes centrais. Tem a desvantagem de no influenciar por metade dos valores observados e que so valores extremos. Podemos determinar pela frmula:

4.4. Desvio absoluto mdio (dm) uma medida de disperso no negativa e quanto maior o seu valor, maior a disperso da varivel. Quando os dados esto desagregados o desvio absoluto mdio (MD) igual soma das diferenas, em valor absoluto, entre os valores observados da varivel e a sua mdia, divididas pelo nmero total de observaes:

Para dados j agrupados, o desvio absoluto mdio de disperso a media aritmtica dos desvios absolutos dos valores da varivel relativamente sua mdia, podemos determinar pela formula:

Electrica II 2012

Pag. 13

Estatstica e Probabilidades

4.5. Varincia e desvio padro 4.5.1. Varincia Para dados no agrupados, a varincia a soma do quadrado das diferenas entre os valores da varivel e a mdia, dividida pelo nmero total de observaes. E determina-se pela frmula:

Para os dados agrupados, a varincia a media aritmtica do quadrado dos desvios dos valores da varivel relativamente sua mdia:

Ou

4.5.2. Desvio mdio a raiz quadrada da varincia. E determina-se pela frmula:

4.6.

Coeficiente de variao (cv)

uma medida relativa de disperso, til para a compreenso em termos termos relativos do grau de concentrao em torno das medidas, de distribuio frequncias distintas. dado pela relao, em termos percentuais, entre o desvio-padro e a media da distribuio.

Electrica II 2012

Pag. 14

Estatstica e Probabilidades

5. MEDIDAS DE TENDNCIA NO - CENTRAL (Quartis, Decis, Percentis)

Para alm das medidas de tendncia Central existem outras medidas que nos do a localizao dos valores da varivel: em termo geral so chamados quantis .

Essas So as medidas que separam a distribuio de frequncias em partes iguais. Vimos que a mediana divide a distribuio em duas partes iguais quanto ao nmero de elementos de cada parte. Agora vamos estudar outras medidas que dividem a distribuio em partes iguais, que So elas:

5.1. Quartis (Qi)

Quartis so os valores dia a varivel que divide a distribuio de frequencia em quatro partes iguais:

Q1: 1o quartil. Deixa 25% dos elementos antes do seu valor. Q2: 2o quartil. Deixa 50% dos elementos antes do seu valor. Coincide com a mediana Q3: 3o quartil. Deixa 75% dos elementos antes do seu valor. Genericamente, para determinar a ordem ou posio do quartil a ser calculado, usaremos a seguinte expresso:

Electrica II 2012

Pag. 15

Estatstica e Probabilidades

Onde: i = nmero do quartil a ser calculado n = nmero de observaes.

Para dados agrupados em classes, encontraremos os quartis de maneira semelhante usada para o clculo da mediana:

Onde, l = limite inferior da classe que contm o quartil desejado h = amplitude do intervalo de classe EQi = posio do quartil Fant = frequncia acumulada at a classe anterior classe mediana f Qi = frequncia absoluta simples da classe quartlica.

5.2. Decis(Di):

Os decis so os valores da varivel que divide a distribuio de frequencia em dez partes iguais:

Electrica II 2012

Pag. 16

Estatstica e Probabilidades

De maneira geral, para calcular os decis, recorreremos expresso que define a ordem em que o decil seencontra:

Para dados agrupados em classes, encontraremos os decis de maneira semelhante usada para clculo da mediana e dos quartis.

Exemplo: Com base na tabela de distribuio de frequncias abaixo calcule o quarto decil (4 decil).

Intervalo (Idade) 4 | 9 9 | 14 14 | 19 19 | 24

de

classe Frequncia ( fi )

Fant

8 12 17 3 40

8 20 37 40

Electrica II 2012

Pag. 17

Estatstica e Probabilidades

5.3. Percentis ( Pi ) Percentis so as medidas que dividem a amostra em 100 partes iguais. Assim

O elemento que definir a ordem do centil ser encontrado pelo emprego da expresso:

Onde: i = nmero identificador do centil n = nmero total de observaes Para dados agrupados em classes, encontraremos os centis de maneira semelhante utilizada para clculo da mediana, dos quartis e dos decis.

Exemplo: Com base na tabela de distribuio de frequncias acima calcule 72 percentil (P72).

Electrica II 2012

Pag. 18

Estatstica e Probabilidades

CONCLUSO De acordo com o abordado ao longo do trabalho, temos como concluso, que para o estudo e aprofundamento da estatstica, tem como papel muito importante o estudo dos quadros de frequncias para dados organizados em classes ou intervalos, que nos do uma imagem clara do que se pretende com os diferentes dados colectados durante um estudo ou observao estatstica. Para a representao grfica dos dados em forma de histograma, conseguimos ainda ter uma noo de como podemos determinar as diferentes medidas que ao logo do trabalho fomos abordando.

Electrica II 2012

Pag. 19

Estatstica e Probabilidades

BIBLIOGRAFIA
REIS, Elizabeth ESTATSTICA DESCRITIVA 7 Edio -2 impresso , Lisboa, 2009

PDF, Medidas de tendncia central .EM: www.google.com.br/estatisica%descritiva%doc Acesso: 20/03 /2012 10h:13 PDF, Medidas de dispero .In: www.google.com.br/estatisica%descritiva%doc1.htm Acesso: 25/03 /2012 03h:00

Electrica II 2012

Pag. 20

You might also like