You are on page 1of 17

Anotaes de Estatstica

Conceitos para estatstica: Cincia que trata dados para gerar informaes relevantes Conjunto de tcnicas e mtodos de pesquisa que envolve planejamento de experimentos, coleta adequada de dados, inferncias, anlise e disseminao de informaes.

Observaes feitas pelo professor: H sempre um cuidado para no enviesar os dados Inferncia = atravs de uma amostra, fazer generalizaes As pesquisas em estatstica so feitas em duas partes: Planejar a coleta de dados Analisar o que foi conseguido (anlise probatria e inferncias)

Organizao e descrio de dados Estatstica Descritiva Inferncia estatstica: generalizar atravs de uma amostra aleatria Etapas de pesquisa Objetivo > Planejamento > Metodologia > Execuo > Anlise> Resultado > Concluso. Planejamento: Definir um problema . Reviso Literria necessria . Citar fontes para informaes secundrias Objetivos: . Geral: propsito do estudo . Especfico: Detalhamentos Metodologia: Explicao minuciosa de toda ao desenvolvida nas fases ou etapas de pesquisa . Tipo de pesquisa .Tabulao de dados . Tratamento dos dados

Ex: Pesquisa experimental Pesquisa de levantamento de dados. Alguns conceitos utilizados em estatstica Populao: Conjunto de todos os elementos para os quais se deseja fazer o estudo Amostra: Subconjunto dos elementos da populao Censo: Contagem de todos os elementos da populao Pesquisa experimental: O pesquisador exerce controle sobre o tratamento que vai ser aplicado a cada elemento da amostra Ex. pesquisa com dois tipos de treinamento, que tentaria descobrir qual dos dois treinamentos seria o mais eficiente comparando-os. Survey Observam-se as caractersticas dos elementos de uma populao ou amostra utilizando-se perguntas Ex. medir o nvel de satisfao dos funcionrios por survey e correlacionar com produtividade Coleta de dados: Obteno, reunio e registro dos dados visando um objetivo. Variveis: so as caractersticas que podem ser observadas em cada elemento da populao. So as mesmas condies gerando apenas um resultado.

Classificao das variveis: As variveis podem ser: A- Qualitativas: Os resultados so atributos ou qualidades Que podem ser classificadas em: o Nominal No h ordenao na realizao

Ex: Estado civil, Sexo o Ordinal Existe ordenao na realizao

Ex: Grau de instruo acadmica (porque h ordem. Primeiro se faz primeiro, depois segundo e por fim terceiro grau) B- Quantitativas: Os possveis resultados so nmeros numa certa escala representando quantidades.

So classificadas em: o Discretas: Os possveis valores formam um conjunto finito ou enumervel de nmeros identificados em um processo de contagem. Sempre um nmero inteiro

Ex: N de filhos por pessoa, de livros, de viagens a algum lugar o Contnuas: Os possveis resultados pertencem a um intervalo de nmeros reais resultantes de uma mensurao. Se encontra em uma escala de valores.

Ex: Idade, Altura, Peso, Tempo de espera.

Recomendaes para a elaborao de um questionrio: . Separar variveis .Fazer reviso bibliogrfica .Pensar na forma mais adequada para mensurao . Elaborar uma ou mais perguntas para cada varivel . Fazer perguntas claras e concisas . Verificar se as perguntas induzem/ determinam respostas. . Questionrios Objetivos e no longos Ferramentas utilizadas para obteno de dados: .Questionrios de survey .Entrevistas Nota do professor: H necessidade de homogeneidade na aplicao, cuidado com o treinamento dos aplicadores dos questionrios.

Amostragem (principais conceitos): Amostra: Subconjunto da populao Amostragem: Tcnica utilizada p/ selecionar uma amostra Parmetro: uma medida que descreve certa caracterstica dos elementos da amostra/ populao. Inferncia estatstica: Uso adequado dos dados de uma amostra para obter alguma informao sobre os parmetros (estimativa, voc infere algo sobre um parmetro).

Vantagens de se utilizar amostras -Economia de recursos financeiros, fazer uma amostragem no geral mais barato que fazer um censo - Tempo necessrio para pesquisar menor -Confiabilidade Desvantagens: - Com populao pequena, os dados retirados usando-se um censo so mais precisos. -Se no for uma caracterstica de fcil mensurao, amostras no funcionam muito bem.

Plano amostral: Contm a definio da unidade amostral 1 unidade de amostragem: a unidade selecionada para se chegar aos elementos da populao.

Alguns tipos de amostragem: A- Amostragem Aleatria (probabilstica s h probabilidade com aleatoriedade) Tipos de AA: Amostragem aleatria simples: Todos os elementos da amostra tem igual probabilidade de serem escolhidos. O processo deve ser feito sem reposio e todos os elementos da populao devem ser numerados. Para o sorteio, utiliza-se uma tabela de nmeros aleatrios1 O plano amostral da A.A.S. descrito como: . De forma aleatria: Sorteia-se com igual probabilidade um elemento da populao .Repete-se o processo at conseguir as n unidades que comporo a amostra .Pode ser feita com ou sem reposio .Propriedade: cada elemento tem a probabilidade n/m de pertencer amostra

.Amostragem aleatria sistemtica: Amostragem aleatria simples em que toda a populao est ordenada de acordo com algum padro (ex. nomes em ordem alfabtica). Com uma populao N e uma amostra de tamanho n. Para se trabalhar com esse tipo de amostra, alguns clculos so necessrios, como descobrir o intervalo da amostragem sendo K = o intervalo da amostragem, k= N/n

Literalmente uma tabela com... nmeros aleatrios.

O sorteio se faz dentro do conjunto de valores (1, 2, 3... at k) e ento se obtm o valor de i; i define qual ser o primeiro elemento da amostra a ser retirado da populao que entra para a amostra. Os outros elementos que completam a amostra podem ser calculados com a frmula: An= i+ (n-1). k Para esclarecer a forma como se trabalha com A.A.Sistemtica : Suponha que uma empresa de telefonia fixa deseja saber o grau de satisfao de seus usurios com servios prestados. O nmero de assinantes da ordem de 50.000 e nos desejamos selecionar uma amostra aleatria de 1.000 assinantes com o intuito de obter a avaliao sobre os servios. N = 50.000 n =1.000 N/n= 50 Entre os 50 primeiros assinantes, 1 ser selecionado para fazer parte do estudo, far parte da amostra. Supondo que o n 10 entre os 50 primeiros foi sorteado (i = 10). Passa-se ento a usar a frmula, An= i+ (n-1). k, para saber quais seriam os prximos membros da populao a serem estudados at que se complete a amostra desejada. (No caso, os outros 999 valores. Os elementos n 60, n 110... e assim por diante completariam a amostra). Amostragem aleatria estratificada Na amostragem estratificada, a populao tem caractersticas heterogneas e pode-se distinguir subpopulaes mais ou menos homogneas entre si chamadas estratos (subpopulaes internamente homogneas). Depois de definidos os estratos, dessas subpopulaes seleciona-se uma amostra aleatria. As sub-amostras devem ser proporcionais ao nmero de elementos contidos no estrato. Pode ser feita com reposio ou sem reposio dos elementos. Amostragem aleatria por conglomerado/ Clusters Voc divide a populao em subpopulaes que nem na amostra estratificada A diferena em relao a amostragem por conglomerado: Dentro dos diversos clusters no h homogeneidade. E essa a diferena entre estrato/ cluster; E como se lida com clusters? - 1 passo: Se define os diversos clusters por sorteio baseado em amostragem aleatria simples -2 passo: Dentro de cada cluster, se faz novamente sorteios por amostragem simples Observaes: Cada unidade amostral no caso de clusters contm mais de um elemento populacional.

Ela gera resultados com mais variabilidade Uso de clusters gera pesquisas mais baratas do ponto de vista econmicos B- Amostras no aleatrias Utilizada quando no se tem acesso aos dados de toda a populao. Amostras no aleatrias so no- probabilsticas (e por no ser probabilstica, no gera inferncias, generalizaes. Seus dados so puramente descritivos). .Em alguns casos a mais adequada a ser utilizada (nota da autora do doc: professor s disse que ela mais adequada, no explicou casos ou deu exemplos). As amostras no aleatrias se dividem em: Por cotas: Populao dividida em grupos internamente homogneos e seleciona-se um nmero de elementos em cada estrato (define-se um nmero de elementos de cada estrato para se levantar o dado). Por julgamento: elementos escolhidos so julgados tpicos de uma populao em estudo. O pesquisador define quais elementos da populao so bons representantes para a informao/ dado que se deseja ter. ----------------------------------------------------------------------------------------------------------------------------Estatstica (estimador): Caracterstica descrita dos elementos da amostra. Erro amostral: Tolerncia que o pesquisador utiliza entre a estatstica e o parmetro analisado. Tamanho de uma Amostra aleatria simples em relao ao erro amostral (E0) n0= 1/ E02 n= N. n0/ N+ n0

N= Tamanho da populao n= tamanho da amostra n0= tamanho aproximado da amostra E0= Erro amostral tolervel Ex. Qual o tamanho da amostra, se o erro amostral de 4% com... a- N= 200 1/(0,04)2 = 625 ........ (200. 625)/ 200+ 625 = 152

Apresentao dos dados da populao, da amostra

- Forma grfica: Apresentao geomtrica da informao permite uma viso explanatria e clara. - Forma tabulada: Dados apresentados em tabelas Principais elementos de uma tabela:

- Ttulo: Descreve o tipo de dado, onde, quando e como foram coletados.

Varivel

Frequncia (absoluta)

Porcentagem relativa)

(frequncia

Grupo tabela

da

Total

Series Estatsticas So a distribuio dos dados em funo de elementos como: poca, local, do fenmeno observado. O ttulo dado a srie deve conter o suficiente para compreender o fato observado, o local geogrfico onde o fato ocorreu e a data/ tempo em que o fato estudado ocorreu. Srie temporal, cronolgica, evolutiva ou histrica: O carter varivel da srie o tempo. Local e fenmeno observados so fixos.

Ex: dados da produo agrcola na paraba nos anos de 2004, 2005 e 2006. Ano 2004 2005 2006 Produo (por toneladas) X Y Z

Srie geogrfica: O fator varivel o local do evento observado. Tempo e fenmeno so fixos

Ex: dados sobre nascidos vivos por regio em 1989

Regio Norte Nordeste Sudeste Sul Centro Oeste Total

Nascidos vivos (por milhes) X Y Z K W (total)

Srie especificativa ou categrica: Fenmeno tem carter varivel. poca e local so os elementos fixos. Os dados so agrupados segundo a modalidade da ocorrncia

Ex: Nascidos vivos por sexo no Brasil, na regio sul em 1989 Sexo Masculino Feminino Total Nmero X Y Z

Sries Mistas: Conjunto de dados estatsticos em funo de suas ou mais sries. So chamadas de tabelas de contingncias ou tabela de duas entradas.

Distribuio de frequncia: Nas distribuies de frequncia temos elementos de poca, local e fenmeno fixos. Embora fixo, o fenmeno apresenta valores discretos (valores pontuais) ou seus valores podem estar distribudos em classes. Distribuio por variveis/ valores pontuais: Usa variveis com valores discretos. O nmero de observaes est relacionado a um ponto real.

Ex. Varivel 1 2 3 4 5 Frequncia 2 4 7 8 9

Ex (copiado da internet):

Notas do Aluno "X" na Disciplina de Estatstica segundo critrios de avaliao do DE da UFSM 1990 Aluno A B C D E F G H I J K L M N O Nota 6,3 5,3 8,4 6,5 8,4 9,5 6,5 9,5 8,4 9,5 6,5 6,5 6,3 6,5 5,3

6.3 8.4 5.3 9.5 6.5 (total de alunos)

2 3 2 3 5 15

Distribuio por classes: Ela usa variveis continuas ou discretas, essas pertencentes a classes pr-determinadas.

Ex. (copiado da internet) Altura em centmetros de 160 alunos do Curso de Administrao da UFSM - 1990 Altura (cm) (ponto de referncia de cada classe. Nesse caso, a mdia aritmtica). 154 162 170 178 186 194 ----

150 |--- 158 158 |--- 166 166 |--- 174 174 |--- 182 182 |--- 190 190 |--- 198

18 25 20 52 30 15 160

Classes: As classes so pequenos intervalos e so construdos de tal forma que todo resultado, todo dado, pertence a uma classe em especfico.

O nmero de classes (K) numa amostra de tamanho n dado aproximadamente por: K= 1+ 3.3 log (n) Outra regra que associa K e n n= n de dados pontuais (Regra de Sturges)

Observao: O nmero encontrado por essas frmulas no uma deciso final. Cabe ao pesquisador se ele seria adequado natureza dos dados coletados

Em relao amplitude dos dados/ amplitude das classes

( )

( a diferena entre o valor mximo e o valor mnimo observado na varivel em estudo)

( )

Tipos de frequncia 1- Frequncia simples absoluta ( ): N total de observaes de um elemento ou classe 2- Frequncia relativa simples ( ): O n de observaes de um elemento ou classe dividido pelo n total de todas as observaes (n)

3- Frequncia acumulada abaixo de: 3.1- Frequncia acumulada abaixo de absoluta: A soma das frequncias simples absolutas das observaes ou das classes com as frequncias dos valores ou classes anteriores.

3.2- Frequncia acumulada relativa abaixo de: a soma das frequncias relativas simples de uma classe/ observao com os valores das frequncias relativas simples de todas as classes/ observaes anteriores

4- Frequncia acumulada acima de A nica coisa que muda que ao invs de se somar as frequncias/ frequncias relativas anteriores, se soma as frequncias posteriores ao valor desejado.

Representao grfica dos dados - Visualizao geomtrica exploratria - Representao de tabelas -Comparaes descritivas Tipos de grfico Grfico de linhas: Adequado para sries temporais Grfico de coluna: Adequado para sries temporais e especificativas Grfico de barras (grfico com colunas na posio horizontal): Adequado para sries geogrficas e especificativas. Grfico de setores: Sries Geogrficas e especificativas. Grfico dot pot (grfico de pontos): empilhamos dados de medida que se repetem

Grfico de hastes: Grfico Dot Pot com pontos ligados numa linha.

Histograma: O histograma um grfico com barras continuas. H proporcionalidade das barras com os intervalos de classe e tambm da rea de cada retngulo formador do histograma a respectiva frequncia da classe.

- Quando o tamanho de toda classe o mesmo, podemos utilizar a frequncia relativa:

Tamanho da classe = Frequncia= Frequncia relativa =

- Quando o tamanho das classes desigual, utilizamos como altura da classe no histograma ou

- Quando utilizamos densidade relativa, a soma das reas dos retngulos igual a 1. Polgono de frequncia: um grfico obtido unindo-se o ponto mdio de cada classe do histograma em uma semi-reta

ex

Grfico de ramos e folhas: A ideia bsica dividir cada observao em duas partes. A primeira ramos- colocada esquerda de uma linha vertical. A segunda, folhas, colocada a direita.

ex

Medidas de tendncia central Mdia aritmtica: soma dos valores observados divididos pelo total de observaes (M) ( )

( )

Mediana: Realizao que ocupa a posio central das observaes ordenadas (Md) . Nmero impar de observaes: utilizamos a estabilidade da ordem X= n+1/ 2 . Nmero par de observaes: utilizamos as estabilidades de ordem

[X(n/2) + X(n/2) + 1] / 2 Moda: Observao de maior frequncia da amostra.

Medidas de disperso : Grupo A: 3,4,5,6,7 (varivel x) Grupo B: 1,2,5,7,9 (varivel y) Grupo C: 5,5,5,5,5 (varivel z)

Os conjuntos tm mdias iguais, mas possuem variabilidade diferente. Para calcular desvios, usa-se as seguintes frmulas (| | )

(| Varincia de uma amostra (( Desvio padro = raiz da varincia

|) )

) )

O coeficiente de variao dado por

Quantil: a parte de uma diviso de uma amostra ou de uma populao

Quartil: Dividir em quatro partes tudo (extremo inferior/ 1 quantil (q1) / Md/ 3 quantil (q3)/ Extremo superior)

Exemplos: Srie impar, com valores impares nos subgrupos

20, 22, 22, 25, 27, 29, 30 20,22,22/ 25/ 27, 29,30

1 subgrupo 2 subgrupo

Md = 25 = 22 = 29

(1 quartil = mediana do primeiro subgrupo)

Outro caso, mas os subgrupos no so impares em nmero de elementos. 1 subgrupo 2 subgrupo

20,21,22,22,25,27,28,29,30 20,21,22,22,25,27,28,29,30 Md = 25 = 21+22/ 2 = 21,5 = 28+29/2 = 28,5

Srie com um nmero par de elementos totais.

1,9; 2; 2,1; 2,5; 3; 3,1; 3,3; 3,7

1 subgrupo 2 subgrupo

= 2+ 2,1/ 2 = 2,05 = 3,1+3,3/ 2= 3,2 Md= 2,5+ 3/ 2 = 2,75

Frmula geral de quantil (p) 0<p< 1 Amostra com n valores ordenados ( ( ( ) ) ) ( ) ( )

i< n e inteiro. ( ) no for um nmero inteiro, tirar a mdia ponderada

( Parte em negrito= k ([ ] ) [ ]

) = valor do quantil

i ser o valor mais prximo de k

Pontos da srie cujo valor seja menor que discrepantes. Para desenhar um diagrama de caixas O maior ponto no discrepante limite superior do diagrama ou maior que so considerados

O menor ponto no discrepante o limite inferior do diagrama Os limites pontilhados so definidos pelas frmulas relacionadas aos valores discrepantes.

You might also like