Professional Documents
Culture Documents
INTRODUC
AO
PESQUISA
RICARDO S. EHLERS
Departamento de Estatstica
Universidade Federal do Parana
Sum
ario
1 Introdu
c
ao
1.1 A Natureza da Ciencia . . . . . . . . . . . . . . . . . . . . . . . .
1.2 O Estudo Cientfico . . . . . . . . . . . . . . . . . . . . . . . . .
1
1
1
2 A Pesquisa Cientfica
2.1 Preparacao . . . . . . . . . . . . . . . . .
2.2 O Projeto de Pesquisa . . . . . . . . . . .
2.3 Execucao da Pesquisa . . . . . . . . . . .
2.4 Comunicacao/Divulgacao dos Resultados
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
3
3
4
4
3 Refer
encias Bibliogr
aficas
3.1 Livro . . . . . . . . . . . . . . . . .
3.2 Periodicos . . . . . . . . . . . . . .
3.3 Documentos de Eventos . . . . . .
3.4 Glossario de termos e abreviaturas
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
6
6
6
4 Divulga
c
ao dos Resultados
4.1 Comunicacao Escrita . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Comunicacao Oral . . . . . . . . . . . . . . . . . . . . . . . . . .
9
9
9
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5 Considera
co
es sobre Assessoria Estatstica
5.1 Problemas . . . . . . . . . . . . . . . . . . .
5.2 Expectativas . . . . . . . . . . . . . . . . .
5.3 Atitudes do Estatstico . . . . . . . . . . . .
5.4 Sobre co-autorias . . . . . . . . . . . . . . .
5.5 Sobre teses e dissertacoes . . . . . . . . . .
6 Erros em Estatstica
6.1 Paradoxo de Simpson . . . . . . . .
6.2 Comparando abacaxi com banana . .
6.3 Testando hipoteses . . . . . . . . . .
6.4 Correlacao nao significa causalidade
6.5 Graficos . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
13
14
14
16
16
.
.
.
.
.
17
17
18
19
19
19
7 Vari
aveis
23
7.1 Classificacao de Variaveis . . . . . . . . . . . . . . . . . . . . . . 23
7.2 Relacoes entre Variaveis . . . . . . . . . . . . . . . . . . . . . . . 24
i
SUMARIO
ii
7.3
7.4
References
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
24
24
25
25
25
27
Captulo 1
Introduc
ao
1.1
A Natureza da Ci
encia
O metodo cientfico e uma forma de producao de conhecimento que se caracteriza pela combinacao entre especulacoes logicas abstratas e verificacoes praticas
concretas. Podemos enumerar as seguintes caractersticas.
um conjunto de paradigmas para a observacao, identificacao, descricao,
1. E
investigacao experimental e explanacao teorica de fenomenos;
2. Envolve tecnicas exatas, objetivas e sistematicas, implementadas atraves
de regras fixas para a formacao de conceitos, para a conducao de observacoes e de experimentos, e para a validacao de hipoteses explicativas;
3. O objetivo maior nao e o de saber como as coisas realmente sao, mas sim
o de desenvolver explicacoes que auxiliem na interacao com o mundo, ou
seja: previsao (o que vai acontecer) e controle (como se pode intervir).
A Ciencia requer obrigatoriamente o uso da Matematica, a sua linguagem
fundamental. Como conseq
uencia, o saber cientfico e caracterizado pela sua
logica, objetividade e verificabilidade logica.
1.2
O Estudo Cientfico
CAPITULO 1. INTRODUC
AO
Captulo 2
A Pesquisa Cientfica
De um modo geral podemos identificar as fases de uma pesquisa cientifica como:
preparacao, projeto, execucao e divulgacao dos resultados. A seguir estas fases
sao detalhadas em suas principais caracteristicas.
2.1
Preparac
ao
2.2
O Projeto de Pesquisa
1. Descricao do problema.
(a) Introducao e formulacao da situacao-problema.
(b) Justificativa. Por que estudar este problema? qual a sua relevancia?
quais sao os benefcios esperados?
(c) Objetivos. O que se espera obter?
(d) Formulacao das hipoteses de interesse (geralmente embasadas em
teorias) e descricao das variaveis envolvidas.
(e) Delimitacao do estudo. Limites de tempo, recursos, acesso, etc.
(f) Definir os termos e abreviaturas.
2. Metodologia.
(a) Identificar o tipo de pesquisa.
(b) Populacao alvo, plano de amostragem.
(c) Instrumentacao a ser utilizada.
3
(d) Plano de coleta de dados, metodos estatsticos para analise dos dados.
3. Cronograma. Estabelecer um cronograma de execucao com datas limites
para a finalizacao de cada etapa.
4. Referencias bibliograficas.
2.3
Execuc
ao da Pesquisa
2.4
Comunicac
ao/Divulgac
ao dos Resultados
1. Relatorio de pesquisa.
2. Comunicacao oral.
3. Artigo cientfico, etc.
Captulo 3
Refer
encias Bibliogr
aficas
A indicacao de todas as fontes de informacao efetivamente utilizadas e parte
obrigatoria de qualquer trabalho de pesquisa. Alem disso, as referencias bibliograficas sao um importante indicador da qualidade do trabalho desenvolvido.
Assim, referencias a autores consagrados e trabalhos inovadores naquela area
de pesquisa sao uma indicacao de que o autor fez uma boa revisao bibliografica
do assunto e esta atualizado quanto aos principais inovacoes. A seguir serao
apresentadas as normas para referencias bibliograficas segundo Associacao Brasileira de Normas Tecnicas (ABNT).
As referencias bibliograficas devem ser relacionadas em uma lista propria,
numerada sequencialmente, em ordem alfabetica de sobrenome de autor e ttulo.
Esta lista aparece no final do trabalho com o ttulo de Bibliografia. Geralmente,
cada item da lista se inicia pelo u
ltimo sobrenome do autor seguido dos prenomes (exceto para sobrenomes compostos) e quando nao houver autoria pessoal
inicia-se pelo ttulo. Pode-se utilizar negrito, italico ou sublinhado para o ttulo.
3.1
Livro
Sao Paulo:
CAPITULO 3. REFERENCIAS
BIBLIOGRAFICAS
3.2
Peri
odicos
Podemos citar um periodico (ou revista) considerado como um todo, i.e. sem
uma referencia pessoal, ou artigos em um periodico. Os seguintes modelos de
citacao podem ser usados,
1. CIENCIA
HOJE. Sao Paulo: Sociedade Brasileira para o Progresso da
Ciencia, v.27, no 160, jun. 2001.
2. CORDEIRO, G.M. e FERRARI, S.L.P. A Modified Score Test Having
Chi-squared Distribution to Order n1 . Biometrika. London, v. 78, p.
573-582, 1991.
3.3
Documentos de Eventos
3.4
Gloss
ario de termos e abreviaturas
3.4. GLOSSARIO
DE TERMOS E ABREVIATURAS
CAPITULO 3. REFERENCIAS
BIBLIOGRAFICAS
Captulo 4
Divulgac
ao dos Resultados
4.1
Comunicac
ao Escrita
4.2
Comunicac
ao Oral
A ideia de falar em p
ublico deixa qualquer pessoa nervosa. Inibicao, nervosismo, ansiedade, etc ocorrem em maior ou menor grau com qualquer pessoa ao
falar em p
ublico. Este quadro entretanto pode ser controlado, atraves de uma
cuidadosa preparacao.
A preparacao cuidadosa e com a devida antecedencia e o fator mais importante para o sucesso de uma apresentacao oral. Mesmo quando o apresentador
tem muita experiencia com o tema do trabalho. A seguir sao listadadas algumas sugestoes u
teis na elaboracao de material e de comportamento durante a
apresentacao.
9
DOS RESULTADOS
CAPITULO 4. DIVULGAC
AO
10
Elaborac
ao de Transpar
encias
1. Calcule uma transparencia por minuto.
2. Evite excesso de informacao na transparecnia. Sugere-se utilizar 7 linhas
e 7 palavras por linha no maximo.
3. Refaca tabelas publicadas se julgar que sao inadequadas.
4. Nao use letras pequenas demais.
5. Nao inclua tabelas muito grandes. Sugere-se usar no maximo 4 linhas em
tabelas de 2 colunas, e 3 linhas em tabelas de 3 colunas.
6. Use letras min
usculas, exceto no ttulo.
7. Evite abreviacoes.
8. Coloque referencia de dados de outros autores.
9. Nao exagere nas cores. Use cores para destacar informacoes relevantes.
10. Nao transforme a apresentacao em espetaculo pirotecnico! Pode distrair
atencao da plateia.
11. Nao use figuras de fundo.
12. Ha outros meios de destacar informacao importante
Durante a Apresentac
ao
1. Fale devagar, olhando para plateia.
2. Nunca fique de costas para a platleia.
3. Nao exagere nos gestos e mudancas de posicao.
4. Aponte as transparencias para orientar a plateia.
5. Nao fique na frente da projecao e nem andando de um lado para outro.
6. Nao aponte erros nas transparencias.
7. Use as mesmas palavras que usou nas transparencias.
8. Nos graficos, indique sempre o que significam.
9. Faca um encerramento, agradeca.
ORAL
4.2. COMUNICAC
AO
11
Respondendo as perguntas
1. Nao se desespere.
2. Tente responder a`s perguntas.
3. Algumas perguntas sao previsveis, outras ja estao respondidas nas transparencias.
4. Tente responder a`s perguntas mas e impossvel saber responder a toda e
qualquer pergunta.
5. Melhor dizer que nao sabe do que dar um tiro no escuro. A plateia
aceita e compreende que nao sabemos tudo.
Recomendaco
es Finais
1. Escreva a apresentacao
2. Prepare o material com antecedencia
3. Pratique, pratique, pratique.
4. Controle os nervos.
12
DOS RESULTADOS
CAPITULO 4. DIVULGAC
AO
Captulo 5
Consideraco
es sobre
Assessoria Estatstica
Segundo a minha experiencia, podemos comecar pensando em uma assessoria
(ou consultoria) como a aplicacao de conhecimentos de Estatstica em trabalhos
aonde o pesquisador nao ve a Estatstica como ciencia. A seguir serao apontados
alguns problemas e caractersticas associadas a` atividade de assessoria, bem
como algumas recomendacoes u
teis.
5.1
Problemas
14CAPITULO 5. CONSIDERAC
OES
SOBRE ASSESSORIA ESTATISTICA
5.2
Expectativas
importante tambem termos uma ideia daquilo que o pesquisador espera obE
ter, i.e. qual a sua expectativa em relacao a` assessoria estatstica. Algumas
expectativas sao naturais e estao corretas, outras podem nao ser muito realistas e devemos estar preparados. Alem da assessoria propriamente dita, as
expectativas mais comuns na minha opiniao sao:
1. Um grande entusiasmo seu pelo trabalho.
2. Repeticao das explicacoes sempre que necessario.
3. Tempo de dedicacao ao trabalho.
4. Todos os calculos feitos.
5. Os resultados prontos para apresentacao.
6. Ajuda na discussao e conclusoes.
5.3
Atitudes do Estatstico
15
16CAPITULO 5. CONSIDERAC
OES
SOBRE ASSESSORIA ESTATISTICA
5.4
Sobre co-autorias
5.5
Captulo 6
Erros em Estatstica
Os metodos estatsticos, quando utilizados de maneira correta e apropriada,
tem sido extremamente valiosos para a acumulacao de conhecimento cientfico.
No entanto, a correta interpretacao dos dados e resultados de uma analise, e
importante ter em mente e deixar
muito importante para evitar confusoes. E
claro as limitacoes do metodo, as hipoteses subjacentes, as simplificacoes e
aproximacoes muitas vezes necessarias, etc.
Nesta secao serao apresentados alguns exemplos de erros em analises estatsticas e recomendacoes de como tentar evita-los. Naturalmente a lista nao
pretende ser exaustiva, mas apenas apontar os problemas mais comuns. Uma
otima referencia sobre o assunto e Good and Hardin (2003).
6.1
Paradoxo de Simpson
Este exemplo foi extrado de DeGroot (1989). Suponha que foi feito um experimento para comparar um novo tratamento para uma doenca com um tratamento padrao. Um grupo de 40 indivduos recebeu o tratamento padrao
enquanto outro grupo de 40 indivduos recebeu o novo tratamento e apos um
certo perodo de tempo foram observados quantos indivduos em cada grupo
apresentaram melhora. Os resultados para os 80 indivduos estao na Tabela 6.1
abaixo.
Tabela 6.1: Frequencias de melhora para indivduos sob dois tratamentos diferentes.
novo tratamento
tratamento padrao
situacao
melhorou nao melhorou
20
20
24
16
porcentagem
de melhora
50
60
Com base nesta tabela, o novo tratamento parece ser inferior ao tratamento
padrao. Suponha agora que os valores foram desagregados considerando-se
homens e mulheres separadamente e obteve-se a Tabela 6.2 abaixo.
17
18
Tabela 6.2: Frequencias de melhora para indivduos sob dois tratamentos diferentes desagregados por sexo.
homens
novo tratamento
tratamento padrao
situacao
melhorou nao melhorou
12
18
3
7
porcentagem
de melhora
40
30
mulheres
novo tratamento
tratamento padrao
situacao
melhorou nao melhorou
8
2
21
9
porcentagem
de melhora
80
70
Ou seja, esta tabela nos leva a` conclusao oposta de que o novo tratamento
parece ser superior ao tratamento padrao. Este tipo de resultado e conhecido
como paradoxo de Simpson e nao depende do tamanho amostral. O problema
aqui e que, independente do tratamento, a taxa de melhora e muito maior entre
as mulheres do que entre os homens. Como muito mais mulheres receberam
o tratamento padrao e muito mais homens receberam o novo tratamento, os
dados agregados mostram o tratamento padrao com uma taxa de melhora global
maior.
Para que este fenomeno nao ocorresse seria necessario que a proporcao de
indivduos recebendo os dois tratamentos fosse a mesma (ou aproximadamente
a mesma) para homens e mulheres. Porem, nao e necessario que haja o mesmo
n
umero de homens e mulheres. No entanto, mesmo apos tomar estes cuidados
pode ser que existam outras variaveis, e.g. idade ou estagio da doenca, tais que
a desagregacao levaria a conclusoes opostas.
6.2
Outro problema consiste em tentar comparar coisas que nao sao realmente
comparaveis. Por exemplo, determinadas definicoes mudam ao longo do tempo
e comparar coisas em instantes de tempo diferentes pode levar a conclusoes sem
valor. O objeto de estudo precisa estar claramente definido e a definicao tem
que se manter constante para se fazer comparacoes.
Em alguns experimentos pode ser difcil se fazer observacaes com variaveis
adequadamente controladas. Suponha por exemplo que foi feito um estudo para
medir o efeito da poluicao urbana na reducao do tempo de vida das pessoas.
A ideia era comparar o tempo de vida das pessoas vivendo em grandes centros
urbanos com o das que viviam em zonas rurais. No entanto, seria necessario
garantir que foram observados indivduos destes dois grupos cuja u
nica diferenca
em termos de ambiente e estilo de vida fosse a poluicao. Esta e uma tarefa
quase impossvel ja que teriamos que eliminar o efeito da violencia urbana,
dos tipos de alimentacao, do stresse, etc. A conclusao do estudo, mesmo que
6.3. TESTANDO HIPOTESES
19
6.3
Testando hip
oteses
6.4
Correlac
ao n
ao significa causalidade
Um dos erros de interpretacao mais comuns e assumir que correlacoes significativas necessariamente implicam em uma relacao de causa e efeito entre duas
variaveis. Esta interpretacao e incorreta.
Tambem e preciso ter cuidado ao assumir que existe correlacao somente
porque duas variaveis seguem o mesmo padrao de variabilidade. A correlacao
pode ser devida a uma terceira variavel influenciando as duas primeiras.
6.5
Gr
aficos
20
100
200
300
400
500
600
20
40
60
80
100
120
140
6.5. GRAFICOS
21
400
300
200
100
0
500
600
1950
1952
1954
1956
Anos
1958
1960
22
Captulo 7
Vari
aveis
O Cambridge Dicionary of Statistics (Everitt, 1998), define uma variavel como
alguma caracterstica que difere de indivduo para indivduo ou ao longo do
tempo ou espaco. De um modo geral uma variavel pode ser vista como um elo
de ligacao entre conceitos em forma de hipoteses e observacoes dos fenomenos
reais. A ideia e que as hipoteses possam ser testadas definindo estes conceitos em
forma de variaveis. Por exemplo, para que se possa testar a hipotese frustracao
produz agressao e preciso observar ou medir estes dois conceitos e isto so sera
possvel se frustracao e agressao forem variaveis cujos valores sao passveis
de mensuracao.
7.1
Classificac
ao de Vari
aveis
CAPITULO 7. VARIAVEIS
24
Na pratica estas distincoes podem ser menos rgidas, embora em geral seja
recomendado manter as variaveis em sua forma original. Por exemplo, normalmente a variavel idade seria tratada como contnua, mas se a idade for
registrada pelo ano mais proximo ela pode ser tratada como discreta. Por outro lado, se os indivduos forem classificados segundo sua idade em criancas,
adultos jovens, adultos e idosos entao teremos faixa etaria como uma
variavel qualitativa ordinal.
7.2
Relaco
es entre Vari
aveis
Em investigacoes cientficas de qualquer natureza e fundamental que o significado das relacoes entre variaveis seja bem entendido. Isto e importante para
que se possa dar prosseguimento a`s investigacoes de forma apropriada. Basicamente, existem tres significados amplos descritos na literatura que serao
apresentados aqui.
7.2.1
Rela
c
ao Sim
etrica
Neste caso, embora se verifique uma relacao nenhuma das variaveis exerce acao
sobre a outra. Alguns exemplos sao os seguintes,
1. Se alunos que obtem bons resultados em matematica tambem alcancam
bons resultados em provas orais nao podemos assumir que a capacidade
matematica explica a capacidade verbal, ou vice-versa.
2. Encontrando-se uma relacao entre transpiracao palmar e batimentos cardacos
nao podemos considerar uma variavel como causa da outra, ambas sao interpretadas como sinal de ansiedade. Para determinar ansiedade podemos
usar uma ou outra variavel.
3. Encontrando-se uma relacao entre frequentar colegio caro e obtencao de
bons empregos nao nos permiter inferir que o preco da escola influencie
a qualidade do emprego. Na verdade ambas as variaveis tem a mesma
causa que e a classe social dos alunos.
Quando duas variaveis sao efeitos de uma causa comum diz-se que as relacoes
entre elas sao esp
urias. Talvez fosse melhor dizer que houve uma interpretacao
esp
uria das relacoes. Seja como for, a identificacao destas relacoes simetricas
pode ajudar no entendimento do fenomeno em questao. Finalmente, pode-se
identificar associacoes completamente fortuitas entre duas variaveis. Seria um
erro metodologico tentar analisar tais associacoes.
7.2.2
Rela
c
ao Recproca
Neste caso, embora seja claro que existem forcas causais nao e possvel determinar de imediato quem causa quem. Na verdade cada uma das variaveis e
alternadamente causa e efeito. Por exemplo,
7.3. VARIAVEIS
MODERADORAS
25
7.2.3
Rela
c
ao Assim
etrica
7.3
Vari
aveis Moderadoras
7.4
Vari
aveis de Controle
Basicamente uma variavel de controle e aquela cujo efeito o pesquisador neutraliza propositadamente para que nao interfira na analise da relacao entre as
outras variaveis. Isto ocorre em situacoes complexas, quando se sabe que o
efeito nao tem apenas uma causa mas pode sofrer influencia de varios fatores.
26
CAPITULO 7. VARIAVEIS
Refer
encias
Box, G. E. P. and G. M. Jenkins (1976). Time Series Analysis: Forecasting
and Control (Revised ed.). Holden-Day, Oakland, California.
Chatfield, C. (1995). Problem-Solving: A Statisticians Guide (2nd ed.). London: Chapman and Hall.
Cleveland, W. (1994). The Elements of Graphing Data (2nd ed.). Summit,
NJ: Hobart Press.
DeGroot, M. H. (1989). Probability and Statistics (2nd ed.). Addison Wesley.
Good, P. I. and J. W. Hardin (2003). Common Errors in Statistics (and how
to avlid them). Wiley: London.
Migon, H. S. and D. Gamerman (1999). Statistical Inference: An Integrated
Approach. Arnold.
27