Professional Documents
Culture Documents
Educação a Distância
Caderno de Estudos
BIOESTATÍSTICA EM EDUCAÇÃO
FÍSICA
UNIASSELVI
2016
NEAD
CENTRO UNIVERSITÁRIO
LEONARDO DA VINCI
Rodovia BR 470, Km 71, nº 1.040, Bairro Benedito
89130-000 - INDAIAL/SC
www.uniasselvi.com.br
Elaboração:
Prof.ª Ma. Grazielle Jenske
519.5024574
J51b Jenske; Grazielle
Bioestatística em educação física / Grazielle Jenske :
UNIASSELVI, 2016.
181 p. : il
ISBN 978-85-515-0018-7
1. Bioestatística.
I. Centro Universitário Leonardo da Vinci
APRESENTAÇÃO
Desta forma, a bioestatística é uma tentativa de aplicar regras matemáticas a uma ciência
experimental. Para utilizar essa ferramenta, precisamos nos basear em suposições, que são a
base de todo o procedimento, e serão estudadas com necessário número de detalhes com os
quais devemos ter prudência para tomarmos a decisão correta. Nesta perspectiva, surge este
caderno de estudos, que tem como propósito principal contribuir para esclarecer e minimizar
as dificuldades existentes entre os diversos domínios deste conhecimento.
Este caderno de estudos está dividido em três unidades que contemplam partes
importantes da Bioestatística em Educação Física, como: fases do método estatístico,
agrupamento de dados, estudo das medidas de tendência central e de dispersão, estudo
das medidas de correlação, análise de tabelas e gráficos, testes de hipóteses, bem como a
aplicação destes conteúdos.
Você, acadêmico, deve saber que além da curiosidade, existem outros fatores
importantes para um bom desempenho: a disciplina, a organização e um horário de estudos
predefinido são essenciais para que se obtenha sucesso nesta trajetória.
Bons estudos!
Prof.ª Ma. Grazielle Jenske
UNI
Oi! Eu sou o UNI, você já me conhece das outras disciplinas.
Estarei com você ao longo deste caderno. Acompanharei os seus
estudos e, sempre que precisar, farei algumas observações.
Desejo a você excelentes estudos!
UNI
CONCEITOS BÁSICOS DA
ESTATÍSTICA
OBJETIVOS DE APRENDIZAGEM
identificar
a terminologia, símbolos usuais e conhecimentos
básicos encontrados em bioestatística;
utilizar
a linguagem bioestatística como instrumento de apoio na
execução de atividades do cotidiano.
B
I
O
E
PLANO DE ESTUDOS S
T
A
Esta unidade está dividida em três tópicos, em cada um deles T
você encontrará atividades que o auxiliarão a fixar os conhecimentos Í
S
abordados. T
I
C
A
TÓPICO 1 – O MÉTODO ESTATÍSTICO E
M
TÓPICO 2 – ARREDONDAMENTO, FRAÇÃO E
PORCENTAGEM E
D
TÓPICO 3 – AGRUPAMENTO DE DADOS U
C
A
Ç
Ã
O
F
Í
S
I
C
A
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 1
TÓPICO 1
O MÉTODO ESTATÍSTICO
1 INTRODUÇÃO
E
Nas últimas décadas, a Estatística tem se mostrado presente nas mais diversas áreas D
de conhecimento, como a Educação, a Engenharia, a Administração, as Ciências Contábeis, a U
C
Medicina, a Agronomia, a Educação Física, a Biologia, a Psicologia e muitas outras. Destacamos
A
ainda que a área da Educação Física que atua em diversas linhas de pesquisa (saúde, lazer, Ç
educação e esporte, entre outras), também utiliza o tratamento estatístico analítico para inferir Ã
O
sobre seus parâmetros.
F
Í
Acadêmico, nesta disciplina você terá a oportunidade de aprender sobre a área da S
matemática que mais desperta o interesse das pessoas. Seja na empresa, com suas metas, ou I
C
A
4 TÓPICO 1 UNIDADE 1
2 CONCEITO DE ESTATÍSTICA
A Estatística é definida por Crespo (2002) como uma parte da Matemática Aplicada que
fornece métodos para coleta, organização, análise e interpretação de dados e para a utilização
dos mesmos na tomada de decisões.
B
I
O Aprofundamos essa definição e a conceituamos como sendo o estudo de um grupo
E
S de indivíduos, objetos ou de qualquer comportamento coletivo, através de métodos, onde
T interpretamos os resultados deste estudo através de valores numéricos.
A
T
Í São exemplos de aplicabilidade da Estatística:
S
T
I a) A média da idade dos alunos ingressantes no curso de Educação Física é de 23 anos.
C b) A taxa de conversão do site da Uniasselvi variou 5% no último mês.
A
c) Os profissionais da área de Educação Física tem uma renda mensal média variando
E entre R$ 1800,00 e R$ 2000,00.
M
E
D
U
C 3 GRANDES ÁREAS DA ESTATÍSTICA
A
Ç
Ã
A Estatística é uma parte da matemática aplicada que, por meio da coleta, organização,
O
descrição, análise e interpretação de dados auxilia na tomada de decisões futuras. Atualmente,
F a Estatística pode ser dividida em três áreas: Estatística Descritiva, Probabilidade e Inferência
Í
S Estatística.
I
C
A
UNIDADE 1 TÓPICO 1 5
Por último, a inferência estatística é o estudo de técnicas que permite uma generalização
por meio de uma determinada quantidade de dados, que se aplicam ao total da população
envolvida.
Este ciclo descreve as fases do método estatístico, que veremos de forma mais
aprofundada a seguir.
4 O MÉTODO ESTATÍSTICO
• na investigação da verdade;
• no estudo de uma ciência;
B
I • ou para alcançar um determinado fim.
O
E
S Dos métodos científicos, vamos destacar o método experimental e o estatístico.
T
A
T
Í
S
T 4.1 MÉTODO EXPERIMENTAL
I
C
A As primeiras investigações foram realizadas na primeira metade do século XIX, por
Gustav Ferchner e conforme o próprio termo sugere este método, através da experimentação,
E
M consiste em limitar as áreas investigadas, mantendo constantes todas as causas, menos uma,
variando-a de modo que se possa descobrir suas implicações, caso existam.
E
D
U Este método tem um papel importante para o conhecimento do comportamento humano
C
A e animal. Um exemplo de aplicação do método experimental é na testagem da eficácia de um
Ç determinado medicamento, onde criam-se dois grupos, em que um grupo recebe a medicação
Ã
O em teste e o outro recebe placebo, ou seja, com as mesmas causas (perfil dos participantes,
hábitos, doenças preexistentes), no entanto, altera-se a composição da medicação.
F
Í
S
I
C
A
UNIDADE 1 TÓPICO 1 7
Como exemplo, pode-se citar a viabilidade ou não da abertura de uma academia, a partir
de uma pesquisa de mercado. Pelo processo do método experimental, neste caso, poderia
ser custoso e inadequado.
E
M
5.1 DEFINIÇÃO DO PROBLEMA
E
D
U
Esta fase consiste na definição e formulação correta do problema a ser estudado. Outra C
parte importante desta fase é analisar outros estudos já realizados sobre a questão para traçar A
Ç
estratégias assertivas para a pesquisa. Ã
O
São sugestões de temas a tratar: F
Í
S
• Variação de altura, peso.
I
C
A
8 TÓPICO 1 UNIDADE 1
5.2 PLANEJAMENTO
E
dados do censo, visto ser esta uma estatística oficial (que segue os critérios e fases do método
M estatístico).
E
D A coleta direta ocorre quando não há disponibilidade de dados primários, sendo
U necessário obter os dados diretamente da fonte. Um exemplo disso é quando uma indústria
C
A de medicamentos realiza uma pesquisa para saber a preferência dos consumidores pela sua
Ç marca.
Ã
O
A coleta direta de dados pode ser classificada com relação ao fator tempo, como:
F
Í
S a) Contínua (registro) - quando é feita continuamente, tal como a de nascimentos, óbitos,
I
C os registros da fiscalização eletrônica de velocidade etc.
A
UNIDADE 1 TÓPICO 1 9
Realiza-se neste processo uma auditoria dos dados, em busca de possíveis falhas e
imperfeições ou dados a serem desconsiderados (repetições, omissões etc.), a fim de não
incorrer em erros que possam influir sensivelmente nos resultados.
a) Crítica Interna: quando visa observar os elementos originais dos dados da coleta.
b) Crítica Externa: quando visa às causas dos erros por parte do informante, por distração
ou má interpretação das perguntas que lhe foram feitas.
B
I
Por exemplo, ao aplicar o questionário, temos que fazer uma crítica para verificar se O
E
as respostas obtidas condizem com a nossa necessidade (crítica interna), no caso de haver S
erros precisamos saber o motivo da ocorrência dos mesmos para futura correção, verificamos T
A
se o pesquisado estava desatento, ou se a questão foi mal interpretada etc. (crítica externa). T
Í
S
T
I
C
5.5 ORGANIZAÇÃO DOS DADOS A
E
Após os processos comentados anteriormente, necessitamos organizá-los, ou seja, M
realizar a soma e o processamento dos dados obtidos, bem como sua disposição mediante
E
critérios de classificação. Este resumo dos dados pode ser feito através de contagem e/ou D
agrupamento. A importância desta fase do método se encontra na facilidade posterior do U
C
entendimento das informações. A
Ç
Ã
Já os dados podem ser apresentados de duas formas, que não se excluem mutuamente: O
a apresentação tabular, que é uma apresentação numérica dos dados em linhas e colunas
F
distribuídas de modo ordenado, segundo regras práticas fixadas pelo Conselho Nacional de Í
Estatística; e a apresentação gráfica, que constitui uma apresentação geométrica, permitindo S
I
uma visão rápida e clara do fenômeno. C
A
10 TÓPICO 1 UNIDADE 1
B
I
O
E
S
FONTE: A autora
T
A
T
Í
S
T 6 TERMOS BÁSICOS
I
C
A
Até aqui usamos diversos termos característicos da estatística e que irão nos
E acompanhar durante o estudo desta disciplina. Desta forma, faz-se necessário descrevê-los
M
com maior detalhamento. Assim, a seguir, apresentaremos os termos básicos da Estatística.
E
D
U
C
A
Ç
6.1 POPULAÇÃO
Ã
O
Definimos população (ou universo estatístico) o conjunto de todos os indivíduos ou a
F todos os objetos do grupo em que serão estudados a partir dos métodos estatísticos.
Í
S
I São exemplos de população:
C
A
UNIDADE 1 TÓPICO 1 11
FIGURA 2 - POPULAÇÃO
B
I
O
E
S
FONTE: Adaptado de: <http://revistaepoca.globo.com/Revista/Epoca/
T
foto/0,,45290355,00.jpg>. Acesso em: 26 jun. 2016.
A
T
Í
Em situações em que o número de indivíduos ou elementos for muito grande,
S
inviabilizando estudar toda a população, utilizamos uma parte da população que denominamos T
de amostra. I
C
A
E
M
6.2 AMOSTRA
E
D
U
Amostra é um conjunto que está contido na população estatística. Em outras palavras, C
é uma parcela representativa da população a ser estudada. Por este fato, a amostra deve A
Ç
caracterizar a população através das mesmas configurações, porém em menor escala de Ã
quantidade de elementos a serem estudados. O
F
Certamente você já vivenciou uma situação semelhante à apresentada a seguir: Í
S
I
C
A
12 TÓPICO 1 UNIDADE 1
Note que 400 acadêmicos são uma amostra do total de acadêmicos desta instituição.
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I FONTE: Adaptado de: <http://revistaepoca.globo.com/Revista/Epoca/
C foto/0,,45290355,00.jpg>. Acesso em: 26 jun. 2016.
A
UNIDADE 1 TÓPICO 1 13
Desta forma, podemos destacar cinco principais razões que levam o pesquisador a
trabalhar com amostras:
ÇÃO!
ATEN E
D
U
C
Acadêmico, toda pesquisa por amostragem tem o risco de um
A
erro, esse erro é previsto e determinado, no caso de população
Ç
pequena, o número de indivíduos da amostra representa quase
Ã
toda a população. Mais adiante veremos como esse erro aparece
O
no cálculo do tamanho da amostra.
F
Í
S
Você deve estar se perguntando: Como uma amostra pode representar uma informação I
correta de um conjunto muito grande de dados? Por que, em uma eleição, cidades com altas C
A
14 TÓPICO 1 UNIDADE 1
populações são escolhidas apenas cerca de 2000 pessoas para darem suas intenções de voto
e assim prever o candidato eleito?
Dois fatores são fundamentais para que uma amostra represente uma população,
uma delas é o tipo de amostragem utilizada e o outro corresponde a determinados cálculos
estatísticos que devemos fazer para chegar a estas comprovações. Veremos isto de maneira
detalhada a seguir:
6.3 AMOSTRAGEM
Temos várias maneiras de extrair e utilizar amostras. No entanto, o método a ser utilizado
deve estar de acordo com os objetivos do estudo. Em primeiro lugar, temos de determinar a
população-alvo, isto é, se é composta por todos as pessoas que vivem numa área de influência,
os alunos da academia, ou só as mulheres, por exemplo.
Uma vez definida a população, temos que elaborar uma lista desses elementos. Por lista
entendemos a descrição de todos eles. Isso parece levantar alguns problemas, por exemplo:
como é que obtenho a lista de todos as pessoas da área de influência de uma academia?
B
I Ou: como é que obtenho a lista de todas as mulheres que praticam atividade física numa
O determinada cidade?
E
S
T Nestes casos, temos que dar resposta a esta situação mudando para um quadro
A
T de amostragem que seja compatível com a população a estudar. A dimensão da amostra é
Í importante, sobretudo se pretendermos realizar inferência estatística e probabilidades para as
S
T médias e proporções que viermos a encontrar. Mais adiante veremos como isso é possível.
I
C
A
Os passos seguintes serão a extração da amostra e a sua validação, isto é, a forma de
nos assegurarmos que ela é suficientemente representativa. Neste ponto você verificará os
E
principais métodos de amostragem, através de exemplos práticos. Numa ideia generalista, as
M
amostragens podem ser divididas em probabilísticas e não probabilísticas.
E
D
U
C
A
Ç 6.3.1 Amostragem probabilística
Ã
O
Neste tipo de amostragem, todos os elementos da população possuem probabilidade
F
Í de pertencer à amostra. Este é o conjunto de amostragem mais adequado para um estudo
S correto e imparcial da maioria dos casos.
I
C
A
UNIDADE 1 TÓPICO 1 15
Amostragem Aleatória
10
Ao realizar a amostragem aleatória, os elementos possuem probabilidade 100 (dez a
cada cem) de participarem da amostra. Os elementos da população são numerados de 1 a
30.000 e é realizado um sorteio para a definição dos participantes.
Este método mostra-se muito útil quando a população é pequena, quando existe uma
listagem disponível e, quando a dispersão geográfica não é um problema. Porém, não é
indicado quando há a necessidade de se possuir uma lista completa de todos os elementos da
população e apresenta um elevado custo para a obtenção de informação sobre os elementos
selecionados.
Amostragem Sistemática B
I
O
A amostragem sistemática é um processo de amostragem probabilístico não aleatório, E
S
ou seja, é um processo em que se selecionam os sujeitos a incluir na amostra utilizando um T
critério. Este tipo de amostragem é utilizado quando os elementos da amostra se encontram A
T
ordenados. Ele consiste em selecionar um ponto de partida aleatório e em seguida tomar cada Í
“n” elementos de uma lista. S
T
I
Exemplo: Para realizar uma amostragem sistemática em uma população de 500 C
A
profissionais habilitados em Educação física, inicialmente devemos numerá-los de 1 até 500.
Então realizamos um sorteio e, suponhamos que saiu o número 37, logo esse funcionário será o E
M
primeiro pesquisado. Após efetuar os cálculos (que aprenderemos posteriormente) verificamos
que uma boa amostra dessa população é formada por 25 indivíduos, então fazemos a divisão E
de 500 por 25, o que resulta 20. Esse 20 representa o “passo” que daremos para “escolher” D
U
outro profissional, como começamos no profissional de número 37, vamos somando de 20 em C
20 para determinar os outros pesquisados, nesse caso seriam os funcionários de números: A
Ç
57, 77, 97, ..., até determinar os 25 indivíduos da amostra. Neste exemplo, cada profissional Ã
O
25
possui probabilidade 500 de participar da amostra.
F
Í
S
I
C
A
16 TÓPICO 1 UNIDADE 1
Amostragem Estratificada
Para realizar a amostragem estratificada devemos iniciar por identificar esses subgrupos
significativos (estratos), depois calcular o peso relativo (%) de cada um dos estratos na
população (iremos relembrar estes cálculos no tópico a seguir) e, por fim, utilizar, em cada
um dos estratos, o procedimento de amostragem aleatória para determinar os sujeitos de
cada estrato que irão integrar a amostra na mesma proporção em que estão representados
na população.
IMPO
RTAN
TE!
É importante destacar que os estratos devem ser mutuamente
exclusivos, isto é, cada elemento da população apenas deve estar
B incluído num estrato e exaustivos, ou seja, nenhum elemento da
I população pode ficar fora de um estrato.
O
E
S
T Utilizar este processo antes do sorteio da amostra é fundamental, ao passo que esta
A
T
amostra deve ser representativa. Seria bastante estranho, por exemplo, numa população de 100
Í pessoas onde 80% são mulheres, criarmos uma amostra com 90% de homens. Com certeza
S
esta amostra não representaria “de forma justa” esta população.
T
I
C Exemplo: Em uma pesquisa sobre os benefícios do hábito de atividades físicas na vida
A
das pessoas que têm entre 20 e 40 anos de idade de uma determinada cidade, precisamos levar
E em consideração que existem diferenças significativas entre a população feminina e masculina.
M
Desta forma, é importante que a nossa amostra inclua um número de homens e de mulheres
E que fosse proporcionalmente igual ao que existe na população em estudo.
D
U
C Vamos supor que esta cidade possui uma população de N = 20.000 habitantes entre
A
Ç 20 e 40 anos e para uma análise acerca do benefício do hábito de atividades físicas desta
à população é necessária uma amostra de tamanho n = 500. Além disto, nos deparamos com
O
6.000 homens e 14.000 mulheres. Como devemos escolher de forma justa os elementos desta
F amostra?
Í
S
I Como já citamos anteriormente, para este caso, devemos ter mais elementos do estrato
C de mulheres, pois são maioria nesta cidade. Para realizar esta separação de forma “justa”
A
UNIDADE 1 TÓPICO 1 17
n ( E1 ) 6000
• Para homens: E1 = = = 0, 3 = 30%
N 20000
n ( E2 )
• Para mulheres: E1 = =
14000
= 0, 7 = 70%
N 20000
Destes resultados, segue que 30% da amostra deve ser escolhida do grupo de homens
e 70% do grupo de mulheres.
ÇÃO!
ATEN
Amostragem Intencional
Deixamos claro aqui que este processo é bastante perigoso, por talvez permitir
manipulações e parcialidade em pesquisas importantes, por exemplo, pesquisas eleitorais.
E
M FONTE: Adaptado de: <http://revistaepoca.globo.com/Revista/Epoca/foto/0,,45290355,00.
jpg>. Acesso em: 26 jun. 2016.
E
D
U
C
A
Ç 6.4 TAMANHO DE UMA AMOSTRA
Ã
O
Quando iniciamos este tópico fomos questionados sobre como conseguimos descobrir
F
Í qual deve ser a quantidade exata de elementos de uma amostra para que ela realmente
S represente a população estudada e que seus resultados possam gerar confiabilidade. Para
I
C tanto, deve-se seguir as quatro etapas descritas abaixo:
A
UNIDADE 1 TÓPICO 1 19
1
n0 =
E02
1a Etapa: Cálculo da Amostra Ideal:
N ⋅ n0
n=
N + n0
n
3a Etapa: Cálculo do Estimador da Amostra: x =
N
Sendo:
N = Tamanho da População;
n = Tamanho da Amostra;
no = Tamanho da Amostra Ideal (primeira aproximação);
E0 = Erro Amostral Tolerável (admissível)
Ç ÃO!
ATEN
B
I
O
O erro amostral é tolerável na forma de coeficiente, ou seja:
E
7 34
7%
= = 0, 07 , ou ainda: 34=
% = 0, 34 . S
100 100 T
A
T
Í
Exemplo 1: Numa população de N = 30.000 elementos, qual deve ser o tamanho n da S
amostra ideal para que a pesquisa tenha erro inferiror a 4%? T
I
C
1 1
E0 4=
Resolução: Como = % 0, 04 temos: n0 = = = 625 A
( 0, 04 )
2
0, 0016
E
Que representa a amostra ideal para o caso. Incluindo agora o peso da população, M
vem: n = 625 ⋅ 30000 ≅ 613
625 + 30000 E
D
U
C
UNI A
Ç
Ã
Note que apesar do arredondamento para inteiro do número O
612,24489... ser 612, usamos 613. Para tamanho de amostra,
sempre arredondamos para cima, para garantirmos o tamanho F
mínimo da amostra e ficarmos abaixo do erro amostral admitido. Í
S
I
C
A
20 TÓPICO 1 UNIDADE 1
Sendo assim, a amostra para esta pesquisa deve ter 613 elementos para ter erro
inferior a 4%.
E
2ª etapa: cálculo da Amostra Mínima: (Lembrete: N = população, ou seja, soma de todos
M
os alunos dos cursos = 6 624.)
E N ⋅ n0 6624 ⋅ 400 2649600
n= = = = 377, 221 ≅ 378 alunos
D N + n0 6624 + 400 7024
U
C 3ª etapa: cálculo do Estimador da Amostra:
A
Ç
Ã
O
F
Í
S
I
C 4ª etapa: aplicação do Estimador aos Estratos: ( estrato ) ⋅ x
A
UNIDADE 1 TÓPICO 1 21
IMPO
RTAN
T E!
Nesta etapa, deve-se multiplicar a quantidade de alunos de cada
curso pelo valor do estimador.
IMPO
RTAN
T E!
Os valores de cada turma foram arredondados em função de
ser uma variável discreta – pessoas – além disso, para garantir
o erro mínimo temos que arredondar sempre para cima, não
importando os dígitos decimais. B
I
O
E
TABELA 2 - MATRÍCULAS DOS CURSOS DE GRADUAÇÃO DA
S
INSTITUIÇÃO X EM 2016
T
CURSO ALUNOS AMOSTRA A
T
Educação Física 870 50 Í
S
Engenharia Civil 662 38 T
Direito 1 555 89 I
C
Finanças 245 14 A
Moda 529 31 E
Marketing 340 20 M
UTU
ROS
! O
DOS F
ESTU
F
Í
No próximo tópico iremos recordar conceitos de arredondamento,
S
frações e porcentagens. Caso estejas com dificuldades para
I
compreender estes cálculos, avance para o Tópico 2 e depois retorne
C
para realizar estas autoatividades.
A
22 TÓPICO 1 UNIDADE 1
RESUMO DO TÓPICO 1
A coleta de dados pode ser direta ou indireta, sendo que a coleta direta pode ser
o
contínua, ocasional ou periódica.
A crítica dos dados pode ser externa ou interna.
o
A organização de dados nada mais é que um resumo dos dados e pode ser feito
o
através de contagem e/ou agrupamento. A importância desta fase do método se
encontra na facilidade posterior do entendimento das informações. Após realizado
esse “resumo”, os dados podem ser apresentados de duas formas: a apresentação
tabular e a apresentação gráfica.
B A análise dos resultados é o objetivo principal da estatística; consiste em apurar
o
I
resultados e interpretá-los.
O
E
S
• Quando, em uma pesquisa, decide-se analisar uma amostra, devemos recorrer aos métodos
T
A de amostragem. Estes métodos consistem no processo de seleção e escolha dos elementos de
T uma população para formar uma amostra que represente fidedignamente a população.
Í
S
T • Existem dois grandes grupos dentro da amostragem:
I
C
A Amostragem probabilística, que pode ser: amostragem aleatória, sistemática ou
o
E estratificada.
M Amostragem não probabilística: por inacessibilidade à população, a esmo (ou sem
o
E norma) ou intencional.
D
U
• Para obter uma amostra ideal, devemos seguir quatro etapas:
C
A
Ç 1
1a Etapa: Cálculo da Amostra Ideal: n0 =
à E02
O
N ⋅ n0
2a Etapa: Cálculo da Amostra Mínima: n =
F N + n0
Í
S n
3a Etapa: Cálculo do Estimador da Amostra: x =
I N
C
A 4a Etapa: Aplicação do Estimador aos Estratos (cada categoria): ( estrato ) ⋅ x
UNIDADE 1 TÓPICO 1 23
IDADE
ATIV
AUTO
Acadêmico, um dos princípios da Uniasselvi é “Não basta saber, é preciso saber fazer”.
Agora chegou a sua vez de colocar em prática os conceitos sobre matrizes, estudados
neste tópico.
1 A natação é uma atividade física praticada na água que surgiu na Grécia Antiga e é
amplamente praticada até os dias atuais, por ser considerada um dos esportes mais
benéficos ao corpo humano. Ao realizar um estudo sobre o tempo gasto, em segundos,
por 60 indivíduos, na modalidade dos 50 metros Crawl (também conhecido como nado
livre), registrou-se o tempo gasto por 16 desses atletas. Os resultados foram os seguintes:
Agora, suponha que você fará uma pesquisa por amostragem estratificada, levando
em conta um erro de, no máximo 5%, com as mulheres que completaram esta prova.
Qual deve ser o número mínimo de mulheres entrevistadas para a amostra?
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 1
TÓPICO 2
ARREDONDAMENTO, FRAÇÃO E
PORCENTAGEM
1 INTRODUÇÃO
No tópico anterior, tivemos uma noção geral de como planejar uma pesquisa através
do método estatístico. De agora em diante estudaremos ferramentas para poder efetivar cada
uma das seis etapas. Iniciaremos fornecendo os subsídios matemáticos necessários para que
você, acadêmico, possa compreender em plenitude os cálculos apresentados. Assim, neste
tópico, iremos rever como realizar o arredondamento, como operar com frações e como realizar B
os cálculos de porcentagem. I
O
E
S
T
A
2 ARREDONDAMENTO DE NÚMEROS T
Í
S
Diversas operações matemáticas resultam em números não inteiros, com várias casas T
I
decimais, ou seja, com vários dígitos após a vírgula. Quando um número desse tipo apresentar C
uma quantidade de casas decimais maior que a desejada, devemos realizar o arredondado do A
A
TE! Ç
RTAN
IMPO Ã
O
Se o arredondamento for: F
• Inteiro, significa que não teremos casas após a vírgula. Í
• Decimal, significa que teremos uma única casa após a vírgula. S
• Centésimo, significa que teremos duas casas após a vírgula. I
• Milésimo, significa que teremos três casas após a vírgula. C
A
26 TÓPICO 2 UNIDADE 1
Para aplicar qualquer uma das regras, é necessário primeiramente definir o número
de casas a ser trabalhado após a vírgula, conforme acabamos de ver. A partir daí, devemos
identificar qual é o dígito remanescente e analisar os dígitos posteriores.
E
M IMPO
RTAN
TE!
E
D Há duas coisas a observar:
U • Somente uma das opções acima é a correta.
C • Os zeros à direita de um número decimal não precisam ser
A escritos.
Ç
Ã
O
Vejamos como determinar a forma correta de arredondamento.
F
Í
S
I
C
A
UNIDADE 1 TÓPICO 2 27
Exemplos:
a) 13,24 arredondado ao décimo mais próximo será 13,2.
b) 38,473 arredondado ao centésimo mais próximo será 38,47.
Exemplos:
a) 72,87 arredondado ao décimo mais próximo será 72,9.
b) 3,7 arredondado ao inteiro mais próximo será 4.
B
I
III- Quando o primeiro algarismo a ser abandonado for o 5 há duas situações a considerar: O
E
S
T
ÇÃO! A
ATEN T
Í
S
Acadêmico, tenha muita atenção nesta situação, pois a maioria T
dos erros cometidos na etapa de arredondamento de dados, I
ocorre aqui. C
A
E
(i) Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma M
unidade no algarismo a permanecer (dígito remanescente). E
D
U
Exemplos:
C
a) 7,352 arredondado ao centésimo mais próximo será 7,4. A
b) 45,6501 arredondado ao décimo mais próximo será 45,7. Ç
Ã
c) 106,250002 arredondado ao décimo mais próximo será 106,3. O
F
(ii) Se o 5 for o último algarismo ou se ao 5 só seguirem zeros, o último algarismo a ser Í
conservado (dígito remanescente) só será aumentado de uma unidade se for ímpar. No caso S
I
de ser par, fica inalterado o último algarismo a permanecer (dígito remanescente). C
A
28 TÓPICO 2 UNIDADE 1
Exemplos:
a) 56,75 arredondado ao décimo mais próximo será 56,8.
b) 56,65 arredondado ao décimo mais próximo será 56,6.
c) 56,7500 arredondado ao décimo mais próximo será 56,8.
d) 56,6500 arredondado ao décimo mais próximo será 56,6.
S!
DICA
E
M
3 FRAÇÕES
E
D
U Ao se questionar sobre o motivo de revisar frações e porcentagem numa disciplina de
C estatística, basta nos remetermos aos cálculos das amostras estudados no tópico anterior, em
A
Ç que foram necessárias segmentações de seus participantes. Um exemplo disso é um caso em
à que apenas 1/4 (um quarto), ou 25%, de uma população de interesse é acessível para uma
O
pesquisa. Precisamos saber calcular qual é a quantidade exata dos elementos da população
F para depois obter a amostra.
Í
S
I
C
A
UNIDADE 1 TÓPICO 2 29
Obviamente, este caso citado acima é apenas um entre vários existentes em que iremos
precisar de um apoio das frações e percentuais para conseguir resolver problemas com os
quais podemos nos deparar.
3.1 TRANSFORMAÇÕES
IMPO
RTAN
TE!
Vamos lembrar, neste momento, o que uma fração representa.
Fração é uma palavra que vem do latim “fractus” e significa B
“partido”, “quebrado”, assim, podemos dizer que fração é a I
representação das partes iguais de um todo. Cada fração é O
formada por três elementos: o numerador (o número da parte de E
cima da fração), o traço (que serve para separar os dois valores e S
representa uma divisão) e, finalmente, o denominador (o número T
da parte de baixo). A
T
numerador
Í
denominador
S
T
O denominador representa quantas partes iguais estão contidas I
no todo (ou seja, em quantas partes algo foi dividido). E, o C
numerador representa a quantidade de partes consideradas de A
um todo (quantas partes do todo nós possuímos).
Por exemplo: E
M
1) 3
4
E
D
U
C
2) 9
+ + A
4 Ç
Ã
O
F
Í
S
I
C
A
30 TÓPICO 2 UNIDADE 1
B
I
O
E Esse traço sobre os dois últimos seis indicam que se trata se uma dízima periódica,
S isto é, que esse valor se repete infinitamente.
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O Transformação de Número Decimal em Número Fracionário
F
Í
Para transformar números decimais em um número fracionário, nós temos três diferentes
S situações. Atente-se para cada uma delas.
I
C
A
UNIDADE 1 TÓPICO 2 31
75
0,75 (lemos, setenta e cinco centésimos), ou seja, 100
.
Verifique que:
6 75
0, 6 = 0, 75 =
10 100
Uma casa decimal – Um zero Duas casas decimais – Dois zeros
438 129
4, 38 = 0,129 =
100 1000
Duas casas decimais – Dois zeros Três casas decimais – Três zeros
B
I
Desta forma, o número de zeros colocados no denominador é igual ao número de casas O
E
após a vírgula. S
T
A
Situação 2: O número decimal é uma dízima periódica simples T
Í
S
Inicialmente, vamos recordar que uma dízima periódica é a parte decimal infinita (não T
tem fim). A dízima periódica é dita simples quando for composta apenas de um período que se I
C
repete igualmente, por exemplo: 0,22222...; 2,5656565656... Já a dízima periódica composta
A
é formada por algarismos que não fazem parte do período, por exemplo, 0,1555...; 2,354444...
Esta dízima será estudada na Situação 3. E
M
Esses números também podem ser escritos em forma de fração, mas apesar de serem E
D
números decimais na sua transformação, é preciso utilizar um processo diferente da Situação U
1. Acompanhe o raciocínio: C
A
Ç
Exemplo 1: Transformar 0,2222... em fração. Ã
O
O objetivo é eliminar as casas decimais. Para isso, andaremos com a vírgula para
a direita uma casa decimal, pois apenas o 2 que repete. Isso é o mesmo que multiplicar o
0,2222... por 10. Ficando assim:
Temos duas equações (I) e (II). Iremos subtrair as duas: (II) – (I).
9
Como x = 0,2222.... , então 0,2222... é o mesmo que 2 . Se dividirmos 2 : 9 chegaremos
a 0,2222...
B Andando com a vírgula duas casas para a direita, pois o número que
I
O
repete nas casas decimais é o 63. Andar duas casas para a direita é o mesmo que multiplicar
E por 100.
S
100x = 63,636363...(II)
T
A
T Subtraindo as duas equações (II) e (I) encontradas:
Í
S
T
I
C
A
E
M
Como x = 0,636363... então 0,636363... é o mesmo que 99 .
63
E
D
U Acadêmico, note que na prática a quantidade de números nove colocados no
C
denominador é igual ao número de dígitos que o período possui. Isso se aplica quando a parte
A
Ç inteira for nula.
Ã
O
Quando tivermos 2, 777..., teremos que separar a parte inteira da decimal para
F transformar, fazendo 2 + 0,777..., o que resultará em 2 +
7
. Essa soma será estudada adiante.
Í 9
S
I Situação 3: O número decimal é uma dízima periódica composta.
C
A
UNIDADE 1 TÓPICO 2 33
Como o 3 não faz parte da dízima, devemos multiplicar a equação por 10 para que o
número 3 passe para o outro lado deixando nas casas decimais apenas a dízima.
10x = 23,5555... (I)
Agora, multiplicamos a equação (I) por 10 novamente para que possamos ter um período
fazendo parte do lado inteiro.
10 . 10 . x = 235,5555...
100x = 235,5555... (II)
212
Como x = 2,35555... então 2,35555... é o mesmo que 90
B
I
O
E
S
3.2 OPERAÇÕES T
A
T
Acadêmico, é imprescindível que tenhas domínio das operações relacionadas neste Í
S
subtópico. Elas fazem parte do seu cotidiano, da sua jornada acadêmica e profissional, por
T
este motivo é importante compreendê-las e não somente resolvê-las. I
C
A
Adição e Subtração de Frações
E
M
Só podemos somar ou subtrair frações que possuam o mesmo denominador.
E
D
U
ÇÃO! C
ATEN
A
Ç
Ã
Atente para a definição: só podemos somar ou subtrair frações O
que possuam o mesmo denominador. Esta definição permite que
você compreenda os artifícios utilizados adiante. F
Í
S
I
C
A
34 TÓPICO 2 UNIDADE 1
Exemplo 1:
1 3
+
5 5
Veja a representação geométrica.
Assim,
1 3 4
+ =
5 5 5
Exemplo 2:
3 2
+
4 4
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
Exemplo 3:
3 2
E −
M 4 4
E
D
U
C
A
Ç 3 2 1
à − =
4 4 4
O
F
Í
S
I
C
A
UNIDADE 1 TÓPICO 2 35
Assim, para somar ou subtrair frações que possuem o mesmo denominador, basta
manter o denominador e operar o numerador.
1 1
E se quisermos somar, + , como fazer?
2 3
Geometricamente, teremos:
1 1
Note que se “transportarmos” a quantidade 2
para o 3
, não irá caber. E, se
1 1
“transportarmos” a quantidade para o 2
irá sobrar espaço. Isso porque o todo está repartido
3
em quantidades diferentes e, pela definição, somente podemos somar e subtrair frações que
possuem o mesmo denominador, ou seja, que estejam repartidas em quantidades iguais.
E
M
E
D
U
C
A
Ç
Acadêmico, observe que apesar do “todo” estar repartido em quantidades diferentes, Ã
O
a parte pintada corresponde à metade da figura (todo) em todas as frações. Por isso dizemos
que elas são frações equivalentes. F
Í
S
I
C
A
36 TÓPICO 2 UNIDADE 1
Veja que agora o todo está repartido em partes iguais e assim podemos realizar a adição.
1 1 3 2 5
+ = + =
2 3 6 6 6
Exemplo:
B
I
Frações equivalentes às frações dadas, com o mesmo denominador.
O
E
S
T Veja o denominador da fração 13 , que era 3 e aumentou para 15, ou seja, multiplicamos
A por 5. Para encontrarmos o numerador que vai manter a equivalência precisamos realizar a
T
Í mesma operação feita no denominador (multiplicar por 5), assim, 1 x 5 = 5.
S
T 1 5
I
= Frações equivalentes
3 15
C
A
O mesmo ocorre para a fração 4
, que tinha o denominador 5 e devido ao m.m.c.,
E 5
M precisamos de uma fração equivalente com denominador 15, assim multiplicamos por 3 o
denominador 5, logo, precisamos fazer a mesma coisa no denominador, 4 x 3 =12.
E
D
U 4 12
= Frações equivalentes
C 5 15
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 1 TÓPICO 2 37
S!
DICA
I
O
T E!
IMPO
RTAN E
S
T
O menor múltiplo comum de dois ou mais números, diferente de A
zero, é chamado de mínimo múltiplo comum desses números. T
Usamos a abreviação m.m.c. Í
S
T
I
Relembraremos uma técnica chamada de “decomposição simultânea em fatores primos”. C
A
Nesta técnica decompomos ao mesmo tempo cada denominador em fatores primos. O produto
de todos os fatores primos que aparece nessa decomposição será o mínimo múltiplo comum. E
M
Número primo é um número que possui apenas 2 divisores (o número 1 e ele mesmo). E
São números primos: 2, 3, 5, 7, 11, 13, 17, 19, ... D
U
C
Utilizando essa técnica, observe como determinar o m.m.c. de 12, 8 e 6. A
Ç
Ã
O
F
Í
S
I
C
A
38 TÓPICO 2 UNIDADE 1
Vejamos como utilizar esse conceito para determinar as frações equivalentes e conseguir
resolver a adição e subtração de frações com denominadores diferentes, vamos a mais um
exemplo:
3 1 5
− +
10 2 6
Sabemos que o novo denominador deve ser 30 para que possamos escrever frações
equivalentes, e assim obter frações de mesmo denominador para poder efetuar a adição e
B subtração.
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A Multiplicação de Frações
Ç
Ã
O Basta multiplicar numerador por numerador e denominador por denominador.
F
Í Exemplos:
S
I
C
A
UNIDADE 1 TÓPICO 2 39
ÇÃO!
ATEN
Você não deve tirar o M.M.C., ou seja, não é necessário que as frações
tenham denominadores iguais.
Iniciamos representando a primeira fração (se preferir é possível iniciar pela segunda,
visto que a ordem dos fatores não altera o produto).
B
I
Em seguida, subdividimos cada uma dessas partes em partes menores em quantidades O
iguais ao denominador da segunda fração, que neste caso é 3. E
S
T
A
T
Í
S
T
Agora, para cada parte pintada, tomamos a quantidade de subdivisões iguais ao I
numerador da segunda fração, que no caso é 2. C
A
E
M
E
D
Desta forma, o círculo original foi dividido em duas partes e depois cada parte subdividida U
em três, totalizando 6 subdivisões, destas 6, tomamos duas, ou seja: 2/6. C
A
Ç
Ã
O
F
Í
Assim, verificamos que:
1 2 2
⋅ =
2 3 3
S
I
FONTE: Adaptado de: <http://obaricentrodamente.blogspot.com.br/2012/07/aspectos-geometricos- C
para-multiplicacao.html>. Acesso em: 18 jun. 2016. A
40 TÓPICO 2 UNIDADE 1
Divisão de Frações
Exemplos:
Este é o processo prático, mas você sabe por que mantemos a primeira fração e
invertemos a segunda passando a divisão para multiplicação?
Na verdade, quando fazemos isso, estamos omitindo uma passagem. O que se pretende
ao multiplicar numerador e denominador pelo inverso do denominador é obter um denominador
B igual a 1, para operar apenas com o numerador, facilitando o cálculo. Observe:
I
O
E
S
T
A
T
Í Vejamos também a forma geométrica da divisão entre frações, para isso, tomemos
S 1 1
T como exemplo a divisão ⋅
2 4
I
C
Iniciamos representando geometricamente ambas as frações.
A
E
M
E
D
U
C
A
Ç 1 1
Observe que a fração cabe duas vezes na fração , portanto, podemos dizer que:
à 1 1 4 2
O : = 2.
2 4
1 1 1 4 4
Pelo artifício do algoritmo, : = ⋅ = = 2.
F 2 4 2 2 2
Í
S
I
C
A
UNIDADE 1 TÓPICO 2 41
!
ROS
OS FUTU
ESTUD
4 PORCENTAGENS
B
I
O
E
S
Neste estudo, você necessita entender muito bem como lidar com todos estes tipos de
T
representação de percentuais. A
T
Í
Por exemplo: Determine qual é o valor que representa 10% de 530. S
T
I
Veja, que o processo pode ser feito da seguinte forma: C
10 1 A
10% × 530 = × 530 = × 530 = 0,1× 530 = 53
100 10 E
M
Repare, que neste cálculo, utilizamos todas as suas formas de representação, a qual E
podemos recair, na forma mais simples, que é 0,1× 530 = 53 . A este valor 0,1, chamamos de D
U
fator de multiplicação percentual.
C
A
Ç
Em outras palavras, para conseguir resolver situações que envolvem percentuais, basta
Ã
descobrir qual é o fator de multiplicação percentual que necessitamos utilizar para alcançar o O
resultado esperado. Segue uma lista de situações em que podemos encontrá-los:
F
Í
1) Situação: 25% do valor 1240. S
I
C
A
42 TÓPICO 2 UNIDADE 1
Percentual: 25%
Fator de multiplicação: 0,25
Resultado: 0,25 x 1240 = 310
Note que os fatores de multiplicação são o resultado dos percentuais divididos por 100.
Outro ponto importante que podemos ressaltar é o fato de que os acréscimos e descontos são
sempre obtidos a partir de 100% (valor referência/todo).
Agora, para ilustrar como este processo, do fator multiplicativo, é muito eficaz nos
problemas envolvendo percentuais, iremos realizar uma série de exemplos em que o utilizamos
B como processo de resolução:
I
O
E Exemplos:
S
T
A 1) No curso de Educação Física há 900 alunos, 42% são rapazes. Calcule o número
T
Í de rapazes.
S
T
I Sabemos que 42% = 0,42, logo, basta realizar a multiplicação:
C 0,42 x 900 = 378 rapazes
A
envolvidos. Você com certeza já deve ter se deparado com alguma situação em que pode se
encontrar o valor percentual envolvido. Por exemplo:
Repare que nos casos acima, podemos desejar conhecer qual é o percentual de
funcionárias da empresa, ou qual foi a taxa de queda percentual do dólar na última semana.
Iremos demonstrar, a seguir, uma forma muito prática para esta determinação, em dois casos:
Para este caso, basta dividir o valor conhecido pelo valor total, onde no caso (a):
E
Que representa em uma queda de 4,975%. Onde, se o valor fosse (+), teríamos uma alta! M
E
Para finalizar, vejamos mais alguns exemplos: D
U
C
1) Numa turma de 30 acadêmicos faltaram 12 devido às fortes chuvas dos últimos dias. A
Ç
Qual a taxa de acadêmicos presentes?
Ã
O
Sabemos que se faltaram 12 acadêmicos, é porque os outros 18 estavam presentes.
F
Logo: Í
S
I
C
A
2) Uma medicação custa R$ 40,00 e é vendida por R$ 52,00. Qual é a taxa de lucro?
44 TÓPICO 2 UNIDADE 1
3) Comprei um par de óculos de sol por R$ 250,00 e vendi por R$ 200,00. De quanto
por cento foi o prejuízo?
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 1 TÓPICO 2 45
RESUMO DO TÓPICO 2
ID ADE
ATIV
AUTO
1 Em uma pesquisa sobre o tempo, em minutos, gasto por acadêmicos para resolver um
teste psicológico observou-se os dados listados abaixo. Para padronizar a quantidade de
casas após a vírgula dos resultados, faça o arredondamento de cada um dos números
abaixo para o décimo mais próximo:
• 23,40 =
• 234,7832 =
• 45,09 =
• 48,85002 =
B • 120,4500 =
I
O
E A resposta que apresenta os arredondamentos de forma correta é:
S
T
a) ( ) 23,4 – 234,8 – 45,1 – 48,9 – 120,4
A b) ( ) 23,4 – 234,8 – 45,0 – 48,9 – 120,5
T
c) ( ) 23,4 – 234,8 – 45,1 – 48,8 – 120,5
Í
S d) ( ) 23,4 – 234,8 – 45,1 – 48,8 – 120,4
T
I
C 2 Um profissional de Educação Física tem uma jornada semanal de trabalho de 30 horas.
A Devido ao acúmulo de atendimento personalizado na semana passada, ele precisou
E fazer 12 horas extras. A fração que corresponde a quanto ele trabalhou a mais do que
M o previsto é:
E
D a) ( ) 1/4.
U
C b) ( ) 1/5.
A c) ( ) 2/5.
Ç
d) ( ) 2/3.
Ã
O
3 Uma academia realizou compras de novas máquinas para uma de suas filiais no valor
F
Í de R$ 35.000,00, efetuando pagamento à vista e recebendo por isso um desconto de
S 7% no valor da nota fiscal. Qual o valor do desconto que recebeu esta empresa?
I
C
A
UNIDADE 1 TÓPICO 2 47
a) ( ) R$ 2.450,00
b) ( ) R$ 3.150,00
c) ( ) R$ 3.169,00
d) ( ) R$ 4.150,00
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
48 TÓPICO 2 UNIDADE 1
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 1
TÓPICO 3
AGRUPAMENTO DE DADOS
1 INTRODUÇÃO
Uma das fases do método estatístico refere-se ao agrupamento de dados, que trata
de como organizar os dados de uma certa pesquisa e como realizar algumas considerações
a partir desta organização. A organização dos dados é uma das formas mais primitivas de se
ter um resultado com relação a uma pesquisa.
B
Todo fenômeno apresenta diversas variações que devem ser analisadas sob diversos I
O
aspectos, de modo que possamos compreendê-lo e agir sobre ele. Desta forma, antes de
E
tratarmos das formas de agrupamento de dados, este tópico também apresentará os tipos S
T
de variáveis com as quais nos deparamos ao estudar qualquer fenômeno e qual o melhor
A
tratamento a ser dado. T
Í
S
T
I
C
2 VARIÁVEIS ESTATÍSTICAS A
E
Variável estatística é o conjunto de resultados possíveis de um fenômeno quando são M
feitas sucessivas medidas. São as características que podem ser observadas (ou medidas) em E
cada elemento da população. Por exemplo, um estudo de análise biomecânica do movimento D
U
humano durante a realização de lançamento de dardos será realizado por um pesquisador,
C
e o problema básico que se coloca nesta pesquisa é definir quais variáveis irão participar do A
Ç
estudo. Nesse caso, podemos definir as variáveis como: idade, altura, peso, cor dos cabelos,
Ã
renda familiar, sexo etc. Notem a importância de definir bem as variáveis, pois é claro que a O
“cor do cabelo” não tem importância para a pesquisa em questão.
F
Í
Na maior parte das vezes, a escolha do método de análise ou descrição dos dados S
I
depende do tipo de variável (dados) considerada. Alguns conjuntos de dados (como alturas, C
A
50 TÓPICO 3 UNIDADE 1
pesos) consistem em números, enquanto outros são não numéricos (como sexo, cor do cabelo).
Para distinguir esses dois tipos de dados aplicam-se, respectivamente, as expressões dados
quantitativos e dados qualitativos.
Como o próprio nome sugere, estes dados representam objetos de estudo em que
a informação se refere a alguma qualidade, categoria, não se associando a números, mas,
sim, à classificação, por exemplo, o sexo de um indivíduo, que pode ser classificado como
masculino ou feminino.
B
I
O
FONTE: A autora E
S
T
Acadêmico, observe ainda que uma mesma população pode originar vários tipos de A
T
dados. Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
52 TÓPICO 3 UNIDADE 1
qualidade
número de ofertas, do produto,
preço (R$), cor, caro ou
Eletrodomésticos quantidades classificação no
peso, potência. barato, marca.
vendidas, selo de economia
procel.
FONTE: A autora
Já vimos que toda pesquisa envolve coleta de dados, seja na forma quantitativa ou
qualitativa, que devem ser organizadas, analisadas, criando conclusões sobre uma determinada
pesquisa. Quando estes dados são coletados sem que haja qualquer tipo de organização,
dizemos que os dados se apresentam na forma bruta.
Exemplo: Ao realizar uma pesquisa em julho de 2016, com uma turma de 50 acadêmicos
do Curso de Educação Física da Faculdade X, sobre o tempo (em segundos) que levaram para
cumprir uma prova de resistência. Os dados a seguir demonstram o resultado bruto obtido:
61 65 43 53 55 51 58 55 59 56
52 53 62 49 68 51 50 67 62 64
53 56 48 50 61 44 64 53 54 55 B
I
48 54 57 41 54 71 57 53 46 48 O
E
55 46 57 54 48 63 49 55 52 51 S
T
A
Como podemos notar, fazer qualquer tipo de observação em dados apresentados T
Í
desta forma é algo demorado e cansativo. Por isso, é importante que os dados apresentados S
em uma pesquisa sejam organizados, pois existem análises estatísticas que só poderão ser T
I
realizadas se os dados estiverem realmente organizados, dando uma clareza visual para os C
resultados obtidos. A
E
M
E
3.2 ROL D
U
C
A organização de dados em ROL é a simples tarefa de colocar os dados quantitativos A
Ç
em ordem crescente ou decrescente, podendo ser por meio de uma tabela ou simplesmente Ã
um ao lado do outro. Esta simples forma de ordenação dos dados já aumenta a capacidade O
41 43 44 46 46 48 48 48 48 49
49 50 50 51 51 51 52 52 53 53
53 53 53 54 54 54 54 55 55 55
55 55 56 56 57 57 57 58 59 61
61 62 62 63 64 64 65 67 68 71
ÇÃO!
ATEN
Note que, neste exemplo, os dados foram alinhados de forma crescente. Poderiam
também estar na forma decrescente, mas foram organizados um ao lado do outro. No entanto,
poderíamos tê-los apresentados um embaixo do outro, criando colunas de organização.
B
I
Quando a quantidade de dados coletados não for muito grande, a organização em ROL
O é bastante útil. Por outro lado, para dados em quantidades grandes, esta forma de organizar
E
pode ser compreendida como ineficaz, pois analisar um grande número de dados em ordem
S
T numa tabela acaba confundindo em muitos casos a veracidade dos dados apresentados.
A
T
Í
!
S ROS
OS FUTU
T ESTUD
I
C
A Veremos nos próximos itens como proceder com este volume de
dados, através de agrupamentos simples ou por agrupamentos
E por faixa de valor. Estes agrupamentos também são conhecidos
M como distribuição de frequência.
E
D
U
C
A 3.3 AGRUPAMENTO SIMPLES OU DISTRIBUIÇÃO DE FREQUÊNCIA
Ç
SEM INTERVALOS DE CLASSE
Ã
O
A distribuição de frequência sem intervalos de classe ou agrupamento simples consiste
F
Í em juntar os dados que possuem valores iguais e transformar este aglomero de dados em uma
S tabela organizada por colunas (mais comum) ou linhas. Este agrupamento deve ser realizado
I
C após os dados estarem organizados em ROL, pois facilita a contagem.
A
UNIDADE 1 TÓPICO 3 55
62 2 E
M
63 1
64 2 E
D
65 1 U
C
67 1 A
68 1 Ç
Ã
71 1 O
Total 50 F
Í
FONTE: A autora S
I
C
A
56 TÓPICO 3 UNIDADE 1
Ç ÃO!
ATEN
E
D 1º Passo - Organize os dados brutos em um ROL.
U
2º Passo - Calcule a amplitude total da amostra (AA).
C
A
Ç Amplitude total da amostra: é a diferença entre o valor máximo e o valor mínimo da
Ã
O amostra (ROL). Onde AA = Xmax - Xmin.
F
Í 3º Passo - Calcule o número de classes através da “Regra de Sturges”.
S
I
C
A
UNIDADE 1 TÓPICO 3 57
Classe: são os intervalos de variação dos dados. É simbolizada por i e o número total
de classes simbolizada por k.
IMPO
RTAN
TE!
Acadêmico, você precisará de uma calculadora científica para
determinar o logaritmo de um número. Na calculadora, deve-
se primeiro descobrir o log n, depois multiplicar por 3,3 e, por
último, somar 1.
Caro acadêmico, é importante que você tenha em mente que qualquer regra para
determinação do número de classes da tabela não nos leva a uma decisão final. O número de
classes vai depender de um julgamento pessoal, que deve estar ligado à natureza dos dados,
como, por exemplo, quando se está trabalhando com notas de alunos (de zero a dez), a regra
perde o seu verdadeiro objetivo, mesmo porque normalmente trabalha-se com amostras
B
superiores a 100 elementos. Neste caso, aplicando a regra de Sturges para uma amostra de
I
1200 elementos encontrar-se-ia 11 classes, o que se torna inviável. O
E
S
4º Passo - Decidido o número de classes, calcule então a amplitude do intervalo de T
classe (h). A
T
Í
A amplitude do intervalo de classe é sempre o número arredondado para cima, resultante S
T
da divisão entre a amplitude total da amostra (AA) e o número de classes (i) encontrada no I
cálculo da Regra de Sturges. C
A
E
M
E
D
U
C
Ç ÃO! A
ATEN
Ç
Ã
AA O
O símbolo > significa maior que, ou seja, a desigualdade h > i .
Significa que h é maior que a razão entre AA (amplitude total da F
amostra) e i (número de classes). Í
S
I
C
A
58 TÓPICO 3 UNIDADE 1
Exemplo: Vamos seguir estes passos para a construção de uma tabela de distribuição
de frequência de classes com os dados já usados anteriormente.
41 43 44 46 46 48 48 48 48 49
49 50 50 51 51 51 52 52 53 53
53 53 53 54 54 54 54 55 55 55
B 55 55 56 56 57 57 57 58 59 61
I
O 61 62 62 63 64 64 65 67 68 71
E
S
T 2º Passo - Calcule a amplitude total da amostra (AA).
A
T
Í Vamos lembrar que a amplitude total da amostra é a diferença entre o valor máximo e
S
T o valor mínimo da amostra (ROL).
I AA = Xmax - Xmin.
C
A Para este exemplo, o valor máximo é 71 e o valor mínimo é 41. Logo:
AA = 71 – 41
E
AA = 30w
M
Registre isso! Amplitude total é 30!
E
D
U 3º Passo - Calcule o número de classes através da "Regra de Sturges".
C
A
Ç Regra de Sturges: i = 1 + 3,3.log n
Ã
O
Para o nosso exemplo, i é o número de classes da distribuição de frequência que
F queremos descobrir e n é o número de dados da nossa amostra, ou seja, n = 50. Portanto:
Í
S i = 1 + 3,3 ∙ log 50
I
C
A
UNIDADE 1 TÓPICO 3 59
Em uma calculadora científica, você consegue determinar que log 50 = 1,6990 (valor
arredondado).
i = 1 + 3,3 ∙ 1,6990
i = 1 + 5,6067 Lembre-se que em uma expressão
numérica devemos resolver primeiramente
i = 6,6067 a multiplicação e depois a adição.
IMPO
RTAN
T E!
B
I
A amplitude do intervalo deve ser arredondado (sempre para cima), O
levando-se em consideração o número de casas após a vírgula dos E
dados brutos. S
T
A
T
5º Passo - Montar a tabela com as classes. Colocamos inicialmente o menor valor da Í
amostra na parte inferior da primeira classe e na parte superior ela aumentada pela amplitude S
T
da classe e seguir este raciocínio para as demais classes. Observe o exemplo: I
C
TEMPO QUE OS ACADÊMICOS DO CURSO DE EDUCAÇÃO FÍSICA A
DA FACULDADE X, LEVARAM PARA CUMPRIR A PROVA DE
RESISTÊNCIA - JULHO DE 2016 E
M
Tempo (em segundos)
E
41 ├ 46
D
46 ├ 51 U
C
51 ├ 56 A
56 ├ 61 Ç
Ã
61├ 66 O
66 ├ 71 F
71 ├ 76 Í
S
Total I
C
FONTE: Dados fictícios A
60 TÓPICO 3 UNIDADE 1
• Este símbolo ├ indica um intervalo, note que ele é fechado à esquerda, ou seja, inclui
o número e aberto à direita, ou seja, exclui o número.
• O intervalo representado por 41 ├ 46 compreende os tempos de 41 segundos até
antes de chegar aos 46 segundos, ou seja, quem fez 46 segundos não irá contar neste intervalo
e sim no próximo.
• Na terceira linha, onde temos o intervalo 51 ├ 56, há 19 acadêmicos que realizaram
a prova em 51, 52, 53 e 54 segundos.
• Se todos os dados fossem contemplados até o intervalo 66 ├ 71, não haveria
necessidade de ter mais uma classe.
• Limites de cada classe: o limite de cada classe se refere aos extremos inferior e
superior de cada linha. Para a classe 41 46, o limite inferior (Li) é 41 e o limite superior (Ls)
é 46. O símbolo indica que à esquerda o intervalo é fechado e à esquerda é aberto. Isso
significa que o valor de 46 não pertence a essa classe e sim à segunda classe 46 51.
Ponto médio da classe: é o ponto que divide o intervalo de classe em duas partes
iguais. No exemplo anterior, em 41 ├ 46 o ponto médio xi = , ou seja, xi= Li + Ls .
2
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
62 TÓPICO 3 UNIDADE 1
RESUMO DO TÓPICO 3
Acadêmico, neste tópico você estudou que as variáveis estatísticas podem ser
classificadas em qualitativas e quantitativas. As qualitativas ainda podem ser nominais ou
ordinais e as quantitativas podem ser discretas ou contínuas.
IDADE
ATIV
AUTO
3 5 4 1 6 6 5 1 3 4 F
Í
4 6 1 1 3 4 5 6 4 4 S
I
C
A
64 TÓPICO 3 UNIDADE 1
a) ( ) 4
b) ( ) 5
c) ( ) 6
d) ( ) 7
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 1 TÓPICO 3 65
IAÇÃO
AVAL
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
66 TÓPICO 3 UNIDADE 1
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 2
MEDIDAS DE POSIÇÃO
OBJETIVOS DE APRENDIZAGEM
utilizar
a linguagem bioestatística como instrumento de apoio na
execução de atividades do cotidiano;
E
TÓPICO 1 - MEDIDAS DE TENDÊNCIA CENTRAL M
F
Í
S
I
C
A
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 2
TÓPICO 1
1 INTRODUÇÃO
B
Para ressaltar as tendências características de cada distribuição é necessário introduzir I
O
conceitos que se expressem através de números, que permitam traduzir estas tendências.
E
Estes conceitos são denominados elementos típicos das medidas de posição, assunto desta S
T
unidade. As medidas de posição representam uma série de dados, orientando quanto à posição
A
da distribuição com relação ao centro. Dentre as várias medidas de posição, descreveremos T
neste tópico as Medidas de Tendência Central. Í
S
T
As Medidas de Tendência Central são números que indicam o valor médio de uma I
C
distribuição de frequência procurando reduzir todos os valores num só, e de preferência, tomam A
como mais representativo aquele que esteja no centro da distribuição. São três as medidas
E
de posição: M
E
• Média: medida de uniformização D
• Mediana: medida de posição U
C
• Moda: medida de concentração
A
Ç
Acadêmico, é importante você notar que cada grupo de dados está devidamente Ã
O
estabelecido na dependência do que está sendo verificado e que, desta forma, há três maneiras
diferentes de calcular essas medidas, que dependem de como os dados se encontram: dados F
Í
não estão agrupados, dados agrupados em distribuição de frequência sem intervalo de classe S
e dados agrupados em distribuição de frequência com intervalo de classe. I
C
A
70 TÓPICO 1 UNIDADE 2
2 MÉDIA ARITMÉTICA
UNI
E
D
U
C
A Vejamos exemplos que demonstram em quais situações a média aritmética pode ser
Ç
à utilizada.
O
FIGURA 7 - CAFÉ
Resposta:
Os valores registrados pelo consumo de café nestes jogadores foram: 8, 7, 4 e 5. Com
isso, a média é representada por: B
I
O
E
S
T
A
O que implica que cada um dos quatro jogadores poderia tomar seis cafés que o T
Í
consumo seria o mesmo. Dizemos então que a média de consumo diário é de seis cafés por S
jogador, mesmo observando que nenhum dos quatro jogadores analisados tomou esta quantia. T
I
C
Exemplo 2: Um professor de Educação Física verificou que as notas da prova teórica A
sobre atletismo dos seis meninos da turma foram: 8,5; 5,0; 9,0; 3,5; 7,5 e 8,5. Com o intuito de
E
verificar como foi o desempenho geral destes meninos, o professor decidiu encontrar a média M
aritmética. Qual valor encontrou?
E
D
Resposta: U
C
Somando os valores das notas e dividindo pelas seis notas somadas: A
Ç
Ã
O
F
Í
A média aritmética destas notas é 7. S
I
C
A
72 TÓPICO 1 UNIDADE 2
Resposta: Como sabemos que a média mínima exigida pela escola é 7, podemos
desenvolver a questão da seguinte forma, adotando com x a nota ainda a ser feita:
Concluímos que a nota mínima que Maria pode tirar é 8,5 para que sua média fique
dentro das expectativas da Universidade.
E
M
E
D
U
C Onde:
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 2 TÓPICO 1 73
Para ter uma visão geral do desempenho destes acadêmicos nesta avaliação, a
professora calculou a média aritmética.
B
I
Resolução: Iniciamos calculando na própria tabela o produto e calculando seu O
E
somatório.
S
T
A
TABELA 6 - NOTAS DOS ACADÊMICOS DO 7O SEMESTRE DO CURSO DE EDUCAÇÃO FÍSICA NA
T
DISCIPLINA DE BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA - UNIASSELVI - 2016
Í
Notas (xi) Número de Acadêmicos (fi) xi ∙ fi S
T
3 3 3∙3=9 I
C
4 6 4 ∙ 6 = 24 A
5 9 5 ∙ 9 = 45
E
6 8 6 ∙ 8 = 48 M
7 6 7 ∙ 6 = 42 E
8 3 8 ∙ 3 = 24 D
U
Total 35 192 C
A
FONTE: A autora Ç
Ã
O
Feito isso, basta substituir as informações necessárias na fórmula:
F
Í
S
I
C
A
74 TÓPICO 1 UNIDADE 2
Assim, a média da turma nesta avaliação, em uma escala de 0 até 10, foi de 5,49.
Em uma escola de Basquetebol, em São Paulo, o treinador busca manter uma média de
altura de seus atletas de 1,95m. Sabendo que, atualmente, treinam nesta escola 30 atletas, os
B quais as alturas estão relacionadas na tabela a seguir, responda se a média de altura pleiteada
I por este treinador está sendo mantida.
O
E
S
T FIGURA 8 - BASQUETEBOL
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
à FONTE: Disponível em: <http://s2.glbimg.com/rk-oAeOVJco-wAq0kHw02UmlSryIv51uWP
O aheI1TYY5XxJLLu7PC3ucFPd86vm44/s.glbimg.com/es/ge/f/original/2013/03/02/
gui_enterrada.jpg>. Acesso em: 15 ago. 2016.
F
Í
S
I
C
A
UNIDADE 2 TÓPICO 1 75
E
D
U
C
A
Ç
Ã
O
Assim, a média das alturas dos atletas desta escola é de 1,96 cm. Portanto, sim, o F
treinador mantém e supera a meta de ter uma média das alturas em 1,95 cm. Í
S
I
C
A
76 TÓPICO 1 UNIDADE 2
Para isso, usaremos uma tabela de exemplo, com poucas classes, uma vez que, se
aprendermos a fazer numa linha, basta repetir para todas as outras. A partir das colunas
iniciais, construídas conforme explicado na Unidade 1, temos que construir outras colunas.
Explicaremos cada coluna detalhadamente.
Ç ÃO!
ATEN
F Note que a nova coluna apresentada é constituída pela soma dos valores da frequência
Í
S absoluta até cada linha, sempre somando todos os valores anteriores. Com a inclusão desta
I nova coluna é possível responder rapidamente a perguntas do tipo: Quantas atletas medem
C
A até 1,96 m.? Observando na tabela, imediatamente verificamos que são 16 atletas.
UNIDADE 2 TÓPICO 1 77
EXEMPLO: Ainda tomando como modelo a tabela do exemplo anterior, vamos inserir
uma coluna para os valores da frequência relativa.
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
78 TÓPICO 1 UNIDADE 2
• O menor grupo de atletas desta escola são os que medem 1,96 m com 6,67% dos
atletas.
• O maior grupo de atletas desta escola são os que medem 1,98 m com 30% do total
de atletas.
• O grupo de atletas que medem 2,03 metros representa 16,67% dos atletas desta
B
I
escola.
O
E
Assim como na frequência absoluta acumulada, podemos também proceder com a
S
T frequência relativa e fazer suas acumulações de cima para baixo. Fazendo isso, neste exemplo,
A temos:
T
Í
S TABELA 12 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO
T PAULO
I
C Frequência
A Alturas Número de
Relativa Frequência Relativa Acumulada (fra)
(xi) Atletas (fi)
E (fr)
M
1,9 4 13,33% 13,33%
E 1,93 7 23,33% 13,33 + 23,33 = 36,66%
D
U 1,95 3 10,00% 13,33 + 23,33+ 10,00 = 46,66%
C 1,96 2 6,67% 13,33 + 23,33+ 10,00 + 6,67 = 53,33%
A
Ç 1,98 9 30,00% 13,33 + 23,33+ 10,00 + 6,67 + 30,00 = 83,33%
Ã
O 2,03 5 16,67% 13,33 + 23,33+ 10,00 + 6,67 + 30,00 + 16,67 = 100,00%
Total 30 100,00%
F
Í FONTE: A autora
S
I
C
A
UNIDADE 2 TÓPICO 1 79
B
I
O
Onde: E
S
T
A
T
Í
S
T
I
C
A
Vejamos os exemplos a seguir:
E
Exemplo 1: Na tabela de distribuição de frequência com intervalos de classe, a M
F
Í
S
I
C
A
80 TÓPICO 1 UNIDADE 2
F FONTE: A autora
Í
S
I
C
A
UNIDADE 2 TÓPICO 1 81
Calculados os pontos médios (xi), devemos multiplicá-los pela frequência absoluta (fi)
de cada classe, conforme apresentamos na tabela a seguir:
Com estas informações, é possível calcularmos a média das estaturas dos 100
acadêmicos do curso de Educação Física da Uniasselvi no ano de 2016.
B
I
O
Substituindo na fórmula, E
S
T
A
T
Í
S
T
I
C
Assim, a média dos acadêmicos do curso de Educação Física da UNIASSELVI no ano A
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
82 TÓPICO 1 UNIDADE 2
Ç ÃO!
ATEN
3 MODA
B
I
O É o elemento representativo da série que indica a concentração. É o valor que ocorre
E
com maior frequência, é o que mais aparece. Às vezes, num conjunto de dados podemos ou
S
T não ter moda. Não existindo moda ele será amodal; havendo mais de uma moda ele será
A
multimodal – bimodal para duas modas; trimodal para três modas.
T
Í
S Assim como no estudo da média, vamos separar o estudo do cálculo da moda nas três
T
I apresentações dos dados vistos:
C
A
E
M IMPO
RTAN
TE!
E
D A moda é representada pelo símbolo Mo.
U
C
A
Ç
Ã
O
3.1 DADOS NÃO AGRUPADOS
F
Í
S Basta colocar os valores no ROL e depois verificar qual valor que ocorreu com maior
I
frequência. Esse valor será a moda da distribuição.
C
A
UNIDADE 2 TÓPICO 1 83
Ex.: a) 2, 4, 5, 5, 6, 7. Mo = 5
b) 5, 6, 7, 8, 9. Mo = Não existente. Classe amodal.
c) 3, 4, 4, 5, 5, 6, 7, 8, 9. Mo = 4 e 5. Classe bimodal.
A moda será o valor com maior frequência, ou seja, basta olhar a linha em que o fi é
maior, veja a tabela a seguir como exemplo.
F
Í
S
I
C
A
84 TÓPICO 1 UNIDADE 2
Onde:
d1 = diferença entre a frequência da classe modal e a anterior;
d 2 = diferença entre a frequência da classe modal e a posterior.
i = limite inferior da classe modal.
hi = amplitude da classe modal. (ls – li)
Vejamos como calcular a moda para o exemplo já utilizado no cálculo da média para
esse mesmo tipo de dados.
B 170 Ⱶ 180 40
I 180 Ⱶ 190 10
O
E 190 Ⱶ 200 5
S
T Total 100
A
T FONTE: A autora
Í
S
T Para calcular a moda em um conjunto de dados agrupados em intervalos de classes,
I devemos observar os seguintes passos:
C
A
1º Passo: Identificar a classe onde a Moda se encontra (Classe Modal), ou seja, vamos
E
M destacar a linha onde temos o maior fi.
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 2 TÓPICO 1 85
FONTE: A autora
Neste exemplo, a classe modal é a quarta classe (i4) da distribuição, pois é ali que se
encontra a maior frequência, que é 40.
2º Passo: Definida a classe modal, vamos aplicar a fórmula para o cálculo da moda:
B
I
Sendo: d1 = maior fi menos fi anterior; (f4 – f3 = 40 – 30 = 10) O
E
d2 = maior fi menos fi posterior. (f4 – f5 = 40 – 10 = 30) S
T
A
T
UNI Í
S
T
Não se esqueça do que significa li (limite inferior da classe) e hi I
(amplitude da classe). Caso não lembre, retorne ao estudo nos C
tópicos anteriores. A
E
M
Neste exemplo, li = 170 e hi = ls – li = 180 – 170 = 10. Substituindo na fórmula, temos:
E
D
U
C
A
Ç
Ã
O
F
Í
Desta forma, a altura modal para este grupo de acadêmicos é de 172,5 centímetros e S
representamos por, Mo = 172,5 cm. I
C
A
86 TÓPICO 1 UNIDADE 2
IMPO
RTAN
TE!
Veja algumas observações sobre a moda:
4 MEDIANA
Novamente, iremos apresentar como determinar essa medida, para os três tipos de
B
I
apresentação de dados.
O
E
S
T
A
4.1 DADOS NÃO AGRUPADOS
T
Í
S
T Quando todas as observações estão ordenadas em rol, a mediana é o valor da
I observação central. A mediana não é calculada como a média, ao invés disso, para determinar
C
A a mediana, calculamos a sua posição, o valor que estiver naquela posição será a mediana.
E
M Em dados não agrupados, determinamos a posição da mediana, através do cálculo:
, sendo n o número de dados da distribuição.
E
D
U Vejamos alguns exemplos:
C
A
Ç Exemplo 1: Qual a mediana dos dados a seguir?
Ã
O
4 7 8
F
Í
S Acadêmico, sabemos que a mediana é o termo que se encontra no centro da distribuição
I e, nesse caso, podemos intuitivamente afirmar que a mediana é 7.
C
A
UNIDADE 2 TÓPICO 1 87
IMPO
RTAN
TE!
Quando o número de dados é par, a posição será um valor
“quebrado”; com isso, a mediana é a média dos dois dados centrais.
3 5 9 16
Como a posição 25,5 não existe, temos que pegar os valores da posição 25 e da posição
26, depois disso fazer a média entre os dois valores (sempre que o número de dados n for par
acontecerá isso).
ÇÃO!
ATEN
F
Í
S
I
C
A
UNIDADE 2 TÓPICO 1 89
FONTE: A autora
B
Logo, queremos o valor da posição 18, ou, em outras palavras, o valor x18. I
O
E
2º passo: Determinar o valor da mediana. Para isso, temos que olhar a coluna da S
frequência acumulada (Fa), e encontrar a linha do primeiro valor igual ou maior que a posição T
A
calculada, que no nosso caso é 18. T
Í
S
TABELA 20 - NOTAS DOS ACADÊMICOS DO 7O SEMESTRE DO CURSO DE EDUCAÇÃO FÍSICA
T
NA DISCIPLINA DE BIOESTATÍSTICA EM EDUCAÇÃO FÍSICA - UNIASSELVI
I
C
Notas (xi) Número de Acadêmicos (fi) Frequência Acumulada (Fa)
A
3 3 3
E
4 6 9 M
5 9 18
E
6 8 26 D
U
7 6 32 C
8 3 35 A
Ç
Total 35 Ã
O
FONTE: A autora
F
Í
S
I
C
A
90 TÓPICO 1 UNIDADE 2
Na tabela, a terceira linha nos apresenta na coluna Fa o valor da posição 18. Logo, o
valor da mediana é 5, porque é o xi da linha 3, ou seja, Md = 5.
ÇÃO!
ATEN
B
I Exemplo: Na tabela de distribuição de frequência com intervalos de classe a seguir,
O estão relacionadas as estaturas de 100 acadêmicos do curso de Educação Física da Uniasselvi
E
S no ano de 2016.
T
A
T TABELA 21 - DISTRIBUIÇÃO DAS ESTATURAS DE 100 ACADÊMICOS DO CURSO DE
Í EDUCAÇÃO FÍSICA DA UNIASSELVI - 2016
S
T Estatura (cm) Número de Acadêmicos (fi)
I 140 Ⱶ 150 5
C
A 150 Ⱶ 160 10
E 160 Ⱶ 170 30
M 170 Ⱶ 180 40
E 180 Ⱶ 190 10
D
U 190 Ⱶ 200 5
C Total 100
A
Ç FONTE: A autora
Ã
O
1º Passo: Continua sendo determinar a posição em que a mediana se encontra,
F
igual aos casos anteriores.
Í
S
I Posição:
C
A
UNIDADE 2 TÓPICO 1 91
2º Passo: Determinar a classe da mediana, que nada mais é que a linha em que
a posição calculada (no caso 50,5) se encontra. Novamente, para determinar essa linha
(classe), basta olhar a coluna da frequência acumulada (Fa). O primeiro valor dessa coluna
Fa igual ou maior que a posição calculada indicará a classe da mediana. Assim, vamos
preparar a tabela com os valores de xi e Fa.
Número de
Estatura (cm) xi Fa
Acadêmicos (fi)
140 Ⱶ 150 5 145 5
150 Ⱶ 160 10 155 15
160 Ⱶ 170 30 165 45
170 Ⱶ 180 40 175 85 Classe da
180 Ⱶ 190 10 185 95 Mediana
Total 100
FONTE: A autora
Neste exemplo, o primeiro valor igual ou maior que 50,5 é o 85, que está na 4ª classe
(linha 4), ou seja, a classe da mediana será 170 ├ 180. B
I
O
3º Passo: Calcular a mediana usando a fórmula a seguir: E
S
T
A
T
Í
S
T
I
C
Onde: A
= limite inferior da classe da mediana.
E
= frequência acumulada da classe anterior à da mediana. M
= frequência da classe mediana.
E
= amplitude da classe modal. D
U
C
Neste exemplo, temos:
A
Ç
Ã
O
F
Í
S
I
C
A
92 TÓPICO 1 UNIDADE 2
ÇÃO!
ATEN
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 2 TÓPICO 1 93
RESUMO DO TÓPICO 1
Neste tópico, você estudou as Medidas de Tendência Central, e vimos que estes números
indicam o valor médio de uma distribuição de frequência, procurando reduzir todos os valores
num só, e de preferência, tomam como mais representativo aquele que esteja no centro da
distribuição. São três as medidas de posição:
Já vimos também que os dados podem estar apresentados de três formas: dados não
agrupados, dados agrupados em distribuição de frequência sem intervalo de classes e dados
agrupados em distribuição de frequência com intervalo de classes. E, para cada maneira de
apresentar os dados de uma pesquisa, existe uma maneira para se calcular a média, moda e
mediana.
B
I
• Dados não agrupados
O
E
S
Média:
T
A
T
Í
S
Moda: basta colocar os valores no ROL e depois verificar qual valor que ocorreu com T
I
maior frequência. C
A
Mediana: em dados não agrupados, determinamos a posição da mediana, através do E
cálculo: , sendo n o número de dados da distribuição. M
E
• Dados Agrupados em Distribuição de Frequência sem Intervalo de Classe D
U
C
Média: A
Ç
Ã
O
Moda: basta olhar a linha em que o fi é maior, o xi correspondente será o valor da moda.
F
Í
Mediana: determinamos a posição da mediana através do cálculo: , buscamos o S
I
valor encontrado na coluna da frequência acumulada (Fa) e localizamos o respectivo xi, este C
será o valor da mediana. A
94 TÓPICO 1 UNIDADE 2
Média:
Moda:
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 2 TÓPICO 1 95
IDADE
ATIV
AUTO
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 2
TÓPICO 2
MEDIDAS DE DISPERSÃO
1 INTRODUÇÃO
2 AMPLITUDE TOTAL
AT = 70 - 40 = 30
E
M Desta forma, quanto menor for o desvio padrão com relação à média, maior a
homogeneidade da distribuição, ou seja, mais agrupados os dados estarão em torno da média.
E
D
Se o desvio padrão for grande, indica que os dados da distribuição estão muito dispersos, ou
U seja, estão longe da média.
C
A
Ç Existem dois tipos de desvio padrão, o amostral e o populacional, os quais trataremos
à a seguir.
O
F
Í
S
I
C
A
UNIDADE 2 TÓPICO 2 99
Assim como nos cálculos das medidas de tendência central, as quais estudamos no
tópico anterior, o desvio padrão também deve ser calculado observando-se o tipo de dados
que temos. Assim, trataremos cada um deles, iniciando pelos dados não agrupados.
B
I
O
3.2.1 Dados não agrupados E
S
T
Para calcular o desvio padrão em dados não agrupados, devemos observar os seguintes A
T
passos: Í
S
T
1º passo: Calcular a média dos elementos. I
C
A
2º passo: Calcular a diferença entre cada elemento e a média.
E
(x−x ) M
E
3º passo: Elevar essas diferenças à segunda potência. D
U
(x − x)
2 C
A
Ç
Ã
4º passo: Somar todos os resultados obtidos no passo 3. O
F
5º passo: Dividir a soma por n (se for populacional) ou dividir por n-1 (se for amostral). Í
S
I
C
A
100 TÓPICO 2 UNIDADE 2
Ç ÃO!
ATEN
Acompanhe o exemplo:
1º passo: Média
B
I
O 2º passo: Fazer cada elemento menos a média ( )
E
S Nota (x) Nota menos a média ( x − x )
T
A 8,5 8,5 – 7,0 = 1,5
T
Í 5,0 5,0 – 7,0 = - 2,0
S 9,0 9,0 – 7,0 = 2,0
T
I 3,5 3,5 – 7,0 = - 3,5
C
A 7,5 7,5 – 7,0 = 0,5
8,5 8,5 – 7,0 = 1,5
E
M
(x − x)
2
Nota (x) (x−x )
8,5 8,5 – 7,0 = 1,5 (1,5)2 = 2,25
5,0 5,0 – 7,0 = - 2,0 (- 2,0)2 = 4,00
9,0 9,0 – 7,0 = 2,0 (2,0)2 = 4,00
3,5 3,5 – 7,0 = - 3,5 (- 3,5)2 = 12,25
7,5 7,5 – 7,0 = 0,5 (0,5)2 = 0,25
8,5 8,5 – 7,0 = 1,5 (1,5)2 = 2,25
Total - 25
IMPO
RTAN
TE!
B
I
O
Acadêmico! Nesse passo acabamos de calcular a variância amostral E
S² e a populacional σ². Sobre a variância, é válido saber: S
T
• num conjunto de dados, a variância é uma medida de dispersão A
que mostra o quão distante cada valor desse conjunto está do T
valor central (médio); Í
• quanto menor é a variância, mais próximos os valores estão da S
média, No entanto, quanto maior ela é, mais os valores estão T
distantes da média. I
C
A
E
D
U
C
A
Para este caso, o desvio padrão é o populacional, pois analisamos os dados de todo
Ç
o grupo selecionado (meninos da turma X). Note que a média foi 7,0 e o desvio padrão ficou Ã
em 2,04, o que indica que há dados distantes desta média, e voltando para os dados brutos, O
realmente confirmamos isso, visto que há menino com nota 9,0 e menino com nota 3,5. F
Í
S
I
C
A
102 TÓPICO 2 UNIDADE 2
Para este agrupamento de dados, iremos repetir os mesmos passos para determinar o
desvio padrão com frequência simples. Vamos retomar a tabela já utilizada para outros cálculos.
B
I Vamos calcular o desvio padrão amostral e populacional.
O
E
S 1º passo: Calcular a média.
T
A
T TABELA 24 - ALTURA, EM METROS, DOS ATLETAS DA ESCOLA DE BASQUETEBOL – SÃO
Í PAULO - 2016
S
T Alturas (xi) Número de Atletas (fi) xi ∙ fi
I 1,90 4 1,90 · 4 = 7,6
C
A 1,93 7 1,93 · 7 = 13,51
F
Í
S
I
C
A
UNIDADE 2 TÓPICO 2 103
Assim, a média das alturas dos atletas desta escola é de 1,96 cm.
FONTE: A autora
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
104 TÓPICO 2 UNIDADE 2
FONTE: A autora
E
M
E
D 3.2.3 Frequência de classes
U
C
A Quando os dados estão agrupados em uma distribuição de frequência com intervalo
Ç
de classe, usaremos a seguinte fórmula para calcular o desvio padrão:
Ã
O
F
Í
S
I
C
A
UNIDADE 2 TÓPICO 2 105
Substituindo na fórmula,
E
Acadêmicos (fi)
M 140 Ⱶ 150 5 145 725 145 - 170,5 = - 25,5 (- 25,5)2 = 650,25
Número de
Estatura
Acadêmicos Xi xi ∙ fi ( xi − x ) ( xi − x )
2
( xi − x )
2
. fi
(cm)
(fi)
145 - 170,5 = (- 25,5)2 = 650,25 · 5 =
140 Ⱶ 150 5 145 725
- 25,5 650,25 3251,25
155 - 170,5 = (- 15,5)2 = 240,25 · 10 =
150 Ⱶ 160 10 155 1550
- 15,5 240,25 2402,5
165 - 170,5 = (- 5,5)2 = 30,25 · 30 =
160 Ⱶ 170 30 165 4950
- 5,5 30,25 907,5
175 - 170,5 = (4,5)2 =
170 Ⱶ 180 40 175 7000 20,25 · 40 = 810
4,5 20,25
185 - 170,5 = (14,5)2 = 210,25 · 10 =
180 Ⱶ 190 10 185 1850
14,5 210,25 2102,5
195 - 170,5 = (24,5)2 = 600,25 · 5 =
190 Ⱶ 200 5 195 975
24,5 600,25 3001,25 B
I
Total 100 17 050 12 475 O
E
FONTE: A autora
S
T
5º passo: Dividir a soma 12 475 obtida no passo 4 por ∑ fi = 100 se for populacional A
T
ou por ∑ fi − 1 = 99 se for amostral. Í
S
T
I
C
A
6º passo: Extrair a raiz quadrada dos resultados do passo 5.
E
M
Acadêmico, perceba que quanto maior é o desvio padrão, mais os dados estão dispersos E
D
com relação à média. U
C
A
Ç
Ã
4 COEFICIENTE DE VARIAÇÃO O
F
Í
Na Estatística utilizamos diversas medidas para descrever fenômenos. Algumas são as
S
de tendência central e outras as de dispersão. Dentre as medidas de dispersão, já estudamos I
C
o desvio padrão. Porém, o desvio padrão por si só tem algumas limitações, por exemplo, um
A
108 TÓPICO 2 UNIDADE 2
desvio padrão de duas unidades pode ser considerado pequeno para uma série de valores
cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito.
Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita
o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente a
sua dispersão ou variabilidade, quando expressas em unidades diferentes. Entretanto, uma
medida muito utilizada, principalmente para se comparar medidas distintas, é o coeficiente de
variabilidade ou apenas coeficiente de variação (CV).
Ç ÃO!
ATEN
B
I
O
E Interpretação do CV:
S Até 15% variação pequena;
T De 15% a 30% variação média;
A 30% ou mais variação grande.
T
Í
S
T Exemplo: Observe a tabela a seguir, com os resultados das estaturas e dos pesos de
I
C
um mesmo grupo de indivíduos.
A
TABELA 33 - COMPARAÇÃO ENTRE A MÉDIA E O DESVIO PADRÃO
E
M Discriminação Média Desvio Padrão
E Estaturas 170 cm 10 cm
D
U Pesos 68 kg 7 kg
C
A FONTE: A autora
Ç
Ã
O Agora responda, qual das medidas (estatura ou peso) possui maior homogeneidade?
F
Í Resposta: Teremos que calcular o coeficiente de variação da estatura e o coeficiente de
S variação do peso, porque só o desvio padrão não informará qual a distribuição é mais dispersa
I
C (como discutido acima), uma vez que os valores são numericamente diferentes (enquanto a
A
UNIDADE 2 TÓPICO 2 109
altura varia na casa das centenas, o peso está na casa das dezenas). O resultado menor será
o de maior homogeneidade (menor dispersão ou variabilidade).
CV estatura = = 5,88%
CV peso = = 10,29%.
Assim, apesar de nesse grupo de indivíduos o desvio padrão ser menor nos dados
relativos aos pesos, as estaturas apresentam menor grau de dispersão que os pesos, visto
apresentarem um coeficiente de variação menor.
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
110 TÓPICO 2 UNIDADE 2
RESUMO DO TÓPICO 2
• Para o cálculo do desvio padrão para dados amostrais é feito usando-se a fórmula:
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 2 TÓPICO 2 111
IDADE
ATIV
AUTO
1 (ENADE 2012). As ações das companhias AAA e ZZZ apresentaram a seguinte série
histórica de cotações em determinado mês, em reais.
II. A média da soma dos quadrados dos erros (variância) da cotação das ações da
empresa AAA é 4,6667.
III. A média das cotações das ações da empresa ZZZ mostra que R$ 25,00 é o valor
mais frequente na sua série histórica.
IV. A mediana da cotação das ações da empresa AAA corresponde à média dos extremos
de sua série histórica.
V. O valor mais frequente da cotação das ações da empresa ZZZ foi 28,00.
2 Uma pesquisa estatística que buscou verificar o perfil do estilo de vida considerando
cinco fatores (nutrição, atividade física, comportamento preventivo, relacionamento
social e controle do estresse) foi observada em dois grupos (A e B) de empresas,
apresentando os resultados seguintes:
B
I
O A: Média 20 - Desvio padrão 4
E
S B: Média 10 - Desvio padrão 3
T
A
T
Assinale a alternativa CORRETA:
Í
S
a) No grupo B, os dados apresentam maior dispersão absoluta.
T
I b) A dispersão absoluta de cada grupo é igual à dispersão relativa.
C c) A dispersão relativa do grupo B é maior do que a dispersão relativa do grupo A.
A
d) A dispersão relativa dos dados entre os grupos A e B é medida pelo quociente da
E diferença de desvios padrão pela diferença de médias.
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 2
TÓPICO 3
1 INTRODUÇÃO
Caro acadêmico, tanto na Unidade 1 como nos tópicos anteriores, trabalhamos com
diversas tabelas, que têm por objetivo fornecer informações rápidas e seguras a respeito das
variáveis em estudo, para que assim se cumpra com a função da estatística, que é analisar
dados, compreendendo o comportamento deles.
B
Em uma pesquisa estatística, além do tamanho da amostra e da preocupação com os I
O
valores apresentados, visto que são provenientes de diversas fontes e, por isso, suscetíveis
E
a diferentes interpretações mediante a forma como são apresentados, também é preciso ter S
T
atenção em como apresentamos esses dados.
A
T
Por este motivo, existem critérios científicos, que vão além de calcular o número de Í
S
classes e a amplitude do intervalo, que são utilizados para melhor organizar os dados coletados T
através da pesquisa estatística e reproduzir este conjunto de informações de uma forma que I
C
apresentem significado claro e de fácil compreensão. A
E
Como você já observou, existem diversos tipos de tabelas e gráficos e cada um deles M
deve ser utilizado para um fim específico. Desta forma, neste tópico iremos estudar quais os
E
elementos necessários para construir uma tabela e um gráfico que representem os dados de D
forma fidedigna. U
C
A
Ç
Ã
O
2 SÉRIE ESTATÍSTICA
F
Í
Séries estatísticas são tabelas que apresentam o agrupamento de um conjunto de S
I
dados estatísticos em função de uma época, local ou espécie. Assim, podemos dizer que uma C
A
114 TÓPICO 3 UNIDADE 2
série estatística é um quadro que resume um conjunto de dados dispostos segundo linhas
e colunas de maneira sistemática. É também um meio eficiente de apresentar os resultados
estatísticos obtidos, por proporcionar uma maior clareza, objetividade e compreensão do
conjunto, oferecendo vantagens para a análise matemática das variáveis relacionadas.
Porém, essa representação não deve ser realizada conforme o entendimento de cada
um. Você já se perguntou por que uma tabela tem título, ou já observou que ela não é fechada
nas laterais?
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 2 TÓPICO 3 115
Corpo da tabela/série
Estados Unidos 2296
União Soviética 1010
Alemanha 851
Grã-Bretanha 715
França 632
complementares
e-37o-do-quadro-de-medalhas-geral-das-olimpiadas-
eua-lideram/>. Acesso em: 16 jul. 2016.
1. (chamada)
I. (nota)
É importante, acadêmico, que você perceba que nesta tabela podemos observar todos
os elementos essenciais e complementares apresentados até o momento. B
I
O
O título da Tabela é “Países recordistas de medalhas dos Jogos Olímpicos de Verão E
(de 1896 a 2008)”. Pelo título é possível sabermos que as informações contidas na série se S
T
referem aos países com o maior número de medalhas nos Jogos Olímpicos de Verão no
A
período de 1896 a 2008. No cabeçalho, observamos que a tabela está dividida em País e T
Í
Número Total de Medalhas. Na coluna indicadora, temos os países recordistas de medalhas
S
nos Jogos Olímpicos de Verão. Na coluna numérica, a quantidade de medalhas conquistadas T
por cada país. Abaixo da Tabela, temos o elemento complementar (fonte) indicando a entidade I
C
responsável pelo fornecimento dos dados. A
E
Além destes elementos essenciais, devemos seguir algumas regras para apresentação M
da tabela/série:
E
D
• toda tabela/série deve ser clara, simples e completa, dispensando a consulta ao U
C
texto;
A
• as tabelas/série não são fechadas nas laterais; Ç
• as tabela/série são fechadas em cima e embaixo com traços horizontais mais grossos; Ã
O
• uma casa nunca deve ficar em branco;
• para englobar várias especificações usamos “outros”. F
Í
S
I
C
A
116 TÓPICO 3 UNIDADE 2
• usar um traço horizontal (—) quando o valor é nulo quanto à natureza das coisas ou
resultado do inquérito.
• três pontos (...) quando não temos dados.
• um ponto de interrogação (?) quando temos dúvida quanto à exatidão do valor.
• zero (0; 0,0; 0,00) quando o valor é muito pequeno para ser expresso pela grandeza
utilizada.
E
S TE!
RTAN
T IMPO
A
T
Í Todas estas normas têm por objetivo padronizar o tratamento dos
S dados estatísticos, permitindo uma maior clareza, objetividade e
T melhor visão do conjunto.
I
C
A
Toda série é uma tabela, mas nem toda tabela é uma série, pois exige homogeneidade,
E
M classificação, critério de modalidade: espécie, local ou época. As séries estatísticas representam
um conjunto de informações ou observações através do tempo ou dentro de um determinado
E
D espaço ou, ainda, com relação a um fenômeno.
U
C
A Série é um conjunto de números associados a fenômenos dispostos em correspondência
Ç com critério de modalidade, ou seja, apresenta a distribuição de um conjunto de dados
Ã
estatísticos em função da época, local ou espécie. Até o momento estudamos os elementos
O
que constituem uma série estatística. A partir de agora, veremos que uma série estatística pode
F
ser classificada segundo o tipo de informação que representa.
Í
S
I
C
A
UNIDADE 2 TÓPICO 3 117
E
Note, acadêmico, que o fenômeno (sedentarismo por gênero no Brasil a cada 100 D
habitantes) e o local (Brasil) são elementos fixos. Enquanto que a época (tempo de 1991 a U
C
2000) é um elemento variável, ou seja, a cada ano observa-se dados diferentes para o fato A
analisado. Ç
Ã
O
F
Í
S
I
C
A
118 TÓPICO 3 UNIDADE 2
Exemplo:
UNI
E
M
F
Í
S
I
C
A
120 TÓPICO 3 UNIDADE 2
B
I Exemplo: Podemos ter a conjugação de uma série geográfica com uma série histórica.
O
E
S TABELA 39 - TERMINAIS TELEFÔNICOS EM SERVIÇO NO BRASIL
T
Regiões 1991 1992
A
T Norte 342.938 375.658
Í
S Sudeste 6.234.501 6.729.467
T Sul 1.497.315 1.608.989
I
C FONTE: Ministério das Comunicações
A
E Exemplo: Podemos ter a conjugação de uma série geográfica com uma série específica.
M
F
Engenharia Civil 23 35
Í
FONTE: A autora
S
I
C
Acadêmico, vistos os tipos de séries estatísticas, estudaremos agora sobre a
A
representação gráfica destas séries.
UNIDADE 2 TÓPICO 3 121
3 GRÁFICO ESTATÍSTICO
O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o
de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do
fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries.
A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais:
a) simplicidade: o gráfico deve ser destituído de detalhes com importância secundária, assim
como de traços desnecessários que possam levar o observador a uma análise morosa ou
com erros;
b) clareza: o gráfico deve possibilitar uma correta interpretação dos valores representativos
do fenômeno em estudo;
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
122 TÓPICO 3 UNIDADE 2
UNI
Acadêmico, note estes elementos nos gráficos que
apresentaremos a seguir, pois agora que aprendemos as
normas de construção dos gráficos estatísticos, dedicaremos
nossos estudos aos tipos de gráficos mais utilizados para
representar dados.
Este tipo de gráfico é composto por dois eixos, um vertical e outro horizontal, e por uma
linha poligonal para representar a série estatística.
Exemplo:
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 2 TÓPICO 3 123
FONTE: A autora
O gráfico de linha é mais utilizado nas séries cronológicas, em que a variável tempo é
representada no eixo horizontal e as quantidades respectivas, no eixo vertical.
Acadêmico, note que os gráficos são representações visuais dos dados estatísticos
que correspondem às tabelas estatísticas, que devem trazer simplicidade e veracidade para B
I
as informações apresentadas. O
E
S
T
A
T
3.2 GRÁFICOS EM COLUNAS OU EM BARRAS
Í
S
T
Este tipo de gráfico é composto por dois eixos, um vertical e outro horizontal, em que os I
dados estatísticos são representados através de retângulos dispostos verticalmente (colunas) C
A
ou horizontalmente (barras) de acordo com sua intensidade.
E
M
Exemplo: Observe a seguinte situação:
E
D
A Copa do Mundo FIFA, mais conhecida tradicionalmente no Brasil pelo antigo nome U
"Copa do Mundo", é uma competição internacional de futebol que ocorre a cada quatro anos. C
A
O formato atual do Mundial é com 32 equipes nacionais disputando por um período de cerca
Ç
de um mês. Ã
O
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
à FONTE: A autora
O
F
Í
S
I
C
A
UNIDADE 2 TÓPICO 3 125
FONTE: A autora
F
Í
S
I
C
A
126 TÓPICO 3 UNIDADE 2
FONTE: A autora.
B
IMPO
RTAN
TE!
I
O Acadêmico, observe que neste gráfico os setores circulares devem
E ter cores diferentes e devem ser colocadas legendas relativas aos
S setores, de modo a ser possível interpretar o gráfico.
T
A
T
Í
S
T
I
3.4 PICTOGRAMAS
C
A
E A representação gráfica por pictogramas, como o próprio nome sugere, utiliza figuras
M que remetem à ideia dos dados em questão. Este tipo de representação tem como objetivo
E atrair a atenção do leitor.
D
U
C Exemplo:
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 2 TÓPICO 3 127
Estes gráficos são uma ilustração relacionada com o fenômeno em estudo sem a
preocupação de mostrar dados precisos. São muito utilizados em propagandas (de jornais,
revistas e televisão, entre outras formas).
Acadêmico, vimos nesta unidade que gráficos são instrumentos que possibilitam
transmitir o significado das séries estatísticas de uma forma mais eficiente e clara. Lembre-se
de que para criar um gráfico é preciso conhecer o tipo de informação que se deseja transmitir, B
I
pois cada tipo de gráfico é adequado para representar um determinado fenômeno.
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
128 TÓPICO 3 UNIDADE 2
RESUMO DO TÓPICO 3
Neste tópico, estudamos sobre os critérios que devem ser utilizados para construir séries
e gráficos estatísticos, bem como suas classificações. Sobre este assunto, destacamos que:
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 2 TÓPICO 3 129
IDADE
ATIV
AUTO
1 Os gráficos são uma forma de representação dos dados estatísticos, que têm o
objetivo de produzir uma impressão rápida e viva de um determinado fenômeno em
estudo. Diante dos conceitos estudados neste tópico, assinale a alternativa CORRETA:
F
Í
S
I
C
A
130 TÓPICO 3 UNIDADE 2
IAÇÃO
AVAL
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 3
OBJETIVOS DE APRENDIZAGEM
F
Í
S
I
C
A
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 3
TÓPICO 1
INTRODUÇÃO À PROBABILIDADE
1 INTRODUÇÃO
F
Í
S
I
C
A
134 TÓPICO 1 UNIDADE 3
FONTE: A autora
F
Í
S
I
C
A
UNIDADE 3 TÓPICO 1 135
B
I
O
E
S
T
A
T
Í
Ainda podemos ter a probabilidade de a variável aleatória Z estar entre 0 e z. S
T
I
• P (Z < z) – 0,5, se z > 0 C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
136 TÓPICO 1 UNIDADE 3
Para saber a probabilidade de Z estar entre z1 e z2, com z2 < z1, precisamos fazer:
B
I
O
E
S
T
A
T
Í
S
T
IMPO
RTAN
TE!
I
C Na tabela Z, o número padronizado z é formado por três dígitos: a
A (parte inteira), b (parte decimal) e c (parte centesimal), z = a,bc.
A parte inteira e a decimal (a,b) aparecem na primeira coluna da
E tabela z, e a parte centesimal você procura na primeira linha da
M tabela Z.
E
D
U Vejamos, agora, alguns exemplos:
C
A
Ç Exemplo 1: Utilize a tabela Z (Apêndice A) para calcular a probabilidade de Z ser maior
à que 1,75. Em símbolos: P(Z > 1,75).
O
Solução: Como a curva é simétrica em relação à média 0, a P(Z < -1,6) é igual a P(Z >
1,6). Assim, P(Z < -1,6) = P(Z > 1,6) = 1 – P(Z > 1,6). Procurando z = 1,6 na tabela Z (1,6 parte
inteira e a decimal, e 0,00 parte centesimal), temos que P(Z > 1,6) = 0,9452, então:
P(Z < -1,6) = P(Z > 1,6) = 1 – P(Z > 1,6) = 1 – 0,9452 = 0,0548.
Solução: Acadêmico, note que P(0 < Z < 2,65) = P(Z < 2,65) – 0,5. Procurando z =
2,65 na tabela Z (2,6 parte inteira e a decimal, e 0,05 parte centesimal), temos que P(Z < 2,65)
= 0,9960, então:
Além desses tipos de exemplos, nos testes de hipóteses é comum querer saber que B
I
valor de z produz uma determinada área sob a curva Normal Padrão, de –z até z; ou seja, O
realizar o processo inverso que fizemos. E
S
T
Vejamos um exemplo disso. Responda: para que valor de z temos uma área sob a curva A
T
normal padrão de 0,90, de –z até z? Í
S
T
A figura a seguir ilustra essa pergunta: I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
Acadêmico, lembre-se de que a curva normal padrão é simétrica e sua área total sob
a curva é 1, logo, se a parte pintada tem área 0,90, falta 0,10 para fechar a área 1. Observe F
Í
que a área branca sob a curva vale 0,05 (0,10/2). Assim, podemos substituir a pergunta para: S
qual valor de z deixa uma área menor que 0,95? I
C
A
138 TÓPICO 1 UNIDADE 3
B
I
O
E Verifica-se que na tabela o valor 0,95 está entre 0,9495 e 0,9505, então podemos dizer
S
que z está entre 1,64 e 1,65. Calculando a média [(1,64 + 1,65)/2] entre esses dois valores,
T
A z = 1,645.
T
Í
S Agora que você já sabe como usar a tabela Z, acompanhe a resolução do exemplo a
T seguir, que pode ser resolvido através de uma distribuição normal.
I
C
A Exemplo 4: As alturas de uma população têm média 1,70 m e desvio padrão de 0,2 m. Um
E pesquisador, ao tomar uma pessoa desta população, pretende determinar qual é a probabilidade
M de:
E
D i) encontrar alguém com altura superior a 1,80 m;
U
ii) encontrar alguém com altura entre 1,40 m e 1,65 m;
C
A iii) encontrar alguém com altura inferior a 1,60 m.
Ç
Ã
O Solução:
F
Í Note que = 1,70 e σ = 0,2, ou seja, tem-se um caso de distribuição normal, mas ainda
S não se tem uma distribuição normal padrão, ou seja, não se pode usar a tabela Z. É preciso
I
C transformar essa distribuição normal em distribuição normal padrão usando:
A
UNIDADE 3 TÓPICO 1 139
O problema agora consiste em encontrar P(Z > 0,5). Como P(Z > 0,5) = 1 – P(Z < 0,5),
temos que P(Z > 0,5) = 1 – 0,6915 = 0,3085. Portanto, a P(X > 1,80) = P(Z > 0,5) = 0,3085.
Assim, o valor 0,3085 representa a probabilidade de encontrar alguém com mais de 1,80 m
de altura.
ii) Devemos encontrar P(1,40 < X < 1,65), para isso precisamos transformar os valores
x1 = 1,40 m e x2 = 1,65 m em z1 e z2 respectivamente.
Agora, o problema consiste em encontrar P(-1,5 < Z < -0,25) usando a tabela Z.
B
I
Como P(-1,5 < Z < -0,25) = P(Z < -0,25) – P(Z < -1,5) e P(Z < -1,5) = P (Z > 1,5) = 1 – O
E
P(Z < 1,5) = 1 – 0,9332 = 0,0668
S
T
A
P(Z < -0,25) = P (Z > 0,25) = 1 – P(Z < 0,25) = 1 – 0,5987 = 0,4013, temos:
T
P(-1,5 < Z < -0,25) = 0,4013 – 0,0668 = 0,3345. Í
S
T
Portanto, a P(1,40 < X < 1,65) = P(-1,5 < Z < -0,25) = 0,3345. I
C
A
iii) Queremos determinar a P(X < 1,60). Transformando o valor x = 1,60 em z padrão,
obtemos: E
M
E
D
U
Note que agora o problema consiste em encontrar a P(Z < -0,5) na tabela Z. Como a C
A
P(Z < -0,5) = P(Z > 0,5) e P(Z > 0,5) = 1 – P(Z < 0,5), temos que:
Ç
Ã
P(Z < -0,5) = 1 – 0,6915 = 0,3085. Portanto, a P(X < 1,60) = P(Z < -0,5) = 0,3085. O
F
Í
S
I
C
A
140 TÓPICO 1 UNIDADE 3
RESUMO DO TÓPICO 1
• A curva Normal Padrão é simétrica em relação à média 0 e a área sob essa curva é 1.
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 3 TÓPICO 1 141
IDADE
ATIV
AUTO
Acadêmico, agora é a sua vez de exercitar o que aprendeu até aqui! Lembre-se de
que você tem à disposição materiais complementares em seu Ambiente Virtual de
Aprendizagem. Consulte-os sempre que necessário. Conte também com a tutoria interna,
que está disponível por meio do 0800, contato e atendimento on-line. Bons estudos!
a) ( ) P = 0,0001.
b) ( ) P = 0,5000.
c) ( ) P = 0,1000.
d) ( ) P = 0,9999. B
I
O
E
2 Em estatística, um intervalo de confiança é o intervalo estimado em que a média de S
T
um parâmetro de uma amostra tem uma dada probabilidade de ocorrer. Quando, num
A
teste, é dito que o nível de significância é de 3%, então o nível de confiança será: T
Í
S
a) ( ) de 97%. T
b) ( ) de 0,03%. I
C
c) ( ) de 0,97%. A
d) ( ) de 3%.
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
142 TÓPICO 1 UNIDADE 3
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 3
TÓPICO 2
TESTES DE HIPÓTESES
1 INTRODUÇÃO
“Pesquisadores médicos afirmam que a temperatura média do corpo humano não é igual a
37 °C”.
Para realizar um teste de hipóteses você deve formular duas hipóteses a respeito da
afirmação, denominadas de H0 e H1.
IMPO
RTAN
TE!
B Saiba que a hipótese H0 é chamada de hipótese nula, ou seja, é a
I hipótese que “anula” o teste. Enquanto a hipótese H1 ou hipótese
O alternativa é a que o teste quer provar.
E
S
T
A Acompanhe os exemplos a seguir para compreender estes conceitos.
T
Í
S Exemplo 1: Numa pesquisa para comparar a eficácia de emagrecimento em pessoas
T adultas entre duas enzimas, tem-se as seguintes hipóteses:
I
C
A Considerando que podemos comparar a eficácia de emagrecimento por meio das
F
Í
S
I
C FONTE: Disponível em: <http://www.gifs-animados.net/profissao/
A profissao132.gif>. Acesso em: 20 jul. 2016.
UNIDADE 3 TÓPICO 2 145
Assim:
H 0: 1
= 2
(média de emagrecimento da enzima 1 é igual à média de emagrecimento
da enzima 2).
H1: 1
≠ 2
(média de emagrecimento da enzima 1 é diferente da média de emagrecimento
da enzima 2).
Ç ÃO!
ATEN
B
I
O
E
S
T
A
T
Í
S
T
I
FONTE: < http://cdn1.mundodastribos.com/wp-admin/ C
uploads/2010/12/cama-elastica-para-ginastica- A
pre%C3%A7os-onde-comprar.jpg> Acesso em: 20 jul.
2016. E
M
Nesse caso: E
D
U
H0: = K (média de resistência da cama elástica para Jump é igual ao valor anunciado K). C
H 1: < K (média de resistência da cama elástica para Jump é menor que o valor A
Ç
anunciado X). Ã
O
Acadêmico, é válido destacar que quando você efetua um teste de hipótese sempre
obterá a resposta tendo como referência H0, ou seja, se após o teste você verificar que a
hipótese certa é a hipótese nula pode aceitar H0, mas se verificar que a hipótese certa é a
hipótese alternativa deve rejeitar H0, ao invés de citar H1.
UNI
B
I
3 ERROS DO TIPO I E II
O
E
S
T Por mais cuidado que se tenha ao coletar os dados de uma pesquisa, a estimação dos
A dados jamais estará livre de erros. E, ao realizar um teste de hipóteses, existem dois tipos de
T
Í erros que podem ser cometidos:
S
T
I Erro do tipo I (a)
C Erro do tipo II (β)
A
E
D
U UNI
C
A
Ç
à Você já deve ter percebido, em sua trajetória escolar, que a utilização
O das letras gregas é bem comum na matemática. Aqui iremos utilizar
as letras gregas Alfa (a) e Beta (β).
F
Í
S
I
C
A
UNIDADE 3 TÓPICO 2 147
O erro do tipo I (Α) significa rejeitar a hipótese nula (H0), sendo que na verdade deveria
ter aceitado. É importante que essa probabilidade de cometer o erro do tipo I seja pequena,
pois assim a chance de rejeitar uma hipótese verdadeira também será pequena.
Cometer um erro do tipo I, no exemplo 1 visto anteriormente, seria ter dito que as médias
são diferentes quando na verdade elas são iguais.
IMPO
RTAN
TE!
O nível de significância do teste a é definido no início do teste.
B
I
O
E
S
T
A
3.2 ERRO DO TIPO II (β) T
Í
S
O erro do tipo II (Β) significa aceitar a hipótese nula (H0) sendo que na verdade você T
deveria ter rejeitado. Para este tipo de erro também se deseja que a probabilidade de cometê- I
C
lo seja pequena, para que a chance de aceitar uma hipótese falsa seja, igualmente, pequena. A
E
Essa probabilidade é representada pela letra β e a diferença 1 – β representa a M
probabilidade de rejeitar uma hipótese falsa quando ela é falsa, e este valor (1 – β) é chamado
E
de poder do teste. D
U
C
Cometer um erro do tipo II, no exemplo 1 visto anteriormente, seria ter dito que as A
médias são iguais quando na verdade elas são diferentes. Ç
Ã
O
O quadro a seguir resume esses dois erros, veja:
F
Í
S
I
C
A
148 TÓPICO 2 UNIDADE 3
REALIDADE
DECISÃO
H0 verdadeira H0 falsa
Rejeitar H0 Erro do tipo I (α) Sem erro
Aceitar H0 Sem erro Erro do tipo II (β)
Ç ÃO!
ATEN
B
I
O
E 4 EXEMPLOS DE TESTES DE HIPÓTESES
S
T
A
T Este item é destinado às resoluções de alguns casos de testes de hipóteses, os conceitos
Í que serão utilizados serão explicados passo a passo e os exemplos trabalhados em ordem
S
T crescente de dificuldade.
I
C
A Acadêmico, os testes de hipóteses podem ser de três tipos diferentes, onde o que muda
é a hipótese alternativa (H1). Vejamos cada um deles a seguir:
E
M
a) teste bicaudal ou bilateral
E
H 0: = 150
D
U H 1: ≠ 150
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 3 TÓPICO 2 149
UNI
sob a curva normal em duas regiões: Região de aceitação de H0 e Região de rejeição de H0. E
M
Acadêmico, não se preocupe com como e quando usar cada um dos tipos anteriores, E
bem como a compreensão do que significa e como definir a(s) área(s) de rejeição de H0 e D
U
a área de aceitação de H0 nos testes de hipóteses. Isso será explicado nas resoluções dos C
próximos exemplos para desvio padrão conhecido e desvio padrão desconhecido, acompanhe! A
Ç
Ã
O
F
Í
S
I
C
A
150 TÓPICO 2 UNIDADE 3
O INMETRO fará uma inspeção numa fábrica de aparelhos para ginástica que afirma
que o diâmetro das suas camas elásticas de Jump segue uma distribuição normal com a média
= 94 cm e desvio padrão populacional σ = 2 cm. Para a verificação, o inspetor recolheu uma
amostra com 10 unidades em que obteve as seguintes medidas (em cm): 92, 97, 94, 95, 96,
97, 96, 95, 95, 94. O INMETRO admite um erro estatístico de 5% (nível de significância 5%),
ou seja, nível de confiança 95%, em outras palavras α = 0,05.
Solução: Fazendo a estimativa da média dos diâmetros das camas elásticas de Jump
, temos:
Um pesquisador que não entende de estatística falaria que a média dos diâmetros das
camas elásticas de Jump é maior que o informado pela fábrica, contudo nós sabemos que
estamos lidando com uma amostra e por isso temos que tomar cuidado nas conclusões, por
B isso que o teste de hipóteses é essencial.
I
O
E É esse teste que indicará se a diferença entre a média populacional ( = 94 cm) informada
S pela empresa e a estimativa θ = 95,1 cm obtida através da amostra recolhida pelo pesquisador
T
é significante ou apenas casual devido à aleatoriedade da amostra.
A
T
Í
Como o objetivo do INMETRO é inspecionar se a média dos diâmetros das camas
S
T elásticas de Jump é diferente de 94 cm, devemos confrontar as seguintes hipóteses:
I
C
A H0: = 94 cm
H 1: ≠ 94 cm
E
M
A distribuição da média amostral θ , convenientemente padronizada, se comporta
E
D segundo um modelo Normal com = 0 e σ2 = 1. Essa padronização é feita por meio da fórmula:
U
C
A
Ç
Ã
O
Agora, para resolver o teste, calcule o valor z padronizado e o compare com os valores
F críticos tabelados ztab. O valor ztab é obtido entrando na tabela Z (Apêndice A) com o valor 1 –
Í α/2 = 1 – 0,05/2 = 1 – 0,025 = 0,975. Localizando este valor na tabela Z:
S
I
C
A
UNIDADE 3 TÓPICO 2 151
Para obter ztab devemos somar o valor inicial da linha com o valor inicial da coluna.
Assim ztab = 1,9 + 0,06 = 1,96.
Calculando z:
B
I
O
E
S
O valor 95,1 cm na curva normal é equivalente a 1,74 na curva normal padrão, veja o
T
esquema: A
T
Í
IMPO
RTAN
TE!
S
T
I
C
A
O Teorema Central do Limite garante que essa padronização,
para n grande, segue um modelo normal, com média 0 e E
desvio padrão 1. M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
152 TÓPICO 2 UNIDADE 3
F
Í Solução:
S
H0: = 94 cm
I
C H 1: > 94 cm
A
UNIDADE 3 TÓPICO 2 153
O que muda é o valor crítico (ztab), pois o nível de significância corresponde somente à
área sob a cauda direita. O valor ztab é obtido entrando na tabela Z (Apêndice A) com o valor
1 – = 1 – 0,05 = 0,950.
B
I
O
Observe que o valor 0,950 não aparece na tabela, mas está entre os valores 0,9495
E
e 0,9505. Assim, fazemos a média aritmética dos valores encontrados na coluna e somamos S
com o valor da linha. Logo, ztab = (0,04 + 0,05)/2 + 1,6 = 1,645. Veja o esquema a seguir: T
A
T
Í
S
T
I
C
A
E
M
E
Observe que o fato de o teste ser unilateral aumenta a área sob a cauda direita da D
curva, diminuindo o valor crítico (ztab). Nesse caso, rejeita-se H0 a um nível de significância de U
C
5% porque o valor z padronizado (1,74) está na região de rejeição de H0 (1,645 < 1,74). Assim,
A
a média populacional é maior que 94 cm a um nível de confiança de 95%. Ç
Ã
O
F
Í
S
I
C
A
154 TÓPICO 2 UNIDADE 3
Suponha que você precisa testar a hipótese de que a média da estatura dos jogadores
brasileiros de basquetebol adultos de sexo masculino seja 1,95 m contra a hipótese de que é
diferente, a um nível de significância de 5%.
linha 29 (“n – 1”) com a coluna 2,5% ( a 2 ) = 2,5/100 = 0,025. Com isso, temos ttab = 2,0452.
5,9 6,5 8,0 9,6 4,0 3,4 8,0 6,0 6,5 8,4
4,0 8,5 9,3 8,5 8,2 6,0 5,1 3,5 6,0 5,2
6,2 7,0 5,5 7,0 7,9 6,4 4,6 4,0 7,0 7,0
H0: 2 = 5,3
H1: σ2 ≠ 5,3
E
M
E
D
U
C
A
Ç
Ã
O
Conclusão: Rejeitamos H0.
F
Í
A variância populacional é diferente a 5,3 a um nível de significância de 10%. Você pode
S
I afirmar isso, pois o valor 16,25 é menor que o valor crítico 17,7084, ou seja, está na região de
C rejeição de H0.
A
UNIDADE 3 TÓPICO 2 157
Segundo o treinador de futebol do Time XX, existe uma taxa de 15% de reprovação
entre seus candidatos já na primeira etapa. Para verificar se a taxa de reprovação é diferente,
com α = 2%, selecionou-se aleatoriamente uma amostra de 300 candidatos e verificou-se que
36 reprovaram.
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
158 TÓPICO 2 UNIDADE 3
ÇÃO!
ATEN
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 3 TÓPICO 2 159
RESUMO DO TÓPICO 2
• Nos testes de hipótese para a média, quando o desvio padrão populacional é conhecido,
a estimativa amostral da média é padronizada pela fórmula: .
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
160 TÓPICO 2 UNIDADE 3
IDADE
ATIV
AUTO
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
162 TÓPICO 2 UNIDADE 3
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 3
TÓPICO 3
REGRESSÕES E CORRELAÇÕES
1 INTRODUÇÃO
E
Diagramas de dispersão são gráficos que permitem a identificação entre causas e M
efeitos, com o propósito de avaliar o tipo de relação entre as variáveis estudadas. E
D
U
De uma maneira mais simples, é a representação gráfica de valores de duas variáveis C
relacionadas a um mesmo fenômeno, mostrando o quanto uma variável é afetada por outra, A
Ç
ajudando desta forma a visualizar se existe, ou não, alguma relação entre elas.
Ã
O
Neste gráfico, cada ponto plotado representa um par observado de valores para as
F
variáveis estudadas (x, y), num sistema de eixos cartesianos, formando uma “nuvem” de pontos, Í
que definirá qual o tipo de correlação está sendo analisada. S
I
C
A seguir, apresentamos alguns exemplos de diagramas de dispersão. A
164 TÓPICO 3 UNIDADE 3
Observe, acadêmico, que cada combinação de dados indica um eixo e uma direção que
caracteriza a relação entre as variáveis x e y. A relação entre as variáveis é direta quando os
valores de y aumentam em decorrência do aumento dos valores de x. A relação é considerada
inversa quando os valores de y variam inversamente em relação aos de x. E não há relação
quando os valores de y não variam com o aumento dos valores de x.
B
I
O Exemplo: Acadêmico, vamos verificar a relação entre os valores informados na tabela
E
de peso e altura para crianças, construindo um gráfico de dispersão:
S
T
A
TABELA 43 - VARIAÇÃO DO PESO E DA ALTURA PARA CRIANÇAS
T
BRASILEIRAS ENTRE 1 E 12 ANOS
Í
S Idade Altura (cm) Peso (Kg)
T
I 1 ano 74 9,8
C
A 2 anos 85 12,3
3 anos 96 14,7
E
M 4 anos 101 16,5
E
5 anos 108 18,6
D 6 anos 112 20,5
U
C 7 anos 117 23,1
A
8 anos 125 25,4
Ç
à 9 anos 132 28,7
O
10 anos 137 32,4
F
11 anos 143 35,3
Í
S 12 anos 149 40,7
I
C FONTE: A autora
A
UNIDADE 3 TÓPICO 3 165
FONTE: A autora
Note que o gráfico de dispersão que relaciona a altura e o peso conforme a idade das
crianças brasileiras sugere que as variáveis possuem uma relação linear direta. Veremos no
próximo tópico que podemos quantificar a força dessa relação através da determinação do
B
coeficiente de correlação de Pearson. I
O
E
S
T
A
3 CORRELAÇÃO DE PEARSON T
Í
S
O coeficiente de correlação de Pearson é uma medida do grau da relação linear entre T
duas variáveis quantitativas. É um índice adimensional que estabelece o quanto uma linha reta I
C
se ajusta em uma de nuvem de pontos (diagrama de dispersão). A
E
O coeficiente de correlação costuma ser representado pela letra R quando se trata de M
uma amostra ou por ρ quando o estudo refere-se a uma população. Possui valores situados
E
entre -1,0 e 1,0, sendo que: D
U
C
• R = 1: significa que as variáveis são diretamente proporcionais, e os pontos da reta A
caem exatamente sobre uma linha crescente; Ç
Ã
• R = -1: significa que as variáveis são inversamente proporcionais, e os pontos da reta
O
caem exatamente sobre uma linha decrescente;
F
• R = 0: Significa que não existe correlação entre as duas variáveis.
Í
S
O coeficiente de correlação é dado por: I
C
A
166 TÓPICO 3 UNIDADE 3
Usualmente, multiplicamos o valor do coeficiente por 100 para termos o seu valor em
porcentagem. A partir dos valores de R ou ρ, podemos verificar o tipo da correlação existente
entre as variáveis estudadas:
• 0 < r < 0,3: a correlação é muito fraca e não é possível estabelecer relação efetiva
entre as variáveis;
• 0,3 r < 0,6: a correlação é fraca, mas pode-se considerar a existência de uma relação
entre as variáveis;
• 0,6 ≤ r < 1: a correlação é média para forte e a relação entre as variáveis é significativa,
havendo uma forte relação entre as variáveis.
Exemplo 1: A busca por uma vida saudável, que alie alimentação equilibrada a exercícios
B físicos, vem crescendo entre todos os grupos da população. Diante disso, uma empresa
I
O buscou fazer uma pesquisa para verificar se há correlação significativa do gasto mensal com
E suplementos dos praticantes regulares de atividade física com a renda de cada um deles.
S
T
A A partir dos dados coletados foi possível elaborar a seguinte tabela:
T
Í
S TABELA 44 - RELAÇÃO ENTRE GASTO MENSAL COM SUPLEMENTO E RENDA INDIVIDUAL
T POR ALUNOS DA ACADEMIA XX NA CIDADE DE BLUMENAU - 2016
I
C
A Atividade Praticada Renda Individual (R$) Gasto com Suplemento (R$)
FONTE: A autora
Acadêmico, note que os gráficos de dispersão exibem quão bem os dados se adaptam
a um certo ajuste (linha de tendência)
Acadêmico, após compreendermos que uma correlação é a relação entre duas variáveis,
partiremos para um novo desafio: encontrar uma equação que represente a variação da variável
independente em relação à variável dependente em um determinado fenômeno, ou seja, nosso
próximo objetivo é estudar a regressão linear.
B
I
O
E
4 REGRESSÃO LINEAR SIMPLES
S
T
A
T O coeficiente de correlação de Pearson é uma medida do grau da relação linear entre
Í duas variáveis quantitativas. É um índice adimensional que estabelece o quanto uma linha reta
S
T se ajusta em uma de nuvem de pontos (diagrama de dispersão).
I
C
A O coeficiente de correlação costuma ser representado pela letra R quando se trata de
uma amostra ou por ρ quando o estudo refere-se a uma população. Possui valores situados
E
M
entre -1,0 e 1,0, sendo que:
E
• R = 1: significa que as variáveis são diretamente proporcionais, e os pontos da reta
D
U caem exatamente sobre uma linha crescente;
C • R = -1: significa que as variáveis são inversamente proporcionais, e os pontos da reta
A
Ç caem exatamente sobre uma linha decrescente;
à • R = 0: Significa que não existe correlação entre as duas variáveis.
O
Neste tópico abordaremos a análise de regressão como uma técnica estatística que
tem por objetivo investigar e modelar a relação entre duas variáveis. Regressão linear significa
determinar uma equação da reta que melhor se ajuste ao padrão seguido pelos dados, para ser
possível determinar um modelo que permita prever uma estimativa linear entre duas variáveis
aleatórias.
Onde:
• n é o número de dados a serem analisados;
B • e y são as médias dos valores de xi e yi, respectivamente. Podemos determinar
I as médias através das equações:
O
E
S
T
A
T
Í É importante ressaltarmos que quando aplicamos estas fórmulas a um conjunto de
S
T dados, estamos fazendo uma estimativa da verdadeira equação de regressão. Deste modo,
I devemos escrever , onde é o y estimado.
C
A
Exemplo 1: Uma academia de ginástica decidiu realizar uma pesquisa de como a prática
E
M de exercícios pode afetar na perda de peso. Para isto, foram selecionados 12 alunos iniciantes
na academia que realizavam os exercícios com o objetivo de emagrecer. No entanto, na fase
E
D inicial da pesquisa, estes alunos não poderiam diminuir a quantidade de calorias ingeridas
U diariamente, para que os dados referentes à perda de peso fossem somente influenciados
C
pelos exercícios físicos realizados. Foi solicitado aos alunos que registrassem no decorrer de
A
Ç duas semanas o número de minutos de exercícios que praticaram, com a perda de peso após
Ã
o período de duas semanas.
O
F
Í
S
I
C
A
UNIDADE 3 TÓPICO 3 171
E
M
E
D
U
C
FONTE: A autora A
Ç
Ã
Observe que os pontos que formam o gráfico de dispersão representam uma correlação O
que se assemelha a uma reta ascendente, sendo, portanto, uma correlação linear positiva.
F
Í
S
I
C
A
172 TÓPICO 3 UNIDADE 3
E
M
E
D
U
C
A
Ç
Ã
O
IMPO
RTAN
TE!
Acadêmico, você pode utilizar o programa Microsoft Excel para
auxiliá-lo na obtenção da linha de tendência dos pontos num
gráfico de dispersão e para a determinação da equação da reta
que representa estes pontos.
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
FONTE: A autora
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
174 TÓPICO 3 UNIDADE 3
RESUMO DO TÓPICO 3
• Regressão linear tem por objetivo determinar uma equação da reta que melhor se
ajuste a um conjunto de dados estatísticos. O resultado de uma regressão linear segue a
equação da reta: y = ax + b.
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 3 TÓPICO 3 175
IDADE
ATIV
AUTO
a) ( ) y = -0,2141x + 54,753
b) ( ) y = 0,2141x - 54,753
c) ( ) y = -4,3526x + 246,23
d) ( ) y = 4,3526x - 246,23
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
UNIDADE 3 TÓPICO 3 177
APÊNDICE A
Tabela Z (Normal Padrão)
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 B
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 I
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 O
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 E
S
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
T
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936 A
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952 T
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964 Í
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974 S
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981 T
I
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
C
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990 A
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995 E
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997 M
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
E
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 D
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 U
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 C
A
Ç
Ã
O
F
Í
S
I
C
A
178 TÓPICO 3 UNIDADE 3
APÊNDICE B
Distribuição Qui-Quadrado
P(χ2(n-1) ≥ χ2tab) = α
APÊNDICE C
Distribuição t-Student
P(t(n-1) ≥ ttab) = α
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
180 TÓPICO 3 UNIDADE 3
IAÇÃO
AVAL
B
I
O
E
S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A
181
REFERÊNCIAS
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. São Paulo:
B
Atlas, 2009. I
O
WALPOLE, Ronald E. Probabilidade e estatística para engenharia e ciências. São Paulo: E
Pearson Prentice Hall, 2009. S
T
A
T
Í
S
T
I
C
A
E
M
E
D
U
C
A
Ç
Ã
O
F
Í
S
I
C
A