You are on page 1of 70

Matemtica

LIO 34,35,36

Estatstica
Amplitude Interquartil
Varincia
Desvio Padro
Dados Bidimensionais
Amplitude de um conjunto de dados
Duas das medidas da variabilidade de um conjunto de dados
so a amplitude e a amplitude interquartil.
O que Chama-se amplitude e representa-
amplitude? se por R (Range) de um conjunto
de dados, x1 , x2, , xi, , xn ,
diferena entre o mximo e o
mnimo do conjunto de dados.

Se os dados esto agrupados em


classes, faz-se uma estimativa
para a amplitude calculando a
diferena entre o limite superior da
ltima classe e o limite inferior da
primeira.
Amplitude interquartil

Vejamos: A amplitude interquartil outra medida de


variabilidade que vamos estudar para
alm da amplitude (R) .
Ao contrrio da amplitude, a amplitude
interquartil (IQR) uma medida
resistente.
J que definida custa de medidas
resistentes que so os quartis e
representada pela diferena entre o 3. e
o 1. quartil.
Amplitude interquartis

Amplitude interquartis a diferena entre o 3.o quartil e


o 1.o quartil, isto , igual a 3.o quartil 1.o quartil
Medidas de Disperso
Caso fizessemos uma reflexo sobre as medidas de
tendncia central, observaramos que elas no so
suficientes, para caracterizar, totalmente, uma
sequncia numrica.

Assim, foram introduzidas as medidas de


disperso, com intuito de verificar como se
comportam essas medidas de tendncia central em
relao disperso.

As principais medidas de disperso absolutas so:


A Varincia e o Desvio Padro.

29/01/2017 PROF : ANA COLAO 5


Desvio mdio
Varincia
uma mdia aritmtica calculada a partir dos
quadrados dos desvios obtidos entre os elementos
da srie e sua mdia.
Notao: Quando a sequncia de dados representa
uma Populao a varincia ser denotada por 2(x),
e quando se tratar de uma amostra ser denotada
por s2(x).

29/01/2017 PROF : ANA COLAO 7


Varincia - Dados no-agrupados
Se a sequncia representa uma populao, a varincia ser
calculada atravs da seguinte frmula:

2 = ( xi x )2
n

Varincia - Dados agrupados sem intervalo de


classes
Se a sequncia representa uma populao, a varincia ser
calculada atravs da seguinte frmula:

2 = ( xi x )2 fi
fi
29/01/2017 PROF : ANA COLAO 8
Varincia - Dados agrupados com intervalo de
classes
Se a sequncia representa uma populao, a varincia ser
calculada atravs da seguinte frmula:

2 = ( xi x )2 fi
fi

Observao: Neste caso o xi o ponto mdio da classe i.

29/01/2017 PROF : ANA COLAO 9


Existem duas expresses para
Arepresentar
varincia no geralmente
a varincia. Ambas so
utilizada
obtidas como medida
a partir de dos quadrados
da soma
disperso masrelativamente
dos desvios o suporte para o
mdia. So
clculo
elas: do desvio-padro.

ou
Quando se utiliza
s2??

Quando x1 , x2 , , xn
representam uma amostra.
populao.
A interpretao do significado da varincia, em
situaes concretas, levanta problemas. Por
exemplo, se estivermos a estudar a altura de
um grupo de pessoas em centmetros, a mdia
das alturas ainda se exprime em centmetros,
mas a varincia exprime-se em centmetros
quadrados.
Exemplo : Calculemos a varincia destas idades

Calcule a varincia da amostra :

29/01/2017 PROF. ANA COLAO 13


Vamos copiar a coluna das idades, e achar
a varincia :

29/01/2017 PROF. ANA COLAO 14


Desvio Padro
a raiz quadrada positiva da varincia.
Notao: Quando a sequncia de dados representa
uma Populao o desvio padro ser denotada por
(x), e quando se tratar de uma amostra ser
denotado por s(x).
Assim, independente de como se apresentarem os
dados (agrupados ou no) a frmula do desvio
padro ser:
= 2

29/01/2017 PROF : ANA COLAO 15


O desvio-padro representa-se por s
ou s conforme a varincia seja s2 ou
2 e igual raiz quadrada positiva
da varincia.
Propriedades do desvio-padro

1. O desvio-padro sempre no negativo.


2. Quanto maior for o desvio-padro maior
ser a disperso dos dados em relao
mdia.

3. Se o desvio-padro igual a zero


porque no existe variabilidade, isto , os
dados so todos iguais.
O processo de clculo do desvio-padro
para dados agrupados em classes ou em
tabelas de frequncia o mesmo que
para os dados simples.
Interpretao do desvio padro O desvio padro sem dvida a
mais importante das medidas de disperso.
fundamental que o interessado consiga relacionar o valor obtido
do desvio padro com os dados da srie.
Quando uma curva de frequncia representativa da srie
perfeitamente simtrica como a curva a seguir, podemos afirmar que
o intervalo [ x - . x + ] contm aproximadamente 68% dos valores
da srie.
Assim como, quando tivermos o intervalo [ x - 2. x + 2] ir conter
aproximadamente 95% dos valores da srie.
E o intervalo [ x - 3. x + 3] ir conter aproximadamente 99% dos
valores da srie.
Como podemos ver no grfico a seguir
29/01/2017 PROF : ANA COLAO 19
V Encontro do Instituto Adolfo Lutz
So Paulo, 13 a 16 de outubro de 2003

Agncia Nacional
de Vigilncia Sanitria
www.anvisa.gov.br
29/01/2017 PROF : ANA COLAO 20
Desvio Padro (clculos passo a
passo)

29/01/2017 PROF : ANA COLAO 21


29/01/2017 PROF : ANA COLAO 22
29/01/2017 PROF : ANA COLAO 23
Clculo Desvio Padro com Frequncias

29/01/2017 PROF : ANA COLAO 24


29/01/2017 PROF. ANA COLAO 25
Dados Bidimensionais . Grfico de pontos

O Nuno est a fazer um estudo estatstico.


Nesse contexto, j observou 10 respostas
acerca da classificao obtida s
disciplinas de Matemtica e Portugus, no
perodo passado.
Os dados obtidos so os apresentados na
tabela ao lado.
1.1 Copie para o seu caderno e complete o grfico colocando
os pontos em falta.
Cada ponto corresponde a um nome.
Na actividade anterior, os dados
observados aparecem sob a forma de
pares de valores: as classificaes em
Matemtica e em Portugus. Trata-se de
dados bidimensionais.

Dados bidimensionais ou
dados bivariados so dados
obtidos de pares de variveis.
O grfico que representa e
organiza este tipo de informao
tem o nome de diagrama de
disperso.

Diagrama de disperso uma


representao grfica para os
dados bivariados, em
que cada par de dados (xi , yi)
representado por um ponto de
coordenadas (xi , yi), num
sistema de eixos coordenados.
Observe os seguintes diagramas de disperso que dizem
respeito ao nmero do calado (tamanho da sapatilha) e a altura
dos atletas que esto a escalar uma montanha e, no segundo
caso, relao entre a altitude e a temperatura.

Pode concluir-se
Quantos que h
atletas foram uma relao
observados entre a altura
relacionando de
o tamanho
medida que se subia a montanha a temperatura subia ou descia?
uma pessoa e ocom
das sapatilhas nmero
a suade sapatilha que usa?
altura?
O diagrama de disperso
muito til pois permite observar
o tipo de associao
entre as variveis x e y .

Variveis positivamente
associadas
Observando o grfico 1 verifica-
se que, em mdia, quando a
varivel x aumenta a varivel y
tambm aumenta. Podemos
traar a recta que melhor se
aproxime de todos os pontos do
grfico. Verifica-se que esta recta
tem declive positivo.
Diz-se que h uma associao
positiva entre as variveis.
O diagrama de disperso
muito til pois permite
observar o tipo de associao
entre as variveis x e y .

Variveis negativamente
associadas
Observando o grfico 2 verifica-se
que, em mdia, quando a varivel
x aumenta a varivel y diminui.
Podemos tambm traar a recta
que melhor se aproxime de todos
os pontos do grfico. Esta recta
tem declive negativo. Diz-se que
existe uma associao negativa
entre as variveis.
O diagrama de disperso
muito til pois permite
observar o tipo de associao
entre as variveis x e y .

No h associao clara entre as


variveis
Observando o grfico 3 verifica-se
que a nuvem de pontos se encontra
bastante dispersa, o que faz prever
que no existe uma associao clara
entre as duas variveis. Diz-se que
no existe associao entre as duas
variveis.
Observe os seguintes diagramas de disperso.

2.1 Indique, pela letra correspondente, aqueles em que se observa:


a) uma associao positiva;
b) uma associao negativa.
2.2 Indique, pela letra correspondente, o diagrama em que no h
uma associao clara entre as duas variveis.
Grau de associao

Observe os diagramas de disperso.

Em qual deles lhe parece haver um maior grau de associao


entre as variveis x e y ?
Explique o seu raciocnio.
Para quantificar o grau da associao
linear entre duas variveis utiliza-se
uma estatstica a que se d o nome
de correlao linear ou coeficiente
de correlao linear, que se
representa por r e dado pela
frmula:
O coeficiente de correlao indica o grau de associao linear
entre as duas variveis.
Prova-se que r um valor do intervalo [- 1 , 1] .
Conhecido o valor de r pode avaliar-se o grau de associao
linear entre as duas variveis de acordo com a seguinte tabela:
Recta de regresso. Utilizao da calculadora grfica

Quando duas variveis esto fortemente


correlacionadas os pontos do diagrama de
disperso colocam-se em torno de uma reta.

H muitas rectas que se podem desenhar, mas


um dos critrios mais comuns para definir essa
recta o de tornar mnima a soma dos quadrados
dos desvios dos pontos em relao recta.
A essa recta chama-se recta de regresso ou
recta dos mnimos quadrados.
A recta de regresso pode ser definida por uma equao do tipo y = ax + b .
Coeficiente de Correlao de Pearson.
* Exemplo *

Encontre o coeficiente de correlao de Pearson aos


dados sobre capacidade de inspirao mxima
relacionando o pr-operatrio e o ps-operatrio.

29/01/201
PROF ANA COLAO 39
7
Coeficiente de Correlao de Pearson.
* Exemplo *
Dados

29/01/2017 PROF ANA COLAO 40


Coeficiente de Correlao de Pearson.
* Soluo do Exemplo *

Sejam as variveis:

x a varivel Capacidade de inspirao no pr-


operatrio;

y no ps-operatrio,

De posse dos dados e da equao vem:

29/01/2017 PROF ANA COLAO 41


Coeficiente de Correlao de Pearson.
* Soluo do Exemplo *

Efetuando os clculos, vem:

29/01/2017 PROF ANA COLAO 42


* Soluo do Exemplo *
Clculos Intermedirios

n = 18;

29/01/2017 PROF ANA COLAO 43


* Soluo do Exemplo *
Clculos Intermedirios

29/01/2017 PROF ANA COLAO 44


* Soluo do Exemplo *
Na frmula

De posse dos valores dos clculos intermedirios:

Vem:

29/01/2017 PROF ANA COLAO 45


* Soluo do Exemplo *
Na frmula

Chega a:

Como r no est nem prximo de Zero e nem de


+1 ou de -1 indica que existe uma relao entre o
pr-operatrio e o ps-operatrio, porem o grau
de relao entre elas no muito explicativo.

29/01/2017 PROF ANA COLAO 46


Coeficiente de Determinao

elevar o coeficiente de correlao ao quadrado.

Notao: r2;

Exemplo:
Do exemplo anterior tem-se:
r2 = 0,5882 = 0,3459 ou 34,59%

29/01/2017 PROF ANA COLAO 47


Coeficiente de Determinao
* Interpretao *

O valor acima indica que a capacidade de


inspirao no ps-operatrio explicada pela
pr-operatria em 34,59%.

29/01/2017 PROF ANA COLAO 48


Regresso Linear

Quando duas variveis esto fortemente correlacionadas


os pontos do diagrama de disperso colocam-se em torno
de uma reta.

29/01/2017 PROF ANA COLAO 49


Regresso Linear

H muitas retas que podem desenhar, mas um dos critrios


mais comuns para definir essa reta o de tornar mnima a
soma dos quadrados dos desvios dos pontos em relao
reta.

A essa reta chama-se reta de regresso ou reta dos mnimos


quadrados.

29/01/2017 PROF ANA COLAO 50


Regresso Linear

29/01/2017 PROF ANA COLAO 51


Regresso Linear

A reta ento definida pela equao do tipo y= ax+b.

Esta reta passa pelo ponto ( x , y ) e o seu declive, a, est


relacionado com o coeficiente de correlao, tendo o
mesmo sinal.

Ao ponto (x,y) chama-se ponto mdio ou centro de


gravidade

29/01/2017 PROF ANA COLAO 52


Suspenderam-se objectos de diferentes massas numa
mola deformada e registaram-se os correspondentes
alongamentos da mola, como se mostra na tabela
seguinte:
Suspenderam-se objetos de diferentes massas numa mola
deformada e registaram-se os correspondentes alongamentos
da mola, como se mostra na tabela seguinte:

Use a calculadora para obter a equao da reta de regresso, o


coeficiente de correlao e a imagem grfica da reta de regresso.
A recta de regresso para fazer estimativas

A recta de regresso adapta-se nuvem


de pontos e descreve, aproximadamente, a
sua regularidade.

Se conhecermos o valor de uma


varivel, a partir da recta de
regresso obtemos, de uma
forma aproximada, o valor
esperado da outra varivel.
Em linguagem estatstica
dizemos que podemos inferir o
valor de x para um dado valor
de y ou vice-versa.
A estes valores tambm se
chamam estimativas.
A recta de regresso para fazer estimativas

Os valores obtidos para a


varivel desconhecida so
sempre valores aproximados,
por isso se diz o valor que
inferimos .
Essencial
O ESSENCIAL

Define-se amplitude e representa-se


por R (Range) como sendo a diferena
entre os valores maior e menor das
observaes. Por exemplo:
O ESSENCIAL

A amplitude interquartis = Q3 - Q1 .
Por exemplo:

amplitude interquartis = 184 - 163 = 21


O ESSENCIAL

Sendo x1 , x2 , , xn os n valores observados


x
de uma varivel quantitativa a sua mdia,
chama-se desvio mdio, e representa-se por d
, ao valor assim obtido:
Para dados agrupados
Para dados simples:
em tabelas de frequncias:

Se os dados esto agrupados em classes, xi e fi so,


respetivamente, o ponto mdio e a frequncia absoluta da
classe i ; k o nmero de classes.
O ESSENCIAL

Define-se varincia, e representa-se por s2 ,


como sendo a medida que se obtm
adicionando os quadrados dos desvios das
observaes da amostra, relativamente
sua mdia, e dividindo pelo nmero de
observaes da amostra menos 1 .
O ESSENCIAL

A varincia envolve a soma de quadrados.


Assim, para obter uma medida da
variabilidade ou disperso com as mesmas
unidades que os dados da amostra, calcula-
se a raiz quadrada positiva da varincia e
obtm-se o desvio-padro.
Diagrama de disperso

Diagrama de disperso uma


representao grfica para os
dados bivariados, em
que cada par de dados (xi , yi)
representado por um ponto de
coordenadas (xi , yi), num
sistema de eixos coordenados.
Interpretar um diagrama de disperso

Associao positiva Associao negativa


Coeficiente de correlao
FIM DA TEORIA!
Alguns exerccios

29/01/2017 PROF : ANA COLAO 67


Exerccios: Medidas de disperso

1- Calcule a varincia e desvio padro das sries abaixo:

a) 2, 3, 5, 4, 5, 2, 5, 7
b) 4, 12, 5, 9, 12, 4, 3
c) 7, 7, 7, 7, 7
d) 4, 5, 6, 6, 6, 7, 8, 8, 8, 9, 10, 10, 10, 11
e) 2, 5, 9, 6, 10, 12

2- Calcule a varincia e o desvio Idades fi


padro das idades dos alunos de 17 3
uma classe: 18 18
19 17
20 8
21 4
= 50

29/01/2017 PROF : ANA COLAO 68


Exerccios: Medidas de disperso

3- Calcule a varincia e o desvio Acidentes fi


padro da tabela ao lado. 0 30
1 5
2 3
3 1
4 1
i Salrios fi
= 40
(Euros )
1 400 500 12
2 500 600 15
4- O salrio de 40 funcionrios de
3 600 700 8
um escritrio est distribudo
4 700 800 3 segundo o quadro ao lado. Calcule
5 800 900 1 a varincia e o desvio padro.
6 900 1000 1
= 40
29/01/2017 PROF : ANA COLAO 69
FIM
Obrigada

29/01/2017 PROF : ANA COLAO 70