You are on page 1of 61

Descriptiva de una variable

Descriptiva para varias variables

Repaso Estadstica Descriptiva


Grado en Fisioterapia, 2010/11
Jess Montanero Fernndez
Ctedra de Bioestadstica
Universidad de Extremadura

13 de octubre de 2010

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

ndice

Descriptiva de una variable

Descriptiva para varias variables


Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

ndice

Descriptiva de una variable

Descriptiva para varias variables


Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

De qu trata?

Descripcin conjunto concreto de datos (sin generalizar)


Clasificacin Tablas de frecuencia
Representacin Grficos
Resumen Valores tpicos

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Tipos de variables ?

Segn SPSS
Cualitativas (factores)
Nominales: Grupo sanguneo
Ordinales: Grado enfermedad

Cuantitativas o de escala : Temperatura, estatura, glucemia,


no hijos...

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Problemas estadsticos: relacin

Tipos de relaciones
Cualitativa (factor) Cuantitativa (Comparacin de
grupos o tratamientos)
Cuantitativa Cuantitativa (Regresin)
Cualitativa (factor) Cuanlitativa (Tablas de
contingencia)

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Grficos

Tipos de variables segn grfico


Cualitativas Diagrama sectores
Cuantitativas discretas Diagrama barras
Cuantitativas continuas Histograma
*Nota: estudiaremos ahora una sola variable

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Variable cualitativa: diagrama de sectores

Grupo
fi
0
2892
A
2625
B
570
AB
226
Total 6313

Jess Montanero Fernndez

pi
0,458
0,416
0,090
0,036
1

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Figura: Grupo sanguneo

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Variable cuantitativa discreta: diagrama de barras


Edad alumnos titulacin universitaria
Edad fi
18
6
19
5
20
3
21
3
22
3
23
3
24
2
Total 25

Jess Montanero Fernndez

pi
0.24
0.20
0.12
0.12
0.12
0.12
0.08
1

Repaso Estadstica Descriptiva

3
2
1
0

Frequencia

Descriptiva de una variable


Descriptiva para varias variables

18

19

20

21

22

23

Edad

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

24

Descriptiva de una variable


Descriptiva para varias variables

Variable cuantitativa continua

0.0

0.2

0.4

Frequency

0.6

0.8

1.0

Glucemia n=100: Diagrama de barras

71.43061

76.69276

78.97109

80.0199

80.63695

81.29456

82.48693

82.96681

83.49599

84.3332

85.12535

86.0123

86.63882

87.17015

87.55771

88.70981

89.46449

90.48297

91.60582

93.09123

cero

Agrupar datos por intervalos


Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Histograma

10

15

frequency

20

25

30

35

Glucemia k=6

70

75

80

85

90

95

Datos$cero

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

100

Descriptiva de una variable


Descriptiva para varias variables

Otros grficos para variables continuas


Tallo-hoja

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Diagrama de caja o box-plot

Figura: Concentracin ozono

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Valores tpicos

Resumir numricamente la informacin


Medidas de centralizacin
Medidas de dispersin

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Medidas de centralizacin

Centro de los datos, nmero ms representativo


Media aritmtica (centro de gravedad):
Pn
xi
x = i=1
n
Mediana (orden): dato que queda en medio una vez
ordenados de menor a mayor.

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

La mediana es robusta: no se ve influenciada por la presencia de


valores extremos

6
4
2
0

frequency

10

12

Ansiedad n=20

10

12

14

16

18

Datos$ham

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

20

Descriptiva de una variable


Descriptiva para varias variables

Otro caso de sesgo n=350


300

200

100

0
7500,0

27500,0
17500,0

47500,0
37500,0

Salario empleados de una banco (USA)

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

10

15

frequency

20

25

30

35

Distribucin normal: media

70

75

80

85

90

95

Datos$cero

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

100

Descriptiva de una variable


Descriptiva para varias variables

Medidas de dispersin

Variabilidad de los datos


Varizanza desviacin tpica
Amplitud (o rango) intercuartil

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Resumen de la informacin

Centralizacin-dispersin
media-desv. tpica o mediana-rango inter.?

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

10

15

frequency

20

25

30

35

media-desviacin tpica
Resumen perfectamente la informacin si la distribucin de los
datos sigue un modelo normal
xs
68 %
x 2s
95 %
x 3s
99 %
Podemos construir la distribucin partiendo exclusivamente de
x y s.

70

75

80

85

90

95

100

Datos$cero

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

mediana-rango intercuartil
En aquellas situaciones en que la media sea poco representativa:
fuerte sesgo + valores extremos.
300

200

100

0
7500,0

27500,0
17500,0

47500,0
37500,0

Salario empleados de una banco (USA)


Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

mediana-rango intercuartil
En aquellas situaciones en que la media sea poco representativa:
fuerte sesgo + valores extremos.
300

200

100

0
7500,0

27500,0
17500,0

47500,0
37500,0

Salario empleados de una banco (USA)


Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Problemas estadsticos: relacin


Tipos de relaciones
Cuantitativa Cuantitativa (Regresin-correlacin)
Cualitativa (factor) Cualitativa (Tablas de contingencia)
Cualitativa (factor) Cuantitativa (Comparacin de
grupos o tratamientos)
Cualitativa (factor) Cuantitativa (Reg logstica, etc)
Temas 2,3 y 4 segn programa

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Relacin entre dos variables cuantitativas

Peso-altura
X =peso(kg)
Y =altura(cm)

80
174

45
152

Jess Montanero Fernndez

63
160

94
183

24
102

75
183

Repaso Estadstica Descriptiva

56
148

...
...

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Descriptiva de una variable


Descriptiva para varias variables

Grfico
Diagrama de dispersin
Y
6
200
190

180

qq

170
160

q qq
q

150
140

q
q

130
120
110

100
|

q
|

10 20 30 40 50 60 70 80 90 100

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Descriptiva de una variable


Descriptiva para varias variables

Otro ejemplo
5,200

5,100

Anchura cabeza

5,000

4,900

4,800

4,700

4,600

4,500
7,800

8,100

8,400

8,700

9,000

Longitud cabeza

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Estudiamos inicialmente relaciones lineales

Concentracin de calcio (mg/100ml)

11,00

10,00

9,00

8,00

7,00

6,00

5,00
0,00

1,00

2,00

3,00

4,00

5,00

Concentracin de hormona paratiroidea (mug/ml)

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Valores tpicos

Dos tipos
De las variables por separados.
Referentes a la relacin entre las variables

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Variables por separado


x,

sx ,

y,

Jess Montanero Fernndez

sy ,

y, . . .

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Referentes a la relacin entre las variables: Covarianza r


Pn
(xi x)(yi y)
sxy = i=1
n1
sx sy sxy + sx sy .

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Descriptiva de una variable


Descriptiva para varias variables

Interpretacin grfica covarianza


Y
q Y
6

q
qq

6
q

q
q

Jess Montanero Fernndez

qq

q
q

Repaso Estadstica Descriptiva

q -

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Descriptiva de una variable


Descriptiva para varias variables

Interpretacin grfica
630,71 sxy +630,71

sxy = 577,86

200

Altura

175

150

125

100

20

40

60

80

100

Peso

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Descriptiva de una variable


Descriptiva para varias variables

5,200

5,100

Anchura cabeza

5,000

4,900

4,800

4,700

4,600

4,500
7,800

8,100

8,400

8,700

9,000

Longitud cabeza

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Descriptiva de una variable


Descriptiva para varias variables

Covarianza prxima a cero


8,00

7,00

6,00

5,00

4,00

3,00

2,00

1,00
2,00

4,00

6,00

8,00

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Covarianza negativa

Concentracin de calcio (mg/100ml)

11,00

10,00

9,00

8,00

7,00

6,00

5,00
0,00

1,00

2,00

3,00

4,00

5,00

Concentracin de hormona paratiroidea (mug/ml)

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Coeficiente de correlacin lineal r

Medida adimensional del grado de correlacin


sx sy sxy + sx sy .
r=

sxy
sx sy

1 r 1

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Descriptiva de una variable


Descriptiva para varias variables

r = 0,91
Y
6
200
190

180

qq

170
160

q qq
q

150
140

q
q

130
120
110

100
|

q
|

10 20 30 40 50 60 70 80 90 100

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Descriptiva de una variable


Descriptiva para varias variables

r = 0,625
5,200

anch

5,000

4,800

4,600

7,800

8,100

8,400

8,700

9,000

longt

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

r = 0,97

Concentracin de calcio (mg/100ml)

11,00

10,00

9,00

8,00

7,00

6,00

5,00
0,00

1,00

2,00

3,00

4,00

5,00

Concentracin de hormona paratiroidea (mug/ml)

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Descriptiva de una variable


Descriptiva para varias variables

Recta de regresin lineal


y = a + b x y = 89,11 + 1,10x
Predicciones: x = 62kg y = 89,11 + 1,10 60 = 155,11cm
200

Altura

175

150

125

100

20

40

60

80

100

Peso

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Regresin mltiple

Pueden introducirse ms variables explicativas en la ecuacin?


y = a + b1 x1 + b2 x2 + b3 x3

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Varianza residual
Mide el error cometido por la recta de regresin
Pn
1
2
s2yx = n2
i=1 [yi (a + bxi )] = 1335,32/10
xi
80
45
63
94
24
75
56
52
61
34
21
78

yi
174
152
160
183
102
183
148
152
166
140
98
160

(a + bxi )
176.80
138.44
158.17
192.15
115.42
171.32
150.50
146.11
155.98
126.38
112.12
174.61

Jess Montanero Fernndez

[yi (a + bxi )]2


7.86
183.94
3.36
83.70
180.05
136.37
6.23
34.69
100.48
185.51
199.66
213.47
1335.32

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Coeficiciente de determinacin r2

s2yx
2
= 1 rxy
s2y
2
1 rxy
indica la proporcin de la variabilidad total de Y no
explicada por la regresin.
2
rxy
expresa lo contrario.

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Descriptiva de una variable


Descriptiva para varias variables

r2 = 0,82
200

Altura

175

150

125

100

20

40

60

80

100

Peso

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Descriptiva de una variable


Descriptiva para varias variables

r2 ' 0
8,00

7,00

6,00

5,00

4,00

3,00

2,00

1,00
2,00

4,00

6,00

8,00

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Descriptiva de una variable


Descriptiva para varias variables

r2 = 0,39
5,200

5,100

Anchura cabeza

5,000

4,900

4,800

4,700

4,600

4,500
7,800

8,100

8,400

8,700

9,000

Longitud cabeza

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Regresin no lineal
Edad das-Peso embrin: Transformar variables
3.000

Peso Embrin

2.000

1.000

0
10

12

14

16

Edad embrin

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Relacin entre variables cualitativas


nivel contaminacin - salud rboles
Cloroplastos
(3 3) Alto Medio Bajo
Alto
3
4
13
5
10
5
SO2 Medio
Bajo
7
11
2
Total
15
25
20

Jess Montanero Fernndez

Total
20
20
20
60

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Vacunacin-hepatitis
Vacunacin
(2 2)
S
Hepatitis
No
Total

S
11
538
549

Jess Montanero Fernndez

No
70
464
534

Total
81
1002
1083

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Grfico
Barras agrupadas
Grfico de barras

Nivel de cloroplastos
Cloroplastos alto
Cloroplastos medio
Cloroplatos bajo

12,5

Recuento

10,0

7,5

5,0

2,5

0,0
SO2 alto

SO2 medio

SO2 bajo

Nivel de SO2

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Medidas del grado de dependencia


Observados vs Esperados independencia: distancia 2
X (Oij Eij )2
2exp =
Eij
i,j
0 2exp +
Coeficiente de contingencia de Pearson C
s
2exp
C=
2exp + n
s
q1
0C
, q = min{no filas, no colunas}
q
Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Ejemplo: cloropastos
Tabla 3 3. Por lo tanto,
r
0C

2
= 0,816
3

En este caso concreto,


C = 0,444
Grado de asociacin medio

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Independencia C = 0
Cloroplastos

SO2

(3 3)
Alto
Medio
Bajo
Total

Alto Medio Bajo


5
8.3
6.7
5
8.3
6.7
5
8.3
6.7
15
25
20

Jess Montanero Fernndez

Total
20
20
20
60

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Mxima dependencia C = 0, 816


Los valores observados deberan ser stos:
Cloroplastos

SO2

(3 3)
Alto
Medio
Bajo
Total

Alto Medio Bajo


0
0
20
0
20
0
20
0
0
20
20
20

Jess Montanero Fernndez

Total
20
20
20
60

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Cualitativa cuantitativa

Puntuacin de ansiedad de Hamilton

20,00

18,00

16,00

5
14,00

12,00

10,00

8,00
Viven solos

Viven con otras personas

Grupo

Influye el estilo de vida en la ansiedad?

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Influye la acidosis en la glucemia?

Nivel de glucemia en el cordn umbilical

100,000

90,000

80,000

70,000

60,000

50,000

40,000
Control

Acidosis Respiratoria

Acidosis Metablica

Acidosis Mixta

Tipo de acidosis

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Contrastes de hiptesis
H 0 : 1 = 2 = 3 = 4
Parmetros poblacionales
denota la media poblacional de una variable cuantitativa
Parmetros muestrales
Nosotros slo contamos con los valores tpicos (x,s, etc) de una
muestra de cada poblacin.

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

Descriptiva de una variable


Descriptiva para varias variables

Regresin-Correlacin
Tablas de contingencia
Comparacin de grupos o tratamientos

Inferencia Estadstica

En general, cmo generalizar conclusiones a partir de una


muestra?

Jess Montanero Fernndez

Repaso Estadstica Descriptiva

You might also like