Professional Documents
Culture Documents
Esquema:
Planteamiento del problema
Hiptesis nula y alternativa
Recogida de datos
No rechazar la hiptesis nula
Test estadstico
Cuntas Variables?
Una variable
Normal?
Un grupo
S
Media y
Des. Est.
Dos grupos
No
Binomial
S
T-test
No
Ji-Cuadrado
Tres o ms
grupos
ANOVA
No
No paramtrica
Cuntas Variables?
Dos variables
Ambas continuas
1 categrica y
1 cuantitativa
Ambas
Categricas
Correlacin
ANOVA
JI-CUADRADO
Cuntas Variables?
3 + variable
Dos grupos
o + grupos
Un grupo
Regresin
Mltiple
Anlisis
Factorial
ANOVA
Medidas
repetidas
Anlisis de
covarianza
ANOVA
Multivaridas
Anlisis
Discriminante
Cuntas Muestras?
Pruebas
No paramtricas
Dos Muestras
Independientes
Una Muestra
Escala
Nominal
Ji-Cuadrado
Escala
Ordinal
Escala Ordinal
Kolmogorov-Smirnov
K Muestras
Independientes
Escala Ordinal
T de Wilcoxon
K Muestras
Relacionadas
Escala Ordinal
Kruskal-Wallis
F de Friedman
Prueba no
paramtrica
correspondiente
Propsito de la Prueba
Examina un grupo de
diereencias
Coeficiente de
correlacin de Pearson
Coeficiente de
correlacin de
Spearman
Evala la asociacin
lineal entre dos variables.
Anlisis de Varianza de
1 factors (Prueba F)
Compara tres o ms
grupos
Anlisis de Varianza de
dos factores
Anlisis de Varianza de
dos factores de
Friedman
Contrastando una
hiptesis
Son demasiados...
Gran
diferencia!
Muestra
aleatoria
Rechazo la
hiptesis
X = 20 aos
1
2
Estadsticos para una muestra
N
puntaje escritura
200
Media
52,78
Desviacin
tp.
9,479
Error tp. de
la media
,670
3
puntaje escritura
t
4,140
gl
199
Sig. (bilateral)
,000
Diferencia
de medias
2,77
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
1,45
4,10
Identificacin de hiptesis
Hiptesis nula Ho
La que contrastamos
Hip. Alternativa H1
Niega a H0
H0 :
H1 :
p = 50% = , ,
p 50 %
, <, >
Razonamiento bsico
Si supongo que H0 es cierta...
No hay evidencia contra H0
Si una teora hace
predicciones con
xito, queda
probado que es
cierta?
No se rechaza H0
El experimento no es concluyente
El contraste no es significativo
= 40
X = 38
Nivel de significacin:
Nmero pequeo: 1% , 5%
Fijado de antemano por el
investigador
Es la probabilidad de rechazar H0
cuando es cierta
=5%
Reg. Crit.
Reg. Crit.
No rechazo H0
0: =40
z = valor crtico
zona blanca = regin de no rechazo
zona gris = regin de rechazo
El porcentaje correspondiente a la regin de no
rechazo se denomina el nivel de confianza y
se escribe (1-a ) donde a representa el
porcentaje correspondiente a las colas (tails) y
el porcentaje correspondiente a la regin de
rechazo (a) se llama el nivel de significacin
(level of significance)
3
Si z0 < -1.96 si z0 > 1.96 entonces se
rechaza H0
Si -1.96 < z0 < 1.96 entonces no se rechaza H0
z0 se denomina la z observada o el valor
observado de la estadstica.
Bilateral
Unilateral
H1: <40
H1: 40
Unilateral
H1: >40
Grado de Significacin: p
Probabilidad de error al rechazar la hiptesis nula. Se calcula a posteriori,
cuando se conoce el resultado de haber aplicado una prueba d esignificacin.
Nivel de Significacin:
H0: =40
Grado de Significacin: p
No se rechaza
H0: =40
H0: =40
X = 43
10
Grado de Significacin: p
Es la probabilidad de tener una muestra que discrepe an ms que la nuestra de H0.
Es la probabilidad de que por puro azar obtengamos una muestra ms extraa que la obtenida.
p es conocido despus de realizar el experimento aleatorio
El contraste es no significativo cuando p>
No se rechaza
H0: =40
X = 43
Grado de Significacin: p
X = 50
11
Grado de Significacin: p
El contraste es estadsticamente significativo cuando p<
X = 50
Resumen: , p y criterio de
rechazo
Sobre
Sobre p
Es nmero pequeo,
preelegido al disear el
experimento
12
Correcto
H0 Falsa
Error de tipo II
Rechazo H0
Acepto H1
13
Conclusiones
Rechazar una hiptesis no prueba que sea falsa. Podemos cometer error de tipo I
No rechazar una hiptesis no prueba que sea cierta. Podemos cometer error de tipo II
H0 :
H1 :
?
=0,05
14
15
4
El resultado indica que hay diferencias
estadsticamente significativas en la
media de los puntajes de escritura entre
hombres y mujeres (t=-3.734, p=0.000).
En otras palabras, las mujeres tienen
una media (54,99) ms alta en escritura
que los hombres (50,12) y es
estadsticamente significativa
2
puntaje escritura
SEXO
Hombre
Mujer
Media
50,12
54,99
Desviacin
tp.
10,305
8,134
Error tp. de
la media
1,080
,779
F
puntaje escritura Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
Prueba de Levene
para la igualdad de
varianzas
11,133
Sig.
,001
Sig. (bilateral)
-3,734
198
,000
-4,87
1,304
-7,442
-2,298
-3,656
169,707
,000
-4,87
1,332
-7,499
-2,241
gl
Error tp. de
la diferencia
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
Diferencia
de medias
Supuestos
1. Las muestras se seleccionan aleatoriamente.
2. Las muestras son independientes (ie. Las observaciones en una
muestra no tienen nada que ver con las observaciones en la otra
muestra)
3. Las poblaciones tienen una distribucin normal
4 . Las varianzas de las poblaciones son iguales (homogeneidad de
varianzas)
Si hay el mismo nmero de observaciones en los dos grupos, la
prueba es robusta y por lo tanto no hace falta realizar la prueba
de homogeneidad de varianzas.
Tradicionalmente los dos primeros supuestos se logran seleccionando
aleatoriamente los sujetos y asignando aleatoriamente la mitad al
grupo control y la otra mitad al experimental.
16
H0 :
?
H1 :
=0,05
4
Rangos
2
puntaje escritura
SEXO
Hombre
Mujer
Total
N
91
109
200
Rango
promedio
85,63
112,92
Estadsticos de contraste
3
U de Mann-Whitney
W de Wilcoxon
Z
Sig. asintt. (bilateral)
puntaje
escritura
3606,000
7792,000
-3,329
,001
Suma de
rangos
7792,00
12308,00
17
VI: Sexo
VD: tip_inst
H0 :
H1 :
?
=0,05
18
1
2
Tabla de contingencia tipo institucin * SEXO
Recuento
tipo institucin
Total
pblica
privada
SEXO
Hombre
Mujer
77
91
14
18
91
109
Total
168
32
200
3
Chi-cuadrado de Pearson
Correccin apor
continuidad
Razn de verosimilitud
Estadstico exacto de
Fisher
Asociacin lineal por
lineal
N de casos vlidos
Pruebas de chi-cuadrado
Sig. asinttica
(bilateral)
,828
,001
,981
,047
,828
,047
,829
Valor
,047b
gl
Sig. exacta
(bilateral)
Sig. exacta
(unilateral)
,849
,492
200
19
H0 :
H1 :
=0,05
1
Tabla de contingencia estus socioeconmico * SEXO
Recuento
estus socioeconmico
bajo
medio
alto
Total
SEXO
Hombre
Mujer
15
32
47
48
29
29
91
109
Total
47
95
58
200
2
Pruebas de chi-cuadrado
Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por
lineal
N de casos vlidos
Valor
4,577a
4,679
3,110
2
2
Sig. asinttica
(bilateral)
,101
,096
,078
gl
200
20
H0 :
H1 :
=0,05
21
1
VD
VI
3
2
La media de la variable
dependiente difiere significativamente
segn los niveles de programas. Pero no
sabemos si las diferencias es entre que
Niveles.
ANOVA
puntaje escritura
Suma de
cuadrados
Inter-grupos 3175,698
Intra-grupos 14703,177
Total
17878,875
gl
2
197
199
Media
cuadrtica
1587,849
74,635
F
21,275
Sig.
,000
La Tabla ANOVA nos indica que al ser 0.000 inferior al valor 0.05 valor
habitual del nivel crtico deberemos de rechazar la hiptesis nula
Comparaciones mltiples
Diferencia de
(I) tipo de programa
(J) tipo de programa
medias (I-J)Error tpico
general
acadmico
-4,92*
1,539
vocacional
4,57*
1,775
acadmico
general
4,92*
1,539
vocacional
9,50*
1,484
vocacional
general
-4,57*
1,775
acadmico
-9,50*
1,484
Intervalo de confianza al
95%
Lmite
Sig. Lmite inferior superior
,007
-8,72
-1,13
,038
,19
8,95
,007
1,13
8,72
,000
5,84
13,16
,038
-8,95
-,19
,000
-13,16
-5,84
22
H0 :
H1 :
=0,05
23
1
2
Rangos
puntaje escritura
tipo de programa
general
acadmico
vocacional
Total
N
45
105
50
200
Rango
promedio
90,64
121,56
65,14
4
3
Estadsticos de contraste
Chi-cuadrado
gl
Sig. asintt.
a,b
puntaje
escritura
34,045
2
,000
a. Prueba de Kruskal-Wallis
b. Variable de agrupacin: tipo de programa
24
H0 :
H1 :
=0,05
1
5
2
Par 1
puntaje lectura
puntaje escritura
Media
52,23
52,78
N
200
200
Error tp. de
la media
,725
,670
Par 1
Desviacin
tp.
10,253
9,479
puntaje lectura y
puntaje escritura
Correlacin
200
Sig.
,597
,000
Media
Par 1
-,55
Desviacin
tp.
8,887
Error tp. de
la media
,628
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-1,78
,69
t
-,867
gl
Sig. (bilateral)
199
,387
25
Seleccionar la
estadstica
Para seleccionar
grficos diagnstico,
click en Grficos.
Segundo, click en el
Histograma
26
Histograma
60
50
40
30
Frecuencia
20
Desv. tp. = 9,48
10
Media = 52,8
N = 200,00
0
30,0
40,0
35,0
50,0
45,0
60,0
55,0
65,0
puntaje escritura
Pruebas de normalidad
a
puntaje escritura
Kolmogorov-Smirnov
Estadstico
gl
Sig.
,134
200
,000
Estadstico
,947
Shapiro-Wilk
gl
200
Sig.
,000
N
a,b
Parmetros normales
Diferencias ms
extremas
Media
Desviacin tpica
Absoluta
Positiva
Negativa
Z de Kolmogorov-Smirnov
Sig. asintt. (bilateral)
puntaje
lectura
200
52,23
puntaje
escritura
200
52,78
10,253
9,479
,105
,105
-,083
1,485
,024
,134
,068
-,134
1,900
,001
27
VD
VI
28
Factores inter-sujetos
SEXO
estus socioeconmico
0
1
1
2
3
Etiqueta
del valor
Hombre
Mujer
bajo
medio
alto
N
91
109
47
95
58
2
Pruebas de los efectos inter-sujetos
Variable dependiente: puntaje escritura
Fuente
Modelo corregido
Interseccin
SEXO
SES
SEXO * SES
Error
Total
Total corregida
Suma de
cuadrados
tipo III
2278,244a
473967,467
1334,493
1063,253
21,431
15600,631
574919,000
17878,875
gl
5
1
1
2
2
194
200
199
Media
cuadrtica
455,649
473967,467
1334,493
531,626
10,715
80,416
F
5,666
5893,972
16,595
6,611
,133
Significacin
,000
,000
,000
,002
,875
31
Prueba de Friedman
Se tiene una variable independiente y
una variable dependiente que no est
normalmente distribuida.
Hay diferencia entre los puntajes de lectura, escritura y matemticas?
Hiptesis nula: las distribuciones de los rangos de cada tipo de puntaje
(lectura, escritura, matemticas) son los mismos.
29
Rangos
puntaje lectura
puntaje escritura
puntaje mat.
Rango
promedio
1,96
2,04
2,01
Estadsticos de contrastea
N
Chi-cuadrado
gl
Sig. asintt.
200
,645
2
,724
a. Prueba de Friedman
30
H0 :
H1 :
1
80
70
60
50
40
puntaje ciencia
=0,05
30
20
30
40
puntaje mat.
50
60
70
80
2
Este tipo de diagrama presenta una imagen de la
relacin entre dos variables numricas.
En la grfica de la transparencia se observa un patrn
que indica una correlacin positiva, puesto que los
puntos suben a medida que nos movemos hacia la
derecha.
31
CORRELACIN
c) Relacin curvilnea
No existe relacin
32
Correlaciones
puntaje
puntaje mat. ciencia
Correlacin de Pearson
1
,631**
Sig. (bilateral)
.
,000
N
200
200
puntaje ciencia Correlacin de Pearson
,631**
1
Sig. (bilateral)
,000
.
N
200
200
puntaje mat.
Interpretacin del
coeficiente de correlacin
COEFICIENTE DE
CORRELACIN
INTERPRETACIN
0,20-0,35
0,35-0,65
0,65-0,85
0,85-1
33
H0 :
H1 :
=0,05
34
4
Coeficientesa
Modelo
1
Modelo
1
R
R cuadrado
,631a
,398
R cuadrado
corregida
,395
Error tp. de la
estimacin
7,702
ANOVAb
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
7760,558
11746,942
19507,500
gl
1
198
199
Media
cuadrtica
7760,558
59,328
F
130,808
Coeficientes
estandarizad
os
Beta
,631
t
5,378
11,437
Sig.
,000
,000
(Constante)
puntaje mat.
Coeficientes no
estandarizados
B
Error tp.
16,758
3,116
,667
,058
35
H0 :
H1 :
=0,05
Correlaciones
puntaje mat.
Rho de Spearman
puntaje mat.
puntaje ciencia
Coeficiente de
correlacin
Sig. (bilateral)
N
Coeficiente de
correlacin
Sig. (bilateral)
N
1,000
puntaje
ciencia
,640**
.
200
,000
200
,640**
1,000
,000
200
.
200
36
H0 :
H1 :
=0,05
37
ANOVAb
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
10756,924
7121,951
17878,875
gl
5
194
199
Media
cuadrtica
2151,385
36,711
F
58,603
Sig.
,000a
a. Variables predictoras: (Constante), SEXO, puntaje mat., puntaje cs. soc., puntaje
ciencia, puntaje lectura
b. Variable dependiente: puntaje escritura
Coeficientesa
Modelo
1
R
R cuadrado
,776a
,602
R cuadrado
corregida
,591
Error tp. de la
estimacin
6,059
(Constante)
puntaje lectura
puntaje mat.
puntaje ciencia
puntaje cs. soc.
SEXO
Coeficientes no
estandarizados
B
Error tp.
6,139
2,808
,125
,065
,238
,067
,242
,061
,229
,053
5,493
,875
Coeficientes
estandarizad
os
Beta
,136
,235
,253
,260
,289
t
2,186
1,931
3,547
3,986
4,339
6,274
Sig.
,030
,055
,000
,000
,000
,000
Los resultados indican que el modelo general es estadsticamente significativo (F=58,60, p=0,000.
Adems, todas las variables predictoras son estadsticamente significativas, excepto lectura.
38
VD
VI
covariable
Factores inter-sujetos
tipo de
programa
1
2
3
Etiqueta
del valor
general
acadmic
o
vocaciona
l
N
45
105
Fuente
Modelo corregido
Interseccin
LECTURA
PROG
Error
Total
Total corregida
Suma de
cuadrados
tipo III
7017,681a
4867,964
3841,983
650,260
10861,194
574919,000
17878,875
gl
3
1
1
2
196
200
199
Media
cuadrtica
2339,227
4867,964
3841,983
325,130
55,414
F
42,213
87,847
69,332
5,867
Significacin
,000
,000
,000
,003
39
,861
Chi-cuadrado
aproximado
gl
492,437
10
Sig.
,000
Comunalidades
puntaje lectura
puntaje escritura
puntaje mat.
puntaje ciencia
puntaje cs. soc.
Inicial
1,000
1,000
1,000
1,000
1,000
Extraccin
,736
,704
,750
,849
,900
40
Grfico de sedimentacin
4,0
3,5
3,0
2,5
2,0
1,5
Autovalor
1,0
,5
0,0
1
Nmero de componente
Componente
1
2
3
4
5
Autovalores iniciales
% de la
Total
varianza
% acumulado
3,381
67,616
67,616
,557
11,148
78,764
,407
8,136
86,900
,356
7,123
94,023
,299
5,977
100,000
puntaje lectura
puntaje escritura
puntaje mat.
puntaje ciencia
puntaje cs. soc.
Componente
1
2
,650
,559
,508
,667
,757
,421
,900
,198
,222
,922
41