Professional Documents
Culture Documents
LEI
Introduccin a la
Estadstica Educativa
Autores:
Dra. Marta Graciela del Valle Pece
M.Sc. Ing. Margarita Jurez de Galndez
Mg. Lic. Mara Mercedes Simonetti de Velazquez
PROGRAMA
UNIDAD I: Estadstica
Concepto. Etapas en el trabajo estadstico. Estadstica Descriptiva e
Inferencial. Variable: concepto. Clasificacin de variables. Series
simples. Agrupamiento de datos en series de frecuencias. Frecuencias
absolutas. Frecuencias relativas. Porcentajes. Frecuencias acumuladas,
frecuencias relativas acumuladas y porcentajes acumulados. Tasas de
uso comn: de escolarizacin, de analfabetismo, de desgranamiento, de
retencin.
de
variables
aleatorias
discretas:
CAPITULO I
UNIDADES I y II
INTRODUCCIN
La palabra Estadstica proviene del latn status (estado).
Precisamente la primera aplicacin de la estadstica consisti en la
recopilacin de datos y la construccin de grficos para describir el
estado de un pas. Con el correr del tiempo esta herramienta fue
evolucionando hasta que en la actualidad podramos decir que no hay
aspectos de la vida cotidiana donde no se aplique la Estadstica.
Hogares, gobiernos y negocios se apoyan en datos estadsticos para
dirigir sus acciones.
El objetivo que se persigue con este mdulo es proporcionar al
docente herramientas y tcnicas para obtener datos, procesarlos para
obtener informacin que sirva para la interpretacin correcta de
fenmenos que se producen en su mbito de trabajo.
ESTADSTICA. CONCEPTOS.
La Estadstica es una coleccin de mtodos para planear
experimentos, obtener datos, y despus organizar, resumir, presentar,
analizar, interpretar y llegar a conclusiones basadas en ellos (Triola,
2004).
Otra definicin considera a la Estadstica como una disciplina
perteneciente a la Matemtica Aplicada que se dedica al estudio
cuantitativo de fenmenos colectivos. Proporciona los mtodos para:
La recoleccin de datos
Su ordenamiento, resumen y presentacin,
Su anlisis e interpretacin y
Posterior enunciado de conclusiones.
Los cuatro pasos que se han enumerado constituyen las etapas del
trabajo estadstico.
Ejemplo. Una poblacin puede ser definida como los alumnos del
Jardn de Infantes Nio Jess del Barrio San Martn
de la ciudad de La Banda. Los alumnos pueden ser
listados e individualizados a travs de los registros
ulicos. Es un ejemplo de poblacin finita.
Datos
Variable
Categrica o
cualitativa
Escala
nominal
Escala
ordinal
Variable
numrica o
cuantitativa
Escala de
intervalo
Escala de
razn
.; x30
xi(cm):
70,75,74,87,92,89,72,83,84,79,98,99,95,87,84,85,79,78,95,99,97,84,8
6,78,74.
10
interpretados. Con los datos del ejemplo 1 se puede construir una tabla
de frecuencias.
Tabla de frecuencias. Una tabla de frecuencias para variable
cualitativa, es una tabla que asocia cada categora de la
variable con el nmero de veces que se repite la categora.
Tabla 1. Alumnos de Jardn de Infantes, de la Escuela San Francisco,
segn estado de salud. Ao 2004.
Categoras:xi
Frecuencias: fi
1
2
(Estado de salud)
Sano
Enfermo
Total
(n de alumnos)
24
6
30
f i = 30
observaciones, en ste caso 30 ( i =1
). Ntese que i ahora se
refiere a las categoras, x1 = Sano, f1 = 24;
x2 = Enfermo, f2= 6.
La tabla de frecuencias, es la ms sencilla de las tablas y es una
tabla de simple entrada pues los individuos se clasifican segn una
nica variable, estado de salud en el ejemplo.
Los datos organizados en tabla de simple entrada para variable
cualitativa, pueden presentarse mediante grficos, que tiene la
finalidad de que la informacin entre por los ojos. El grfico que puede
usarse en ste caso es el grfico de barras.
11
N de alumnos
30
25
20
15
10
5
0
Sanos
Enfermos
Estado de salud
12
Estado de salud
Enfermos
Sanos
10
15
20
25
30
N de alumnos
fi
24
+ 6
30
i = 1
y se
fi
fri =
fr
=1
i =1
13
xi
fi
(Estado de salud)
Sano
Enfermo
Total
fri
Porcentajes:
24
24/30=0,80
%
80
6/30=0,20
20
30
1,00
100
% 100
80
60
40
20
0
sanos
enfermos
Estado de salud
14
Sexo
fi
fri
360xfri
Varones
Mujeres
Total
(n de
alumnos)
15
25
40
0,38
0,62
1,00
137
223
360
38%
62%
Fuente:Datos ficticios
15
Variables cuantitativas.
Ejemplo: N de hermanos que tienen los alumnos de preescolar de la
escuela San Martn
xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0
Para el caso de variables cuantitativas discretas, la tabla de
frecuencias se construye de la siguiente manera: se ubica el valor
mayor y el menor valor de la variable (en el ejemplo 2 del n de
hermanos por alumno, el menor valor es cero y el valor mayor 6), se
colocan todos los valores correspondientes en la primera columna de la
tabla, y luego se cuentan las veces que se presentan dichos valores. La
tabla resultante es:
fi
5
5
6
3
4
3
4
30
Fi
5
10
16
19
23
26
30
fr
0,17
0,17
0,20
0,10
0,13
0,10
0,13
1,0
%
17
17
20
10
13
10
13
100
16
frecuencia
4
3
2
1
0
0
Nmero de hermanos
Interpretacin:
El nmero 6 en la columna de fi significa que 6 alumnos tienen 2
hermanos.
El nmero 19 en la columna Fi significa que 19 alumnos tienen 3
hermanos o menos.
El nmero 20 en la columna de porcentajes significa que el 20% de los
alumnos tienen 2 hermanos.
17
valor
log(n + 1)
log(2)
log(25 + 1)
= 4,7004 5 int ervalos
log(2)
18
a=
Rango
29
=
= 5 .8 6
n de int ervalos 5
19
6.- Una vez formadas las clases se procede al conteo, que consiste en
determinar el n de observaciones (frecuencias) de cada clase. Una
manera sencilla de hacerlo es leyendo la serie simple y ubicando
mediante marcas cada valor de la variable en su clase correspondiente.
De sta manera cuando se termine de pasar lista a la serie simple, el
agrupamiento ha sido efectuado.
cm)
75
80
85
90
95
100
xi
(marca de clase)
72,5
77,5
82,5
87,5
92,5
97,5
fi
fri
4
5
4
5
1
6
25
0,16
0,20
0,16
0,20
0,04
0,24
1,00
20
x1 =
Li1 + Ls1 70 + 75
=
= 72,5
2
2
x2 =
Li 2 + Ls 2 75 + 80
=
= 77,5
2
2
x 2 = x1 + a = 72,5 + 5 = 77,5
x3 = x 2 + a = 77,5 + 5 = 82,5
21
7
6
5
N alum.
4
3
2
1
0
70
75
80
85
90
95
100
Altura (cm)
Fuente:Datos ficticios
22
N de alumnos
6
5
4
3
2
1
0
65
70
75
80
85
90
95
100
105
Altura(cm)
30
20
25
26
25
22
26
28
31
35
80
65
68
75
72
68
74
80
82
85
23
Altura (cm)
100
80
60
40
20
25
30
35
40
Peso (kg)
N de inasist.
Mujeres
Varones
3
4
5
7
2
4
6
5
8
8
4
5
3
4
4
3
5
2
1
6
24
9
Mujeres
N de inasistencias
Varones
7
6
5
4
3
2
1
0
M
J
A
Meses
Barrios
A
400
200
300
900
B
500
200
400
1100
Total
C
200
50
100
350
1100
450
800
2350
25
26
1200
Empleada
Profesional
1000
N de alumnos
A. de casa
800
600
400
200
0
A
Lugar de residencia
500
N de alumnos
Empleada
400
300
200
100
0
A
Lugar de residencia
27
28
29
30
INDICES
El ndice es un indicador til tanto para fijar situaciones como para
hacer un diagnstico. Cuando interesa comparar los valores de una
caracterstica de la educacin (matrcula, asistencia de alumnos,
nmero de profesores, etc...) en el tiempo o en el espacio, ya sea
comparando dos valores entre s o todos con uno de ellos se puede
realizar un cociente cuyo resultado se denomina ndice simple.
Ejemplo: Se desea comparar la matrcula en preescolar de una ciudad
en el ao 2004 con la matrcula en el ao 1994. Si la primera es de
4000 alumnos y la de 1994 es de 2000, el ndice ser:
I 2004 / 1994 =
4000
=2
2000
I 1994 / 1994 =
2000
=1
2000
Con frecuencia se multiplica por 100 los ndices con lo que entonces los
ndices son los porcentajes correspondientes siendo 100 el porcentaje
del ndice base.
N alumnos matriculados
Poblacin en edad escolar
I=
1272
= 0.39
3229
31
I=
N alumnos
N maestros
I=
300
= 20
15
N analfabetos de 15 aos y ms
*100
Poblacin de 15 aos y ms
I=
31625
*100 = 5.53%
571546
Ta =
32
Ta =
405
* 100 = 15%
15 *180
Tasa de desgranamiento
Es la proporcin de alumnos ingresados al primer grado (o curso) que
no lograron culminar todos los grados (o cursos) correspondientes al
nivel, en el perodo establecido.
Td =
Td =
337292
= 0,46
729048
Tr =
33
Tr =
391756
= 0,5374
729048
Tasa de escolarizacin
Proporcin de la poblacin en edad escolar que est efectivamente
escolarizada
Ez =
N de alumnos matriculados
*100
Poblacin en edad escolar
I=
237708
*100 = 33,63%
706794
34
GUA DE EJERCITACIN
Actividad 1
Clasifique en base al siguiente listado las variables socio educativas, en
cualitativas nominales u ordinales y cuantitativas discretas o continuas
Variable
Tipo
1-
Religin
2-
3-
Barrios
4-
5-
6-
Sexo
7-
N de inasistencias mensuales
8-
9-
Lugar de nacimiento
10-
11-
Horas de juego
12-
13-
14-
Grado de
asignatura
15
16
17
Categoras de escuela
satisfaccin
por
la
35
Actividad 2
Los siguientes datos corresponden a N de
inasistencias de los
alumnos de una seccin de Jardn de Infantes correspondientes al
primer cuatrimestre:
xi :
8
6
9
5
5
7
4
7
3
5
5
2
4
5
0
7
2
3
8
6
5
9
6
4
4
7
5
9
4
2
1
4
10
6
1
5
6
4
4
3
Actividad 3
A los padres de 50 alumnos de seccin de 5 aos de Jardn de Infantes
de un establecimiento de la Capital de la Pcia. de Sgo. del Estero, se les
distribuy un cuestionario con la finalidad de determinar la actitud de
los mismos ante el desempeo de los docentes. Una de las preguntas
estaba referida al grado de conformidad sobre el desarrollo de
actividades ldicas.
Los resultados obtenidos fueron los siguientes:
xi:
MC
I
MC
C
C
MD
MC
D
MD
MC
C
I
MC
MC
D
I
MC
D
I
MD
C
D
MC
C
MC
MC
MC
D
MC
I
D
MD
MD
MC
D
D
C
I
D
MC
MC
D
C
C
I
MC
C
C
MC
MC
36
Donde:
MC: muy conforme
C: conforme
I: indiferente
D: disconforme
MD: Muy disconforme
a) Indique el tamao de la muestra
b) Ud. debe representar al establecimiento en una reunin de
docentes en la que participan distintos Colegios de la Capital.
Como presentara la opinin de los padres?
c) Que ttulo colocara a la presentacin?
d) Incluya en la misma frecuencias relativas y porcentajes
correspondiente a cada valor de la variable.
e) Presente esos mismos resultados con un grfico de barras
simples.
f) Indique si corresponde calcular frecuencia acumulada. En el caso
de respuesta afirmativa obtenga dicha frecuencia.
g) Analice los resultados obtenidos
Actividad 4
En un estudio realizado en el Jardn de infantes de la Escuela Normal
de la ciudad de La Banda para determinar la zona de influencia del
mismo segn el lugar de residencia de los alumnos, los resultados
obtenidos fueron los siguientes:
Alumnos del Jardn de Infantes de la Escuela Normal de La ciudad de
La Banda segn el barrio en el que residen.
Barrios
Barrio
Barrio
Barrio
Barrio
Total
San Martn
Villa Rosita
Menndez
Mercantil
Nmero
alumnos
100
80
40
20
240
de
37
30
47
36
46
49
52
46
45
38
45
61
34
37
46
48
56
31
39
48
41
31
31
29
31
43
34
29
60
45
43
32
38
64
37
29
33
43
34
47
44
49
53
35
62
32
45
47
37
40
54
60
54
38
36
39
41
44
30
55
37
60
56
58
Total
3320
7399
14448
Sexo
Varones
Mujeres
1654
1666
3605
3794
7207
7281
38
Actividad 7
Utilice un grfico lineal para mostrar la evolucin de egresados del
Polimodal.
Ao
1980
1985
1990
1995
2000
N de
egresados
233
278
321
375
391
FUENTE: Datos ficticios
Actividad 8
En base a los datos de la siguiente tabla:
Poblacin en edad escolar, N de alumnos matriculados y N de
maestros correspondiente a cuatro lugares de la Repblica Argentina.
Lugar
Poblacin en
edad escolar
A
B
C
D
300000
150000
25000
160000
N de
N de
alumnos
alumnos no
matriculados matriculados
248.000
106.000
24.000
142.000
N de
maestros
7.000
4.000
1.200
4.750
39
Actividad 9
Dada la siguiente tabla, calcule la tasa de retencin y el desgranamiento
de cada cohorte y en base a los resultados realice el anlisis
correspondiente
Retencin y Desgranamiento de la Escuela Primaria. Su evolucin en 3
ciclos escolares del perodo 1964-1980.
Ciclo Escolar
1964 - 1970
1969 - 1975
1974 - 1980
Alumnos matriculados
1er Grado
7 Grado
723.264
321.940
751.049
375.723
729.048
391.756
40
Provincia
Total
Capital
Banda
Ro
Hondo
Copo
Poblacin
de 10 aos
y ms
607.782
191.311
97.689
38.435
Total
571.067
186.724
92.937
34.962
Condicin de alfabetismo
Alfabetos
Analfabetos
Varones
Mujeres
Total
Varones Mujeres
284.309
286.758
36.715
19.030
17.685
87.894
98.830
4.587
2.299
2.288
45.066
47.871
4.752
2.461
2.291
17.361
17.601
3.473
1.960
1.513
19.241
17.264
9.156
8.108
1.977
948
1.029
41
CAPTULO II
UNIDAD III
MEDIDAS DE POSICIN Y DISPERSIN
INTRODUCCIN
En todo trabajo estadstico luego de recolectar los datos,
ordenarlos, agruparlos en tablas y presentarlos grficamente,
es
preciso extraer alguna informacin que caracterice a la poblacin de la
cual se los extrajo.
Por ello, el objetivo de ste captulo es interiorizarlos acerca de las
medidas de posicin y, variacin ms utilizadas para caracterizar a la
poblacin en estudio, y en que caso se emplea cada una de ellas,
interpretando los resultado a travs del pensamiento crtico.
Los mtodos de ste captulo suelen denominarse mtodos de
estadstica descriptiva, porque su objetivo es resumir o describir las
caractersticas importantes de un conjunto de datos. stas
caractersticas se refieren al centro, variacin, distribucin, datos
distantes y cambios a travs del tiempo.
1. MEDIDAS DE POSICIN
Supongamos que una directora est preocupada por las
inasistencias de los alumnos del jardn bajo su direccin. Necesita
resumir los datos y dar un nico valor sencillo y representativo que
pueda servir de referencia para todos los alumnos; esta medida que
sirve para ubicar el conjunto de datos en una escala de medicin, se
denominan Medidas de Posicin, y si adems indican el centro de se
conjunto de valores, se denominan Medidas de posicin y tendencia
central.
Se conocen varias formas de determinar el centro de un conjunto de
datos. A continuacin, se indicarn tres que son las ms comnmente
utilizadas: media aritmtica, mediana y modo.
42
0 + 16 + 12 + 5 + 7 x1 + x 2 + x3 + x 4 + x5
=
=
x=
5
5
i =1
x=
i =1
2.1
43
i =1
2.2
tamao de la poblacin
x=
x
i =1
0 + 16 + 12 + 5 + 7 40
=
=8
5
5
44
(d ) = (x
i
x =0
xi
0
5
7
12
16
Total
d i = xi x
0 8 =-8
5 - 8 =-3
7 - 8 =-1
12 8 = 4
16 8 = 8
0
Ejemplo 2
X = inasistencias de alumnos
xi : 0; 66; 12; 5; 7
alejndose el promedio
x ==
x
i =1
0 + 66 + 12 + 5 + 7 90
=
= 18
5
5
45
1. 2 Mediana.
La mediana (de un conjunto de datos): es una medida de tendencia
central que divide a la serie ordenada de datos en dos partes iguales. La
mediana se designa con Me, es un valor de variable que expresa que el
50% de los datos son menores o iguales a la mediana y el otro 50%
mayores o iguales a ella.
n +1
2
46
5 +1 6
= =3
2
2
Este valor nos indica que el valor de la mediana esta ubicado en el
tercer lugar:
0; 5; 7; 12; 66.
Me = 7 inasistencias
Ejemplo 4
En el caso de que n sea par
X = inasistencias de alumnos
xi : 0; 66; 12; 5; 7;10
6 +1 7
= = 3,5
2
2
Los valores centrales son dos y ocupan el tercer y cuarto lugar, como la
mediana es un nico valor se la obtiene como el promedio de esos dos
valores centrales:
47
0; 5; 7; 10; 12; 66
Me =
7 + 10
= 8,5 8
2
1. 3. Modo.
El Modo es el valor de la variable que ocurre con mayor frecuencia. Se
designa frecuentemente como Mo.
Se debe hacer notar aqu que el Mo es un valor de variable y la
frecuencia de este valor sugiere su importancia estadstica.
Cuando dos valores ocurren con la misma frecuencia y sta es la ms
alta, ambos valores son modas, por lo que el conjunto de datos es
bimodal.
Cuando ms de dos valores ocurren con la misma frecuencia y sta es
la ms alta, todos los valores son modas, por lo que el conjunto de
datos es multimodal.
Cuando ningn valor se repite, se dice que no hay moda.
48
Ejemplo 5.
Calcule las modas para los siguientes conjuntos de datos:
Serie A: 4,5; 7,6; 2,8; 4,5; 3,6; 2,6
Serie B: 4; 5; 3; 4; 6; 8; 5
Serie C: 27; 27; 27; 55; 55; 55; 88; 88; 99
Serie D: 1; 2; 3; 6; 7; 8; 9; 10
Solucin:
En la serie A. El nmero 4,5 es la moda pues es el valor que ocurre
con mayor frecuencia (2 veces).
En la serie B. Los nmeros 4 y 5 son modas, ya que ambos ocurren
con la frecuencia ms alta (2 veces).
En la serie C. Los nmeros 27 y 55 son modas, ya que ambos ocurren
con la frecuencia ms alta (3 veces).
En la serie D. No hay moda, ya que ningn valor se repite.
La moda puede determinarse en variables cuantitativas continuas y
discretas, en variables cualitativas ordinales y nominales, pero es la
nica medida de posicin y tendencia central que puede usarse cuando
se trata de variables cualitativas nominales.
Ejemplo 6.
Una encuesta efectuada a los padres de los alumnos del jardn sobre la
actitud de los nios al concurrir a su jardincito mostr que el 100
concurren contentos al jardn; 76 concurren protestando; 39 concurren
llorando. La nica medida que disponemos para resumir estos datos en
un nico valor es el modo. El valor modal de la actitud es concurren
contentos.
No podemos calcular la media por que no se pueden sumar los valores
de la variable que son: contentos, protestando, llorando; tampoco
podemos calcular la mediana pues no podemos ordenar los valores, de
49
Ejemplo 7
La profesora de nivel inicial esta interesada en conocer el nmero
promedio de hermanos que tienen sus alumnos. Para ello toma la ficha
de 25 alumnos y ordena los datos de inters en la tabla 1.
N de alumnos
(xi)
0
1
2
3
4
Total
(fi)
1
9
7
5
3
25
Fuente: Datos ficticios
50
xi: n de hermanos
fi : nmero de alumnos que poseen xi hermanos
25
x ==
i =1
25
x=
xi f1 + x 2 f 2 + ... + x5 f 5
f1 + f 2 + ... + f 5
x=
1 n
xi f i
n i =1
N de alumnos
xi*fi
(xi)
0
1
2
3
4
Total
(fi)
1
9
7
5
3
25
0
9
14
15
12
50
Fuente: Datos ficticios
51
1.2.b. Mediana
El clculo del valor mediano del n de hermanos que poseen los
alumnos de nivel inicial de una escuela rural, se realiza de la siguiente
manera, cuando los datos estn presentados en una serie de
frecuencias (tabla 3).
En esta serie de frecuencias de variable cuantitativa discreta, los
datos ya estn ordenados, por lo que solo resta encontrar el valor
central, cuya posicin se encuentra en el lugar
n + 1 44 + 1 45
=
=
= 22,5
2
2
2
Tabla 3. Alumnos de la primera seccin del Jardn de una escuela
rural, clasificados segn el nmero de hermanos.
N de hermanos
(xi)
2
3
4
5
Total
N de
alumnos
(frecuencia,
fi)
5
5
30
4
44
Fuente: Datos ficticios
52
N de
alumnos
(xi)
(frecuencia,
fi )
2
3
4
5
Total
5
5
30
4
44
Frecuencias
acumulada
(Fi)
5
10
40
44
Fuente: Datos ficticios
n + 1 44 + 1 45
=
=
= 22,5
2
2
2
donde n = tamao de la muestra
Como el valor de la mediana se encuentra entre la posicin 22 y la
posicin 23, se busca en la columna de frecuencias acumuladas, el
menor valor que contiene a 22 (es 40), al que corresponde el valor de
variable 4 y el menor valor que contiene a 23 (es 40), al que
corresponde el valor de variable 4.
Por lo que el valor mediano es el promedio de los dos valores centrales.
Me =
4+4
=4
2
53
1.3.b. Moda
Ejemplo: Calcular el valor ms frecuente del nmero de hermanos
alumnos de nivel inicial de del Jardn de una escuela rural (Tabla 3).
Solucin: La variable que se estudia es una variable cuantitativa
discreta.
Se busca en la columna fi el valor ms alto, en este ejemplo es 30.
El valor de la moda es el valor de la variable que tiene frecuencia 30, es
decir
Mo = 4 hermanos
Interpretacin: La mayora de los alumnos de alumnos de nivel inicial
de del Jardn de una escuela rural poseen cuatro hermanos.
1.c. Variable agrupada en serie de frecuencias con intervalos de
clase, para variable aleatoria continua
N de
alumnos
Marca de
clase
fi
12
19
7
6
6
50
xi
11
13
15
17
19
xi * fi
132
247
105
102
114
700
54
Solucin
1.- Se calcula las marcas de clase.
Al organizar de esta forma los datos, se pierde informacin, pues la
tabla indica, por ejemplo que hay 12 alumnos que pesan entre 10 kg y
12 kg, pero no cuanto pesan realmente cada uno de ellos. Ahora
debemos encontrar un nico valor que represente o resuma a todos los
valores del intervalo, ese valor es el promedio o media aritmtica de los
lmites del intervalo, a este promedio se lo denomina punto medio de la
clase o marca de clase. Este valor representar el valor xi de la frmula
de la media.
x1 =
10 + 12
= 11
2
x2 =
12 + 14
= 13 = xi + a = 11 + 2 = 13
2
x=
1 n
xi f i
n i =1
fi
x=
1 n
1
xi f i =
* 700 = 14kg
n i =1
50
55
f
Me = L inf +
Fant Me
f Me
*a
ant Me
N de
alumnos
(kg)
10 a 12
12 a 14
14 a 16
16 a 18
18 a 20
Total
fi
12
19
7
6
6
50
56
Solucin
1-En la tabla se agrega una columna en la cual se calcula los valores de
frecuencias acumuladas.
Peso de los alumnos del Jardn de una escuela rural.
Intervalo
N de alumnos
Fi
(kg)
10 a 12
12 a 14
14 a 16
16 a 18
18 a 20
Total
fi
12
19
7
6
6
50
12
31
38
44
50
2-
Se calcula
f
2
50
= 25
2
f
Me = L inf +
Fant Me
f Me
*a
50
12
25 12
13 * 2
2
Me = 12 +
* 2 = 12 +
* 2 = 12 +
= 12 + 1,37 = 13,37
19
19
19
Interpretacin:
El 50% de los alumnos pesan 13,37 kg o menos.
57
1.3.c. Moda
Ejemplo
Se desea conocer el peso ms frecuente de los 50 alumnos de una
escuela rural. El clculo del modo en serie de frecuencias para variable
cuantitativa continua se efecta utilizando la siguiente frmula
Mo = Linf Mo +
D1
*a
D1 + D2
Donde:
D1 = f Mo f anterior a la clase
Modal
Solucin
En la columna fi se busca el valor ms alto, en nuestro ejemplo 19, se
seala la fila, ella constituye la clase modal.
Se calcula:
D1 = 19 12 = 7
D2 = 19 7 = 12
a = 14 - 12 = 2
Se aplica la frmula
Mo = 12 +
7
7
14
* 2 = 12 + * 2 = 12 + = 12,74kg
12 + 7
19
19
58
= Me=Mo
Figura 1. Distribucin simtrica.
Cuando esa coincidencia no existe, se dice que la distribucin unimodal
es asimtrica.
La asimetra es positiva (figura 2) cuando la media es mayor que la
mediana y la mediana mayor que el modo, en ste caso vemos que la
media aritmtica se dirige hacia el o los valores extremadamente
grandes
Mo < Me <
59
< Me< Mo
2- MEDIDAS DE LOCALIZACIN
Son Medidas de Posicin que dividen los valores ordenados de una serie
en cuatro, diez o cien partes iguales y se denominan cuartiles, deciles y
percentiles.
2.1 Cuartiles
Los cuartiles son tres valores Q1, Q2, Q3,
ordenada en cuatro partes iguales.
Por debajo del primero quedan el 25% de los datos; por debajo del
segundo el 50% de los mismos y por debajo del tercero el 75%. El
segundo cuartil coincide con la Mediana.
60
2.2 Deciles
Los Deciles son nueve valores de la variable que dividen a la serie
ordenada de datos en 10 partes iguales, el decil 5 coincide con la
Mediana, es decir el 50% de los valores son menores o iguales al D5.
2.3 Percentiles
Los percentiles son 99 valores de la variable, que dividen al conjunto de
datos (ordenados de menor a mayor en cien partes iguales); el percentil
50 coincide con la mediana. El percentil 25 coincide con el primer
cuartel, el percentil 75 coincide con el valor del tercer cuartel. Los
percentiles se designan con la letra Pi, el subndice i, vara de 1 a 99,
indicando el valor del percentil, que se desea calcular.
9 Clculo de percentiles:
Para calcular los percentiles de una distribucin de frecuencias se
procede del mismo modo que en el caso de la mediana, salvo que ahora
n= fi
en cien partes iguales en
dividiremos al tamao de la muestra
vez de dos.
Ejemplo
Se desea conocer P20 de los das de licencia solicitadas por los
profesores de las escuelas de nivel inicial en la ciudad de Santiago del
Estero en el ao 2004.
Tabla 6. Das de inasistencia de los profesores de las escuelas de nivel
inicial en la ciudad de Santiago del Estero en el ao 2004.
Intervalo de clase
N de docentes
Fi
(das de licencia)
0 a 10
10 a 20
20 a 30
30 a 40
40 a 50
50 a 60
60 a 70
70 a 80
80 a 90
90 a 100
Total
(fi)
30
60
60
70
90
100
60
40
10
10
530
30
90
150
220
310
410
470
510
520
530
61
inf
Fant Pi
f Pi
*a
Solucin
Clculo del percentil 20
Pasos
1.- Se agrega una columna de frecuencias acumuladas (Fi)
2.- Se calcula
i fi
100
20 * 530
= 106
100
P20 = 20 +
106 90
16 *10
*10 = 20 +
= 22,67 23 das
60
60
62
Interpretacin
P20 = 23 das
El 20 % de los docentes toman 23 das de licencia o menos
9 Rango percentil
Se puede presentar, el problema inverso, es decir, conocer cuntos
profesores de nivel inicial toman 52 das de licencia o menos, es decir
nos dan como dato un valor de la variable y nos preguntan que
percentil le corresponde; a este procedimiento se lo denomina calcular
el Rango percentil.
Es decir el rango percentil de un valor dado es el porcentaje de valores
comprendidos debajo del valor solicitado.
Ejemplo:
Calcular el rango percentil que le corresponde a 52 das de licencia de
los de los profesores de las escuelas de nivel inicial en la ciudad de
Santiago del Estero en el ao 2004.
Repetimos la tabla 6 para visualizar mejor el clculo.
Das de inasistencia de los profesores de las escuelas de nivel inicial en
la ciudad de Santiago del Estero en el ao 2004.
Intervalo de clase
N de docentes
Fi
(das de licencia)
0 a 10
10 a 20
20 a 30
30 a 40
40 a 50
50 a 60
60 a 70
70 a 80
80 a 90
90 a 100
Total
(fi)
30
60
60
70
90
100
60
40
10
10
530
30
90
150
220
310
410
470
510
520
530
63
Solucin
1.- Ubicamos en la tabla el intervalo de clase donde se encuentra el
valor 52 es el intervalo que va de 50 a 60.
2.- Se calcula la Frecuencia acumulada que le correspondera al valor
52 con la siguiente frmula:
F ( xi ) =
( xi Linf )
* f int erv + FClase anterior
a
Donde:
F(xi)=
Linf
finterv
F (52) =
(52 50)
2 *100
*100 + 310 =
+ 310 = 330
10
10
Rp =
F ( xi )
*100
fi
330
* 100 = 62.26% 62%
530
Interpretacin:
El 62% de los los profesores de las escuelas de nivel inicial en la ciudad
de Santiago del Estero en el ao 2004, toman 52 das de licencia o
menos.
64
N de
docentes
(das de
licencia)
0 a 10
10 a 20
20 a 30
30 a 40
40 a 50
50 a 60
60 a 70
70 a 80
80 a 90
90 a 100
Total
(fi)
30
60
60
70
90
100
60
40
10
10
530
fri
Porcentaje
fri*100
0,0566
0,1132
0,1132
0,1321
0,1698
0,1887
0,1132
0,0755
0,0189
0,0189
5,67= 6
11,32 = 11
11,32 = 11
13,21 = 13
16,98 = 17
18,87 = 19
11,32 = 11
7,55 = 8
1,89 = 2
1,89 = 2
100
Porcentaje
acumulado
6
17
28
41
58
77
88
96
98
100
65
100
90
80
70
60
50
40
30
20
10
0
0
10
20
30
40
50
60
70
80
90
100
Das
Interpretacin:
El 20 % profesores de las escuelas de nivel inicial en la ciudad de
Santiago del Estero en el ao 2004 incurren en 23 das de licencia o
menos.
6.-Si deseamos conocer cual es el rango percentil que corresponde a 52
das, ubicamos ese valor en el eje horizontal y trazamos una paralela al
eje vertical hasta la curva y desde all una paralela al eje horizontal,
leemos en el eje vertical el valor correspondiente al rango percentil
(aproximadamente 60).
66
100
90
80
70
60
50
40
30
20
10
0
0
10
20
30
40
50
60
70
80
90
100
Das
67
Estas series tienen igual valor del rango, a pesar de que notamos que la
variabilidad de las dos distribuciones es diferente.
La desventaja de esta medida es que solo considera los valores extremos
sin tener en cuenta el comportamiento del resto de las observaciones.
Por lo que observamos que a pesar de tener variabilidades diferentes las
dos distribuciones, el rango no la capta.
Para solucionar este problema surgen otras medidas como el desvo
medio.
Si se considera las distribuciones anteriores:
Distribucin A: 1, 5, 5, 5, 5, 5, 5, 5, 5, 9
Distribucin B: 1, 1, 2, 4, 5, 6, 7, 7, 8, 9
Cmo se puede medir la variabilidad de un conjunto de datos? Si por
variabilidad se entiende el grado en que los valores de la distribucin
difieren de la media y entre si, entonces la desviacin promedio de los
valores a partir de la media puede resultar una medida razonable de
variabilidad
(x
68
3.a.2.DESVIO MEDIO:
Se define como el promedio del valor absoluto de los desvos; se
designa con
DM.
DM =
d
n
di=
xi x
-4
0
0
0
0
0
0
0
0
4
(d i ) = 0
di
4
0
0
0
0
0
0
0
0
4
di = 8
DM =
8
= 0,8
10
69
(x x )
n
S2 =
i =1
n 1
Varianza poblacional
n
2 =
(x )
i =1
di= xi x
-4
0
0
0
0
0
0
0
0
4
(d i ) = 0
1
5
5
5
5
5
5
5
5
9
xi = 50
x=5
d12 = xi x
(x
S2 =
16
0
0
0
0
0
0
0
0
16
x = 32
32
= 3,56
9
(x x )
n
S2 =
i =1
n 1
32
= 3,56
9
70
(x x )
n
S=
i =1
n 1
(x x )
n
S=
i =1
n 1
32
= 3,56 = 1,89
9
S = 2 hermanos
(x )
i =1
71
N de
alumnos
(xi)
11
12
14
15
23
Total
(fi)
12
9
5
4
2
32
DM =
d * f x x *f
f
f
i
Clculo:
1) Se calcula la media aritmtica
2) Se calculan los desvos
3) Se obtiene el valor absoluto y se los multiplica por sus
frecuencias
4) Se aplica la frmula
72
Inasistencias de 32 alumnos.
N de
inasistencias
N de
alumnos
(xi)
11
12
14
15
23
(fi)
12
9
5
4
2
32
xi*fi
d i = xi x
d1
di * fi
132
108
70
60
46
416
-2
-1
1
2
10
2
1
1
2
10
24
9
5
8
20
66
x=
x * f
f
i
416
= 13
32
d *f
f
i
66
= 2,06
32
DM= 2 das
3.b.3. Varianza en serie de frecuencia simple
(x x )
n
S =
2
i =1
n 1
(x x ) f
=
f 1
n
fi
i =1
73
Inasistencias de 32 alumnos.
N de inasistencias
N de alumnos
xi*fi
d i = xi x
d i2
d i2 * f i
(xi)
11
12
14
15
23
(fi)
12
9
5
4
2
32
132
108
70
60
46
416
-2
-1
1
2
10
4
1
1
4
100
48
9
5
16
200
278
(x x )
n
S =
2
i =1
fi
n 1
278
278
=
= 8,97 9 das 2
32 1 31
(x x ) * f
n
S=
(x x ) * f
n
S=
i =1
i =1
i =1
n 1
(x x ) * f
f 1
n
n 1
278
278
=
= 8,97 = 2,99 3 das
32 1
31
Marca de
clase
N
de
alumnos
(xi)
11
13
15
17
19
fi
12
19
7
6
6
50
Fuente: Datos ficticios
74
3.c.1.Rango
R = L. superior de la ltima clase L. inferior de la primera clase.
Como los lmites superiores de las clases son abiertos, es decir no toma
el valor 20, debemos colocar el valor 19,99
R =19,99 6 = 13,99 kg
3.c.2. Desvo medio en serie de frecuencia de intervalos
1) Se calcula la marca de clase y luego la media aritmtica
x=
x * f
f
i
700
= 14kg
50
Intervalo
(kg)
N
de xi*fi
alumnos
(xi)
11
13
15
17
19
10 a 12
12 a 14
14 a 16
16 a 18
18 a 20
Total
fi
12
19
7
6
6
50
d i = ( xi x)
d1
d1
-3
-1
1
3
5
3
1
1
3
5
36
19
7
18
30
110
132
247
105
102
114
700
*fi
d * f
f
i
110
= 2,2kg
50
75
Intervalo
(kg)
(xi)
11
13
15
17
19
10 a 12
12 a 14
14 a 16
16 a 18
18 a 20
Total
N
de xi*fi
alumnos
fi
12
19
7
6
6
50
132
247
105
102
114
700
d i = ( xi x)
d i2
d i2 *
fi
-3
-1
1
3
5
9
1
1
9
25
108
19
7
54
150
338
(x x )
n
S =
2
i =1
n 1
fi
338
338
=
= 6,9 kg 2
50 1 49
(x x ) * f
n
S=
i =1
n 1
176
338
=
= 6,9 = 2,63kg
50 1
49
76
COEFICIENTE DE VARIACIN
Las cuatro medidas de variabilidad enunciadas precedentemente son
medidas de variabilidad absoluta. El coeficiente de variacin es una
medida de variabilidad relativa.
Expresa la desviacin estndar como un porcentaje de la media. Es una
medida adimensional, se expresa en % y sirve para comparar la
variabilidad entre dos o ms distribuciones que provengan de diferentes
unidades de medidas o teniendo igual unidad de medida los valores de
diferente magnitud.
C.V . =
S
100
x
Ejemplo
Decir cual de las siguientes distribuciones es ms variable:
xi: peso de los alumnos de nivel inicial (kg)
34 29 28 31 40
yi: altura de los alumnos de nivel inicial (m)
1,24 1,54 1,38 1,37 1,56
x = 32,4 kg Sx = 4,83kg
y =1,42 m
Sy = 0,13m
77
78
n1
presione = y en su pantalla aparecer el valor1,58
Si aprieta ahora la tecla x2 obtendr 2,50 que es el valor de la varianza
muestral S2.
Cuando se trabaja con todos los datos de una poblacin para el clculo
de la desviacin estndar se aprieta SHIFT y la tecla 2
79
GUA DE EJERCITACIN
Actividad 1
a) Los siguientes son pesos individuales de 10 alumnos de la segunda
seccin de Jardn en kg:
20; 22; 20,5; 21; 23; 21; 22,9; 24; 24,6; 25
b) En la etapa de diagnstico destinada a implementar un Plan de Salud
Bucal en alumnos de jardn de Infantes, en una jardn municipal, el
odontlogo determin el nmero de caries que presentaba una muestra
de nueve alumnos, las que figuran a continuacin
2; 4; 0; 2; 3; 5; 1; 2; 2
c) De la ficha de los alumnos de la primera seccin se tom ocho fichas
al azar y se anot el salario que perciba mensualmente sus padres. Los
mismos figuran a continuacin:
3000; 1000; 570; 400; 600; 1500; 500; 570.
1.- En cada ejemplo
a) indique la variable en estudio
b) Clasifique la variable
c) Indique el tamao de la muestra
d) Identifique la unidad de muestreo
e) Indique la poblacin en estudio
2.- Cmo se denomina el conjunto de datos escritos en el orden en que
fueron medidos, observados o contados obtenidos para la variable que
se estudia?
3.- Que medidas de posicin y tendencia central utilizara para
resumir los datos de los ejemplos a, b, y c? Calcule e interprete los
mismos.
4.- En cul de los tres casos arriba detallados, la media aritmtica no
es adecuada para indicar el centro del conjunto? Justifique la
respuesta.
80
Actividad 2
a) Para cada una de las series de e la Actividad 1. Indique las medidas
de dispersin o variabilidad que puede utilizar. Calcule.
b) Si Ud. quiere comparar la variabilidad de los pesos de los nios con
la variabilidad del ingreso de los padres presentadas en la Actividad 1,
que medida de dispersin empleara? Justifique la respuesta,
Actividad 3
Se desea comprar libros de cuentos para la escuela, los que
clasificados de la siguiente manera.
Libros
Ficcin
Para pintar
Para reconocer objetos
fueron
Cantidad de
libros
150
200
70
Actividad 4
Los siguientes datos corresponden a Tipo de juego que prefieren los
alumnos del jardn
Tipo de Juego
N de alumnos
Tobogn
Rompecabezas
El rincn de la casita
El rincn del carpintero
Ftbol
fi
30
10
80
60
30
81
Actividad 5
Clasificacin de los alumnos segn el nmero de comidas por da
N de comidas
xi
N de alumnos
10 23
fi
Actividad 6
Las alturas de alumnos de la primera seccin del jardn se muestran en
la siguiente tabla:
Altura de los alumnos de la primera seccin del jardn en metros
altura(m)
1,10 - 1,12
1,12 - 1,14
1,14 - 1,16
1,16 - 1,18
1,18 - 1,20
1,20 - 1,22
fi
2
5
10
8
2
4
82
83
CAPTULO III
UNIDAD IV
1.- INTRODUCCIN
84
85
4.1.-EXPERIMENTOS
EVENTOS.
frecuencial y axiomtico de la
ALEATORIOS.
ESPACIO
MUESTRAL.
86
9 Para el caso
resultante es:
M={C, S}
9 Para
el caso de arrojar una moneda y un dado
simultneamente, el espacio muestral resultante es:
M = (cara, 1) , ( cara , 2 ) .....,(cara , 6) , (sello , 1),...(sello, 6)
87
Ejemplos
9 Para el caso de arrojar un dado. Obtener el nmero 1, es un
evento simple, lo mismo ocurre con los nmeros restantes
e={1}
e={2}
P={2, 4, 6}
88
A={1, 2,3}
89
A= {2, 4, 6}
A = {1, 3, 5 }
Ejemplo:
Un experimento consiste en tirar un dado y observar el nmero de
puntos que aparece en la cara superior. El espacio muestral se puede
describir fcilmente, ya que es finito. Las posibilidades para el dado son
seis: 1, 2, 3, 4, 5, 6. Por lo tanto, los posibles resultados son:
M = {1, 2, 3,4, 5, 6}
b) Describir los siguientes eventos:
A: Sale un nmero par.
B: Sale un nmero impar.
C: Sale un nmero menor que 4
D: Sale un nmero mayor que 3.
E: Sale un nmero impar o mayor que 3.
F. Sale un nmero par y menor que 4.
G: Sale un nmero par y un impar.
90
Solucin
El evento:Sale un nmero par , est representado por
la letra A, su descripcin puede realizarse mediante el
siguiente conjunto :
A = {2,4,6} ,
91
P ( A) =
N de casos favorables a A
N total de casos igualmente posibles
9 Por ejemplo, la probabilidad de extraer el as de espada de una
baraja ordinaria de 52 cartas es 1/52.
9 Pero la probabilidad de sacar un as de espada rojo es cero
(puesto que no hay figuras de espadas rojas en la baraja) no
hay sucesos posibles que favorezcan este resultado.
9 Si los eventos son mutuamente excluyentes (esto es, si los
dos eventos no pueden ocurrir simultneamente), pues A B
= , la P ( ) = 0
92
P(As)
f (As)
= f r(As)
P( E ) 0 la probabilidad es positiva y
0 P( E ) 1
1.
2.- Al espacio muestral M completo le corresponde
P(M)=1
3.- Si E1 y E2 son eventos mutuamente exclusivos y E1E2=, entonces
se cumple
P (E1 E 2) = P (E1 ) + P (E
P (E1 E 2 ) = P ( E1 ) + P ( E
) +
93
4.5. PROPIEDADES:
1.- Si
P ( E ) = 1 P( E )
94
95
donde:
96
P(CP)=P(C)+P(P)- P(CP)
P (C P ) =
6 6 3
9 3
+ =
= = 0,75
12 12 12 12 4
P ( B / A) =
P(A B )
P ( A)
97
P( A / B) =
P(A B )
P (B )
Solucin :
En este caso M = 1, 2 , 3 , 4 , 5 , 6
C = 1 , 2 , 3 , D = 4 , 5 , 6 , P( D ) = 3 / 6 = 1 /2 , P( C ) =
0
P(C/D)= 0/ =0
98
P( D )= 3 / 6 = 1 / 2
P ( B D ) = 1/6
P ( B / D = P( B D ) / P( D ) = 1/6 / 12 = 1/3
P (A /B)=P(A).
99
Al lanzar un dado:
M=1, 2, 3, 4, 5, 6
A: nmero par
B: nmero impar
P ( A) =
3
6
P( B ) =
3
6
P( A B) =
1
6
1
1
P( A / B ) = 6 =
3 3
6
que no es igual a P ( A ) = 1 / 2 ,
Y
1
1
P ( B / A) = 6 =
3 3
6
que no es igual a P ( B ) = 1/2
100
Solucin:
Consideremos los eventos
A: El primer juego extrado no tiene fallas.
B: El segundo juego extrado no tiene fallas.
Es claro que P (A) = 7/10, ya que 7 de los 10 juegos no son
defectuosos y estamos muestreando aleatoriamente, por lo cual cada
juego tiene la misma probabilidad ( 1/10 ) de ser escogido.
Si A ocurre, entonces quedan 9 juegos en la caja, 6 de los cuales
tienen fallas, por lo que
P (B / A)= = 6 / 9 = 2 / 3
Y por el teorema de la multiplicacin, la respuesta es
P (A B ) = 7 /10 . 2 / 3 = 0,47
101
Ejemplo
Si se seleccionan dos cartas de un paquete de naipes bien
barajado, cul es la probabilidad de que ambas sean reinas?
Solucin
Hay dos maneras de seleccionar las cartas: 1) Se puede
seleccionar una carta, reponerla en la baraja, barajar y extraer
una segunda carta. (Muestreo con reemplazo); 2) Se pueden
seleccionar las dos cartas consecutivamente sin reemplazar la
primera en la baraja (Muestreo sin reemplazo)
1. Sea A el suceso de una reina en la primera extraccin, y B el
suceso de una reina en la segunda extraccin. Cuando el
muestreo es con reemplazo, la probabilidad de extraer una reina
permanece igual en las dos extracciones. As, puesto que
P (A / B) = P (A) y P (B / A) = P (B), las dos extracciones son
independientes, por lo tanto
P (A B) = P (A). P (B) = 4/52. 4/52= 16/ 2704
2. Cuando se emplea el muestreo sin reemplazo la probabilidad
de obtener una reina en la segunda extraccin se reduce siempre
que la primera carta seleccionada haya sido una reina. En otras
palabras , cuando P ( B / A ) P ( B ) o P ( A / B ) P ( A ) , los
sucesos no son independientes. La probabilidad de extraer una
reina en el segundo intento es 3 / 51. Empleando la frmula
correspondiente, encontramos que la probabilidad de seleccionar
dos reinas en extracciones consecutivas procedentes de una
baraja sin reemplazo, es:
102
10
30
45
35
20
100
P ( A) =
45
= 0,45
100
P ( A) =
100 35 65
=
= 0,65
100
100
P(A C ) =
20
= 0,20
100
103
15
P( B I O ) 100 15
P( B / O ) =
=
=
= 0,43
35 35
P(O )
100
9 Probabilidad que el padre tenga trabajo temporario o sea poco
comprometido
P(O B ) = P( ) + P( ) P( B ) =
30 35 10
55
+
=
= 0,55
100 100 100 100
104
1
1/6
2
1/6
3
1/6
4
1/6
5
1/6
6
1/6
Total
1
M
=1
2)
3) Esta distribucin recibe el nombre de uniforme, es una
distribucin de variable aleatoria discontinua y sus parmetros
son los valores mnimos (a) y mximo (b) que puede tomar x.
Esto se indica como X ~ U (a, b).
x
donde C n son las combinaciones de n elementos tomadas de a x,
105
Las
combinaciones
C = (n.(n - 1). (n - 2)...(n - x + 1))/x!
se
calculan
como
sigue:
x
n
15!
(0,05) 0 (1 0,05)150
0! (15 - 0)!
= 1(0,95)15 = 0.4631
106
15!
(0,05)1 (1 0,05)151
P(1 15, 0,05) = 1! (15 - 1)!
=
= 15(0,05)(0,95)14 = 0,3658
107
n
13
p
x 0,01 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0,95 0,99 x
0 878 513 254 055 010 001 0+ 0+ 0+ 0+ 0+
0+
0+
0
1 115 351 367 179 054 011 002 0+ 0+ 0+ 0+
0+
0+
1
2
7
111 245 268 139 045 010 001 0+ 0+ 0+
0+
0+
2
3
0+
21 100 246 218 111 035 006 001 0+ 0+
0+
0+
3
4
0+
3
28 154 234 184 087 024 003 0+ 0+
0+
0+
4
5
0+
0+ 006 069 180 221 157 066 014 001 0+
0+
0+
5
6
0+
0+ 001 023 103 197 209 131 044 006 0+
0+
0+
6
7
0+
0+
0+ 006 044 131 209 197 103 023 001 0+
0+
7
8
0+
0+
0+ 001 014 066 157 221 180 069 006 0+
0+
8
9
0+
0+
0+ 0+ 003 024 087 184 234 154 028 003
0+
9
10 0+
0+
0+ 0+ 001 006 035 111 218 246 100 021
0+ 10
11 0+
0+
0+ 0+ 0+ 001 010 045 139 268 245 111
0+ 11
12 0+
0+
0+ 0+ 0+ 0+ 002 011 054 179 367 351 115 12
13 0+
0+
0+ 0+ 0+ 0+ 0+ 001 010 055 254 513 878 13
14
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
869
123
008
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
488
359
123
026
004
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
229
356
257
14
035
008
001
0+
0+
0+
0+
0+
0+
0+
0+
044
154
250
250
172
086
032
009
002
0+
0+
0+
0+
0+
0+
007
041
113
194
229
196
126
062
023
007
001
0+
0+
0+
0+
001
007
032
085
155
207
207
157
092
041
014
003
001
0+
0+
0+
001
006
022
061
122
183
209
183
122
061
022
006
001
0+
0+
0+
001
003
014
041
092
157
207
207
155
085
032
007
001
0+
0+
0+
0+
001
007
023
062
126
196
229
194
113
041
007
0+
0+
0+
0+
0+
0+
002
009
032
086
172
250
250
154
044
0+
0+
0+
0+
0+
0+
0+
0+
001
008
035
114
257
356
229
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
004
026
123
359
488
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
008
123
869
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
860
130
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
463
366
135
031
005
001
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
206
343
267
129
043
010
002
0+
0+
0+
0+
0+
0+
0+
0+
0+
035
132
231
250
188
103
043
014
003
001
0+
0+
0+
0+
0+
0+
005
031
092
170
219
206
147
081
035
012
003
001
0+
0+
0+
0+
0+
005
022
063
127
186
207
177
118
061
024
007
002
0+
0+
0+
0+
0+
003
014
042
092
153
196
196
153
092
042
014
003
0+
0+
0+
0+
0+
002
007
024
061
118
177
207
186
122
063
022
005
0+
0+
0+
0+
0+
0+
003
012
035
081
147
206
219
170
092
031
005
0+
0+
0+
0+
0+
0+
001
003
014
043
103
188
250
231
132
035
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
010
043
129
267
343
206
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
001
005
031
135
366
463
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
009
130
860
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
108
5.3. DISTRIBUCIONES
ALEATORIA CONTINUA
DE
PROBABILIDADES
DE
VARIABLE
hasta +
y su
109
f (x) =
1 x
f (x)
0,30
0,20
0,10
0,00
4
10
12
14
x = 2
x = 3
110
f ( x)dx = 1
x -
-5
-3
111
Tabla de 1 cola
En ella, los valores de probabilidad se encuentran en el cuerpo de
la tabla y los valores de z se forman utilizando la primera columna y la
primera fila (es decir en lo que se conoce como matriz de la tabla). En
esta tabla es importante considerar el signo de z.
Como su nombre lo indica, para el valor de z considerado, da el
valor del rea bajo de la curva desde menos infinito hasta z. Por ejemplo
si z = -2.1 la tabla da
P(z < -2,1) = 0,0179.
Ejemplo :
Una poblacin de pesos de alumnos en gr tiene distribucin normal
con media y desviacin estndar ( y ) de 50 y 5 Kg. respectivamente.
Cul es la probabilidad de
x -
z = (55 - 50)/5 = 1.
112
z =
x -
113
00
.0
.8413
01
.8438
0
.1
.8643
.8849
.8665
.3
.9032
.8869
.5
.9332
.9345
.9452
.7
.9554
.8
.9641
.9
.9713
.9564
.1
.9772
.9821
.9826
.9861
.9864
.9582
.9830
.9868
0
.9591
.9834
.9738
0
0
.9793
0
.9838
0
.9871
.9671
0
.9495
0
.9788
0
.9382
0
.9732
0
0
0
.2
.9726
.8925
.9251
0
.9664
0
0
.9099
.9484
0
.9783
0
.9370
0
0
0
.9778
.9573
.9236
.9656
0
.8907
.8729
.9082
0
.8508
0
.9719
.9474
0
.9649
0
.0
.9357
04
0
0
.8888
.9222
.9463
0
.8485
.8708
.9066
0
03
0
.6
.9207
0
.8686
.9049
.9192
0
.4
.8461
0
.2
02
0
0
.9875
114
z2 =
60 - 50 10
= =2
5
5
z1 =
52,75 - 50 2,75
=
= 0,55
5
5
P(z 2)=0,9772
z0,10 = 1,64
para el 90 % central
z0,05 = 1,96
z0, 01 = 2,58
Ejemplo
poblacin
1,96. Es
tanto por
valor que
z =
x -
entonces x = z
115
x = 50 1,96 * 5 = 50 9,80 .
116
GUA DE EJERCITACIN
Actividad 1
Actividad 2
117
Actividad 4
En el experimento aleatorio de la Actividad N2, segundo prrafo:
a)
b)
c)
d)
e)
f)
g)
Actividad 5
Una oficina donde asignan becas para padres de los alumnos de Jardn
de Infantes, realiza la seleccin de los mismos para dos Becas de
distinto origen de fondos; los resultados posibles son Seleccionado (S) o
No Seleccionado (NS). El experimento consiste en tomar al azar un
alumno y observar el resultado en las dos selecciones.
a) Describa el espacio muestral de este experimento (suponga que los
padres de todos los alumnos han estado inscriptos en las dos Becas)
b) Cul es la probabilidad de que el padre del alumno haya sido
seleccionado en las dos Becas?
c) Cul es la probabilidad que el padre del alumno no haya sido
seleccionado en ninguna de las dos Becas?
d) Cul es la probabilidad que el padre del alumno haya sido
seleccionado en una Beca por lo menos?
Actividad 6
Cada uno de los tems siguientes representa las probabilidades de cada
uno de tres eventos simples.
Marque el tem correcto, justificando al mismo tiempo su respuesta.
a) P(E1) = 0,8
P(E2) = 0,3
P(E3) = 0,1
b) P(E1) = 0,3
P(E2) = 0,2
P(E3) = 0,5
118
c) P(E1) = -0,6
P(E2) = 0,2
P(E3) = 0,2
d) P(E1) = 1/3
P(E2) = 1/2
P(E3) = 1/6
Actividad 7
En una encuesta realizada a los padres de 90 alumnos que egresan
del Jardn de Infantes en un establecimiento educativo, se les
preguntaba sobre el nivel de instruccin alcanzado y si a los hijos los
inscribiran o no en el mismo establecimiento educativo para continuar
sus estudios. El resultado de la encuesta figura en la tabla siguiente:
Inscriben a
Nivel de
educacin de los sus hijos en la
misma escuela?
padres
Si
No
Superior
20
10
Secundario
30
10
Primario
15
5
Total
65
25
Total
30
40
20
90
119
Actividad 8
En un examen de 10 bolillas un alumno no sabe dos de ellas. Cul es
la probabilidad que le toquen justamente las dos bolillas que no sabe?
Actividad 9
Una prueba tiene 2 preguntas con dos opciones: Verdadero (V) o
Falso(F).
a) Cul es la probabilidad de que acierte en las dos?
b) Cul es la probabilidad de que acierte por lo menos en una?
c) Cul es la probabilidad de que a las dos las conteste
incorrectamente?
Actividad 10
En una escuela hay tres Profesores de Educacin Fsica. La
probabilidad de que no asistan a clase cada uno de ellos es de 0.05.
Cul es la probabilidad de que un da cualquiera falten los tres juntos?
Actividad 11
En un anlisis realizado por el Director de un establecimiento
educativo, se determin que de los alumnos ingresantes en EGB en una
cohorte, solo el 70% (en promedio) complet el polimodal. De ellos solo
el 15% lo hizo en el mismo establecimiento. Cul es la probabilidad de
que un nuevo alumno ingresante en EGB termine el Polimodal en la
misma escuela?
Actividad 12
La probabilidad de que a un alumno le interese Matemticas en un
curso es de 0.1. Si se toman 3 alumnos de dicho curso al azar:
Cul es la probabilidad de que:
a) No le agrade a ninguno Matemticas?
b) Le agrade por lo menos a un alumno esta materia?
c) Le agrade como mximo a 2 alumnos?
120
Actividad 13
La probabilidad de que un alumno apruebe una Prueba Integradora de
conocimientos de Matemtica en el ltimo ao del Polimodal es de 0,25.
Si se seleccionan al azar 10 alumnos de un curso:
a)
b)
c)
d)
e)
Cul
Cul
Cul
Cul
Cul
es
es
es
es
es
la
la
la
la
la
probabilidad
probabilidad
probabilidad
probabilidad
probabilidad
de
de
de
de
de
que
que
que
que
que
5 alumnos aprueben?
no apruebe ningn alumno?
todos aprueben?
aprueben como mnimo 5 alumnos?
como mximo aprueben 5 alumnos?
Actividad 14
La probabilidad de que la ltima semana de clase los alumnos que
egresan cometan un acto de indisciplina serio es de 0,004. De 300
alumnos que terminan este ao:
Cul es la probabilidad de que:
a) 8 alumnos terminen sus estudios con una sancin por este acto de
indisciplina?
b) De qu ms de 5 alumnos terminen sus estudios con una sancin
por este acto de indisciplina?
c) De que menos de 4 terminen sus estudios con una sancin por este
acto de indisciplina?
d) De qu ningn alumno cometa un acto de indisciplina serio?
Actividad 15
Los pesos de los alumnos de un curso de EGB se distribuyen
normalmente con = 48 kg y = 2 kg.
a) Obtenga los pesos estndar correspondientes a:
43 kg ; 44,5 kg ; 46 kg ; 49,5 kg ; 50 kg
b) Cul es la probabilidad de que un alumno tenga un peso menor a
44,5 kg?
c) Cul es la probabilidad de que un alumno tenga un peso mayor a
46 kg?
d) Cul es la probabilidad de que un alumno tenga un peso entre
44,5 kg y 49,5 kg?
121
Actividad 16
Los puntajes promedio con su correspondiente desviacin estndar,
obtenidos por los alumnos del ltimo curso de Polimodal en una
escuela en los exmenes finales de una asignatura son los siguientes:
CURSO
A
B
5,9
6,75
1,5
1
122
CAPTULO IV
UNIDAD V
TABLAS DE CONTINGENCIA
INTRODUCCIN
2 = X 12 + X 22 + ... + X n2 2
A la distribucin correspondiente a esta suma se la llama Distribucin
ji-cuadrada, cuya funcin de densidad es
f ( x ) = Kn
f(x)=0
(n-2) /2
e x/2
cuando x > 0
cuando x< 0
123
= 1 / 2n/2 . ( n/2)
124
125
2. TABLA DE CONTINGENCIA
Definicin: Una tabla de contingencia es una tabla en donde las
frecuencias corresponden a dos variables.( Una variable se utiliza para
categorizar renglones y una segunda variable para categorizar
columnas).
En una Tabla de Contingencia, los niveles de un criterio de
clasificacin forman las filas y los niveles de otro criterio, las columnas.
Las celdas que se encuentran en las intersecciones de las filas y las
columnas contienen conteos o frecuencias de sujetos que se han
clasificados en forma cruzada con base en los dos criterios. Es
importante reconocer que la palabra contingencia se refiere a
126
Nivel
1
c
1
2
.
n11
n21
.
.
I
.
.
ni1
.
.
R
Total
.
nr1
n.1
2
Total
n12
n22
.
.
ni 2
nr2
n.2
..........
........
............
...........
n1j
n2j
.............
............
n1c
n2c
n1.
n2.
............
nij
............
nic
ni.
...........
nrj
n.j
.........
nrc
n.c
nr.
n
127
128
La hiptesis alterna es .
4.- Calculamos las frecuencias esperadas para cada una de las celdas
de la tabla de contingencia. Esto lo hacemos suponiendo que la
129
de
2 =
(O E )2
E
130
131
de las probabilidades
11
11
= (n1. / n ) . (n.1 / n ) . n
= ( n1. * .n
.1
)/n
(1)
E=
132
2
con c
gl=(f1).(c1)
Figura: Regin crtica (sombreada) para un contraste con el estadstico
.
La prueba de ji-cuadrado
decisin.
133
Solucin:
2. Determinar Ho y H1.
La hiptesis nula que se va a verificar con la prueba de ji-cuadrado de
independencia es :
H1 :
DESEMPEO
ACADMICO
MALO
SATISFACTORIO
TOTAL
ESTADO DE
NUTRICIN
MALO
BUENO
105
80
185
15
300
315
TOTAL
120
380
500
134
ESTADO DE NUTRICIN
DESEMPEO
ACADMICO
Malo
Malo
105 ( 44,4 )
Satisfactorio 80 ( 140,6 )
TOTAL
185
Bueno
15 ( 75,6 )
300 ( 239,4
)
315
Total
120
380
500
135
2 =
(O E )2
E
g.l. = ( 2 1 ) . ( 2 1) = 1
El nivel de confianza: 5 %
7. Buscamos el 2 en la tabla :
Para 1 grado de libertad y un nivel de confianza = 5 % , el
= 3,84
136
Comparamos el 2 c y el
ji-cuadrado de tabla)
= 172,74 >
= 3,84
137
GUIA DE EJERCITACIN
ACTIVIDAD 1
De un estudio realizado a quinientos alumnos de la Sala de 5 aos
correspondiente a distintos Jardines de la Provincia, fueron clasificados
de acuerdo con el grupo socio-econmico al que pertenecen y la
presencia o ausencia de ciertos defectos en el lenguaje.
Defecto del
lenguaje
Presente
Ausente
Total
Grupo Socio-Econmico
Medio alto Medio Bajo
Bajo
24
32
27
121
138
108
145
170
135
Alto
8
42
50
Total
91
409
500
ACTIVIDAD 2
Los resultados de un estudio realizado por un socilogo respecto al nivel
de comprensin de las consignas dadas a los alumnos de la Sala de 5
aos en un Jardn de la ciudad Capital de Santiago del Estero,
clasificados segn Nivel socioeconmico, se muestran en la tabla
siguiente:
Edad
(en meses)
Baja
Media
Alta
Total
Muy Bueno
12
13
18
Nivel de Comprensin
Bueno
Escaso o
Insuficiente
13
13
16
11
15
11
Total
138
ACTIVIDAD 3
En una investigacin se estudiaron 631nios de 0 a 5 aos de edad y se
analiz su estado nutricional, con referencia particular a si presentaban
o no retardo de crecimiento. Una vez hallados los resultados, el
investigador desea saber si el peso de nacimiento (bajo: igual o menor a
2500 g; normal: ms de 2500 gramos) est asociado al retardo de
crecimiento posterior, con un nivel de significacin de 0,05 %.
Peso de
Nacimiento
Bajo
Normal
Total
Si
21
124
145
Retardo en el Crecimiento
No
26
460
486
Total
47
584
631
139
CAPTULO V
UNIDAD VI
INFERENCIA ESTADSTICA
1. INTRODUCCIN
140
hay que
2. INFERENCIA ESTADSTICA
141
142
3. DISEOS DE MUESTREO
La operacin de tomar una muestra de una poblacin se
denomina muestreo y los mtodos de muestreo que se utilicen deben
garantizar
aquella representatividad para que pueda hablarse
correctamente de una muestra estadstica.
Si se desea conocer, por ejemplo, el consumo medio de protenas
por alumno y dia en una ciudad y tomamos para ello un grupo de
familias integrado por la de ms alto nivel de vida, se concluir que ese
grupo no es representativo del total de familias de la ciudad. Por tanto,
el consumo medio que se obtenga del citado grupo no es una buena
estimacin porque entraa un error de un tipo distinto del que cabe
esperar en una muestra representativa.
Conviene distinguir entre dos clases de error. De una parte
existen los errores muestrales, que son aquellos que estn latentes en
toda muestra representativa, pues aun sindolo no proporciona, salvo
raras excepciones, una medida exacta de las caractersticas de la
poblacin; por ello hay que contar siempre con los errores muestrales o
errores de muestreo.
Y por otra parte estn los sesgos, bajo cuya denominacin se
incluyen algunos errores especficos de las muestras como los debidos a
su falta de representatividad, y otros que son comunes a toda
investigacin estadstica, tanto si es exhaustiva como si no lo es. A este
ltimo grupo pertenecen los errores de observacin, los originados por
definiciones defectuosas de los elementos de la poblacin, de los
caracteres a investigar , los debidos a respuestas o medidas mal
efectuadas , a frmulas inadecuadas, a clculos equivocados, etc.
Ejemplo: Supongamos que deseamos tomar una muestra de 100
padres de alumnos de nios en edad de 4 y 5 aos de un Colegio para
conocer su opinin acerca de un nuevo juego. Un posible mtodo es
situarse a las nueve de la maana en una entrada del Colegio y
preguntar a los 100 primeros padres que aparezcan. Con este
procedimiento los padres de nios que solo asisten por la tarde no
estarn representados en la muestra. Adems, estarn muy poco o
nada representados los padres de nios que no acudan habitualmente.
Cuando algunos miembros de la poblacin tienen una
probabilidad ms alta que los otros de estar representados en una
muestra se dice que existe un sesgo de seleccin y la muestra puede
no ser representativa de la poblacin. Por ejemplo, si existen diferencias
marcadas de opinin entre los padres nuevos y los veteranos, y la
muestra slo incluye a los veteranos, tendr un sesgo de seleccin. Una
143
144
K = 10.000 / 500 = 20
145
146
147
BIBLIOGRAFA
-
148