You are on page 1of 148

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

LEI
Introduccin a la
Estadstica Educativa

Autores:
Dra. Marta Graciela del Valle Pece
M.Sc. Ing. Margarita Jurez de Galndez
Mg. Lic. Mara Mercedes Simonetti de Velazquez

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

PROGRAMA

UNIDAD I: Estadstica
Concepto. Etapas en el trabajo estadstico. Estadstica Descriptiva e
Inferencial. Variable: concepto. Clasificacin de variables. Series
simples. Agrupamiento de datos en series de frecuencias. Frecuencias
absolutas. Frecuencias relativas. Porcentajes. Frecuencias acumuladas,
frecuencias relativas acumuladas y porcentajes acumulados. Tasas de
uso comn: de escolarizacin, de analfabetismo, de desgranamiento, de
retencin.

UNIDAD II: Presentacin de datos estadsticos.


Partes funcionales y construccin de tablas estadsticas. Elementos
estructurales de las tablas. Tablas simples, cruzadas. Anlisis de tablas
estadsticas. Tcnicas de representaciones grficas. Reglas de
construccin. Grficos segn los distintos tipos de variables.

UNIDAD III: Medidas de resumen.


Medidas de tendencia central. Media aritmtica, mediana y moda.
Comparacin de media, mediana y moda. Distribuciones simtricas y
asimtricas. Medidas de dispersin. Rango, variancia y desviacin
estndar y desviacin mediana. Coeficiente de variacin. Medidas de
localizacin. Percentiles y rango percentil. Aplicaciones.

UNIDAD IV: Nociones elementales de probabilidad.


Experimentos aleatorios: conceptos bsicos. Probabilidad clsica,
frecuencial y axiomtica. Teorema de la suma y del producto de
probabilidades.
Tabla de contingencia. Clculo de probabilidades. Asociacin de
variables.
Distribucin de probabilidades
Uniforme y Binomial.

de

variables

aleatorias

discretas:

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Clculo de probabilidad en variables aleatorias continuas: distribucin


normal y distribucin normal estndar.

UNIDAD V :Tablas de Contingencia


Distribucin ji-cuadrado. Verificacin de hiptesis. Tablas de
contingencia. Pruebas de independencia mediante la prueba
2
cuadrado, en tablas de contingencia de c x f .

UNIDAD VI: Inferencia estadstica.


Poblacin. Definicin de muestra aleatoria. Diseos de muestreo.
Muestreo aleatorio simple. Muestreo sistemtico. Muestreo por estratos.
Muestreo por conglomerados: concepto

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

CAPITULO I
UNIDADES I y II

INTRODUCCIN
La palabra Estadstica proviene del latn status (estado).
Precisamente la primera aplicacin de la estadstica consisti en la
recopilacin de datos y la construccin de grficos para describir el
estado de un pas. Con el correr del tiempo esta herramienta fue
evolucionando hasta que en la actualidad podramos decir que no hay
aspectos de la vida cotidiana donde no se aplique la Estadstica.
Hogares, gobiernos y negocios se apoyan en datos estadsticos para
dirigir sus acciones.
El objetivo que se persigue con este mdulo es proporcionar al
docente herramientas y tcnicas para obtener datos, procesarlos para
obtener informacin que sirva para la interpretacin correcta de
fenmenos que se producen en su mbito de trabajo.

ESTADSTICA. CONCEPTOS.
La Estadstica es una coleccin de mtodos para planear
experimentos, obtener datos, y despus organizar, resumir, presentar,
analizar, interpretar y llegar a conclusiones basadas en ellos (Triola,
2004).
Otra definicin considera a la Estadstica como una disciplina
perteneciente a la Matemtica Aplicada que se dedica al estudio
cuantitativo de fenmenos colectivos. Proporciona los mtodos para:

La recoleccin de datos
Su ordenamiento, resumen y presentacin,
Su anlisis e interpretacin y
Posterior enunciado de conclusiones.

Los cuatro pasos que se han enumerado constituyen las etapas del
trabajo estadstico.

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

La primera etapa tiene como objetivo recolectar datos proveniente de


medicin, conteo u observacin efectuado sobre el material objeto de
estudio en base a un plan formulado segn los principios del diseo
experimental y las tcnicas de muestreo.
La segunda etapa consiste en ordenar los datos en tablas
estadsticas, presentarlos mediante grficos y diagramas y resumirlos a
travs del clculo de promedios, porcentajes e ndices.
En la tercera etapa se analizan los resultados obtenidos en la etapa
anterior, y comienzan a distinguirse las caractersticas del fenmeno, lo
que permite utilizar diferentes mtodos para analizarlos e
interpretarlos.
En la ltima etapa se debe concluir acerca del estudio realizado.
Si las conclusiones, se refieren exclusivamente a los datos de los que se
dispone (una parte de la poblacin que se desea estudiar), se dice que
la Estadstica es Descriptiva.
Si por el contrario, las conclusiones van ms all de los datos que
se dispone y se refieren a un conjunto mayor (poblacin), del cual se
extrajeron, se dice que la Estadstica es Inferencial; las conclusiones
van de lo particular (muestra) a lo general (la poblacin).Esta se basa en
el estudio de la teora de probabilidades que nos permite medir el error
de nuestras afirmaciones.
Las estadsticas (en plural) se obtienen como resultado del
trabajo estadstico y estn constituidas por porcentajes, promedios,
tablas, grficos y otros elementos que describen un fenmeno y ayudan
a su comprensin (Ej.: estadsticas demogrficas, estadsticas del
ftbol,
estadsticas
de
accidentes
de
trnsito,
estadsticas
universitarias, etc.).
Es necesario definir algunos conceptos importantes: por ejemplo
Poblacin. Se define poblacin como el conjunto de individuos u
objetos que comparten una caracterstica comn,
en la que el investigador est interesado.
Muestra.

Es un subconjunto de la poblacin. Debe ser


representativa, es decir se deben mantener las
mismas caractersticas de la poblacin en estudio.

Una poblacin puede ser finita o infinita.

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Poblacin finita Una poblacin finita es aqulla que puede ser


fsicamente listada

Poblacin infinita. Una poblacin es infinita, cuando en la


prctica no puede ser fsicamente listada

Ejemplo. Una poblacin puede ser definida como los alumnos del
Jardn de Infantes Nio Jess del Barrio San Martn
de la ciudad de La Banda. Los alumnos pueden ser
listados e individualizados a travs de los registros
ulicos. Es un ejemplo de poblacin finita.

Personas portadoras de SIDA en Santiago del


Estero, constituyen un ejemplo de poblacin
infinita.
Unidad de observacin: es aqulla sobre la cual se efectan las
mediciones u observaciones. La unidad de
observacin puede ser una persona, una familia,
una planta, una parcela, etc.
Dato: es el valor que se obtiene de la medicin, observacin o
conteo efectuada en la unidad de observacin o
unidad de muestreo.

Por ejemplo si el objetivo de una investigacin es el rendimiento de


los alumnos, la unidad de observacin es el alumno.
El nmero de materias rendidas contadas en un alumno es el dato.
El conjunto de datos obtenidos de cada unidad de observacin
constituir la base para el anlisis estadstico del rendimiento de
los alumnos.

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Variables. Concepto y tipos.

Variable. Una variable es cualquier caracterstica que vara de


una unidad de muestreo a otra en la poblacin o en
la muestra

Ejemplo 1: Supngase que interesa conocer la salud de los


alumnos, entonces la variable a observar en cada alumno ser el
estado de salud, el que podr asumir dos valores: sano o enfermo.

Ejemplo 2: Si interesa saber el nmero de hermanos que posee


cada alumno, se tendr valores que van desde 0(ningn hermano), 1,
2...,n y se deber contar cuantos hermanos posee cada alumno.

Ejemplo 3: Si el objetivo de un estudio fuera la talla alcanzada


por alumnos, se debe medir la variable altura la que, expresada en
metros podr tener valores mayores a 1 metro.

En los tres ejemplos anteriores, el nombre de la variable y la


forma de obtener sus valores est resaltado en negrita. En el primer
ejemplo, los valores que puede asumir la variable son calidades, por lo
que se dice que la variable es cualitativa. Las calidades o categoras
pueden ser naturales como al definir la variable sexo, o arbitrarias
como la clasificacin de alturas en bajas, medianas y altas.
Por el contrario, en los otros dos ejemplos los valores que asumen las
variables pueden expresarse mediante nmeros, por lo que las dos
de nmero de
ltimas variables son cuantitativas. En el caso
hermanos, la variable toma slo determinados valores en el intervalo
que va de cero a n, por lo que se la denomina variable cuantitativa
discreta o discontinua; cuando la variable toma los infinitos valores
dentro del intervalo se dice que la variable es cuantitativa continua
Otra forma de clasificacin de las variables es mediante el empleo
de cuatro niveles de medicin: nominal, ordinal, de intervalo y de razn.
Cuando se manejan datos reales el nivel de medicin es importante ya
que orienta sobre el procedimiento estadstico a utilizar.

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Un nivel de medicin es nominal cuando los valores de


variables son nombres, etiquetas o categoras y no se puede establecer
un orden entre ellos.
Ejemplo: colores de ojos, estado de salud, lugar de nacimiento de un
alumno. Aunque las ciudades pueden ser ordenadas segn su tamao,
densidad poblacional, grado de contaminacin del aire, etc, en general,
la variable lugar de nacimiento no tiene un orden establecido
Con estos datos no es posible realizar clculos. A veces se asignan
nmeros a las diferentes categoras; a la variable salud que posee dos
valores sano y enfermo, podemos codificarlas numricamente de la
siguiente manera 1= sano, 2= enfermo pero esto no es nada ms que
una codificacin y tales nmeros no tienen significado computacional.
Un nivel de medicin es ordinal cuando se puede establecer un
orden entre las categoras de la variable. Ejemplo: mximo nivel de
instruccin alcanzado por los padres de los alumnos: analfabeto,
primario, secundario, terciario, universitario.
Lo nico que podemos decir es que el nivel de instruccin secundario es
mayor que el primario y que el universitario es mayor que el primario,
secundario o terciario, pero no podemos decir cuanto mayor es una
categora de la variable respecto a la otra.
Supongamos que se codifican dichos niveles con 1, 2, 3, 4 y 5.
Si bien se podra hacer la diferencia entre 2-1=1 y 4-3=1, este resultado
1 no significa que entre el primario y el analfabeto hay la misma
cantidad de conocimiento que entre el universitario y el nivel terciario.
Otro nivel de medicin es el de intervalo. En este nivel la
diferencia entre dos valores de datos tiene un significado. En este nivel
no hay un cero natural, donde nada de la cantidad est presente. El
valor del cero es convencional
Ejemplo: La variable Temperatura est medida en escala de intervalo.
Un termmetro por ejemplo, mide la temperatura en grados que son del
mismo tamao en cualquier punto de la escala. Aqu no existe un punto
de partida natural, el valor 0 es arbitrario y no representa la ausencia
total de calor. La diferencia entre 20C y 21C es la misma que entre
12C y 13. Se pueden realizar operaciones de suma y resta pero no
cociente entre valores.
Por ltimo el nivel de medicin de razn o cociente aunque se
parece al nivel de medicin de intervalo tiene un punto de partida o cero
inherente (donde cero indica que nada de la cantidad est presente).
Para los valores en este nivel tanto las diferencias como los cocientes

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

tienen significado. En este nivel se pueden realizar todas las


operaciones.
Ejemplo: Los precios de los libros de texto (0$ representa ningn costo
y un precio de $60 es dos veces ms costoso que uno de $30).

Datos

Variable
Categrica o
cualitativa

Escala
nominal

Escala
ordinal

Variable
numrica o
cuantitativa

Escala de
intervalo

Escala de
razn

Series de datos. Series simples


El conjunto de valores de una variable constituye una serie de
datos. Se presentan a continuacin series de datos referidas a los tres
ejemplos que se dieron para ilustrar tipos de variables:

Ejemplo 1: En el ao 2004, se examinan 30 nios de Jardn de


Infantes de la escuela San Francisco y se anota su estado de salud
(S=Sano, E=Enfermo).
Generalmente las variables se designan con las ltimas letras del
abecedario en mayscula por ej. X y los valores que toma la variable
con x minscula; incluso se coloca xi donde el subndice i indica el
nmero de individuo observado; de ste modo las 30 observaciones son:
xi : S, S, E, E, E, S, S, E, S, S, S, S, S, E, S, S, S, S, E, S, S, S, S, S, S,
S, S, S, S, S.

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

El subndice i vara de 1 a 30. As, x1 = S; x7 = S;


X14 = E; . . . x30 =S.

Ejemplo 2: Un maestro de preescolar de la Escuela San Martn


interroga a 30 alumnos sobre el nmero de hermanos que poseen.
Xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0.

.; x30

El subndice i va desde 1 a 30 y entonces x1 = 4; x5 = 0; x12 = 5; .


=0.

Ejemplo 3: Un maestro mide la talla de sus 25 alumnos de


Seccin Maternal de la Escuela San Francisco la que expresada en cm
es la siguiente:

xi(cm):
70,75,74,87,92,89,72,83,84,79,98,99,95,87,84,85,79,78,95,99,97,84,8
6,78,74.

Ahora i va desde 1 a 25, entonces x1 = 70; x2 = 75; . . .;


x25 =74.

Los datos en bruto, tal cual fueron obtenidos, sin agrupar


constituyen una serie simple.
Tablas y grficos
Organizacin de datos categricos o cualitativos.
Cuando la masa de datos obtenidos es muy grande y stos estn
desordenados, no dan informacin alguna; conviene por lo tanto
ordenarlos y tabularlos, haciendo uso de tablas estadsticas, que deben
confeccionarse de tal modo que los datos resulten fciles de ser ledos e

10

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

interpretados. Con los datos del ejemplo 1 se puede construir una tabla
de frecuencias.
Tabla de frecuencias. Una tabla de frecuencias para variable
cualitativa, es una tabla que asocia cada categora de la
variable con el nmero de veces que se repite la categora.
Tabla 1. Alumnos de Jardn de Infantes, de la Escuela San Francisco,
segn estado de salud. Ao 2004.

Categoras:xi

Frecuencias: fi

1
2

(Estado de salud)
Sano
Enfermo
Total

(n de alumnos)
24
6
30

Fuente: Datos ficticios

Frecuencia absoluta: Es el n de veces que se repite cada categora de


la variable. Se la simboliza con fi.
La suma de las frecuencias absolutas, es igual al n total de
2

f i = 30
observaciones, en ste caso 30 ( i =1
). Ntese que i ahora se
refiere a las categoras, x1 = Sano, f1 = 24;
x2 = Enfermo, f2= 6.
La tabla de frecuencias, es la ms sencilla de las tablas y es una
tabla de simple entrada pues los individuos se clasifican segn una
nica variable, estado de salud en el ejemplo.
Los datos organizados en tabla de simple entrada para variable
cualitativa, pueden presentarse mediante grficos, que tiene la
finalidad de que la informacin entre por los ojos. El grfico que puede
usarse en ste caso es el grfico de barras.

11

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Grfico 1a. Alumnos de Jardn de Infantes, de la Escuela San


Francisco, segn estado de salud. Ao 2004.

N de alumnos

30
25
20
15
10
5
0
Sanos

Enfermos
Estado de salud

Fuente: Datos ficticios


.
Para su construccin se utiliza el sistema de coordenadas
ortogonales. Sobre el eje horizontal se colocan las distintas categoras
de la variable en estudio (estado de salud) y sobre el eje vertical con una
escala adecuada, se representan las frecuencias. Se dibujan barras de
ancho constante, una para cada valor de la variable, con una altura que
representa el valor de la frecuencia que corresponde a cada categora.
Es conveniente que la separacin entre las barras sea menor que el
ancho de las mismas.
El ancho de las barras debe elegirse teniendo en cuenta el espacio
disponible, el nmero de categoras de la variable a representar y la
altura que les corresponde, con el objeto de obtener un grfico
proporcionado. Las barras pueden dibujarse en sentido vertical u
horizontal.

12

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Grfico 1b. Alumnos de Jardn de Infantes, de la Escuela. San


Francisco, segn estado de salud. Ao 2004.

Estado de salud

Enfermos

Sanos

10

15

20

25

30

N de alumnos

Fuente: Datos ficticios


En algunos trabajos es necesario calcular frecuencias relativas.
Frecuencia relativa de una categora es la proporcin de veces que
ocurre dicha categora.
Se obtiene dividiendo la frecuencia absoluta de cada categora entre la
suma de las frecuencias de todas las categoras. La suma en ste caso
es f1 + f2 = 24 + 6 = 30, y se expresa literalmente mediante el signo

que se denomina sumatoria, as


i = 2

fi

24

+ 6

30

i = 1

a la frecuencia relativa de la clase i-sima se la simboliza con fri


la calcula de la siguiente manera:

y se

fi

fri =

La suma de las frecuencias relativas es siempre igual a 1.


n

fr

=1

i =1

Si se multiplica las frecuencias relativas por 100 se obtienen


porcentajes. En ste ejemplo sera:

13

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Tabla 2. Alumnos de Jardn de Infantes, de la Escuela. San Francisco,


segn estado de salud. Ao 2004.

xi

fi

(Estado de salud)
Sano

Enfermo
Total

fri

Porcentajes:

24

24/30=0,80

%
80

6/30=0,20

20

30

1,00

100

Fuente: Datos ficticios

Se pueden representar los datos de la tabla 2 mediante un grfico de


barras, slo que en el eje vertical van los porcentajes.
Grfico 2. Alumnos de Jardn de Infantes, de la Escuela San
Francisco, segn estado de salud. Ao 2004.

% 100
80
60
40
20
0
sanos

enfermos

Estado de salud

Fuente: Datos ficticios


Otro grfico adecuado para representar series de frecuencias de
variable cualitativa es el grfico de sectores circulares, llamado
grfico de tortas o pie charts.

14

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Tabla 3. Alumnos de Jardn de Infantes, de la Escuela San Francisco,


segn sexo. Ao 2004.

Sexo

fi

fri

360xfri

Varones
Mujeres
Total

(n de
alumnos)
15
25
40

0,38
0,62
1,00

137
223
360

Fuente: Datos ficticios


Se elige un radio por ej. 3cm (el valor del radio se elige segn el espacio
que se disponga para el grfico) y se grafica un crculo La superficie de
dicho crculo representa el total de alumnos (40), en consecuencia, le
corresponde un ngulo de 360. Se puede discriminar mediante
sectores circulares la porcin que corresponde a las mujeres y a los
varones. Los grados correspondientes a los sectores se obtienen
multiplicando la frecuencia relativa por 360.

Grfico 3. Alumnos de Jardn de Infantes, de la Escuela. San


Francisco, segn sexo. Ao 2004.
Varn
Mujer

38%

62%

Fuente:Datos ficticios

15

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Variables cuantitativas.
Ejemplo: N de hermanos que tienen los alumnos de preescolar de la
escuela San Martn
xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0
Para el caso de variables cuantitativas discretas, la tabla de
frecuencias se construye de la siguiente manera: se ubica el valor
mayor y el menor valor de la variable (en el ejemplo 2 del n de
hermanos por alumno, el menor valor es cero y el valor mayor 6), se
colocan todos los valores correspondientes en la primera columna de la
tabla, y luego se cuentan las veces que se presentan dichos valores. La
tabla resultante es:

Tabla 5. Alumnos de preescolar de la escuela San Martn segn N de


hermanos.
Xi
0
1
2
3
4
5
6
Total

fi
5
5
6
3
4
3
4
30

Fi
5
10
16
19
23
26
30

fr
0,17
0,17
0,20
0,10
0,13
0,10
0,13
1,0

%
17
17
20
10
13
10
13
100

Fuente: Datos ficticios

La diferencia que existe entre cada clase es constante e igual a 1.


Adems de las frecuencias relativas (cuyo clculo se explic en
prrafos anteriores) aqu se puede calcular tambin las frecuencias
acumuladas fa. La frecuencia acumulada de una clase se obtiene
sumndole a la frecuencia de la clase, la frecuencia de las clases
anteriores.
F(0)=5
F(1)=5+5=10
F(2)=5+5+6=16 = F(1)+6

16

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

La tabla de frecuencias para variables cuantitativas discretas se


representa mediante un grfico de bastones. En la abscisa se colocan
los valores de la variable y se levanta para cada uno de ellos una lnea
de altura igual a su frecuencia.

Grfico 4. Alumnos de preescolar de la escuela San Martn segn


N de hermanos.
6
5

frecuencia

4
3
2
1
0
0

Nmero de hermanos

Fuente: Datos ficticios

Interpretacin:
El nmero 6 en la columna de fi significa que 6 alumnos tienen 2
hermanos.
El nmero 19 en la columna Fi significa que 19 alumnos tienen 3
hermanos o menos.
El nmero 20 en la columna de porcentajes significa que el 20% de los
alumnos tienen 2 hermanos.

17

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Para el caso de variables cuantitativas continuas como los


datos del ejemplo 3 (altura en cm de 25 alumnos de una seccin
maternal de la Escuela San Francisco) que fueron obtenidos por
medicin, se recomienda construir intervalos de clase, cuya amplitud
depende de la cantidad de intervalos que se deseen construir y la
cantidad de datos que posee la serie simple. Es recomendable que los
intervalos de clases sean iguales, es decir que la amplitud de los
mismos (a) sea constante. La tcnica a emplear para el agrupamiento de
una serie simple de variable cuantitativa continua es sencilla.
xi (cm): 70, 75, 74, 87, 88, 89, 72, 83, 84, 79, 98, 99, 95, 87, 84, 85,
79, 78, 95, 99, 97, 84, 86, 78, 74
1. -Se ubica el valor mayor que toma la variable (99 cm) y el
menor (70 cm).

valor

2. - Se obtiene la diferencia, la que se denomina Rango o amplitud de


variacin y se designa con la letra R.
R = xmax xmin = 99 70 = 29

3. El nmero de intervalos aproximado se puede calcular con la


siguiente frmula:
n de intervalos =

log(n + 1)
log(2)

dnde n: n de valores de la serie o tamao de la muestra


log: logaritmo decimal

nde int erv. =

log(25 + 1)
= 4,7004 5 int ervalos
log(2)

Cuando en la variable que se estudia existen intervalos


predeterminados, el nmero de clases o intervalos depender de la
amplitud que se usa habitualmente.

4. - El rango se divide entre el n de clases o intervalos de clases, 5 para


ste ejemplo, (se recomienda que el nmero de intervalos no sea menor
que 5, ni mayor de 15, pues en el primer casos se reduce demasiado la
informacin y en el segundo no se cumple con el objetivo del

18

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

agrupamiento) obtenindose una idea aproximada de la longitud o


amplitud del intervalo de clase.

a=

Rango
29
=
= 5 .8 6
n de int ervalos 5

ste valor de amplitud es orientativo, por lo que se decide tomar


una amplitud de intervalo 5 cm para facilitar el agrupamiento.

5.- Se delimitan las clases buscando preferentemente valores enteros


para sus lmites. Se debe elegir el lmite inferior del 1er intervalo de tal
manera que contenga al menor valor de la serie (70 cm). La eleccin
recae en el 70. El lmite superior del 1er intervalo, se obtiene sumando
al Li la amplitud.

Li del 1er intervalo = 70


Ls del 1er intervalo = Li + a= 70 + 5 = 75
El lmite inferior del 2do intervalo debe coincidir con el lmite
superior del primer intervalo.

Li del 2do intervalo = 75


Ls del 2do intervalo Li + a= 75+ 5 = 80

El lmite inferior del 3er intervalo debe coincidir con el


lmite superior del 2do intervalo, y as sucesivamente, hasta que el lmite
superior del ltimo intervalo, contenga el valor observado ms alto de la
variable.

19

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

6.- Una vez formadas las clases se procede al conteo, que consiste en
determinar el n de observaciones (frecuencias) de cada clase. Una
manera sencilla de hacerlo es leyendo la serie simple y ubicando
mediante marcas cada valor de la variable en su clase correspondiente.
De sta manera cuando se termine de pasar lista a la serie simple, el
agrupamiento ha sido efectuado.

Tabla 6. Alumnos de Seccin maternal de la escuela San Francisco


segn su altura.
Intervalo de clase
(altura en
70
a
75
a
80
a
85
a
90
a
95
a
Total

cm)
75
80
85
90
95
100

xi
(marca de clase)
72,5
77,5
82,5
87,5
92,5
97,5

fi

fri

4
5
4
5
1
6
25

0,16
0,20
0,16
0,20
0,04
0,24
1,00

Fuente: Datos ficticios

Un problema que se puede presentar es el siguiente: si un valor


de la variable coincide con uno de los lmites del intervalo, por ejemplo
la altura 95 cm dnde se lo ubica? en el quinto o en el sexto intervalo
de clase? La respuesta es: puede ubicarlo en cualquiera de los
intervalos, pero si se elige un criterio se lo debe respetar hasta el final
del agrupamiento. En ste ejemplo al n 95 se lo ubica en el 6
intervalo, de la misma manera, cuando aparezca por ejemplo un valor
85, debe ser anotado como perteneciente al intervalo en el que el n 85
se encuentra como lmite inferior. El intervalo de clase es cerrado en el
lmite inferior y abierto en el superior. Esto se indica de la siguiente
forma [75;80 ) los valores del intervalo van desde 75 a 79,9999.

7.- Se agrega una tercera columna, titulada marca de clase o punto


medio de clase que se designa con xi que contiene los valores
correspondientes a los puntos medios de cada uno de los intervalos y se
calcula as:

20

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

x1 =

Li1 + Ls1 70 + 75
=
= 72,5
2
2

x2 =

Li 2 + Ls 2 75 + 80
=
= 77,5
2
2

Tambin se puede calcular de la siguiente manera

x 2 = x1 + a = 72,5 + 5 = 77,5

x3 = x 2 + a = 77,5 + 5 = 82,5

Al efectuar el agrupamiento, se pierde detalle de la informacin ya


que, por ejemplo, de los valores que resultaron ubicados en la primera
clase, slo se sabe ahora que se encuentran entre 70 y 75. Por eso, en
caso de ser necesario asignar un valor a cada uno de ellos, como es en
el clculo de la media aritmtica a partir de la tabla de frecuencias, se
opta por pensar que todos tienen igual valor, que es el correspondiente
al punto medio de clase.

Un grfico adecuado para representar una serie de frecuencias de


variable cuantitativa continua es el histograma (grfico n 5). Su
construccin es fcil. Se utiliza el sistema de coordenadas cartesianas
ortogonales. En el eje de las ordenadas (vertical) se marcan las
frecuencias (fi) y en el de las abscisas (horizontal), la variable segn la
cual se efectu la clasificacin (altura). Consiste en rectngulos
adyacentes (uno por cada clase) con bases materializadas por la
amplitud de clases (5 cm). La altura est dada por la frecuencia
correspondiente a la clase. Cuando las clases son iguales, el rea del
histograma es proporcional a la frecuencia total.

21

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Grfico 5.Alumnos de Seccin maternal de la escuela San Francisco


segn su altura.

7
6
5
N alum.

4
3
2
1
0
70

75

80

85

90

95

100

Altura (cm)

Fuente:Datos ficticios

Otro grfico adecuado para representar la serie de frecuencias de


variable cuantitativa continua es el polgono de frecuencias (grfico
6). Se emplea para su realizacin el sistema de coordenadas cartesianas
ortogonales. Se coloca la variable clasificadora en el eje horizontal y las
frecuencias en el vertical.
La construccin es sencilla, se marcan tantos puntos como pares
de valores (xi,fi) o sea segn marcas de clase, frecuencias haya en la
tabla. En la tabla N 6 vemos que hay 6 pares de valores; el primer par
tiene abscisa 72,5 y ordenada 4 y as sucesivamente hasta marcar el
sexto par. Luego se unen los puntos mediante trazos rectos. Algunos
autores, en su afn de mantener la proporcionalidad entre la superficie
y la frecuencia aconsejan cerrar el polgono de frecuencias uniendo el
primer punto con la marca de clase inmediata anterior y el ltimo
punto con la inmediata superior; en stos dos casos la unin de los
puntos se realiza con trazos cortados.
La principal ventaja de los polgonos de frecuencias consiste en
que ellos permiten dibujar en el mismo sistema de eje dos o ms
polgonos correspondientes a series diferentes que tengan similar
posicin sobre el eje de las x, as se puede compararlos, lo cual resulta
engorroso efectuar con los histogramas a causa de la superposicin de
las superficies de los rectngulos.

22

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Grfico 6.Alumnos de Seccin maternal de la escuela San Francisco


segn su altura.

N de alumnos

6
5
4
3
2
1
0
65

70

75

80

85

90

95

100

105

Altura(cm)

Fuente: Datos ficticios


Como cada miembro de una poblacin presenta diversas
caractersticas, se puede necesitar clasificarlos de acuerdo a dos de
ellas. Cuando el nmero
de individuos medidos es pequeo, se
enumeran todos los pares de observaciones, si alguno de ellos aparece
dos veces, se lo repite y la presentacin suele hacerse de modo que una
de las dos variables est ordenada.

Tabla 9. Alumnos de un Jardn de Infantes segn su peso y altura.


Peso
(kg)
Alt
(cm)

30

20

25

26

25

22

26

28

31

35

80

65

68

75

72

68

74

80

82

85

Fuente: Datos ficticios


Para representar estos datos que corresponden a dos
variables cuantitativas continuas se utilizan los grficos de dispersin
o scatter plot, que se construye de la siguiente manera: se coloca una
de las variables en las abscisas o eje horizontal, por ejemplo la altura y
la otra variable, el peso, en el eje vertical, con sus escalas
correspondientes, luego se marcan tantos puntos como pares de valores
(xi, yi) se tengan.

23

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Grfico 7. Alumnos de un Jardn de Infantes segn su peso y


altura.

Altura (cm)

100

80

60

40
20

25

30

35

40

Peso (kg)

Fuente: Datos ficticios


ste grfico sirve para mostrar la relacin entre las dos variables
y se usa cuando para el mismo valor de xi se tiene diferentes valores de
yi. Si esto no ocurre puede utilizarse el grfico lineal, que se construye
de igual manera que el anterior, con la nica diferencia que se unen los
puntos. ste grfico, se suele emplear, especialmente, en los casos
donde la variable que se representa en el eje horizontal es el tiempo. De
ste modo se puede ver la evolucin de la otra variable en el perodo
considerado. Pueden representar simultneamente en el mismo grfico
dos o ms variables, como se observar al representar grficamente los
datos de la tabla N 10.
Tabla 10. Inasistencias mensuales de alumnos de una Seccin de
preescolar de la Escuela San Martn segn sexo.
Meses
Marzo
Abril
Mayo
Junio
Julio
Agosto
Sept.
Octubre
Noviem.
Diciem.

N de inasist.
Mujeres
Varones
3
4
5
7
2
4
6
5
8
8
4
5
3
4
4
3
5
2
1
6

Fuente: Datos ficticios

24

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Grfico 8. Inasistencias mensuales de alumnos de una Seccin


preescolar de la Escuela San Martn segn sexo.

9
Mujeres

N de inasistencias

Varones

7
6
5
4
3
2
1
0
M

J
A
Meses

Fuente: Datos ficticios


Cuando los pares de valores son muy numerosos, las tablas se
presentan segn lo muestra la tabla 11; en ste caso se dice que las
tablas son de doble entrada pues son dos las variables de
clasificacin.
Tabla 11. Alumnos de Jardn de Infantes de una ciudad de Santiago del
Estero segn ocupacin de la madre y lugar de residencia.
Ocupacin
de la
Madre
A. de casa
Profesional
Empleada
Total

Barrios

A
400
200
300
900

B
500
200
400
1100

Total

C
200
50
100
350

1100
450
800
2350

Fuente: Datos ficticios

En este ejemplo cada alumno se caracteriza segn la variable


Ocupacin de la madre (variable cualitativa nominal) y Barrio de
residencia (variable cualitativa nominal).

25

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Los valores que se encuentran en la celda son frecuencias, es decir


representan la cantidad de alumnos que comparten las dos
caractersticas.

Las partes de una tabla son:


La matriz, formada por la primera fila, lleva los encabezamientos de las
columnas y / o la primera columna que titula a las filas.

El cuerpo constituido por celdas.

La informacin proporcionada por los valores de las celdas se


completa con la suministrada por los encabezamientos de las filas y
columnas; en las celdas se encuentra la frecuencia, es decir la cantidad
de elementos o individuos que poseen las dos caractersticas.

Por ejemplo el 100 de la ltima celda significa que en esa escuela


hay 100 alumnos que viven en el Barrio C y cuyas madres son
empleadas.
El grfico que se utiliza para representar ste tipo de tablas es el
y el grfico de barras
grfico de barras compuestas (grfico 9)
agrupadas (grfico 10).

Grfico de barras compuestas


La construccin del grfico de barras compuestas es sencilla. Se
comienza dibujando las barras como si fueran simples es decir con las
alturas correspondientes a los totales y luego se yuxtaponen los valores
parciales hasta alcanzar el de su suma. En el ejemplo, Barrio A, se
procede de la siguiente manera: se marca una barra de altura 900, en
ella se indica la subdivisin que corresponde a alumnos cuyas madres
son amas de casa con el valor 400; para marcar el n de alumnos que
es 200, se marca 400+200=600 en el eje vertical lo que queda
corresponde n de alumnos cuyas madres son empleadas. De igual
manera se procede con los barrios B y C.

26

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Grfico 9. Alumnos de Jardn de Infantes de una ciudad de


Santiago del Estero segn ocupacin de la madre y lugar de residencia.

1200
Empleada
Profesional

1000

N de alumnos

A. de casa
800
600
400
200
0
A

Lugar de residencia

Fuente: Datos ficticios


Grfico de barras agrupadas
Sirven para representar fenmenos similares a los que originan
barras compuestas. La diferencia con stas estriba en que, para cada
valor de la variable independiente x en ste ejemplo lugar de
residencia, se dibujan grupo de barras . El nmero de barras en
cada grupo es el del nmero de categoras de la segunda variable, en
este ejemplo ocupacin de las madres.
Grfico 10. Alumnos de Jardn de Infantes de una ciudad de Santiago
del Estero segn ocupacin de la madre y lugar de residencia.
600
A. de casa
Profesional

500

N de alumnos

Empleada
400
300
200
100
0
A

Lugar de residencia

Fuente: Datos ficticios

27

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Otro tipo de grficos son los grficos de figuras o pictogramas.


Son los ms indicados para publicaciones de divulgacin popular,
por su fcil e inmediata interpretacin. Consisten en dibujos
esquemticos y relacionados con el fenmeno a representar. Cada
figura es equivalente a una cantidad determinada, preferentemente
entera, de unidades de la variable dependiente y el nmero de
unidades no su tamao, es proporcional a la magnitud a
representar.
Cartogramas: Se emplean cuando es importante sealar la
distribucin geogrfica de un determinado acontecimiento, razn por
la cual se construyen sobre planos o mapas.
Cartogramas de sealizacin (Grfico 11): Sirven para indicar la
distribucin de una variable cualitativa sobre una base geogrfica.
Mediante figuras, colores o diferentes rayados se seala que hay en
lugares determinados.

Grfico 11. Qu es lo que caracteriza a cada provincia argentina.

Fuente: Pensando en plural. Divisin de educacin tributaria. AFIP.


Mayo 2005. ISBN N987-9101-26-X

28

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Cartogramas de densidad: adems de indicar que hay y dnde, de


ellos se puede obtener la informacin de cunto hay. Mediante
diferente rayado o colores y tambin utilizando barras sobre la base
geogrfica, se puede expresar la cuanta del fenmeno como as
tambin su ubicacin. Suelen utilizarse pictogramas, grficos de
lneas, en general cualquiera de los descriptos, sobre el mapa o
plano.

Resumiendo: los datos se ordenan, clasifican y presentan en formas


de tablas. Las tablas pueden de ser de simple entrada (cuando los
individuos se clasifican segn una variable), de doble entrada
(cuando los individuos se clasifican segn dos caractersticas) y de
triple o ms entradas (cuando se clasifican los datos segn tres o
ms variables).Las tablas se complican a medida que se agregan ms
variables, por lo tanto es preferible varias tablas sencillas a una
complicada.
Toda tabla debe llevar ttulo, el cul debe responder a las preguntas
Segn?, Qu?, Cundo? y Dnde?.
No se debe olvidar la fuente de datos que indica de donde proviene la
informacin.
Se debe incluir los totales.
En caso de expresar los datos en porcentajes, deben indicarse los
totales de los cuales provienen.
Con respecto a los grficos, stos constituyen una de las formas ms
tiles de presentacin de datos estadsticos. Su importancia reside
en las mltiples formas que pueden adoptar, lo que permite su
aplicacin a una amplia gama de finalidades: didcticas, de
investigacin, etc. Sirven para mostrar la relacin entre una o ms
variables. La variedad de tipo de representaciones grficas exige una
cautelosa eleccin de acuerdo a su finalidad. La seleccin de la
presentacin grfica debe, por lo tanto tener los siguientes aspectos:
Tipo de anlisis estadstico, caractersticas y nmero de los
fenmenos o variables a representar y pblico al que va dirigido.

29

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Recomendaciones para la construccin correcta de un grfico.


Una vez elegido el tipo de grfico adecuado, es conveniente no
descuidar las siguientes consideraciones:
*Decidir cul de las variables es la independiente x y cul la
dependiente y.
*La representacin grfica debe ser sencilla, simple y explicarse por
s misma.
*Ttulo se coloca encabezando el grfico y debe responder a las
preguntas; qu, segn, cundo, dnde?.
*Fuente de datos. Se coloca al pie del grfico.
*Escalas se elige de tal modo que no alteren la objetividad de la
representacin, hecho ste muy utilizado para fines publicitarios
donde es comn ver escalas construidas con el propsito de alterar
el fenmeno exagerando ventajas y enmascarando la realidad, o lo
que es peor an eliminando la graduacin de los ejes, evitando de
sta forma todo patrn de comparacin. Las escalas deben
construirse buscando obtener como resultado un dibujo armnico y
proporcionado.
*Debe nominarse los ejes de modo tal que no quede duda alguna
acerca de las variables que en ellos se representan.
*No olvidar el corte de ejes en caso de ser necesario. ste debe
efectuarse entre el 0 y el valor mnimo a representar.
*Aclaracin de las unidades de representacin.
*Las referencias sern colocadas al pie o al costado del grfico.
*En caso de usarse abreviaturas, stas sern aclaradas con la debida
extensin, en el rengln siguiente al correspondiente a las fuentes.
*En lo posible acompaar los grficos con las tablas estadsticas que
lo originen.
*Si el trabajo lo requiere y es necesario expresar algunos valores en
%, deben consignarse las cifras de las cuales provienen stos
porcentajes.

30

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

INDICES
El ndice es un indicador til tanto para fijar situaciones como para
hacer un diagnstico. Cuando interesa comparar los valores de una
caracterstica de la educacin (matrcula, asistencia de alumnos,
nmero de profesores, etc...) en el tiempo o en el espacio, ya sea
comparando dos valores entre s o todos con uno de ellos se puede
realizar un cociente cuyo resultado se denomina ndice simple.
Ejemplo: Se desea comparar la matrcula en preescolar de una ciudad
en el ao 2004 con la matrcula en el ao 1994. Si la primera es de
4000 alumnos y la de 1994 es de 2000, el ndice ser:

I 2004 / 1994 =

4000
=2
2000

Lo que indica que la matrcula en el ao 2004 es el doble que la


matrcula de 10 aos atrs, en preescolar.
El valor que va en el denominador se llama base.
El ndice del ao base es 1:

I 1994 / 1994 =

2000
=1
2000

Con frecuencia se multiplica por 100 los ndices con lo que entonces los
ndices son los porcentajes correspondientes siendo 100 el porcentaje
del ndice base.

Los ndices ms comunes utilizados en educacin son:

Razn de alumnos matriculados en las escuelas con respecto a la


poblacin en edad escolar.
I=

N alumnos matriculados
Poblacin en edad escolar

Ejemplo: En el ao 2001, en el departamento Robles, Pcia. de Santiago


del Estero segn el INDEC, la poblacin en edad preescolar fue de 3229
y los alumnos matriculados fue de 1272. La razn de alumnos
matriculados es entonces en ese ao de:

I=

1272
= 0.39
3229
31

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Es decir que solo el 39% del total de la poblacin en edad preescolar


asiste a la escuela en ese departamento.

Alumnos por maestro en las escuelas primarias.

I=

N alumnos
N maestros

Ejemplo: Si el total de alumnos de preescolar de una escuela es de 300


y el plantel docente es de 15 docentes (Datos ficticios), la razn alumnos
por maestro es de:

I=

300
= 20
15

Es decir que en esa escuela hay 20 alumnos por cada maestro.

Porcentaje de poblacin analfabeta de 15 aos y ms.


I=

N analfabetos de 15 aos y ms
*100
Poblacin de 15 aos y ms

Ejemplo: En la provincia de Santiago del Estero segn el INDEC, en el


ao 2001 el total de poblacin de 15 aos y ms fue de 571546
personas. De ellas, 31625 no tenan ninguna instruccin.
El Porcentaje de poblacin analfabeta para la provincia es entonces,

I=

31625
*100 = 5.53%
571546

Tasa de ausentismo de docentes.

Es el porcentaje de ausentismo de docentes en un perodo de tiempo


determinado.

Ta =

N de das de ausencia de todos los docentes en un perodo


*100
N de das de clase de todos los docentes en ese perodo

32

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Ejemplo: Si en un Jardn de Infantes hay una planta docente de 15


personas y el total de inasistencias de los docentes (por diversas
causas) en el ao es de 405, la Tasa de ausentismo se calcula como
sigue (considere que los das de clase en el ao son 180):

Ta =

405
* 100 = 15%
15 *180

Tasa de desgranamiento
Es la proporcin de alumnos ingresados al primer grado (o curso) que
no lograron culminar todos los grados (o cursos) correspondientes al
nivel, en el perodo establecido.
Td =

N de alumnos que no culminaron sus estudios en el perodo establecido


*100
N de alumnos matriculados al inicio del perodo

Ejemplo: Si en el estudio de la cohorte 1974-1980 el nmero de


alumnos matriculados en la Argentina en la escuela primaria al inicio
del perodo es de 729048 y los que no culminaron sus estudios es de
337292 (Fuente: Estado, Sociedad y Educacin en la Argentina de fin de
siglo. D. Filmus. Troquil-Bs.As.1996. Pag.87, citado por Lic. Julio
Zurita: Gua de actividades del a asignatura: Introduccin a la
estadstica Educativa. Escuela para la Innovacin educativa. UNSE.)
La Tasa de desgranamiento es:

Td =

337292
= 0,46
729048

Es decir que en ese perodo hay un desgranamiento del 46%.


El 46% de los alumnos matriculados al inicio del perodo no culminaron
sus estudios al final del mismo.

Tasa de retencin de la cohorte


Es la proporcin de alumnos ingresados al primer grado (o curso) que
lograron culminar todos los grados (o cursos) correspondientes al nivel,
en el perodo establecido.

Tr =

N de alumnos que culminaron sus estudios en el perodo establecido


* 100
N de alumnos matriculados al inicio del perodo

33

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Ejemplo: Si en el mismo perodo considerado en el ejercicio anterior


terminan el 7 grado 391756 alumnos de los 729048 matriculados, la
Tasa de retencin ser:

Tr =

391756
= 0,5374
729048

Es decir que la Tasa de retencin es aproximadamente del 54%.


El 54% del os alumnos matriculados al inicio del perodo culminaron
sus estudios al final del mismo.

Tasa de escolarizacin
Proporcin de la poblacin en edad escolar que est efectivamente
escolarizada

Ez =

N de alumnos matriculados
*100
Poblacin en edad escolar

Ejemplo: La poblacin de 5 aos y ms para Sgo. del Estero en el 2001


segn el INDEC es de 706794 habitantes. De ellos asisten a la escuela
237708.
La Tasa de escolarizacin es:

I=

237708
*100 = 33,63%
706794

Es decir que el 33.63% de la poblacin en edad escolar asiste a la


escuela.

34

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

GUA DE EJERCITACIN
Actividad 1
Clasifique en base al siguiente listado las variables socio educativas, en
cualitativas nominales u ordinales y cuantitativas discretas o continuas
Variable

Tipo

1-

Religin

2-

N de alumnos promocionados por


seccin

3-

Barrios

4-

Nivel de educacin alcanzado por


el tutor

5-

Edad de los alumnos

6-

Sexo

7-

N de inasistencias mensuales

8-

Altura de los alumnos

9-

Lugar de nacimiento

10-

Peso de los alumnos

11-

Horas de juego

12-

N de materias que cursan

13-

N de hermanos que tiene cada


alumno

14-

Grado de
asignatura

15

Superficie construida por escuela

16

N de escuelas por Departamento

17

Categoras de escuela

satisfaccin

por

la

35

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Actividad 2
Los siguientes datos corresponden a N de
inasistencias de los
alumnos de una seccin de Jardn de Infantes correspondientes al
primer cuatrimestre:

xi :

8
6
9
5

5
7
4
7

3
5
5
2

4
5
0
7

2
3
8
6

5
9
6
4

4
7
5
9

4
2
1
4

10
6
1
5

6
4
4
3

a) Que indica el subndice i?


b) Cul es la variable que se estudia?. Clasifquela.
c) Ud. debe presentar un cuadro de inasistencias de los alumnos.
Cmo construye el mismo?
d) Incluya en la tabla: frecuencias acumuladas, frecuencias
relativas, porcentaje y porcentaje acumulado correspondiente a
cada valor de la variable.
e) Presente los resultados con el grfico apropiado.

Actividad 3
A los padres de 50 alumnos de seccin de 5 aos de Jardn de Infantes
de un establecimiento de la Capital de la Pcia. de Sgo. del Estero, se les
distribuy un cuestionario con la finalidad de determinar la actitud de
los mismos ante el desempeo de los docentes. Una de las preguntas
estaba referida al grado de conformidad sobre el desarrollo de
actividades ldicas.
Los resultados obtenidos fueron los siguientes:
xi:
MC
I
MC
C
C

MD
MC
D
MD
MC

C
I
MC
MC
D

I
MC
D
I
MD

C
D
MC
C
MC

MC
MC
D
MC
I

D
MD
MD
MC
D

D
C
I
D
MC

MC
D
C
C
I

MC
C
C
MC
MC

36

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Donde:
MC: muy conforme
C: conforme
I: indiferente
D: disconforme
MD: Muy disconforme
a) Indique el tamao de la muestra
b) Ud. debe representar al establecimiento en una reunin de
docentes en la que participan distintos Colegios de la Capital.
Como presentara la opinin de los padres?
c) Que ttulo colocara a la presentacin?
d) Incluya en la misma frecuencias relativas y porcentajes
correspondiente a cada valor de la variable.
e) Presente esos mismos resultados con un grfico de barras
simples.
f) Indique si corresponde calcular frecuencia acumulada. En el caso
de respuesta afirmativa obtenga dicha frecuencia.
g) Analice los resultados obtenidos

Actividad 4
En un estudio realizado en el Jardn de infantes de la Escuela Normal
de la ciudad de La Banda para determinar la zona de influencia del
mismo segn el lugar de residencia de los alumnos, los resultados
obtenidos fueron los siguientes:
Alumnos del Jardn de Infantes de la Escuela Normal de La ciudad de
La Banda segn el barrio en el que residen.
Barrios
Barrio
Barrio
Barrio
Barrio
Total

San Martn
Villa Rosita
Menndez
Mercantil

Nmero
alumnos
100
80
40
20
240

de

Fuente: Datos ficticios

37

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

a) Que representa el nmero 100?


b) Cul es la variable de clasificacin? Indique de que tipo de
variable se trata.
c) Obtenga frecuencias relativas y los porcentajes correspondientes.
d) Determine si corresponde calcular frecuencias acumulada.
e) Realice grfico de tortas.
f) Qu otro grfico puede emplear para representar estos datos?
Actividad 5
Los siguientes datos corresponden a la edad de los tutores de alumnos
que concurren al Jardn de Infantes de un establecimiento escolar.
xi :
44
45
52
55
63
50
39

30
47
36
46
49
52
46

45
38
45
61
34
37
46

48
56
31
39
48
41
31

31
29
31
43
34
29
60

45
43
32
38
64
37
29

33
43
34
47
44
49
53

35
62
32
45
47
37
40

54
60
54
38
36
39
41

44
30
55
37
60
56
58

Presentar los datos:


a) En una tabla con un nmero conveniente de intervalos de clase.
b) En una tabla con 5 intervalos.
c) Qu grficos utilizara para representar los datos contenidos en
estas tablas?
d) Con la tabla presentada en el tem b, realice un histograma.
e) Con la tabla presentada en el tem a, realice un polgono de
frecuencias.
Actividad 6
Los siguientes datos corresponden a nios en edad preescolar en la
Pcia. de Santiago del Estero, discriminados por sexo. Ao 2001.
Categora de
edad
1(3 aos)
2(4 aos)
3(5 aos)

Total
3320
7399
14448

Sexo
Varones
Mujeres
1654
1666
3605
3794
7207
7281

FUENTE: INDEC. Censo Nacional de Poblacin, Hogares y Viviendas.


2001.

38

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

En base a los datos proporcionados en la tabla anterior realice:


a) Grfico de barras simples que muestre el nmero total de nios
que pertenecen a la primera categora de edad. Qu otro tipo de
grfico podra utilizar en la representacin?
b) Grfico
de tortas que muestre el nmero de nios
discriminados por sexo para la categora 2 de edad.
c) Realice un grfico de barras agrupadas por categora de edad.
d) Realice un grfico de barras porcentuales por categora de edad
discriminando dentro de cada una de ellas los porcentajes de
varones y mujeres.

Actividad 7
Utilice un grfico lineal para mostrar la evolucin de egresados del
Polimodal.
Ao
1980
1985
1990
1995
2000

N de
egresados
233
278
321
375
391
FUENTE: Datos ficticios

Actividad 8
En base a los datos de la siguiente tabla:
Poblacin en edad escolar, N de alumnos matriculados y N de
maestros correspondiente a cuatro lugares de la Repblica Argentina.
Lugar

Poblacin en
edad escolar

A
B
C
D

300000
150000
25000
160000

N de
N de
alumnos
alumnos no
matriculados matriculados
248.000
106.000
24.000
142.000

N de
maestros
7.000
4.000
1.200
4.750

Fuente: Datos Ficticios

39

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Calcular para cada lugar:


a)
b)
c)
d)
e)

Proporcin de alumnos matriculados


N de alumnos por maestro
Tasa de escolarizacin
Nmero de alumnos No matriculados
Porcentaje de alumnos No matriculados

Actividad 9
Dada la siguiente tabla, calcule la tasa de retencin y el desgranamiento
de cada cohorte y en base a los resultados realice el anlisis
correspondiente
Retencin y Desgranamiento de la Escuela Primaria. Su evolucin en 3
ciclos escolares del perodo 1964-1980.
Ciclo Escolar
1964 - 1970
1969 - 1975
1974 - 1980

Alumnos matriculados
1er Grado
7 Grado
723.264
321.940
751.049
375.723
729.048
391.756

Fuente: Estado, sociedad y educacin en la Argentina de fin de siglo. D.


Filmus. Troquil-Bs.As.-1996-Pg.87.Citado por Lic,. Julio Zurita: Gua
de actividades de la asignatura: Introduccin a la Estadstica Educativa.
Escuela para la Innovacin Educativa. UNSE. Ao

a) Calcule la tasa de desgranamiento


b) Calcule la tasa de retencin
c) Interprete los resultados obtenidos
Actividad 10
La siguiente tabla fue extrada del Censo Nacional de Poblacin,
Hogares y Vivienda . 2001.
Poblacin de 10 aos y ms de departamentos de Santiago del Estero,
por condicin de alfabetismo y sexo. Ao 2001.

40

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Provincia

Total
Capital
Banda
Ro
Hondo
Copo

Poblacin
de 10 aos
y ms
607.782
191.311
97.689
38.435

Total
571.067
186.724
92.937
34.962

Condicin de alfabetismo
Alfabetos
Analfabetos
Varones
Mujeres
Total
Varones Mujeres
284.309
286.758
36.715
19.030
17.685
87.894
98.830
4.587
2.299
2.288
45.066
47.871
4.752
2.461
2.291
17.361
17.601
3.473
1.960
1.513

19.241

17.264

9.156

8.108

1.977

948

1.029

a) Calcular la tasa de analfabetismo de los distintos Departamentos que


se muestran en la Tabla.
b) Cul es el porcentaje de poblacin de ms de 10 aos sabiendo que
la poblacin total de Santiago del Estero, segn el Censo del ao 2001
es de 804.457 ?
c) Cul es la tasa de analfabetismo de las mujeres en los distintos
departamentos?
d) Calcule la tasa de analfabetismo correspondiente a los varones de los
distintos departamentos.

41

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

CAPTULO II
UNIDAD III
MEDIDAS DE POSICIN Y DISPERSIN

INTRODUCCIN
En todo trabajo estadstico luego de recolectar los datos,
ordenarlos, agruparlos en tablas y presentarlos grficamente,
es
preciso extraer alguna informacin que caracterice a la poblacin de la
cual se los extrajo.
Por ello, el objetivo de ste captulo es interiorizarlos acerca de las
medidas de posicin y, variacin ms utilizadas para caracterizar a la
poblacin en estudio, y en que caso se emplea cada una de ellas,
interpretando los resultado a travs del pensamiento crtico.
Los mtodos de ste captulo suelen denominarse mtodos de
estadstica descriptiva, porque su objetivo es resumir o describir las
caractersticas importantes de un conjunto de datos. stas
caractersticas se refieren al centro, variacin, distribucin, datos
distantes y cambios a travs del tiempo.

1. MEDIDAS DE POSICIN
Supongamos que una directora est preocupada por las
inasistencias de los alumnos del jardn bajo su direccin. Necesita
resumir los datos y dar un nico valor sencillo y representativo que
pueda servir de referencia para todos los alumnos; esta medida que
sirve para ubicar el conjunto de datos en una escala de medicin, se
denominan Medidas de Posicin, y si adems indican el centro de se
conjunto de valores, se denominan Medidas de posicin y tendencia
central.
Se conocen varias formas de determinar el centro de un conjunto de
datos. A continuacin, se indicarn tres que son las ms comnmente
utilizadas: media aritmtica, mediana y modo.

42

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

1.1. Media aritmtica


La media (aritmtica) es la medida de posicin y tendencia central,
generalmente, la ms importante de todas las medidas numricas
utilizadas para describir los datos; constituye lo que la mayora de la
gente denomina promedio. Es quizs la ms conocida y usada.

a) Clculo de las media aritmtica en series simples


Ejemplo 1
Se registr los das de inasistencias en un ao, de una muestra de
cinco alumnos de la seccin materna del jardn y se desea averiguar
cul es el promedio de inasistencias de esa muestra. La variable en
estudios es:
X = n de inasistencias de los alumnos
Los valores de la variable son:
xi : 0; 16; 12; 5; 7

La media aritmtica en una serie simple de datos, se la obtiene al dividir


la suma de todos los valores de la variable entre la cantidad valores
sumados. A la media aritmtica se la representa con x :
5

0 + 16 + 12 + 5 + 7 x1 + x 2 + x3 + x 4 + x5
=
=
x=
5
5

i =1

y su frmula de clculo es la siguiente

x=

i =1

2.1

43

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

En la frmula se utiliza la letra griega (sigma mayscula) que indica


que los valores de la variable deben sumarse.
El smbolo n denota el tamao de la muestra, que es el nmero de
alumnos observados y que constituyen el nmero de valores de la
variable que se dispone para el estudio.
Cuando los datos provienen de una muestra el smbolo de la media
aritmtica es x (se denomina x barra); si se calcula la media aritmtica
con los datos de toda la poblacin se simboliza con :
N

i =1

denota la sumatoria del conjunto de valores.

expresan los diferentes valores que toma la variable.

2.2

tamao de la muestra, cantidad de valores observados

tamao de la poblacin

Como nuestros datos pertenecen a una muestra para calcular la media


utilizamos la frmula 2.1
5

x=

x
i =1

0 + 16 + 12 + 5 + 7 40
=
=8
5
5

Interpretacin: Los alumnos tienen en promedio 8 inasistencias por


ao.

44

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Algunas propiedades de la media aritmtica


1-La media aritmtica es reproductora del total.
2- Si llamamos desvo a la diferencia entre un valor y la media
aritmtica

(d ) = (x
i

x =0
xi
0
5
7
12
16
Total

d i = xi x
0 8 =-8
5 - 8 =-3
7 - 8 =-1
12 8 = 4
16 8 = 8
0

Una desventaja de la media es su sensibilidad a valores extremos, de


modo que un valor excepcional puede afectarla de una manera drstica,
en este caso no representa en forma adecuada al centro de dicho
conjunto y tiende a dirigirse a ese valor extremo.

Si por equivocacin al pasar los datos en el ejemplo de las inasistencias


de los 5 alumnos colocamos 66 en vez de 16.

Ejemplo 2
X = inasistencias de alumnos
xi : 0; 66; 12; 5; 7

La inasistencia promedio toma el valor 18,


hacia al valor extremo 66.

alejndose el promedio

x ==

x
i =1

0 + 66 + 12 + 5 + 7 90
=
= 18
5
5

45

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

La media aritmtica no representa el centro del conjunto de datos. Este


problema o desventaja se resuelve utilizando otra medida de resumen
de datos que se denomina: mediana.
La media aritmtica se puede calcular cuando los valores de las
variables son cuantitativos tanto continuos como discretos.

1. 2 Mediana.
La mediana (de un conjunto de datos): es una medida de tendencia
central que divide a la serie ordenada de datos en dos partes iguales. La
mediana se designa con Me, es un valor de variable que expresa que el
50% de los datos son menores o iguales a la mediana y el otro 50%
mayores o iguales a ella.

a) Clculo de la mediana en series simples


Ejemplo 3
Se desea determinar el valor mediano de las inasistencias de los
alumnos del ejemplo 2,
El tamao de la muestra, n es impar.
X: inasistencias de alumnos
xi : 0; 66; 12; 5; 7
Para su clculo debemos ordenar primero los datos en forma
ascendente o descendente.
Si el nmero de observaciones es impar, la mediana es el valor de la
variable que se localiza exactamente en la mitad de la lista.
En caso de que el nmero de observaciones fuera par, el valor de la
mediana se obtiene promediando los dos valores centrales.
El o los valores centrales se ubican con:

n +1
2

46

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Solucin. Primero se ordenan los datos


0; 5; 7; 12; 66.
Se cuenta el nmero de valores de la muestra, n = 5 es un nmero
impar se busca la ubicacin de la mediana

5 +1 6
= =3
2
2
Este valor nos indica que el valor de la mediana esta ubicado en el
tercer lugar:
0; 5; 7; 12; 66.
Me = 7 inasistencias

Interpretacin: el 50% de las inasistencias son menores o iguales a 7.

Ejemplo 4
En el caso de que n sea par
X = inasistencias de alumnos
xi : 0; 66; 12; 5; 7;10

Solucin. Primero se ordenan los datos


0; 5; 7; 10; 12; 66.

Las muestra posee tamao n = 6 valores, es un nmero par se busca la


ubicacin de la mediana

Posicin de los valores centrales

6 +1 7
= = 3,5
2
2

Los valores centrales son dos y ocupan el tercer y cuarto lugar, como la
mediana es un nico valor se la obtiene como el promedio de esos dos
valores centrales:

47

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

0; 5; 7; 10; 12; 66

Me =

7 + 10
= 8,5 8
2

Interpretacin: el 50% de las inasistencias de los alumnos son


menores o iguales a 8.
Deben quedar claro dos conceptos:
Primero: La mediana no se ve influenciada por los valores extremos, ya
que en su clculo interviene el orden y no la magnitud de los valores.
Segundo: la media aritmtica es sensible a valores extremos.
La mediana se puede determinar cuando los valores de las variables son
cuantitativos tanto continuos como discretos y para variables
cualitativas que se miden en escala ordinal.

1. 3. Modo.
El Modo es el valor de la variable que ocurre con mayor frecuencia. Se
designa frecuentemente como Mo.
Se debe hacer notar aqu que el Mo es un valor de variable y la
frecuencia de este valor sugiere su importancia estadstica.
Cuando dos valores ocurren con la misma frecuencia y sta es la ms
alta, ambos valores son modas, por lo que el conjunto de datos es
bimodal.
Cuando ms de dos valores ocurren con la misma frecuencia y sta es
la ms alta, todos los valores son modas, por lo que el conjunto de
datos es multimodal.
Cuando ningn valor se repite, se dice que no hay moda.

48

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Ejemplo 5.
Calcule las modas para los siguientes conjuntos de datos:
Serie A: 4,5; 7,6; 2,8; 4,5; 3,6; 2,6
Serie B: 4; 5; 3; 4; 6; 8; 5
Serie C: 27; 27; 27; 55; 55; 55; 88; 88; 99
Serie D: 1; 2; 3; 6; 7; 8; 9; 10

Solucin:
En la serie A. El nmero 4,5 es la moda pues es el valor que ocurre
con mayor frecuencia (2 veces).
En la serie B. Los nmeros 4 y 5 son modas, ya que ambos ocurren
con la frecuencia ms alta (2 veces).
En la serie C. Los nmeros 27 y 55 son modas, ya que ambos ocurren
con la frecuencia ms alta (3 veces).
En la serie D. No hay moda, ya que ningn valor se repite.
La moda puede determinarse en variables cuantitativas continuas y
discretas, en variables cualitativas ordinales y nominales, pero es la
nica medida de posicin y tendencia central que puede usarse cuando
se trata de variables cualitativas nominales.

Ejemplo 6.
Una encuesta efectuada a los padres de los alumnos del jardn sobre la
actitud de los nios al concurrir a su jardincito mostr que el 100
concurren contentos al jardn; 76 concurren protestando; 39 concurren
llorando. La nica medida que disponemos para resumir estos datos en
un nico valor es el modo. El valor modal de la actitud es concurren
contentos.
No podemos calcular la media por que no se pueden sumar los valores
de la variable que son: contentos, protestando, llorando; tampoco
podemos calcular la mediana pues no podemos ordenar los valores, de

49

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

ah que la nica medida para resumir los valores de una variable


cualitativa medida en escala nominal es el modo.

1.b. Clculo de las medidas de posicin en series de frecuencias


Veremos como se calculan la medidas de posicin y tendencia central
cuando los datos estn agrupados en una serie de frecuencias.

1.1.b. Media aritmtica.


Como en una serie de frecuencias, fi nos indica las veces que se repite
el valor de la variable, debemos considerarlas en el clculo de la media
aritmtica.

Ejemplo 7
La profesora de nivel inicial esta interesada en conocer el nmero
promedio de hermanos que tienen sus alumnos. Para ello toma la ficha
de 25 alumnos y ordena los datos de inters en la tabla 1.

Tabla 1. Alumnos de la primera seccin del Jardn Municipal N 1,


clasificados segn el nmero de hermanos.
N de hermanos

N de alumnos

(xi)
0
1
2
3
4
Total

(fi)
1
9
7
5
3
25
Fuente: Datos ficticios

Si aplicamos la frmula 2.1, deberamos sumar 1 vez cero, nueve veces


1 y as sucesivamente hasta sumar 3 veces 4 y dividir esa suma entre
25 que es el tamao de la muestra.

50

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

xi: n de hermanos
fi : nmero de alumnos que poseen xi hermanos
25

x ==

i =1

25

0 + 1... + 1 + 2... + 3... + 4... + 4 50


=
=2
25
25

Pero, este clculo se podra realizar en forma ms simple y es obtener


esa misma suma reemplazndola por la multiplicacin. Utilizando la
frecuencia fi que indica las veces que se repite el valor de la variable xi.

x=

xi f1 + x 2 f 2 + ... + x5 f 5
f1 + f 2 + ... + f 5

ahora expresando literalmente la frmula de la media aritmtica


tenemos

x=

1 n
xi f i
n i =1

Este promedio se conoce como media aritmtica ponderada. Para poder


calcular la media aritmtica ponderada correspondiente al ejemplo
planteado, agregamos a la tabla de frecuencias anterior una columna
auxiliar que facilitar el clculo de la media.

Tabla 2. Alumnos de la primera seccin del Jardn Municipal N 1,


clasificados segn el nmero de hermanos.
N de hermanos

N de alumnos

xi*fi

(xi)
0
1
2
3
4
Total

(fi)
1
9
7
5
3
25

0
9
14
15
12
50
Fuente: Datos ficticios

51

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Podemos concluir diciendo que los alumnos de la primera seccin del


Jardn Municipal N 1 en promedio poseen 2 hermanos.

1.2.b. Mediana
El clculo del valor mediano del n de hermanos que poseen los
alumnos de nivel inicial de una escuela rural, se realiza de la siguiente
manera, cuando los datos estn presentados en una serie de
frecuencias (tabla 3).
En esta serie de frecuencias de variable cuantitativa discreta, los
datos ya estn ordenados, por lo que solo resta encontrar el valor
central, cuya posicin se encuentra en el lugar

n + 1 44 + 1 45
=
=
= 22,5
2
2
2
Tabla 3. Alumnos de la primera seccin del Jardn de una escuela
rural, clasificados segn el nmero de hermanos.
N de hermanos
(xi)

2
3
4
5
Total

N de
alumnos
(frecuencia,
fi)
5
5
30
4
44
Fuente: Datos ficticios

O sea tenemos 2 valores centrales que estn ubicados en los lugares 22


y 23. El valor mediano ser el promedio de los valores de la variable
ubicados en esos lugares. Para ubicar dichos valores se deben seguir
los siguientes pasos:

52

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

1.-Calcular las frecuencias acumuladas correspondientes a cada


valor de la variable.

Tabla 4. Alumnos de la primera seccin del Jardn de una escuela


rural, clasificados segn el nmero de hermanos.
N de
hermanos

N de
alumnos

(xi)

(frecuencia,
fi )

2
3
4
5
Total

5
5
30
4
44

Frecuencias
acumulada
(Fi)

5
10
40
44
Fuente: Datos ficticios

2.-Calcular el orden de localizacin de la mediana efectuando el


cociente

n + 1 44 + 1 45
=
=
= 22,5
2
2
2
donde n = tamao de la muestra
Como el valor de la mediana se encuentra entre la posicin 22 y la
posicin 23, se busca en la columna de frecuencias acumuladas, el
menor valor que contiene a 22 (es 40), al que corresponde el valor de
variable 4 y el menor valor que contiene a 23 (es 40), al que
corresponde el valor de variable 4.
Por lo que el valor mediano es el promedio de los dos valores centrales.

Me =

4+4
=4
2

Interpretacin: el 50 % de los alumnos de nivel inicial del Jardn de


una escuela rural, tienen 4 hermanos o menos.

53

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

1.3.b. Moda
Ejemplo: Calcular el valor ms frecuente del nmero de hermanos
alumnos de nivel inicial de del Jardn de una escuela rural (Tabla 3).
Solucin: La variable que se estudia es una variable cuantitativa
discreta.
Se busca en la columna fi el valor ms alto, en este ejemplo es 30.
El valor de la moda es el valor de la variable que tiene frecuencia 30, es
decir
Mo = 4 hermanos
Interpretacin: La mayora de los alumnos de alumnos de nivel inicial
de del Jardn de una escuela rural poseen cuatro hermanos.
1.c. Variable agrupada en serie de frecuencias con intervalos de
clase, para variable aleatoria continua

1.1.c. Media aritmtica.


Ejemplo
Para realizar un estudio sobre la nutricin de la poblacin infantil que
concurre a la escuela en una localidad rural, se consultaron los pesos,
en kilogramos, de los 50 alumnos de la escuela. Los que se encuentran
en la Tabla 5. Los datos se agruparon en intervalos de amplitud 2 kg y
con lmites enteros. Determine el peso promedio de los alumnos.
Tabla 5. Peso de los alumnos del Jardn de una escuela rural.
Intervalo
(kg)
10 a 12
12 a 14
14 a 16
16 a 18
18 a 20
Total

N de
alumnos

Marca de
clase

fi
12
19
7
6
6
50

xi
11
13
15
17
19

xi * fi

132
247
105
102
114
700

Fuente: Datos ficticios

54

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Solucin
1.- Se calcula las marcas de clase.
Al organizar de esta forma los datos, se pierde informacin, pues la
tabla indica, por ejemplo que hay 12 alumnos que pesan entre 10 kg y
12 kg, pero no cuanto pesan realmente cada uno de ellos. Ahora
debemos encontrar un nico valor que represente o resuma a todos los
valores del intervalo, ese valor es el promedio o media aritmtica de los
lmites del intervalo, a este promedio se lo denomina punto medio de la
clase o marca de clase. Este valor representar el valor xi de la frmula
de la media.

x1 =

10 + 12
= 11
2

x2 =

12 + 14
= 13 = xi + a = 11 + 2 = 13
2

Se introduce una nueva columna en la tabla que la denominaremos xi.


La frmula para encontrar la media en serie de frecuencias es

x=

1 n
xi f i
n i =1

Pero en este caso xi representa a la marca de clase


n=tamao de la muestra=

fi

Ahora ya estamos en condiciones de aplicar la frmula para el clculo


de la media aritmtica, por ello agregamos una columna que es el
producto de cada marca de clase por su frecuencia (xi*fi).

x=

1 n
1
xi f i =
* 700 = 14kg

n i =1
50

55

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Interpretacin: Los alumnos pesan en promedio 14 kg.


1.2.c. Mediana
Ejemplo
Se desea conocer el peso mediano de los 50 alumnos de una escuela
rural (Tabla 5). El clculo de la mediana en serie de frecuencias para
variable cuantitativa continua se efecta utilizando la siguiente frmula

f
Me = L inf +

Fant Me
f Me

*a

L inf : lmite inferior de la clase mediana

2 : Suma de la frecuencia entre 2


F

ant Me

: frecuencia acumulada anterior a la clase mediana

f Me : frecuencia absoluta de la clase mediana


a:

amplitud del intervalo a = Lsup- Linf

Peso de los alumnos del Jardn de una escuela rural.


Intervalo

N de
alumnos

(kg)
10 a 12
12 a 14
14 a 16
16 a 18
18 a 20
Total

fi
12
19
7
6
6
50

Fuente: Datos ficticios

56

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Solucin
1-En la tabla se agrega una columna en la cual se calcula los valores de
frecuencias acumuladas.
Peso de los alumnos del Jardn de una escuela rural.
Intervalo

N de alumnos

Fi

(kg)
10 a 12
12 a 14
14 a 16
16 a 18
18 a 20
Total

fi
12
19
7
6
6
50

12
31
38
44
50

Fuente: Datos ficticios

2-

Se calcula

El tamao de la muestra se divide entre 2 porque la Mediana es el valor


de la variable que divide la serie ordenada de datos en 2 partes iguales.

f
2

50
= 25
2

3- Se busca en la columna Fi el menor valor que contiene a 25, el valor


que corresponde es 31, se seala la clase mediana y se aplica la
frmula.

f
Me = L inf +

Fant Me
f Me

*a

50
12
25 12
13 * 2
2
Me = 12 +
* 2 = 12 +
* 2 = 12 +
= 12 + 1,37 = 13,37
19
19
19
Interpretacin:
El 50% de los alumnos pesan 13,37 kg o menos.

57

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

1.3.c. Moda
Ejemplo
Se desea conocer el peso ms frecuente de los 50 alumnos de una
escuela rural. El clculo del modo en serie de frecuencias para variable
cuantitativa continua se efecta utilizando la siguiente frmula
Mo = Linf Mo +

D1
*a
D1 + D2

Donde:

D1 = f Mo f anterior a la clase

Modal

D 2 = f Mo f posterior a la clase Modal


a: amplitud del intervalo

Solucin
En la columna fi se busca el valor ms alto, en nuestro ejemplo 19, se
seala la fila, ella constituye la clase modal.
Se calcula:
D1 = 19 12 = 7
D2 = 19 7 = 12

a = 14 - 12 = 2

Se aplica la frmula

Mo = 12 +

7
7
14
* 2 = 12 + * 2 = 12 + = 12,74kg
12 + 7
19
19

Interpretacin: el peso ms frecuente del grupo de alumnos es de


12,74 kg.

58

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Relacin entre media, mediana y modo


Cuando la media, la mediana y el modo coinciden, la serie de datos
presenta una distribucin simtrica unimodal (figura 1).

= Me=Mo
Figura 1. Distribucin simtrica.
Cuando esa coincidencia no existe, se dice que la distribucin unimodal
es asimtrica.
La asimetra es positiva (figura 2) cuando la media es mayor que la
mediana y la mediana mayor que el modo, en ste caso vemos que la
media aritmtica se dirige hacia el o los valores extremadamente
grandes

Mo < Me <

Figura 2. Distribucin asimtrica positiva.


La distribucin presenta asimetra negativa ( figura 3) cuando la media
es menor que la mediana y la mediana menor que el modo; en ste caso
vemos que la media aritmtica se dirige hacia el o los valores
extremadamente pequeos.

59

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

< Me< Mo

Figura 3. Distribucin asimtrica negativa.


La distancia entre la media aritmtica y el modo podra usarse como
una medida de asimetra (Ya-Lun Chou, 1990).
Asimetra = media modo
En nuestro ejemplo:
Media = 14
Mo = 12,74
Asimetra =14 - 12,74= 1,26 Resultado positivo, la distribucin es
asimtrica positiva

Cunto mayor es esta distancia, negativa o positiva, tanto ms


asimtrica es la distribucin.

2- MEDIDAS DE LOCALIZACIN
Son Medidas de Posicin que dividen los valores ordenados de una serie
en cuatro, diez o cien partes iguales y se denominan cuartiles, deciles y
percentiles.
2.1 Cuartiles
Los cuartiles son tres valores Q1, Q2, Q3,
ordenada en cuatro partes iguales.

que dividen a la serie

Por debajo del primero quedan el 25% de los datos; por debajo del
segundo el 50% de los mismos y por debajo del tercero el 75%. El
segundo cuartil coincide con la Mediana.

60

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

2.2 Deciles
Los Deciles son nueve valores de la variable que dividen a la serie
ordenada de datos en 10 partes iguales, el decil 5 coincide con la
Mediana, es decir el 50% de los valores son menores o iguales al D5.
2.3 Percentiles
Los percentiles son 99 valores de la variable, que dividen al conjunto de
datos (ordenados de menor a mayor en cien partes iguales); el percentil
50 coincide con la mediana. El percentil 25 coincide con el primer
cuartel, el percentil 75 coincide con el valor del tercer cuartel. Los
percentiles se designan con la letra Pi, el subndice i, vara de 1 a 99,
indicando el valor del percentil, que se desea calcular.
9 Clculo de percentiles:
Para calcular los percentiles de una distribucin de frecuencias se
procede del mismo modo que en el caso de la mediana, salvo que ahora
n= fi
en cien partes iguales en
dividiremos al tamao de la muestra
vez de dos.

Ejemplo
Se desea conocer P20 de los das de licencia solicitadas por los
profesores de las escuelas de nivel inicial en la ciudad de Santiago del
Estero en el ao 2004.
Tabla 6. Das de inasistencia de los profesores de las escuelas de nivel
inicial en la ciudad de Santiago del Estero en el ao 2004.
Intervalo de clase

N de docentes

Fi

(das de licencia)
0 a 10
10 a 20
20 a 30
30 a 40
40 a 50
50 a 60
60 a 70
70 a 80
80 a 90
90 a 100
Total

(fi)
30
60
60
70
90
100
60
40
10
10
530

30
90
150
220
310
410
470
510
520
530

Fuente: Datos ficticios

61

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

El clculo de percentiles para variables agrupadas en serie de


frecuencias en intervalos de clase, se efecta utilizando la siguiente
frmula:
i fi
Pi = L inf + 100

inf

Fant Pi
f Pi

*a

: Lmite inferior de la clase donde se encuentra el percentil

i = valor del percentil que se busca


Fant Pi: frecuencia acumulada anterior a la clase donde se encuentra el
Percentil i
fPi :frecuencia absoluta de la clase donde se encuentra el Pi
a:

amplitud del intervalo a =Lsup- Linf

Solucin
Clculo del percentil 20
Pasos
1.- Se agrega una columna de frecuencias acumuladas (Fi)
2.- Se calcula

i fi
100

20 * 530
= 106
100

3.- Se ubica en la columna Fi el menor valor que contiene a 106, en


nuestro ejemplo 150.
4.- Se calcula a: Lsup Linf = 30-20=10
5.- Se aplica la frmula.

P20 = 20 +

106 90
16 *10
*10 = 20 +
= 22,67 23 das
60
60

62

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Interpretacin
P20 = 23 das
El 20 % de los docentes toman 23 das de licencia o menos
9 Rango percentil
Se puede presentar, el problema inverso, es decir, conocer cuntos
profesores de nivel inicial toman 52 das de licencia o menos, es decir
nos dan como dato un valor de la variable y nos preguntan que
percentil le corresponde; a este procedimiento se lo denomina calcular
el Rango percentil.
Es decir el rango percentil de un valor dado es el porcentaje de valores
comprendidos debajo del valor solicitado.
Ejemplo:
Calcular el rango percentil que le corresponde a 52 das de licencia de
los de los profesores de las escuelas de nivel inicial en la ciudad de
Santiago del Estero en el ao 2004.
Repetimos la tabla 6 para visualizar mejor el clculo.
Das de inasistencia de los profesores de las escuelas de nivel inicial en
la ciudad de Santiago del Estero en el ao 2004.
Intervalo de clase

N de docentes

Fi

(das de licencia)
0 a 10
10 a 20
20 a 30
30 a 40
40 a 50
50 a 60
60 a 70
70 a 80
80 a 90
90 a 100
Total

(fi)
30
60
60
70
90
100
60
40
10
10
530

30
90
150
220
310
410
470
510
520
530

Fuente: Datos ficticios

63

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Solucin
1.- Ubicamos en la tabla el intervalo de clase donde se encuentra el
valor 52 es el intervalo que va de 50 a 60.
2.- Se calcula la Frecuencia acumulada que le correspondera al valor
52 con la siguiente frmula:

F ( xi ) =

( xi Linf )
* f int erv + FClase anterior
a

Donde:
F(xi)=

Frecuencia acumulada correspondiente al valor que se busca

Linf

Lmite inferior del intervalo de clase donde se encuentra xi

finterv

Frecuencia absoluta del intervalo donde se encuentra xi

amplitud del intervalo

F clase ant. Frecuencia acumulada de la clase anterior al intervalo


donde se encuentra xi

F (52) =

(52 50)
2 *100
*100 + 310 =
+ 310 = 330
10
10

3.- Se calcula ahora el rango percentil con la siguiente frmula


Rp =

Rp =

F ( xi )
*100
fi

330
* 100 = 62.26% 62%
530

Interpretacin:
El 62% de los los profesores de las escuelas de nivel inicial en la ciudad
de Santiago del Estero en el ao 2004, toman 52 das de licencia o
menos.

64

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Clculo grfico de percentiles y rango percentil


Ejemplo
Calcular grficamente el percentil 20
Solucin
Se debe construir un grfico de lneas; los pares de valores a graficar
corresponden al lmite superior del intervalo con el porcentaje
acumulado correspondiente.
1.- Calcular porcentaje acumulados. Para ello se necesita calcular:
a) frecuencia relativa para cada intervalo
b) porcentaje
c) porcentaje acumulado
2.- Se grafica un polgono (Lsup; %acum.). El grfico que se obtiene se
denomina ojiva.
Das de inasistencia de los profesores de las escuelas de nivel inicial en
la ciudad de Santiago del Estero en el ao 2004.
Intervalo de
clase

N de
docentes

(das de
licencia)
0 a 10
10 a 20
20 a 30
30 a 40
40 a 50
50 a 60
60 a 70
70 a 80
80 a 90
90 a 100
Total

(fi)
30
60
60
70
90
100
60
40
10
10
530

fri

Porcentaje
fri*100

0,0566
0,1132
0,1132
0,1321
0,1698
0,1887
0,1132
0,0755
0,0189
0,0189

5,67= 6
11,32 = 11
11,32 = 11
13,21 = 13
16,98 = 17
18,87 = 19
11,32 = 11
7,55 = 8
1,89 = 2
1,89 = 2
100

Porcentaje
acumulado

6
17
28
41
58
77
88
96
98
100

65

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

100
90
80
70

60
50
40
30
20
10
0
0

10

20

30

40

50

60

70

80

90

100

Das

5.-Si deseamos calcular el valor que corresponde al percentil 20. Se


ubica el valor 20 en el eje vertical y se traza una paralela al eje
horizontal hasta la curva y luego se traza una vertical hasta encontrar
el valor de das correspondiente, el que aproximadamente es 23.

Interpretacin:
El 20 % profesores de las escuelas de nivel inicial en la ciudad de
Santiago del Estero en el ao 2004 incurren en 23 das de licencia o
menos.
6.-Si deseamos conocer cual es el rango percentil que corresponde a 52
das, ubicamos ese valor en el eje horizontal y trazamos una paralela al
eje vertical hasta la curva y desde all una paralela al eje horizontal,
leemos en el eje vertical el valor correspondiente al rango percentil
(aproximadamente 60).

66

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

100
90
80
70

60
50
40
30
20
10
0
0

10

20

30

40

50

60

70

80

90

100

Das

Los valores correctos se obtienen utilizando las frmulas presentadas


anteriormente.

3.-MEDIDAS DE VARIABILIDAD O DISPERSIN


Las Medidas de Posicin no son suficientes para describir el conjunto
de datos sino que es necesario tener una idea de como se distribuyen
los datos alrededor del centro de la distribucin. Para eso surgen las
Medidas de Dispersin.

3.a.-MEDIDAS DE VARIABILIDAD EN SERIES SIMPLE. SU CLCULO


3.a.1. RANGO
Es llamado tambin amplitud total de variacin de la variable. Se lo
obtiene como la diferencia entre el valor mximo y mnimo de la
variable.
Distribucin A: 1, 5, 5, 5, 5, 5, 5, 5, 5, 9
Distribucin B: 1, 1, 2, 4, 5, 6, 7, 7, 8, 9
Rango = Valor mayor Valor menor
RA = 9 -1 = 8
RB = 9 -1 = 8

67

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Estas series tienen igual valor del rango, a pesar de que notamos que la
variabilidad de las dos distribuciones es diferente.
La desventaja de esta medida es que solo considera los valores extremos
sin tener en cuenta el comportamiento del resto de las observaciones.
Por lo que observamos que a pesar de tener variabilidades diferentes las
dos distribuciones, el rango no la capta.
Para solucionar este problema surgen otras medidas como el desvo
medio.
Si se considera las distribuciones anteriores:
Distribucin A: 1, 5, 5, 5, 5, 5, 5, 5, 5, 9
Distribucin B: 1, 1, 2, 4, 5, 6, 7, 7, 8, 9
Cmo se puede medir la variabilidad de un conjunto de datos? Si por
variabilidad se entiende el grado en que los valores de la distribucin
difieren de la media y entre si, entonces la desviacin promedio de los
valores a partir de la media puede resultar una medida razonable de
variabilidad

(x

Pero por propiedades de la media sabemos que la suma de los desvos


de los valores respecto a la media es siempre es cero, pues las
desviaciones positivas respecto a la media, anulan siempre a las
desviaciones negativas de la misma, con lo que resulta siempre un valor
promedio de cero.
Como esta medida de variabilidad parece razonable, debemos redefinir
nuestra medida para evitar los valores negativos. Una manera de
hacerlo es considerar el valor absoluto de los desvos; la medida que se
obtiene se denomina:

68

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

3.a.2.DESVIO MEDIO:
Se define como el promedio del valor absoluto de los desvos; se
designa con
DM.
DM =

d
n

Tabla 7: Distribucin del nmero de hermanos de un grupo de


alumnos.
xi
1
5
5
5
5
5
5
5
5
9
xi = 50
x=5

di=

xi x

-4
0
0
0
0
0
0
0
0
4
(d i ) = 0

di

4
0
0
0
0
0
0
0
0
4
di = 8
DM =

8
= 0,8
10

Fuente: Datos ficticios


Pero generalmente no se puede operar fcilmente cuando se
trabaja con valor absoluto, por eso se considera una segunda forma de
modificar esos signos negativos y consiste en elevar los desvos al
cuadrado, lo que dar desvos al cuadrado positivos. Esta nueva medida
de variabilidad se denomina varianza.
3.a.3. Varianza es el promedio de los desvos al cuadrado y se designa
con S2 cuando se trata de una muestra y es un mejor
estimador de la varianza poblacional( ) cuando la suma
de los desvos al cuadrado se divide entre el tamao de la
muestra menos 1; por ello la frmula para calcular es para:
2

Variancia de una muestra (series simples)

69

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

(x x )
n

S2 =

i =1

n 1

Varianza poblacional
n

2 =

(x )

i =1

Cuntos ms tiendan los valores a diferir de la media, mayor ser la


varianza. El valor numrico de la varianza de una distribucin depende
de la unidad de medida que se utilice. Por consiguiente, cuando se
compara la varianza de dos o ms distribuciones, hay que estar seguro
que la unidad de medida empleada es igual en todas las distribuciones.
En el ejemplo de la Tabla 7:
Distribucin del nmero de hermanos de un grupo de alumnos.
xi

di= xi x
-4
0
0
0
0
0
0
0
0
4
(d i ) = 0

1
5
5
5
5
5
5
5
5
9
xi = 50
x=5

d12 = xi x

(x

S2 =

16
0
0
0
0
0
0
0
0
16

x = 32
32
= 3,56
9

Fuente: Datos ficticios

(x x )
n

S2 =

i =1

n 1

32
= 3,56
9

S2 = 3,56, aproximadamente 4 hermanos


Otra desventaja es que la varianza se expresa, en unidades al cuadrado
y no en trmino de las unidades originales de medicin, lo que hace
difcil la tarea de relacionar en forma significativa el valor de la varianza

70

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

con el conjunto original de datos.


Por eso es conveniente, considerar una medida de variabilidad que se
exprese en unidades originales. Esta nueva medida denominada
desviacin estndar se obtiene al extraer a la varianza la raz cuadrada.
3.a.4.Desviacin estndar muestral

(x x )
n

S=

i =1

n 1

(x x )
n

S=

i =1

n 1

32
= 3,56 = 1,89
9

S = 2 hermanos

Desviacin estndar poblacional


n

(x )

i =1

Debe quedar claro que la desviacin estndar mide la variacin entre


los valores. Los valores cercanos producirn una desviacin estndar
pequea, mientras que los valores dispersos producirn una desviacin
estndar ms grande.

71

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

3.b.-MEDIDAS DE VARIABILIDAD EN SERIES DE FRECUENCIA


SIMPLE. SU CLCULO
Ejemplo: Calcular la variabilidad de las inasistencias de 32 alumnos.
Tabla N 8. Inasistencias de 32 alumnos.
N de
inasistencias

N de
alumnos

(xi)
11
12
14
15
23
Total

(fi)
12
9
5
4
2
32

FUENTE: Datos ficticios

Cuando se trata de variables cuantitativas discretas el Rango se


calcula:
3.b.1. Rango = Valor mximo - Valor mnimo + 1
Rango = R = 23 11 + 1 = 13 inasistencia
3.b.2 Desvo medio en serie de frecuencia simple

DM =

d * f x x *f
f
f
i

Clculo:
1) Se calcula la media aritmtica
2) Se calculan los desvos
3) Se obtiene el valor absoluto y se los multiplica por sus
frecuencias
4) Se aplica la frmula

72

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Inasistencias de 32 alumnos.
N de
inasistencias

N de
alumnos

(xi)
11
12
14
15
23

(fi)
12
9
5
4
2
32

xi*fi

d i = xi x

d1

di * fi

132
108
70
60
46
416

-2
-1
1
2
10

2
1
1
2
10

24
9
5
8
20
66

x=

x * f
f
i

416
= 13
32

El promedio de la inasistencia de los alumnos es de 13 das


DM =

d *f
f
i

66
= 2,06
32

DM= 2 das
3.b.3. Varianza en serie de frecuencia simple

(x x )
n

S =
2

i =1

n 1

(x x ) f
=
f 1
n

fi

i =1

1) Se calcula la media aritmtica


2) Se calculan los desvos
3) Se elevan los desvos al cuadrado
4) Se multiplica cada desvo al cuadrado por su frecuencia
5) Se aplica la frmula

73

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Inasistencias de 32 alumnos.
N de inasistencias

N de alumnos

xi*fi

d i = xi x

d i2

d i2 * f i

(xi)
11
12
14
15
23

(fi)
12
9
5
4
2
32

132
108
70
60
46
416

-2
-1
1
2
10

4
1
1
4
100

48
9
5
16
200
278

FUENTE: Datos ficticios

(x x )
n

S =
2

i =1

fi

n 1

278
278
=
= 8,97 9 das 2
32 1 31

3.b.4. Desviacin estndar en serie de frecuencia simple

(x x ) * f
n

S=

(x x ) * f
n

S=

i =1

i =1

i =1

n 1

(x x ) * f
f 1
n

n 1

278
278
=
= 8,97 = 2,99 3 das
32 1
31

3.c.- MEDIDA DE VARIABILIDAD EN SERIE DE FRECUENCIAS DE


INTERVALOS DE CLASE
Los siguientes datos corresponden a peso de los alumnos del Jardn de
una escuela rural.
Peso de los alumnos del Jardn de una escuela rural.
Intervalo
(kg)
10 a 12
12 a 14
14 a 16
16 a 18
18 a 20
Total

Marca de
clase

N
de
alumnos

(xi)
11
13
15
17
19

fi
12
19
7
6
6
50
Fuente: Datos ficticios

74

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

3.c.1.Rango
R = L. superior de la ltima clase L. inferior de la primera clase.
Como los lmites superiores de las clases son abiertos, es decir no toma
el valor 20, debemos colocar el valor 19,99
R =19,99 6 = 13,99 kg
3.c.2. Desvo medio en serie de frecuencia de intervalos
1) Se calcula la marca de clase y luego la media aritmtica
x=

x * f
f
i

700
= 14kg
50

2) Se calcula los desvos


Peso de los alumnos del Jardn de una escuela rural.
Marca de
clase

Intervalo
(kg)

N
de xi*fi
alumnos

(xi)
11
13
15
17
19

10 a 12
12 a 14
14 a 16
16 a 18
18 a 20
Total

fi
12
19
7
6
6
50

d i = ( xi x)

d1

d1

-3
-1
1
3
5

3
1
1
3
5

36
19
7
18
30
110

132
247
105
102
114
700

*fi

Fuente: Datos ficticios


3) Se obtiene el valor absoluto de los desvos
4) Se multiplica cada desvo absoluto por su frecuencia, se suma
5) Se aplica la frmula
DM =

d * f
f
i

110
= 2,2kg
50

75

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

3.c.3. Variancia en serie de frecuencia de intervalos


1) Se calcula la media aritmtica
2) Se calculan los desvos
3) Se elevan los desvos al cuadrado
4) Se multiplica cada desvo al cuadrado por su frecuencia
5) Se aplica la frmula.
6)
Peso de los alumnos del Jardn de una escuela rural.
Marca de
clase

Intervalo
(kg)

(xi)
11
13
15
17
19

10 a 12
12 a 14
14 a 16
16 a 18
18 a 20
Total

N
de xi*fi
alumnos
fi
12
19
7
6
6
50

132
247
105
102
114
700

d i = ( xi x)

d i2

d i2 *
fi

-3
-1
1
3
5

9
1
1
9
25

108
19
7
54
150
338

Fuente: Datos ficticios


Varianza en serie de frecuencias de intervalos, la nica diferencia con
las frmulas para serie de frecuencias simples es que xi, representa el
punto medio de la clase o marca de clase

(x x )
n

S =
2

i =1

n 1

fi

338
338
=
= 6,9 kg 2
50 1 49

3.c.4. Desviacin estndar en serie de frecuencias de intervalos

(x x ) * f
n

S=

i =1

n 1

176
338
=
= 6,9 = 2,63kg
50 1
49

76

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

COEFICIENTE DE VARIACIN
Las cuatro medidas de variabilidad enunciadas precedentemente son
medidas de variabilidad absoluta. El coeficiente de variacin es una
medida de variabilidad relativa.
Expresa la desviacin estndar como un porcentaje de la media. Es una
medida adimensional, se expresa en % y sirve para comparar la
variabilidad entre dos o ms distribuciones que provengan de diferentes
unidades de medidas o teniendo igual unidad de medida los valores de
diferente magnitud.

Coeficiente de variacin muestral

C.V . =

S
100
x

Ejemplo
Decir cual de las siguientes distribuciones es ms variable:
xi: peso de los alumnos de nivel inicial (kg)
34 29 28 31 40
yi: altura de los alumnos de nivel inicial (m)
1,24 1,54 1,38 1,37 1,56
x = 32,4 kg Sx = 4,83kg

y =1,42 m

Sy = 0,13m

No podemos decir que la variabilidad en peso es mayor que la


variabilidad en altura, ya que las variables estn medidas en distintas
unidades, para poder compararlas la debemos expresar como
porcentaje de sus medias
CVx = (4,83/32,4)*100 = 14,91%
CVy = (0,13/1,42)*100 = 9,15%

77

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Conclusin: los alumnos tienen menor variabilidad en altura que en


peso.

Uso de la calculadora cientfica para el clculo de Medidas de


Posicin y Dispersin Calculadoras Casio modelo fx-82W.
Seguir las siguientes instrucciones:
Debe procurar que la calculadora se encuentre en disposicin para
efectuar clculos estadsticos. Para ello apriete mode 2 y en la parte
superior de la pantalla debe aparecer la notacin SD.
Debe cerciorarse de que no hay nada acumulado en la memoria. Para
ello pulse SHIFT AC = y en su pantalla aparece el nmero cero. Se esta
en condiciones de introducir los datos.
Por ejemplo para serie simple: xi: 1 2 3 4 5
Marque el n 1 y luego la tecla M+
Marque el n 2 y luego la tecla M+
Marque el n 3 y luego la tecla M+

As sucesivamente hasta haber cargado todos los datos.


Para cerciorarse de la cantidad de datos introducidos
Pulse ALPHA y la tecla 3 en el cursor aparece la letra n, apriete ahora =
y aparecer el 5, si Ud. Introdujo los 5 valores.

Para obtener la media aritmtica pulse SHIFT y la tecla 1, en la pantalla


aparece
x

apriete = y en su pantalla aparece el valor 3 que es el valor de la media


Para obtener la desviacin estndar marque SHIFT y la tecla 3, aparece
en su pantalla

78

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

n1
presione = y en su pantalla aparecer el valor1,58
Si aprieta ahora la tecla x2 obtendr 2,50 que es el valor de la varianza
muestral S2.

Si desea obtener la suma de los valores de x presione Alpha y la tecla 2.


Para el caso de que la serie sea de frecuencia simple.
Se coloca la mquina en modo estadstica Mode 2.

Presione SHIFT AC =; ya tiene la memoria limpia.


Se introduce el valor xi, luego SHIFT, la tecla que tiene la coma aparece
en la pantalla xi; ahora introduzca el valor de fi y una vez que tenga en
la pantalla xi;fi recin apriete M+ ; contine as hasta introducir todos
los valores de su serie, para el clculo de la media, desviacin estndar
y varianza se procede luego apretando las teclas indicadas
anteriormente.

Cuando se trabaja con todos los datos de una poblacin para el clculo
de la desviacin estndar se aprieta SHIFT y la tecla 2

79

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

GUA DE EJERCITACIN

Actividad 1
a) Los siguientes son pesos individuales de 10 alumnos de la segunda
seccin de Jardn en kg:
20; 22; 20,5; 21; 23; 21; 22,9; 24; 24,6; 25
b) En la etapa de diagnstico destinada a implementar un Plan de Salud
Bucal en alumnos de jardn de Infantes, en una jardn municipal, el
odontlogo determin el nmero de caries que presentaba una muestra
de nueve alumnos, las que figuran a continuacin
2; 4; 0; 2; 3; 5; 1; 2; 2
c) De la ficha de los alumnos de la primera seccin se tom ocho fichas
al azar y se anot el salario que perciba mensualmente sus padres. Los
mismos figuran a continuacin:
3000; 1000; 570; 400; 600; 1500; 500; 570.
1.- En cada ejemplo
a) indique la variable en estudio
b) Clasifique la variable
c) Indique el tamao de la muestra
d) Identifique la unidad de muestreo
e) Indique la poblacin en estudio
2.- Cmo se denomina el conjunto de datos escritos en el orden en que
fueron medidos, observados o contados obtenidos para la variable que
se estudia?
3.- Que medidas de posicin y tendencia central utilizara para
resumir los datos de los ejemplos a, b, y c? Calcule e interprete los
mismos.
4.- En cul de los tres casos arriba detallados, la media aritmtica no
es adecuada para indicar el centro del conjunto? Justifique la
respuesta.

80

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Actividad 2
a) Para cada una de las series de e la Actividad 1. Indique las medidas
de dispersin o variabilidad que puede utilizar. Calcule.
b) Si Ud. quiere comparar la variabilidad de los pesos de los nios con
la variabilidad del ingreso de los padres presentadas en la Actividad 1,
que medida de dispersin empleara? Justifique la respuesta,

Actividad 3
Se desea comprar libros de cuentos para la escuela, los que
clasificados de la siguiente manera.
Libros
Ficcin
Para pintar
Para reconocer objetos

fueron

Cantidad de
libros
150
200
70

a) Indique el tamao de la muestra


b) Cul es la variable de estudio? Clasifquela
c) Que medida de posicin utilizara para resumir los datos?
d) Si la directora le pide que sugiera el tipo de libro a comprar Cul
sera su respuesta?

Actividad 4
Los siguientes datos corresponden a Tipo de juego que prefieren los
alumnos del jardn
Tipo de Juego

N de alumnos

Tobogn
Rompecabezas
El rincn de la casita
El rincn del carpintero
Ftbol

fi
30
10
80
60
30

81

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

a) Indique la variable. Clasifquela


b) Determine la Medida de Posicin que corresponda a este caso.
Calcule e interprete.

Actividad 5
Clasificacin de los alumnos segn el nmero de comidas por da
N de comidas

xi
N de alumnos

10 23

fi

a) Calcule Media, Mediana y Modo.


b) Determine Desviacin Estndar, Varianza y Coeficiente de Variacin.
c) Indique si la distribucin que se analiza es simtrica En caso de que
su respuesta sea negativa, indique el tipo de asimetra presenta.
d)Que porcentaje de alumnos realiza 4 comidas?
e)Qu porcentaje de alumnos realiza ms de cuatro comidas?

Actividad 6
Las alturas de alumnos de la primera seccin del jardn se muestran en
la siguiente tabla:
Altura de los alumnos de la primera seccin del jardn en metros
altura(m)
1,10 - 1,12
1,12 - 1,14
1,14 - 1,16
1,16 - 1,18
1,18 - 1,20
1,20 - 1,22

fi
2
5
10
8
2
4

a) Cul es la variable en estudio? Clasifquela

82

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

b) Encuentre frecuencias acumuladas, porcentajes y porcentajes


acumulados.
c) Encuentre Media Aritmtica, Mediana y Modo.
d) Calcule Desviacin estndar y Coeficiente de variacin.
e) Realice el grfico de la distribucin porcentual acumulada.
f) Determine grfica y analticamente el rango percentil para las
siguientes alturas:
1,17; 1,15; 1, 21. Interprete cada uno de ellos
g) Determine grfica y analticamente las alturas correspondientes a los
percentiles:
10, 25, 50, 75. Interprete cada uno de ellos

83

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

CAPTULO III

UNIDAD IV

PROBABILIDADES Y DISTRIBUCIONES DE PROBABILIDADES-

1.- INTRODUCCIN

La teora de probabilidad tiene sus orgenes en la teora de la


casualidad. Histricamente, la teora de la Probabilidad comenz con el
estudio de los juegos de azar, tales como la ruleta y las cartas.
La teora de la Probabilidad no es tan extraa como pudiera
pensarse. Sin duda alguna, en la vida diaria con mucha frecuencia
emitimos juicios probabilsticos, aunque a menudo no lo reconocemos
como tales.
Por ejemplo, supongamos que, por razones diferentes, usted no
est preparado para la clase de hoy. Seriamente usted considera faltar a
clase. Qu factores influirn en su decisin? Obviamente una
consideracin ser la probabilidad de que el profesor descubra su falta
de preparacin. Si el riesgo es alto, usted decide no ir a clase. Veamos,
hay dos alternativas posibles:

1. Su falta de preparacin ser descubierta.


2. Su falta de preparacin no ser descubierta.

Hay incertidumbre en esta situacin porque hay ms de una


alternativa posible. Su decisin de asistir a clase, depender del
grado de certeza asociado con cada una de estas alternativas. As, si
usted est bastante seguro de que prevalezca la primera alternativa,
usted decidir no ir a clase.
Supngase que su profesor con frecuencia pide a los estudiantes
que participen en clase activamente. De hecho, usted ha notado que la
mayora de los estudiantes son interrogados en cada sesin de clase.

84

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Este es un ejemplo en el cual hay un alto grado de certeza asociada con


la primera alternativa. Dicho de esta manera, la probabilidad del
primero es mayor que la del segundo. Por consiguiente usted decide no
ir a clase. Usted ha tomado una decisin con base en un empleo
intuitivo, de la probabilidad.
Antes de estudiar la teora de la probabilidad, es conveniente
comprender bien uno de los conceptos ms importantes de la Inferencia
Estadstica: el concepto de azar .

2.- EL CONCEPTO DE AZAR

Definimos una poblacin como el conjunto completo de


individuos, objetos o medidas que tienen alguna caracterstica comn
observable. Muy rara vez se puede estudiar una poblacin.
Seleccionamos muestras de una poblacin con la esperanza de que los
estadsticos de la muestra nos permitan calcular los parmetros de la
poblacin. Para obtener una correspondencia entre un estadstico y un
parmetro, la muestra debe ser seleccionada al azar utilizando el
muestreo al azar simple que se caracteriza porque cada una de las
observaciones tiene la misma probabilidad de ser seleccionada. Una
forma de obtener una muestra aleatoria, es mediante el Muestreo al
Azar Simple, de tal manera que cada individuo, objeto o medida tenga
igual probabilidad de ser seleccionado. Una caracterstica sobre los
sucesos aleatorios, es que ningn suceso tiene efecto predecible sobre el
siguiente. Podremos comprender ms clara y fcilmente el concepto de
azar en relacin con los juegos de azar, si suponemos que se juegan
limpiamente. Conocer el resultado del lanzamiento de una moneda al
aire, del lanzamiento de un dado, del resultado de un juego de ruleta,
no nos ayudar en absoluto en la prediccin de los resultados por venir.
Esta caracterstica de los sucesos al azar se conoce como
independencia. Si la independencia existe, podemos hablar de sucesos
realmente al azar.

3.- PROBABILIDAD Y ESTADSTICA

La Estadstica Descriptiva, hace referencia a los datos que se


tienen en la mano. Cuando se quiere ir ms all de los datos
disponibles, es necesario inferir o sea utilizar la Estadstica Inferencial.
Como ella infiere el todo (poblacin) a partir de la informacin que da

85

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

una parte de ese todo (muestra), el conocimiento que adquiere es


incompleto y por lo tanto no totalmente cierto es decir, se debe
trabajar con probabilidades. Por ello, antes de estudiar las aplicaciones
de la Estadstica Inferencial es necesario estudiar probabilidades.

4.- TEORIAS DE PROBABILIDAD

Se puede considerar la probabilidad como la teora que tiene que


ver con los posibles resultados de los experimentos. Estos deben ser
potencialmente repetitivos, es decir, debemos ser capaces de
reproducirlos bajo condiciones similares. Debe ser posible enumerar
cada resultado que pueda ocurrir, y debemos ser capaces de establecer
las frecuencias relativas de estos resultados.

Se distingue el enfoque clsico,


teora de probabilidad.

4.1.-EXPERIMENTOS
EVENTOS.

frecuencial y axiomtico de la

ALEATORIOS.

ESPACIO

MUESTRAL.

El lanzamiento de un dado, o de una moneda, la extraccin de un


naipe de la baraja, de las bolillas de la lotera son experiencias
aleatorias, pues sus resultados dependen del azar. Tambin son
aleatorios: el tiempo de espera de una persona en la parada del
autobs, sexo de los hijos en un matrimonio, el nmero de hijos que
tendr un matrimonio, etc.
Los primeros (lanzamiento, extracciones) son fciles de seguir,
pues se pueden repetir tantas veces como se quiera de forma rpida. A
partir de ellos se obtienen leyes que rigen los fenmenos aleatorios y se
aplican al estudio de situaciones aleatorias.

86

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Conceptos necesarios para definir probabilidades

Experimentos aleatorios: son aquellos que, repetidos bajo idnticas


condiciones, no arrojan un nico resultado sino un conjunto de
ellos.
9 Ejemplos: Arrojar un dado
9 Arrojar una moneda

Espacio muestral. Es el conjunto de los resultados posibles de un


experimento aleatorio y se denota con M.
Ejemplos.

9 Para el caso de arrojar un dado, el espacio muestral resultante


es:
M = {1,2,3,4,5,6}

9 Para el caso
resultante es:

de arrojar una moneda, el espacio muestral

M={C, S}

9 Para
el caso de arrojar una moneda y un dado
simultneamente, el espacio muestral resultante es:
M = (cara, 1) , ( cara , 2 ) .....,(cara , 6) , (sello , 1),...(sello, 6)

Evento simple .Es cada uno de los resultados de un experimento


aleatorio que no puede desglosarse en componentes ms
simples. Se designan con la letra minscula
ei .

87

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Ejemplos
9 Para el caso de arrojar un dado. Obtener el nmero 1, es un
evento simple, lo mismo ocurre con los nmeros restantes
e={1}
e={2}

9 Para el experimento aleatorio arrojar una moneda al aire, los


evento simples son
e={c}
e={s}

Evento compuesto. Es un subconjunto del Espacio Muestral. Es el


resultado de la unin de eventos simples. Se lo representa con
letra mayscula.

9 Para el caso de arrojar un dado. El espacio muestral es


M = {1,2,3,4,5,6}

Obtener nmero par, es el resultado de la unin de los


eventos simples 2, 4, 6, y constituyen un subconjunto del
espacio muestral.

P={2, 4, 6}

Obtener nmero impar


I={3, 5, 7}

Obtener un nmero menor que 4

88

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

A={1, 2,3}

Suceso seguro: es el conjunto total M(espacio muestral).

Suceso imposible: es el conjunto vaco.

Operaciones con sucesos

En las aplicaciones de la teora de probabilidades trataremos


muchas veces con eventos relacionados entre s, ms que con un solo
evento. Por esta razn consideraremos ahora un experimento aleatorio,
con su espacio muestral correspondiente M, y cualesquiera dos eventos
A y B en el experimento. Entonces:

*Union de Eventos A B ( A unin B , A o B ) representa el evento


que ocurre si, y solo si ocurre A u ocurre B o ambos ( Una
notacin ms antigua que representa a A B
es A + B, y el
nombre correspondiente es suma de dos eventos)

*Interseccin de Eventos. A B ( A interseccin B A y B )


representa el evento que ocurre si, y solo si, ocurren A y B
simultneamente, esto es, si ocurren en la misma ejecucin del
experimento en consideracin.

Eventos mutuamente exclusivos. Son los eventos que no ocurren


simultneamente. Este caso se representa solamente cuando A
B = , el evento vaco, de tal manera que A y B no tienen puntos
en comn.

89

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

El evento A es el complemento del evento A con respecto al espacio


muestral M y contiene a todos los resultados de M que no se
encuentran en A.

Ejemplo Para el caso del arrojar una dado, el espacio muestral es


M = {1,2,3,4,5,6}

9 Evento A obtener un n par

A= {2, 4, 6}

A = {1, 3, 5 }

Ejemplo:
Un experimento consiste en tirar un dado y observar el nmero de
puntos que aparece en la cara superior. El espacio muestral se puede
describir fcilmente, ya que es finito. Las posibilidades para el dado son
seis: 1, 2, 3, 4, 5, 6. Por lo tanto, los posibles resultados son:
M = {1, 2, 3,4, 5, 6}
b) Describir los siguientes eventos:
A: Sale un nmero par.
B: Sale un nmero impar.
C: Sale un nmero menor que 4
D: Sale un nmero mayor que 3.
E: Sale un nmero impar o mayor que 3.
F. Sale un nmero par y menor que 4.
G: Sale un nmero par y un impar.

90

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Solucin
El evento:Sale un nmero par , est representado por
la letra A, su descripcin puede realizarse mediante el
siguiente conjunto :
A = {2,4,6} ,

El evento Sale un nmero impar , est representado


por la letra B, su descripcin puede realizarse mediante
el siguiente conjunto :
B = { 1 , 3 , 5 }.

El evento Sale un nmero menor que 4 , est


representado por la letra C, su descripcin puede
realizarse mediante el siguiente conjunto :
C= 1 , 2 , 3
El evento
Sale un nmero mayor que 3, est
representado por la letra D, su descripcin puede
realizarse mediante el siguiente conjunto :
D= 4 , 5 , 6
El evento Sale un nmero impar o mayor que 3, se
representa por la letra E, est formado por todos los
resultado de B o de D o de ambos. Este evento recibe el
nombre de unin de B y D, se denota por B D y su
descripcin puede realizarse mediante el siguiente
conjunto:
B D = E =1 , 3 , 4 , 5 , 6
El evento Sale un nmero par y menor que 4, se
representa por la letra F, est formado por los resultados
comunes tanto a A como a C. Este evento recibe el
nombre de interseccin de A y C, se denota por A C
y su descripcin puede realizarse mediante el siguiente
conjunto :
A C = F = 2

91

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

El evento Sale un nmero par y un nmero impar,


se representa mediante la letra G, est formado por la
interseccin de los eventos A y B, estos eventos no
tienen nada en comn, por lo tanto la interseccin de
ellos es vaca. A y B son mutuamente excluyentes o
disjuntos..
A B = G = =

4.2. DEFINICIN CLSICA DE PROBABILIDAD (PROBABILIDAD A


PRIORI)
Supngase que queremos conocer la probabilidad de que una
moneda caiga con la cara hacia arriba. Como hay solo dos posibles
resultados (cara o seca) adoptamos una situacin ideal en la cual
esperamos que cada resultado tenga igual probabilidad de ocurrir. As,
1
P (C ) =
2
la probabilidad de que se presente una cara,
Definicin :La probabilidad de un evento A en un experimento aleatorio
est dado por: el cociente entre el nmero de casos favorables y el
nmero de casos igualmente posibles

P ( A) =

N de casos favorables a A
N total de casos igualmente posibles
9 Por ejemplo, la probabilidad de extraer el as de espada de una
baraja ordinaria de 52 cartas es 1/52.
9 Pero la probabilidad de sacar un as de espada rojo es cero
(puesto que no hay figuras de espadas rojas en la baraja) no
hay sucesos posibles que favorezcan este resultado.
9 Si los eventos son mutuamente excluyentes (esto es, si los
dos eventos no pueden ocurrir simultneamente), pues A B
= , la P ( ) = 0

4.3. DEFINICIN DE PROBABILIDAD FRECUENCIAL (PROBABILIDAD


A POSTERIORI)
Las probabilidades se aproximan despus de realizar la experiencia a la
frecuencia relativa. Por ejemplo, para saber cul es la probabilidad de
obtener el as con un dado determinado, se arroja el dado 600 veces en
las cuales se obtienen 113 veces un as.

92

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

La probabilidad de obtener un as con ese dado es estimada por la


frecuencia relativa = 113/600 = 0.1883.
Realice ( u observe) un procedimiento un gran nmero de veces y
cuente las ocasiones que el suceso A ocurre en realidad. Con base en
estos resultados reales, P(As) se estima de la siguiente forma :

P(As)

f (As)

= f r(As)

4.4. AXIOMAS DE PROBABILIDAD


Sea un experimento aleatorio que genera un espacio muestral M. Sea E1
y E2 eventos de un espacio muestral, se define probabilidad como una
funcin que asigna a cada evento del espacio un valor comprendido
entre [0,1] tal que se cumplan los siguientes axiomas:

1.- Si E es un evento cualquiera en un espacio muestral M, entonces

P( E ) 0 la probabilidad es positiva y
0 P( E ) 1

la probabilidad de un suceso vara entre 0 y

1.
2.- Al espacio muestral M completo le corresponde
P(M)=1
3.- Si E1 y E2 son eventos mutuamente exclusivos y E1E2=, entonces
se cumple
P (E1 E 2) = P (E1 ) + P (E

Si el espacio muestral es infinito, debemos reemplazar el axioma 3 por


3* .- Si E1 , E
tenemos que

,... son eventos mutuamente exclusivos, entonces

P (E1 E 2 ) = P ( E1 ) + P ( E

) +

93

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

4.5. PROPIEDADES:

1.- Si

es el conjunto vaco, entonces P ( ) = 0 . Imposibilidad.

Por ejemplo, la probabilidad de extraer el as de espada de una


baraja ordinaria de 52 cartas es 1/52. Pero la probabilidad de sacar
un as de espada rojo es cero (puesto que no hay figuras de espadas
rojas en la baraja).no hay sucesos posibles que favorezcan este
resultado.

2.- Si E es el complemento de un evento E, entonces

P ( E ) = 1 P( E )

3.- Si A B , entonces P ( A ) menor o igual a P ( B ).

La probabilidad de que ocurra el evento A , es decir que


al lanzar un dado salga un nmero par , se calcula como
P(A) =3/6 = 1/2
donde:

el nmero de resultados favorables es 6, ya que A = 2, 4, 6,


tiene 3 elementos.
el nmero total de resultados es 6, ya que M= {1 , 2 , 3 , 4 ,5,
6} tiene 6 elementos.

94

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

La probabilidad de que ocurra el evento B, es decir que


al lanzar un dado salga un nmero impar , se calcula
como
P(B) =3/6 = 1/2
donde:

el nmero de resultados favorables es 6, ya que B = 1, 3, 5,


tiene 3 elementos.
el nmero total de resultados es 6, ya que M = {1, 2, 3, 4, 5, 6}
tiene 6 elementos.

La probabilidad de que ocurra el evento C, es decir que


al lanzar un dado salga un nmero menor que 4 , se
calcula como
P(C) =3/6 = 1/2
donde:

el nmero de resultados favorables es 3, ya que C= 1, 2, 3 ,


tiene 3 elementos.
el nmero total de resultados es 6, ya que M = {1 , 2, 3, 4, 5 ,
6} tiene 6 elementos.

La probabilidad de que ocurra el evento D, es decir que


al lanzar un dado salga un nmero mayor que 3 , se
calcula como
P(D) =3/6 = 1/2
donde:

el nmero de resultados favorables es 3, ya que D= 4, 5, 6 ,


tiene 3 elementos.
el nmero total de resultados es 6, ya que M = {1, 2, 3, 4, 5, 6}
tiene 6 elementos.
La probabilidad de que ocurra el evento E, es decir que
al lanzar un dado salga un nmero impar o mayor que
3 , se calcula como
P(E) =5 / 6

95

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

donde:

el nmero de resultados favorables es 5, ya que E=1,3,4,5,6 ,


tiene 5 elementos.
el nmero total de resultados es 6, ya que M = {1 , 2, 3 , 4 ,5,
6} tiene 6 elementos.

La probabilidad de que ocurra el evento F, es decir que


al tirar un dado salga un nmero par y menor que 4 ,
se calcula como
P(F) =1 / 6
donde:

el nmero de resultados favorables es 1, ya que F = 2 , tiene


1 elemento.
el nmero total de resultados es 6, ya que M = {1,2 , 3 , 4, 5, 6}
tiene 6 elementos.

La probabilidad de que ocurra el evento G, esta formado


por la interseccin de los eventos A y B que son
mutuamente excluyentes, al lanzar un dado obtener
un nmero impar y par , es cero, ya que es imposible
de que ocurra dicho evento. La probabilidad del evento
nulo o vaco siempre es 0. Se calcula como
P(G) = P ( ) = 0
donde:

el nmero de resultados favorables es vaco, ya que G = =.


el nmero total de resultados es 6, ya que M = {1, 2, 3, 4, 5, 6}
tiene 6 elementos.

96

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

4.5.TEOREMA DE LA SUMA DE PROBABILIDADES


Sean A y B dos eventos del espacio muestral M generado por un
experimento aleatorio. El teorema de la suma de probabilidades dice
que la probabilidad de la unin de A y B es la suma de las
probabilidades menos la probabilidad de la interseccin. En smbolos:
Sean A y B M entonces
P(AB)=P(A)+P(B)- P(AB)

Si los eventos son mutuamente excluyentes, el ltimo trmino


desaparece, pues
A B = y P ( ) = 0
P(AB)=P(A)+P(B)
9 En el ejemplo, calcule la probabilidad del evento sale cara o sale
un nmero par correspondiente al experimento de lanzar
simultneamente un dado y una moneda, utilizando el teorema
de la suma de probabilidades.

P(CP)=P(C)+P(P)- P(CP)

P (C P ) =

6 6 3
9 3
+ =
= = 0,75
12 12 12 12 4

4.6. PROBABILIDAD CONDICIONAL

Muchas veces necesitamos encontrar la probabilidad de un


evento B si se sabe que ha ocurrido un evento A. Esta probabilidad se
llama probabilidad condicional de B dado A, y se representa como P (
B / A ) . En este caso A sirve como un espacio muestral nuevo (
reducido ) , y la probabilidad es la fraccin de P( A) que corresponde a
A B. As que

P ( B / A) =

P(A B )
P ( A)

97

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Del mismo modo, la probabilidad condicional de A dado B es

P( A / B) =

P(A B )
P (B )

Volviendo al ejemplo del dado:

a) halle la probabilidad de que aparezca un nmero menor que 4 dado


que apareci un nmero mayor que 3

b) halle la probabilidad de que aparezca un nmero impar dado que


apareci un nmero mayor que 3

Solucin :

a) P ( C / D ) se denomina probabilidad condicional de C dado que ha


ocurrido el evento D , se define como
P ( C / D ) = P ( C D ) / P( D )

En este caso M = 1, 2 , 3 , 4 , 5 , 6

C = 1 , 2 , 3 , D = 4 , 5 , 6 , P( D ) = 3 / 6 = 1 /2 , P( C ) =
0

P(C/D)= 0/ =0

98

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

b) P ( B / D) es la probabilidad condicional de que aparezca un nmero


impar dado que apareci un nmero mayor que 3.

P( D )= 3 / 6 = 1 / 2

P ( B D ) = 1/6

P ( B / D = P( B D ) / P( D ) = 1/6 / 12 = 1/3

4.7..TEOREMA DEL PRODUCTO DE PROBABILIDADES


En ocasiones, nos encontramos con la necesidad de determinar la
probabilidad de ocurrencia simultnea de dos o mas eventos. Para
obtener este resultado, deberemos aplicar la regla de multiplicacin.
Regla de la Multiplicacin : Si A y B son eventos contenidos en un
espacio muestral M , y P ( A ) > 0 y P ( B ) > 0, entonces se cumple que
P ( A y B ) = P(AB) = P(A) P(B /A) = P ( B ) P ( A / B)
Cuando los eventos son independientes: En el caso especial en el que
la ocurrencia de A no est en absoluto relacionada con la ocurrencia de
B y viceversa, se dice que los sucesos son independientes. La
independencia se representa simblicamente por
P ( B/ A ) = P(B)

P (A /B)=P(A).

Cuando los eventos son independientes la regla de la multiplicacin


se simplifica a: Si A y B son eventos contenidos en un espacio muestral
M y P(A)> 0 y P(B)> 0, entonces La probabilidad de la interseccin es
el producto de las probabilidades :
P ( A y B ) = P(AB) = P(A) P(B)
En el ejemplo del dado: son A y C independientes?
Si la probabilidad del resultado A no depende de la ocurrencia de
un segundo evento C ( o viceversa) se dice que A y C son eventos

99

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

independientes. En trminos de probabilidad se expresa que A y C son


eventos independientes si
P (A / C ) = P ( A ) bien P ( C / A ) = P ( C )
En caso de que A y C no sean eventos independientes (se
denominan dependientes), debido a que
P(A/C) P(A) o bien P(C/A) P(C)

Al lanzar un dado:
M=1, 2, 3, 4, 5, 6

A: nmero par
B: nmero impar

P ( A) =

3
6

P( B ) =

3
6

P( A B) =

1
6

1
1
P( A / B ) = 6 =
3 3
6
que no es igual a P ( A ) = 1 / 2 ,
Y

1
1
P ( B / A) = 6 =
3 3
6
que no es igual a P ( B ) = 1/2

100

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Muestreo con y sin reemplazo


Hay dos maneras de extraer objetos para obtener una muestra
de la poblacin, conocido como muestreo de una poblacin; estas son
las siguientes.
1.- Muestreo con reemplazo significa que el objeto que se extrajo al
azar se coloca de nuevo en el conjunto dado, se mezcla completamente
y se precede a extraer al azar el siguiente objeto.
2. Muestreo con reemplazo significa que el objeto que se extrajo se
deja aparte y no se lo introduce nuevamente.
Ejemplo
Una caja contiene 10 juegos para nios de Jardn de Infantes, de
los cuales 3 estn con fallas. Dos juegos se extraen al azar sin
reemplazo. Encontrar la probabilidad del evento tal que ninguno de
los 2 juegos tenga fallas.

Solucin:
Consideremos los eventos
A: El primer juego extrado no tiene fallas.
B: El segundo juego extrado no tiene fallas.
Es claro que P (A) = 7/10, ya que 7 de los 10 juegos no son
defectuosos y estamos muestreando aleatoriamente, por lo cual cada
juego tiene la misma probabilidad ( 1/10 ) de ser escogido.
Si A ocurre, entonces quedan 9 juegos en la caja, 6 de los cuales
tienen fallas, por lo que
P (B / A)= = 6 / 9 = 2 / 3
Y por el teorema de la multiplicacin, la respuesta es
P (A B ) = 7 /10 . 2 / 3 = 0,47

101

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Ejemplo
Si se seleccionan dos cartas de un paquete de naipes bien
barajado, cul es la probabilidad de que ambas sean reinas?
Solucin
Hay dos maneras de seleccionar las cartas: 1) Se puede
seleccionar una carta, reponerla en la baraja, barajar y extraer
una segunda carta. (Muestreo con reemplazo); 2) Se pueden
seleccionar las dos cartas consecutivamente sin reemplazar la
primera en la baraja (Muestreo sin reemplazo)
1. Sea A el suceso de una reina en la primera extraccin, y B el
suceso de una reina en la segunda extraccin. Cuando el
muestreo es con reemplazo, la probabilidad de extraer una reina
permanece igual en las dos extracciones. As, puesto que
P (A / B) = P (A) y P (B / A) = P (B), las dos extracciones son
independientes, por lo tanto
P (A B) = P (A). P (B) = 4/52. 4/52= 16/ 2704
2. Cuando se emplea el muestreo sin reemplazo la probabilidad
de obtener una reina en la segunda extraccin se reduce siempre
que la primera carta seleccionada haya sido una reina. En otras
palabras , cuando P ( B / A ) P ( B ) o P ( A / B ) P ( A ) , los
sucesos no son independientes. La probabilidad de extraer una
reina en el segundo intento es 3 / 51. Empleando la frmula
correspondiente, encontramos que la probabilidad de seleccionar
dos reinas en extracciones consecutivas procedentes de una
baraja sin reemplazo, es:

P (A B) = P (A). P (B / A) = 4 / 52. 3 / 51 = 12 / 2652

Se debe notar que la diferencia entre ambos muestreos es despreciable


cuando la poblacin es grande en relacin con el tamao de la muestra.

Ejemplo: Para un estudio, se obtiene una muestra de padres de


alumnos de un Jardn de Infantes y se los clasifica segn

102

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

ocupacin y grado de compromiso con el mismo, obtenindose


los siguientes resultados:

Padres de alumnos de un Jardn de Infantes, clasificados segn


ocupacin y grado de compromiso con el mismo.
Ocupacin
Desocupado
Trabajo
permanente
Trabajo
temporario
Total

Grado de compromiso con el establecimiento


No
Poco
Comprometido
Total
comprometido
comprometido
20
10
5
35
10
15
10
35
15

10

30

45

35

20

100

FUENTE: Datos ficticios


Suponga que se selecciona un padre al azar de este grupo. Obtenga las
probabilidades siguientes
9 Que el padre no se comprometa con la institucin.

P ( A) =

45
= 0,45
100

9 Que el padre no se comprometa o se comprometa con la


institucin.
P(AB)=P(A)+P(B)
45 20
65
P(A B ) = P ( ) + P( ) =
+
=
= 0,65
100 100 100
9 Que el padre se comprometa poco con la institucin.

P ( A) =

100 35 65
=
= 0,65
100
100

9 Que el padre sea Desocupado y no se comprometa.

P(A C ) =

20
= 0,20
100

9 Probabilidad que el padre sea poco comprometido dado que tiene


trabajo permanente

103

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

15
P( B I O ) 100 15
P( B / O ) =
=
=
= 0,43
35 35
P(O )
100
9 Probabilidad que el padre tenga trabajo temporario o sea poco
comprometido

P(O B ) = P( ) + P( ) P( B ) =

30 35 10
55
+

=
= 0,55
100 100 100 100

5.- DISTRIBUCIN DE PROBABILIDAD


Una distribucin de probabilidad no es ms que, como su nombre
lo indica, la asignacin a cada evento posible de un experimento, de la
probabilidad que le corresponde.
Definicin. Cualquier regla o mecanismo que sirva para determinar
P(X = x), probabilidad de que la variable aleatoria X tome
cada uno de los valores posibles x, se denomina una
Distribucin de Probabilidad
Existen dos tipos de distribuciones que son importantes en las
aplicaciones prcticas, a saber: las distribuciones discretas y las
continuas. Una distribucin discreta surge al contar (por ejemplo,
obtener un 6 y un 4 al lanzar dos dados, o bien sacar un rey al extraer
una carta de la baraja espaola). Una distribucin continua aparecer
si se mide (por ejemplo altura de los alumnos y alumnas de la clase).
Entre todas las distribuciones discretas, la Distribucin Binomial
es la ms sencilla. Entre las distribuciones continuas veremos la
Distribucin Normal.
5.1. VARIABLE ALEATORIA
Una variable aleatoria X es una funcin cuyos valores son
nmeros reales y dependen del azar.

104

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

5.2.DISTRIBUCIONES DE PROBABILIDADES DE VARIABLE


ALEATORIA DISCRETA
La siguiente es la distribucin de la variable aleatoria
Xi = n de puntos obtenidos al arrojar un dado perfecto, o sea que todas
sus caras son igualmente posibles:
xi
P(xi)

1
1/6

2
1/6

3
1/6

4
1/6

5
1/6

6
1/6

Total
1

Obsrvese que se cumplen dos condiciones que son


necesarias para que un conjunto de pares ordenados (x,y) sea
considerada una distribucin de probabilidades:
1) Para cada valor de x le corresponde un nico valor de y que es
un valor de probabilidad (no negativo y menor o igual a 1),
P(xi )

M
=1
2)
3) Esta distribucin recibe el nombre de uniforme, es una
distribucin de variable aleatoria discontinua y sus parmetros
son los valores mnimos (a) y mximo (b) que puede tomar x.
Esto se indica como X ~ U (a, b).

5.2.1. DISTRIBUCIN BINOMIAL.


La variable X toma los valores 0, 1, 2, 3,..., n. (donde n es finito y
bien determinado). Se puede considerar que la Distribucin Binomial
es la repeticin de n pruebas independientes, cada una de las cuales
tiene solo dos resultados posibles: xito o fracaso (por ejemplo tomar 4
pruebas en un ao, cada una de las cuales puede ser aprobada o
desaprobada). La funcin de probabilidades es:
P ( x ) = Cnx p x q n x

x
donde C n son las combinaciones de n elementos tomadas de a x,

p= probabilidad de xito en una sola prueba,


q = 1- p = probabilidad de fracaso.

105

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Las
combinaciones
C = (n.(n - 1). (n - 2)...(n - x + 1))/x!

se

calculan

como

sigue:

x
n

Los parmetros que definen a la distribucin Binomial son n y p.


Las dos caractersticas necesarias de una distribucin de
probabilidad consisten en que cada valor de P ( X = xn , p ) tiene que
ser mayor o igual a 0 y que la suma de todos los valores de P ( X = x
n , p ) debe ser igual a 1.
Ejemplo: Cuando se recibe un envo de lpices en la escuela, se
seleccionan de manera aleatoria, 15 unidades con el propsito de
verificar el porcentaje de unidades defectuosas en el envo. Con base en
informacin pasada, la probabilidad de tener una unidad defectuosa es
de 0,05. La directora ha decidido no recibir el envo cada vez que una
muestra de 15 unidades tenga dos o ms defectuosas. Cul es la
probabilidad de que, se rechace el envo?
Solucin
El modelo de distribucin apropiado para esta situacin
es la distribucin binomial, se puede suponer que las 15
unidades que se seleccionan al da, constituyen un
conjunto de ensayos independientes de manera tal que la
probabilidad de tener una unidad defectuosa es de 0,05
entre ensayos. Definimos a la variable aleatoria X:
nmero de unidades defectuosas que se encuentran
entre las 15 unidades seleccionadas. El evento se definir
como A: unidad defectuosa.
La probabilidad de defectuosa es
P(D) = 0,05
El nmero de ensayos n = 15
La probabilidad de que el envo no se reciba, es igual a la
probabilidad de que X sea igual o mayor que dos:
P(X 2) = 1 P(X < 2) = 1 [P(X = 0) + P(X = 1)]
P(0 15, 0,05) =

15!
(0,05) 0 (1 0,05)150
0! (15 - 0)!

= 1(0,95)15 = 0.4631

106

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

15!
(0,05)1 (1 0,05)151
P(1 15, 0,05) = 1! (15 - 1)!
=
= 15(0,05)(0,95)14 = 0,3658

P(X 2 15, 0,05) = 1 P(X < 2) =


=1 (0,4631 + 0,3658) = 1 0,8289 = 0,1711

Por lo tanto la probabilidad de que, el envo sea rechazado es de 0,1711.


La distribucin binomial es realmente una familia de distribuciones,
puesto que para cada valor diferente de n y p, que se denominan
parmetros de la distribucin binomial, se puede definir una
distribucin diferente. Sin tener en cuenta el valor de n, la distribucin
es simtrica cuando p = 0,5. Cuando p es mayor que 0,5, la
distribucin es asimtrica y su mximo se encuentra a la derecha del
centro. Cuando p es menor que 0,5, la distribucin es asimtrica y su
mximo se encuentra a la izquierda del centro.
Tablas de la Distribucin Binomial El clculo de las probabilidades
binomiales mediante la ecuacin anterior puede resultar laborioso
cuando n es grande. Afortunadamente hay tablas de probabilidades
binomiales y entonces no es necesario el uso directo de la ecuacin.
Solamente necesitamos utilizar una tabla con los valores dados de n, p
y x para obtener la probabilidad deseada.
Para explicar el uso de la Tabla consideremos nuevamente
el ejemplo en el cul desebamos conocer: La probabilidad de que la
direccin rechace el envo es igual a la probabilidad de que X sea igual o
mayor que dos: para hallar esta probabilidad en la tabla, localizamos
primero n = 15, luego la columna de p = 0,05 y finalmente para x, las
filas marcadas con un 0 y un 1
P(X 2 15 , 005) = 1 P(X < 2) = 1 [P(X = 0) + P(X = 1)] = 1 [0,463 +
0,366] = 0,171

107

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

n
13

p
x 0,01 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0,95 0,99 x
0 878 513 254 055 010 001 0+ 0+ 0+ 0+ 0+
0+
0+
0
1 115 351 367 179 054 011 002 0+ 0+ 0+ 0+
0+
0+
1
2
7
111 245 268 139 045 010 001 0+ 0+ 0+
0+
0+
2
3
0+
21 100 246 218 111 035 006 001 0+ 0+
0+
0+
3
4
0+
3
28 154 234 184 087 024 003 0+ 0+
0+
0+
4
5
0+
0+ 006 069 180 221 157 066 014 001 0+
0+
0+
5
6
0+
0+ 001 023 103 197 209 131 044 006 0+
0+
0+
6
7
0+
0+
0+ 006 044 131 209 197 103 023 001 0+
0+
7
8
0+
0+
0+ 001 014 066 157 221 180 069 006 0+
0+
8
9
0+
0+
0+ 0+ 003 024 087 184 234 154 028 003
0+
9
10 0+
0+
0+ 0+ 001 006 035 111 218 246 100 021
0+ 10
11 0+
0+
0+ 0+ 0+ 001 010 045 139 268 245 111
0+ 11
12 0+
0+
0+ 0+ 0+ 0+ 002 011 054 179 367 351 115 12
13 0+
0+
0+ 0+ 0+ 0+ 0+ 001 010 055 254 513 878 13

14

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14

869
123
008
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+

488
359
123
026
004
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+

229
356
257
14
035
008
001
0+
0+
0+
0+
0+
0+
0+
0+

044
154
250
250
172
086
032
009
002
0+
0+
0+
0+
0+
0+

007
041
113
194
229
196
126
062
023
007
001
0+
0+
0+
0+

001
007
032
085
155
207
207
157
092
041
014
003
001
0+
0+

0+
001
006
022
061
122
183
209
183
122
061
022
006
001
0+

0+
0+
001
003
014
041
092
157
207
207
155
085
032
007
001

0+
0+
0+
0+
001
007
023
062
126
196
229
194
113
041
007

0+
0+
0+
0+
0+
0+
002
009
032
086
172
250
250
154
044

0+
0+
0+
0+
0+
0+
0+
0+
001
008
035
114
257
356
229

0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
004
026
123
359
488

0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
008
123
869

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14

15

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

860
130
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+

463
366
135
031
005
001
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+

206
343
267
129
043
010
002
0+
0+
0+
0+
0+
0+
0+
0+
0+

035
132
231
250
188
103
043
014
003
001
0+
0+
0+
0+
0+
0+

005
031
092
170
219
206
147
081
035
012
003
001
0+
0+
0+
0+

0+
005
022
063
127
186
207
177
118
061
024
007
002
0+
0+
0+

0+
0+
003
014
042
092
153
196
196
153
092
042
014
003
0+
0+

0+
0+
0+
002
007
024
061
118
177
207
186
122
063
022
005
0+

0+
0+
0+
0+
0+
003
012
035
081
147
206
219
170
092
031
005

0+
0+
0+
0+
0+
0+
001
003
014
043
103
188
250
231
132
035

0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
010
043
129
267
343
206

0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
001
005
031
135
366
463

0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
0+
009
130
860

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

108

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

5.3. DISTRIBUCIONES
ALEATORIA CONTINUA

DE

PROBABILIDADES

DE

VARIABLE

En estas distribuciones no es posible calcular la probabilidad en


puntos sino que hay que hacerlo en intervalos. Recurdese que en las
variables discontinuas las probabilidades de intervalos se obtenan
sumando las probabilidades que corresponden a cada punto o valor de
la variable. En variables continuas, los valores que puede tomar la
variable son infinitos por lo que es necesario hacer una suma infinita es
decir una integral. En las variables continuas, la probabilidad de un
intervalo se obtiene integrando la funcin de densidad.
9 Ejemplo: la distribucin rectangular X ~ R (0,2).
Esta es una distribucin rectangular (todos sus puntos tienen
igual densidad de probabilidad) que se extiende desde 0 a 2. El grfico
de su funcin de densidad es el siguiente:

en el que se puede observar que la funcin de densidad es


f(x) = 1/2
La probabilidad de encontrar valores de variables entre 1 y 2 se
encuentra integrando la funcin de densidad entre esos lmites.
La integral entre esos lmites corresponde al rea bajo de la curva entre
los mismos.

5.3.1. LA DISTRIBUCIN NORMAL

Si una variable es continua, vara desde


funcin de densidad es:

hasta +

y su

109

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

f (x) =

1 x

se dice que x tiene distribucin normal con parmetros y (media


aritmtica y desviacin estndar). Esto se simboliza como sigue:
X ~ N ( , )
Su grfica es la siguiente:
0,40

f (x)

0,30

0,20

0,10

0,00
4

10

12

14

La distribucin normal presenta las siguientes caractersticas:


1) Presenta un mximo en x = , por lo tanto Mo =
2) Es simtrica y su eje de simetra es f ( ) , por lo que se deduce que
Md = = Mo.
3) Tiene dos puntos de inflexin ubicados en x =
4) Toda transformacin lineal de x da otra distribucin normal.
5) Algunos sectores usados de la funcin son:
x =

corresponde aproximadamente al 68 % central

x = 2

corresponde aproximadamente al 95 % central

x = 3

corresponde aproximadamente al 99 % central

110

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

6) f(x) se acerca asintticamente al eje x o sea que f(x) > 0.


1) Por ser funcin de densidad, el rea bajo de la curva es

f ( x)dx = 1

Para calcular la probabilidad de un intervalo en la distribucin


normal, por tratarse de una variable continua, debe hacerse mediante
la integracin de la funcin de densidad, lo cual equivale a calcular el
rea bajo de la curva. Considrese por ejemplo que la altura de los
alumnos de la escuela tiene distribucin normal con media = 1,6 m y
desviacin estndar = 0,1 m. La probabilidad de que al seleccionar
un alumno al azar, posea altura comprendida entre 1,5 y 1,65
(P(1,5<x<1,65)) se obtiene integrando la funcin de densidad f(x), (en la
cual se debe reemplazar los valores correspondientes de y por 1,6 y
0,1 respectivamente) entre los lmites 1,5 y 1,65.

La distribucin normal estndar


Usando la propiedad que dice que la transformacin lineal
z =

x -

conduce a una distribucin tambin normal, cuyos


parmetros son z = 0 y z = 1 , se obtiene una nueva distribucin que
se conoce con el nombre de distribucin normal estndar o normal
0,1 y se la describe como
Z ~ N (0,1) cuya representacin grfica es la siguiente:

-5

-3

111

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Tablas de la distribucin normal

El clculo de probabilidades en la normal involucra el clculo de


integrales que son muy engorrosas de resolver manualmente. Por ello,
las integrales estn tabuladas para una distribucin normal que es la
estndar.
Vamos a aprender el uso de tablas de una cola.

Tabla de 1 cola
En ella, los valores de probabilidad se encuentran en el cuerpo de
la tabla y los valores de z se forman utilizando la primera columna y la
primera fila (es decir en lo que se conoce como matriz de la tabla). En
esta tabla es importante considerar el signo de z.
Como su nombre lo indica, para el valor de z considerado, da el
valor del rea bajo de la curva desde menos infinito hasta z. Por ejemplo
si z = -2.1 la tabla da
P(z < -2,1) = 0,0179.

Ejemplo :
Una poblacin de pesos de alumnos en gr tiene distribucin normal
con media y desviacin estndar ( y ) de 50 y 5 Kg. respectivamente.
Cul es la probabilidad de

9 que los alumnos pesen menos de 55 kg


En smbolos, la probabilidad buscada es P(x 55)
Para solucionar esto es necesario pasar de la normal que
nos interesa a la normal estndar. Esto se consigue
mediante el siguiente cambio de variable:
z =

x -

en este caso x = 55 , = 50 y = 5 por lo que

z = (55 - 50)/5 = 1.

112

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

P(x 55) = P(z 1) = 0,8413

Cuando se busca un valor por menor, la probabilidad se


obtiene directamente en la tabla.

9 que los alumnos pesen ms de 57,75 kg


En smbolos, la probabilidad buscada es P(x 57,75)
Para solucionar esto es necesario pasar de la normal que
nos interesa a la normal estndar. Esto se consigue
mediante el siguiente cambio de variable:

z =

x -

en este caso x = 57.75 , = 50 y = 5 por lo que

z = (57,75 - 50)/5 = 7,7/5 = 1,54.


P(x 57,75)= P(z 1,54) = 1- P(z 1,54)=1-0,9382=0,0618

113

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

00
.0

.8413

01
.8438

0
.1

.8643
.8849

.8665

.3

.9032

.8869

.5

.9332

.9345

.9452

.7

.9554

.8

.9641

.9

.9713

.9564

.1

.9772
.9821

.9826

.9861

.9864

.9582

.9830
.9868

0
.9591

.9834

.9738

0
0

.9793
0

.9838

0
.9871

.9671
0

.9495
0

.9788
0

.9382

0
.9732

0
0

0
.2

.9726

.8925

.9251
0

.9664
0

0
.9099

.9484
0

.9783
0

.9370

0
0

0
.9778

.9573

.9236

.9656
0

.8907

.8729

.9082
0

.8508

0
.9719

.9474
0

.9649
0

.0

.9357

04

0
0

.8888

.9222

.9463
0

.8485

.8708

.9066
0

03

0
.6

.9207
0

.8686

.9049

.9192

0
.4

.8461

0
.2

02

0
0

.9875

que los alumnos pesen entre de 52,75 kg y 60 kg


En smbolos, la probabilidad buscada es P(52,75 x 60)

Para solucionar esto es necesario pasar de la normal que nos


interesa a la normal estndar. Esto se consigue mediante el siguiente
cambio de variable z = x -

, se buscan dos valores de z, primero para

el valor mayor de x, luego para el menor.

114

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

z2 =

60 - 50 10
= =2
5
5

z1 =

Se buscan los valores en la tabla para z=2;

52,75 - 50 2,75
=
= 0,55
5
5
P(z 2)=0,9772

Se buscan los valores en la tabla para z=0,55; P(z 0,55)=0,7088

Luego se restan los valores


P(52,75 x 60)= P(0,55 z 2)=0,9772-0,7088=0,2684

Los valores de z ms usados y que determinan intervalos


centrales (1-) son:

z0,10 = 1,64

para el 90 % central

z0,05 = 1,96

para el 95% central

z0, 01 = 2,58

para el 99% central

Ejemplo

En la poblacin de pesos X ~ N(50 ; 5) cul es el intervalo que


corresponde al 95 % central de la poblacin?
En la distribucin de z, el 95 % central de la
corresponde al intervalo que va desde -1,96 a +1,96, o sea
muy simple, si se desea que en el centro est el 95 % o, en
uno, 0,95, entonces en las colas debe quedar el 0,05. El
z = 1,96
corresponde 0, 05
.

poblacin

1,96. Es

tanto por
valor que

Ya se determin el intervalo en z, cmo se pasa a la normal


con media 50 y desviacin estndar 5? Se debe hacer el cambio inverso
de variable:

z =

x -

entonces x = z

115

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Para indicar que el intervalo corresponde a un porcentaje central


determinado se acostumbra a llamar a lo que queda en las colas.
x = z

Volviendo entonces al ejemplo, por ser z = 1,96, el intervalo que


corresponde al 95 % central de la poblacin de pesos de los alumnos es:

x = 50 1,96 * 5 = 50 9,80 .

El intervalo del 95 % central entonces va desde 40,20 kg a


59,80 kg.

116

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

GUA DE EJERCITACIN

Actividad 1

Indique con una cruz cual de los siguientes experimentos son


aleatorios:
Comprar un nmero en una rifa y ganar el primer premio.
Extraer de una bolsa con fichas blancas, rojas y verdes, una ficha
roja.
Sumar dos nmeros naturales menores que cuatro y obtener un
nmero de una cifra.
Tirar un dado y obtener un mltiplo de dos.
Tirar de un quinto piso un vaso de vidrio y que se rompa.
Mirar por la ventana y ver pasar un auto de color azul.

Actividad 2

Describa el espacio muestral de los siguientes experimentos aleatorios:


Extraer al azar un legajo de una bolsa que contiene los legajos de
5 docentes de 1 seccin y 3 docentes de 2a seccin de un Jardn
de Infantes.
Extraer al azar dos legajos de una bolsa que contiene los legajos
de 5 docentes de 1 seccin y 3 docentes de 2a seccin de un
Jardn de Infantes.
Actividad 3

Escriba verdadero (V) o Falso (F):


Cuando un experimento es imposible, la probabilidad es cero.
Cuando un experimento es seguro la probabilidad es cero.
La probabilidad de un experimento es un numero comprendido
entre 0 y 1.

117

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Actividad 4
En el experimento aleatorio de la Actividad N2, segundo prrafo:
a)
b)
c)
d)
e)
f)
g)

Cuntos grupos de dos personas se formaron?


En cuntos estn docentes de la 1 Seccin?
En cuntos estn docentes de la 1 Seccin solamente?
En cuntos estn docentes de la 2 Seccin?
En cuntos estn docentes de la 2 Seccin solamente?
En cuntos estn docentes de la 1 y 2 Seccin?
Calcule la probabilidad de cada uno de estos sucesos.

Actividad 5

Una oficina donde asignan becas para padres de los alumnos de Jardn
de Infantes, realiza la seleccin de los mismos para dos Becas de
distinto origen de fondos; los resultados posibles son Seleccionado (S) o
No Seleccionado (NS). El experimento consiste en tomar al azar un
alumno y observar el resultado en las dos selecciones.
a) Describa el espacio muestral de este experimento (suponga que los
padres de todos los alumnos han estado inscriptos en las dos Becas)
b) Cul es la probabilidad de que el padre del alumno haya sido
seleccionado en las dos Becas?
c) Cul es la probabilidad que el padre del alumno no haya sido
seleccionado en ninguna de las dos Becas?
d) Cul es la probabilidad que el padre del alumno haya sido
seleccionado en una Beca por lo menos?

Actividad 6
Cada uno de los tems siguientes representa las probabilidades de cada
uno de tres eventos simples.
Marque el tem correcto, justificando al mismo tiempo su respuesta.
a) P(E1) = 0,8

P(E2) = 0,3

P(E3) = 0,1

b) P(E1) = 0,3

P(E2) = 0,2

P(E3) = 0,5

118

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

c) P(E1) = -0,6

P(E2) = 0,2

P(E3) = 0,2

d) P(E1) = 1/3

P(E2) = 1/2

P(E3) = 1/6

Actividad 7
En una encuesta realizada a los padres de 90 alumnos que egresan
del Jardn de Infantes en un establecimiento educativo, se les
preguntaba sobre el nivel de instruccin alcanzado y si a los hijos los
inscribiran o no en el mismo establecimiento educativo para continuar
sus estudios. El resultado de la encuesta figura en la tabla siguiente:
Inscriben a
Nivel de
educacin de los sus hijos en la
misma escuela?
padres
Si
No
Superior
20
10
Secundario
30
10
Primario
15
5
Total
65
25

Total

30
40
20
90

Si se selecciona un padre al azar, cul es la probabilidad de:


a) Qu el padre posea educacin superior?
b) Qu el padre inscriba a su hijo en la misma escuela?
c) Qu el padre inscriba a su hijo en la misma escuela y tenga
educacin primaria?
d) Qu el padre posea educacin superior o secundaria?
e) Qu el padre no posea educacin superior?
f) Qu el padre inscriba a su hijo en la misma escuela dado que posee
educacin primaria?
g) Qu el padre no inscriba a sus hijos en la misma escuela dado que
posee educacin secundaria?
h) El evento que inscriba a su hijo en la misma escuela
es
independiente del nivel de educacin Superior alcanzado por el
padre?

119

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Actividad 8
En un examen de 10 bolillas un alumno no sabe dos de ellas. Cul es
la probabilidad que le toquen justamente las dos bolillas que no sabe?

Actividad 9
Una prueba tiene 2 preguntas con dos opciones: Verdadero (V) o
Falso(F).
a) Cul es la probabilidad de que acierte en las dos?
b) Cul es la probabilidad de que acierte por lo menos en una?
c) Cul es la probabilidad de que a las dos las conteste
incorrectamente?

Actividad 10
En una escuela hay tres Profesores de Educacin Fsica. La
probabilidad de que no asistan a clase cada uno de ellos es de 0.05.
Cul es la probabilidad de que un da cualquiera falten los tres juntos?

Actividad 11
En un anlisis realizado por el Director de un establecimiento
educativo, se determin que de los alumnos ingresantes en EGB en una
cohorte, solo el 70% (en promedio) complet el polimodal. De ellos solo
el 15% lo hizo en el mismo establecimiento. Cul es la probabilidad de
que un nuevo alumno ingresante en EGB termine el Polimodal en la
misma escuela?

Actividad 12
La probabilidad de que a un alumno le interese Matemticas en un
curso es de 0.1. Si se toman 3 alumnos de dicho curso al azar:
Cul es la probabilidad de que:
a) No le agrade a ninguno Matemticas?
b) Le agrade por lo menos a un alumno esta materia?
c) Le agrade como mximo a 2 alumnos?

120

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Actividad 13
La probabilidad de que un alumno apruebe una Prueba Integradora de
conocimientos de Matemtica en el ltimo ao del Polimodal es de 0,25.
Si se seleccionan al azar 10 alumnos de un curso:
a)
b)
c)
d)
e)

Cul
Cul
Cul
Cul
Cul

es
es
es
es
es

la
la
la
la
la

probabilidad
probabilidad
probabilidad
probabilidad
probabilidad

de
de
de
de
de

que
que
que
que
que

5 alumnos aprueben?
no apruebe ningn alumno?
todos aprueben?
aprueben como mnimo 5 alumnos?
como mximo aprueben 5 alumnos?

Actividad 14
La probabilidad de que la ltima semana de clase los alumnos que
egresan cometan un acto de indisciplina serio es de 0,004. De 300
alumnos que terminan este ao:
Cul es la probabilidad de que:
a) 8 alumnos terminen sus estudios con una sancin por este acto de
indisciplina?
b) De qu ms de 5 alumnos terminen sus estudios con una sancin
por este acto de indisciplina?
c) De que menos de 4 terminen sus estudios con una sancin por este
acto de indisciplina?
d) De qu ningn alumno cometa un acto de indisciplina serio?

Actividad 15
Los pesos de los alumnos de un curso de EGB se distribuyen
normalmente con = 48 kg y = 2 kg.
a) Obtenga los pesos estndar correspondientes a:
43 kg ; 44,5 kg ; 46 kg ; 49,5 kg ; 50 kg
b) Cul es la probabilidad de que un alumno tenga un peso menor a
44,5 kg?
c) Cul es la probabilidad de que un alumno tenga un peso mayor a
46 kg?
d) Cul es la probabilidad de que un alumno tenga un peso entre
44,5 kg y 49,5 kg?

121

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

e) Cul es la probabilidad de que un alumno tenga un peso de por lo


menos 46 kg?
f) Obtenga el Rango Percentil correspondiente a los pesos del item a).
Interprete que significa cada uno de ellos.
g) Si el nmero de alumnos a los que se ha medido el peso en ese curso
fuera de 200,
cuntos alumnos tendrn un peso inferior a la media?. Cuntos
alumnos tendrn un peso superior a 52 kg?
h) Qu porcentaje de alumnos tienen un peso comprendido entre 45
kg y 47 kg?

Actividad 16
Los puntajes promedio con su correspondiente desviacin estndar,
obtenidos por los alumnos del ltimo curso de Polimodal en una
escuela en los exmenes finales de una asignatura son los siguientes:

CURSO
A
B

5,9
6,75

1,5
1

Se supone que los puntajes se distribuyen normalmente:


a) Si un alumno del Curso A ha obtenido 7 puntos y otro del Curso B
igual puntaje, quiere decir que el nivel de aprendizaje es el mismo en
los dos cursos?. Justifique su respuesta.
b) Qu porcentaje de alumnos obtuvieron ms de 5 puntos en cada
curso? Analice en base a esto el rendimiento de cada curso.
c) Qu porcentaje de alumnos obtuvieron ms de 7 puntos en cada
curso?
d) Qu porcentaje de alumnos obtuvieron menos de 4 puntos en cada
curso?
e) En base a estos resultados qu conclusin puede enunciar?

122

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

CAPTULO IV
UNIDAD V
TABLAS DE CONTINGENCIA
INTRODUCCIN

Con alguna frecuencia deseamos verificar la hiptesis de que los


datos observados de una muestra son el resultado del hecho de que las
caractersticas de una poblacin no tienen relacin entre s. Por
ejemplo, podemos hacer la hiptesis de que la actitud de la gente hacia
un determinado grupo minoritario no tiene relacin con su nivel de
educacin. En otra situacin, podramos estar interesados en verificar
la hiptesis de que, en varias poblaciones, la proporcin de sujetos que
tienen una determinada caracterstica, es la misma. Podemos, por
ejemplo, formular la hiptesis de que en tres grupos, digamos de
recursos econmicos bajos, medios y altos, la proporcin de personas
con conocimientos altos, y bajos acerca de la poltica nacional, es la
misma.

1.- DISTRIBUCIN JI-CUADRADA


Sean X 1, X 2,..., X n, variables aleatorias normales independientes
que tienen media 0 y variancia 1. La suma de sus cuadrados se
representa en general por 2 ( ji-cuadrada ), esto es,

2 = X 12 + X 22 + ... + X n2 2
A la distribucin correspondiente a esta suma se la llama Distribucin
ji-cuadrada, cuya funcin de densidad es
f ( x ) = Kn
f(x)=0

(n-2) /2

e x/2

cuando x > 0
cuando x< 0

En esta frmula n es un entero positivo que se llama nmero de grados


de libertad de la distribucin y K n es una constante

123

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

= 1 / 2n/2 . ( n/2)

Donde ( n/2) es la funcin gamma.


Grados de libertad: es el nmero de clases en que las frecuencias
pueden distribuirse libremente.
1.1. Propiedades de la distribucin del estadstico ji-cuadrada
1. Los valores de ji-cuadrado son mayores o iguales a
cero.
No puede tomar valores negativos, ya que es suma de valores
elevados al cuadrado.

2. La distribucin ji-cuadrada no es simtrica. Tiene cola


estrecha que se extiende a la derecha; esto es, est
sesgada a la derecha.

3. La forma de una distribucin ji-cuadrada depende del


grado de libertad que es igual a n 1 . En consecuencia
hay un nmero infinito de distribuciones ji-cuadrada.

4. La distribucin ji-cuadrada tiene valor medio = n 1


y variancia 2 = 2(n 1)

La siguiente figura ilustra tres distribuciones 2 . Note que el valor


modal aparece en el valor (n-3) = (gl-2).

124

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Hiptesis: La palabra hiptesis se define como:


1. Una afirmacin que est sujeta a verificacin o comprobacin.
2. Una suposicin que se utiliza como base para una accin.
Una hiptesis es una afirmacin o suposicin y no un hecho
establecido.
Una hiptesis estadstica es una suposicin que se hace acerca
de la distribucin de una variable aleatoria. Una prueba estadstica de
una hiptesis es un procedimiento en el cual se usa una muestra con
el fin de determinar cuando podemos no rechazar (aceptar ) la
hiptesis, es decir, actuar como si fuera cierta o cuando debemos
rechazar esta, es decir, actuar como si fuera falsa.
Las hiptesis estadsticas son de dos tipos. Primero est la
hiptesis nula, que se simboliza con H0 y que es la hiptesis que se
debe comprobar.
Para verificar una hiptesis nula, examinamos los datos de la
muestra tomada de la poblacin pertinente y determinamos si son o no
compatibles con la hiptesis nula. Si los datos de la muestra no son
compatibles con la hiptesis nula, entonces
H0 se rechaza. Si los
datos son compatibles con la hiptesis nula, entonces H0
no se
rechaza.
Si la hiptesis nula no se rechaza, decimos que los datos
particulares de la muestra no dan suficiente evidencia como para que
concluyamos que la hiptesis nula es falsa. Si la hiptesis nula se
rechaza, decimos que los datos particulares de la muestra s dan
suficiente evidencia como para hacernos concluir que la hiptesis nula
es falsa y que una segunda hiptesis es verdadera. Esta segunda
hiptesis, de la que hemos concluido que es verdadera si la hiptesis
nula es rechazada, se denomina hiptesis alterna y se designa con el
smbolo H 1

125

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

1.2 Tabla de la Distribucin ji-cuadrada


Para conocer el valor de
especfica, que contiene:

2, debemos consultar una tabla

En la matriz de las columnas, los grados de libertad.


En la matriz de las filas, los valores de probabilidad.
En el cuerpo de la tabla, los valores de 2 .

La tabla que se utilizar es la de 2 , la cual da valores crticos


para valores especiales de . Para denotar el valor crtico de una
distribucin 2 con ( gl ) grados de libertad se usa el smbolo 2 (gl);
este valor crtico determina a su derecha un rea debajo la curva 2
y sobre el eje horizontal. Por ejemplo para encontrar 2 0.05(6) en la
tabla se localiza 6 gl en el lado izquierdo y = 0,05 en el lado superior
de la misma tabla.

2. TABLA DE CONTINGENCIA
Definicin: Una tabla de contingencia es una tabla en donde las
frecuencias corresponden a dos variables.( Una variable se utiliza para
categorizar renglones y una segunda variable para categorizar
columnas).
En una Tabla de Contingencia, los niveles de un criterio de
clasificacin forman las filas y los niveles de otro criterio, las columnas.
Las celdas que se encuentran en las intersecciones de las filas y las
columnas contienen conteos o frecuencias de sujetos que se han
clasificados en forma cruzada con base en los dos criterios. Es
importante reconocer que la palabra contingencia se refiere a

126

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

dependencia, pero esto solo es una dependencia estadstica, por lo cul


no es posible utilizarla para establecer una cadena directa de causaefecto entre las dos variables en cuestin.
Las tablas de contingencia tienen especial importancia, puesto
que suelen utilizarse para analizar resultados de encuestas. Por
ejemplo, podemos hacer una pregunta a los sujetos en la que
identifiquen su gnero ( masculino / femenino), y otra en la que
describan la frecuencia de su uso del control remoto del televisor
(frecuentemente / algunas veces / nunca ), Se puede determinar si el
uso del control remoto del televisor es independiente del gnero.
La Tabla 1 es una tabla de contingencia generalizada en la que
se ha clasificado en forma cruzada una muestra de n sujetos. La tabla
muestra que el nmero de sujetos que cae en el nivel i del primer
criterio y el nivel j del segundo, es n ij . Un total de n r . sujetos cae
dentro de la categora r del primer criterio y n . c sujetos caen dentro
de la categora c del segundo criterio.

Tabla 1 : Clasificacin de doble entrada de una muestra de sujetos.


Primer
criterio de
clasificacin

Segundo criterio de clasificacin


Nivel

Nivel
1
c
1
2
.

n11
n21
.

.
I
.

.
ni1
.

.
R
Total

.
nr1
n.1

2
Total
n12
n22
.
.
ni 2

nr2
n.2

..........

........

............
...........

n1j
n2j

.............
............

n1c
n2c

n1.
n2.

............

nij

............

nic

ni.

...........

nrj
n.j

.........

nrc
n.c

nr.
n

127

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

En general una tabla de contingencia tiene r filas y c columnas,


siendo f y c nmeros mayores o iguales a dos. Una caracterstica
importante en el anlisis de las tablas de contingencia es el nmero de
grados de libertad de la tabla, que se define como el nmero de casillas
que pueden fijarse arbitrariamente cuando los totales por filas y
columnas se suponen fijos.
Se presentan dos tipos de prueba de hiptesis que se basan en
tablas de contingencia :Las pruebas de independencia, que se usan
para determinar si una variable de rengln de una tabla de contingencia
es independiente de su variable de columna y Las pruebas de
homogeneidad, que sirven para determinar si situaciones diferentes
tienen las mismas proporciones de alguna caracterstica. Ambos tipos
de prueba de hiptesis utilizan los mismos mtodos bsicos. Veremos
nicamente las pruebas de independencia.
Se obtiene una tabla de contingencia 2 x 2 debido a que los
individuos se clasifican segn dos criterios, y para cada criterio se hace
distincin entre dos categoras. Se habra obtenido una tabla de
contingencia 2 x 3 si hubiramos usado 3 categoras .

3. PRUEBA DE JI-CUADRADO DE INDEPENDENCIA


Definicin: Prueba la hiptesis de que no hay asociacin entre la
variable de rengln y la variable de columna en una tabla de
contingencia.
Un investigador puede estar interesado en saber, respecto de una
poblacin, si dos criterios
de clasificacin estn probablemente
relacionados o no. Por ejemplo, podemos estar interesados en saber si
hay o no asociacin entre la religin , y el inters poltico en algn
grupo de personas. Si concluimos que dos criterios de clasificacin no
estn relacionados, decimos que son independientes.
Dos criterios de clasificacin son independientes
si la
distribucin de un criterio no depende de ninguna manera de la
distribucin del otro. En el ejemplo, diremos que la participacin
religiosa y el inters poltico son independientes si el hecho de conocer
la religin de una persona no interviene en la prediccin de la
naturaleza de sus intereses polticos.
Para poder llegar a una decisin sobre la independencia de dos
criterios en una poblacin, generalmente analizamos los datos de la
muestra y sacamos conclusiones acerca de la poblacin a partir de los
resultados de la muestra.

128

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Para este tipo de problemas la tcnica que ms se emplea es la


denominada Prueba de Ji-Cuadrado de Independencia
Cuando se prueba la hiptesis de independencia entre las
variables de rengln y de columna, en una tabla de contingencia, los
supuestos, el estadstico de prueba y los valores, para aplicar la prueba
de ji-cuadrado de independencia hay que realizar los siguientes pasos:

1.- Tomamos una muestra aleatoria de sujetos de la poblacin de


inters.

2.- Plantear las hiptesis. La hiptesis planteada es la afirmacin de


que las variables de rengln y de columna son independientes, la otra
hiptesis que se plantea es la afirmacin de que las variables rengln y
columna son dependientes, o sea :
La hiptesis nula que se va a verificar con la prueba de ji-cuadrado de
independencia es :

: Los dos criterios de clasificacin son independientes

La hiptesis alterna es .

: Los dos criterios de clasificacin no son independientes.

3.- Presentamos los datos en una Tabla de Contingencia, en la cual los


niveles de un criterio de clasificacin forman las filas y los niveles del
otro criterio, las columnas.

4.- Calculamos las frecuencias esperadas para cada una de las celdas
de la tabla de contingencia. Esto lo hacemos suponiendo que la

129

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

hiptesis nula es verdadera , es decir, que los dos criterios


clasificacin son independientes.

de

5.- Comparamos las frecuencias esperadas y observadas calculando el


estadstico de prueba para una prueba de independencia.

2 =

(O E )2
E

donde O ij es la frecuencia observada y E ij es la frecuencia esperada


de la celda ij. Si la hiptesis nula es verdadera, es decir, si los dos
criterios de clasificacin son realmente independientes, 2 se
distribuir aproximadamente como una distribucin ji-cuadrada.

Definicin. Un estadstico de prueba es una cantidad numrica que


se calcula a partir de los datos de una muestra y que se utiliza para
tomar la decisin de rechazar o no rechazar una hiptesis nula.

6.- Escogemos un nivel de significacin ( 5 % , 1% o alguno


semejante).

7.- Se determinan los valores crticos.

i) Los valores crticos se encuentra utilizando


grados de libertad = ( r 1 ) . ( c - 1 )

ii) En una prueba de independencia de una tabla de


contingencia, la regin crtica se localiza solo en la cola derecha.

130

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

8.- Comparamos el valor calculado de 2 c , para su significacin, con


los valores tabulados de 2 t . Si 2 c es igual o mayor que 2 t para
los grados apropiados de libertad y el nivel escogido de significacin ,
rechazamos la hiptesis nula de independencia y concluimos que los
dos criterios de clasificacin no son independientes.

Determinacin de frecuencias esperadas. Para determinar las


frecuencias esperadas de las celdas de la tabla de contingencias, en una
prueba de ji-cuadrado de independencia, utilizamos nuestros
conocimientos sobre la probabilidad. Refirmonos a la tabla de
contingencia de la Tabla 1. Supongamos que deseamos estimar la
probabilidad de que un sujeto tomado al azar en esa poblacin est
caracterizado por el nivel 1 del primer criterio. El estimador de esa
probabilidad es n1 . / n , es decir, el nmero de sujetos de la muestra
caracterizados por el nivel 1 del primer criterio dividido por el nmero
total de sujetos de la muestra. De igual manera, para estimar la
probabilidad de que un sujeto tomado al azar en esta poblacin se
categorice
por el nivel 1 del segundo criterio de clasificacin,
calculamos n . 1 / n.
Para obtener la frecuencia esperada de una celda determinada,
determinemos la probabilidad de que un sujeto , tomado al azar en esta
poblacin, est en esta celda. . Por ejemplo, calculemos la probabilidad
de que un sujeto tomado al azar en esa poblacin est contado en la
primera celda de la Tabla 1. Esto es, en otras palabras, la probabilidad
de que un sujeto tomado al azar en esta poblacin est caracterizado
por el nivel 1
de ambos criterios
de clasificacin. Sin ningn
conocimiento de la dependencia o independencia de los dos criterios,
estaramos inclinados
a estimar esta probabilidad calculando la
probabilidad conjunta n 11 / n. Siguiendo la hiptesis que los dos
criterios
de clasificacin son independientes, hacemos otro
razonamiento. En probabilidad vimos, que si dos eventos son
independientes, la probabilidad de su ocurrencia conjunta es igual al
producto de sus probabilidades individuales. Si establecemos esta regla
de modo que se pueda aplicar especficamente a una tabla de
contingencia, podemos hacer el siguiente planteamiento:

En una tabla de contingencia, si dos criterios de clasificacin son


independientes, cada una de las probabilidades conjuntas asociadas con

131

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

la celda de la tabla es igual al producto


marginales correspondientes.

de las probabilidades

Entonces siguiendo la hiptesis de independencia, la


probabilidad de que un sujeto tomado al azar en esta poblacin est
caracterizado por el nivel 1 de ambos criterios de estima mediante (n1.
/ n ) . (n . 1 / n ) .
Con el fin de obtener las frecuencias esperadas de las celdas de
la tabla de contingencia , multiplicamos cada una de las probabilidades
conjuntas por el tamao total de la muestra, n . Por ejemplo, la
frecuencia esperada E 11 de la primera celda de la Tabla 1 est dada
por :

11

11

= (n1. / n ) . (n.1 / n ) . n

= ( n1. * .n

.1

)/n

(1)

La forma de este producto sugiere una forma general para obtener


la frecuencia que se espera de una celda:

E=

(total de rengln ) .(total de columna )


( gran total )

El gran total se refiere al total de todas las frecuencias que se


observan en la Tabla.

Determinacin de los grados de libertad: El nmero de grados de


libertad asociados con valor de 2 c calculado a partir de los datos de
una tabla de contingencia es igual al nmero de celdas que se pueden
llenar arbitrariamente si se han establecidos los totales marginales.

132

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

En general, el nmero de grados de libertad asociados


calculado en una tabla de contingencia es igual:

2
con c

gl=(f1).(c1)
Figura: Regin crtica (sombreada) para un contraste con el estadstico
.

Ejemplo: Un socilogo desea saber si es posible concluir


que hay relacin respecto al estado de nutricin y
desempeo acadmico en una
poblacin de alumnos
pertenecientes al Nivel Inicial de Escuela de la Capital de
la Provincia de Santiago del Estero. El socilogo seleccion
una muestra de 500 alumnos.

La prueba de ji-cuadrado
decisin.

resulta adecuada para tomar una

133

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Solucin:

1. Los datos muestrales se seleccionan aleatoriamente.

2. Determinar Ho y H1.
La hiptesis nula que se va a verificar con la prueba de ji-cuadrado de
independencia es :

Ho : el estado nutricional y el desempeo acadmico son


independientes.

H1 :

las dos variables no son independientes.

3. Presentacin de los datos en una tabla de contingencia

Tabla 2: Estado de nutricin y desempeo acadmico de 500 nios de


una escuela primaria.

DESEMPEO
ACADMICO
MALO
SATISFACTORIO
TOTAL

ESTADO DE
NUTRICIN
MALO
BUENO
105
80
185

15
300
315

TOTAL
120
380
500

134

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

4. Calculamos las frecuencias esperadas

Aplicando el procedimiento abreviado, calculamos las frecuencias que


se espera para cada celda, suponiendo independencia entre las variable
de rengln y las variables de columna de la tabla, empleando la frmula
(1)

E 11 = 120 . 185 / 500 = 44,4


75,6

E12 = 120 . 315 / 500 =

E 21 = 380 . 185 / 500 = 140,6


239,4

E 22 = 380. 315 /500 =

5. Comparamos las frecuencias que se observadas y las frecuencias


que se esperan.

Tabla 3 . Frecuencias observadas y frecuencias esperadas del ejemplo 1

ESTADO DE NUTRICIN
DESEMPEO
ACADMICO
Malo
Malo
105 ( 44,4 )
Satisfactorio 80 ( 140,6 )
TOTAL

185

Bueno
15 ( 75,6 )
300 ( 239,4
)
315

Total
120
380
500

135

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

La tabla muestra las frecuencias esperadas entre parntesis y las


frecuencias observadas.

Utilizamos los datos de la Tabla 3 y el Estadstico de prueba , que es

2 =

(O E )2
E

para calcular el valor de 2

2 =(105 44,4 ) 2 / 44,4 + (15 75,6 )2 / 75,6 + (80 140,6 ) 2 /140,6+


(300-239,4) 2 / 239,4 = 82.71+48.58+26.12+15.34=172.74

6. Determinacin de los grados de libertad. Como el nmero de grados


de libertad asociado con 2 calculado en una tabla de contingencia es
igual a (c-1)*(f-1) o sea

g.l. = ( 2 1 ) . ( 2 1) = 1

El nivel de confianza: 5 %

7. Buscamos el 2 en la tabla :
Para 1 grado de libertad y un nivel de confianza = 5 % , el

= 3,84

136

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

El valor crtico es 2 t = 3,84, se encuentra en la tabla observando que


= 0,05 en la cola derecha y que el nmero de grados de libertad es 1.

Comparamos el 2 c y el
ji-cuadrado de tabla)

= 172,74 >

( el ji-cuadrado calculado con el

= 3,84

Como el estadstico de prueba est dentro de la regin crtica,


rechazamos la hiptesis H 0 .

Interpretamos: El estado nutricional y el desempeo acadmico


no son independientes.

137

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

GUIA DE EJERCITACIN

ACTIVIDAD 1
De un estudio realizado a quinientos alumnos de la Sala de 5 aos
correspondiente a distintos Jardines de la Provincia, fueron clasificados
de acuerdo con el grupo socio-econmico al que pertenecen y la
presencia o ausencia de ciertos defectos en el lenguaje.

Defecto del
lenguaje
Presente
Ausente
Total

Grupo Socio-Econmico
Medio alto Medio Bajo
Bajo
24
32
27
121
138
108
145
170
135

Alto
8
42
50

Total
91
409
500

Son compatibles estos datos, a un nivel de significacin de 0,05, con


la hiptesis de que el defecto en el lenguaje no est relacionado con el
grupo socio-econmico?

ACTIVIDAD 2
Los resultados de un estudio realizado por un socilogo respecto al nivel
de comprensin de las consignas dadas a los alumnos de la Sala de 5
aos en un Jardn de la ciudad Capital de Santiago del Estero,
clasificados segn Nivel socioeconmico, se muestran en la tabla
siguiente:

Edad
(en meses)
Baja
Media
Alta
Total

Muy Bueno
12
13
18

Nivel de Comprensin
Bueno
Escaso o
Insuficiente
13
13
16
11
15
11

Total

138

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

A nivel de significacin de 0,05, comprobar si hay relacin entre las dos


variables.
Nota Aclaratoria:
Edad Baja : 42 a 46 meses- Edad Media: 46 a 50 mesesEdad Alta: 50 a 54 meses

ACTIVIDAD 3
En una investigacin se estudiaron 631nios de 0 a 5 aos de edad y se
analiz su estado nutricional, con referencia particular a si presentaban
o no retardo de crecimiento. Una vez hallados los resultados, el
investigador desea saber si el peso de nacimiento (bajo: igual o menor a
2500 g; normal: ms de 2500 gramos) est asociado al retardo de
crecimiento posterior, con un nivel de significacin de 0,05 %.

Peso de
Nacimiento
Bajo
Normal
Total

Si
21
124
145

Retardo en el Crecimiento
No
26
460
486

Total
47
584
631

139

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

CAPTULO V

UNIDAD VI

INFERENCIA ESTADSTICA

1. INTRODUCCIN

En captulos anteriores se vi:

Estadstica Descriptiva : Su objetivo es la recoleccin y reduccin de


datos . Se estudian tcnicas para presentar los datos de una forma ms
comprensible y as poder visualizar propiedades de los mismos.

Clculo de Probabilidades :La razn de su estudio es que la


Estadstica incluye la toma de decisiones en presencia de
incertidumbre. Estas decisiones tomadas se basan en probabilidades.
Aqu conocemos ( o suponemos conocido) por completo el modelo
probabilstico que usamos, es decir, la poblacin a estudiar la podemos
representar por una variable aleatoria X.

Recordemos que una poblacin est constituida por todos los


elementos que poseen unos caracteres por cuyo estudio estamos
interesados. Una muestra, en cambio, es una parte de los elementos
de la poblacin; pero esta parte ha de ser representativa del total.

Cuando el estadstico puede observar todos los elementos de la


poblacin
( observacin exhaustiva) , entonces su tarea se reduce a describir las
caractersticas y regularidades de la poblacin. Pero si la observacin no

140

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

puede ser exhaustiva, entonces aquellas caractersticas


estudiarlas a travs de una muestra representativa.

hay que

Hay que distinguir


entre poblaciones finitas y poblaciones
infinitas. Se dice que una poblacin es finita si tiene un nmero
limitado de sucesos o unidades elementales. Ejemplo de poblacin
finita son, en un ao dado los salarios recibidos por todos los docentes
de un Colegio, los ttulos recibidos por todos los estudiantes de un pas.
Mientras el nmero total de observaciones posibles sea limitado, se
trata de una poblacin finita.
En cambio, una poblacin infinita es la que, consiste en un
nmero infinitamente grande de observaciones. Por lo menos en teora ,
no hay lmite alguno al nmero de unidades que puede abarcar. Por
ejemplo, los resultados obtenidos al lanzar dos dados constituyen una
poblacin infinita , lo mismo que los pesos al nacer de todos los seres
humanos. Una poblacin infinita puede ser siempre generada a partir
de un conjunto finito de valores o unidades si el muestreo se hace con
reemplazo.

2. INFERENCIA ESTADSTICA

Definicin: La Inferencia Estadstica es el procedimiento por medio del


cual se llega a inferencias acerca de los parmetros de una poblacin
mediante los resultados que se obtienen a partir de una muestra
extrada de esa poblacin.
El objetivo principal de la Estadstica Inferencial
es la
estimacin, esto es que mediante el estudio de una muestra aleatoria
seleccionada de una poblacin se quiere generalizar las conclusiones al
total de la misma.

Definicin de muestra aleatoria


Todo conjunto de n unidades de observacin elementales tomadas
de una poblacin dada, se puede considerar como una muestra de
tamao n. Pero el tipo de muestra que aqu interesa es el de muestra
aleatoria. Una muestra aleatoria se puede tomar con o sin reemplazo.
Si la muestra se toma con reemplazo, de una poblacin , finita o infinita
, la unidad tomada se vuelve a dejar en la poblacin y el nmero de
unidades disponibles para seguir la operacin no se afecta. Esto
tambin es cierto cuando la muestra se toma de una poblacin infinita

141

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

sin reemplazo, es decir, cuando la unidad escogida no se vuelve a la


poblacin. Cuando se toma un elemento, sin reemplazar, de una
poblacin finita, el nmero de unidades que quedan tras cada unidad
que se saca se reduce en una unidad, y en consecuencia la probabilidad
de sacar cualquier unidad restante en operaciones sucesivas
se
aumenta.
Es necesario formular nuestro concepto en forma precisa. Por
definicin, una muestra debe tener ciertas propiedades como sigue:
Se supone que las muestras dan informacin acerca de la
poblacin a que corresponde, ya que por lo general es demasiado
costoso, requiere demasiado tiempo, o es imposible observar o medir
todos los objetos pertenecientes a la poblacin. La muestra debe
resultar de una seleccin aleatoria. Es decir, cada elemento de la
poblacin debe tener una probabilidad conocida de integrar la muestra,
esto es, de ser tomado en la muestra; el caso mas sencillo y ms comn
es en donde la probabilidad es la misma para todos los elementos de la
poblacin, y solo si se satisface este requisito ( al menos
aproximadamente) , los mtodos estadsticos darn resultados
razonables y tiles.
Adems, es necesario que las n ejecuciones del experimento
aleatorio con el que obtenemos
n
valores de la muestra sean
independientes, esto es, el resultado de una ejecucin no debe influir
en las otras ejecuciones. Esto equivale a decir que la probabilidad de
que cualquier miembro de la poblacin aparezca en una muestra, no
depende de la aparicin o no aparicin de los otros miembros de la
poblacin en la muestra.
Hay que tener presente que el conocimiento de las caractersticas
de una poblacin, salvo algunas excepciones, no puede conseguirse con
toda exactitud mediante una muestra. Si se tiene una poblacin
humana y suponemos que no existen errores de observacin, la nica
manera de obtener exactamente la estatura media, el porcentaje de
analfabetos, etc , en dicha poblacin es observando todos los
elementos de ella. Pero si esta observacin exhaustiva no es posible y se
utiliza como medio supletorio una muestra, entonces lo nico que
puede obtenerse, salvo en algunos casos particulares, son estimaciones
de aquellas caractersticas.
El problema de la Inferencia Estadstica parte del hecho cierto
de que una muestra, en general, no da una informacin exacta de las
caractersticas de la poblacin que deseamos estudiar, por lo que se
utiliza la muestra para estimar dichas caractersticas. Este enfoque
origina la Teora de la Estimacin, mediante la cual se da solucin a
los problemas especficos que se plantean.

142

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

3. DISEOS DE MUESTREO
La operacin de tomar una muestra de una poblacin se
denomina muestreo y los mtodos de muestreo que se utilicen deben
garantizar
aquella representatividad para que pueda hablarse
correctamente de una muestra estadstica.
Si se desea conocer, por ejemplo, el consumo medio de protenas
por alumno y dia en una ciudad y tomamos para ello un grupo de
familias integrado por la de ms alto nivel de vida, se concluir que ese
grupo no es representativo del total de familias de la ciudad. Por tanto,
el consumo medio que se obtenga del citado grupo no es una buena
estimacin porque entraa un error de un tipo distinto del que cabe
esperar en una muestra representativa.
Conviene distinguir entre dos clases de error. De una parte
existen los errores muestrales, que son aquellos que estn latentes en
toda muestra representativa, pues aun sindolo no proporciona, salvo
raras excepciones, una medida exacta de las caractersticas de la
poblacin; por ello hay que contar siempre con los errores muestrales o
errores de muestreo.
Y por otra parte estn los sesgos, bajo cuya denominacin se
incluyen algunos errores especficos de las muestras como los debidos a
su falta de representatividad, y otros que son comunes a toda
investigacin estadstica, tanto si es exhaustiva como si no lo es. A este
ltimo grupo pertenecen los errores de observacin, los originados por
definiciones defectuosas de los elementos de la poblacin, de los
caracteres a investigar , los debidos a respuestas o medidas mal
efectuadas , a frmulas inadecuadas, a clculos equivocados, etc.
Ejemplo: Supongamos que deseamos tomar una muestra de 100
padres de alumnos de nios en edad de 4 y 5 aos de un Colegio para
conocer su opinin acerca de un nuevo juego. Un posible mtodo es
situarse a las nueve de la maana en una entrada del Colegio y
preguntar a los 100 primeros padres que aparezcan. Con este
procedimiento los padres de nios que solo asisten por la tarde no
estarn representados en la muestra. Adems, estarn muy poco o
nada representados los padres de nios que no acudan habitualmente.
Cuando algunos miembros de la poblacin tienen una
probabilidad ms alta que los otros de estar representados en una
muestra se dice que existe un sesgo de seleccin y la muestra puede
no ser representativa de la poblacin. Por ejemplo, si existen diferencias
marcadas de opinin entre los padres nuevos y los veteranos, y la
muestra slo incluye a los veteranos, tendr un sesgo de seleccin. Una

143

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

forma de evitar este sesgo es tomar la muestra mediante un


procedimiento de seleccin objetivo que garantice a todos los elementos
de la poblacin la misma oportunidad de aparecer en la muestra.
El mtodo anterior presenta adems el riesgo de un sesgo
adicional: el sesgo por no respuesta. Si los padres que no responden
son los ms disconformes, la muestra contendr una proporcin menor
de padres de esta categora y, de nuevo, puede no ser representativa de
la poblacin que tratamos de investigar. El sesgo de no respuesta no
puede evitarse con certeza pero deben tomarse precauciones para
prevenir que ocurra.

3.1. MUESTREO ALEATORIO SIMPLE


El muestreo aleatorio simple est fundamentado en el puro azar.
Se puede decir que es un muestreo en el que si se saca al azar una
muestra de n unidades, toda posible muestra de n unidades tiene la
misma probabilidad de ser seleccionada. Una muestra obtenida por este
procedimiento se dice muestra aleatoria simple.

Uno de los mtodos comnmente utilizados para lograr que la


muestra sea aleatoria es numerar todos los elementos de una
poblacin, escribir los nmeros en tarjetas o fichas o bolillas o
cualesquiera cosas fsicamente homogneas; poner luego en una bolsa
estos objetos numerados y mezclarlos completamente. Se define el
tamao n de la muestra y se sacan los objetos al azar uno por uno,
hasta que se obtenga el nmero deseado de partidas para anotar. El
procedimiento se puede simplificar utilizando una tabla de nmeros
aleatorios.

3.2. MUESTREO ALEATORIO SISTEMTICO


Cuando los elementos de la poblacin estn ordenados en listas,
una alternativa ms fcil de ejecutar que el muestreo aleatorio simple
es el muestreo sistemtico. Muy a menudo, si se desea un muestreo
aleatorio simple se sigue un procedimiento sistemtico en vez de un
mtodo al azar. Segn el procedimiento sistemtico, se obtiene una
muestra tomando cada k-sima unidad de la poblacin tras numerar
las unidades de la poblacin o haberlas ordenado de alguna manera. La
letra k representa un nmero entero, que es aproximadamente la razn
de muestreo entre el tamao de la poblacin y el tamao de la muestra.

144

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

As, si la poblacin consiste en 10.000 unidades de muestreo y se desea


una muestra de 500 unidades, entonces

K = 10.000 / 500 = 20

Y la muestra se obtiene tomando una unidad cada veinte de la


poblacin.
Para que toda unidad de la poblacin tenga igual probabilidad de
salir, el procedimiento debe empezar al azar. Con una razn de
muestreo de 20, se puede utilizar el procedimiento de la bolsa o del
bolillero poniendo 20 bolillas o 20 papelitos numerados de 1 a 20 en el
bolillero o bolsa. Tras revolver y mezclar completamente, se saca una
bolilla al azar. Si se saca la bolilla 11, se empieza con este nmero y se
incluye en la muestra cada vigsima bolilla a partir de esta, es decir, la
treinta y una, la cincuenta y una, y as sucesivamente.

3.3. MUESTREO POR ESTRATOS


El muestreo aleatorio simple debe utilizarse cuando los elementos
de la poblacin son homogneos respecto a la caracterstica a estudiar,
es decir, a priori la prediccin que haramos del valor de la variable sera
el mismo para todos los elementos. Un muestreo que sera ms efectivo
que este, es el muestreo aleatorio por estratos, procedimiento que
exige tener conocimiento previo de la poblacin. El proceso de
estratificacin contempla dividir la poblacin en grupos homogneos o
clases llamados estratos . Dentro de cada uno de tales estratos, estn
los elementos situados de manera ms homognea con respecto a las
caractersticas que estn en estudio. Para cada estrato se toma una
submuestra mediante el procedimiento aleatorio simple, y la muestra
global se obtiene combinando las submuestras de todos los estratos.
El muestreo por estratos es el ms efectivo cuando se trata de
poblaciones heterogneas tales como datos de desempleo (que varan de
ocupacin a ocupacin), ventas al por menor (que difieren entre las
distintas regiones geogrficas) , y las actitudes de los consumidores
respecto de los nuevos modelos de automviles ( en las que influyen
factores tales como el sexo, la edad, y la categora de ingreso). Al
hacerse la estratificacin, las clases se establecen de modo que las
unidades de muestreo tienden a ser uniformes dentro de cada clase, y
las clases tienden a ser diferentes entre s. As se puede controlar la

145

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

proporcin de cada estrato en la muestra global y no dejarla al azar y


queda asegurado el carcter representativo de la muestra.
El muestreo por estrato es por consiguiente una combinacin de
submuestras de los estratos, que son muestras aleatorias simples o
sistemticas. En cuanto tales, todo elemento disponible de cada estrato
tiene igual probabilidad de ser seleccionado, y esta ser la situacin
aun en el caso en que la muestra no sea proporcionada, en el cual las
probabilidades de ser seleccionado cada elemento individual de la
poblacin no son iguales.

3.4.MUESTREO POR CONGLOMERADO


Diametralmente opuesto al muestreo por estratos est el
muestreo por conglomerados, que consiste en seleccionar primero al
azar grupos, llamados conglomerados , de elementos individuales de la
poblacin, y en tomar luego todos los elementos o una submuestra de
ellos dentro de cada conglomerado para constituir as la muestra global.
Para lograr los mejores resultados en el plan del muestreo por
conglomerado, se hacen tan pequeas como sea posible las diferencias
entre conglomerados, en tanto que las diferencias entre los elementos
individuales dentro de cada conglomerado se hacen tan grandes como
sea posible.
Por ejemplo, si queremos extraer una muestra aleatoria simple de
los estudiantes universitarios de un pas sera necesario disponer de
una lista de todos ellos y de sus direcciones y telfonos. Esta
informacin puede no estar disponible o ser muy cara de conseguir. Sin
embargo, en este caso, los estudiantes aparecen clasificados en
universidades, facultades y cursos. Podemos seleccionar en una
primera etapa algunas universidades, despus algunas facultades al
azar de cada universidad, dentro de las facultades algunas clases y,
dentro de las clases, estudiantes mediante muestreo aleatorio.
Para la primera etapa solo necesitamos una lista de
universidades. Para las universidades seleccionadas es necesario luego
conocer las facultades que incluyen. En las facultades elegidas
necesitamos una lista de las clases, y de las clases que se tomen, una
relacin de los estudiantes. Esta informacin estar disponible por lo
que este tipo de muestreo ser factible.
Llamaremos conglomerados a estas unidades amplias donde se
clasifican los elementos de la poblacin. En cada etapa de muestreo , en
lugar de seleccionar elementos al azar , seleccionamos conglomerados.
Los conglomerados se refieren a formas de agrupacin fsica de las
unidades en el espacio o en el tiempo.

146

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

Idealmente los conglomerados tienen que ser lo ms parecido


posible a muestras aleatorias de la poblacin , de manera que cada
conglomerado sea tan heterogneo como la poblacin a investigar.
El muestreo por conglomerado tiene la ventaja de simplificar
enormemente la recogida de la informacin muestral. El inconveniente
obvio es que si los conglomerados son heterogneos entre s, como slo
se analizan algunos de ellos, la muestra final puede no ser
representativa de la poblacin.

3.5. MUESTREO POR CUOTAS


A veces la estratificacin no es posible, o es muy cara, y se
recurre en su lugar al muestreo por cuotas. Por ejemplo, se desea
tomar una muestra de una poblacin para estudiar la proporcin de
personas que estn de acuerdo con el uso de remedios especiales. Si
suponemos que la edad y el sexo pueden influir en la opinin,
deberamos tomar una muestra donde estas caractersticas sean las
mismas que en la poblacin base, lo que implica una muestra
estratificada. Sin embargo, esto requiere una lista de las personas de la
poblacin que incluya su sexo y edad, lo que puede no estar disponible.
Sin embargo, si conocemos la proporcin de cada sexo y la distribucin
de la edad en la poblacin, una solucin frecuente es exigir que estas
caractersticas aparezcan en la muestra en la misma proporcin que en
la poblacin. Esto conduce a fijar cuotas de hombres y mujeres por
grupos de edad. El entrevistador debe conseguir los elementos de la
muestra respetando esta restriccin de cuotas.

147

Licenciatura en Educacin Inicial Escuela para la Innovacin Educativa - UNSE

BIBLIOGRAFA
-

Bentez, Celia de; Pece, Marta G.; Galndez, Margarita de.


(2003). Serie Didctica N7: Elementos de Estadstica para
tcnicos en vivero y plantaciones forestales, con gua de
ejercitacin.
Barbancho, A. (1983).
Estadstica Elemental Moderna. 9a
Edicin. Ariel, S. A. Barcelona. ISBN 84-344-2005-8
Daniel, W.W. (1997) Bioestadstica. ISBN 968-18-5196-X.
Glass, G y Sanley,J. Mtodos Estadsticos Aplicados a las
Ciencias Sociales. Prentice /Hall Internacional
Kreyszig, E. (1994). Introduccin a la Estadstica Matemtica .
Principios y mtodos. LIMUSA. Noriega Editores. ISBN 968-180729-4.
Pea, D. y Romo, J. (1999) . Introduccin a la Estadstica para
las Ciencias Sociales. ISBN 84-481-1617-8.
Triola, M.F.(2004). Estadstica. Novena edicin.ISBN 970-260519-9. Editorial Pearson. Mxico. 837 pags.
Ya-Lun, Chou. (1990). Anlisis Estadstico. ISBN 970-10-0046-3.
pags.808.

148

You might also like