You are on page 1of 21

APUNTE N 1 ESTADSTICA

1 Unidad: Anlisis de Datos Univariados


I. ESTADSTICA DESCRIPTIVA
Definiciones:
A.
Estadstica
Es un conjunto de conceptos y mtodos, empleados para recolectar e interpretar datos referentes
a un rea de investigacin particular y para extraer conclusiones en situaciones en que la
variabilidad est presente.
El OBJETIVO de la Estadstica es hacer INFERENCIAS (predecir, tomar decisiones) sobre
algunas caractersticas de una poblacin con base en la informacin contenida en una
muestra.
B.
Estadstica Descriptiva o Deductiva
Es una descripcin, vale decir, resume y registra, en forma adecuada, un gran conjunto de datos.
Estos datos se recopilan, organizan, tabulan, y se representan mediante grficos o tablas.
C.
Poblacin
Poblacin Estadstica, es el conjunto completo de posibles mediciones o registros de algn rasgo
cualitativo, corresponde a la coleccin completa de unidades de las que se harn inferencias. La
Poblacin representa el objetivo de una investigacin y, por ende, es el punto desde donde se
recolectan datos para obtener o extraer conclusiones referente a ella.
D.
Muestra
La Muestra de una poblacin, es el conjunto de mediciones que se obtienen en el curso de la
recoleccin, por lo tanto corresponde a un subconjunto de la Poblacin.
E.
Variable
Es cualquier caracterstica, que diferencia a un miembro de otro, dentro de una misma Poblacin
Estadstica. Puede tomar un valor cualquiera, obtenido de un conjunto que constituye el dominio
de la variable. Se representa por x, y, etc.
Atributos: Corresponde a los datos de tipo cualitativo.
Por ejemplo: Color de pelo, Nacionalidad, Profesin, Nombres, etc.
Tipos de Variables:
Existen dos tipos: Variable Continua y Variable Discreta.
Variable Continua
Es aquella que puede tomar cualquier valor comprendido entre dos valores dados, adems se
obtiene mediante un proceso de medicin .
Por ejemplo : la estatura de una persona
Variable Discreta
Es aquella que puede tomar slo valores enteros, se obtiene mediante un proceso de conteo.
Por ejemplo : el nmero de personas que son atendidas en una Isapre en un mes determinado
F.
Datos
Conjunto de valores asociados o asignados a una variable.
Por ejemplo:
Poblacin : Trabajadores de una empresa
Muestra : Trabajadores que laboran en la seccin de recursos humanos dentro de la empresa
Variable : Ingresos los trabajadores de la seccin de recursos humanos
Datos
: $350.000; $425.000; $385.200; $421.400; etc.

Distribuciones de Frecuencias
Es usual presentar la ordenacin de datos muy numerosos, en forma agrupada y ordenada, en
clases o categoras. Determinar el nmero de individuos que pertenecen a cada clase, se
denomina, Frecuencia de Clase.
Una disposicin tabular o Tabla de Datos, junto con las correspondientes frecuencias de clase, se
llama Distribucin de Frecuencias, o Tabla de Frecuencias.

Para confeccionar estas Tablas de Frecuencias, debemos considerar las siguientes situaciones:
Si la variable que estamos midiendo, es de tipo Discreto, asumen valores de un conjunto
finito, entonces podemos realizar la distribucin en columnas, en las cuales se registran los
valores de la variable y las frecuencias asociadas a ellas.
Si la variable que estamos midiendo, es de tipo Continuo, pueden tomar cualquier intervalo
determinado por los nmeros reales, no tiene sentido tabularla para cada una de las
observaciones, dado que es muy improbable que la variable bajo estudio tome el mismo valor
durante el experimento. Dicho de otro modo, cuando en una distribucin de frecuencias haya
muchos valores distintos de la variable, conviene agruparlos en Intervalos o Clases.
Agrupacin de Intervalos
Se debe considerar:
Recorrido o Campo de Variacin de la Variable(RANGO): Es la diferencia entre el mayor y el
menor valor que ella toma.
Es decir: Valor mximo valor mnimo
Nmero de Intervalos:
Debe cumplir con dos condiciones:
a.- Resumir la informacin
b.- Conservar el detalle de la muestra
Existen diferentes criterios que permiten determinar el nmero de intervalos. Uno de ellos
corresponde a determinar la raz cuadrada del tamao de la muestra
n
Nmero de intervalos =
Tamao o amplitud de los Intervalos:
Dependen de la cantidad de datos de la muestra y de su recorrido.
c=

Rango de la muestra
nmero de int ervalos

Ejemplos :
Variable Tipo Discreto
Los siguientes datos corresponden a las edades (en aos) de un grupo de 34 personas:
45 36 72 54 45 72 48 62 38 43 48 64 43 36 54 72 64
60 70 38 64 60 70 48 72 62 72 48 54 64 70 43 60 45
Tabla de frecuencias que corresponde es:
Edad
N de personas
36
2
38
2
43
3
45
3
48
4
54
3
60
3
62
2
64
4
70
3
72
5
34
Variable Tipo Continuo
Despus de medir los resultados obtenidos en una prueba para postular a un cargo administrativo
dentro de una empresa. de 40 personas, resultaron los siguientes valores de la variable:
154 178 150 166 181 175 163 175 150 162
152 155 161 165 160 159 160 168 162 162
163 155 157 161 162 155 167 164 165 158
158 163 166 167 156 164 170 176 172 160
Rango de la muestra = 181 - 150 = 31

Si elige intervalos de cuatro puntos de diferencia entre los valores extremos, de cada intervalo
entonces:
31:4 = 7,75 aprox. 8 intervalos
Tabla de Frecuencias:
Intervalo
150-154
154-158
158-162
162-166
166-170
170-174
174-178
178-182

N de personas
3
6
8
11
5
2
3
2

Tablas de Frecuencias
Para facilitar el resumen de la informacin contenida en las Tablas de Frecuencias, es necesario
definir algunos conceptos:
a)

Frecuencia o Frecuencia Absoluta ( f i )

Corresponde al nmero de veces que se repite un valor o una caracterstica determinada, en


algunos casos corresponder al nmero de valores que caen en un determinado intervalo.
b)

Frecuencia total (n) : es el total de la muestra, es decir :


m

n f i f1 f 2 .......... f m
i 1

c)

Frecuencia Relativa ( h

i)

i al nmero de veces que


Si se denota por
a la variable bajo estudio y
se repite dicha
variable, la Frecuencia Relativa corresponder a la expresin:
m
fi
hi 1
Propiedad a cumplir :
hi
n
i 1

d)
Frecuencia Relativa Porcentual
Corresponde a la Frecuencia Relativa multiplicada por 100.

h i 100

e)
Frecuencia Absoluta Acumulada
Corresponde a los valores una vez ordenados que van siendo agregados a travs de las distintas
clases o categoras.
Fi f 1 f2 ................ f k
Propiedad a cumplir : Fm = n
f)
Frecuencia Relativa Acumulada
Corresponde a la Frecuencia Absoluta acumulada partido por el total de observaciones.

Hi

Fi
n

Propiedad a cumplir:

H m % 100%

Intervalos o clases
Para Tablas, en que la variable est representada por Intervalos, es necesario definir algunos
otros conceptos que nos sern de utilidad ms adelante.
a)

Intervalos de Clases y Lmites de Clases

4
El smbolo que define una Clase, como el 150-154, en nuestro ejemplo, se llama Intervalo de
Clase. Los nmeros extremos, 150 y 154 se llama lmite inferior de clase (150) y lmite superior
de clase (154).
b)
Fronteras de Clase o lmites reales
Si se dan alturas con precisin de 1 cm., el intervalo de clase 150-154 incluye tericamente todas
las medidas desde 149,5 a 154,5. Estos nmeros se llaman Fronteras de Clase o Lmites Reales de
Clase. En la prctica, los lmites reales se obtienen promediando el lmite superior de un intervalo
con el inferior del siguiente.

c)

Amplitud o tamao de un Intervalo de Clase


Es la diferencia entre las Fronteras de Clases superior e inferior.
Es decir:
c = LRS - LRI
d)
Marca de Clase
Es el punto medio del Intervalo de Clase y se obtiene promediando los lmites inferior y superior
del intervalo (clase).
Ejemplo
La tabla que resume las puntuaciones obtenidas en el examen de seleccin es:
Intervalo de Clase

Marca de Clase

150-154
154-158
158-162
162-166
166-170
170-174
174-178
178-182

152
156
160
164
168
172
176
180

Observacin :

3
6
8
11
5
2
3
2

hi 100

Hi %

3
9
17
28
33
35
38
40

7,5%
15 %
20 %
27,5%
12,5%
5%
7,5%
5%

7,5 %
22,5 %
42,5 %
70,0 %
82,5 %
87,5 %
95,0%
100,0%

Verificar si se cumplen las propiedades de las frecuencias.

Representaciones Grficas de las Distribuciones de Frecuencias


a)
Histograma
Consiste en un conjunto de rectngulos con:
Bases en el eje X horizontal, centros en las marcas de clases y amplitud ( ancho) iguales a los
tamaos de los Intervalos de Clases.
reas proporcionales a las Frecuencias de Clases.
Si los Intervalos de Clases, tienen todos la misma amplitud, las alturas de los rectngulos son
proporcionales a las Frecuencias de Clase, y entonces es costumbre tomar las alturas iguales a
las Frecuencias absolutas.
b)
Polgono de Frecuencia
Es un grfico de trazos de la Frecuencia de Clase con relacin a la marca de clase. Puede
obtenerse conectando los puntos medios de las partes superiores de los rectngulos del
Histograma.
Por ejemplo
Polgono e Histograma de la Tabla de Frecuencias de la altura.

c)

Ojiva

Otra representacin grfica de las Tablas de Frecuencias es la Ojiva, la diferencia entre sta y el
Histograma, o el Polgono de Frecuencias, es que la Ojiva representa la distribucin de
frecuencias acumuladas por debajo de cualquiera de las fronteras de clase superiores respecto de
dicha frontera.
Por ejemplo

PROBLEMAS RESUELTOS
1. Dadas las siguientes variables, clasifquelas, en atributos, variables discretas o continuas:
a)
Valor de la U.F.
b)
Sueldo de un asistente judicial, en la Regin Metropolitana
c)
Nmero de cargas familiares de un grupo de trabajadores
d)
Nmero de personas que ingresa diariamente a un banco
e)
Valor de dlar
f)
Nmero de fojas, que contiene un expediente judicial
g)
Nacionalidad de los asistentes a un evento musical

6
Solucin:
a) Variable continua
b) Variable continua
c) Variable discreta
d) Variable discreta
e) Variable continua
f) Variable discreta
g) Atributo
2) Los siguientes datos corresponden al nmero de empleados que tienen demanda por pensin
alimenticia, en veinte empresas del rubro metalrgico:
5
2
3
1

0
4
2
3

2
3
1
2

3
2
2
0

1
0
5
4

Con la informacin anterior construya una tabla de distribucin de frecuencias, considerando


frecuencias absolutas y relativas.
Solucin:
Los datos anteriores corresponden a una variable discreta, ya que no admite valores intermedios.
Los valores de la variable estn comprendidos entre 0 y 5, los cuales se ubican en la primera
columna, marca de clase.
La segunda columna corresponde a la frecuencia absoluta ( f i ), la cual se obtiene contando, las
veces que se repiten cada uno de los valores de la muestra.

La tercera columna corresponde a la frecuencia absoluta acumulada F i , el primer valor


acumulado es igual al primer valor de la frecuencia absoluta, los siguientes valores , se obtienen
a partir de sumas acumuladas.

La cuarta columna corresponde a la frecuencia relativa h i 100 , que indica el porcentaje de

cada frecuencia absoluta, respecto del total hi i


n

H i , el primer valor
La quinta columna corresponde a la frecuencia relativa acumulada
acumulado es igual al primer valor de la frecuencia relativa, los siguientes valores , se obtienen a
partir de sumas acumuladas.

Nmero

Empleadosf i (Nmero
0
1
2
3
4
5

Totales:

3
3
6
4
2
2
20

Empresas) F i
3
6
12
16
18
20

hi 100
15%
15 %
30 %
20%
10 %
10 %
100%

Hi
15 %
30 %
60 %
80 %
90 %
100 %

Con respecto a la tabla anterior, responda lo siguiente:


a) Nmero
de empresas, que presentan menos de tres trabajadores con demanda
alimenticia
b) Qu tanto por ciento de la empresas no presentan empleados con demanda alimenticia?

c) Qu tanto por ciento de las empresa presentan entre dos y tres demandas por pensin
alimenticia?
d) Nmero de empresas que presentan a lo menos cuatro trabajadores con problemas
judiciales.
Solucin :
a) Doce empresas, presentan menos de tres trabajadores con demanda alimenticia, esto se
obtiene, considerando la suma de ninguno, uno y dos trabajadores que cumplen esta condicin.
b) 15% de las empresas no tienen problemas judiciales, esto lo obtenemos directamente a partir
de la tabla.
c) El cincuenta por ciento de las empresas presentan entre dos y tres demandas judiciales, esto
corresponde a la suma de la frecuencia relativa de dos y tres trabajadores.
d) Cuatro empresas presentan a lo menos cuatro trabajadores con problemas judiciales, que
corresponde a la suma de las frecuencias absolutas de cuatro y cinco trabajadores.
Represente grficamente la informacin anterior.
3) La siguiente informacin nos proporciona el nmero de causas que ingresan en un da
determinado a la corte de apelaciones , presentadas por 50 abogados de diferentes empresas:
5
8
4
10
20

12
3
11
15
17

8
15
7
4
14

25
18
9
8
11

4
14
12
5
3

10
9
14
12
4

15
6
10
11
1

23
7
11
14
18

2
6
14
8
12

0
21
4
9
10

Con la informacin anterior construya una tabla de distribucin de frecuencias


Solucin :
Rango de la variable: Valor mximo variable Valor mnimo de la variable
R = 25 0 = 25
Para la construccin de la tabla de distribucin consideraremos una amplitud de 5 ( Este valor
corresponde a un criterio determinado, Ud. puede elegir otra amplitud, de acuerdo a su criterio)
Con respecto al tipo de intervalo, se ha escogido, intervalo cerrado por la izquierda y abierto por
la derecha. Cerrado por la izquierda significa que este valor pertenece al conjunto, abierto por la
derecha, significa que el valor no est incluido en el intervalo. Usted puede definir otro tipo de
intervalo.

Nmero

i 1

de causasMarca de clase xi
xi

0-5
5 10
10 -15
15 -20
20 -25
Totales:

2,5
7,5
12,5
17,5
22,5

f i (N

de abogados) F i
10
13
17
6
4
50

Con respecto a la tabla anterior, responda lo siguiente:


Qu cantidad de abogados ingresa entre 5 y menos de 15 causas?
Qu porcentaje de abogados ingresan menos 20 causas?

10
23
40
46
50

hi %

Hi

20% 20%
26% 46 %
34% 80 %
12% 92 %
8% 100 %
100%

8
Qu cantidad de abogados ingresa menos de 10 causas?
Entre que rango varan el mayor nmero de causas que presentan estos profesionales?
Solucin:
Observando los valores de la tabla de distribucin, podemos responder las interrogantes
anteriores, en forma similar al problema anterior
30 abogados ingresan entre 5 y 15 menos de 15 causas.
92% de los abogados ingresan menos de 20 causas.
23 abogados ingresan menos de 10 causas
Diecisiete abogados presentan entre 10 y menos de 15 causas

PROBLEMAS PROPUESTOS
1. La siguiente informacin corresponde a los sueldos de 40 empleados de la empresa XXX

HISTOGRAMA

% de em pleados

sueldos de em pleados

30%
28%
26%
24%
22%
20%
18%
16%
14%
12%
10%
8%
6%
4%
2%
0%
620 - 665

665 - 710

710 - 755

755 - 800

800 - 845

845 - 890

Ingresos

Con la informacin anterior, construya una tabla de distribucin de frecuencias.


2. . El nmero de inasistencias de los alumnos, durante 50 clases en la asignatura de estadsticas
son :
1 3 0 0 1 0 4 1 1 0 1 2 6 0 1 0 0 0 0 1 0 0
1 2 6 0 1 0 0 1 0 0 2 4 5 6 0 1 2 4 5 2 1 3
1 2 0 1 0 1
a) Disear una tabla de frecuencias.
b ) Completar la tabla con hi, Fi , Hi
c) Interpretar estadsticamente f4 , h5 , H5 , F4

II. ESTADGRAFOS DE POSICIN


Las medidas de tendencia central son valores que estn en el centro o punto medio de un
conjunto de datos.
Entre las medidas ms conocidas se pueden sealar las siguientes:
a) Media aritmtica: La media aritmtica de un conjunto de valores es el valor que se
obtiene sumando los valores y dividiendo el total entre la cantidad de valores. Esta
medida recibe tambin el nombre de promedio aritmtico o simplemente promedio.
Notacin :

Media =

Donde :

xi

xi

= i 1
n

denota la suma de los valores de la muestra o poblacin.

n : representa el tamao de la muestra.


N : representa el tamao de la poblacin.
Si se cuenta con todos los valores de la poblacin la media se denota por

xi

i 1

La media aritmtica para datos agrupados en tablas de distribucin de frecuencias


k

est dada por :

x i f i

i 1

donde : x i corresponde al valor observado o a la marca de clase


f i corresponde a la frecuencia absoluta .
Ejemplo : Los siguientes datos corresponden a las edades de 6 personas:
34, 33, 44, 29, 45, 25
La media aritmtica de las edades es: x

34 33 44 29 45 25 210

35
6
6

Se interpreta como que la mayora de las personas tiene edad cercana a los 35 aos.

Media aritmtica para muestras estratificadas.

Para ms de una muestra, si se tiene la media aritmtica ( x i ) y el tamao ( n i ),


de cada una de las muestras se puede determinar la media aritmtica de la siguiente
forma:

10
X

Ejemplo :

x1 n1 x 2 n 2 ... x k n k
n 1 n 2 ... n k

En una fbrica, se tiene que el sueldo promedio de 90 empleados de la seccin A es


de $560.000, el sueldo promedio de 60 empleados del seccin B es de $ 600.000 y
el sueldo promedio del de 50 empleados seccin C es de $ 500.000.

El sueldo promedio de los empleados de la fbrica es igual a:


X

560000 90 600000 60 500000 50


= 557000
90 60 50

La media o promedio de sueldo de los trabajadores de la fbrica es de $ 557.000


Propiedades de la media aritmtica
n

1)

x i x 0

i 1

2) k x =
3)

kx

k x k x

; k R
; k R

Ejemplo :
Los siguientes datos corresponden a las edades de 8 personas:
x i : 35, 25, 36, 45, 36, 39, 40, 26.

35 25 36 43 36 39 40 26
35
8
40 30 41 48 41 44 45 31
Cul ser la media dentro de 5 aos? x =
40
8

La media aritmtica es: x =

Que es igual a sumar 5 a la media aritmtica: x + 5 = 35 + 5 = 40


b) Mediana ( Me) : La mediana de un conjunto de valores es a que se encuentra en medio
de los valores ordenados en forma ascendente ( o descendente) .
Para obtener la mediana, primero se clasifica los valores y luego se decide de acuerdo a
uno de los siguientes criterios:
i)

Si el NMERO DE DATOS ES IMPAR, la mediana es el nmero que est situado


exactamente a la mitad de la lista.
Ejemplo : Obtenga la mediana de estos tiempos de supervivencia en aos
(despus de entrar en funciones) de los primeros cinco presidentes de Estados
Unidos.
10
29
26
28
15
Al ordenar los valores: 10 15
26
18
29
Se obtiene que el valor que est justo en la mitad es 26, es decir: M e= 26

ii)

Si el NMERO DE DATOS ES PAR, la mediana se obtiene sumando los valores


que estn en medio y dividindolos por 2.
Ejemplo: Los siguientes valores representan los sueldos ( en miles de pesos) de 6
funcionarios de la empresa G. E: 600, 556, 356, 700, 450, 659.
Al ordenar los valores: 356, 450, 556, 600, 659, 700
Se obtiene que la mediana es

556 600
= 578
2

11

Si los datos estn agrupados en tablas de distribucin de frecuencias la mediana se


determina a partir de la siguiente frmula:
n

2 F i1
M e = L IR + c

fi

Donde
L i : Es el lmite inferior del intervalo o clase.
C : es la amplitud del intervalo
F i 1 : Es la frecuencia acumulada del intervalo anterior.
f i : es la frecuencia absoluta de la clase o intervalo.
Profundidad de Mediana

Ejemplo: Sean los datos

d(Me )

n 1
2

6, 7 , 8 , 9 , 9 y 10

d( Me)

significa

6 1
3,5
2

Esto

que, la mediana est a la mitad entre la porciones de datos tercera y cuarta. Luego
Me = 8,5
Ejemplo : La siguiente distribucin de frecuencias representa el nmero de das durante un
ao, que los empleados y obreros de una compaa manufacturera, estuvieron
ausentes del trabajo debido a enfermedad.
N de
inasistencias
02
35
68
9 11
12 - 14

n = 50

N de empleados ( f
i )
5
12
20
10
3

n
2

50

5
17
37
47
50

25

Ubicamos el 25 en la frecuencia acumulada La mediana ( o valor mediano) se encuentra


en el intervalo 6 8 ( que se denomina INTERVALO MEDIANO)
Observacin :
El lmite inferior del Intervalo Mediano debe ser Real para el
clculo de la Mediana.

25 17
= 6,7
20

M e = 5,5 + 3

Interpretacin :
Para este grupo de 50 empleados , el 50% de las inasistencias se
encuentra en 6,7 7 das.
Moda ( M o ) : La moda de un conjunto de datos
valor de mayor frecuencia.

es el valor que ms se repite, es decir, el

12
Si hay dos datos que tienen la misma frecuencia, y esta frecuencia es la ms alta, los dos
valores son moda. En tal caso la distribucin se denomina bimodal . Si ningn valor se
repite, no hay moda.
Ejemplo : Los siguientes valores representan los sueldos ( en miles de pesos)
funcionarios de la empresa G. E: 600, 556, 356, 700, 450, 659. 450 , 450.

de 8

Para este caso M o = 450.000

La moda para de un conjunto de datos agrupados est dada por :


Mo= L
Donde :

Ejemplo :

IR

1
1

+ c

1 es la diferencia entre la frecuencia del intervalo modal y la frecuencia


anterior.
2 es la diferencia entre la frecuencia del intervalo modal y la frecuencia
posterior.
Para la distribucin dada.
N de
inasistencias
02
35
68
9 11
12 - 14

N de empleados ( f
i )
5
12
20
10
3

Se tiene que la frecuencia absoluta ms alta es f 3 = 20 y eso indica que la moda se


encuentra en el intervalo 6 8.
Recuerda que : segn la frmula se necesitan los lmites reales del "INTERVALO
MODAL"
Para determinar el valor que denominaremos moda, se procede de la siguiente forma:
Determinar
1 = f 3 f 2 = 20 12 = 8

2 = f 3 f 4 = 20 10 = 10

M o = 5,5 + 3 8 10 = 6.83

Interpretacin:
El nmero de inasistencias que ocurre mms se repite para la
muestra de 50 empleados es de 6,8 = 7 das
El valor denominado moda, no siempre es un valor de la muestra.
COMPARACIN ENTRE MEDIA, MEDIANA, Y MODA.
i) Si la distribucin de frecuencias de la variable es simtrica, las tres medidas coinciden.
ii) Si la distribucin es unimodal y es sesgada a la derecha ( asimtrica positiva) , entonces
Mo<Me < x

13
iii) Si la distribucin es unimodal y es sesgada a la izquierda
entonces

( asimtrica negativa ) ,

x < Me < Mo

OTRAS MEDIDAS DE POSICIN:


Las medidas de localizacin dividen la distribucin en partes iguales, sirven para clasificar a un
individuo o elemento dentro de una determinada poblacin o muestra. As en psicologa los
resultados de los test o pruebas que realizan a un determinado individuo, sirve para clasificar a
dicho sujeto en una determinada categoria en funcin de la puntuacin obtenida. Estos medidas
segn su localizacin son :
1. Cuartiles.
2. Deciles.
3. Percentiles.
Los percentiles, deciles y cuartiles corresponden a medidas de posicin , pero no de tendencia
central.
a) Percentiles : Son los 99 valores que dividen la distribucin en 100 partes iguales. Se
designan por P1 , P2 ,..., P 99 , donde P1 es el percentil 1, P2 es el percentil 2, etc .
Ejemplo 1
En una distribucin de notas, el percentil 45 es una nota de referencia que permite afirmar
que el 45% de los alumnos tiene una nota igual o inferior a esa nota o que el ( 100-46)% tiene
una nota superior a esa nota.
Para determinar el percentil se utiliza la siguiente frmula:

Ejemplo 2:

p n

100 F i1

Pp= Li+ c
fi

Los siguientes datos corresponden a puntajes obtenidos por 55 personas en un


test de habilidades mentales.
Clase
10 - 20
20 30
30 40

fi
6
5
16

Fi
6
11
27

14
40 50
50 60
60 70
70 - 80
i)

10
5
5
8

Determinar el percentil 40 .

n = 55

p n
100

37
42
47
55

40 55
100

22

Ubicamos el 22 en la frecuencia acumulada. El percentil 40 est en el intervalo 30 40


40 55

100 11

P 40 = 30 + 10
16

= 36,875 = 36,88

El 40% de las personas obtuvo un puntaje menor o igual a 36,88.


ii)

Determine el percentil 50, interprete.

b) Cuartiles :
Medida de localizacin que divide la poblacin o muestra en cuatro partes
iguales.
Q1= Valor de la variable que deja a la izquierda el 25% de la distribucin.

Q2= Valor de la variable que deja a la izquierda el 50% de la distribucin = mediana.


Q3= Valor de la variable que deja a la izquierda el 75% de la distribucin.
nj
Fi 1

Q j LIR 4
fi

Su expresin es :

Observacin :

25

=Q

50

=Q

75

=Q

c) Deciles : Medida de localizacin que dividen a la distribucin en 10 partes iguales, por lo


tanto hay 9 deciles.

nj

10

LIR

F
i 1
f

Observacin :
decir :

El percentil 50, el cuartil 2 y el decil 5 coinciden con la mediana, es

Me=P

50

=Q

=D

EJEMPLO:
Dada la siguiente distribucin de frecuencia , calcular Q 1 , Q3 , D3 y P45
Li-1
45
55
65
75
85

Li
55
65
75
85
95

ni
6
10
19
11
4

Ni
6
16
35
46
50

15

Solucin : Como se puede observar la forma de calcular estas medidas (Cuartiles)


similar a la del clculo de la mediana.

es muy

Clculo de Q1: Buscamos en la columna de las frecuencias Acumuladas el valor que supere al
25% de N=50, corresponde al 2 intervalo. (50/4 = 12.5)
Anlogamente calculemos Q3, Buscamos ahora en la misma columna el correspondiente al 75
%de N que en este caso es el 4 intervalo (3.50/4=37.5)

Veamos ahora el decil 3. (corresponde al 30 % 3 50 / 10 = 15) sera el 2 intervalo.

Por ltimo veamos el percentil 45 (4550/100 = 22.5) Corresponde al intervalo 3.

III. ESTADGRAFOS DE DISPERSIN


Las medidas de posicin por s solas, no son suficientes para describir o comparar distribuciones,
ya que ellas no consideran la variabilidad ( o dispersin) de los valores observados.
La idea de dispersin se relaciona con la mayor o menor concentracin de los datos en torno al
promedio y por lo tanto la mayor o menor representatividad de este.
Los datos tienen mayor dispersin cuando estn ms alejados del promedio y tienen menor
dispersin si el conjunto de datos est mas cerca del promedio.
Las medidas de dispersin son los valores tpicos de cada conjunto de datos que expresan la
forma en que ellos se alejan con respecto a cierto valor.
a) Rango o Intervalo : Se define como la diferencia entre le valor mximo y el valor
mnimo observado en la muestra.

16
Si los datos estn agrupados en intervalos, se hace la diferencia entre el lmite inferior
del primer intervalo y el lmite superior del ltimo intervalo.
Esta medida no es muy til, ya que depende de los valores extremos y por error puede
aparecer un valor muy grande o muy pequeo.
b) Desviacin estndar y Varianza:

i)

La desviacin estndar toma en cuenta todos los valores de la muestra y


corresponde a una medida de la variacin de los alrededor de la media y se
calcula con la siguiente frmula:

x i x

ii)

desviacin estndar al cuadrado ,es decir:


v(x)= s2 =

La varianza corresponde a la

La varianza para datos agrupados se determina con la siguiente frmula :


v(x)= s
Observacin:

x i x 2 f i

Una forma abreviada de calcular la varianza y la desviacin estndar:

V(x) = x 2
c)

x 2

s=

Coeficiente de Variacin: Es una medida de variabilidad que no depende de la unidad


de medida. Se expresa, generalmente en porcentaje.
CV(x) =

sx
x

100%

donde: s

es la desviacin estndar de la variable x

APLICACIONES
1) Los sueldos promedios expresados en pesos en las secciones de una empresa son,
respectivamente: A : $ 150.900, B :$ 273.500 y C : $ 361.000. Si el nmero de empleados en
cada seccin es: 160, 91 y 30 respectivamente.
a) Determine el sueldo promedio de los empleados de la empresa.
b) Determine el sueldo promedio de los empleados, si en la seccin B hay un
reajuste del 4,5%.
2)

A cada persona que se presenta como candidato para un trabajo de ensamble es una
empresa de muebles, se le aplica una prueba de aptitudes mecnicas. Una parte de la prueba
consiste en ensamblar un armario con base e instrucciones numeradas. En la siguiente
distribucin de frecuencias se tiene una muestra de los tiempos que necesitaron 42 personas
para ensamblar el armario.
Tiempo
( mn)
14
47
7 10

4
8
14

17
10 13
13 16
16 - 19
a)
b)
c)
d)
e)
f)
g)

9
5
2

Cul es la amplitud total?


:
Cul es el tiempo medio de la 5ta clase?
Cuntas personas ensamblaron el armario en menos de 10 minutos?
Qu porcentaje de las personas a lo ms tard 16 minutos en ensamblar el armario?
Cul es el tiempo promedio de ensamble del armario?
Cuntas personas tardaron, en promedio, 5 minutos y medio?
Interprete f 2, , F 4 , H 3

3) El ministerio de agricultura en su informe anual, public el siguiente histograma. El texto


deca que corresponda a los ingresos netos ( millones de pesos) en 1992 de una muestra de
parcela subvencionadas en parte por el estado.
N de parcelas
16
14
12
10
8
6
4
2

----------------------------------9
-- 7
---------------------------------------------------------------------------------------------0
a)
b)
c)
d)
e)
f)

4)

10

15

20

25

30

35

Ingresos

Calcule el nmero de parcelas consideradas en el estudio


Genere la tabla de frecuencias
Halle el ingreso promedio de las parcelas.
En qu clase se encuentra la mayor cantidad de observaciones.
Determine el 50% de la muestra.
Determine la varianza, desviacin estndar y el coeficiente de variacin.

Los siguientes datos corresponden a los ingresos percibidos por los trabajadores
departamento de ventas de una empresa: ( en miles de pesos)
SUELDOS

NMERO DE
EMPLEADOS

240 290

290 340

340 390

12

390 440

25

440 490

490 540

Marca
de
Clase

del

18

a) Complete la tabla para los ingresos percibidos


b) Calcular :
- El ingreso promedio mensual
- La mediana
- La desviacin estndar
- El coeficiente de variacin
5) Las distribuciones de ingresos de dos pases son las siguientes.
PAS
Ingresos anuales
80
100
120
140
160
180
a)
b)
c)
d)

- 100
- 120
- 140
- 160
- 180
- 200

PAS
B
Ingresos Anuales

Poblacin
remunerada
30000
80000
40000
10000
4000
1000

60 - 90
90 - 120
120 - 150
150 - 180
180 - 210
210 - 240
240 - 270

Poblacin
remunerada
10000
20000
50000
20000
15000
10000
4000

Encontrar los ingresos anuales correspondiente para ambos pases.


Calcular la desviacin estndar para los ingresos del pas B.
Compare la desviacin para los ingresos de ambos pases.
Calcular el coeficiente de variacin para el pas B.

6) Los siguientes datos corresponden a los tiempos (en minutos) que demoran los clientes en una
cafetera.
tiempo

N de clientes

20-40

10

40-60

15

60-80

25

80-100

100-120

120-140

a) Cul es el tiempo ms frecuente de permanencia de los clientes en la cafetera?


Mod =70
b) Cul es el tiempo promedio de permanencia en la cafetera.
c) En cuntos minutos se encuentra el 50% del tiempo de estada?
e) Obtener el histograma para el tiempo de permanencia.
7) La siguiente Tabla de Distribucin corresponde a las ventas diarias (en miles de pesos) de un
Centro Comercial en Santiago.
Xi

ni

19
100-150

10

150-200

25

200-250

30

250-300

300-350

a) Calcular la desviacin tpica para las ventas.


b) Encontrar el coeficiente de variacin.
c) Representar las ventas diarias en una ojiva.
8) En la oficina de un diario , el tiempo que se tardan en imprimir la primera plana fue
registrado durante 50 das. A continuacin se transcriben los datos , aproximados en dcimas de
minuto.
Minutos
fi
19,0 19,7
4
19,8 20,5
4
20,6 21,3 10
21,4 22,1
5
22,2 22,9
7
23,0 23,7
5
23,8 24,5 11
24,6 25,3 4
a)
Calcular para los datos las medidas de tendencia central.
b)
Representar grficamente la informacin.
c)
Calcular la varianza para el tiempo de impresin.
9)

Antes de construir una presa sobre el ro Colorado, el Army Corps of Engineers efectu una
serie de pruebas para medir el flujo de agua ms all del sitio propuesto por la obra. Los
resultados de las pruebas son:

Flujo del ro (miles galones por


mn)
1,001 1,050
1,051 1,100
1,101 1,150
1,151 1,200
1,201 1,250
1,251- 1,300
1,301 1,350
1,351 1,400

Frecuencia
7
21
32
49
58
41
27
11

a) Con los datos calcular donde se encuentra el 50% de ellos.


b) Cunto flujo se obtuvo en la mayor cantidad de muestras.
10)
El Ministerio de Economa en relacin a un estudio , public el siguiente histograma. El
texto deca que corresponda a los ingresos netos mensuales (en millones de pesos) en 2001 de
un grupo de microempresarios .
20

20

16
14
12
10
8
6
4
2

-9
-

11
6

a)
b)
c)
d)
e)

15
12

10

15

20 25

4
30

35

40

Calcular el nmero de microempresarios considerados en el estudio.


Hallar el ingreso promedio de los empresarios.
Encontrar el valor de la desviacin mxima.
Calcular la dispersin para los ingresos netos.
Calcular el coeficiente de variacin.

11)
Los siguientes datos corresponden a los ingresos percibidos por los trabajadores del
departamento de ventas de una empresa ( en miles de pesos )
SUELDOS
240
290
340
390
440
490

a)
b)
c)
d)

290
340
390
440
490
540

NUMERO DE
EMPLEADOS
2
4
12
25
3
2

Calcular el ingreso promedio mensual del departamento de ventas. Realice la mejor grfica.
Calcular la varianza.
Calcular el coeficiente de variacin.
Encontrar las medidas de tendencia central para los sueldos.

12) La siguiente distribucin corresponde a los pesos de 80 variedades de esprragos , para


exportacin medidos en grms.
PESOS
10 - 13
13 - 16
16 - 19
19 - 22
22 - 25

a)
b)

fi
10
20
30
15
5

Calcular los estadgrafos de posicin , para la distribucin de esprragos.


Indicar el tipo de simetra que presentan los esprragos.

13) Dado el conjunto de los siguientes valores en (US$) ganados por un grupo de amigos en un
cierto juego: yi = ( 2 , 6 , 4 , 2 , 5 , 3 , 2 , 0 ,1 , 3 )
Calcular el valor de los estadgrafos de posicin.
14) Sean las siguientes tasas de inters correspondientes a prstamos hipotecarios otorgados por
una cierta entidad financiera de Santiago.
8,5

7,5

8,25

8,2

7,5

9 8,5

7,75

a) Calcular los estadgrafos de posicin.

8,5

8,5

9,06

7,6

8,1

9,2

7,09

21
b) Calcular la desviacin estndar y el coeficiente de variacin para la muestra.

You might also like