Professional Documents
Culture Documents
VALDIVIA
ESTADISTICA DESCRIPTIVA
Antecedentes:
El desarrollo de la recopilacin de datos y su uso en Estadstica, se remonta a
los primeros aos de la historia.
En el ao 3.050 A.C. se realiz en Egipto, un registro de las riquezas de la
poblacin, para hacer un nuevo reparto de ellas Sin embargo, el desarrollo pleno
de la Estadstica se inicia slo a fines del siglo XVII y principios del XVIII, cuando
matemticos como Bermoulli, Francis Maseres, Lagrange y Laplace desarrollaron
la Teora de la Probabilidad.
En estrecha relacin con la Fsica, la Qumica y la Biologa, la Estadstica
ha servido de base para el estudio de determinados fenmenos. Tambin la
Psicologa, la Pedagoga, la Sociologa y la Economa ,aplican estos mtodos a
los fenmenos sociales.
Esta disciplina es de estudio obligado en la educacin superior, debido a la
gran informacin relacionada con el hombre y la empresa. Su utilidad radica en la
necesidad del hombre ,en la toma de decisiones en el actuar cotidiano.
Sabas que:
El nmero 100 se puede escribir
como:
Una sucesin de los nueve primeros
nmeros naturales
123 - 45 - 67 + 89
o con cinco cifras iguales
empleando el 1;
111-11
empleando el 3
33 3 3
Estadstica Descriptiva
VALDIVIA
ESTADSTICA
SNTESIS TERICA
1.- Estadstica:
Es un conjunto de conceptos y mtodos empleados, para recolectar e
interpretar datos referentes, a un rea de investigacin particular y para extraer
conclusiones,.en situaciones en que la variabilidad est presente.
1.A- Estadstica Descriptiva o Deductiva:
Comprende una descripcin, esto es, resumir en forma adecuada un gran
conjunto de datos, As tenemos entonces, que esta parte corresponde a la
organizacin, recopilacin, tabulacin, representacin de los datos de inters; ya
sea mediante grficos o tablas, adems involucra la obtencin de la informacin
deseada. A estas medidas que resumen al gran conjunto de datos, recibe el
nombre de Estadsticas o Estadgrafos.
1.B.- Estadstica Inferencial o Inductiva:
Desarrolla las tcnicas para calcular valores llamados parmetros, que se
relacionan con una cierta poblacin, en base a datos, que entrega la estadstica
Descriptiva. Permite obtener informacin y sacar conclusiones relativas a una
poblacin, a partir de una muestra dada.
2.- Poblacin:
Poblacin Estadstica es el conjunto completo, de posibles mediciones o
registros de algn rasgo cualitativo, correspondiente a la coleccin completa de
unidades, para las que se harn inferencias. La poblacin representa el objetivo
de una investigacin y por ende, el objetivo de recolectar datos para obtener o
extraer conclusiones referentes a ella.
3.- Muestra:
La muestra de una poblacin, es el conjunto de mediciones que realmente
se obtienen en el curso de la recoleccin; por lo tanto, corresponde a un
subconjunto de la poblacin.
Estadstica Descriptiva
VALDIVIA
4.- Variable:
Es cualquier caracterstica que difiere de un miembro a otro, dentro de una
poblacin estadstica. Puede tomar un valor cualquiera, obtenido de un conjunto
que constituye el dominio de la variable. Se representa por x,y,etc.
Existen variables continuas y discretas:
-
Variable discreta: es aquella que puede tomar, slo valores enteros. Ej.;
nmero de componentes de un curso.
5.- Datos:
Es el conjunto de valores asociados o asignados a una variable.
Ejemplo:
Poblacin: padres de los alumnos.de un colegio determinado
Muestra: padres de los alumnos de octavo ao.
Variable: peso de los padres de los alumnos, de los octavos aos.
Datos: 60 kg.;80 kg.; 65 kg.;78 kg.; etc.
6. La palabra aleatoria viene del latn aleatorius,, propio del juego de dados y por
ende, relativo al juego de azar
7. La palabra azar proviene del rabe az-zahr, que significa casualidad.
8. Cuando se habla de intervalo es equivalente a clase.
Estadstica Descriptiva
VALDIVIA
DISTRIBUCIONES DE FRECUENCIAS
En la ordenacin de datos muy numerosos, es usual presentarlos
agrupados y ordenados en clases o categoras y determinar, el nmero de
individuos que pertenece a cada clase, llamado frecuencia de clase.
Una disposicin tabular o tabla de datos junto con las correspondientes
frecuencias de clase, se llama distribucin de frecuencias (o tabla de
frecuencias).
Para confeccionar estas tablas de frecuencias, debemos considerar los
siguientes casos:
Caso 1:
Si la variable que estamos midiendo es un tipo discreto (asumen valores de
un conjunto finito), entonces podemos realizar la distribucin en dos columnas. En
la primera se anotan los valores de la variable y en la segunda, el nmero de
veces que se repite cada una.
Caso 2:
Si la variable que estamos midiendo es de tipo continuo (pueden tomar
cualquier intervalo determinado por los nmeros reales), no tiene sentido el
tabularla para cada una de las observaciones, dado que es muy improbable que la
variable bajo estudio, tome el mismo valor durante el experimento. Dicho de otro
modo, cuando en una distribucin de frecuencias haya muchos valores distintos
de la variable, conviene agruparlos en intervalos o clases.
Estadstica Descriptiva
VALDIVIA
Ejemplo: CASO 1
Los siguientes datos corresponden a los pesos de un grupo de 33 personas:
45 36 72 54 45 72 48 62 38 43 48
64 43 36 54 72 64 60 70 38 64 60
70 48 72 62 72 48 54 64 70 43 60
Tabla se frecuencias:
Peso
36
38
43
45
48
54
60
62
64
70
72
N de personas
2
2
3
2
4
3
3
2
4
3
5
Ejemplo: Caso 2.
Despus de medir las alturas de 30 alumnos de un curso, resultaron los
siguientes valores de la variable:
154
152
163
158
178
155
155
163
150
161
157
166
166
165
161
167
182
160
162
156
175
159
155
164
163
160
167
170
175
168
164
176
150
162
165
172
162
162
158
160
R = 182-150= 32
Si elige intervalos de cuatro cm. de estaturas, entonces
32:4 = 8 intervalos
Tabla de frecuencias:
Intervalo
150.154
154.158
158.162
162.166
166.170
170.174
174.178
178.182
N de personas
3
6
8
11
5
2
3
2
Estadstica Descriptiva
VALDIVIA
Estadstica Descriptiva
VALDIVIA
b) FRONTERAS DE CLASE:
Si se dan alturas con precisin de 1 cm., el intervalo de clase 150-154,
incluye tericamente todas las medidas desde 149,5 a 154,5. Estos nmeros
se llaman fronteras de clase o lmites reales de clase. En la prctica, las
fronteras de clase, se obtienen promediando el lmite superior de una clase,
con el inferior de la siguiente.
c) AMPLITUD O TAMAO DE UN INTERVALO DE CLASE:
Es la diferencia entre las fronteras de clases superior e inferior.
d) MARCA DE CLASE:
Es el punto medio del intervalo de clase y se obtiene promediando los
lmites inferior y superior de clase.
Ejemplo: La tabla de las alturas, luego de todas estas definiciones es:
Intervalo
clase
150-154
154-158
158-162
162-166
166-170
170-174
174-178
178-182
de Marca de clase
ni
152
156
160
164
168
172
176
180
3
6
8
11
5
2
3
2
N1
3
9
17
28
33
35
38
40
f i 100
7,5%
15 %
20 %
27,5%
12,5%
5%
7,5%
5%
Estadstica Descriptiva
VALDIVIA
12
10
8
6
4
2
0
148 152 156 160 164 168 172 176 180 184
Estadstica Descriptiva
VALDIVIA
40
36
32
28
24
20
16
12
8
4
0
148
152
156
160
164
168
172
176
180
ESTADSTICOS O ESTADGRAFOS
Estadstica Descriptiva
VALDIVIA
El smbolo
x
i 1
i=1 a
x
i 1
x1 x 2 ... x N
a)
ax
i 1
a xi
i 1
b)
a a a a a... na
donde a es constante.
i 1
10
Estadstica Descriptiva
VALDIVIA
Notacin:
X: variable de estudio
X i : i-simo valor de la variable
N: cantidad de datos de una poblacin finita.
N: muestra desde una poblacin finita, por lo tanto n N
I.- MEDIDAS DE TENDENCIA CENTRAL
xi
x1 x 2 ... x N
i 1
x
N
N
Si los datos provienen de una tabla de frecuencia, la media se calcula de la
siguiente forma. Sean x1 , x 2 ,... x k las marcas de clase de cada uno de los k
intervalos, cada uno con una frecuencia absoluta de n i , luego x es:
k
x
i 1
ni x i
N
Intervalo
1
2
3
...
k
xi
ni
x1
x2
n1
n2
x3
n3
...
...
xk
nk
N
Ejemplos:
1) La media aritmtica de los nmeros
x
8, 3, 5, 12 y 10 es:
8 3 5 12 10 38
7,6
5
5
11
Estadstica Descriptiva
VALDIVIA
2)
x
i 1
x i n i 38
N
8
Intervalo
1
2
3
4
5
xi
ni
xi ni
2
4
6
8
10
3
2
1
1
1
8
6
8
6
8
10
38
w1 x1 w2 x 2 ... wk x k
xp
i 1k
w1 w2 ... wk
wi x i
w
i 1
1 70 1 90 3 85 415
83
11 3
3
4) MEDIANA:
Mediana de un conjunto de nmeros ordenados en magnitud es, o el
valor central o la media de los dos valores centrales.
Ejemplo:
Profesor: Erwin Belmar T.
Estadstico.
12
Estadstica Descriptiva
VALDIVIA
1
(9 11) 10
2
Para datos agrupados, la mediana obtenida por interpolacin viene dada por
Me L1
donde:
n
( f )1
2
fme
N=
mediana.
fme= frecuencia de la clase de la mediana
C = amplitud del intervalo de clase de la mediana
5) MODA:
La moda de un conjunto de nmeros, es el valor que ocurre con
mayor frecuencia; es decir, el valor ms frecuente. La moda puede no existir,
incluso no ser nica, en caso de existir.
En el caso de datos agrupados. donde se haya construdo una curva
de frecuencias para ajustar los datos, la moda ser el valor (o valores) de X
correspondiente al mximo (o mximos) de la curva.
La moda puede deducirse de una distribucin de frecuencias. o de un
histograma a partir de la frmula
Mo Li C
1 2
donde
Li frontera inferior de la clase modal
1 exceso de la frecuencia modal sobre la clase inferior inmediata
2 exceso de la frecuencia modal sobre la clase superior inmediata
C = amplitud del intervalo de clase modal
6) MEDIA GEOMTRICA:
La media geomtrica de un grupo de n observaciones x1 , x 2 ,..., x n
se define como la raz ensima, del producto de las observaciones:
G n x1 x 2 ... x n
13
Estadstica Descriptiva
VALDIVIA
G n x1 1 x 2 2 .... x k
nk
ni ,
1
N
1
1
n i 1 x i
3
3
3,43
1 1 1 7
2 4 8 8
14
Estadstica Descriptiva
VALDIVIA
Q i Li C 4
ni
donde:
Li frontera inferior que contiene la fraccin deseada
C= amplitud de intervalo, que contiene la fraccin deseada
iN
fraccin deseada
4
deseada
DECILES:
Son aquellas medidas de orden que dividen a la muestra en 10
partes de igual tamao, sern denotadas por la letra Di , i 1,9 . Su frmula para
datos tabulados es :
iN
N ( i 1)
Di Li C 10
ni
PERCENTILES:
Son aquellas medidas de orden que dividen a la muestra ordenada
en 100 partes, dejando en cada una de ellas igual nmero de elementos, ser
denotada por Pi , i 1,99 . Su frmula para datos tabulados es:
Ni
N ( i 1)
100
Pi Li C
ni
15
Estadstica Descriptiva
VALDIVIA
DESVIACIN MEDIA:
La desviacin media de un conjunto de N nmeros x1 , x 2 ,..., x n es denotada por
MD y se define como:
N
MD
i 1
N
donde:
x es la media aritmtica de los nmeros
x i x = es el valor absoluto de la desviacin de x i respecto de x
DESVIACION ESTANDAR:
La desviacin estandar de un conjunto de N nmeros x i , x 2 ,..., x n se
denota por S y se define:
N
(x
i 1
x) 2
S
donde:
n (x
i 1
x) 2
VARIANZA:
La varianza de un conjunto de dato,s se define como el cuadrado de
la desviacin estndar.
Var S 2
COEFICIENTE DE VARIACION:
16
Estadstica Descriptiva
VALDIVIA
S
x
EJERCICIOS PROPUESTOS
1) Si las marcas de clase de una distribucin de frecuencias de pesos, de
estudiantes son 128, 137, 146, 155,164,173 y 182 libras, hallar:
a) Amplitud del intervalo de clase.
b) Fronteras de clase
c) Lmites de clase
Suponga que los pesos se midieron con una libra de precisin.
17
Estadstica Descriptiva
VALDIVIA
n de empleados
250.0.259.990
260.0.269.990
270.0.279.990
280.0.289.990
290.0.299.990
300.0.309.990
310.0.319.990
total
8
10
16
14
10
5
2
65
18
Estadstica Descriptiva
VALDIVIA
a)
b)
c)
d)
e)
19
Estadstica Descriptiva
VALDIVIA
20
Estadstica Descriptiva
VALDIVIA
(distribucin simtrica)
e) 25,63
16) Una casa comercial hace un estudio con respecto a los precios de cierto
artculo especfico, resultando un precio promedio de $1500 con una varianza
de $120. Posteriormente, se verific que el mal uso de un factor permiti un
error de $50 sobre el valor promedio. Determine los nuevos valores de los
estadgrafos mencionados, despus de la correccin.
Rp.: x 70 ; V ( x ) 120
17) Para estudiar el consumo de cierto producto por una poblacin, se dividi la
muestra en dos estratos A y B, cuyos datos se indican en las tablas siguientes:
Estrato A
X - X'
50-100
100-150
150-200
200-250
250-300
n
10
15
18
20
10
Estrato B
X -X'
100-150
150-200
200-250
250-300
n
5
15
20
15
Calcule
a) Media de cada estrato
Profesor: Erwin Belmar T.
Estadstico.
21
Estadstica Descriptiva
VALDIVIA
d) 3524,89
50- 110
-
yj
Ni
Hi
Ni
Hi
5
0,275
8
0,825
22
Estadstica Descriptiva
VALDIVIA
hi
5
6
7
0,65
0,25
0,10
n 150
n 3 24
H 4 0,62
n1 y1 US $48.000
h7 0,08
n int ervalos 7
n1 8
y 3 n 3 1260
y1 10
n 2 n 5 62
H 6 0,96
yi
ni
hi
Ni
Hi
5-15
15-25
25-35
35-45
45-55
55-65
10
20
30
40
50
60
8
20
42
60
42
20
0,04
0,10
0,21
0,30
0,21
0,10
8
28
70
130
172
192
0,04
0,14
0,35
0,65
0,86
0,96
23
Estadstica Descriptiva
VALDIVIA
65-75
c) Me(y)=40
70
8
Mo(y)=40
0,04
200
promedio=40
1,00
a)
b)
c)
d)
e)
y 5 90
n 3 20
n2 n5 2
N1 8
b) n 4 4
N 3 12
c ) n 20
N m 22
d ) h1 0,20
n 40
N 4 16
n1 12
e ) H 1 h 2 h3 h4 1
n5 3
N5 1
f ) h1 H 2 H 3 2,8
g ) H 4 0,75
H 5 0,66
H 6 0,81
j ) H 4 0,30
n 10
n 3 31
k ) h1 0,04
h3 0,12
H 4 0,15
H 7 0,93
h) n6 : n3 2
i) H 6 N 6
l ) xi 0
25) Los sueldos que paga una empresa a sus empleados, en miles de US$
anuales, estn dados por;
x 'j 1 x 'j
ni
14.000-15.000
15.000-16.000
16.000-17.000
17.000-18.000
18.000-19.000
19.000-20.000
20.000-21.000
21.000-22.000
5
7
8
6
5
4
3
2
24
Estadstica Descriptiva
VALDIVIA
20,0
12,2
24,0
20,0
10,0
16,0
18,0
11,2
25
Estadstica Descriptiva
VALDIVIA
1838,96
100 21,48%
8560
26