You are on page 1of 73

ELEMENTOS DE

ESTADSTICA
DESCRIPTIVA
Profr.: Jhon Jairo Pestaa Robledo
Introduccin

La Estadstica es una ciencia que


facilita la solucin de problemas
en los cuales necesitamos
conocer caractersticas sobre el
comportamiento de algn
suceso o evento.

Nos permite inferir el


comportamiento de sucesos
iguales o similares sin
necesidad de que estos
Esto nos da la posibilidad de
tomar decisiones acertadas
y a tiempo, as como
realizar proyecciones del
comportamiento del suceso.
Slo se realizan los clculos
y el anlisis con los datos
obtenidos de una muestra
de la poblacin y no con
toda la poblacin.
Actualmente el DANE es el encargado de
concentrar y publicar la informacin
estadstica del estado y del pas.
Conceptos bsicos
Estadstica:
Es la ciencia que se encarga de recolectar,
organizar, resumir y analizar datos para
despus obtener conclusiones. Se divide en
Estadstica Descriptiva y Estadstica
Inferencial.
Estadstica
descriptiva:
Se encarga de la
recoleccin,
organizacin,
presentacin y anlisis
Estadstica inferencial:
Se encarga de analizar la
informacin presentada por la
estadstica descriptiva mediante
tcnicas que nos ayuden a conocer,
con determinado grado de
confianza, a la poblacin. Lo que
nos permite tomar decisiones.
Poblacin:
Conjunto definido de TODOS los INDIVIDUOS,
de donde se observa cierta caracterstica.

Al nmero de integrantes de la poblacin


se llama tamao de la poblacin y se
representa con la letra N.

Las poblaciones pueden ser finitas o


infinitas.
Poblacin Estadstica:
Conjunto de TODOS los DATOS que se
obtienen al realizar la medicin de una
variable en los elementos de una poblacin.
Muestra:
Subconjunto de una poblacin, que
intenta reflejar las caractersticas de la
poblacin lo mejor posible.
El nmero de individuos que integran la
muestra, llamado tamao de la
muestra se representa con la letra n.
Individuo:
Es el elemento de la poblacin o de la muestra
que aporta informacin sobre lo que se estudia.

Variable:
Caracterstica o propiedad de los
individuos que se desea estudiar y se
puede medir o calificar; cambia o vara
con el tiempo en un individuo dado, o
cambia o vara de elemento a elemento.
Ej. Edad, peso, sexo, estado civil, nmero
Dato:
Valor que se obtiene al realizar la medicin de la
caracterstica de la variable en estudio.
Pueden ser univariados, bivariados o
multivariados.

La naturaleza de los datos pueden ser


datos cuantitativos o datos
cualitativos.
Datos Cuantitativos
(nmeros):
Valores obtenidos al medir
peso, estatura, temperatura,
nmero de hijos.

Datos Cualitativos
(categoras):
Se obtienen al calificar la
caracterstica en cuestin
como el sexo, estado
civil, grado mximo de
Variable Dicotmica:
Slo puede tomar dos valores (s no, 0 1,
hombre mujer, bueno malo, encendido
apagado).

En la variable CUANTITATIVA se pueden


distinguir dos tipos: continua y
discreta.
Variable Continua:
Si la variable puede tomar cualquier
nmero real entre dos valores dados
(decimal o entero).
Ej. El peso de un individuo.

Variable Discreta:
Si la variable slo puede
tomar nmeros enteros.
Ej. El nmero de hijos de un
individuo.
Escalas de Medicin
Escala Nominal

Escala
Ordinal
Escala de
Intervalo
Escala de
Razn
Escala Nominal:
Est asociada a variables cualitativitas y es
denominada de este modo si no se pueden
hacer operaciones aritmticas entre sus valores,
pues stos son nicamente ETIQUETAS.

Ejemplo: sexo, cdigo postal, estado civil,


nmero telefnico, nmero al correr en un
maratn, deporte favorito, carrera a estudiar,
etc.
Escala Ordinal:
Los valores de la variable que tienen un
ORDEN con un nivel especfico, pero no se
pueden hacer operaciones aritmticas entre
ellas.

Ejemplo:
Psimo Malo Regular Bueno Excelente
Primaria Secundaria Preparatoria -
Licenciatura
Escala de Intervalo:
En ella existe un orden entre los valores de la
variable y adems una NOCIN DE DISTANCIA
aunque no se puedan realizar operaciones.
El cero o punto de inicio no es nico, es ms
bien un punto de referencia.

Ejemplo: Escalas de temperatura, la edad de


la Tierra, la lnea del tiempo de la humanidad.
Escala de Razn:
La magnitud tiene SENTIDO FSICO,
existe el cero absoluto, existe orden, se
puede determinar cuntas veces es
mayor uno que otro.

Ejemplo: peso, estatura, edad, distancia,


dinero, etc.
Fuentes de informacin

Encuesta:
Recopilar los datos mediante el
uso de cuestionarios o entrevistas.

Experimento:
Procedimiento utilizado en la
investigacin cientfica para
obtener informacin que
permita conocer el
comportamiento de algn
Fuentes de Informacin

Investigacin
Documental:
Procedimiento para
obtener
datos mediante la consulta
de informacin ya escrita y
concentrada en
documentos
que se localicen en libros o
revistas en bibliotecas,
Redondeo de datos,
notacin cientfica y cifras
significativas.
Redondeo:
El redondeo de datos es un
procedimiento que consiste en
escribir un nmero que
representa a una cantidad con
menos cifras de las que tiene
realmente para tener una idea
rpida de la cantidad.
Notacin Cientfica
Es una manera de escribir en forma breve
cifras muy grandes o pequeas. La forma
generaln es
a x 10 , en donde a es un nmero entre 1
y 9, n es un nmero entero.

Ejemplo: 4
El nmero 25 000 se escribe 2.5 x 10- 4, o el
nmero 0.00025 se escribe como 2.5 x 10 .
Cifras Significativas
A los dgitos exactos que se utilizan para escribir
una cifra, a parte de los ceros para localizar el
punto decimal, se les llama cifras significativas.

Ejemplos:
3.22 tiene 3 cifras significativas.

0.0032 = 3.2 x 10 tiene 2 cifras significativas.


-
3 tiene 3 cifras significativas.
0.00320 = 3.20 x 10
-
3
La cifra 3.22 se encuentra realmente
entre 3.215 y 3.225.

La cifra 0.0032 es un valor que se


encuentra entre 0.00315 y 0.00325.

La cifra 0.00320 se encuentra entre las


cifras 0.003195 y 0.003205
Orden de datos
La ordenacin es el proceso mediante el
cual los datos estn acomodados de tal
manera que se establece un orden
(ascendente o descendente) entre ellos.

Hay dos mtodos comunes:


Listado en orden
ascendente
Mtodo de tallo y hojas
Ejemplo
Considera que la variable de estudio es
el peso de 25 estudiantes. Los pesos se
encuentran en la siguiente tabla:
Peso de 25 estudiantes
(en kg)
40 43 48 51 49
56 44 42 55 52
52 62 44 50 59
63 50 56 55 45
57 66 63 51 58
Listado en orden
ascendente
El proceso consiste en ordenarlos de
menor a mayor
Peso de 25 estudiantes Peso de 25 estudiantes
(en kg) (en kg)
42 40 48 51 49 40 42 43 44 44
56 44 43 55 52
45 48 49 50 50
52 62 44 50 59
51 51 52 52 55
63 50 56 55 45
55 56 56 57 58
57 66 63 51 58
59 62 63 63 66
Mtodo de tallo y hojas

Si los nmeros de los datos estn


formados por dos dgitos, se hace una
columna con el primer dgito (decenas) y a
la derecha de cada uno de ellos se escribe,
en fila, slo el segundo dgito (unidades)
de cada uno de los datos que tengan el
mismo primer dgito.
Datos sin ordenar: Peso de 25 estudiantes
(en kg)
4 2,0,8,9,4,3,4,5 42 40 48 51 49
5 1,6,5,2,2,0,9,0,6,5,7,1 56 44 43 55 52
6 ,8 52 62 44 50 59
2,3,6,3
63 50 56 55 45
57 66 63 51 58
Datos ordenados:
4 0,2,3,4,4,5,8,9
5 0,0,1,1,2,2,5,5,6,6,7,8
6 2,3,3,6
,9
Doble tallo
Una variante de este mtodo es en lugar de
dividir en un grupo las decenas, se divide en
dos grupos. El primero abarcando los dgitos
del 0 al 4 y el segundo del 5 al 9.

El ejemplo anterior 4 0,2,3,4,4


queda: 4 5,8,9
5 0,0,1,1,2,2,
5 5,5,6,6,7,8,9
6 2,3,3
6 6
Caso de variables
cualitatitivas
El procedimiento es:

Se identifican todos los valores


diferentes y se acomodan en columna.

Se agrega una segunda columna en


donde se van registrando, mediante una
lnea vertical, la veces que aparece el
valor dado.
Ejemplo
Considera que la variable de estudio es
el color de playera de 25 estudiantes.
Los colores se encuentran en la
siguiente tabla:
rosa azul blanco azul rosa
gris blanco caf negro blanco
rosa azul caf blanco blanco
gris azul blanco rosa gris
gris blanco caf negro verde
Color Frecuen
rosa azul blanc azul rosa cia
IIII
o Azul
IIII I
gris blanc caf negro blanc Blanco II I I
o o Caf
rosa azul caf blanc blanc IIII
Gris
o o II
Negro
gris azul blanc rosa gris IIII
Rosa
o I
Verde
gris blanc caf negro verde
o
Tabla de Frecuencia de
Datos
Una vez que se tenga ordenados los
datos, se acomodan en la Tabla de
distribucin de frecuencias o tabla de
frecuencias.

La tabla es bsicamente una tabla de


valores x-y, dnde x representa el dato
y y representa la frecuencia.
La frecuencia es el nmero de veces que
aparece cada dato.

Hay dos clases de tablas de frecuencias:


Para datos NO agrupados.
Para datos agrupados.
Tabla de frecuencias para
datos NO agrupados

Est formada por dos columnas: una


para la variable xi y la otra para su
frecuencia f, a esta frecuencia se le
llama frecuencia absoluta o frecuencia
observada.
Ejemplo
Tabla de frecuencias de los pesos en kg
de 25 alumnos.
xi f xi f
Peso de 25 estudiantes
40 1 52 2
(en kg)
42 1 55 2
40 42 43 44 44 43 56
1 2
45 48 49 50 50 44 2 57 1
51 51 52 52 55 45 1 58 1
55 56 56 57 58 48 1 59 1
59 62 63 63 66 49 62
1 1
50 2 63 2
51 2 66 1
Tota 25
l
Frecuencia relativa y
acumulada
Por lo regular, se agregan dos columnas:
la de la frecuencia relativa fr y la de la
frecuencia acumulada fa.
La frecuencia relativa se obtiene
mediante el cociente de la frecuencia y el
nmero total de datos, esto es fr = f/n.
La frecuencia acumulada se obtiene
sumando las frecuencias anteriores a las
frecuencias de un dato dado.
Ejemplo
1/25
xi f fr fa xi f fr fa
40 1 0.0 1 52 2 0.0 14
42 1 4 2 55 2 8
0.0 0.0 16
43 1 4 3 2/25 56 2 8.0
0 18
0.0
44 2 4
0.0 5 57 1 8
0.0 19
45 1 8 58 1 4
0.0 20
0.0 6
48 1 4 7 59 1 4
0.0 0.0 21 Siempre
49 1 4
0.0 8 62 1 4
0.0 22 es el
50 2 4 10 63 2 4 nmero
0.0 0.0 24
total
51 2 8
0.0 12 66 1 8
0.0 25
8 4
Tot 25 1
al
Siempre es 1
Intervalo de clase
En ocasiones es conveniente acomodar los datos en
pequeos grupos de igual tamao, llamados intervalos de
clase.
El punto medio o marca de clase xi, se obtiene con:

El tamao del intervalo se obtiene mediante la


diferencia de los lmites superior e inferior.
Marca de Lmite inferior + lmite
superior 2
clase =
Ejemplo
Lmite inferior Lmite superior Lm inf + Lim sup
2
Intervalo de clase Punto medio xi
38 42 40
43 47 45
48 52 50
53 57 55
58 62 60
63 67 65
Lmite verdadero del
intervalo
Frontera de clase o lmite verdadero del
intervalo: de clase Punto medio xi
Intervalo
37.5 42.5 40
40 2.5 42.5 47.5 40 + 2.5 45
47.5 52.5 50
52.5 57.5 55
57.5 62.5 60
62.5 67.5 65
Tabla de intervalos con
lmites verdaderos
Usando smbolos Usando
Est incluido No est incluido
Est incluido No est incluido
de desigualdad parntesis y
Intervalo Punto corchetesPunto
Intervalo
de clase medio de clase medio
xi xi
37.5 x < 40 [37.5 , 42.5) 40
42.5 [42.5 , 47.5) 45
42.5 x < 45 [47.5 , 52.5) 50
47.5
[52.5 , 57.5) 55
47.5 x < 50
[57.5 , 62.5) 60
52.5
[62.5 , 67.5) 65
52.5 x < 55
El tamao del intervalo es
Si por alguna razn no es fcil decidir el
ancho del intervalo y el nmero de ellos,
se pueden utilizar las siguientes frmulas:
K = 1 + 3.3 log (n)
Donde K = nmero aproximado de

clases
Amplitudn de
= los
nmero de datos.
intervalos = Rango / K
Donde Rango = diferencia entre el

dato mayor y
el dato menor.
Ejemplo
Para el ejemplo de los datos de los pesos
de 25 alumnos, el valor de K:
K = 1 + 3.3 log (n) = 1 + 3.3 log (25) =
5.6.
Por lo tanto se requieren
aproximadamente
Y la amplitud de los6 intervalos
intervalos.sera:
Amplitud = Rango / K = (66 40) / 5.6 =
4.64.
Aproximadamente 5 unidades es la
amplitud de los intervalos.
Tabla de distribucin de
frecuencias para datos
agrupados
Se elabora con los intervalos de clase, sus
puntos medios y las frecuencias
correspondientes para cada uno de los
intervalos.
xi f 52 2 Datos
40 1 55 2 agrupados
Intervalo Punto f
42 1 56 2 de clase medio
43 1 57 1 xi
2
Datos sin

44 2 58 1 38 42 40 4
agrupar

45 1 59 1 43 47 45 8
48 1 62 1 48 52 50 5
49 1 63 2 53 57 55
3
50 2 66 1 58 62 60
3
51 2 Tota 25 63 - 67 65
2
Se agregan las columnas de frecuencia
relativa fr y frecuencia acumulada
fa:
Interva Punto f fr Fa
2/25
lo de medio
clase xi 4/25
0.08 2
38 42 40 2 8/25
0.16 6
43 47 45 4
0.32 14
48 52 50 8
0.20 19
53 57 55 5
0.12 22
58 62 60 3
0.12 25
63- 68 65 3
1
Total 25
Por ltimo se agregan las columnas:
Frecuencia porcentual, f% %f, se

obtiene multiplicando la frecuencia


relativa fr x 100.
Frecuencia relativa acumulada fra,

se obtiene sumando las frecuencias


relativas anteriores a un dato dado.
Frecuencia porcentual acumulada, f

%a, se obtiene sumando las frecuencias


porcentuales acumuladas a un dato dado.
Tablas de frecuencias
absoluta, relativa y 0.08 x
100

acumulada0.08 x 2/25
100
Interva Punto f fr f% fa fra f%a
lo de medio
clase xi 8 0.0 8
38 42 40 2 0.0 16 2 8
0.2 24
8 4
32 0.5 56
43 47 45 4 0.1 6 6
6 20 0.7 76
12 6
0.8 88
48 52 50 8 0.3 14
2 12 8
1 100
53 57 55 5 0.2 100 19
0
58 62 60 3 0.1 22
Grfica de Datos
Existen dos tipos de grficas mas
usuales:
Polgono de Frecuencias
Histograma

Otros grficos:
Grfica de barras
Pictograma
Grfico Circular o de pastel.
Polgono de Frecuencias
Es la representacin mediante un
grfico de lnea. En l se muestra la
distribucin de frecuencias y est
formado por segmentos de lnea que
unen los puntos correspondientes a la
frecuencia de cada una de las clases.

El eje x representa el dato xi


y el eje y las frecuencias.
Ejemplo

Intervalo Punto medio f


de clase xi
38 42 40 2

43 47 45 4

48 52 50 8

53 57 55 5

58 62 60 3

63 - 68 65 3

Total 25
El eje y puede ser sustituido por las
frecuencias relativas o porcentuales.
Polgono de Frecuencia Relativa

fr

xi
Polgono de Frecuencia Porcentual

%f

xi
Histograma
Es la representacin grfica de
los datos mediante una sucesin
de rectngulos.
Est formado por rectngulos cuya anchura

representa a cada uno de los intervalos y la


altura corresponde a la frecuencia.
En el eje x estarn los lmites verdaderos,

los puntos medios y en el eje y las


frecuencias.
Intervalo Punto medio f

Ejemplo
de clase xi
38 42 40 2

43 47 45 4

48 52 50 8

53 57 55 5

58 62 60 3

63 - 68 65 3

Total 25
Tambin podemos usar la frecuencia
relativa y la frecuencia porcentual.

fr

xi
%f

xi
Pirmide Poblacional
Una variante en el histograma es colocar
en el eje x de tal manera que las
columnas quedarn en forma horizontal,
es muy comn en datos poblacionales.
Ojiva
Es la representacin grfica de las
frecuencias acumuladas mediante un
grfico de lnea. Se muestra la
distribucin de frecuencias
acumuladas de los datos.

En el eje x estarn los puntos


medios y en el eje y las frecuencias
acumuladas.
Ejemplo

Interva Punto f fr fa
lo de medio
clase xi
38 42 40 2 0.08 2
43 47 45 4 0.16 6
48 52 50 8 0.32 14
53 57 55 5 0.20 19
58 62 60 3 0.12 22
63- 68 65 3 0.12 25
Total 25 1
Usando la frecuencia acumulada y la
frecuencia porcentual.
Interval Punto f fr f% fa fra f%a
o de medio xi
clase
38 42 40 2 0.0 8 2 0.0 8
8 8
43 47 45 4 0.1 16 6 0.2 24
6 4
48 52 50 8 0.3 32 14 0.5 56
2 6
53 57 55 5 0.2 20 19 0.7 76
Grfico Circular
Tambin es llamado grfico de pastel.

Slo se representan datos de frecuencias


relativas o frecuencias porcentuales.

Se debe dividir el rea del crculo de


manera proporcional a las frecuencias.
Agregaremos una columna a nuestra
tabla de frecuencias Frecuencia
relativa al crculo, multiplicando (fr)
(360), para mostrar la parte
proporcional de crculo medida en
grados que corresponde a cada
intervalo.
Ejemplo 1
0.08 x
360
Interval Punto f fr (fr )
o de medio (360) 0.16 x
clase xi 28.8 360
38 42 40 2 0.08 57.6
43 47 45 4 0.16 115.2
48 52 50 8 0.32 72
53 57 55 5 0.20 43.2
58 62 60 3 0.12 43.2
63- 68 65 3 0.12 360
Total 25 1
Ejemplo 2

Color Frecuen Conteo


cia
IIII
Azul 4
IIII I
Blanco II I I 7
Caf 3
IIII
Gris 4
II
Negro 2
IIII
Rosa 4
I
Verde 1
Otros Grficos
La grfica de barras se traza similar
al Histograma, slo que las barras se
dibujan separadas unas de otras.
La escala en el eje x es para

mostrar categoras o intervalos de


nmeros NO consecutivos.
Alumn
Carrera
os
Medicina 8
Mecnica 11
Civil 8
Agronoma 3
Fsico -
3
Matemticas
Leyes 6
Contadura 11
Pictograma
Similar al de barras, slo que se
sustituyen por figuras, generalmente
relacionadas con la variable estudiada.

You might also like