You are on page 1of 5

Estadstica _________________

Tema 1. Series Estadsticas. Distribuciones de frecuencias. Pg. 1

I. ANLISIS DESCRIPTIVO DE UN CONJUNTO DE DATOS


1 Series Estadsticas. Distribuciones de frecuencias.

1.1 Definicin de Estadstica. 1.1.1 Conceptos generales. 1.1.2 Tipo de caracteres. 1.2 Escalas de medida. 1.3 Resmenes numricos. 1.4 Diagrama de tronco y hojas.

1.1 Definicin de estadstica.


Estadstica: Ciencia que trata de la teora y aplicacin de mtodos apropiados para coleccionar, representar, resumir y analizar datos para hacer inferencias a partir de ellos. Clasificaciones de estadstica Estadstica descriptiva o deductiva. Se encarga de recoger y resumir las caractersticas de una poblacin o muestra deduciendo de esta descripcin conclusiones sobre su estructura, adems de las relaciones existentes entre otros colectivos distintos con los cuales se compara. Estadstica inductiva o inferencial. Basndose en los resultados del anlisis de la muestra de la poblacin induce o estima las leyes generales de comportamiento de la poblacin.

1.1.1 Conceptos generales.


Poblacin: Es un conjunto de elementos al que est referida la investigacin y de la que se extraen los datos. Individuo o unidad estadstica: Cada uno de los elementos que componen la poblacin. Es un ente observable que no tiene por qu ser una persona, puede ser algo abstracto. Muestra: Subconjunto de elementos de la poblacin, a partir del cual se realiza el estudio estadstico en caso de que no sea posible recopilar toda la informacin de la poblacin. Variable o serie estadstica: Es una representacin numrica de los caracteres, o una funcin que a cada modalidad asigna un valor. Caracteres: Cada uno de las unidades estadsticas se describen mediante cualidades llamadas caracteres.

Estadstica _________________ Existen dos tipos:

Tema 1. Series Estadsticas. Distribuciones de frecuencias. Pg. 2

Caracteres cualitativos: Aquellos caracteres que no se pueden medir (no cuantificables). Caracteres cuantitativos: Aquellos en los que se puede establecer una escala de medida, y se pueden subdividir a su vez en: Variables discretas: Las que no pueden tomar valores entre dos consecutivos: Variables contnuas: Las que admiten modalidades intermedias, es decir, puede haber infinitos valores entre dos.

A su vez las variables se pueden clasificar en agrupadas en intervalos y no agrupadas en intervalos. Modalidad: Cada una de las diferentes situaciones posibles del carcter. Ejemplo: n n n n Poblacin: Alumnos de la Universidad de Sevilla. Individuo: Alumno. Muestra: Subconjunto representativo de los alumnos de la Universidad de Sevilla. Caracteres: n Carrera: (Cualitativo) - Ingeniera. - Matemticas. - Fsica. - Derecho.... n Ao de nacimiento (Cuantitativo discreto) n N de Hermanos (Cuantitativo discreto) n Lugar de nacimiento (Cualitativo) n Altura (Cualitativo contnuo)

1.2 Escalas de medida.


La regla es aceptar slo como relaciones vlidas entre los nmeros aquellas que sean verificables empricamente entre las correspondientes modalidades. Escala: Conjunto de modalidades distintas y conjunto de nmeros distintos relacionados biunvocamente. Las escalas se clasifican segn Stevens en:

Escala NOMINAL: Cuando solamente es posible establecer una relacin de igualdad o desigualdad entre
las modalidades.

Escala ORDINAL: No slo una relacin de igualdad o desigualdad, sino tambin un orden. Escala de INTERVALOS: Unidad de medida y sirve para comprobar cuantas veces est contenida esa
unidad en la diferencia de 2 modalidades.

Escala de RAZN: Podemos decir cuntas veces una modalidad es mayor que otra. 1.3 Resmenes numricos.
Supongamos que tenemos n individuos u observaciones y x1,,xk modalidades distintas. Normalmente se dar que x1 <x2 << xk. - Frecuencia absoluta (de la modalidad xi): Es el nmero de individuos que presenta dicha modalidad del carcter x.

n
i =1

=n

Estadstica _________________

Tema 1. Series Estadsticas. Distribuciones de frecuencias. Pg. 3

- Frecuencia relativa (de la modalidad xi ): Es la proporcin de individuos que presenta dicha modalidad del carcter x. Se denota por fi.

f
i =1

=1

fi =

ni n

- Porcentaje (de la modalidad xi): Viene dada por el producto fi 100

pi = f i 100
Tipos de frecuencias para variables cuantitativas.

- Frecuencia absoluta acumulada (de la modalidad xi): N de individuos de la poblacin que presentan una modalidad xi . Se denota por Ni.

Ni = n j
j =1

- Frecuencia relativa acumulada (de la modalidad xi ): Proporcin de individuos de la poblacin que presentan una modalidad xi. Se denota por Fi .

Fi =
- Porcentaje acumulado: P = Fi 100 i

Ni n

Para el caso de variables cuantitativas contnuas o en intervalos definimos... - Marca de clase: Valor que representa al intervalo y viene dado por el punto medio de ese intervalo.

xi =

ei 1 + ei 2

Ii = (ei 1 , ei ]

Siendo Ii el intervalo abierto por la izquierda y cerrado por la derecha. - Amplitud: La diferencia entre el extremo derecho y el izquierdo.

a i = ei ei 1
- Tabla de frecuencias: Ejemplo: Tenemos una empresa.. Salario ni (140,150] 1 (150,160] 1 (160,170] 2 (170,180] 3 (180,190] 2 (190,200] 1 10 empresa con 10 empleados y vamos a hacer un estudio de los trabajadores de una fi 0,1 0,1 0,2 0,3 0,2 0,1 1 Pi 10% 10% 20% 30% 20% 10% 100% Ni 1 2 4 7 9 10 Fi 0,1 0,2 0,4 0,7 0,9 1 Pi 10% 20% 40% 70% 90% 100% xi 145 155 165 175 185 195 ai 10 10 10 10 10 10

Decimos que la amplitud es constante cuando todos los intervalos son iguales.

Cuando construimos una tabla de frecuencias agrupada en intervalos se est perdiendo informacin. Si est sin agrupar en intervalos no se pierde informacin.

Estadstica _________________

Tema 1. Series Estadsticas. Distribuciones de frecuencias. Pg. 4

Si empleamos un k 10, entonces podemos agrupar en intervalos. Todos los intervalos van a tener la misma amplitud: a 10 p, o mltiplos de 5 o de 2. 1.- L = n mx. de intervalos permitidos = [10log10 n] Ej: X= alturas en cm. n = 10 150, 160, 162, 182, 185, 192, 192, 194, 194, 197 L = [10log1010] = 10 ser el nmero mximo de intervalos permitidos. 2.-

R max x i min x i 197 150 47 = = = = 4 '7 L L 10 10 R < 10 m , con m mnimo. En este caso 47<10 L

3.- Determinar m:

4.a.-

R < 2 10 m1 L

4.b.-

R < 5 10 m1 L

RS: Comprobar que no se supera el n mx. de intervalos | | al considerar a = 2 10 RNo FIN S SS supera b) T | |No b) T RS: Comprobar que no se supera el n mx. de intervalos | | al considerar a = 5 10 RNo FIN S SS supera c) T | |No c) T
m1 m1

4.c.- a = 10 m Ej: Intervalo (140, 150] (150, 160] (160, 170] (170, 180] (180, 190] (190, 200]

FIN

Xi 145 155 165 175 185 195

ni 1 1 1 0 2 5 10

fi 0.1 0.1 0.1 0 0.2 0.5

Ni 1 2 3 3 5 10

Fi 0.1 0.2 0.3 0.3 0.5 1

1.4 Diagrama de tronco y hojas (STEAM-AND-LEAF)


Se debe al estadstico TUKEY. Nos permiten ver la simetra, dispersin, as como datos extraos (outleer). Para el caso de variables discretas procederemos as: 1. Calcularemos el nmero mximo de ramas (L):

L = [10 log10 n]

2. Identificar los dgitos ms significativos. Ser la potencia de 10 ms cercana por exceso al cociente R/L, siendo R = Mx - Min

Estadstica _________________ Ejemplo:

Tema 1. Series Estadsticas. Distribuciones de frecuencias. Pg. 5

150, 160, 162, 182, 185, 192, 193, 194, 194,197 (altura en cms.) (1) L = [10 log1010] = 10 (2) R =197-150 =47;

R 47 = = 4,7 < 10 decenas ; Los dgitos ms significativos sern decenas. L 10


(Ramas) 15 16 17 18 19 (Hojas) 0 02 25 23447

En el caso de variables contnuas podemos proceder del siguiente modo:

(1) (2)

N Mximo de Intervalos: L = [10 log10 n] Amplitud


R L

= 10 n
R R L L

R = max min;
Ejemplo:

< 5 10 n 1 < 2 10
n 1

U Siempre que no sobrapasen L | V | W


n = 10

150, 160, 162, 182, 185, 192, 193, 194, 197 L = [10log10 n] = 10 = 10

Determinar m: 47 < 10m m = 1 Hojas: 10m-1 = 100 = 1


R

R 197 150 47 = = = 4,7 L 10 10

L = 10 ; R = 47
* 0, 1, 2, 3, 4

L L

U | El de abajo no es menor, as que no nos vale. = 4 ,5 < 5 10 V 123 | W


= 4 ,7 < 10
0 5

0 5, 6, 7, 8, 9
TRONCO HOJA

5* 50 6* 60 7* 70 8* 80 9* 90

0 02

2 5 2344 7

n=10, udad=1, 510150

You might also like