You are on page 1of 33

Tema 1: Estadstica Descriptiva

1. Conceptos generales.
2. Medidas de centralizacin.
3. Medidas de dispersin.
4. Medidas de posicin.
5. Medidas de forma.
6. Tipificacin.

1. Conceptos generales.
Estadstica (Estado): parte de las Matemticas que
se encarga de RECOGER y ANALIZAR datos.
Estadstica Descriptiva
Estadstica Inferencial
Teora de muestras,
Diseo de experimentos

POBLACION
Muestra

Razones para tomar muestras: tiempo, dinero, accesibilidad,

PARADOJICAMENTE, para conocer a la poblacin no


hace falta estudiar a TODA la poblacin

EN DOS SEMANAS RECORTA 4 PUNTOS

El PP se sita a dos puntos del PSOE en intencin de voto,


segn una encuesta publicada en El Pas
El PP se encuentra a dos puntos del PSOE en intencin directa de voto, segn un sondeo del Instituto Opina
que publica este domingo el diario El Pas. Agrega el peridico que el PP ha logrado recortar en dos
semanas cuatro puntos en intencin de voto respecto a los socialistas, quienes tenan un 44 por ciento de
intencin de voto, frente al 38 por ciento del PP, segn la anterior encuesta de Opina, publicada el 25 de
septiembre en se mismo diario.

L D (Agencias) El sondeo publicado este domingo, hecho sobre una muestra de 1.300 entrevistas hechas desde el 4 al 6 de octubre en todo
el territorio espaol, desvela que el PP gana dos puntos y el PSOE los pierde, "con lo que la diferencia se reduce drsticamente y supone la
ventaja socialista ms reducida desde las elecciones generales"..
Aunque los diarios La Vanguardia y El Peridico de Catalua recogen otra encuesta que revela que el PSC y CiU mantienen un
empate tcnico, aunque en los porcentajes de intencin de voto el PSC continuara por delante. En ambas encuestas, tanto el
presidente de la Generalidad, Pasqual Maragall, como el lder de la oposicin, Artur Mas, mejoran sustancialmente su valoracin
respecto a encuestas anteriores, aunque Maragall saca 19,3 puntos en la pugna por la presidencia de la Generalidad.
As, la encuesta de La Vanguardia elaborada por el Instituto Noxa entre los das 3 y 6 de octubre a 1.000 entrevistados, otorga al
PSC 44 escaos y una intencin de voto del 32,5 por ciento, mientras que CiU pasara de los actuales 46 escaos a 43 y
mantendra una intencin de voto del 29,2 por ciento. ERC mantendra su estatus de tercera fuerza poltica con 23 escaos, al igual
que el PP, aunque segn la encuesta crece la intencin de voto respecto a las elecciones de 2003 y alcanza el 12,7 por ciento. ICVEA tambin subira y podra alcanzar los 10 escaos. Por su parte, la encuesta de El Peridico realizada durante los mismos das
por la empresa Gesop a 800 entrevistados sita a PSC y CiU con un voto estimado del 32 por ciento en ambos casos, aunque la
intencin de voto directa otorga al PSC un 31,5 por ciento y a CiU un 22,3 por ciento.

Discretas
Cuantitativas
Continuas
VARIABLE
ESTADISTICA
Cualitativas

la cualidad que
deseamos estudiar
en la poblacin

Intencin

de voto
Nmero de hijos
Longitud del ala de un pjaro
Nmero de ejemplares de una especie en un continente.
Tiempo de recuperacin de un ecosistema.
Nmero del despacho de distintos profesores.
.

Una vez diseada la muestra, recogemos los datos;


despus, la informacin proporcionada por ellos debe
ORDENARSE

Tablas y grficas estadsticas


(datos agrupados y no agrupados)

Procedimiento usual para agrupar datos en clases


(libro de Susan Milton,
pg. 22):
1.- El n de clases se puede aproximar como k=1+3.322 log10n
(n tamao de la muestra; k se redondea hacia abajo,
p. ej. 6.82 a 6).
2.- Localizamos el mayor y menor dato, respectivamente. Diferencia entre
ambos: RANGO de los datos.
3.- Amplitud mnima de clase: cociente entre el rango y el n de clases.
- Redondeamos por arriba el n obtenido hasta la precisin de los datos; si
el cociente tiene ya esa precisin, la incrementamos en una unidad.
- El extremo inferior de la primera clase es el menor de los datos, disminuido en 0.5 si los datos son enteros, en 0.05 si tienen 1 decimal, en 0.005
si tienen 2 decimales
(As ningn dato coincide con un extremo de un intervalo)
4.- Alternativa: intervalos [a,b)
5.- Si hay datos atpicos (outliers), la tcnica se modifica (S. Milton, p. 25)

GRAFICOS ESTADISTICOS
Ejemplo 1:
ni %i

17

DIAGRAMA DE BARRAS

18 19

21 22

xi

Ejemplo 2:
ni %i

3.75

HISTOGRAMA

5.95 8.15 10.35.

xi

Ejemplo 1:

DIAGRAMA DE SECTORES

DIAGRAMA DE TALLO Y HOJAS

2. Medidas de centralizacin.
3. Medidas de dispersin o variabilidad.
4. Medidas de posicin.

3. Medidas de dispersin o variabilidad.


La DISPERSION (o variabilidad)de un conjunto de datos es una medida
de la distancia entre los datos, y su media.

Poca dispersin = Datos homogneos = Media


muy representativa
Mucha dispersin = Datos heterogneos =
Media poco representativa

Ejemplo 5: En una investigacin sobre deficiencias medioambientales encontradas en plantas industriales, se seleccionaron aleatoriamente 25 plantas
de dos comunidades diferentes. Se obtuvieron los siguientes datos sobre el
nmero de deficiencias encontradas:

La media es 4, en cada
comunidad; pero en cul
de ellas la variable es ms
dispersa?

Ejemplo 5: En una investigacin sobre deficiencias medioambientales encontradas en plantas industriales, se seleccionaron aleatoriamente 25 plantas
de dos comunidades diferentes. Se obtuvieron los siguientes datos sobre el
nmero de deficiencias encontradas:

1 2 3 4 5 6 7
+ disp.

1 2 3 4 5 6 7

Cmo podemos medir la dispersin?


1.- Rango: dif. entre el mayor y el menor de los datos.
k

2.- Varianza:

S2

x
ni

i 1

n
i 1

3.- Desviacin tpica:

S V

Propiedades de la varianza y la desviacin tpica:


1.- La varianza no puede ser negativa.
2.- A igualdad de medias, cuanto mayor sea la dispersin, mayor es la
varianza (y la desv. tpica).
3.- Si dos conjuntos de datos poseen medias similares, es ms disperso
aquel que tenga mayor varianza (desv. tpica).
4.- El recproco no es necesariamente cierto, porque la varianza (desv. tpica)
depende tambin del tamao de los datos.

Coeficiente de variacin (CV)


5.- Interpretacin de la desviacin tpica en fenmenos
de medida.

Cmo podemos medir la dispersin?


1.- Rango.
2.- Varianza.
3.- Desviacin tpica.
4.- Coeficiente de variacin:

A mayor CV, mayor dispersin

CV

S
x

Ejemplo: Se realiza un experimento para investigar el efecto de una


nueva dieta, sobre la ganancia de peso de cachorros durante las primeras
semanas de vida.
Gran Dans: ganancia media de 30 libras, desv. tpica de 10 libras.
Chihuahua: ganancia media de 3 libras, desv. tpica de 15 libras.
Qu grupo posee mayor variabilidad?

Cmo podemos medir la dispersin?


1.- Rango.
2.- Varianza.
3.- Desviacin tpica.
4.- Coeficiente de variacin.
5.- Cuasivarianza; cuasidesviacin tpica.
k

s2

x
ni

i 1

n 1
i 1

s s2
(Util para estimar la varianza poblacional)

4. Medidas de posicin.

5. Medidas de forma.
Parmetros que permiten evaluar ciertas caractersticas del
diagrama de barras/histograma (simetra, apuntamiento).

Momento de orden r con respecto a la media:


k

mr

x x
i 1

ni

Coeficiente de asimetra:
Un conjunto de datos es simtrico, si lo es su histograma/diagrama de barras

1 2 3 4 5 6 7

1 2 3 4 5 6 7
Simetra

x
Mo
Asimetra negativa (a la izqda.)

Mo
Asimetra positiva (a la dcha.)

Coeficiente de asimetra:

x
Mo
Asimetra negativa (a la izqda.)

Mayor concentracin de
datos a la izquierda

Mo
Asimetra positiva (a la dcha.)

Mayor concentracin de
datos a la derecha

Coeficiente de asimetra:

Coeficiente de asimetra de Pearson:


(slo variables con distribucin
acampanada)

x Mo
CAP
S
Mo: moda

CAP AF>0: Asimetra positiva (a la dcha.)


CAP AF=0: Simetra
CAP AF<0: Asimetra negativa (a la izqda.)
Coeficiente de asimetra de Fisher:
(todo tipo de variables)

m3
AF 3
S

x
ni
i
i 1

NS 3

Coeficiente de apuntamiento o curtosis:


Previamente: curva normal N(,) o campana de Gauss

f ( x)

1
e
2

Una variable estadstica es normal si el polgono de frecuencias


(utilizando %) se ajusta a esta curva.

1 x

Coeficiente de apuntamiento o curtosis:


k

m4
g2 4 3
S
Normal

Leptocrtica: ms apuntada
Mesocrtica: normal
Platicrtica: ms aplanada

g2>0
g2=0
g2<0

x
ni
i
i 1

NS

Ligeras correcciones de los coeficientes de asimetra y


curtosis dan lugar a los coeficientes de asimetra y
curtosis tipificadas (Statgraphics)

Aceptamos que un conjunto de datos es


aproximadamente normalcuando los
coeficientes de asimetra y de curtosis
tipificadas estn entre -2 y 2.

6. Tipificacin.
Dada una variable estadstica X, la tipificacin de esta variable es
otra Dnueva variable, Z, que se define como

X x
S

Caractersticas:
La media de Z es 0; su desviacin tpica es 1.
El valor de Z se puede entender como una medida de la variacin relativa
que experimenta el valor X frente a su media.
Es til para comparar valores correspondientes a variables cuyas medias
y desviaciones tpicas son diferentes.

EJEMPLO: Al terminar la carrera, un licenciado en psicologa y otro


en econmicas reciben sendas ofertas de trabajo, con sueldos
anuales de 18.000 y 24.000 . La media de los sueldos de los recin
licenciados en psicologa es de 16.000, con una desviacin tpica
de 850. La media de los sueldos de los recin licenciados en
econmicas es de 22.000, con una desviacin tpica de 1.200.
Cul de los dos ha tenido una mejor oferta laboral, en relacin a los
sueldos de su profesin?

EJEMPLO: Al terminar la carrera, un licenciado en psicologa y otro


en econmicas reciben sendas ofertas de trabajo, con sueldos
anuales de 18.000 y 24.000 . La media de los sueldos de los recin
licenciados en psicologa es de 16.000, con una desviacin tpica
de 850. La media de los sueldos de los recin licenciados en
econmicas es de 22.000, con una desviacin tpica de 1.200.
Cul de los dos ha tenido una mejor oferta laboral, en relacin a los
sueldos de su profesin?
Solucin: Calculamos la variacin relativa, en cada caso, con respecto a
la media (es decir, tipificamos):
Psicologa: (18000-16000)/850=235
Econmicas: (24000-22000)/1200=166
Por tanto, el sueldo ofrecido al psiclogo posee mayor variacin
relativa; puesto que la variacin es positiva, ello implica que el sueldo
es comparativamente mejor

You might also like