You are on page 1of 28

Probabilidad y

Estadstica
Introduccin a la estadstica

P y Estadstica - UNER Introduccin 1


Qu es estadstica?
Definicin de estadstica
La estadstica es una ciencia aplicada que nos proporciona
un conjunto de mtodos para:
recopilar,
organizar (clasificar, agrupar)
presentar y
analizar datos,

con el fin de describirlos solamente (descriptiva)

con el fin de realizar generalizaciones (inferencial)

P y Estadstica - UNER Introduccin 2


Estadstica descriptiva e inferencial

EST DESCRIPTIVA: mtodos que nos llevan a


describir los datos mediante graficas o cuadros y
realizar algunos clculos de indicadores.

EST INFERENCIAL: mtodos con los que se


hace la generalizacin sobre una poblacin
usando una muestra.
Este mtodo usa la probabilidad

P y Estadstica - UNER Introduccin 3


Para qu sirve la estadstica?
La ciencia se ocupa en general de fenmenos observables
y se desarrolla observando hechos, formulando leyes que los
explican y realizando experimentos para validar o rechazar
dichas leyes

Los modelos que crea la ciencia son de tipo determinstico


o estocstico (componentes probabilsticas y aleatorias)

La Estadstica se utiliza como tecnologa al servicio de las


ciencias donde la variabilidad y la incertidumbre forman
parte de su naturaleza

La Estadstica permite el anlisis y la comprensin de los


fenmenos mas diversos, a partir de una recoleccin y de
un procesamiento de datos
P y Estadstica - UNER Introduccin 4
Definicin
La Estadstica es la Ciencia de la:

sistematizacin, recoleccin, ordenacin y


presentacin de los datos referentes a un fenmeno
que presenta variabilidad o incertidumbre para su
estudio metdico, con objeto de:

deducir las leyes que rigen esos fenmenos,

poder hacer previsiones sobre los mismos, tomar


decisiones u obtener conclusiones.

P y Estadstica - UNER Introduccin 5


Pasos en un estudio estadstico
Plantear hiptesis sobre una poblacin
Los fumadores tienen ms ausencias laborales que los no fumadores
En qu sentido? Mayor nmero? Tiempo medio?

Decidir qu datos recoger (diseo de experimentos)


Qu individuos pertenecern al estudio (muestras)
Fumadores y no fumadores en edad laboral.
Criterios de exclusin Cmo se eligen? Descartamos los que padecen enfermedades
crnicas?
Qu datos recoger de los mismos (variables)
Nmero de ausencias, tiempo de duracin de cada perodo con problemas
Sexo? Sector laboral? Otros factores?

Recoger los datos (muestreo) No hay que


Estratificado? Sistemticamente?
entenderlo (an)
Describir (resumir) los datos obtenidos
tiempo medio de ausencia en fumadores y no (estadsticos)
% de ausencias por fumadores y sexo (frecuencias), grficos,...

Realizar una inferencia sobre la poblacin


Los fumadores estn ausentes al menos 10 das/ao ms de media que los no fumadores.

Cuantificar la confianza en la inferencia


Nivel de confianza del 95%
Significacin del contraste: p=2%

P y Estadstica - UNER Introduccin 6


Mtodo cientfico y estadstica

Plantear Disear
hiptesis experimento

Obtener Recoger datos


conclusiones y analizarlos

P y Estadstica - UNER Introduccin 7


Poblacin y muestra
Poblacin es el conjunto sobre el que
estamos interesados en obtener conclusiones
(hacer inferencia).
Normalmente es demasiado grande para
poder abarcarlo.

Muestra es un subconjunto al que tenemos


acceso y sobre el que realmente hacemos las
observaciones (mediciones)
Debera ser representativo
Esta formado por miembros
seleccionados de la poblacin
(individuos, unidades experimentales).

P y Estadstica - UNER Introduccin 8


Censo .vs. Muestreo

P y Estadstica - UNER Introduccin 9


Tabla INDIVIDUOS x VARIABLES

Como escoger los individuos?

Cmo construir las variables?

P y Estadstica - UNER Introduccin 10


Diseos experimentales

Introduccin

P y Estadstica - UNER 11
Variables
Una variable es una caracterstica observable que vara entre los
diferentes individuos de una poblacin.

La informacin que disponemos de cada individuo es resumida en


variables.

En los individuos de la poblacin argentina, de uno a


otro es variable:

El grupo sanguneo
{A, B, AB, O} Var. Cualitativa Nominal
Su nivel de felicidad declarado
{Deprimido, Ni fu ni fa, Muy Feliz} Var. Cualitativa Ordinal
El nmero de hijos
{0,1,2,3,...} Var. Numrica discreta
La altura
{162 ; 174; ...} Var. Numrica continua
P y Estadstica - UNER Introduccin 12
Tipos de variables
Cualitativas o Categricas
Si sus valores (modalidades) no se pueden asociar naturalmente a un
nmero (no se pueden hacer operaciones algebraicas con ellas)

Nominales: Si sus valores no se pueden ordenar


Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No)

Ordinales: Si sus valores se pueden ordenar


Mejora a un tratamiento, Grado de satisfaccin, Intensidad del dolor

Cuantitativas o Numricas
Si sus valores son numricos (tiene sentido hacer operaciones
algebraicas con ellos)

Discretas: Si toma valores enteros


Nmero de hijos, Nmero de cigarrillos, Num. de cumpleaos

Continuas: Si entre dos valores, son posibles infinitos valores intermedios.


Altura, Presin intraocular, Dosis de medicamento administrado, edad

P y Estadstica - UNER Introduccin 13


Los posibles valores de una variable suelen denominarse modalidades.

Las modalidades pueden agruparse en clases (intervalos)


Edades:
Menos de 20 aos, de 20 a 50 aos, ms de 50 aos
Hijos:
Menos de 3 hijos, De 3 a 5, 6 o ms hijos

Las modalidades/clases deben forman un sistema exhaustivo y


excluyente
Exhaustivo: No podemos olvidar ningn posible valor de la variable
Mal: Cul es su color del pelo: (Rubio, Moreno)?
Bien: Cul es su grupo sanguneo?
Excluyente: Nadie puede presentar dos valores
simultneos de la variable
Estudio sobre el ocio
Mal: De los siguientes, qu le gusta: (deporte, cine)
Bien: Le gusta el deporte: (S, No)
Bien: Le gusta el cine: (S, No)
Mal: Cuntos hijos tiene: (Ninguno, Menos de 5, Ms de 2)

P y Estadstica - UNER Introduccin 14


Presentacin ordenada de datos
7
6
Gnero Frec.
5

Hombre 4 4
3
2
Mujer 6 1
0
Hombre Mujer

Las tablas de frecuencias y las representaciones


grficas son dos maneras equivalentes de presentar la
informacin. Las dos exponen ordenadamente la
informacin recogida en una muestra.

P y Estadstica - UNER Introduccin 15


Tablas de frecuencia
Exponen la informacin recogida en la muestra, de forma que no se pierda nada de
informacin (o poca).

Frecuencias absolutas: Contabilizan el nmero de individuos de cada modalidad

Frecuencias relativas (porcentajes): Idem, pero dividido por el total

Frecuencias acumuladas: Slo tienen sentido para variables ordinales y numricas


Muy tiles para calcular cuantiles (ver ms adelante)
Qu porcentaje de individuos tiene 3 hijos o menos? Sol: 83,8
Entre 4 y 6 hijos? Soluc 1: 8,4%+3,6%+1,6%= 13,6%. Soluc 2: 97,3% - 83,8% = 13,5%

Sexo del encuestado


Nmero de hijos
Porcentaje
Porcentaje Porcentaje
Frecuencia Porcentaje v lido
Frecuencia Porcentaje v lido acumulado
Vlidos Hombre 636 41, 9 41, 9
Vlidos 0 419 27, 6 27, 8 27, 8
Mujer 881 58, 1 58, 1
1 255 16, 8 16, 9 44, 7
Tot al 1517 100,0 100,0
2 375 24, 7 24, 9 69, 5
3 215 14, 2 14, 2 83, 8
Nivel de felicidad
4 127 8, 4 8, 4 92, 2
Porcentaje Porcentaje 5 54 3, 6 3, 6 95, 8
Frecuencia Porcentaje v lido acumulado 6 24 1, 6 1, 6 97, 3
Vlidos Muy f eliz 467 30,8 31,1 31,1 7 23 1, 5 1, 5 98, 9
Bastante f eliz 872 57,5 58,0 89,0
Ocho o ms 17 1, 1 1, 1 100,0
No demasiado f eliz 165 10,9 11,0 100,0
Tot al 1509 99, 5 100,0
Total 1504 99,1 100,0
Perdidos No cont esta 8 ,5
Perdidos No contesta 13 ,9
Total Tot al 1517 100,0
1517 100,0

P y Estadstica - UNER Introduccin 16


Datos desordenados y ordenados en tablas
Variable: Gnero Gnero Frec. Frec. relat.
Modalidades: porcentaje
H = Hombre Hombre 4 4/10=0,4=40%
M = Mujer Mujer 6 6/10=0,6=60%

10=tamao
muestral
Muestra:

MHHMMHMMMH

equivale a
HHHH MMMMMM

P y Estadstica - UNER Introduccin 17


Ejemplo
Cuntos individuos tienen Nmero de hijos
menos de 2 hijos?
frec. indiv. sin hijos Porcent. Porcent.
+ Frec. (v lido) acum.
frec. indiv. con 1 hijo 0 419 27, 8 27, 8
= 419 + 255 1 255 16, 9 44, 7
= 674 individuos 2 375 24, 9 69, 5 50%
3 215 14, 2 83, 8
Qu porcentaje de individuos 4 127 8, 4 92, 2
tiene 6 hijos o menos?
5 54 3, 6 95, 8
97,3%
6 24 1, 6 97, 3
7 23 1, 5 98, 9
Qu cantidad de hijos es tal
que al menos el 50% de la Ocho+ 17 1, 1 100,0
poblacin tiene una cantidad Tot al 1509 100,0
inferior o igual?
2 hijos

P y Estadstica - UNER Introduccin 18


Grficos para v. cualitativas
Diagramas de barras
Alturas proporcionales a las frecuencias (abs. o
rel.)
Se pueden aplicar tambin a variables discretas

Diagramas de sectores (tartas, polares)


No usarlo con variables ordinales.
El rea de cada sector es proporcional a su
frecuencia (abs. o rel.)

Pictogramas
Fciles de entender.
El rea de cada modalidad debe ser proporcional a
la frecuencia. De los dos, cul es incorrecto?.

P y Estadstica - UNER Introduccin 19


P y Estadstica - UNER Introduccin 20
Grficos diferenciales para variables numricas
419
40 0 375

Son diferentes en funcin de que las


30 0

255

Recuento
215

variables sean discretas o continuas. 20 0

127

Valen con frec. absolutas o relativas. 10 0

54
24 23 17
Diagramas barras para v. discretas 0 1 2 3 4 5 6 7 Ocho o m s

Se deja un hueco entre barras para indicar Nme ro de hijos

los valores que no son posibles


25 0

Histogramas para v. continuas 20 0

Recuento
El rea que hay bajo el histograma entre 15 0

dos puntos cualesquiera indica la cantidad 10 0

(porcentaje o frecuencia) de individuos en 50

el intervalo.
20 40 60 80

Edad del e ncue stado

P y Estadstica - UNER Introduccin 21


Diagramas integrales
Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se
realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la
cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo.
Se pasan de los diferenciales a los integrales por integracin y a la inversa por derivacin.

P y Estadstica - UNER Introduccin 22


P y Estadstica - UNER Introduccin 23
P y Estadstica - UNER Introduccin 24
P y Estadstica - UNER Introduccin 25
P y Estadstica - UNER Introduccin 26
P y Estadstica - UNER Introduccin 27
Qu hemos visto?
Definicin de estadstica
Poblacin
Muestra
Variables
Cualitativas
Numricas
Presentacin ordenada de datos
Tablas de frecuencias
absolutas
relativas
acumuladas
Representaciones grficas
Cualitativas
Numricas
Diferenciales
Integrales

P y Estadstica - UNER Introduccin 28

You might also like