You are on page 1of 100

TEMAS DE ESTADSTICA Y

PROBABILIDAD
Estadistica cuantitativa y cualitativa

Estadistica cuantitativa caracteres medibles, estadistica cualitativa propiedades no


medibles. Individuo en estadistica, poblacin y muestra. Ejemplos de estadistica
cuantitativa y cualitativa.

Estadstica descriptiva

Estadistica cuantitativa y cualitativa

Cuantitativos

Son aquellos que se pueden medir. Determinan variables estadsticas que pueden
ser:

Discretas

Slo pueden tomar un nmero finito de valores enteros, los valores posibles de estas
variables son aislados.

Ejemplos de variables estadsticas cuantitativas discretas

Nmero de hermanos: pueden ser 1, 2, 3 , pero nunca podr ser 3,45.


Nmero de hijos

Nmero de empleados de una fbrica.

Nmero de goles marcados por un equipo de futbol en la liga.

Continuas

Pueden tomar cualquier valor real (infinitos) dentro de un intervalo.

Ejemplos de variables estadsticas cuantitativas continuas

Velocidad de un vehculo: puede ser 20; 54,2; 100 ; km/h

Temperaturas registradas en un observatorio cada hora.

Peso en kg de los recin nacidos en un da en Espaa.

Cualitativos

No se pueden medir numricamente.

Ejemplos de variables estadsticas cualitativas

Color de los ojos.

Bondad de una persona.

Profesin de una persona.

Determinan modalidades. Las modalidades del carcter profesin pueden ser:


arquitecto, albail, mdico, etc.

Tablas, frecuencias y grficos

Frecuencia absoluta y relativa

Frecuencia absoluta y relativa de variables cuantitativas, frecuencia acumulada,


diagrama de barras y de sectores, histograma.

Ejercicios resueltos

Variable cuantitativa discreta

Las notas de un examen de matemticas de 30 alumnos de una clase son las


siguientes:

5, 3, 4, 1, 2, 8, 9, 8, 7, 6, 6, 7, 9, 8, 7, 7, 1, 0, 1, 5, 9, 9, 8, 0, 8, 8, 8, 9, 5, 7.

a) Ordenar los datos y calcular las frecuencias absolutas de cada nota.


b) Hacer un diagrama de barras de las frecuencias absolutas y dibujar el polgono
de frecuencias.

a) Tabla para calcular la frecuencia relativa hi y la frecuencias


acumuladas.

Ordenamos los datos contando los alumnos que han sacado un 0 han sido 2, un 1
han sido 3 y as sucesivamente. Construimos la tabla correspondiente:

N: nmero total de datos N = 30.

xi: variable estadstica, nota del examen.

fi: frecuencia absoluta, nmero de veces que se repite una nota. El sumatorio nos da
los datos totales N = 30.

Fi: frecuencia absoluta acumulada. Para calcularla vamos sumando los valores de la
frecuencia absoluta fi. F 2 = f 1 + f2 => 2 + 3 = 5 F 3 = F 2 + f 3 => 5 + 1 = 6

hi: frecuencia relativa. Cociente f i / N

Hi: frecuencia relativa acumulada

: sumatorio (suma de todos los datos de la columna correspondiente)

b) Diagrama de barras de frecuencia absoluta y polgono de


frecuencias

Representar el diagrama de barras de frecuencia absoluta

Dibujar el polgono de frecuencias

Variable cuantitativa continua

Se ha controlado el peso de 50 recin nacidos, obtenindose los siguientes


resultados:

a) Formar la tabla de frecuencias.


b) Representar grficamente la distribucin.

a) Tabla de frecuencias

La tabla de frecuencias se hace igual que en el ejemplo anterior

b) Histograma, grfica de la distribucin

Interpretacin

La mayora de los nios, 23 tiene un peso comprendido entre 3 y 3,5 kg.


Los nios con menor peso [2,5 - 3) son muy pocos solo 6.

Ejemplo de un diagrama de sectores

En un hipermercado se han producido las siguientes ventas en euros: juguetes 125,


plantas 175, discos 250, alimentacin 450.
a) Calcular las frecuencias, porcentajes y ngulo correspondiente.
b) Realizar un diagrama de sectores.

a) Colocamos los datos en una tabla.

Las variable xi son los productos vendidos.


Las frecuencias absolutas f i son las ventas en euros de cada producto.
Las frecuencias relativas hi se obtienen dividiendo las frecuencias absolutas entre el
total de euros 1000 .
El porcentaje % se calcula multiplicando la frecuencia relativa por 100.

b) Diagrama de sectores

Para realizar el diagrama de sectores necesitamos conocer el ngulo. Para hallar el


ngulo multiplicamos la frecuencia relativa por 360 que se corresponden con el
total. Ver datos en la tabla.
Dibujamos los ngulos obtenidos en un crculo, unos a continuacin de otros.

Frmulas de la media y desviacin tpica

Media aritmtica y desviacin tpica. Frmulas para calcular la media aritmtica,


la moda y la desviacin tpica.

Medidas de centralizacin: media, moda y mediana

Medidas de dispersin: varianza, desviacin tpica y rango

Problemas de desviacin tpica

Problemas de desviacin tpica. Clculo de la media aritmtica y la desviacin


tpica en variables continuas y variables discretas. Diagramas

Variable discretas

Se ha preguntado a 40 personas el nmero de personas que forman el hogar


familiar obtenindose los siguientes resultados:
Nmero de personas en el hogar
Frecuencia

2 3 4 567
4 11 11 6 6 2

a) Calcula la media, la mediana, la moda y la desviacin tpica.


b) Haz el diagrama correspondiente.

Media aritmtica,mediana, moda y desviacin tpica

Para resolver esto construimos una tabla, debemos fijarnos en las columnas que
necesitamos para calcular lo que nos piden.

Fi La frecuencia absoluta acumulada la necesitamos para calcular la mediana.

xifi Necesitamos el sumatorio de esta columna para la frmula de la media


aritmtica. Los valores se hallan multiplicando xifi de cada fila.

xi2fi Necesitamos este sumatorio para hallar la desviacin tpica. Para conseguir
los valores se multiplica en cada fila el valor de xi por xifi.

Tabla para

calcular la media y desviacin tpica

personas xi

frecuencia fi

Fi

xi f i

xi 2 f i

16

11

15

33

99

11

26

44

176

32

30

150

38

36

216

40

14

98

40

165

755

Diagrama de barras por ser variables discretas

Variables continuas

En un test de inteligencia realizado a una muestra de 200 personas, se han obtenido


los resultados siguientes:
Puntuacin
Nmero de
personas

30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90
6

18

a) Calcula la media, y la desviacin tpica.

76

70

22

b) Dibuja un histograma para representar grficamente los datos , haz tambin el


polgono de frecuencias.

Media aritmtica y desviacin tpica

Es una variable continua, debemos hallar la marca de clase para cada intervalo
sumando los valores extremos y dividiendo entre dos. Esta marca de clase la
trataremos como xi.
El resto de los sumatorios que necesitamos se hallan como en el ejemplo anterior.

Intervalos Marca de clase xi Frecuencia fi

xi f i

xi 2 f i

30 - 40

35

210

7350

40 - 50

45

18

810

36450

50 - 60

55

76

4180

229900

60 - 70

65

70

4550

295750

70 - 80

75

22

1650

123750

80 - 90

85

680

57800

200

12080 751000

Histograma y polgono de frecuencias

Para construir el polgono de frecuencias se unen las marcas de clase de cada


intervalo.

Clculo del coeficiente de variacin

La media y la desviacin tpica de los puntos conseguidos por Ana y Rosa en una
semana de entrenamiento jugando al baloncesto han sido las siguientes: media de
Ana 22 puntos y desviacin tpica 4,106. Media de Rosa 22 puntos y desviacin
tpica 2.

a) Calcula el coeficiente de variacin de cada una de ellas.


b) Cul de las dos ha sido ms regular?

Parmetros estadsticos, frmulas

Parmetros estadsticos: calcular la media, moda, mediana y desviacin tpca de


variables discretas y continuas.

Parmetros estadsticos, frmulas

Medidas de centralizacin

Parmetros de localizacin o posicin: cuantiles

Medidas de dispersin

Ejercicios estadstica, media, moda y mediana

Ejercicios estadstica, media estadstica, moda y mediana estadstica. Ejercicios


resueltos de variables continuas y discretas.

Ejercicios estadstica

Ejemplo de una variable discreta

Las calificaciones de historia del arte de los 40 alumnos de una clase viene dada por
la tabla adjunta:

xi

fi

a) Halla la media aritmtica, la moda y la mediana.


b) El cuartil Q1 y el percentil P70.
c) Halla la desviacin tpica.

Construimos una tabla, con las columnas necesarias para calcular la media
estadstica, moda, mediana y desviacin tpica.

Ejemplo de una variable continua

Se ha aplicado un test de satisfaccin en el trabajo a 88 empleados de una fbrica


obtenindose la tabla de datos adjunta.

a) Halla la media aritmtica, moda, mediana y el cuartil Q1.


b) Halla el rango y la desviacin tpica.

Construimos una tabla, con las columnas necesarias para calcular la media
estadstica, moda, mediana y desviacin tpica.

Distribuciones bidimensionales. Covarianza y correlacin

Distribuciones bidimensionales, estudio de dos variables. Covarianza, coeficiente de


correlacin entre las variables y ecuaciones de las rectas de regresin.

Distribuciones bidimensionales

Covarianza y coeficiente de correlacin

Rectas de regresin

Ejercicios de estadstica, covarianza, correlacin y recta de regresin

Ejercicios de estadstica, problemas de distribuciones bidimensionales.


Covarianza, coeficiente de correlacin entre las variables y ecuacin de las recta
de regresin.

Ejercicios resueltos

1. Una compaa de seguros considera que el nmero de vehculos (y) que circulan
por una determinada autopista a ms de 120 km/h , puede ponerse en funcin del
nmero de accidentes (x) que ocurren en ella. Durante 5 das obtuvo los siguientes
resultados:
Ejercicios estadstica
Accidentes xi

Vehculos yi

15

18

10

20

a) Calcula el coeficiente de correlacin lineal.


b) Si ayer se produjeron 6 accidentes, cuntos vehculos podemos suponer que
circulaban por la autopista a ms de 120 km / h?
c) Es buena la prediccin?

Construimos una tabla con las columnas necesarias

Vemos las frmulas que tenemos que aplicar para saber las columnas que
necesitamos, a continuacin se explica la forma de hacer esto.

2. Las calificaciones de 40 alumnos en psicologa evolutiva y en estadstica han sido


las de la tabla adjunta.

Psicologa xi

3 4

6 6 7 7 8

10

Estadstica yi

2 5

6 7 6 7 9

10

N de alumnos fi

4 6

12

4 5 4 2 1

a) Obtener la ecuacin de la recta de regresin de calificaciones de estadstica


respecto de las calificaciones de psicologa.
b) Cul ser la nota esperada en estadstica para un alumno que obtuvo un 4,5 en
psicologa?

Construimos una tabla con las columnas necesarias

3. Las notas obtenidas por 10 alumnos en Matemticas y en Msica son:


Matemticas xi

8 5

3,5

7 5 10 5 4

Msica yi

6,5

4,5

7 5

8 7 10 6 5

Calcula la covarianza y el coeficiente de correlacin.


Existe correlacin entre las dos variables?

Cul ser la nota esperada en Msica para un alumno que hubiese obtenido un
8,3 en Matemticas?

Distribucin de una variable aleatoria discreta

Distribucin aleatoria discreta, variable aleatoria, comparar una distribucin de


frecuencias con una de probabilidad.

Distribucin aleatoria

Una variable aleatoria es discreta cuando slo puede tomar unos ciertos valores
enteros.

Ejemplos de variable aleatoria

Nmero de caras obtenidas al lanzar tres monedas: 0, 1, 2, 3.


Suma de las caras superiores obtenidas al lanzar dos dados: 2, 3, 4, 5, 6, 7, 8, 9,
10, 11, 12.

Distribucin de probabilidad

Ejemplo de variable aleatoria

Lanzamos un dado perfecto 240 veces, anotamos el resultado obtenido en la cara


superior obteniendo los siguientes resultados:

Distribucin aleatoria discreta


Cara superior
Nmero

de veces

40

39

42

38

42

39

1. Tabla de distribucin de frecuencias

La tabla de distribucin de frecuencias muestra los resultados obtenidos

2. Tabla de distribucin de probabilidad

La tabla de distribucin de probabilidad muestra los resultados esperados

3. Grfica de las distribuciones

En la grfica de los valores esperados, observamos que a cada valor de la variables


aleatoria xi "cara del dado" le hacemos corresponder su probabilidad terica. A esta
ley se le llama distribucin de probabilidad.

Parmetros de una distribucin discreta

Media y desviacin tpica de una variable aleatoria discreta. La media es el valor


esperado tambin se llama esperanza matemtica

Esperanza matemtica o media , varianza y desviacin tpica

Ejemplo

Se lanzan tres monedas y se cuenta el nmero de caras obtenidas. Haz una


tabla con las probabilidades, represntala grficamente y calcula la media y la
desviacin tpica.

Construimos la tabla, teniendo en cuenta los valores que puede tomar la variable xi
obtener cara.

Tenemos tres monedas, el nmero de caras que podemos obtener ser: 0, 1, 2 y 3.


Escribimos el espacio muestral para facilitar el recuento, los casos posibles son
23 = 8
E = { CCC, CCX, CXC, XCC, XCX, XXC, CXX, XXX }

- La probabilidad de no obtener ninguna cara ser obtener tres cruces {XXX} = 1 / 8


- La probabilidad de obtener una cara ser {XCX, XXC, CXX } = 3 / 8
- La probabilidad de obtener dos caras ser {CCX, CXC, XCC } = 3 / 8
- La probabilidad de obtener tres caras ser {CCC} = 1 / 8

Calcular media y desviacin tpica


sacar cara xi

probabilidad pi

xi p i

p i x i2

1/8

3/8

3/8

3/8

3/8

6/8

12/8

1/8

3/8

9/8

1,5

Distribucin binomial

Frmula y caractersticas de la distribucin binomial

Caractersticas

Frmula distribucin binomial

Media, varianza y desviacin tpica de una distribucin binomial

Ejercicios y problemas resueltos de distribucin binomial

Ejercicios y problemas resueltos de distribucin binomial

Ejercicio 1

Ejercicio 2

Ejercicio 3

Ejercicio 4

Variable aleatoria continua, distribucin normal

Caractersticas de una variable aleatoria continua. Distribucin normal,curva


normal o campana de Gauss.

Variable aleatoria continua, definicin y caractersticas

Es aquella que puede tomar infinitos valores dentro de un intervalo de la recta real.

En el caso de una variable aleatoria continua no tiene sentido plantearse


probabilidades de resultados aislados. La probabilidad de valores puntuales es
cero.

El inters de estas probabilidades est en conocer la probabilidad correspondiente a


un intervalo.

Dicha probabilidad se conoce mediante una curva llamada funcin de densidad y


suponiendo que bajo dicha curva hay un rea de una unidad.

Conociendo esta curva, basta calcular el rea correspondiente para conocer la


probabilidad de un intervalo cualquiera.

Distribucin normal, curva normal o campana de Gauss

Tabla de distribucin normal tipificada N(0,1)


Los valores de la tabla normal representan el rea bajo la curva normal hasta
un valor positivo de z.

Manejo de la tabla normal. Casos frecuentes

Ejemplos de uso de la tabla normal. Cuando la variable z es mayor o igual que


un nmero positivo, menor o igual que un nmero negativo, entre dos valores
positivos, clculo de la probabilidad en cada caso. Estudio de los casos ms
frecuentes.

1 Cuando la probabilidad pedida se encuentra directamente en las tablas

Hallar la probabilidad p ( z 0,45 )

En la 1 columna buscamos el valor de las unidades y las dcimas.


En la 1 fila el valor de las centsimas.
Basta buscar 0,4 en la columna y 0,05 en la fila. Su interseccin nos da la
probabilidad.

Leemos y nos da 0,6736. La probabilidad p ( z 0,45 ) = 0,6736

2 Probabilidad de un valor positivo p ( z > 1,24)

En este caso la probabilidad pedida no est en las tablas.


Sin embargo, si tenemos en cuenta que el rea total bajo la grfica ha de ser 1,
deducimos de la figura que:

p (z > 1,24) = 1 p (z 1,24) = 1 0,8925 = 0,1075

3 Probabilidad de un valor negativo p ( z - 0,72 )

Como la grfica es simtrica respecto al eje de ordenadas, p ( z - 0,72 ) = p ( z


+ 0,72 )

Calculamos p ( z + 0,72 ) igual que en el caso 2.

p ( z + 0,72 ) = 1 - p ( z < + 0,72 ) = 1 - 0,7642 = 0,2358

p ( z - 0,72 ) = p ( z + 0,72 )= 1 - p ( z < + 0,72 ) = 1 - 0,7642 = 0,2358

4 Probabilidad entre dos valores positivos p ( 0,5 z 1,76 )

Leemos directamente en la tabla la p ( z 1,76 ) y la p ( z 0,5 ).


La diferencia entre ellas es la probabilidad que nos piden.

p ( 0,5 z 1,76 ) = p ( z 1,76 ) - p ( z 0,5 ) = 0,9608 - 0,6915 = 0,2693

5 Probabilidad entre dos valores negativos p ( - 1,76 z - 0,5 )

Por simetra cambiamos los dos valores negativos a positivos y calculamos sus
probabilidades.

p ( - 1,76 z - 0,5 ) = p ( 0,5 z 1,76 ) = 0,9608 - 0,6915 = 0,2693

Observa que el rea sombreada es la misma que en el caso 4.

6 Probabilidad entre un valor positivo y uno negativo p(- 0,53 z 2,46)

p(- 0,53 z 2,46) = p ( z 2,46) - p ( z - 0,53 )

p ( z - 0,53 ) = p ( z 0,53 ) = 1 - p ( z < 0, 53)= 1 - 0,7019 = 0,2981

p(- 0,53 z 2,46) = p ( z 2,46) - p ( z - 0,53 ) = 0,9931 - 0,2981 = 0,695

Manejo de la tabla de forma inversa

Ejercicios

Ejercicios resueltos distribucin normal

Ejercicios resueltos distribucin normal. Una distribucin normal que no tiene de


media 0 y desviacin tpica 1 debemos tipificar la variable x para poder leer en la
tabla normal N(0,1).

Tipificacin de la variable x

Ejercicios resueltos tipificar la variable x

Pasar una variable x N (8, 3) a una variable tipificada z N(1,0)

Porcentaje de poblacin en los diferentes intervalos simtricos

Para hallar el porcentaje %, hallamos la probabilidad y multiplicamos por 100. Ver


ejercicio 1

Aproximacin de la distribucin binomial a la


normal
Una distribucin binomial variable discreta la podemos aproximar a una normal,
variable continua cuando n es grande.

Distribucin binomial

Problemas aproximar distribucin binomial a


normal

Problemas de la distribucin normal


Problemas de la distribucin normal, tipificacin de la variable, aproximacin de la
binomial a la normal.

1. Un profesor de matemticas ha observado que las notas obtenidas por sus


alumnos en los exmenes de Estadstica siguen una distribucin N (6; 2,5).
Se han presentado al ltimo examen 32 alumnos, cuntos sacaron al menos un
7?

Solucin: 11 alumnos sacaron al menos un 7

2. Una empresa lleva a cabo una prueba para seleccionar nuevos empleados. Por
la experiencia de pruebas anteriores, se sabe que las puntuaciones siguen una
distribucin normal de media 80 y desviacin tpica 25.
Qu porcentaje de candidatos obtendr entre 75 y 100 puntos?.

Solucin: 36,74 %

3. El peso de los toros de una determinada ganadera se distribuye normalmente


con una media de 500 kg y 45 kg de desviacin tpica. Si la ganadera tiene 2000
toros, calcular:

a) Cuntos pesarn ms de 540 kg.


b) Cuntos pesarn menos de 480 kg.
c) Cuntos pesarn entre 490 y 510 kg.

Soluciones:

a) 373 kg b) 660 kg c) 348 kg

4. Una de las pruebas de acceso a la Universidad para mayores de 25 aos


consiste en un test con 100 preguntas, cada una de las cuales tiene 4 posibles
respuestas y slo una correcta. Para superar esta prueba deben obtenerse, al
menos, 30 respuestas correctas.
Si una persona contesta al azar, cul es el nmero esperado de respuestas
correctas?
Qu probabilidad tendr de superar la prueba?.

Ayuda: utiliza la aproximacin de la binomial a travs de la normal para la segunda


pregunta.

Soluciones: 25 respuestas correctas, p = 0,1492

Soluciones: a) 0,7852

b) 0,3446

Tipos de muestreo

Conceptos generales

Estadstica inferencial
La estadstica inferencial se ocupa de extender o extrapolar a toda una poblacin,
informaciones obtenidas de una muestra, as como de la toma de decisiones.

Poblacin
Es el conjunto total de individuos susceptibles de poseer la informacin buscada. No
se refiere exclusivamente a personas, la poblacin puede estar formada por todos
los rboles de un bosque.

Muestra
Es la parte de la poblacin en la que se miden las caractersticas estudiadas.
El nmero de individuos de la muestra se llama tamao de la muestra.

Muestreo
Es el proceso seguido para la extraccin de una muestra.

Encuesta
Es el proceso de obtener la informacin buscada entre los elementos de la
muestra.

Tipos de muestreo

No aleatorios
Se eligen los elementos, en funcin de que sean representativos, segn la opinin
del investigador.

Aleatorios
Todos los miembros de la muestra han sido elegidos al azar, de forma que cada
miembro de la poblacin tuvo igual oportunidad de salir en la muestra.

Simple
Elegido el tamao de la muestra, los elementos que la compongan se han de
elegir aleatoriamente
entre los N de la poblacin.
Con calculadora: se utilizan los nmeros aleatorios

Sistemtico
Se ordenan previamente los individuos de la poblacin; despus se elige uno de
ellos al azar,
a continuacin, a intervalos constantes, se eligen todos los dems hasta
completar la muestra.

Estratificado
Se divide la poblacin total en clases homogneas, llamadas estratos; por
ejemplo, por grupos de
edades, por sexo. Hecho esto la muestra se escoge aleatoriamente en nmero
proporcional al de
los componentes de cada clase o estrato.

Distribucin de medias muestrales

Frmulas poblacin y muestra

Intervalo de probabilidad de medias muestrales

Niveles de confianza y probabilidad en porcentaje

Intervalo de probabilidad para la media muestral

Ejemplos

Intervalo de probabilidad para proporciones

Distribucin para proporciones

Intervalo de probabilidad para la proporcin muestral

Estimacin de la poblacin desde una muestra

Estimacin

Lo habitual es que se desconozca la media y la desviacin tpica de la poblacin,


vamos a estimar estos parmetros en funcin de una muestra .
Si desconocemos la desviacin tpica de la poblacin, utilizamos la desviacin tpica
de la muestra.
Vamos a calcular el intervalo de confianza para la media poblacional, error
mximo admitido y tamao de la muestra.

Intervalo de confianza, error y tamao de la muestra

Contraste de hiptesis

Contraste de hiptesis sobre la media poblacional, ver si la media poblacional


pertenece al intervalo de la media muestral o no. Pueden ser unilaterales y
bilaterales.

Contraste de hiptesis bilaterales

Contraste de hiptesis unilaterales

Proporciones: estimacin y contraste de hiptesis

Estimacin para proporciones: intervalo de confianza

Ejemplos de intervalo de confianza para proporciones

Contraste de hiptesis

El contraste de hiptesis para proporciones consiste en ver si la proporcin muestral


pertenece a la zona de aceptacin o no. Pueden ser unilaterales y bilaterales.

Problemas resueltos de muestreo y estimacin

You might also like