You are on page 1of 34

o Clara Lara Aldo Eduardo

o Figarola Ledesma Fryn


o Salom Gonzlez Diana Fabiola
o Ziga Muoz Ricardo Alejandro

Probabilidad y Estadstica
Guadalupe Pinette Medina
La teora de la probabilidad se usa extensamente en reas como la estadstica, la
fsica, la matemtica, las ciencias y la filosofa para sacar conclusiones sobre la
probabilidad discreta de sucesos potenciales y la mecnica subyacente discreta
de sistemas complejos, por lo tanto es la rama de las matemticas que estudia,
mide o determina a los experimentos o fenmenos aleatorios.
La tarea de describir y procesar de modo adecuado la masa de datos,
provenientes de las observaciones y experimentos, es el objeto de la Estadstica
descriptiva.
En el presente trabajo se presenta una comparacin entre las reservas petroleras
de tres potencias a nivel mundial, donde ocupamos registros desde el ao 1980
hasta 1999. Se podrn observar las variaciones de stos en los diferentes aos y
describir cmo varan respecto a los otros pases. As como las distribuciones
aplicadas a distintos temas de la probabilidad y estadstica.
El objetivo de este proyecto es proporcionar datos anuales
histricos precisos, confiables y actualizados sobre la industria
petrolera. Nuestro compromiso es ofrecer una amplia gama de
datos estadsticos detallados y bien documentados del pasado,
estamos seguros de que usted encontrar esta publicacin a la vez
til e informativo.

Estamos proporcionando los datos de tres pases diferentes, esos
pases son Arabia Saudita, Estados Unidos y Mxico, y son potencias
mundiales del petrleo. Nosotros los elegimos porque, como
sabemos, Arabia Saud ha sufrido un gran desarrollo desde que
comenzaron a explotar sus reservas de petrleo. As que elegimos
porque EE.UU. es el pas vecino y es nuestro mayor comprador de
petrleo. Finalmente tomamos Mxico porque es nuestro pas y
como ingenieros de petrleo que estamos interesados en estos
datos.

En este anlisis estamos comparando los datos de los pases,
mediante el uso de las funciones de distribucin de probabilidad y
estadstica descriptiva. Como prueba de hiptesis e intervalos de
confianza.

Fuente GL SC MC F P
Factor 2 3753789504 1876894752 10.39 0.000
Error 57 10300528846 180711032
Total 59 14054318350

S = 13443 R-cuad. = 26.71% R-cuad.(ajustado) = 24.14%
ICs de 95% individuales para la media
basados en Desv.Est. agrupada
Nivel N Media Desv.Est. -------+---------+---------+---------+--
MXICO 20 40815 9865 (-------*-------)
ARABIA 20 60009 15672 (-------*-------
)
ESTADOS UNIDOS 20 52696 14114 (-------*------)
-------+---------+---------+---------+--
40000 48000 56000 64000

Desv.Est. agrupada = 13443

Este anlisis de varianza (ANOVA), donde los intervalos de confianza corresponden al 90% se muestra
cmo los intervalos de confianza de Arabia Saudita y Estados Unidos logran intersectar, mientras que los
intervalos correspondientes a Mxico se encuentran alejados, pues la media basada en la desviacin
estndar de este pas es menor en comparacin a los dos primeros pases mencionados.
50000 25000 0 -25000 -50000
99.9
99
95
90
80
70
60
50
40
30
20
10
5
1
0.1
Residuo
P
o
r
c
e
n
t
a
j
e
Grfica de probabilidad normal 90%
(las respuestas son MXICO, ARABIA, ESTADOS UNIDOS)
En esta grfica de distribucin normal, por la forma en la que se encuentran los datos de los tres
pases estudiados, se puede decir que s corresponden a este tipo de distribucin pues estn
cercanos a la lnea normal.
ESTADOS UNIDOS ARABIA MXICO
80000
70000
60000
50000
40000
30000
20000
10000
D
a
t
o
s
Grfica de caja de MXICO, ARABIA, ESTADOS UNIDOS 90%
El grfico anterior de Cajas correspondiente a los datos de reservas petroleras de Mxico, Arabia Saudita y Estados Unidos
muestra las medias de cada uno de estos pases, as como los bigotes muestran los valores mximos y mnimos, donde
podemos apreciar unos asteriscos, stos denotan que los datos manejados son de cifras muy grandes. Mientras que en el
diagrama de cajas de Estados Unidos y Mxico observamos que los datos se encuentran distribuidos uniformemente antes y
despus de la media, en cambio, en el grfico de Arabia, se observa que los datos tienden a pasar la media.
Fuente GL SC MC F P
Factor 2 3753789504 1876894752 10.39 0.000
Error 57 10300528846 180711032
Total 59 14054318350

S = 13443 R-cuad. = 26.71% R-cuad.(ajustado) = 24.14%
ICs de 95% individuales para la media
basados en Desv.Est. agrupada
Nivel N Media Desv.Est. -------+---------+---------+---------+--
MXICO 20 40815 9865 (-------*-------)
ARABIA 20 60009 15672 (-------*-------
)
ESTADOS UNIDOS 20 52696 14114 (-------*------)
-------+---------+---------+---------+--
40000 48000 56000 64000

Desv.Est. agrupada = 13443

El ANOVA correspondiente a intervalos de confianza al 95% muestran intervalos un poco ms amplios, sin
embargo, Arabia Saudita y Estados Unidos coinciden nuevamente, mientras Mxico al poseer, de igual
forma un intervalo ligeramente ms amplio, logra acercarse al intervalo de EEUU.
50000 25000 0 -25000 -50000
99.9
99
95
90
80
70
60
50
40
30
20
10
5
1
0.1
Residuo
P
o
r
c
e
n
t
a
j
e
Grfica de probabilidad normal 95%
(las respuestas son MXICO, ARABIA, ESTADOS UNIDOS)
Este grfico de distribucin normal al 95% de datos de reservas petroleras de tres pases
muestra cmo stos se asemejan a este tipo de distribucin estando cercanos a la lnea normal.
ESTADOS UNIDOS ARABIA MXICO
80000
70000
60000
50000
40000
30000
20000
10000
D
a
t
o
s
Grfica de caja de MXICO, ARABIA, ESTADOS UNIDOS 95%
El grfico anterior corresponde a los diagramas de cajas individuales de los pases elegidos en
este proyecto. De manera general se puede observar que la distribucin de Arabia Saudita no es
simtrica respecto a los diagramas de caja de Mxico y EEUU.
Fuente GL SC MC F P
Factor 2 3753789504 1876894752 10.39 0.000
Error 57 10300528846 180711032
Total 59 14054318350

S = 13443 R-cuad. = 26.71% R-cuad.(ajustado) = 24.14%
ICs de 99% individuales para la media
basados en Desv.Est. agrupada
Nivel N Media Desv.Est. -------+---------+---------+---------+--
MXICO 20 40815 9865 (-------*-------)
ARABIA 20 60009 15672 (-------*-------)
ESTADOS UNIDOS 20 52696 14114 (-------*-------)
-------+---------+---------+---------+--
40000 50000 60000 70000

Desv.Est. agrupada = 13443

Este ANOVA con intervalos de confianza al 99% muestra intervalos ligeramente ms amplios a los
anteriores, donde ya se observa a simple vista cmo logran intersectarse los intervalos de los tres pases.
50000 25000 0 -25000 -50000
99.9
99
95
90
80
70
60
50
40
30
20
10
5
1
0.1
Residuo
P
o
r
c
e
n
t
a
j
e
Grfica de probabilidad normal 99%
(las respuestas son MXICO, ARABIA, ESTADOS UNIDOS)
Este grfico de distribucin normal al 99% revela que los datos correspondientes de reservas
petroleras de cada pas, s obedecen a una distribucin normal.
ESTADOS UNIDOS ARABIA MXICO
80000
70000
60000
50000
40000
30000
20000
10000
D
a
t
o
s
Grfica de caja de MXICO, ARABIA, ESTADOS UNIDOS 95%



El grfico de cajas correspondiente al 99% indica la aparente simetra entre los datos de Mxico
y Arabia Saudita, mientras que, a juzgar por la forma de la caja perteneciente a Arabia Saudita
no sigue una distribucin simtrica.


La Estadstica descriptiva registra los datos en
tablas y los representa en grficos. Calcula los
parmetros estadsticos (medidas de
centralizacin y de dispersin), que describen el
conjunto estudiado.

La distribucin de frecuencias o tabla de
frecuencias es una ordenacin en forma de tabla
de los datos estadsticos, asignando a cada dato su
frecuencia correspondiente.
En est grfica de pastel se muestra la distribucin de la frecuencia porcentual de las cantidades
de reservas de petrleo en Mxico, se puede observar de manera ms sencilla cmo los
intervalos de 43,000-46,000 y 46,000-50,000 millones de barriles son los que ocupan la mayor
parte del grfico, ya que son los que ms se repiten.
Las reservas entre 43,000-46,000 y 46,000-50,000 millones de barriles son las que ms
frecuencia tienen. En esta grfica se muestra la repeticin de los intervalos de manera general.
Las reservas entre 43,000-46,000 y 46,000-50,000 millones de barriles son las que ms
frecuencia tienen. En grfica se muestra la frecuencia relativa.
Las reservas entre 43,000-46,000 y 46,000-50,000 millones de barriles son las que ms
frecuencia tienen. En grfica se muestra la frecuencia porcentual.
En ste grfico de puntos se puede observar cmo se comportan los datos recaudados, se nota
muy fcilmente cmo de 1984 a 1998, las cantidades de reservas se encontraban en un nivel
cercano.
50000
40000
30000
20000
10000
D
a
t
o
s
Grfica de caja de MXICO
sta grfica de cajas nos muestra cmo estn distribuidos los datos con respecto a la media de la
muestra, podemos observar que las cajas estn equilibradas por debajo y encima de la media, lo
que nos indica que los datos estn distribuidos de manera simtrica.
En sta grfica se muestra de manera ms dinmica la distribucin porcentual de los datos, y se
aprecia muy claramente cmo los intervalos de 55,000-60,000 y 60,000-75,000 millones de
barriles tienen una considerable diferencia en repeticin con respecto a los otros dos intervalos.
Se exhiben las diferencias en los intervalos de las reservas de petrleo en Arabia Saudita. Se
puede observar cmo la cantidad de 65,000-80,000 millones de barriles es la que ms se repite,
estando presente 7 veces en los datos, esto es lo que nos muestra la grfica de frecuencia.
En grfica se muestra la frecuencia relativa de las reservas de petrleo de Arabia Saudita.
Se exhiben las diferencias en los intervalos de las reservas de petrleo en Arabia Saudita. Se
puede observar cmo la cantidad de 65,000-80,000 millones de barriles es la que ms se repite
nos muestra el porcentaje de cada uno de los intervalos de datos.
La anterior grfica de puntos nos muestra cmo se han comportado las reservas de petrleo de
Arabia Saudita en los aos 1980 a 1999. Se puede observar cmo se van elevando los puntos en
el grfico, por lo cual podemos inferir que su produccin es mayor que su consumo de petrleo,
ya que las reservas van en aumento.
80000
70000
60000
50000
40000
30000
20000
10000
D
a
t
o
s
Grfica de caja de ARABIA
La grfica de cajas de las reservas de petrleo en Arabia Saudita, podemos apreciar cmo es un
poco ms grande el tercer y cuarto cuartil, por lo que inferimos que existen ms datos por
encima de la media. Y aunque esto pase, los datos no muestran una separacin significativa.
En sta grfica de pastel podemos apreciar cmo se comportan los porcentajes de los datos de
las reservas de petrleo en Estados Unidos, se observa que los intervalos que ms ocupan
espacio son los de 55,000-60,000 y 40,000-55,000 millones de barriles.


Se puede observar cmo se comportan los intervalos de las reservas de petrleo de Estados
Unidos en cuanto a su repeticin, podemos apreciar cmo el intervalo de 40,000-55,000
millones de barriles, es el que ms se repite, y antes de l, se encuentra el intervalos de 55,000-
60,000 millones de barriles. Esta grafica hace representacin a la frecuencia de las reservas de
petrleo de los ltimos aos.

Se observa cmo se comportan los intervalos de las reservas de petrleo
de Estados Unidos. En la grfica se puede apreciar la frecuencia relativa.
Se exhiben las diferencias en los intervalos de las reservas de petrleo en Estados Unidos. Se
puede observar cmo la cantidad de 40,000-55,000 millones de barriles es la que ms se repite
nos muestra el porcentaje de cada uno de los intervalos de datos.
En este grfico de puntos podemos observar el comportamiento de las reservas de petrleo en
Estados Unidos de 1980 a 1999. Se puede apreciar que los datos tienen un comportamiento
uniforme, por lo que varan mucho los puntos en la tabla.
70000
60000
50000
40000
30000
20000
10000
D
a
t
o
s
Grfica de caja de ESTADOS UNIDOS
Nuestra grfica de cajas muestra de manera muy clara cmo el ltimo
cuartil est ms alejado de la media muestral, por lo que inferimos que hay
cierta cantidad de datos que estn ms alejados del resto.

Durante este proyecto y en base a los conocimientos obtenidos del curso,
realizamos el anlisis de varianza que permite realizar la prueba de hiptesis
para determinar si dos varianzas muestrales provienen de proporciones iguales,
as como organizar los datos en la tabla de ANOVA desarrollando intervalos de
confianza para la diferencia entre las medias de tratamiento. La tcnica del
Anlisis de la Varianza consiste en descomponer la variabilidad de una poblacin
(representada por su varianza) en diversos sumandos segn los factores que
intervengan en la creacin de esa variabilidad.

De la misma manera, con la distribucin F de Fisher pudimos probar si dos
muestras provienen de poblaciones que poseen varianzas iguales,
determinndola por dos parmetros: grados de libertad en el numerador y
denominador.

Por otra parte, con la estadstica descriptiva pudimos ver en qu medida los
datos se agrupan o dispersan en torno a un valor central.

You might also like