o Salom Gonzlez Diana Fabiola o Ziga Muoz Ricardo Alejandro
Probabilidad y Estadstica Guadalupe Pinette Medina La teora de la probabilidad se usa extensamente en reas como la estadstica, la fsica, la matemtica, las ciencias y la filosofa para sacar conclusiones sobre la probabilidad discreta de sucesos potenciales y la mecnica subyacente discreta de sistemas complejos, por lo tanto es la rama de las matemticas que estudia, mide o determina a los experimentos o fenmenos aleatorios. La tarea de describir y procesar de modo adecuado la masa de datos, provenientes de las observaciones y experimentos, es el objeto de la Estadstica descriptiva. En el presente trabajo se presenta una comparacin entre las reservas petroleras de tres potencias a nivel mundial, donde ocupamos registros desde el ao 1980 hasta 1999. Se podrn observar las variaciones de stos en los diferentes aos y describir cmo varan respecto a los otros pases. As como las distribuciones aplicadas a distintos temas de la probabilidad y estadstica. El objetivo de este proyecto es proporcionar datos anuales histricos precisos, confiables y actualizados sobre la industria petrolera. Nuestro compromiso es ofrecer una amplia gama de datos estadsticos detallados y bien documentados del pasado, estamos seguros de que usted encontrar esta publicacin a la vez til e informativo.
Estamos proporcionando los datos de tres pases diferentes, esos pases son Arabia Saudita, Estados Unidos y Mxico, y son potencias mundiales del petrleo. Nosotros los elegimos porque, como sabemos, Arabia Saud ha sufrido un gran desarrollo desde que comenzaron a explotar sus reservas de petrleo. As que elegimos porque EE.UU. es el pas vecino y es nuestro mayor comprador de petrleo. Finalmente tomamos Mxico porque es nuestro pas y como ingenieros de petrleo que estamos interesados en estos datos.
En este anlisis estamos comparando los datos de los pases, mediante el uso de las funciones de distribucin de probabilidad y estadstica descriptiva. Como prueba de hiptesis e intervalos de confianza.
Fuente GL SC MC F P Factor 2 3753789504 1876894752 10.39 0.000 Error 57 10300528846 180711032 Total 59 14054318350
S = 13443 R-cuad. = 26.71% R-cuad.(ajustado) = 24.14% ICs de 95% individuales para la media basados en Desv.Est. agrupada Nivel N Media Desv.Est. -------+---------+---------+---------+-- MXICO 20 40815 9865 (-------*-------) ARABIA 20 60009 15672 (-------*------- ) ESTADOS UNIDOS 20 52696 14114 (-------*------) -------+---------+---------+---------+-- 40000 48000 56000 64000
Desv.Est. agrupada = 13443
Este anlisis de varianza (ANOVA), donde los intervalos de confianza corresponden al 90% se muestra cmo los intervalos de confianza de Arabia Saudita y Estados Unidos logran intersectar, mientras que los intervalos correspondientes a Mxico se encuentran alejados, pues la media basada en la desviacin estndar de este pas es menor en comparacin a los dos primeros pases mencionados. 50000 25000 0 -25000 -50000 99.9 99 95 90 80 70 60 50 40 30 20 10 5 1 0.1 Residuo P o r c e n t a j e Grfica de probabilidad normal 90% (las respuestas son MXICO, ARABIA, ESTADOS UNIDOS) En esta grfica de distribucin normal, por la forma en la que se encuentran los datos de los tres pases estudiados, se puede decir que s corresponden a este tipo de distribucin pues estn cercanos a la lnea normal. ESTADOS UNIDOS ARABIA MXICO 80000 70000 60000 50000 40000 30000 20000 10000 D a t o s Grfica de caja de MXICO, ARABIA, ESTADOS UNIDOS 90% El grfico anterior de Cajas correspondiente a los datos de reservas petroleras de Mxico, Arabia Saudita y Estados Unidos muestra las medias de cada uno de estos pases, as como los bigotes muestran los valores mximos y mnimos, donde podemos apreciar unos asteriscos, stos denotan que los datos manejados son de cifras muy grandes. Mientras que en el diagrama de cajas de Estados Unidos y Mxico observamos que los datos se encuentran distribuidos uniformemente antes y despus de la media, en cambio, en el grfico de Arabia, se observa que los datos tienden a pasar la media. Fuente GL SC MC F P Factor 2 3753789504 1876894752 10.39 0.000 Error 57 10300528846 180711032 Total 59 14054318350
S = 13443 R-cuad. = 26.71% R-cuad.(ajustado) = 24.14% ICs de 95% individuales para la media basados en Desv.Est. agrupada Nivel N Media Desv.Est. -------+---------+---------+---------+-- MXICO 20 40815 9865 (-------*-------) ARABIA 20 60009 15672 (-------*------- ) ESTADOS UNIDOS 20 52696 14114 (-------*------) -------+---------+---------+---------+-- 40000 48000 56000 64000
Desv.Est. agrupada = 13443
El ANOVA correspondiente a intervalos de confianza al 95% muestran intervalos un poco ms amplios, sin embargo, Arabia Saudita y Estados Unidos coinciden nuevamente, mientras Mxico al poseer, de igual forma un intervalo ligeramente ms amplio, logra acercarse al intervalo de EEUU. 50000 25000 0 -25000 -50000 99.9 99 95 90 80 70 60 50 40 30 20 10 5 1 0.1 Residuo P o r c e n t a j e Grfica de probabilidad normal 95% (las respuestas son MXICO, ARABIA, ESTADOS UNIDOS) Este grfico de distribucin normal al 95% de datos de reservas petroleras de tres pases muestra cmo stos se asemejan a este tipo de distribucin estando cercanos a la lnea normal. ESTADOS UNIDOS ARABIA MXICO 80000 70000 60000 50000 40000 30000 20000 10000 D a t o s Grfica de caja de MXICO, ARABIA, ESTADOS UNIDOS 95% El grfico anterior corresponde a los diagramas de cajas individuales de los pases elegidos en este proyecto. De manera general se puede observar que la distribucin de Arabia Saudita no es simtrica respecto a los diagramas de caja de Mxico y EEUU. Fuente GL SC MC F P Factor 2 3753789504 1876894752 10.39 0.000 Error 57 10300528846 180711032 Total 59 14054318350
S = 13443 R-cuad. = 26.71% R-cuad.(ajustado) = 24.14% ICs de 99% individuales para la media basados en Desv.Est. agrupada Nivel N Media Desv.Est. -------+---------+---------+---------+-- MXICO 20 40815 9865 (-------*-------) ARABIA 20 60009 15672 (-------*-------) ESTADOS UNIDOS 20 52696 14114 (-------*-------) -------+---------+---------+---------+-- 40000 50000 60000 70000
Desv.Est. agrupada = 13443
Este ANOVA con intervalos de confianza al 99% muestra intervalos ligeramente ms amplios a los anteriores, donde ya se observa a simple vista cmo logran intersectarse los intervalos de los tres pases. 50000 25000 0 -25000 -50000 99.9 99 95 90 80 70 60 50 40 30 20 10 5 1 0.1 Residuo P o r c e n t a j e Grfica de probabilidad normal 99% (las respuestas son MXICO, ARABIA, ESTADOS UNIDOS) Este grfico de distribucin normal al 99% revela que los datos correspondientes de reservas petroleras de cada pas, s obedecen a una distribucin normal. ESTADOS UNIDOS ARABIA MXICO 80000 70000 60000 50000 40000 30000 20000 10000 D a t o s Grfica de caja de MXICO, ARABIA, ESTADOS UNIDOS 95%
El grfico de cajas correspondiente al 99% indica la aparente simetra entre los datos de Mxico y Arabia Saudita, mientras que, a juzgar por la forma de la caja perteneciente a Arabia Saudita no sigue una distribucin simtrica.
La Estadstica descriptiva registra los datos en tablas y los representa en grficos. Calcula los parmetros estadsticos (medidas de centralizacin y de dispersin), que describen el conjunto estudiado.
La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente. En est grfica de pastel se muestra la distribucin de la frecuencia porcentual de las cantidades de reservas de petrleo en Mxico, se puede observar de manera ms sencilla cmo los intervalos de 43,000-46,000 y 46,000-50,000 millones de barriles son los que ocupan la mayor parte del grfico, ya que son los que ms se repiten. Las reservas entre 43,000-46,000 y 46,000-50,000 millones de barriles son las que ms frecuencia tienen. En esta grfica se muestra la repeticin de los intervalos de manera general. Las reservas entre 43,000-46,000 y 46,000-50,000 millones de barriles son las que ms frecuencia tienen. En grfica se muestra la frecuencia relativa. Las reservas entre 43,000-46,000 y 46,000-50,000 millones de barriles son las que ms frecuencia tienen. En grfica se muestra la frecuencia porcentual. En ste grfico de puntos se puede observar cmo se comportan los datos recaudados, se nota muy fcilmente cmo de 1984 a 1998, las cantidades de reservas se encontraban en un nivel cercano. 50000 40000 30000 20000 10000 D a t o s Grfica de caja de MXICO sta grfica de cajas nos muestra cmo estn distribuidos los datos con respecto a la media de la muestra, podemos observar que las cajas estn equilibradas por debajo y encima de la media, lo que nos indica que los datos estn distribuidos de manera simtrica. En sta grfica se muestra de manera ms dinmica la distribucin porcentual de los datos, y se aprecia muy claramente cmo los intervalos de 55,000-60,000 y 60,000-75,000 millones de barriles tienen una considerable diferencia en repeticin con respecto a los otros dos intervalos. Se exhiben las diferencias en los intervalos de las reservas de petrleo en Arabia Saudita. Se puede observar cmo la cantidad de 65,000-80,000 millones de barriles es la que ms se repite, estando presente 7 veces en los datos, esto es lo que nos muestra la grfica de frecuencia. En grfica se muestra la frecuencia relativa de las reservas de petrleo de Arabia Saudita. Se exhiben las diferencias en los intervalos de las reservas de petrleo en Arabia Saudita. Se puede observar cmo la cantidad de 65,000-80,000 millones de barriles es la que ms se repite nos muestra el porcentaje de cada uno de los intervalos de datos. La anterior grfica de puntos nos muestra cmo se han comportado las reservas de petrleo de Arabia Saudita en los aos 1980 a 1999. Se puede observar cmo se van elevando los puntos en el grfico, por lo cual podemos inferir que su produccin es mayor que su consumo de petrleo, ya que las reservas van en aumento. 80000 70000 60000 50000 40000 30000 20000 10000 D a t o s Grfica de caja de ARABIA La grfica de cajas de las reservas de petrleo en Arabia Saudita, podemos apreciar cmo es un poco ms grande el tercer y cuarto cuartil, por lo que inferimos que existen ms datos por encima de la media. Y aunque esto pase, los datos no muestran una separacin significativa. En sta grfica de pastel podemos apreciar cmo se comportan los porcentajes de los datos de las reservas de petrleo en Estados Unidos, se observa que los intervalos que ms ocupan espacio son los de 55,000-60,000 y 40,000-55,000 millones de barriles.
Se puede observar cmo se comportan los intervalos de las reservas de petrleo de Estados Unidos en cuanto a su repeticin, podemos apreciar cmo el intervalo de 40,000-55,000 millones de barriles, es el que ms se repite, y antes de l, se encuentra el intervalos de 55,000- 60,000 millones de barriles. Esta grafica hace representacin a la frecuencia de las reservas de petrleo de los ltimos aos.
Se observa cmo se comportan los intervalos de las reservas de petrleo de Estados Unidos. En la grfica se puede apreciar la frecuencia relativa. Se exhiben las diferencias en los intervalos de las reservas de petrleo en Estados Unidos. Se puede observar cmo la cantidad de 40,000-55,000 millones de barriles es la que ms se repite nos muestra el porcentaje de cada uno de los intervalos de datos. En este grfico de puntos podemos observar el comportamiento de las reservas de petrleo en Estados Unidos de 1980 a 1999. Se puede apreciar que los datos tienen un comportamiento uniforme, por lo que varan mucho los puntos en la tabla. 70000 60000 50000 40000 30000 20000 10000 D a t o s Grfica de caja de ESTADOS UNIDOS Nuestra grfica de cajas muestra de manera muy clara cmo el ltimo cuartil est ms alejado de la media muestral, por lo que inferimos que hay cierta cantidad de datos que estn ms alejados del resto.
Durante este proyecto y en base a los conocimientos obtenidos del curso, realizamos el anlisis de varianza que permite realizar la prueba de hiptesis para determinar si dos varianzas muestrales provienen de proporciones iguales, as como organizar los datos en la tabla de ANOVA desarrollando intervalos de confianza para la diferencia entre las medias de tratamiento. La tcnica del Anlisis de la Varianza consiste en descomponer la variabilidad de una poblacin (representada por su varianza) en diversos sumandos segn los factores que intervengan en la creacin de esa variabilidad.
De la misma manera, con la distribucin F de Fisher pudimos probar si dos muestras provienen de poblaciones que poseen varianzas iguales, determinndola por dos parmetros: grados de libertad en el numerador y denominador.
Por otra parte, con la estadstica descriptiva pudimos ver en qu medida los datos se agrupan o dispersan en torno a un valor central.