You are on page 1of 20

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

TALLER 1 DE ESTADISTICA 1
Efran Sampedro Montoya

1. Genere 50 datos de una distribucin uniforme (0,1), calcule la media y la varianza muestral

R/ Una distribucin uniforme tiene como parmetros un valor mnimo y mximo, en este caso (0,1) lo que representa a y b respectivamente, as que se procede a llenar los campos correspondientes con estos valores en R para generar dicha muestra aleatoria de distribucin uniforme, la cual a su vez arrojo:

Comentario: lo que era de esperarse, la media para una distribucin uniforme (0,1)
es 0.5, valor al que es muy aproximado la media que hallamos; mientras que la varianza

Es igual a 1/12= 0.083

Lo cual es muy prximo al valor de la varianza que hallamos: 0.078

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

2.

Repita el proceso anterior 1000 veces y guarde en una matriz. En la primera columna las medias y en la segunda las varianzas

R/ este punto se hace totalmente en R y es un poco intil e ineficiente guardar una matriz de 1000 filas para pegarla en Word; no obstante, dichas medias y varianzas las tendremos en cuenta en la solucin del tercer punto para poder elaborar el histograma

3. Elabore un histograma para las medias y para las varianzas. Comente acerca de la forma de dichos grficos

R/ el color verde ser para las grficas de medias, mientras que las azules sern para las varianzas GRAFICA DE LAS MEDIAS

Porcentaje

Medias

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

Esta grafica era de esperarse, pues la grfica de medias tiene una grfica aproximadamente normal donde hay mayor concentracin de medias alrededor de la media 0.5, es decir, los datos tienden a 0.5, o sea, se comprueba que:

GRAFICA DE VARIANZAS

Porcentaje

Varianzas

Esta grafica es la correspondiente a la de varianzas, pero que pasa?, observamos que tiene la forma aproximada de una distribucin normal; aunque supuestamente la ( ), hay que tener en grfica de varianzas equivale a una grafica cuenta que para dicha grafica estamos tomando 1000 muestras, lo que es una muestra grande, y cuando una muestra tiende al infinito o es muy grande, su respectiva grafica tiende a una forma aproximadamente normal; segn convencionalismos, una muestra se considera grande cuando n>30. Tambin podemos observar que todos los valores tienden a 0.083, es decir, la media de las varianzas es la varianza

4. Usando la matriz calculada en el punto 2, calcule la proporcin de medias inferiores a la media ms 0.1 veces la desviacin estndar, explique el procedimiento usado

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

R/ como ya habamos dicho, la media de una distribucin uniforme (0,1) es la media de una distribucin muestral es

Como tambin ya habamos dicho, la varianza para una distribucin uniforme (0,1) es aproximadamente

Pero la varianza para la distribucin muestral de la media es

Como son 1000 muestras, Ahora la ecuacin anterior se convierte en

Ahora la desviacin estndar de la distribucin muestral de la media es:

Ahora el planteamiento del ejercicio nos preguntaban por la media ms 0.1 veces la desviacin estndar, o equivalentemente

Ya lo que tenemos que calcular es la proporcin de medias que sean inferiores a C, asi que crearemos una nueva variable en la tabla de datos en el software estadstico R, de la siguiente manera

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

Lo que nos dar en las filas correspondientes a la columna C, unos datos: True o False (verdad o mentira), lo que nos esta diciendo si cumple o no con la condicin Ahora hacemos un resumen del conjunto de datos activo y optemos para la columna C lo siguiente

Con estos datos podemos encontrar dicha proporcin. La proporcin de medias inferiores a C, o sea los valores que cumplen con la condicin, es decir los True es 479 datos de 1000 datos

5. Use el teorema central del lmite para responder a la pregunta del numeral 4. Compare sus resultados. Qu observa?

R/ El teorema central del lmite bsicamente dice que un gran nmero de observaciones o de muestras se distribuyen aproximadamente normal, lo cual es cierto y lo comprobamos con la grfica de la varianza. Pero volviendo a la grfica de las medias mustrales de 1000 muestras de distribucin uniforme obtuvimos una grfica

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

normal, o sea la distribucin de las medias mustrales se comportan con una distribucin normal. Por lo anterior dicha proporcin la podemos calcular como una probabilidad de una distribucin normal. ( ( ) ( ) )

Elegimos cola izquierda ya que calcularemos la proporcin de medias inferiores de dicho valor

Es decir, segn el teorema central del lmite datos sern inferiores al valor de C

. Aproximadamente 539

Al comparar los dos resultados 479 y 539 veo que no hay un rango muy alto; sin embargo, a mi parecer, lo considero grande; pero son aproximados para una muestra tan grande No obstante, observando ms a fondo me di cuenta que el complemento de la primer proporcin hallada [( ) )] esta mucho ms cerca de

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

parecerse al dato hallado mediante el teorema central del lmite: 539, con un rango mucho ms pequeo (521 Vs 539). Pero a lo cual no le encuentro sentido ya que esta como comparando una cola derecha con otra izquierda, o ms exactamente, los valores que son mayores a C con los que son menores. La verdad no le encuentro explicacin a esta similitud, quizs ser coincidencia, o el redondeo de las cifras que tienden a alterar un poco los resultados

PARTE B
1. Un diseador de productos est interesado en reducir el tiempo de secado de una pintura para tapar poros. Se prueban dos frmulas distintas: la frmula 1 tiene un ingrediente estndar, mientras la frmula 2 tiene un ingrediente que espera reduzca el tiempo de secado

R/ lo siguiente es la tabla de datos para el primer ejercicio de la parte b

El primer pedazo en rojo del siguiente pantallazo nos muestra unos datos generalizados para la variable tiempo e ingrediente. No obstante, no son de gran utilidad ya que realiza los clculos para la variable tiempo sin ningn tipo de segmentacin, es decir, no tomo en cuenta a que formula pertenece. Pero uno de los

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

datos que si nos son de utilidad, so el valor mi nio y mximo, que nos indica un intervalo de tiempo de secado sin importar que tipo de formula utilizamos Los segundos datos nos son de mucha utilidad, pues est segmentando la informacin segn su tipo de ingrediente, as que nos resulta mucho ms fcil para poder comparar y determinar cul de los dos ingredientes es ms efectivo, en dicha informacin podemos observar, la media, le desviacin, los cuartiles y el nmero de observaciones para cada formula. Comparando las medias, nos damos cuenta que en promedio, se demora menos tiempo en secarse la pintura si se utiliza la frmula 2, no obstante, esta presenta una desviacin tpica mayor, lo que representa un poco ms de variabilidad de los datos con respecto a la media; no obstante, no es muy grande la diferencia de la desviacin entre las dos frmulas. Y los cuartiles nos dan como una especie de ubicacin de cuanto porcentaje de observaciones se sec en menos de un tiempo determinado, as pues, podemos observar que en todos los cuartiles la frmula 2 presento un menor tiempo de secado; por ejemplo: el 75% de las muestras de la frmula 2 se secaran en un tiempo menor 114.92, mientras que los de formula1 lo hicieron en un tiempo menor o igual a 121.46

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

El diagrama de caja nos muestra de una manera ms fcil de visualizar y de entender la anterior informacin y con la posibilidad de compararlos. Aunque como ya se haba dicho antes, la frmula 2 tiene mayor variabilidad, por lo general todos sus datos de los tiempo son menores que los de la frmula 1 As que podemos concluir que el diseador debe de elegir la frmula 2 para poder reducir el tiempo de secado en que una pintura se demora para tapar los poros. Por lo tanto, el ingrediente de la frmula 2 cumpli con las expectativas de reducir el tiempo de secado

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

2. Se tiene inters en determinar la forma en que dos catalizadores afectan el rendimiento promedio de un proceso qumico. Ambos catalizadores son aceptables, pero el catalizador 2 es un poco ms econmico

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

R/ lo siguiente es la tabla de datos para el ejercicio

Los primeros datos summary nos muestra unos datos generalizados de las variables de la tabla de datos, nos da a conocer que existen 15 datos o pruebas para el catalizador 1, mientras que para el catalizador 2 solo hay 13 datos o pruebas. Tambin nos da un intervalo mnimo y mximo (85.3698.70), en este intervalo se espera estn los datos de las pruebas posteriores sin importar que tipo de catalizador se elija

Los segundos datos numsumary nos muestra una informacin segmentada por el tipo de catalizador lo que hace ms fcil comparar los dos tipos de catalizadores. Nos damos cuenta

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

que existe un mayor rendimiento promedio para el catalizador 2 y con una desviacin tpica o estndar menor y por ende menor variabilidad; de igual forma, los cuartiles nos muestra que porcentaje de datos se encuentran con un rendimiento menor o igual a su valor correspondiente, donde el catalizador 2 para todos los cuartiles supera al catalizador 1. Pero tambin hay que tener en cuenta que para el catalizador1 se hicieron un mayor nmero de pruebas, pero en este caso no es muy relevante

Los siguientes datos round nos muestra la proporcin de datos con respecto al tipo de catalizador: 1 2. As se obtiene que el 53.57% de los datos corresponden a pruebas con el catalizador 1, equivalentemente 15 observaciones de 28. Mientras que para el catalizador dos, la proporcin de sus datos le corresponde al complemento de la proporcin del catalizador 1

El siguiente diagrama de caja nos muestra la informacin anterior de una manera mas didctica, rpida y entendible. Se observa que para el catalizador 1 existe una gran variabilidad de sus datos con respecto a la media y que dicha variabilidad se encuentra casi en el mnimo y mximo valor que pueden tomar los datos en todas las muestras; pero tambin se observa que la media se encuentra por debajo de la media del catalizador 2, es ms, el tercer cuartil del catalizador 1 es casi correspondiente a la media del catalizador 2, tambin esa caja, nos muestra que el 50% de

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

los datos del catalizador 1 ms cercanos a la media se encuentra dentro del intervalo correspondiente (89.77----93.495). Ahora para el catalizador 2 se observa una menor variabilidad, una media ms alta, un intervalo menor donde se encuentran ubicados el 50% de los datos ms cercanos a la media (92.00----94.640), un menor intervalo para el 25% de los datos superiores al tercer cuartil. Sin embargo, se observa un dato anormal que lo excluiremos de la estadstica

Ahora, si el problema se basara en elegir uno de los dos catalizadores, se debera de elegir el catalizador 2, pues con l se obtiene un mayor rendimiento del proceso qumico, adems que es un poco ms econmico

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

3. una viga se somete a dos mtodos distintos de corte. Los datos de las mediciones de resistencias aparecen a continuacin R/ lo siguiente es la respectiva tabla de datos

Con los primeros datos summary nos damos cuenta que los datos los toma sin segmentacin, que existen 9 datos pertenecientes al mtodo Karlsruhe y otros 9 al de Lehigh, y que para cada viga se realiz el respectivo ensayo con ambos mtodos. El intervalo en que pueden caer los datos de la resistencia sea cual sea la viga y el mtodo es: (0.992----1.559)

Los segundo datos numsummary nos muestra una informacin segmentada por el mtodo de corte utilizado para poder hacer una mejor comparacin entre ellos, donde observamos que las vigas ofrecen menor resistencia promedio en el mtodo de Lehigh, al igual que tiene una desviacin tpica muy mnima, por lo cual tiene poca variacin y los datos se encuentran concentrados cerca de su media; de igual forma podemos ver los cuartiles que ubican que porcentaje de ensayos tienen una resistencia igual o menor a su respectivo valor, y vemos que

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

en todos los cuartiles, se experimente una resistencia menor para el mtodo de Lehigh que para el de Karlsruhe

El siguiente diagrame de caja de Resistencia Vs Mtodo, nos muestra de una manera ms amena la informacin anterior, donde claramente se observa que el mtodo de Lehigh ofrece una resistencia muy baja y de poca varianza, aunque con algunos datos atpicos . Mientras que el mtodo de karlsruhe ofrece una resistencia ms elevada, pero sus datos con una mayor variabilidad, quizs sea por el material del que este hecha la viga

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

El siguiente es un grfico de medias de la resistencia con respecto al mtodo de corte utilizado con sus respectivas desviaciones tpicas. Aunque este grafico se puede decir que nos muestra una parte de lo que nos mostr el anterior diagrama de caja, mediante este grafico de medias se ve ms significativo y drstico el cambio y la diferencia entre las medias

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

Los siguientes datos, tambin numsummary nos muestran un resumen numrico pero segmentado mediante la viga, es decir, se analiza Viga Vs Resistencia. Con este resumen numrico no nos podemos dar cuenta de las particularidades de los datos, pues son 9 tipos de viga para comparar lo que resulta una tarea muy tediosa, sin embargo, sirve para tener el valor exacto de algunos datos de inters. El grafico de medias ubicado un poco ms abajo, nos muestra casi que la misma informacin de una forma resumida y prctica, ya que un buen grafico dice ms que 1000 datos

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

El siguiente grafico de medias nos muestra la informacin anterior de una manera amena y de rpida lectura. Si se observa detalladamente, la viga que representa la mayor resistencia promedio es la viga nmero 8 para ambos mtodos de corte , pero con un gran intervalo, o variabilidad (aunque en este caso, como solo son 2 datos por viga la raya horizontal superior e inferior a la media equivale al valor de la resistencia que obtuvo dicha viga para determinado mtodo de corte), as se puede ver, que la viga 8 presenta una mayor resistencia promedio, pero debido a una muy baja resistencia para el mtodo de Lehigh y una muy alta para el mtodo de Karlshure . As que si se analiza, se observa que la viga 6 tiene una resistencia promedio muy parecida a la de la viga 8, pero con una menor variabilidad o intervalo para ambos valores de los mtodos de corte. Mientras que la viga que menor resistencia opone a ambos mtodos de corte es la viga 2

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

As pues, se puede concluir muchas cosas de estos datos, como el ejercicio no nos establece una pregunta o problema especfico, estas son las conclusiones que se pueden deducir de esta tabla de datos Si se busca el mtodo de corte que disminuya la resistencia que presenta los materiales de las vigas, el ms recomendable es el de Lehigh, pues para las pruebas con las 9 vigas, estas obtuvieron un valor muy bajo comparado con el otro mtodo Si se desea una viga fcil de cortar por cualquier mtodo de corte, se debe de elegir la viga 2

Efran Sampedro Montoya Ingeniera Industrial-UdeA-Ude@ Estadstica 1-Taller 1

El material de la viga 2 es el que presenta menos resistencia, as que es ideal para trabajos que no exijan mucha resistencia Si se desea una viga robusta y que presente buena resistencia para ambos mtodos de corte, se debe elegir la viga numero 6 El material de la viga nmero 6 es ms resistente El mtodo de corte de Karlshure es poco prctico, ya que para cortar lo ideal es hacerlo rpido y para ello se necesita que haya poca resistencia, y para dicho mtodo los materiales de las vigas presentaron unas altas resistencias

Nota: para este tercer punto de la parte B trate de realizar una grfica de barras (barplot) que me agrupara mediante determinado color que tipo de mtodo de corte es; en el eje X, ubicar la viga correspondiente con sus dos respectivos valores del mtodo de corte segn el color y en el eje Y ubicar la resistencia correspondiente; pero al alterar la escala de medida del eje Y (de frecuencia a resistencia) se me altera el grafico no mostrndome la informacin deseada Lastimosamente no fui capaz de hacer dicho grfico, el cual hubiera sido muy til, de fcil interpretacin y un gran resumidor de datos para su posterior anlisis Los cdigos generadores de las tablas, probabilidades o grficas, no los considere necesarios aadirlos, pues hacan el trabajo an ms extenso y no eran de gran utilidad

You might also like