Professional Documents
Culture Documents
Presentado por:
Agustn Cardona Naranjo
Docente:
Julio Fernando Suarez Cifuentes
Objetivos
1. Aplicar por lo menos una variable contina a casos reales de la ingeniera qumica
(exponencial).
2. Aplicar un caso de ingeniera a una variable discreta (poisson).
3. A un caso o proceso de ingeniera aplicar los conceptos de regresin lineal vistos en
la clase de probabilidad y estadstica.
Objetivos especficos del objetivo 3:
3.1 A las variables de la regresin lineal hacer el anlisis con logaritmo.
INTRODUCCIN
En el presente trabajo se tratara de modelar algunos casos de la ingeniera con
distribuciones de probabilidad y de regresin lineal, para ello se baso en la consulta del
material bibliogrfico para poder tener un respaldo solido. de esta forma se desarrolla los
casos de estudio y poder cumplir con los objetivos planteados, de tal forma se obtuvo un
anlisis serio de las variables involucradas, por lo que la dinmica del trabajo ser definir y
explicar las variables obtenidas y hacer un anlisis de los resultados obtenidos durante el
transcurso del trabajo.
VARIABLE CONTINUA: DISTRIBUCIN EXPONENCIAL
Revisin Bibliogrfica:
La distribucin exponencial es una distribucin continua de probabilidad para describir el
tiempo que se tarda en realizar una actividad. Esta distribucin es un caso especial de la
distribucin gamma. Esta funcin se usa para modelar las vidas de las bateras, de
transistores, de valeros, etc. Una variable aleatoria exponencial puede ser usada para medir
el tiempo que transcurre entre las ocurrencias de un evento.
Una variable aleatoria continua X se dice que est exponencialmente distribuida si su
funcin de densidad es:
F ( x )= e x Para X 0, 0
Donde: es un parmetro de la distribucin, y e una constante igual a 2.71828
X y s2 de la variable aleatoria exponencial X son E(X) = 1/ y V(X) = 1/2,
respectivamente. Se puede demostrar que el promedio y la desviacin estndar de una
distribucin exponencial son iguales el uno al otro, esto es: = = 1/.
Por otro lado, Keller et al. (1990) afirma que, en el caso de una variable aleatoria
exponencial X, se puede demostrarse que la probabilidad de que X pueda tomar un valor
P(X a) =
ex
dx = -
ex
| a=
ex
eb
a
P(X a) = 1 e
P(X a) = e
Para hacer nuestra base de datos se observara el consumo de celulosa hasta que la bacteria
la consumido completamente.
6
4
0
C e lu lo sa
Tiempo<-c(0,25,49,68,91);Tiempo
Celulosa<-c(8.87,7,4.25,1.26,0);Celulosa
20
40
Tiempo
60
80
Entonces: sea x una variable aleatoria que indica la duracin de celulosa si se sabe que la
duracin media para degradar los compuestos celulsicos es de 91 horas (tiempos iguales
para el consumo total tanto de celulosa como glucosa a las condiciones planteadas por el
artculo al que se hace mencin al principio).
Primero defino los intervalos para calcular las probabilidades intervalo=91/7=13 por lo que
se eligen 8 intervalos a continuacin se hace la siguiente tabla:
1
1
= =0,0110
X~Exponencial(= E (x) 91
Gx(x)=
1 91
e x> 0
91
0 en otro caso
26
1 91 dx
e
91
13
0.1154
0.2485
26-39
39
1 91 dx
e
91
26
0.1000
0.3485
39-52
1 91
e
91
52
0.0867
0.4352
dx
39
52-65
65
1 91 dx
e
91
52
0.0752
0.5104
65-78
78
1 91 dx
e
91
65
0.0652
0.5756
78-91
91
0.0565
0.6321
1 91 dx
e
91
78
91 +
1 91 dx
e
91
91
0.3679
1.0000
Cdigo
>pexp(c(13), rate=1/91, lower.tail=TRUE)
[1] 0.1332459
Anlisis
La probabilidad puntual de que se consuma
el sustrato entre 0-13 horas es del 13.3246
%
> pexp(c(26), rate=1/91, lower.tail=TRUE) La probabilidad acumulada de que se
[1] 0.2487374
consuma el sustrato entre 0-26 horas es del
24.8737 %
> pexp(c(39), rate=1/91, lower.tail=TRUE) La probabilidad acumulada de que se
[1] 0.3488401
consuma el sustrato entre 0-39 horas es del
34. 8840%
> pexp(c(52), rate=1/91, lower.tail=TRUE) La probabilidad acumulada de que se
[1] 0.4356045
consuma el sustrato entre 0-52 horas es del
43.5604 %
> pexp(c(65), rate=1/91, lower.tail=TRUE) La probabilidad acumulada de que se
[1] 0.5108079
consuma el sustrato entre 0-65 horas es del
51.0810 %
> pexp(c(78), rate=1/91, lower.tail=TRUE) La probabilidad acumulada de que se
[1] 0.5759907
consuma el sustrato entre 0-78 horas es del
57.5991 %
Intervalo
(0-91)=0,6325 La probabilidad acumulada de que se
consuma el sustrato entre 0-91 horas es del
acumulada hasta ese putno
63.25%.
>pexp(c(91),rate=1/91, lower.tail=FALSE)
La probabilidad acumulada de que se
[1] 0.3675117
consuma el sustrato entre 91 horas o ms es
del 100% y la puntual del 36.7512%.
Tabla 3. Anlisis de Probabilidades puntuales y acumuladas a 8
intervalos de tiempo
Donde:
x e
x!
x !
x=0
Grafica 6. Presin y tiempo de deformacin (se debe pasar a tiempo), lectura de para
hallar tiempo.
A 1650C y 90MPa con una media de 0.5 de deformados el tiempo para la formacin de las
microestructuras (Nota: se aclara que en la grafica esta a diferentes presiones a las cuales se
forman las microestructuras); en todos los casos siguen una distribucin de poisson, para
ese punto el tiempo es igual a:
=124 seg1 (Dato ledo de la tabla 6), Con este dato encontramos el tiempo en el cual
ocurren las deformaciones para esta temperatura a la presin dada, entonces se calcula de
la siguiente manera:
Son:
1
T
T=
Donde
entonces
T=
1
=20736 seg
si lo pasamos a horas
12 seg1
4
20736 seg
1hora=5.76 horas
3600 seg
Cabe resaltar que no tienen el mismo comportamiento de tiempo. Para todos los casos solo
basta con observar la lnea que se trazo, paso por los tres intervalos de temperatura tocando
todos los puntos a pesar de estar a diferentes temperaturas pero a la misma presin pero
variando en el tiempo, con un promedio de deformacin de cristales de 0.5m.
Ahora se cuenta que la deformacin del proceso tiene un promedio de 0,5m cada 5.76
horas a la temperatura y presin dadas (tambin cabe resaltar que el promedio se mantiene
por todo el proceso a pesar de que las presiones y temperaturas cambien pero para mi caso
lo trabaje a 1650C y 90MPa); cabe resaltar que los intervalos de tiempo son diferentes
para las tres temperaturas.
X: variable aleatoria que denota la deformacin por unidad de tiempo.
Ahora puedo hacer la siguiente pregunta Cul es la probabilidad de que un policristal se
deforme 0.5m durante un tiempo cualquiera?, y esto se explica por la difusin y
transferencia de calor ya que el calor debe penetrar a travez de la estructura del policristal y
en ese transcurso asa el interior de la estructura ocurrirn deformaciones.
Tambin se puede hallar la probabilidad de que se registre distinto nmero de
deformaciones en las mismas 5.76 horas.
x e
f ( x )=P ( X =x ) =
x=0,1,2, .. ,
x!
0 en otro caso
El lambda =0.5
Calculando con la funcin de densidad se halla la siguiente tabla para el caso en x vale de
0m de deformacin hasta 10m de deformacin: entonces X=1,2,3,4,5,6,7,8,9,10.
x
0
P(x)=f(x)
0 0.5
0.5 e
0!
P(x)
0.6065
0.51 e0.5
1!
0.3033
0.52 e0.5
2!
0.0758
0.53 e0.5
3!
0.0126
0.54 e0.5
4!
0.0016
0.55 e0.5
5!
0.0002
0.5 e
6!
6 0.5
1.3163E-5
0.57 e0.5
7!
9.4018E-7
0.58 e0.5
8!
5.7861E-8
0.5 e
9!
9 0.5
3.2664E-9
10 0.5
10
1.6323E-10
0.5
e
Cdigo R
Anlisis
de resultados
! un policristal se deforme 0m a
> dpois(0,0.5)
La probabilidad de 10
que
[1] 0.6065307
1650C y 90MPa
es del 60.6531% 1.0000
Suma
> dpois(1,0.5)
La probabilidad
de
que un policristal
se deforme
Tabla 4. Probabilidades
puntuales
para 1m a
[1] 0.3032653
1650C yla90MPa
es del 30.3265%
deformacin
de policristales
> dpois(2,0.5)
La probabilidad de que un policristal se deforme 2m a
[1] 0.07581633
1650C y 90MPa es del 7.5816%
> dpois(3,0.5)
La probabilidad de que un policristal se deforme 3m a
[1] 0.01263606
1650C y 90MPa es del 1.2636%
> dpois(4,0.5)
La probabilidad de que un policristal se deforme 4m a
[1] 0.001579507 1650C y 90MPa es del 0.157951% (Pbaja)
> dpois(5,0.5)
La probabilidad de que un policristal se deforme 5m a
[1] 0.0001579507 1650C y 90MPa es del 0.0157951% ( Pmuy baja)
> dpois(6,0.5)
La probabilidad de que un policristal se deforme 6m a
[1] 1.316256e-05 1650C y 90MPa es del 0.00131625% (Pmuy baja)
> dpois(7,0.5)
La probabilidad de que un policristal se deforme 7m a
[1] 9.401827e-07 1650C y 90MPa es del 9.401827e-05% (Pmuy baja)
> dpois(8,0.5)
La probabilidad de que un policristal se deforme 8m a
[1] 5.876142e-08 1650C y 90MPa es del 5.876142e-06 % (Pmuy baja)
> dpois(9,0.5)
La probabilidad de que un policristal se deforme 9m a
[1] 3.264523e-09 1650C y 90MPa es del 3.264523e-07% (Pmuy baja)
> dpois(10,0.5)
La probabilidad de que un policristal se deforme 10m a
[1] 1.632262e-10 1650C y 90MPa es del 1.632262e-08% (Pmuy baja)
Tabla 5. Anlisis Probabilidades puntuales para la deformacin de
policristales
Ahora
se
procede
a
calcular
lo
anterior
en
el
cdigo
de R:
Observando la tabla anterior se puede concluir que los datos calculados con la funcin y los
calculados con el programa R son muy parecidos con la diferencia en que en R el clculo se
hace de inmediato.
Alternativa: Si se da la probabilidad de tener, de manera exacta, (y) ocurrencias en un
intervalo (t) veces mayor o menor que el de referencia en la medicin entonces la
distribucin de probabilidades de Y nmero de xitos en la nueva unidad de referencia
viene dada por:
y
f ( y )=
t e
y!
Anlisis de resultados
La probabilidad de que los policristales se
deformen entre 0.5m y 1m en 2 horas es del
36.7879 %.
> a2<-(a1-a);a2
[1] 0.3678794
>
La probabilidad de que los policristales se
> b<-ppois(0,1.5);b
deformen entre 0.5m y 1m en 3 horas es del
[1] 0.2231302
55.7825 %.
> b1<ppois(1,1.5);b1
[1] 0.5578254
> b2<-(b1-b);b2
[1] 0.3346952
>
La probabilidad de que los policristales se
> c<-ppois(0,2);c
deformen entre 0.5m y 1m en 4 horas es del
[1] 0.1353353
27.0671%.
> c1<-ppois(1,2);c1
[1] 0.4060058
> c2<-(c1-c);c2
[1] 0.2706706
>
La probabilidad de que los policristales se
> d<-ppois(0,2.5);d
deformen entre 0.5m y 1m en 5 horas es del
[1] 0.082085
20.5212 %.
> d1<ppois(1,2.5);d1
[1] 0.2872975
> d2<-(d1-d);d2
[1] 0.2052125
>
La probabilidad de que los policristales se
> e<-ppois(0,3);e
deformen entre 0.5m y 1m en 6 horas es del
[1] 0.04978707
14.9361 %.
> e1<-ppois(1,3);e1
[1] 0.1991483
> e2<-(e1-e);e2
[1] 0.1493612
Tabla 6. Anlisis de las probabilidades de deformacin a diferentes
tiempos con un intervalo de deformacin de 0.5m-1m de
policristales
MODELO DE REGRESION CON 3 VARIABLES INDEPENDIENTES X1, X2 y X3.
Para este anlisis se busco una referencia bibliogrfica en la base de datos science direct y
se eligi el artculo: H2 production by sorption enhanced steam reforming ofbiomassderived bio-oil in a fluidized bed reactor: An assessment ofthe effect of operation variables
using response surface methodology. Para poder construir mi base de datos. La siguiente
tabla fue extrada de dicho artculo.
> X1<-c(90.22, 98.77, 95.05, 99.75, 77.74, 98.56, 86.4, 99.8, 98.82, 73.26)
> X2<-c(94.72, 96.53, 97.28, 96.55, 87.35, 96.25, 92.29, 96.42, 98.94, 81.44)
> X3<-c(516, 634, 516, 634, 516, 634, 516, 634, 575, 475)
Los datos se visualizan en el siguiente data.frame:
>datos<-data.frame(Y,X1,X2,X3);datos
Y
X1
X2
1
65.5 90.2 94.7
0
2
2
2
92.4 98.7 96.5
8
7
3
3
74.1 95.0 97.2
7
5
8
4
94.7 99.7 96.5
1
5
5
5
51.8 77.7 87.3
6
4
5
6
86.3 98.5 96.2
7
6
5
7
64.2 86.4 92.2
8
0
9
8
88.3 99.8 96.4
3
0
2
9
85.3 98.8 98.9
5
2
4
10 22.4 73.2 81.4
8
6
4
Tabla 8. Base de datos
X3
516
634
516
634
516
634
516
634
575
475
Rendimiento H2 (% )
75 85 95
500
600
75 85 95
20
60
95
X1
600
85
X2
500
X3
20
60
85
95
X1
X2
Y
0.9663441 0.9313163
X1
1.0000000 0.9526421
X2
0.952642 1.0000000
1
X3 0.8702770 0.830245 0.6625810
7
Tabla 9. Matriz de correlacin de
cero
X3
0.8702770
0.8302457
0.6625810
1.0000000
orden
Residuals:
Min
-3.8386
1Q
-1.7701
Median
-0.2681
3Q
1.6199
Max
4.621
4
Tabla 13. Resumen del rendimiento de H2 (%)
~Selectividad (%)+pureza H2 (Vol. %)+Temperatura(C)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
(Intercept)
-330.73119
47.41835
-6.975
0.000432 ***
datos[, 2]
-1.13045
0.72982
-1.549
0.172368
datos[, 3]
4.08418
0.97726
4.179
0.005818 **
datos[, 4]
0.21964
0.04512
4.868
0.002800 **
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 3.153 on 6 degrees of freedom
Multiple R-squared: 0.9869, Adjusted R-squared: 0.9803
F-statistic: 150.5 on 3 and 6 DF, p-value: 4.915e-06
Tabla 14.Modelo: rendimiento de H2 (%) ~Selectividad H2 (%)+pureza H2(Vol.
%)+Temperatura(C)
El modelo generado es: Y= -330.7312 1.13045X1+ 4.0842X2 + 0.2196X3
Inferencia en el modelo de regresin simple:
Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores se visualizan en la tabla
14.
La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.9869 que est muy cercano a 1 por lo que los valores se
ajustan bien (este es el modelo que a pesar de involucrar todas las variables tiene un R
mayor que el resto de los modelos).
> Yest2<-ajuste2.lm$fitted.values # obtener los valores ajustados (estimados) por el
modelo.
> Error2<- ajuste2.lm$residuals # generar los valores de los errores
> sum(Error2)
[1] 3.885781e-16
> cbind(datos[,1],Yest2,Error2)
originales
Yest2
Error2
1
65.50
67.46975
-1.9697529
2
92.48
91.11479
1.3652097
3
74.17
72.46517
1.7048250
4
94.71
90.08863
4.6213703
5
51.86
51.47737
0.3826274
6
86.37
90.20861
-3.8386139
7
64.28
61.86352
2.4164831
8
88.33
89.50116
-1.1711631
9
85.35
87.94213
-2.5921317
10
22.48
23.39885
-0.9188540
Tabla 15. Valores estimados del rendimiento de
H2 (%)
De la tabla 15 se puede inferir que al generar con el modelo los nuevos datos del
rendimiento de H2 estos no estn tan lejanos de los datos originales por lo que es una muy
buena aproximacin de los datos reales.
> mean(Error2)
[1] 3.887407e-17 # se puede decir que el error es cero.
Ahora se har un anlisis de todas las variables involucradas con la opcin b) MRLM:
> Y1<-lm(Y~X1);summary(Y1)
Call:
lm(formula = Y ~ X1)
Residuals:
Min
-8.655
1Q
-3.279
Media
n
-1.574
3Q
4.314
Max
10.737
Estimate
-132.1996
Std. Error
19.3687
t value
-6.825
Pr(>|t|)
0.000134 ***
(Intercept
)
X1
2.2295
0.2098
10.625
5.39e-06 ***
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 6.134 on 8 degrees of freedom
Multiple R-squared: 0.9338, Adjusted R-squared: 0.9255
F-statistic: 112.9 on 1 and 8 DF, p-value: 5.39e-06
Tabla 17.Modelo: rendimiento de H2 (%) ~Selectividad H2 (%)
El modelo generado es: Y= -132.1996 2.2295 Nota: este modelo ya haba sido hecho
previamente con una variacin del cdigo y se puede observar en la tabla 11, por lo que no
se volver a repetir el anlisis.
> Y2<-lm(Y~X2);summary(Y2)
Call:
lm(formula = Y ~ X2)
Residuals:
Min
1Q
Median
3Q
Max
-11.9261
-6.0040 0.8892
5.2331 11.4362
Tabla 18. Resumen del rendimiento de H2 (%)
~+pureza H2(Vol.%)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
(Intercept) -290.0031 50.2039
-5.777
0.000416 ***
X2
3.8662
0.5346
7.233
8.96e-05 ***
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 8.684 on 8 degrees of freedom
Multiple R-squared: 0.8674, Adjusted R-squared: 0.8508
1Q
Median 3Q
Max
-0.0543 7.623 16.5984
5.6135
4
Tabla 20. Resumen del rendimiento de H2(%)
~Temperatura(C)
Coefficients:
Estimat
e
-100.19182
Std. Error
t
value
-2.882
Pr(>|t|)
(Interce
34.76611
0.02045 *
pt)
X3
0.30574
0.06118
4.997
0.00106 **
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 11.74 on 8 degrees of freedom
Multiple R-squared: 0.7574,
Adjusted R-squared:
0.7271
F-statistic: 24.97 on 1 and 8 DF, p-value: 0.001056
Tabla
21.Modelo:
rendimiento
de
H2(%)
~Temperatura(C)
Y= -100.1918+ 0.3057X3
Inferencia en el modelo de regresin simple:
Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores se visualizan en la tabla
21.
La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.7574 este valor no es muy cercano a 1 pero los valores
todava se ajustan relativamente bien.
> Y4<-lm(Y~X1+X2);summary(Y4)
Call:
lm(formula = Y ~ X1 + X2)
Residuals:
Min
-7.4496
1Q
-4.1058
Median
-0.9335
3Q
Max
4.478 10.2369
6
Tabla 22. Resumen del rendimiento de H2 (%)
~Selectividad H2 (%)+pureza H2(Vol.%)
Coefficients:
Estimate Std. Error
t value Pr(>|t|)
(Intercept) -153.9622 62.8105
-2.451
0.0440 *
X1
1.9743
0.7307
2.702
0.0306 *
X2
0.4820
1.3148
0.367
0.7248
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 6.495 on 7 degrees of freedom
1Q
Media
3Q
Ma
n
x
-9.5229 -2.8970 -0.3965
2.4136
8.5950
Tabla 24. Resumen del rendimiento de H2(%)
~Selectividad H2 (%)+Temperatura(C)
Coefficients:
Estimate
-137.13942
Std. Error
18.55862
t value
-7.390
Pr(>|t|)
0.000151 ***
(Intercept
)
X1
1.81044
0.35437
5.109
0.001386 **
X3
0.07686
0.05396
1.424
0.197344
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
1Q
Median
-0.7828
3Q
Max
2.989 3.9456
2.2802
8
Tabla 26. Resumen del rendimiento de H2
(%) ~pureza H2 (Vol. %)+Temperatura(C)
Coefficients:
(Intercept
)
X2
X3
Estimate
-263.17230
Std. Error
20.37920
2.62467
0.15857
0.28389
0.02403
t value
-12.914
Pr(>|t|)
3.88e-06 ***
9.245
6.600
3.58e-05 ***
0.000304 ***
1Q
-3.8386
Media
n
-0.2681
3Q
Ma
x
1.6199 4.6214
1.7701
Tabla 28. Resumen del rendimiento de H2
(%) ~Selectividad H2 (%)+pureza H2(Vol.
%)+Temperatura(C)
Coefficients:
(Intercept
Estimate
-330.73119
Std. Error
47.41835
t value
-6.975
Pr(>|t|)
0.000432 ***
)
X1
-1.13045
0.72982
-1.549
0.172368
X2
4.08418
0.97726
4.179
0.005818 **
X3
0.21964
0.04512
4.868
0.002800 **
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 3.153 on 6 degrees of freedom
Multiple R-squared: 0.9869, Adjusted R-squared: 0.9803
F-statistic: 150.5 on 3 and 6 DF, p-value: 4.915e-06
Tabla 29.Modelo: rendimiento de H2 (%) ~Selectividad H2 (%)+pureza
H2 (Vol.%)+Temperatura(C)
El modelo generado es: Y= -330.7312 1.13045X1+ 4.0842X2 + 0.2196X3 Nota: no
repito el anlisis ya que esta hecho en la tabla 14. (Se puede concluir que este es el modelo
que mejor ajusta los datos teniendo en cuenta que se tienen 3 variables independientes).
Ahora se hace un anlisis con regresin no lineal aplicando log para cumplir con el objetivo
especfico 3.1:
> Y8<-lm(log(Y)~log(X1));summary(Y8)
Call:
lm(formula = log(Y) ~ log(X1))
Residuals:
Min
1Q
Media 3Q
Max
n
-0.31127 -0.05465 -0.01217
0.02477 0.31102
Tabla 30. Resumen del log rendimiento de H2 (%) ~log
Selectividad H2 (%)
Coefficients:
Estimate
-12.0316
Std. Error
2.2563
t value
-5.332
Pr(>|t|)
7e-04 ***
(Intercept
)
log(X1)
3.5993
0.4996
7.204
9.21e-05 ***
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.1681 on 8 degrees of freedom
Multiple R-squared: 0.8664, Adjusted R-squared: 0.8497
F-statistic: 51.89 on 1 and 8 DF, p-value: 9.211e-05
Tabla 31.Modelo: log rendimiento de H2 (%) ~log Selectividad H2
(%)
Para el caso de log se puede observar que el R-cuadrado baja con respecto al modelo que
hizo previamente a los datos de la base sin ningn tipo de tratamiento previo para hallar el
modelo, este comportamiento tambin se repite para el resto de los datos, cabe resaltar que
los p-valores son bajos Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Los modelos que se obtienen a continuacin como ya se haba mencionado
presentan la misma tendencia que el modelo de la tabla 31(salvo unas excepciones). Y se
observaran a continuacin.
> Y9<-lm(log(Y)~log(X2));summary(Y9)
Call:
lm(formula = log(Y) ~ log(X2))
Residuals:
Min
1Q
Media
3
Max
n
Q
-0.17322 -0.14023 0.04800
0.09086 0.20592
Tabla 32. Resumen del log rendimiento de H2 (%) ~log
pureza H2 (vol. %)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
(Intercept)
-26.8519
3.5993
-7.460
7.19e-05 ***
log(X2)
6.8445
0.7929
8.633
2.51e-05 ***
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.1432 on 8 degrees of freedom
Multiple R-squared: 0.9031, Adjusted R-squared: 0.8909
F-statistic: 74.53 on 1 and 8 DF, p-value: 2.515e-05
Tabla 33.Modelo: log rendimiento de H2 (%) ~log pureza H2 (vol. %)
Log*(Y= -26.8519+ 6.8445X2) este modelo ajusta mejor los datos involucrados que el
modelo que se observa en la tabla 19.
Inferencia en el modelo de regresin simple:
Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores se visualizan en la tabla
33.
La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.9031 que es cercano a 1 por lo que los valores todava se
ajustan relativamente bien.
> Y10<-lm(log(Y)~log(X3));summary(Y10)
Call:
lm(formula = log(Y) ~ log(X3))
Residuals:
Min
1Q
Media
3Q
Max
n
-0.59597 -0.09251 -0.02281
0.19205 0.34644
Tabla 34. Resumen del log rendimiento de H2 (%)~log
Temperatura(C)
Coefficients:
Estimat
e
-15.0006
Std. Error
t value
Pr(>|t|)
(Intercept
5.1832
-2.894
0.02007 *
)
log(X3)
3.0356
0.8186
3.708
0.00597 **
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.2789 on 8 degrees of freedom
Multiple R-squared: 0.6322, Adjusted R-squared: 0.5862
F-statistic: 13.75 on 1 and 8 DF, p-value: 0.005971
Tabla 35.Modelo:log rendimiento de H2 (%)~log Temperatura(C)
El modelo que se visualiza en la tabla 35, no es mejor modelo que el que se encuentra en la
tabla 21. Por lo que me quedo con el anlisis de la tabla 21.
> Y11<-lm(log(Y)~log(X1)+log(X2));summary(Y11)
Call:
lm(formula = log(Y) ~ log(X1) + log(X2))
Residuals:
Min
1Q
Median
3Q
Max
-0.17729 -0.11856 0.02764 0.07664 0.24076
Tabla 36. Resumen del log rendimiento de H2 (%)
~log selectividad H2 (%)+log pureza H2(Vol.%)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
(Intercept) -23.4847
6.7699
-3.469
0.0104 *
log(X1)
0.9368
1.5674
0.598
0.5689
log(X2)
5.1711
2.9196
1.771
0.1198
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.1493 on 7 degrees of freedom
Multiple R-squared: 0.9078, Adjusted R-squared: 0.8814
F-statistic: 34.45 on 2 and 7 DF, p-value: 0.0002383
Tabla 37.Modelo:log rendimiento de H2 (%) ~log selectividad H2
(vol. %)+log pureza H2 (Vol.%)
El modelo que se visualiza en la tabla 37, no es mejor modelo que el que se encuentra en la
tabla 23. Por lo que me quedo con el anlisis de la tabla 23.
> Y12<-lm(log(Y)~log(X1)+log(X3));summary(Y12)
Call:
lm(formula = log(Y) ~ log(X1) + log(X3))
Residuals:
Min
1Q
Median
3Q
Max
-0.31633 -0.04774 -0.00897
0.02572 0.29631
Tabla 38. Resumen del log rendimiento de H2 (%)
~log selectividad H2 (%)+log Temperatura(C)
Coefficients:
Estimate
Std. Error t value
Pr(>|t|)
(Intercept) -12.7750
3.3752
-3.785
0.00685 **
log(X1)
3.3541
0.9470
3.542
0.00945 **
log(X3)
0.2923
0.9350
0.313
0.76369
Signif. Codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.1785 on 7 degrees of freedom
Multiple R-squared: 0.8683, Adjusted R-squared: 0.8306
F-statistic: 23.07 on 2 and 7 DF, p-value: 0.0008297
Tabla 39.Modelo: log rendimiento de H2 (%) ~log
selectividad H2 (%)+log Temperatura(C)
El modelo que se visualiza en la tabla 39, no es mejor modelo que el que se encuentra en la
tabla 25. Por lo que me quedo con el anlisis de la tabla 25.
> Y13<-lm(log(Y)~log(X2)+log(X3));summary(Y13)
Call:
lm(formula = log(Y) ~ log(X2) + log(X3))
Residuals:
Min
1Q
Media
n
-0.01765
3Q
Max
-0.03676
0.03098 0.20151
0.162
44
Tabla 40. Resumen del log rendimiento de H2 (%)
~log pureza H2 (Vol.%)+log Temperatura(C)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
(Intercept)
-27.3845
2.9301
-9.346
3.34e-05 ***
log(X2)
5.4891
0.8779
6.253
0.000423 ***
log(X3)
1.0560
0.4653
2.269
0.057542
Signif. Codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.1162 on 7 degrees of freedom
Multiple R-squared: 0.9441, Adjusted R-squared: 0.9282
F-statistic: 59.16 on 2 and 7 DF, p-value: 4.118e-05
Tabla 41.Modelo: log rendimiento de H2 (%) ~log pureza H2 (Vol. %)+log
Temperatura(C)
El modelo que se visualiza en la tabla 41, no es mejor modelo que el que se encuentra en la
tabla 27. Por lo que me quedo con el anlisis de la tabla 27.
> Y14<-lm(log(Y)~log(X1)+log(X2)+log(X3));summary(Y14)
Call:
lm(formula = log(Y) ~ log(X1) + log(X2) + log(X3))
Residuals:
Min
1Q
Median
3Q
Max
-0.120893 -0.031666
0.004532 0.036873 0.072390
Tabla 42. Resumen del log rendimiento de H2 (%) ~log
selectividad H2 (%)+log pureza H2 (Vol. %)+log
Temperatura(C)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
(Intercept)
-46.1663
5.6036
-8.239
0.000173 ***
log(X1)
-4.9984
1.4121
-3.540
0.012225 *
log(X2)
12.3440
2.0104
6.140
0.000854 ***
log(X3)
2.6719
0.5387
4.960
0.002553 **
Signif. Codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.07142 on 6 degrees of freedom
Multiple R-squared: 0.9819, Adjusted R-squared: 0.9729
F-statistic: 108.6 on 3 and 6 DF, p-value: 1.285e-05
Tabla 43.Modelo: log rendimiento de H2 (%) ~log selectividad H2 (%)+log pureza H2
(Vol. %)+log Temperatura(C)
El modelo que se visualiza en la tabla 43, no es mejor modelo que el que se encuentra en la
tabla 29. Por lo que me quedo con el anlisis de la tabla 29.
CONCLUSIONES
Muchas cosas se pueden modelar con la distribucin exponencial, y ms cuando los datos
que son objeto de estudio representan muy bien la forma de dicha distribucin para el caso
de estudio con Clostridium cellulovorans, el comportamiento cuando este va consumiendo
como sustratos los materiales celulsicos, para dar lugar a la formacin de nuevos
productos. Se encontr que el tiempo para degradar estos materiales es de 91 horas, lo que
nos hace pensar que este tipo de microorganismos mantienen una tasa metablica ya sea
que se utilice como sustrato celulosa o glucosa y esto es debido a la capacidad enzimtica
que toda bacteria tiene para de esta forma obtener la energa necesaria para la obtencin de
biomasa y para la produccin de analitos de inters que son utilizados por el hombre como
es el caso de cidos y alcoholes (comnmente etanol o butanol). Entonces con la
distribucin exponencial se puede saber con exactitud la probabilidad de consumo de
sustrato para nuestro caso, claro que tambin se puede modelar otras variables del proceso
ya que por lo regular siguen una distribucin exponencial como un caso particular
hablemos por ejemplo de la produccin de biomasa del microorganismo ya que esta
biomasa tambin sigue una distribucin exponencial por lo que tambin se podra saber con
exactitud la probabilidad de producir biomasa en un determinado momento.
La distribucin de poisson tiene un valor especial y es que al conocer el promedio de un
evento en un intervalo de tiempo determinado como puede ser el caso de la deformacin de
un policristal a condiciones de presin y temperatura dadas. Se puede encontrar la
probabilidad de que ocurra dicho evento en un tiempo cualquiera siguiendo las condiciones
iniciales del problema, ya que si nos remontamos al caso de estudio el intervalo de tiempo
varia con respecto a la presin para cada temperatura dada (1450 C, 1550C y 1650C),
por lo que la probabilidad de que ocurra el mismo evento a temperaturas distintas al mismo
intervalo de tiempo es muy bajo, pero afortunadamente el histograma de deformaciones
sigue un comportamiento de poisson, por lo que dicho modelo explica muy bien la
probabilidad de deformacin de policristales para el caso particular al cual las
observaciones fueron tomadas.
El modelo que mejor representa los datos es el presentado en la tabla 14 ya que el Rcuadrado como se ha comentado antes es el mayor de todos por lo que ajusta mejor los
datos a la regresin lineal que los dems modelos, tambin cabe resaltar que los valores
estimados de la tabla 15 son muy cercanos a los valores que tenamos en un principio en
nuestra base de datos, cabe resaltar que cuando se hace el anlisis con log al modelo en
algunos casos mejora un poco la correlacin, pero nunca fue superior al modelo presentado
en la tabla 14. Por lo que el tratamiento de los datos con log en este caso no es necesario, ya
que los datos se ajustan bien sin ningn tipo de transformacin adicional.
Finalmente la estadstica con distribuciones y modelos de regresin ayudan a estructurar
mejor el anlisis de los procesos y eventos en la ingeniera no solo en la qumica si no en
todas las disciplinas en donde se relacione la observacin de lo que esta sucediendo.
Bibliografa
1- Xiaorui Yang, Mengmeng Xu, Shang-Tian Yang n. Metabolic and process
engineering of Clostridium cellulovorans for biofuel production from cellulose.
Department of Chemical and Biomolecular Engineering and Department of
Molecular Genetics, The Ohio State University, 151 West Woodruff Avenue,
Columbus, OH 43210, USA. Metabolic Engineering 32 (2015) 3948.
2- Mara V. Gila,b, Javier Fermosoc, Fernando Rubieraa, De Chenb,. H2production
Web-grafa
3- Araya alpizar carlomangno. Estadistica para laboratorista qumico. Recuperado
de:https://books.google.com.co/books?
id=IibtfIBQLMoC&pg=PA54&lpg=PA54&dq=como+aplicar+la+distribuci
%C3%B3n+de+poisson+en+quimica&source=bl&ots=gl8sf0ArE&sig=VHq2arhdS
cbfi8aYLLqXhl4_eZM&hl=es&sa=X&ved=0ahUKEwiyjrv_9bPJAhWCKiYKHT
mzDMEQ6AEIJDAB#v=onepage&q=como%20aplicar%20la%20distribuci
%C3%B3n%20de%20poisson%20en%20quimica&f=false
4- Recuperadode:http://materiales.unex.es/miembros/personal/jjmelendez/ES/Investiga
ci%C3%B3n-ES.html
5- Recuperadode:http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un2/co
nt_232_74.html
6- Recuperadode:https://www.uam.es/personal_pdi/ciencias/joser/paginaR/regresion.ht
ml.
7- Recuperadode:http://ldc.usb.ve/~moises/estadistica/Ej_Regresion_Lineal_Multiple_
Zoritza.pdf.