You are on page 1of 35

Trabajo final de probabilidad y estadstica

Ejemplos de las distribuciones y regresin lineal en la ingeniera qumica

Presentado por:
Agustn Cardona Naranjo

Docente:
Julio Fernando Suarez Cifuentes

Universidad Nacional de Colombia-Sede Manizales

Objetivos
1. Aplicar por lo menos una variable contina a casos reales de la ingeniera qumica
(exponencial).
2. Aplicar un caso de ingeniera a una variable discreta (poisson).
3. A un caso o proceso de ingeniera aplicar los conceptos de regresin lineal vistos en
la clase de probabilidad y estadstica.
Objetivos especficos del objetivo 3:
3.1 A las variables de la regresin lineal hacer el anlisis con logaritmo.
INTRODUCCIN
En el presente trabajo se tratara de modelar algunos casos de la ingeniera con
distribuciones de probabilidad y de regresin lineal, para ello se baso en la consulta del
material bibliogrfico para poder tener un respaldo solido. de esta forma se desarrolla los
casos de estudio y poder cumplir con los objetivos planteados, de tal forma se obtuvo un
anlisis serio de las variables involucradas, por lo que la dinmica del trabajo ser definir y
explicar las variables obtenidas y hacer un anlisis de los resultados obtenidos durante el
transcurso del trabajo.
VARIABLE CONTINUA: DISTRIBUCIN EXPONENCIAL
Revisin Bibliogrfica:
La distribucin exponencial es una distribucin continua de probabilidad para describir el
tiempo que se tarda en realizar una actividad. Esta distribucin es un caso especial de la
distribucin gamma. Esta funcin se usa para modelar las vidas de las bateras, de
transistores, de valeros, etc. Una variable aleatoria exponencial puede ser usada para medir
el tiempo que transcurre entre las ocurrencias de un evento.
Una variable aleatoria continua X se dice que est exponencialmente distribuida si su
funcin de densidad es:
F ( x )= e x Para X 0, 0
Donde: es un parmetro de la distribucin, y e una constante igual a 2.71828
X y s2 de la variable aleatoria exponencial X son E(X) = 1/ y V(X) = 1/2,
respectivamente. Se puede demostrar que el promedio y la desviacin estndar de una
distribucin exponencial son iguales el uno al otro, esto es: = = 1/.
Por otro lado, Keller et al. (1990) afirma que, en el caso de una variable aleatoria
exponencial X, se puede demostrarse que la probabilidad de que X pueda tomar un valor

ms grande que un nmero especificado no negativo a, es e-a. Esto se puede expresar


usando clculo integral, es decir:

P(X a) =

ex

dx = -

ex

| a=

ex

El clculo de las funciones exponenciales involucra la evaluacin de integrales de


probabilidad entre los lmites de a y b. Para esto, se da una tabla de probabilidades
exponenciales. Las siguientes frmulas se usan con esa tabla.
a
P(a X b) = e

eb

a
P(X a) = 1 e

P(X a) = e

CASO DE ESTUDIO TOMADO DEL ARTCULO: METABOLIC AND PROCESS


ENGINEERING OF CLOSTRIDIUM CELLULOVORANS FOR BIOFUEL
PRODUCTION FROM CELLULOSE.
Revisin Bibliogrfica.
La grafica 1 muestra que mientras se consume la celulosa, se produce acido butrico para la
posterior produccin de butanol y acido actico intermediario para la produccin de etanol
segn el ciclo de la bacteria mencionada en el artculo (clostridium Cellulovorans), se
escoge la celulosa y no la glucosa porque con una menor concentracin de celulosa en g/l,
se obtiene los mismos productos que con glucosa. Por lo que para completar la tarea
metablica o actividad de produccin se hace lo mismo con menos materia prima.

Grafica 1. Cintica de fermentacin de naturaleza de tipo C. cellulovorans usando (B),


Celulosa (tomada del articulo).

Para hacer nuestra base de datos se observara el consumo de celulosa hasta que la bacteria
la consumido completamente.

Grafica 2. Observacin de los puntos del consumo de Celulosa en el tiempo para la


construccin de la base de datos para la funcin exponencial (tomada del artculo).
Tiempo (horas)
celulosa (g/l)
0
8.87
25
7.00
49
4.25
68
1.26
91
0.00
Tabla 1. Base de datos del consumo
de la celulosa en horas.
La representacin en R seria de la siguiente forma:

6
4
0

C e lu lo sa

Tiempo<-c(0,25,49,68,91);Tiempo
Celulosa<-c(8.87,7,4.25,1.26,0);Celulosa

20

40
Tiempo

60

80

Figura 3. Representacin en R del consumo de sustrato (celulosa).

Entonces: sea x una variable aleatoria que indica la duracin de celulosa si se sabe que la
duracin media para degradar los compuestos celulsicos es de 91 horas (tiempos iguales
para el consumo total tanto de celulosa como glucosa a las condiciones planteadas por el
artculo al que se hace mencin al principio).
Primero defino los intervalos para calcular las probabilidades intervalo=91/7=13 por lo que
se eligen 8 intervalos a continuacin se hace la siguiente tabla:
1
1
= =0,0110
X~Exponencial(= E (x) 91

Gx(x)=

1 91
e x> 0
91
0 en otro caso

Con la funcin de densidad se obtiene la siguiente grafica desarrollando la integral:


x
Gx(x)
P(Li<=X<=Ls
Fx(x)
)
13
x
0-13
0.1331
0.1331
1 91 dx
e
91
0
13-26

26

1 91 dx
e
91
13

0.1154

0.2485

26-39

39

1 91 dx
e
91
26

0.1000

0.3485

39-52

1 91
e
91

52

0.0867

0.4352

dx

39

52-65

65

1 91 dx
e
91
52

0.0752

0.5104

65-78

78

1 91 dx
e
91
65

0.0652

0.5756

78-91

91

0.0565

0.6321

1 91 dx
e
91
78

91 +

1 91 dx
e
91
91

0.3679

1.0000

Tabla 2. Probabilidades puntuales y acumuladas a 8


intervalos de tiempo
En lenguaje R el cdigo queda de la siguiente manera:
Desarrollo en R de la Distribucin Exponencial acumulada a excepcin del primero y el
ltimo que no estn acumuladas:

Cdigo
>pexp(c(13), rate=1/91, lower.tail=TRUE)
[1] 0.1332459

Anlisis
La probabilidad puntual de que se consuma
el sustrato entre 0-13 horas es del 13.3246
%
> pexp(c(26), rate=1/91, lower.tail=TRUE) La probabilidad acumulada de que se
[1] 0.2487374
consuma el sustrato entre 0-26 horas es del
24.8737 %
> pexp(c(39), rate=1/91, lower.tail=TRUE) La probabilidad acumulada de que se
[1] 0.3488401
consuma el sustrato entre 0-39 horas es del
34. 8840%
> pexp(c(52), rate=1/91, lower.tail=TRUE) La probabilidad acumulada de que se
[1] 0.4356045
consuma el sustrato entre 0-52 horas es del
43.5604 %
> pexp(c(65), rate=1/91, lower.tail=TRUE) La probabilidad acumulada de que se
[1] 0.5108079
consuma el sustrato entre 0-65 horas es del
51.0810 %
> pexp(c(78), rate=1/91, lower.tail=TRUE) La probabilidad acumulada de que se
[1] 0.5759907
consuma el sustrato entre 0-78 horas es del
57.5991 %
Intervalo
(0-91)=0,6325 La probabilidad acumulada de que se
consuma el sustrato entre 0-91 horas es del
acumulada hasta ese putno
63.25%.
>pexp(c(91),rate=1/91, lower.tail=FALSE)
La probabilidad acumulada de que se
[1] 0.3675117
consuma el sustrato entre 91 horas o ms es
del 100% y la puntual del 36.7512%.
Tabla 3. Anlisis de Probabilidades puntuales y acumuladas a 8
intervalos de tiempo

VARIABLE DISCRETA: DISTRIBUCIN DE POISSON


Fundamentos para realizar el ejercicio (Revisin Bibliogrfica):
La distribucin Poisson es una distribucin de probabilidad discreta, porque se forma
contando algo. La distribucin de Poisson fue desarrollada por el francs Simeon Denis
Poisson, quin la describi en 1837.
Aplicaciones de la distribucin de Poisson:
1. Las aplicaciones de la distribucin pueden ser enfocadas a estudiar el nmero de txicos
encontrados en un volumen de aire emitido por una industria (contaminacin del aire).
Otras aplicaciones son en la meteorologa, para encontrar la frecuencia imprevista de
tempestades, ciclones, tornados, granizadas, inundaciones, fuegos forestales, etc., en ciertas
regiones del mundo. Otras aplicaciones importantes de la distribucin de Poisson son para
encontrar el nmero de accidentes, entre los trabajadores, como por ejemplo, en una
industria, en estudios de higiene industrial y seguridad entre otros.
Condiciones que se requieren para aplicar la distribucin de Poisson:
1. Un experimento consiste en contar el nmero de veces de que un cierto evento ocurra
(x), durante una unidad de tiempo o espacio.
2. La probabilidad de que un evento ocurra es pequea para cada unidad de tiempo o
espacio.
3. El nmero de eventos que ocurran en una unidad de tiempo o espacio es
independiente del nmero de eventos que ocurren en las otras susodichas unidades.
4. Tericamente, un nmero infinito de ocurrencias del evento deben ser posibles en el
intervalo.
Funciones probabilsticas de la distribucin Poisson:
Cuando la distribucin de Poisson es apropiada, la probabilidad de observar
exactamente x nmero de ocurrencias por unidad de medicin (horas, minutos,
centmetros cbicos, pginas, etc.), es decir, el nmero de resultados que ocurren en un
intervalo de tiempo dado o en una regin especfica, se encuentra usando las ecuaciones
de abajo:
P ( x )=f ( x )=

Donde:

x e
x!

= promedio de ocurrencias por intervalo = np


Donde: n = tamao de la muestra
p = la probabilidad
e = 2.71828... (Base de los logaritmos Neperianos)
x = 0, 1, 2,....., , es decir, los valores de la variable aleatoria X, esto es, el nmero de
resultados que ocurren en un intervalo de tiempo.
De acuerdo a la frmula de arriba, la distribucin de Poisson tiene un solo parmetro
simbolizado por la letra griega . Si conocemos este valor del promedio podemos
escribir la distribucin de probabilidad completa. Este parmetro puede ser
interpretado como el promedio de las ocurrencias, por intervalo de tiempo o espacio que
caracteriza el proceso generado por la distribucin de Poisson.
Otra manera de ver la distribucin de Poisson es usando la funcin dada:
Abajo:
x e
(
)
P x=
x!
Donde:
= np es una constante dada. Es el nmero promedio de resultados por unidad de tiempo o
regin. Aqu, debido a que es positiva para todos los posibles valores de X, entonces:

x !
x=0

CASO DE ESTUDIO TOMADO DEL TEXTO: MECANISMOS DE


DEFORMACIN PLSTICA A ALTA TEMPERATURA DE POLICRISTALES
CERMICOS.
Revisin Bibliogrfica:
Los cermicos avanzados han sido objeto de atencin preferente por parte de cientficos e
ingenieros a lo largo del siglo XX. En gran medida, este inters se basa en las peculiares
propiedades fsicas que algunos de estos sistemas presentan, que los hacen ptimos para
ciertas aplicaciones funcionales; pensemos, por ejemplo, en el UO2 en aplicaciones
nucleares, en el ZrO2 como componente de clulas de combustible o en los YBaCuO
superconductores. Otros cermicos, en cambio, son interesantes por sus potenciales

aplicaciones estructurales; por ejemplo, en 1986 se puso de manifiesto que algunos


cermicos a base de ZrO2 exhiban el comportamiento superplstico caracterstico de los
metales.
La identificacin de los mecanismos de deformacin en policristales se realiza mediante
una secuencia de ensayos mecnicos, que permiten caracterizar macroscpicamente el
proceso, y de observaciones de la microestructura de las muestras antes y despus de la
deformacin. La comparacin de ambas microestructuras permite obtener informacin
acerca de los procesos primarios y de acomodacin activos y, por tanto, identificar el
mecanismo de deformacin.
Anlisis del problema: sea x la variable aleatoria que mida la deformacin de los
policristales en un intervalo de tiempo a condiciones de temperatura como se muestran en
las siguientes graficas tomadas de los

siguientes grficos, con los cuales


haremos el anlisis para la distribucin de
poisson:

Grafica 4 y 5. Presin y tiempo de deformacin (se debe pasar a tiempo) (4). Y


Frecuencia de deformacin y no deformacin de los policristales (5) con tendencia de
poisson.
Los ensayos mecnicos a alta temperatura (entre 1450 C y 1650 C) revelaron un
exponente de tensin sistemticamente menor que uno (con un valor promedio en torno a
0.5) para ambas muestras en todas las condiciones experimentales. Las observaciones
micro estructurales eran consistentes, en principio, con un mecanismo de deslizamiento de

fronteras de grano acomodado por disolucin - precipitacin. Estos resultados eran


sorprendentes porque los distintos modelos comnmente invocados para explicar la
fluencia de este tipo de materiales predicen exponentes de tensin iguales a uno o
comprendidos entre uno y dos. Y por este caso en particular tienen una distribucin que
tiene una tendencia de poisson tanto para la configuracin de los policristales cuando se
deforman como tambin, cuando no estn deformados(antes de someterse a las
temperaturas), con una media de 5m, para cualquiera de los casos. La temperatura a la
cual se someten a deformacin es de 1450 C, 1550C y 1650 C, se puede hallar el
tiempo en el cual ocurre dicha deformacin a las condiciones de presin (que son las
mismas para las tres temperaturas), para este caso se tomo a 1650 C para realizar el
ejercicio.

Grafica 6. Presin y tiempo de deformacin (se debe pasar a tiempo), lectura de para
hallar tiempo.
A 1650C y 90MPa con una media de 0.5 de deformados el tiempo para la formacin de las
microestructuras (Nota: se aclara que en la grafica esta a diferentes presiones a las cuales se
forman las microestructuras); en todos los casos siguen una distribucin de poisson, para
ese punto el tiempo es igual a:
=124 seg1 (Dato ledo de la tabla 6), Con este dato encontramos el tiempo en el cual
ocurren las deformaciones para esta temperatura a la presin dada, entonces se calcula de
la siguiente manera:

Son:

1
T

T=

Donde

entonces

T=

1
=20736 seg
si lo pasamos a horas
12 seg1
4

20736 seg
1hora=5.76 horas
3600 seg

Cabe resaltar que no tienen el mismo comportamiento de tiempo. Para todos los casos solo
basta con observar la lnea que se trazo, paso por los tres intervalos de temperatura tocando
todos los puntos a pesar de estar a diferentes temperaturas pero a la misma presin pero
variando en el tiempo, con un promedio de deformacin de cristales de 0.5m.
Ahora se cuenta que la deformacin del proceso tiene un promedio de 0,5m cada 5.76
horas a la temperatura y presin dadas (tambin cabe resaltar que el promedio se mantiene
por todo el proceso a pesar de que las presiones y temperaturas cambien pero para mi caso
lo trabaje a 1650C y 90MPa); cabe resaltar que los intervalos de tiempo son diferentes
para las tres temperaturas.
X: variable aleatoria que denota la deformacin por unidad de tiempo.
Ahora puedo hacer la siguiente pregunta Cul es la probabilidad de que un policristal se
deforme 0.5m durante un tiempo cualquiera?, y esto se explica por la difusin y
transferencia de calor ya que el calor debe penetrar a travez de la estructura del policristal y
en ese transcurso asa el interior de la estructura ocurrirn deformaciones.
Tambin se puede hallar la probabilidad de que se registre distinto nmero de
deformaciones en las mismas 5.76 horas.

x e
f ( x )=P ( X =x ) =
x=0,1,2, .. ,
x!
0 en otro caso
El lambda =0.5
Calculando con la funcin de densidad se halla la siguiente tabla para el caso en x vale de
0m de deformacin hasta 10m de deformacin: entonces X=1,2,3,4,5,6,7,8,9,10.
x
0

P(x)=f(x)
0 0.5
0.5 e
0!

P(x)
0.6065

0.51 e0.5
1!

0.3033

0.52 e0.5
2!

0.0758

0.53 e0.5
3!

0.0126

0.54 e0.5
4!

0.0016

0.55 e0.5
5!

0.0002

0.5 e
6!

6 0.5

1.3163E-5

0.57 e0.5
7!

9.4018E-7

0.58 e0.5
8!

5.7861E-8

0.5 e
9!

9 0.5

3.2664E-9

10 0.5
10
1.6323E-10
0.5
e
Cdigo R
Anlisis
de resultados
! un policristal se deforme 0m a
> dpois(0,0.5)
La probabilidad de 10
que
[1] 0.6065307
1650C y 90MPa
es del 60.6531% 1.0000
Suma
> dpois(1,0.5)
La probabilidad
de
que un policristal
se deforme
Tabla 4. Probabilidades
puntuales
para 1m a
[1] 0.3032653
1650C yla90MPa
es del 30.3265%
deformacin
de policristales
> dpois(2,0.5)
La probabilidad de que un policristal se deforme 2m a
[1] 0.07581633
1650C y 90MPa es del 7.5816%
> dpois(3,0.5)
La probabilidad de que un policristal se deforme 3m a
[1] 0.01263606
1650C y 90MPa es del 1.2636%
> dpois(4,0.5)
La probabilidad de que un policristal se deforme 4m a
[1] 0.001579507 1650C y 90MPa es del 0.157951% (Pbaja)
> dpois(5,0.5)
La probabilidad de que un policristal se deforme 5m a
[1] 0.0001579507 1650C y 90MPa es del 0.0157951% ( Pmuy baja)
> dpois(6,0.5)
La probabilidad de que un policristal se deforme 6m a
[1] 1.316256e-05 1650C y 90MPa es del 0.00131625% (Pmuy baja)
> dpois(7,0.5)
La probabilidad de que un policristal se deforme 7m a
[1] 9.401827e-07 1650C y 90MPa es del 9.401827e-05% (Pmuy baja)
> dpois(8,0.5)
La probabilidad de que un policristal se deforme 8m a
[1] 5.876142e-08 1650C y 90MPa es del 5.876142e-06 % (Pmuy baja)
> dpois(9,0.5)
La probabilidad de que un policristal se deforme 9m a
[1] 3.264523e-09 1650C y 90MPa es del 3.264523e-07% (Pmuy baja)
> dpois(10,0.5)
La probabilidad de que un policristal se deforme 10m a
[1] 1.632262e-10 1650C y 90MPa es del 1.632262e-08% (Pmuy baja)
Tabla 5. Anlisis Probabilidades puntuales para la deformacin de
policristales

Ahora
se
procede
a
calcular
lo
anterior
en
el
cdigo
de R:

Observando la tabla anterior se puede concluir que los datos calculados con la funcin y los
calculados con el programa R son muy parecidos con la diferencia en que en R el clculo se
hace de inmediato.
Alternativa: Si se da la probabilidad de tener, de manera exacta, (y) ocurrencias en un
intervalo (t) veces mayor o menor que el de referencia en la medicin entonces la
distribucin de probabilidades de Y nmero de xitos en la nueva unidad de referencia
viene dada por:
y

f ( y )=

t e
y!

Donde Promedio de ocurrencias por intervalo unidad de medida considerada en X y


t= Nmero de intervalos unidades de medida especificados donde u (y)=t.
Tambin se puede proceder a trabajar y hallar sus correspondientes probabilidades
variando el tiempo (con esto tambin se varia el lambda) para saber el porcentaje de
deformacin de policristales en el proceso (recuerde que el promedio de deformaciones es
de 5m).
Ahora se toma varios intervalos de tiempo (1, 2, 3, 4, y 5 horas), con lo cual quedara
mejor ilustrado mi ejemplo y se observara como van evolucionando las deformaciones a
diferentes lambdas.
y= variable aleatoria que indica el promedio de deformacin a 2, 3, 4, 5 y 6 horas a las
condiciones elegidas en nuestro proceso de deformacin de policristales. Hallar la
probabilidad de que en los tiempos dados se deforme entre 0.5m y 1m.
Entonces t1=0.5*1=0.5; t2=0.5*2=1;
t5=0.5*6=3.

t3=0.5*3=1.5; t4=0.5*4=2; t5=0.5*5=2.5;

Reemplazo los calculados anteriormente en el cdigo de R menos para el primero ya que


el lambda no vara la probabilidad queda de la siguiente forma:
P (0.5<=y<=1) = p (y<=1) - p (y<=0) esto lo pasamos al cdigo de R:
Codigo
> a<-ppois(0,1);a
[1] 0.3678794
> a1<-ppois(1,1);a1
[1] 0.7357589

Anlisis de resultados
La probabilidad de que los policristales se
deformen entre 0.5m y 1m en 2 horas es del
36.7879 %.

> a2<-(a1-a);a2
[1] 0.3678794
>
La probabilidad de que los policristales se
> b<-ppois(0,1.5);b
deformen entre 0.5m y 1m en 3 horas es del
[1] 0.2231302
55.7825 %.
> b1<ppois(1,1.5);b1
[1] 0.5578254
> b2<-(b1-b);b2
[1] 0.3346952
>
La probabilidad de que los policristales se
> c<-ppois(0,2);c
deformen entre 0.5m y 1m en 4 horas es del
[1] 0.1353353
27.0671%.
> c1<-ppois(1,2);c1
[1] 0.4060058
> c2<-(c1-c);c2
[1] 0.2706706
>
La probabilidad de que los policristales se
> d<-ppois(0,2.5);d
deformen entre 0.5m y 1m en 5 horas es del
[1] 0.082085
20.5212 %.
> d1<ppois(1,2.5);d1
[1] 0.2872975
> d2<-(d1-d);d2
[1] 0.2052125
>
La probabilidad de que los policristales se
> e<-ppois(0,3);e
deformen entre 0.5m y 1m en 6 horas es del
[1] 0.04978707
14.9361 %.
> e1<-ppois(1,3);e1
[1] 0.1991483
> e2<-(e1-e);e2
[1] 0.1493612
Tabla 6. Anlisis de las probabilidades de deformacin a diferentes
tiempos con un intervalo de deformacin de 0.5m-1m de
policristales
MODELO DE REGRESION CON 3 VARIABLES INDEPENDIENTES X1, X2 y X3.
Para este anlisis se busco una referencia bibliogrfica en la base de datos science direct y
se eligi el artculo: H2 production by sorption enhanced steam reforming ofbiomassderived bio-oil in a fluidized bed reactor: An assessment ofthe effect of operation variables

using response surface methodology. Para poder construir mi base de datos. La siguiente
tabla fue extrada de dicho artculo.

Tabla 7. Datos experimentales del rendimiento de H2.


Ahora se procede al anlisis de nuestro problema de estudio y de las variables que
intervienen y la posterior explicacin del modelo de regresin lineal al cual ajustamos
dichas variables.
los datos de la tabla 7 son los datos obtenidos de la Produccin de H2 (en trminos de su
rendimiento) por absorcin mejorada de reformado con vapor, de la biomasa derivada de
bio-aceite en un reactor de lecho fluidizado: Una evaluacin del efecto de las variables de
operacin utilizando la metodologa de superficie de respuesta. Ahora se procede a definir
mi variable dependiente y las tres variables independientes. Se arranca nuestro ejercicio con
3 variables independientes para ver cul de todas o si todas ajustan el rendimiento, todo
enfocado a cumplir los objetivos propuestos al inicio del trabajo.
Variable dependiente:
Y= Rendimiento H2 (%)
Variables independientes:
X1= Selectividad H2 (%)
X2= Pureza H2 (vol. %)
X3=Temperatura (C)
Ahora se procede a resolver el modelo en R con 10 observaciones para cada variable:
Datos de entrada en R:
> Y<-c(65.5, 92.48, 74.17, 94.71, 51.86, 86.37, 64.28, 88.33, 85.35, 22.48)

> X1<-c(90.22, 98.77, 95.05, 99.75, 77.74, 98.56, 86.4, 99.8, 98.82, 73.26)
> X2<-c(94.72, 96.53, 97.28, 96.55, 87.35, 96.25, 92.29, 96.42, 98.94, 81.44)
> X3<-c(516, 634, 516, 634, 516, 634, 516, 634, 575, 475)
Los datos se visualizan en el siguiente data.frame:
>datos<-data.frame(Y,X1,X2,X3);datos
Y
X1
X2
1
65.5 90.2 94.7
0
2
2
2
92.4 98.7 96.5
8
7
3
3
74.1 95.0 97.2
7
5
8
4
94.7 99.7 96.5
1
5
5
5
51.8 77.7 87.3
6
4
5
6
86.3 98.5 96.2
7
6
5
7
64.2 86.4 92.2
8
0
9
8
88.3 99.8 96.4
3
0
2
9
85.3 98.8 98.9
5
2
4
10 22.4 73.2 81.4
8
6
4
Tabla 8. Base de datos

X3
516
634
516
634
516
634
516
634
575
475

> pairs(datos,main="Rendimiento H2 (% )")# matriz de grficos bidimensionales.

Rendimiento H2 (% )
75 85 95

500

600

75 85 95

20

60

95

X1

600

85

X2

500

X3
20

60

85

95

Grafica 7. Matriz de grficos bidimensionales.


En la grafica 7 se puede observar un comportamiento bastante lineal en la base de datos que
se ha construido, se podra decir que casi todas se pueden explicar con el modelo lineal.
MATRIZ DE CORRELACION: correlacin de orden cero (correlacin simple:marginal)
> R<-cor(datos);R
Y
1.0000000
0.9663441
0.9313163

X1
X2
Y
0.9663441 0.9313163
X1
1.0000000 0.9526421
X2
0.952642 1.0000000
1
X3 0.8702770 0.830245 0.6625810
7
Tabla 9. Matriz de correlacin de
cero

X3
0.8702770
0.8302457
0.6625810
1.0000000
orden

La matriz de correlacin R es una matriz cuadrada n X n constituida por los coeficientes de


correlacin de cada pareja de variables; de manera que tendr unos en su diagonal
principal, y en los elementos no diagonales (i,j) los correspondientes coeficientes de

correlacin rij . La matriz de correlacin ser, obviamente, simtrica, y conservar las


propiedades de ser definida-positiva y tener un determinante no negativo.
El ajuste de la regresin lineal se puede hacer por a) MRLS, Y b) MRLM: a continuacin
presentare 2 ejemplos (1 es al azar y el otro con todas las variables ya que como se ver
ms adelante es el modelo que mejor ajusta los datos); del primero para observar que dan
iguales y el resto lo hago con MRLM incluido el caso no lineal con logaritmos ya que en lo
personal me parece ms sencillo el cdigo.
a. MRLS:
> (ajuste1<-lm(datos[,1]~datos[,2]))
> summary(ajuste1)
Call:
lm(formula = datos[, 1] ~ datos[, 2])
Residuals:
Min
1Q
Median
3Q
Max
-8.655 -3.279
-1.574
4.314 10.737
Tabla 10. Resumen del rendimiento de H2 (%)
~pureza H2 (vol. %)
Coeficientes:
Estimate
Std. Error
t value
Pr(>|t|)
(Intercept) -132.1996
19.3687
-6.825
0.000134 ***
datos[, 2]
2.2295
0.2098
10.625
5.39e-06 ***
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 6.134 on 8 degrees of freedom Multiple Rsquared: 0.9338, Adjusted R-squared: 0.9255 F-statistic: 112.9 on 1
and 8 DF, p-value: 5.39e-06
Tabla 11. Modelo: rendimiento de H2 (%) ~pureza H2 (vol. %)
El modelo generado es: Y= -132.1996 + 2.2295X1
Inferencia en el modelo de regresin simple:
Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores son 19.3687 y 0.2098
respectivamente.

La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su


error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.9338 que est muy cercano a 1 por lo que los valores se
ajustan relativamente bien.
> Yest1<-ajuste1$fitted.values # obtener los valores ajustados (estimados) por el modelo
> Error1<- ajuste1$residuals # generar los valores de los errores
> cbind(datos[,1],Yest1,Error1)
originales
Yest1
Error1
1
65.50
68.94786
-3.447862
2
92.48
88.01028
4.469721
3
74.17
79.71646
-5.546455
4
94.71
90.19521
4.514789
5
51.86
41.12342
10.736577
6
86.37
87.54208
-1.172079
7
64.28
60.43109
3.848913
8
88.33
90.30669
-1.976687
9
85.35
88.12175
-2.771755
10
22.48
31.13516
-8.655162
Tabla 12. Valores estimados del rendimiento de
H2 (%)
> mean(Error1) #verificacin de la suma cero
[1] 2.203099e-17 #se puede concluir que es cero
Ahora se procede a verificar el modelo con todos los datos en R:
> datos1<-as.data.frame(datos)
> (ajuste2.lm<-lm(datos[,1]~datos[,2]+datos[,3]+datos[,4]))
> summary(ajuste2.lm)
Call:
lm(formula = datos[, 1] ~ datos[, 2] + datos[, 3] + datos[, 4])

Residuals:
Min
-3.8386

1Q
-1.7701

Median
-0.2681

3Q
1.6199

Max
4.621
4
Tabla 13. Resumen del rendimiento de H2 (%)
~Selectividad (%)+pureza H2 (Vol. %)+Temperatura(C)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
(Intercept)
-330.73119
47.41835
-6.975
0.000432 ***
datos[, 2]
-1.13045
0.72982
-1.549
0.172368
datos[, 3]
4.08418
0.97726
4.179
0.005818 **
datos[, 4]
0.21964
0.04512
4.868
0.002800 **
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 3.153 on 6 degrees of freedom
Multiple R-squared: 0.9869, Adjusted R-squared: 0.9803
F-statistic: 150.5 on 3 and 6 DF, p-value: 4.915e-06
Tabla 14.Modelo: rendimiento de H2 (%) ~Selectividad H2 (%)+pureza H2(Vol.
%)+Temperatura(C)
El modelo generado es: Y= -330.7312 1.13045X1+ 4.0842X2 + 0.2196X3
Inferencia en el modelo de regresin simple:
Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores se visualizan en la tabla
14.
La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.9869 que est muy cercano a 1 por lo que los valores se
ajustan bien (este es el modelo que a pesar de involucrar todas las variables tiene un R
mayor que el resto de los modelos).
> Yest2<-ajuste2.lm$fitted.values # obtener los valores ajustados (estimados) por el
modelo.
> Error2<- ajuste2.lm$residuals # generar los valores de los errores

> sum(Error2)
[1] 3.885781e-16
> cbind(datos[,1],Yest2,Error2)
originales
Yest2
Error2
1
65.50
67.46975
-1.9697529
2
92.48
91.11479
1.3652097
3
74.17
72.46517
1.7048250
4
94.71
90.08863
4.6213703
5
51.86
51.47737
0.3826274
6
86.37
90.20861
-3.8386139
7
64.28
61.86352
2.4164831
8
88.33
89.50116
-1.1711631
9
85.35
87.94213
-2.5921317
10
22.48
23.39885
-0.9188540
Tabla 15. Valores estimados del rendimiento de
H2 (%)
De la tabla 15 se puede inferir que al generar con el modelo los nuevos datos del
rendimiento de H2 estos no estn tan lejanos de los datos originales por lo que es una muy
buena aproximacin de los datos reales.
> mean(Error2)
[1] 3.887407e-17 # se puede decir que el error es cero.
Ahora se har un anlisis de todas las variables involucradas con la opcin b) MRLM:
> Y1<-lm(Y~X1);summary(Y1)
Call:
lm(formula = Y ~ X1)

Residuals:

Min
-8.655

1Q
-3.279

Media
n
-1.574

3Q
4.314

Max
10.737

Tabla 16. Resumen del rendimiento de H2 (%)


~Selectividad H2 (%)
Coefficients:

Estimate
-132.1996

Std. Error
19.3687

t value
-6.825

Pr(>|t|)
0.000134 ***

(Intercept
)
X1
2.2295
0.2098
10.625
5.39e-06 ***
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 6.134 on 8 degrees of freedom
Multiple R-squared: 0.9338, Adjusted R-squared: 0.9255
F-statistic: 112.9 on 1 and 8 DF, p-value: 5.39e-06
Tabla 17.Modelo: rendimiento de H2 (%) ~Selectividad H2 (%)

El modelo generado es: Y= -132.1996 2.2295 Nota: este modelo ya haba sido hecho
previamente con una variacin del cdigo y se puede observar en la tabla 11, por lo que no
se volver a repetir el anlisis.
> Y2<-lm(Y~X2);summary(Y2)
Call:
lm(formula = Y ~ X2)
Residuals:
Min
1Q
Median
3Q
Max
-11.9261
-6.0040 0.8892
5.2331 11.4362
Tabla 18. Resumen del rendimiento de H2 (%)
~+pureza H2(Vol.%)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
(Intercept) -290.0031 50.2039
-5.777
0.000416 ***
X2
3.8662
0.5346
7.233
8.96e-05 ***
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 8.684 on 8 degrees of freedom
Multiple R-squared: 0.8674, Adjusted R-squared: 0.8508

F-statistic: 52.31 on 1 and 8 DF, p-value: 8.957e-05


Tabla 19.Modelo: rendimiento de H2 (%) ~+pureza H2 (Vol.%)
Y= -290.0031+ 3.8662X2
Inferencia en el modelo de regresin simple:
Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores se visualizan en la tabla
19.
La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.8674 que es cercano a 1 por lo que los valores todava se
ajustan relativamente bien.
> Y3<-lm(Y~X3);summary(Y3)
Call:
lm(formula = Y ~ X3)
Residuals:
Min
-22.5561

1Q
Median 3Q
Max
-0.0543 7.623 16.5984
5.6135
4
Tabla 20. Resumen del rendimiento de H2(%)
~Temperatura(C)
Coefficients:
Estimat
e
-100.19182

Std. Error

t
value
-2.882

Pr(>|t|)

(Interce
34.76611
0.02045 *
pt)
X3
0.30574
0.06118
4.997
0.00106 **
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 11.74 on 8 degrees of freedom
Multiple R-squared: 0.7574,
Adjusted R-squared:

0.7271
F-statistic: 24.97 on 1 and 8 DF, p-value: 0.001056
Tabla
21.Modelo:
rendimiento
de
H2(%)
~Temperatura(C)
Y= -100.1918+ 0.3057X3
Inferencia en el modelo de regresin simple:
Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores se visualizan en la tabla
21.
La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.7574 este valor no es muy cercano a 1 pero los valores
todava se ajustan relativamente bien.
> Y4<-lm(Y~X1+X2);summary(Y4)
Call:
lm(formula = Y ~ X1 + X2)
Residuals:
Min
-7.4496

1Q
-4.1058

Median
-0.9335

3Q
Max
4.478 10.2369
6
Tabla 22. Resumen del rendimiento de H2 (%)
~Selectividad H2 (%)+pureza H2(Vol.%)
Coefficients:
Estimate Std. Error
t value Pr(>|t|)
(Intercept) -153.9622 62.8105
-2.451
0.0440 *
X1
1.9743
0.7307
2.702
0.0306 *
X2
0.4820
1.3148
0.367
0.7248
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 6.495 on 7 degrees of freedom

Multiple R-squared: 0.9351, Adjusted R-squared: 0.9165


F-statistic: 50.4 on 2 and 7 DF, p-value: 6.976e-05
Tabla 23.Modelo: rendimiento de H2 (%) ~Selectividad H2 (%)
+pureza H2 (Vol.%)
Y= -153.9622+ 1.9743X1+ 0.4820X2
Inferencia en el modelo de regresin simple:
Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores se visualizan en la tabla
23.
La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.9351 este valor es cercano a 1 los valores se ajustan
relativamente bien al modelo lineal.
> Y5<-lm(Y~X1+X3);summary(Y5)
Call:
lm(formula = Y ~ X1 + X3)
Residuals:
Min

1Q

Media
3Q
Ma
n
x
-9.5229 -2.8970 -0.3965
2.4136
8.5950
Tabla 24. Resumen del rendimiento de H2(%)
~Selectividad H2 (%)+Temperatura(C)
Coefficients:
Estimate
-137.13942

Std. Error
18.55862

t value
-7.390

Pr(>|t|)
0.000151 ***

(Intercept
)
X1
1.81044
0.35437
5.109
0.001386 **
X3
0.07686
0.05396
1.424
0.197344
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Residual standard error: 5.774 on 7 degrees of freedom


Multiple R-squared: 0.9487, Adjusted R-squared: 0.934
F-statistic: 64.72 on 2 and 7 DF, p-value: 3.059e-05
Tabla 25.Modelo: rendimiento de H2(%) ~Selectividad H2 (%)
+Temperatura(C)
Y= -137.1394+ 1.8104X1+ 0.07686X2
Inferencia en el modelo de regresin simple:
Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores se visualizan en la tabla
25.
La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.9487 este valor es cercano a 1 los valores se ajustan
relativamente bien al modelo lineal.
> Y6<-lm(Y~X2+X3);summary(Y6)
Call:
lm(formula = Y ~ X2 + X3)
Residuals:
Min
-3.6151

1Q

Median
-0.7828

3Q
Max
2.989 3.9456
2.2802
8
Tabla 26. Resumen del rendimiento de H2
(%) ~pureza H2 (Vol. %)+Temperatura(C)
Coefficients:
(Intercept
)
X2
X3

Estimate
-263.17230

Std. Error
20.37920

2.62467
0.15857

0.28389
0.02403

t value
-12.914

Pr(>|t|)
3.88e-06 ***

9.245
6.600

3.58e-05 ***
0.000304 ***

Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1


Residual standard error: 3.454 on 7 degrees of freedom
Multiple R-squared: 0.9816, Adjusted R-squared: 0.9764
F-statistic: 187.1 on 2 and 7 DF, p-value: 8.393e-07
Tabla 27.Modelo: rendimiento de H2 (%) ~pureza H2(Vol.%)
+Temperatura(C)
Y= -263.1723+ 2.6247X2+ 0.1586X3
Inferencia en el modelo de regresin simple:
Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores se visualizan en la tabla
27.
La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.9816 este valor es cercano a 1 los valores se ajustan
relativamente bien al modelo lineal.
> Y7<-lm(Y~X1+X2+X3);summary(Y7)
Call:
lm(formula = Y ~ X1 + X2 + X3)
Residuals:
Min

1Q

-3.8386

Media
n
-0.2681

3Q

Ma
x
1.6199 4.6214

1.7701
Tabla 28. Resumen del rendimiento de H2
(%) ~Selectividad H2 (%)+pureza H2(Vol.
%)+Temperatura(C)
Coefficients:
(Intercept

Estimate
-330.73119

Std. Error
47.41835

t value
-6.975

Pr(>|t|)
0.000432 ***

)
X1
-1.13045
0.72982
-1.549
0.172368
X2
4.08418
0.97726
4.179
0.005818 **
X3
0.21964
0.04512
4.868
0.002800 **
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 3.153 on 6 degrees of freedom
Multiple R-squared: 0.9869, Adjusted R-squared: 0.9803
F-statistic: 150.5 on 3 and 6 DF, p-value: 4.915e-06
Tabla 29.Modelo: rendimiento de H2 (%) ~Selectividad H2 (%)+pureza
H2 (Vol.%)+Temperatura(C)
El modelo generado es: Y= -330.7312 1.13045X1+ 4.0842X2 + 0.2196X3 Nota: no
repito el anlisis ya que esta hecho en la tabla 14. (Se puede concluir que este es el modelo
que mejor ajusta los datos teniendo en cuenta que se tienen 3 variables independientes).
Ahora se hace un anlisis con regresin no lineal aplicando log para cumplir con el objetivo
especfico 3.1:
> Y8<-lm(log(Y)~log(X1));summary(Y8)
Call:
lm(formula = log(Y) ~ log(X1))
Residuals:
Min

1Q

Media 3Q
Max
n
-0.31127 -0.05465 -0.01217
0.02477 0.31102
Tabla 30. Resumen del log rendimiento de H2 (%) ~log
Selectividad H2 (%)
Coefficients:
Estimate
-12.0316

Std. Error
2.2563

t value
-5.332

Pr(>|t|)
7e-04 ***

(Intercept
)
log(X1)
3.5993
0.4996
7.204
9.21e-05 ***
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.1681 on 8 degrees of freedom
Multiple R-squared: 0.8664, Adjusted R-squared: 0.8497
F-statistic: 51.89 on 1 and 8 DF, p-value: 9.211e-05
Tabla 31.Modelo: log rendimiento de H2 (%) ~log Selectividad H2

(%)
Para el caso de log se puede observar que el R-cuadrado baja con respecto al modelo que
hizo previamente a los datos de la base sin ningn tipo de tratamiento previo para hallar el
modelo, este comportamiento tambin se repite para el resto de los datos, cabe resaltar que
los p-valores son bajos Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Los modelos que se obtienen a continuacin como ya se haba mencionado
presentan la misma tendencia que el modelo de la tabla 31(salvo unas excepciones). Y se
observaran a continuacin.
> Y9<-lm(log(Y)~log(X2));summary(Y9)
Call:
lm(formula = log(Y) ~ log(X2))
Residuals:
Min

1Q

Media
3
Max
n
Q
-0.17322 -0.14023 0.04800
0.09086 0.20592
Tabla 32. Resumen del log rendimiento de H2 (%) ~log
pureza H2 (vol. %)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
(Intercept)
-26.8519
3.5993
-7.460
7.19e-05 ***
log(X2)
6.8445
0.7929
8.633
2.51e-05 ***
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.1432 on 8 degrees of freedom
Multiple R-squared: 0.9031, Adjusted R-squared: 0.8909
F-statistic: 74.53 on 1 and 8 DF, p-value: 2.515e-05
Tabla 33.Modelo: log rendimiento de H2 (%) ~log pureza H2 (vol. %)
Log*(Y= -26.8519+ 6.8445X2) este modelo ajusta mejor los datos involucrados que el
modelo que se observa en la tabla 19.
Inferencia en el modelo de regresin simple:

Los errores tpicos de los estimadores de los parmetros beta0 y beta1 se encuentran en la
columna Std Error de la salida anterior. En el ejemplo, sus valores se visualizan en la tabla
33.
La columna t value contiene el estadstico t, es decir, cociente entre cada estimador y su
error tpico. Estos cocientes son la base para llevar a cabo los contrastes (H0: beta0 = 0) y
(H0:beta1 = 0). Los correspondientes p-valores aparecen en la columna Pr (>|t|). En este
caso son muy pequeos por lo que se rechazan ambas hiptesis para los niveles de
significacin habituales. Por lo que los Bj son diferentes de cero y los Xj deben ir en el
modelo. Con un R-Cuadrado de 0.9031 que es cercano a 1 por lo que los valores todava se
ajustan relativamente bien.
> Y10<-lm(log(Y)~log(X3));summary(Y10)
Call:
lm(formula = log(Y) ~ log(X3))
Residuals:

Min

1Q

Media
3Q
Max
n
-0.59597 -0.09251 -0.02281
0.19205 0.34644
Tabla 34. Resumen del log rendimiento de H2 (%)~log
Temperatura(C)
Coefficients:
Estimat
e
-15.0006

Std. Error

t value

Pr(>|t|)

(Intercept
5.1832
-2.894
0.02007 *
)
log(X3)
3.0356
0.8186
3.708
0.00597 **
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.2789 on 8 degrees of freedom
Multiple R-squared: 0.6322, Adjusted R-squared: 0.5862
F-statistic: 13.75 on 1 and 8 DF, p-value: 0.005971
Tabla 35.Modelo:log rendimiento de H2 (%)~log Temperatura(C)
El modelo que se visualiza en la tabla 35, no es mejor modelo que el que se encuentra en la
tabla 21. Por lo que me quedo con el anlisis de la tabla 21.

> Y11<-lm(log(Y)~log(X1)+log(X2));summary(Y11)
Call:
lm(formula = log(Y) ~ log(X1) + log(X2))
Residuals:
Min
1Q
Median
3Q
Max
-0.17729 -0.11856 0.02764 0.07664 0.24076
Tabla 36. Resumen del log rendimiento de H2 (%)
~log selectividad H2 (%)+log pureza H2(Vol.%)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
(Intercept) -23.4847
6.7699
-3.469
0.0104 *
log(X1)
0.9368
1.5674
0.598
0.5689
log(X2)
5.1711
2.9196
1.771
0.1198
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.1493 on 7 degrees of freedom
Multiple R-squared: 0.9078, Adjusted R-squared: 0.8814
F-statistic: 34.45 on 2 and 7 DF, p-value: 0.0002383
Tabla 37.Modelo:log rendimiento de H2 (%) ~log selectividad H2
(vol. %)+log pureza H2 (Vol.%)
El modelo que se visualiza en la tabla 37, no es mejor modelo que el que se encuentra en la
tabla 23. Por lo que me quedo con el anlisis de la tabla 23.
> Y12<-lm(log(Y)~log(X1)+log(X3));summary(Y12)
Call:
lm(formula = log(Y) ~ log(X1) + log(X3))
Residuals:
Min
1Q
Median
3Q
Max
-0.31633 -0.04774 -0.00897
0.02572 0.29631
Tabla 38. Resumen del log rendimiento de H2 (%)
~log selectividad H2 (%)+log Temperatura(C)
Coefficients:

Estimate
Std. Error t value
Pr(>|t|)
(Intercept) -12.7750
3.3752
-3.785
0.00685 **
log(X1)
3.3541
0.9470
3.542
0.00945 **
log(X3)
0.2923
0.9350
0.313
0.76369
Signif. Codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.1785 on 7 degrees of freedom
Multiple R-squared: 0.8683, Adjusted R-squared: 0.8306
F-statistic: 23.07 on 2 and 7 DF, p-value: 0.0008297
Tabla 39.Modelo: log rendimiento de H2 (%) ~log
selectividad H2 (%)+log Temperatura(C)
El modelo que se visualiza en la tabla 39, no es mejor modelo que el que se encuentra en la
tabla 25. Por lo que me quedo con el anlisis de la tabla 25.
> Y13<-lm(log(Y)~log(X2)+log(X3));summary(Y13)
Call:
lm(formula = log(Y) ~ log(X2) + log(X3))
Residuals:
Min

1Q

Media
n
-0.01765

3Q

Max

-0.03676
0.03098 0.20151
0.162
44
Tabla 40. Resumen del log rendimiento de H2 (%)
~log pureza H2 (Vol.%)+log Temperatura(C)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
(Intercept)
-27.3845
2.9301
-9.346
3.34e-05 ***
log(X2)
5.4891
0.8779
6.253
0.000423 ***
log(X3)
1.0560
0.4653
2.269
0.057542
Signif. Codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.1162 on 7 degrees of freedom
Multiple R-squared: 0.9441, Adjusted R-squared: 0.9282
F-statistic: 59.16 on 2 and 7 DF, p-value: 4.118e-05
Tabla 41.Modelo: log rendimiento de H2 (%) ~log pureza H2 (Vol. %)+log

Temperatura(C)
El modelo que se visualiza en la tabla 41, no es mejor modelo que el que se encuentra en la
tabla 27. Por lo que me quedo con el anlisis de la tabla 27.
> Y14<-lm(log(Y)~log(X1)+log(X2)+log(X3));summary(Y14)
Call:
lm(formula = log(Y) ~ log(X1) + log(X2) + log(X3))
Residuals:
Min
1Q
Median
3Q
Max
-0.120893 -0.031666
0.004532 0.036873 0.072390
Tabla 42. Resumen del log rendimiento de H2 (%) ~log
selectividad H2 (%)+log pureza H2 (Vol. %)+log
Temperatura(C)
Coefficients:
Estimate
Std. Error
t value
Pr(>|t|)
(Intercept)
-46.1663
5.6036
-8.239
0.000173 ***
log(X1)
-4.9984
1.4121
-3.540
0.012225 *
log(X2)
12.3440
2.0104
6.140
0.000854 ***
log(X3)
2.6719
0.5387
4.960
0.002553 **
Signif. Codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.07142 on 6 degrees of freedom
Multiple R-squared: 0.9819, Adjusted R-squared: 0.9729
F-statistic: 108.6 on 3 and 6 DF, p-value: 1.285e-05
Tabla 43.Modelo: log rendimiento de H2 (%) ~log selectividad H2 (%)+log pureza H2
(Vol. %)+log Temperatura(C)
El modelo que se visualiza en la tabla 43, no es mejor modelo que el que se encuentra en la
tabla 29. Por lo que me quedo con el anlisis de la tabla 29.
CONCLUSIONES
Muchas cosas se pueden modelar con la distribucin exponencial, y ms cuando los datos
que son objeto de estudio representan muy bien la forma de dicha distribucin para el caso
de estudio con Clostridium cellulovorans, el comportamiento cuando este va consumiendo
como sustratos los materiales celulsicos, para dar lugar a la formacin de nuevos

productos. Se encontr que el tiempo para degradar estos materiales es de 91 horas, lo que
nos hace pensar que este tipo de microorganismos mantienen una tasa metablica ya sea
que se utilice como sustrato celulosa o glucosa y esto es debido a la capacidad enzimtica
que toda bacteria tiene para de esta forma obtener la energa necesaria para la obtencin de
biomasa y para la produccin de analitos de inters que son utilizados por el hombre como
es el caso de cidos y alcoholes (comnmente etanol o butanol). Entonces con la
distribucin exponencial se puede saber con exactitud la probabilidad de consumo de
sustrato para nuestro caso, claro que tambin se puede modelar otras variables del proceso
ya que por lo regular siguen una distribucin exponencial como un caso particular
hablemos por ejemplo de la produccin de biomasa del microorganismo ya que esta
biomasa tambin sigue una distribucin exponencial por lo que tambin se podra saber con
exactitud la probabilidad de producir biomasa en un determinado momento.
La distribucin de poisson tiene un valor especial y es que al conocer el promedio de un
evento en un intervalo de tiempo determinado como puede ser el caso de la deformacin de
un policristal a condiciones de presin y temperatura dadas. Se puede encontrar la
probabilidad de que ocurra dicho evento en un tiempo cualquiera siguiendo las condiciones
iniciales del problema, ya que si nos remontamos al caso de estudio el intervalo de tiempo
varia con respecto a la presin para cada temperatura dada (1450 C, 1550C y 1650C),
por lo que la probabilidad de que ocurra el mismo evento a temperaturas distintas al mismo
intervalo de tiempo es muy bajo, pero afortunadamente el histograma de deformaciones
sigue un comportamiento de poisson, por lo que dicho modelo explica muy bien la
probabilidad de deformacin de policristales para el caso particular al cual las
observaciones fueron tomadas.
El modelo que mejor representa los datos es el presentado en la tabla 14 ya que el Rcuadrado como se ha comentado antes es el mayor de todos por lo que ajusta mejor los
datos a la regresin lineal que los dems modelos, tambin cabe resaltar que los valores
estimados de la tabla 15 son muy cercanos a los valores que tenamos en un principio en
nuestra base de datos, cabe resaltar que cuando se hace el anlisis con log al modelo en
algunos casos mejora un poco la correlacin, pero nunca fue superior al modelo presentado
en la tabla 14. Por lo que el tratamiento de los datos con log en este caso no es necesario, ya
que los datos se ajustan bien sin ningn tipo de transformacin adicional.
Finalmente la estadstica con distribuciones y modelos de regresin ayudan a estructurar
mejor el anlisis de los procesos y eventos en la ingeniera no solo en la qumica si no en
todas las disciplinas en donde se relacione la observacin de lo que esta sucediendo.
Bibliografa
1- Xiaorui Yang, Mengmeng Xu, Shang-Tian Yang n. Metabolic and process
engineering of Clostridium cellulovorans for biofuel production from cellulose.
Department of Chemical and Biomolecular Engineering and Department of

Molecular Genetics, The Ohio State University, 151 West Woodruff Avenue,
Columbus, OH 43210, USA. Metabolic Engineering 32 (2015) 3948.
2- Mara V. Gila,b, Javier Fermosoc, Fernando Rubieraa, De Chenb,. H2production

by sorption enhanced steam reforming ofbiomass-derived bio-oil in a


fluidized bed reactor: An assessment ofthe effect of operation variables
using response surface methodology. -a). Instituto Nacional del Carbn,
INCAR-CSIC, Apartado 73, 33080 Oviedo, Spain; b).Department of Chemical
Engineering, Norwegian University of Science and Technology, Sem Slands vei 4,
Trondheim NO-7491, Norway; c).IMDEA Energy Institute, Thermochemical Processes
Unit, Avenida Ramn de la Sagra 3, 28935 Mstoles, Spain. Catalysis Today 242 (2015) 1934.

Web-grafa
3- Araya alpizar carlomangno. Estadistica para laboratorista qumico. Recuperado
de:https://books.google.com.co/books?
id=IibtfIBQLMoC&pg=PA54&lpg=PA54&dq=como+aplicar+la+distribuci
%C3%B3n+de+poisson+en+quimica&source=bl&ots=gl8sf0ArE&sig=VHq2arhdS
cbfi8aYLLqXhl4_eZM&hl=es&sa=X&ved=0ahUKEwiyjrv_9bPJAhWCKiYKHT
mzDMEQ6AEIJDAB#v=onepage&q=como%20aplicar%20la%20distribuci
%C3%B3n%20de%20poisson%20en%20quimica&f=false
4- Recuperadode:http://materiales.unex.es/miembros/personal/jjmelendez/ES/Investiga
ci%C3%B3n-ES.html
5- Recuperadode:http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un2/co
nt_232_74.html
6- Recuperadode:https://www.uam.es/personal_pdi/ciencias/joser/paginaR/regresion.ht
ml.
7- Recuperadode:http://ldc.usb.ve/~moises/estadistica/Ej_Regresion_Lineal_Multiple_
Zoritza.pdf.

You might also like