You are on page 1of 9

Sergio Ballestas Padilla estudiante Ing.

Mec.
Taller
6.- Un estudio para evaluar la capacidad de los sistemas de flujo fretico, para eliminar la
demanda bioqumica de oxgeno y varios otros componente qumicos, dio como resultados los
datos siguientes sobre x = carga de masa de DBO y=eliminacin de masa de DBO
X 3 8 10 11 13 16 27 30 35 37 38 44 103 142
Y 4 7 8 8 10 11 16 26 21 9 31 30 75 90
a.- Trace diagramas de caja, de carga de masa y eliminacin de masa, y comente las propiedades
interesantes. b.- trace un diagrama de dispersin de los datos y comente las propiedades
interesantes. C.- obtenga la ecuacin de regresin y a la ANOVA. ESTABLECA la hiptesis de
trabajo. D.- calcule el coeficiente de determinacin (R
2
) y el coeficiente de determinacin
ajustado (R
2
ajustad
) y proponga una interpretacin prctica de estas cantidades;
y de correlacin r. e.- determine el intervalo de prediccin cuando x
p =35 y 50
f.- determina el
intervalo de confianza para el promedio cuando x = 35 y 50. f.- Los dos ltimos valores de x, 103
y 142, son mucho mayores que los dems. cmo afecta la eliminacin de las dos observaciones
correspondientes de la muestra a la ecuacin de la recta de mnimos y al valor de r;

Ajuste los
valores dados de las cantidades de resumen, y use el nuevo valor de SSE que es 311.79.
Explique cada uno de tems anteriores.

A) Para X




Anlisis estadistico
Recuento 14
Promedio 36,928
6
Mediana 28,5
Desviacin
Estndar
39,226
1
Mnimo 3,0
Mximo 142,0
Rango 139,0
Cuartil Inferior 11,0
Cuartil Superior 38,0
Rango
Intercuartlico
27,0


Para Y
Grfico de Caja y Bigotes
0 30 60 90 120 150
<recuperado>.X=carga de masa de DBO




Anlisis estadstico
Recuento 14
Promedio 36,928
6
Mediana 28,5
Desviacin
Estndar
39,226
1
Mnimo 3,0
Mximo 142,0
Rango 139,0
Cuartil Inferior 11,0
Cuartil Superior 38,0
Rango
Intercuartlico
27,0
Grfico de Caja y Bigotes
0 20 40 60 80 100
<recuperado>.Y=eliminacion de masa de DBO











Grfico de dispersin
El grfico de dispersin no muestra una clara tendencia.

Tabla ANOVA para A.Col_1 por A.Col_2

Fuente Suma de
Cuadrados
Gl Cuadrado
Medio
Razn-F Valor-P
Entre
grupos
20002,4 12 1666,87 3333,74 0,0134
Intra grupos 0,5 1 0,5
Total (Corr.) 20002,9 13


Anlisis
La tabla ANOVA descompone la varianza de A.Col_1 en dos componentes: un componente entre-
grupos y un componente dentro-de-grupos. La razn-F, que en este caso es igual a 3333,74, es el
cociente entre el estimado entre-grupos y el estimado dentro-de-grupos. Puesto que el valor-P de
Grfico de A.Y=eliminacion de masa DBO vs A.X=carga de masa DBO
0 30 60 90 120 150
A.X=carga de masa DBO
0
20
40
60
80
100
A
.
Y
=
e
l
i
m
i
n
a
c
i
o
n

d
e

m
a
s
a

D
B
O
la prueba-F es menor que 0,05, existe una diferencia estadsticamente significativa entre la media
de A.Col_1 entre un nivel de A.Col_2 y otro, con un nivel del 95,0% de confianza. Para determinar
cules medias son significativamente diferente tras seleccione Pruebas de Mltiples Rangos, de la
lista de Opciones Tabulares e otras, seleccione Pruebas de Mltiples Rangos, de la lista de
Opciones Tabulares.

9.- estime la varianza y la desviacin estndar de beta

estimado y los intervalos


respectivos.
a.- encuentre un intervalo de confianza de 95% para beta
1
estimado.




b.- Desviacin estndar de

]

c.- Intervalos de confianza :
1.- Bajo el supuesto de que las observaciones tienen una distribucin normal e independiente, un
intervalo de confianza de 100(1-)% para la pendiente
1
es:


= (0,23 ; 8,58)
Conclusin: que una confianza de 100(1-)% = 95% el verdadero parmetro de
1
se encuentra
entre 0,23 y 8,58,
2.- Lo mismo se puede aplicar para el parmetro de
0.

t
/2(n-2) *

/

0
(41,02; 157,7)

Conclusin: que con una confianza del 100(1-) = 95%, el verdadero valor del parmetro
0
, se
encuentra entre 41,02 y 157,7
3.- Intervalo de confianza para la respuesta media:

cuando X
0
=70 se construir un intervalo
de confianza de 95% alrededor de la respuesta media para los datos del ejemplo 5: el modelo
ajustado es:

entonces



que se calcula a partir del modelo de
regresin ajustado.

]
[

] = (393,19; 422,40)

--

--


Conclusin: que al predecir la respuesta media de las millas recorridas cuando las pulsaciones son
X
0
=70 , con una confianza del 95% por lo tanto el intervalo de confianza para

de
393,19 y 422,4 .
4.- Intervalos de confianza de prediccin para nuevas observaciones:
Una aplicacin importante de los modelos de regresin es predecir observaciones nueva o futuras
de Y que correspondan a un nivel especificado de de la variable de regresin X. si x
0
es el valor de
la variable de regresin de inters, entonces un intervalo de confianza del 100(1-)% de prediccin
para una observacin futura y
0
, para el valor de x
0
est dado por:

]
Donde

se calcula a partir del modelo de regresin




Para ilustrar la construccin de un intervalo de prediccin, suponga que se usan los datos del
ejemplo 5 y se encuentra un intervalo de prediccin del 95% para la siguiente observacin
cuando las pulsaciones son X
0
=70 , con una confianza del 95% por lo tanto el intervalo el valor


Entonces el intervalo de prediccin es:
[

] = (340,89; 474,71)




La salida muestra los resultados de ajustar un modelo lineal para describir la relacin entre .Y=
eliminacin de masa de DBO y. X=carga de masa de DBO. La ecuacin del modelo ajustado es

Y= eliminacin de masa de DBO = 0,918008 + 0,654058*<recuperado>.X=carga de masa de DBO.
Puesto que el valor-P en la tabla ANOVA es menor que 0,05, existe una relacin estadsticamente
significativa entre Y=eliminacin de masa de DBO y X=carga de masa de DBO con un nivel de
confianza del 95,0%.

Grfico del Modelo Ajustado
<recuperado>.Y=eliminacion de masa de DBO = 0,918008 + 0,654058*<recuperado>.X=carga de masa de DBO
0 30 60 90 120 150
<recuperado>.X=carga de masa de DBO
0
20
40
60
80
100
<
r
e
c
u
p
e
r
a
d
o
>
.
Y
=
e
l
i
m
i
n
a
c
i
o
n

d
e

m
a
s
a

d
e

D
B
O
Conclusin
Que al estudiar si el modelo es interesante mediante la Anova y acerca de los coeficientes se
rechaza la H
0
y se concluye que el modelo es interesante.
Que al predecir la respuesta

de las millas recorridas cuando las pulsaciones son X


0
=70 , con
una confianza del 95% por lo tanto el intervalo de confianza para

de 340,89 y 474,71
. Los lmites de prediccin son siempre ms anchos que los intervalos de confianza y que los
intervalos de la respuesta media. Ver grfico
En cuanto a el R
2
ajustado

, no siempre se incrementar cuando se agregan trminos al modelo. De
hecho, si se agregan trminos innecesarios el valor ajustado se decrecera por lo que este indicador
es ms adecuado que el R
2
.
El R
2
ajustado

, nos est indicando que la cantidad de variabilidad total explicada por el modelo se
debe a los trminos del error y no a los trminos de la regresin por lo que se aconsejara hacer
una transformacin de los datos de este problema y buscar una mejor
Por ltimo todos los resultados anteriores conducen a sugerir en primera instancia hacer una
transformacin de los datos o tomarlos nuevamente.

Bibliografa
Probabilidad y estadstica para ingenieros 6 ed walpole

You might also like