You are on page 1of 62

UNIVERSIDAD AUTONOMA DE COAHUILA

FACULTAD DE SISTEMAS

METODOS DE REGRESION LINEAL APLICADO EN EL PROCESO


DE FUNDICION DE UN TANQUE MUERTO DE ALUMINIO 356

TESIS PRESENTADO POR:

OSWALDO NEAVE UREA

PARA OBTENER EL GRADO ACADEMICO DE

MAESTRIA EN INGENIERIA APLICADA

CON ACENTUACION EN: MANUFACTURA INTEGRAL

Saltillo, Coahuila

Fecha

05 De Mayo del 2017.

1
Universidad Autnoma de Coahuila

Facultad de Sistemas

METODOS DE REGRESION LINEAL APLICADO EN EL PROCESO


DE FUNDICION DE UN TANQUE MUERTO DE ALUMINIO 356.

TESIS PRESENTADO POR:

OSWALDO NEAVE UREA

Tesis Presentado Por:

Oswaldo Neave Urea

Ingeniero en Mecatrnica.

Director: Dr. Rolando Javier Praga Alejo.

Codirector: Dr. David Salvador Gonzales Gonzales.

2
Dedico esta tesis a mis padres Rubn Neave Garca y Leonor Urea Frausto que estuvieron
siempre a mi lado en la realizacin de este trabajo. Los amo.

Hago mencin especial de las personas cuyo apoyo fue fundamental para la realizacin de
este trabajo: Dr. Rolando Javier Praga Alejo y Dr. David Salvador Gonzales. Gracias por su
apoyo, tiempo y espacio.

3
RESUMEN
En este trabajo lo que se pretende con esta investigacin es aportar conocimientos para
poder controlar eficazmente el proceso de fundicin ya bien sea utilizando el mtodo de
regresin Ridge o el mtodo de Componente Principales, para generar modelos
predictores del proceso de fundicin.

La regresin Ridge es un mtodo estadstico que elimina la multicolinealidad y ayuda a


encontrar los estimadores del modelo, ste en comparacin con el de mnimos cuadrados
hace uso de una estimacin sesgada1, lo que le da la ventaja de ser ms preciso en sus
estimaciones.

El mtodo de Componentes Principales, al igual que el de mnimos cuadrados, elimina la


multicolinealidad, pero ste sin embargo no realiza estimacin sesgada. Sino que elige un
conjunto de componentes que resultan ser significativos para el proceso de fundicin.

Una forma que se utiliza para solucionar el problema de la multicolinealidad y la


prediccin del proceso de fundicin, es eliminar el requisito de que sea insesgado en el
caso de regresin Ridge. Si se permite una pequea cantidad de sesgo en , la varianza
de puede ser pequea, lo que hace que su prediccin sea ms estable, por lo que
beneficiara a nuestro proceso. Los estimados Ridge se calculan como:

= ( )1


Donde = [ ] = [0 ]

En donde es la matriz aumentada y es el vector necesario para calcular la solucin


Ridge (Montgomery et al. 2001).

Se aplicar el mtodo de regresin Ridge al proceso de fundicin, recopilando una muestra


de piezas fundidas, despus se har una comparacin con el mtodo de mnimos

1
Estimacin sesgada: se refiere a este tipo de estimacin, cuando el estimador del parmetro no est centrado,
es decir, que su valor esperado no es igual al parmetro que se desea estimar.

4
cuadrados para verificar si el mtodo de regresin Ridge es ms preciso en sus
estimaciones.

Una vez recopilados los datos se tiene que realizar una prueba que permita diagnosticar
si existe multicolinealidad en los datos. El mtodo que utilizaremos aqu es el anlisis de
los Factores de Inflacin de Varianza (VIF), donde si hay uno o ms VIF grandes
(mayores que 10), entonces existe multicolinealidad en los datos. Este mtodo adems de
detectar multicolinealidad en los datos, ayuda a identificar cules factores intervienen en
la multicolinealidad. Una vez hecho este diagnstico se procede al anlisis Ridge y de
Componentes Principales, para poder obtener los valores adecuados del modelo de
prediccin del proceso de fundicin.

5
Contenido
RESUMEN ......................................................................................................................... 1
INDICE DE FIGURAS ........................................................................................................ 9
INDICE DE TABLAS ........................................................................................................ 10
Captulo 1 ........................................................................................................................ 11
INTRODUCCION ............................................................................................................. 11
1.1Estudio retrospectivo ............................................................................................................ 12
1.2 Estudio Observacional ........................................................................................................ 12
1.3Experimento Diseado ......................................................................................................... 13
Usos de la Regresin:............................................................................................................ 13
Captulo II ........................................................................................................................ 14
PLANTAMIENTO DEL PROBLEMA........................................................................................ 14
2.2 Objetivo General. ................................................................................................................. 15
2.3 Objetivos Especficos. ......................................................................................................... 15
2.4 Preguntas de Investigacin ................................................................................................ 16
2.5 Hiptesis General ................................................................................................................ 17
2.6 Hiptesis Especficas .......................................................................................................... 17
2.7 Justificacin .......................................................................................................................... 18
2.8 Variables ............................................................................................................................... 18
Captulo III ....................................................................................................................... 19
MARCO DE REFERENCIA.............................................................................................. 19
Captulo IV ....................................................................................................................... 22
MARCO TEORICO .......................................................................................................... 22
4.1 Regresin Lineal .................................................................................................................. 22
4.2 Regresin y Formacin de Modelos ................................................................................. 22
4.3 Recoleccin de Datos ......................................................................................................... 25
4.3.1 Estudio Retrospectivo .................................................................................................. 25
4.3.2 Estudio Observacional ................................................................................................. 26
4.3.3 Experimento Diseado ................................................................................................ 26
4.4 Estimacin de los Parmetros por Mnimos Cuadrados ............................................... 27
4.4.1 Estimacin de y ................................................................................................. 27
4.5 Regresion Lineal Mltiple ................................................................................................... 28

6
4.5.1 Modelo de Regresin Mltiple .................................................................................... 28
4.5.2 Estimacin de los Parmetros del Modelo. .............................................................. 29
4.5.3 Propiedades de los Estimadores de Mnimos Cuadrados ..................................... 31
4.5.4 Estimacin de .......................................................................................................... 31
4.5.5 Prueba de la Significancia de la Regresin .............................................................. 32
4.5.6 Estadsticos y Coeficiente de Correlacin r ....................................... 34
4.5.7 Prueba t para los coeficientes de Regresin ......................................................... 35
4.5.8 Error de Prediccin Promedio Cuadrado .................................................................. 35
4.5.9 Intervalos de Confianza en Regresin Mltiple ....................................................... 36
4.5.10 Coeficientes Normalizados de Regresin ............................................................. 37
4.5.11 Escalamiento normal unitario ................................................................................... 37
4.5.12 Escalamiento de Longitud Unitaria .......................................................................... 38
4.5.11 Modelo de Segundo Orden ....................................................................................... 39
4.6 Multicolinealidad................................................................................................................... 40
4.6.1 Fuentes de Multicolinealidad ...................................................................................... 41
4.6.3 Diagnstico de la Multicolinealidad ............................................................................ 42
4.6.4 Factores de Inflacin de la Varianza (VIF) ............................................................... 42
4.6.5 Anlisis del Eigensistema............................................................................................ 43
4.6.6 Mtodos para Manejar la Multicolinealidad .............................................................. 43
4.6.7 Recoleccin de Datos Adicionales ............................................................................ 43
4.6.8 Re-especificacin del Modelo ..................................................................................... 44
4.7 Regresin Ridge .................................................................................................................. 44
4.7.1 Mtodos para seleccionar k. ....................................................................................... 47
4.7.2 Regresin Ridge y la Seleccin de Variables. ......................................................... 49
4.8 Regresin por componentes principales................................................................................. 49
Captulo V ........................................................................................................................ 51
METODOLOGIA .............................................................................................................. 51
Captulo VI ....................................................................................................................... 53
EXPERIMENTACION Y APLICACION............................................................................. 53
6.1 Descripcin de la experimentacin. ............................................................................. 53
6.2 Obtencin de los Datos....................................................................................................... 53
6.3Anlisis de datos ................................................................................................................... 54

7
6.5 Modelacin............................................................................................................................ 57
6.5.1 Regresin Mltiple ........................................................................................................ 57
6.5.2 Regresin Ridge ........................................................................................................... 57
6.5.2 Regresin por Componentes Principales ................................................................. 58
6.6 Validacin .............................................................................................................................. 58
Captulo VII ...................................................................................................................... 59
CONCLUSIONES ....................................................................................................................... 59
Bibliografa ....................................................................................................................... 62

8
INDICE DE FIGURAS

Figura 4.1 Grafica de Entrega y Tiempo........22

Figura 4.2 Lnea Recta de los Datos de Entrega y Tiempo.23

Figura 4.3 Distribucin de Muestreo de Estimadores insesgado de ...44

Figura 4.4 Coeficientes sesgados de ...44

Figura 5.1 Metodologa propuesta...51

Figura 6.1 Efectos principales para la respuesta..54

Figura 6.2 Respuesta de Regresin Mltiple vs Real..57

Figura 6.3 Respuesta de Regresin Ridge vs Real..57

Figura 6.4 Respuesta por Componentes Principales vs Real.58

9
INDICE DE TABLAS

Tabla 4.1 Anlisis de Varianza33

Tabla 6.1 Matriz de datos recolectados de proceso de fundicin.53

Tabla 6.2 Efectos del coeficiente de regresin.54

Tabla 6.3 Anlisis de Varianza por Regresin Mltiple Ordinario. ...55

Tabla 6.4 Anlisis de Varianza por Regresin Ridge..55

Tabla 6.5 Anlisis de Varianza por Componentes Principales..55

Tabla 6.6 Calculo de VIF de los estimadores por Regresin Mltiple Ordinario56

Tabla 6.7 Calculo de VIF de los estimadores por Regresin Ridge..56

Tabla 6.8 Calculo de VIF de los estimadores por Regresin MPC56

Tabla 6.9 Comparacin de mtodos de Regresin Lineal..58

10
Captulo 1
INTRODUCCION

Este trabajo describe mtodos de regresin lineal para poder predecir el comportamiento
del proceso de fundicin de un tanque muerto (aluminio 356), mediante una serie de
pasos mencionados posteriormente, as como una interpretacin de los resultados
obtenidos, se utilizar el que prediga mejor los datos para poder modelar el proceso de
soldadura en cuestin.

En la industria podra tener cambios buenos, ya que normalmente existen problemas de


calidad relacionados con fundicin, muchas piezas resultan estar fuera de especificacin,
lo que podra ocasionar que ensambles no se solidifique, en el tiempo apropiado, el
producto no funcion de manera apropiada. En la recoleccin de los datos se puede
presentar el caso, en donde exista multicolinealidad en los datos, es decir que exista una
dependencia lineal en los regresores por lo que es necesario utilizar mtodos estadsticos
sesgados, en este caso utilizaremos el mtodo de regresin Ridge y el mtodo de
componentes principales. Para la deteccin de la multicolinealidad de los datos se
emplean varios mtodos; anlisis de la matriz de correlaciones XX, en el cual, si un
determinante es muy cercano a cero, indica que tiene problemas de multicolinealidad.

El anlisis de regresin es una tcnica estadstica para investigar y modelar la relacin


entre variables, la relacin de una recta que relaciona esas dos variables es

= 0 + 1

Donde 0 es la ordenada al origen y 1 es la pendiente. Los datos no estn exactamente


sobre una recta. Sea la diferencia entre el valor observado de y el de la lnea recta (0 +
1 ) un error de , un modelo ms plausible para los datos es

= 0 + 1 +

La ecuacin se llama modelo de regresin lineal, donde x es la variable predictora y la


variable respuesta, se llama modelo de regresin lineal simple.

La respuesta media en cualquier valor de la variable regresora es

11
(|) = | = (0 + 1 + ) = 0 + 1

La varianza de para cualquier valor dado de es

(|) = (0 + 1 + ) = 2

La altura de la lnea de regresin en cualquier valor de no es ms que el valor esperado


de para esa .

Recoleccin de Datos:

Hay tres mtodos bsicos:

1.1Estudio retrospectivo
Ofrecen con frecuencia cantidades limitadas de informacin til, sus principales
desventajas son:

Faltan algunos datos importantes


La Fiabilidad y la calidad de los datos suelen ser muy dudosos
Pueden no permitir atacar el problema de mano
Pueden no explicar fenmenos interesantes que identifica el anlisis de datos

Los datos histricos suelen sufrir errores de transcripcin y otros problemas con la calidad
de datos, tambin no permiten al analista incluir el factor de anlisis de los datos, aunque
tenga cierta importancia, por consiguiente, tienen menos calidad, menos exactitud y
fiabilidad mnima, la memoria comienza a fallar con el tiempo.

1.2 Estudio Observacional


Solo se observa el proceso o la poblacin y se interacciona o perturba el proceso lo
necesario para obtener datos relevantes, pueden asegurar datos exactos, complejos y
fiables, reduce al mnimo las probabilidades de observar un dato atpico relacionado con
algn error en los datos, presentan a tener problemas de linealidad.

12
1.3Experimento Diseado
La mejor estrategia resulta ser hacer un experimento diseado (Diseo de experimentos)

Usos de la Regresin:
Se usan con varios fines: Descripcin de datos, Estimacin de parmetros, Control,
Prediccin y estimacin.

13
Captulo II
PLANTAMIENTO DEL PROBLEMA

El presente proyecto consiste en investigar el comportamiento de los factores bajo estudio


(Temperatura de metal, temperatura del molde, basculamiento, iteracin de temperaturas)
en el modelo matemtico. Ser mediante la regresin Ridge y Componentes principales y
dependiendo de los resultados que arroja se generar el modelo predictor y elegir el
mejor, el proyecto buscar reducir el nmero de defectos en la fundicin de un tanque
muerto una vez enfriado, ya que este es un factor muy importante en la consideracin de
costos de un proyecto. Disminuyendo en lo posible los costos de produccin, al eliminar
problemas de calidad en el producto.

Los parmetros como temperatura del metal, temperatura del molde, basculamiento,
resultan ser los parmetros crticos para el estudio de los experimentos, en donde la
combinacin de stos logre un modelo que sea el ptimo, para el cual es necesario la
recoleccin de estos datos estadsticos de la mquina para poder introducirlos a los
modelos matemticos y poder expresar la factibilidad mediante el modelo propuesto.

Sin embargo, en la recoleccin de los datos existe el problema de la multicolinealidad, es


decir que existe una dependencia lineal en los regresores, por lo que es necesario utilizar
un mtodo alternativo para la modelacin de la trayectoria de soldadura. El mtodo de
mnimos cuadrados no resuelve este problema, por lo que en la fase de experimentacin
se establecer un modelo que estime los parmetros que influyen en el proceso de
soldadura y que a su vez elimine el problema de la multicolinealidad.

14
2.2 Objetivo General.
Utilizar mtodos de regresin lineal para predecir el comportamiento en el proceso de
fundicin de aluminio de un tanque muerto de aluminio 356.

2.3 Objetivos Especficos.


1. Verificar que existe multicolinealidad en los datos.
2. Eliminar la multicolinealidad entre las variables regresoras del modelo.
3. Determinar si la ecuacin del modelo es adecuado mediante los estadsticos R2 y
para cada uno de los mtodos de regresin lineal.
4. Determinar cul es el modelo ms apropiado para llevar a cabo la optimizacin del
proceso de fundicin de aluminio 356.

15
2.4 Preguntas de Investigacin
El mtodo de regresin Ridge genera resultados ptimos en prediccin del
comportamiento del proceso de fundicin de aluminio?

El mtodo de componentes principales genera resultados ptimos en prediccin del


comportamiento del proceso de fundicin de aluminio?

Se puede disminuir el nmero de defectos modificando los parmetros de temperatura


de metal, temperatura del molde, basculamiento, en el proceso de fundicin de aluminio
356 con respecto los valores iniciales?

Es necesario utilizar el mtodo de regresin Ridge?

El modelo de regresin Ridge es adecuado?

Es mejor el mtodo de regresin Ridge en comparacin con el mtodo de componentes


principales?

16
2.5 Hiptesis General
Se puede predecir el comportamiento de manufactura de fundicin de aluminio 356,
mediante la utilizacin del mtodo de regresin Ridge y Componentes Principales.

2.6 Hiptesis Especficas


1 El modelo de Regresin con valores dentro de un rango establecido de parmetros
como temperatura de metal, temperatura del molde, basculamiento, basado en los
resultados obtenidos de 2 y pueden disminuir el tiempo de puesta en marcha.

2 Se puede eliminar la multicolinealidad presente entre las variables regresoras del


modelo.

17
2.7 Justificacin
Investigar la factibilidad de la optimizacin del proceso de fundicin de aluminio mediante
el mtodo de regresin Ridge, componentes principales, mnimos cuadrados y realizar
una comparativa para verificar cul es mejor.

Es necesario obtener un modelo estadstico de prediccin, que permita describir el


proceso de fundicin de aluminio, sin embargo, es muy difcil obtener el modelo
estadstico con modelos de regresin convencionales (mtodo de mnimos cuadrados), ya
que existe el riesgo de que exista mucha variabilidad en las pruebas debido a la
multicolinealidad, es decir, existe una regresin lineal entre los regresores o variables del
proceso, lo que ocasionara errores de varianza e imprecisin en el modelo.

La regresin Ridge resulta ser una solucin a este tipo de problemas; no slo se puede
obtener un modelo preciso; sino que se elimina sustancialmente el efecto de la
multicolinealidad en los datos y el nivel de confianza del modelo ser mayor.

2.8 Variables
Las variables han sido establecidas bsicamente de acuerdo a los planteamientos de los
objetivos especficos y del anlisis del proceso, las cuales son:

Temperatura de metal, Temperatura del molde, Basculamiento, como variables de


entrada y como variable de salida: total de defectos por porosidad.

18
Captulo III
MARCO DE REFERENCIA

Existen trabajos anteriores, en los cuales se ha realizado la modelacin de procesos de


fundicin. La regresin por mnimos cuadrados trabaja con datos los cuales pudiese
existir dependencia lineal entre las variables. Cuando existe multicolinealidad los datos no
son de utilidad ya que existe dependencia en los datos, la cual est mal condicionada y
esto trae como resultado estimadores errneos de .

Al parecer el mtodo de componentes principales tiene una infinidad de aplicaciones, uno


es el caso de reduccin de sensores para el monitoreo de condiciones de un sistema de
turbinas de aire, donde utilizan un gran nmero de sensores para monitorear este
sistema, y el propsito de esta investigacin por (Yifei Wang, Xiadong Ma, Malcolm J.
Joyce 2016) es el de reducir el nmero de sensores, para poder procesar la informacin
en tiempo real, seleccionando slo los ms importantes de tal manera que la informacin
vital no se pierda, haciendo uso de este mtodo. La tcnica propuesta fue reducir en un
tamao de 51.7% y 45.4% el tamao de los datos, midiendo varianza acumulada,
promedio de correlacin y entropa de la informacin.

Otro trabajo en donde hacen uso del mtodo de Regresin Ridge es el de (Ryo Uemukai,
2010) en donde estudia las propiedades de los estimadores del mtodo de regresin
Ridge cuando se omiten variables en el modelo que resultan ser significativas. En este
trabajo se estudian las propiedades del mtodo en diferentes aspectos:

1) Cuando el modelo es derivado con respecto a un coeficiente en particular.


2) La explicacin del modelo simple.
3) Cuando el modelo no est especificado.
4) Se derivan las frmulas exactas del modelo de Regresin. Cuando existen
variables omitidas.
5) Se hace un comparativo evaluando numricamente la formula exacta de los
momentos.
Con todo esto se concluye que el modelo cuando est completo (no existen variables
omitidas) es mejor que cuando se omiten variables; ya que los resultados obtenidos del
y del resultan ser menores.

19
Otro artculo de relevancia es el de Iono, Tanvir y Hendry (2000) en donde utilizan el
mtodo de componentes principales para analizar informacin sobre las estrellas. Indican
que el mtodo de Fourier es una manera efectiva para analizar la estructura no lineal de la
informacin de la luz que irradian stas, as como la velocidad. Sin embargo, no se logra
analizarla de forma completa. Con el mtodo de componentes principales lo que hace es
analizar los datos de forma completa (Luz y velocidad), de forma simultnea, en donde
con tan solo seis parmetros la informacin puede ser predicha, ya que con el mtodo de
Fourier se necesitan seis o ms.

Otro trabajo es el de Junyong Park (2016) en donde menciona que existen casos en
donde las covariables exhiben multicolinealidad, en donde lo que se propone es usar los
estimadores Ridge. En este trabajo explica cmo estimar los intervalos de las tolerancias.
Se explica cmo obtener los lmites para el caso que se requiere solamente el superior y
de dos lados. Tambin se habla el caso cuando se tiene base de datos que tienen ms
variables que observaciones en el que mencionan que an no est disponible una
solucin posible. Otro es el caso cuando la escasez es asumida (pocas variables o pocos
datos), cuando esto sucede, uno debe de seleccionar un subconjunto de variables
significantes y aplicar el mtodo. Se hace tambin un estudio numrico para comparar el
desempeo del OLS y el estimador Ridge, en donde lo que hacen es generan la
informacin de la forma {( , ), 1 } y se calcula la tolerancia de un lado (superior)
o de dos lados (superior e inferior).Se repite este procedimiento 1000 veces de tal forma
que se tiene 1000 tolerancias y se calcula la probabilidad para cada tolerancia (, 1).
En donde es igual a 0.95 y 1 es igual a 0.90. Se realizan tres enfoques el bootstrap,
el OLS y el Ridge. Se muestra que el bootstrap no funciona ya que tiene una probabilidad
del lmite muy superior en comparacin con el OLS y el Ridge, por lo que solo se
comparan OLS y Ridge. Se muestra que las probabilidades empricas para los lmites del
OLS son casi iguales al nominal (0.90) por lo que se concluye elegir mejor los calculados
por los del OLS.

Se realiza un grfico de dispersin obtenido a partir de la Regresin Ridge y del OLS en


donde se muestra que los lmites superiores del OLS son ms grandes que aquellos por
Regresin Ridge, lo que puede ocasionar mayor varianza en las estimaciones. Se
muestran 6 Figuras, en donde se tienen 3 casos en cada figura. La primera en donde es
el primer eigenvector de (), la segunda donde es dcimo eigenvector de (), y la

20
tercera en donde es el veinteavo eigenvector de (), todas con una probabilidad
emprica determinadas.

Tambin se realiza un estudio numrico para la tolerancia de dos lados, en donde los
resultados obtenidos son similares a los de un slo lado, sin embargo, las probabilidades
del OLS tienden a ser un poco menores ahora que el nominal (0.90), por lo que se
concluye que los intervalos con la regresin Ridge son ms cortos que el OLSE cuando
una nueva covariable x est cerca de los eigenvectores correspondientes a los pequeos
eigenvalor.

Se muestran los resultados con un ejemplo real, en donde lo que se muestra es que los
lmites de tolerancia de los estimadores Ridge tienen intervalos ms ajustados en
comparacin que los del OLSE.

Manjunath Patel (2016) hace un estudio estadstico del proceso de fundicin, para poder
predecir las propiedades mecnicas. Establece una relacin no lineal entre las entradas y
salidas, observa el comportamiento fsico del proceso utilizando diseo de experimentos y
superficies de respuesta. En donde utiliz dos modelos de regresin Box-Benhnken y el
diseo central compuesto. Lo que se observ fue que ambos modelos de regresin no
lineales fueron adecuados para establecer la relacin entre las entradas y las salidas.

21
Captulo IV
MARCO TEORICO
4.1 Regresin Lineal

El anlisis de Regresin es una tcnica estadstica para investigar y modelar la relacin


entre variables. Existe un sinfn de aplicaciones para esta metodologa incluyendo las
reas de ingeniera, ciencias fsicas y qumicas, economa, administracin, ciencias
biolgicas, as como ciencias de la vida y sociales. De hecho, esta es la tcnica
estadstica ms utilizada (Montgomery, 2006).

4.2 Regresin y Formacin de Modelos

Como ejemplo para ver la relacin entre variables y un modelo de dicha relacin se
utilizar el problema propuesto por Montgomery (2006), un ingeniero industrial analiza las
operaciones de entrega y servicio de producto en mquinas tragamonedas. Cree que el
tiempo en cargar y dar servicio a una mquina se relaciona con la cantidad de cajas de un
producto entregadas. Visita 25 tiendas de menudeo al azar con mquinas tragamonedas y
anota el tiempo de entrega en la tienda (minutos) y el volumen del producto entregado
(cajas) para cada una. Se muestran en la siguiente grfica:

90
80
70
60
Tiempo De Entrega 50
40
30
20
10
0
0 10 20 30 40

Volumen Entregado

Figura 4.1 Grfica de Datos de Entrega y Tiempo

22
Con claridad parece indicar que hay una relacin entre el tiempo de entrega y el volumen
en este caso ya que da la impresin de que los datos caen en una lnea recta, no
exactamente, pero se puede apreciar esa tendencia.

Si y representa el tiempo de entrega y x el volumen entregado, la ecuacin de la recta


que relaciona esas 2 variables es:

= 0 + 1 (4.1)

Donde 0 es la ordenada al origen y 1 es la pendiente. Como los datos no caen


exactamente en una lnea recta, hay que modificar la ecuacin (4.1) para tomar en cuenta
esto. Sea la diferencia entre el valor observado de y y el de la lnea recta (0 + 1 ) un
error . Conviene establecer que es un error estadstico, considerando una variable
aleatoria que explica que el modelo no ajusta exactamente los datos. Este error puede
formarse por defectos de las otras variables sobre el tiempo, medicin, etc. Un modelo
ms adecuado es como sigue:

= 0 + 1 + (4.2)

90
80
70
Tiempo De Entrega 60
50
40
30
20
10
0
0 10 20 30 40

Volumen Entregado
Figura 4.2 Lnea Recta de los Datos de Entrega y Tiempo

23
La ecuacin (4.2) se llama modelo de Regresin lineal (Montgomery, 2006). Cmo la
ecuacin slo tiene una variable regresora, se llama modelo de Regresin lineal simple.

Para comprender mejor el modelo de Regresin lineal, supongamos que se pueden fijar el
valor de la variable regresora x para observar el valor correspondiente de la respuesta
y. Ahora, si x est fija, el componente aleatorio determina las propiedades de y.
Supongamos que el promedio y la varianza de son 0 y 2 , respectivamente. Entonces,
la respuesta media en cualquier valor de la variable regresora es:

(|) = | 2 = (0 + 1 + ) = 2 (4.3)
As el modelo verdadero de Regresin | = 0 + 1 es una lnea recta de valores
promedios, esto es, la altura de la lnea de Regresin en cualquier valor de x no es ms
que el valor esperado de y para que sea x.

En casi todas las aplicaciones de Regresin, la ecuacin de Regresin slo es una


aproximacin a la verdadera relacin funcional entre las variables de inters. Esas
relaciones funcionales se basan en una teora fsica, qumica o de otra disciplina cientfica
o tcnica.

En general, las ecuaciones de Regresin slo son vlidas dentro del rango de las
variables regresoras contenidas en los datos observados. La variable de respuesta y se
puede relacionar con k regresores 1 , 2 , 3 , de modo que:

= 0 + 1 1 + 2 2 + + (4.4)

A esto se le llama modelo de Regresin lineal mltiple, ya que implica ms de una


variable regresora (Montgomery, 2006).

Un objetivo importante del anlisis de Regresin es estimar los parmetros desconocidos


en el modelo de Regresin. Tambin se le llama a este proceso ajuste del modelo a los
datos. La siguiente fase del anlisis de Regresin se llama comprobacin de la
adecuacin del modelo en donde se estudia lo apropiado del modelo y la calidad del
ajuste determinado. Mediante esos anlisis se puede determinar la utilidad del modelo de
Regresin. El resultado de la comprobacin de la adecuacin puede indicar que el modelo
es razonable, o que debe modificarse el original. Por lo anterior, el anlisis de Regresin
es un procedimiento iterativo en el que los datos conducen a un modelo, y se produce un
ajuste del modelo a los datos.

24
4.3 Recoleccin de Datos
Un aspecto importante y esencial de un anlisis de Regresin es la recoleccin de datos.
Todo anlisis es tan bueno como lo son los datos sobre los que se basa. Hay 3 mtodos
bsicos para la recoleccin de datos:

- Estudio Retrospectivo basado en datos histricos


- Estudio Observacional
- Experimento Diseado.

4.3.1 Estudio Retrospectivo


Se puede hacer utilizando todos los datos histricos del proceso o una muestra de ellos,
dentro de algn periodo, para determinar las relaciones entre las variables tanto
regresoras como de respuesta. Al hacerlo se aprovecha la ventaja de contar con datos
previamente reunidos y minimizar el costo del estudio. Sin embargo, se debe hacer notar
que hay varios problemas:

1- No se puede ver el efecto de la relacin porque se debe suponer que no vari


mucho durante el periodo histrico.
2- Como varan tan poco a travs del tiempo, dificultar poder apreciar su impacto
real.
3- Dentro de los lmites estrechos entre los que vara, habr dificultad para separar
los efectos individuales. Esto conduce al problema de Multicolinealidad

Los estudios retrospectivos ofrecen cantidades limitadas de informacin til. En general,


sus principales desventajas son:

- Con frecuencia faltan algunos de los datos importantes.


- La fiabilidad y la calidad de los datos suelen ser muy dudosas.
- Las naturalezas de los datos con frecuencia pueden no permitir atacar el problema
a la mano.
- El analista trata, con frecuencia, de usar los datos en formas que nunca se
pretendi que se usaran.
- Los registros, cuadernos y memorias pueden no explicar fenmenos interesantes
que identifica el anlisis de datos.

El uso de datos histricos siempre corre riesgo el de que, por cualquier razn, algunos de
los datos se perdieron o no se anotaron.

25
4.3.2 Estudio Observacional
Slo se observa el proceso o la poblacin y se interacciona o perturba el proceso lo
necesario para obtener datos relevantes. Plantendolo adecuadamente, estos estudios
pueden asegurar datos exactos, completos y fiables, a la vez que suelen proporcionar
informacin muy limitada acerca de las relaciones especficas entre los datos. ste
mtodo tambin reduce al mnimo las probabilidades de observar un dato atpico
relacionado con algn error en los datos.

4.3.3 Experimento Diseado


Esta estrategia debe asegurar que se puedan separar los efectos de cada factor. Los
valores especificados de los factores que se ajustan en el experimento, se llaman niveles.
Comnmente se usa una pequea cantidad (dos o tres) de niveles para cada factor.

26
4.4 Estimacin de los Parmetros por Mnimos Cuadrados

Los parmetros 0 y 1 son desconocidos y se deben calcular con los datos de la


muestra.

4.4.1 Estimacin de y
Para obtener los valores del vector de parmetros , se utiliza el mtodo de los mnimos
cuadrados. Segn la ecuacin (4.2), se puede escribir de la siguiente manera:

= 0 + + , = 1,2, , (4.5)

El criterio de mnimos cuadrados es:

(0 , 1 ) = =1( 0 )2 (4.6)

Los estimadores, por mnimos cuadrados, de 0 y 1 , que se designarn por 0 y 1 ,


deben satisfacer:



| = 2 ( 0 ) = 0 | = 2 ( 0 ) = 0
0 1
0 ,1 =1 0 ,1 =1

Se simplifican estas dos ecuaciones y se obtiene:

0 + 1 =
=1 =1

0 =1 + 1 =1 2 = =1 (4.7)

Las ecuaciones (4.7) son llamadas ecuaciones normales de mnimos cuadrados. Su


solucin es la siguiente:

0 = 1 (4.8)

(=1 )(=1 )

=1
1 =
2 = (4.9)
( )
2 =1
=1

27
En donde:


1
=

=1

1
= =1 (4.10)

Son los promedios de y , respectivamente. Por consiguiente, 0 y 1 son los


estimadores por mnimos cuadrados (Montgomery 2006).

4.5 Regresin Lineal Mltiple


Como ya se mencion, un modelo de Regresin donde interviene ms de una variable
regresora se llama modelo de Regresin mltiple.

4.5.1 Modelo de Regresin Mltiple


Un modelo de Regresin mltiple que puede describir el comportamiento de la
observacin de datos con ms de una variable independiente, es:

= 0 + 1 1 + 2 2 + (4.11)

El parmetro 0 es la ordenada al origen del plano de Regresin. Si en el intervalo de


datos se incluyen 1 = 2 = 0, entonces 0 es el promedio de cuando 1 = 2 = 0. Si no
es as, 0 no tiene interpretacin fsica. El parmetro 1 indica el cambio esperado de la
respuesta y por cambio unitario en 1 , cuando 2 se mantiene constante. De igual modo,
2 mide el cambio esperado de y por unidad de cambio de 2 cuando se mantiene
constante 1 . En general, se puede relacionar la respuesta y con k regresores o variables
de prediccin el cual se conoce como modelo de Regresin mltiple con k regresores:

0 + 1 1 + 2 2 + + + (4.12)

Los parmetros , = 0,1 , se llaman coeficientes de Regresin. El parmetro


representa el cambio esperado en la respuesta y por cambio unitario en cuando todas
las dems variables regresoras ( ) se mantienen constantes. Por esta razn, a los
parmetros , = 1,2 se les llama con frecuencia coeficientes de Regresin parcial.
Los modelos de Regresin parcial mltiple se usan con frecuencia como modelos

28
empricos o como funciones de aproximacin, ya que se desconoce la relacin funcional
real entre y 1 , 2 , , pero dentro de ciertos mrgenes de las variables regresoras, el
modelo de Regresin lineal es una aproximacin adecuada a la funcin verdadera
desconocida. En general, todo modelo de Regresin es lineal en los parmetros ( ) es un
modelo de Regresin lineal, independientemente de la superficie que genera
(Montgomery 2006).

4.5.2 Estimacin de los Parmetros del Modelo.


Estimacin de los coeficientes de Regresin por Mnimos Cuadrados de la ecuacin
(4.12). La funcin de mnimos cuadrados es:

(0 , 1 , , ) = 2
=1

= ( 0 ) (4.13)
=1 =1

Una forma mucho ms cmoda de manejar modelos de Regresin mltiple cuando se


expresan en notacin matricial, permite mostrar una forma muy compacta del modelo, los
datos y los resultados. En notacin matricial el modelo expresado por la ecuacin (4.12)
es:

= + (4.14)

Dnde:

1 11 12 1
= [2. ]
.. =[
21.
..
22 2.
.. ]
.
1 2

1 1
= [2.. ] = [2.. ]
. .

29
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

es un vector de 1 de las observaciones, es una matriz de de los niveles de


las variables regresoras, es un vector de 1 de los coeficientes de Regresin y es un
vector de 1 de errores aleatorios. Por lo tanto, se desea determinar el vector que
minimice:

() = 2 = = ( )( )
=1

Puede expresarse tambin de la siguiente manera:


() = + = 2 +

Ya que es una matriz de 11, es decir, un escalar, y que su transpuesta ( ) =


es el mismo escalar. Los estimadores de mnimos cuadrados deben satisfacer:


| = 2 + 2 = 0
0

Que se simplifica a:

= (4.15)

Las ecuaciones (4.15) son las ecuaciones normales de mnimos cuadrados. Estas
ecuaciones son la forma matricial de la representacin escalar. Para resolver las
ecuaciones normales, ambos lados de (4.15) se multiplican por la inversa de . As, el
estimador de por mnimos cuadrados es:

= ( )1 (4.17)

Siempre y cuando exista la inversa de la matriz , ya que existe si los regresores son
linealmente independientes, esto es, si ninguna columna de la matriz X es una
combinacin lineal de las dems columnas (Montgomery 2006).

30
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

4.5.3 Propiedades de los Estimadores de Mnimos Cuadrados

Como es un estimador insesgado de , su matriz de covarianza es:

( ) = {[ ( )][ ( )]}

Que es una matriz simtrica de , cuyo j-simo elemento diagonal es la varianza de


y cuyo (ij)-simo elemento fuera de la diagonal es la covarianza entre . La
covarianza de la matriz de es:

( ) = 2 ()1 (4.18)

4.5.4 Estimacin de
Para estimar la varianza 2 , se puede desarrollar un estimador a partir de la suma de
cuadrados de residuales:

= ( )2 = 2 =
=1 =1

Se sustituye = y se obtiene:

= ( )( )

= +

= 2 +

Como = , la ltima ecuacin se transforma en:

= (4.19)

Por lo tanto, el cuadrado medio residual es:


= (4.20)

31
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

Por consiguiente, un estimador insesgado de 2 es:

2 = (4.21)

Sin embargo, el valor del estimador de 2 depende del modelo (Montgomery 2004).

4.5.5 Prueba de la Significancia de la Regresin


Esta prueba se realiza para determinar si hay una relacin lineal entre la respuesta y
cualquiera de las variables regresoras. Este procedimiento suele considerarse como una
prueba general o global de la adecuacin del modelo, la cual se realiza mediante la
siguiente hiptesis:

0 : 1 = 2 = = = 0

0 : 1 0 .

El rechazo de la hiptesis nula implica que al menos uno de los regresores contribuye al
modelo en forma significativa. De acuerdo con la definicin de un estadstico F:



= = (4.22)

( 1)



= = (4.23)

( 1)

El parmetro de no centralidad indica que el valor observado debe ser grande para que
al menos una 0. Por consiguiente, para probar la hiptesis 0 : 1 = 2 = = = 0,
se calcula el estadstico de prueba y se rechaza 0 si:

> ,,1 (4.24)

El procedimiento de prueba se resume normalmente en la tabla de un anlisis de varianza


(Montgomery, 2004).

32
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

Tabla 4.1 Anlisis de Varianza

Fuente de Variacin Suma de Grados Cuadrado


Cuadrados de Medio
Libertad

Regresin K

Residuales (Error) N-K-1

Total N-1

Para calcular , partimos de la ecuacin (4.18):

Y ya que:


(=1 )2 (=1 )2
= 2 [ ]

=1

Se puede escribir de la forma:

(=1 )2 (=1 )2
= [ ] (4.25)

O bien:

33
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

Por consiguiente, la suma de cuadrados de Regresin y la suma de cuadrados total


sern:

(=1 )2
=
(4.26)

(=1 )2 (4.27)
=

4.5.6 Estadsticos y Coeficiente de Correlacin r


Los estadsticos 2 2 son otras maneras de evaluar la adecuacin general del
modelo, 2 aumenta cuando se agrega un regresor al modelo, independientemente del
valor de la contribucin de esa variable. En consecuencia, es difcil juzgar si un aumento
de 2 dice algo importante; la 2 se define como sigue:


2 = (4.28)

es una estimacin sesgada del coeficiente de determinacin de la poblacin y es
insesgada (Montgomery 2006). Algunas personas prefieren utilizar el estadstico ,
definido de la siguiente manera:


( )
2 =1 (4.29)

( 1)

2 ,Slo aumentar si al agregar una variable al modelo reduce el cuadrado medio


residual. El coeficiente de correlacin es una asociacin entre 2 o ms variables y se
representa como:

= 2 (4.30)

34
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

4.5.7 Prueba t para los coeficientes de Regresin


Si no es rechazada la hiptesis nula, quiere decir que se debe eliminar el regresor del
modelo. El estadstico de prueba utilizado para probar esta hiptesis es:


0 =
2 (4.31)

Donde es el elemento diagonal de ()1 que corresponde a . Se rechaza la


hiptesis nula : = 0 si | | > 2,1 . Ntese que sta es en realidad una prueba

parcial o marginal, porque el coeficiente de Regresin depende de todas las dems


variables regresoras ( ), que hay en el modelo. As, se trata de una prueba de la
contribucin de dados los dems regresores.

4.5.8 Error de Prediccin Promedio Cuadrado


Este estadstico indica que el modelo ser o no un buen predictor y se obtiene mediante la
siguiente ecuacin:


1
= 2
(4.32)
=1

Note que el valor PREMSS calculado debe ser menor que el Error Cuadrtico Medio
(MSE). La Suma Cuadrada de Prediccin se obtiene mediante la ecuacin que sigue:


2
= ( ) (4.33)
1
=1

35
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

Representa cada error de prediccin comparado con el valor real y son los
elementos diagonales de la matriz gorro que es una matriz idempotente y simtrica
obtenida a travs de ( )1 que mapea el vector de los valores ajustados.

Coeficiente de Determinacin de la Prediccin

Este estadstico da cierta indicacin de la capacidad predictiva del modelo de Regresin.


La ecuacin es la siguiente:


2 = 1 (4.34)

4.5.9 Intervalos de Confianza en Regresin Mltiple


Los intervalos de confianza de los coeficientes de Regresin individuales, y los intervalos
de confianza de la respuesta media, para niveles especficos de los regresores, juegan el
mismo papel importante que en la Regresin lineal simple.

Para los regresores individuales, la ecuacin de los intervalos de confianza para los
coeficientes son los siguientes:

2, 2 + 2, 2 (4.35)

Recurdese que:

( ) = 2 (4.36)

Lo cual representa el error estndar del coeficiente de Regresin .

Por otro lado, los intervalos de confianza para la respuesta media en un determinado
punto, como 01 , 02 , , 0 se realiza de la siguiente manera; defnase el vector 0 como
sigue:

36
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356
1
01
0 = 02
.
[0 ]

El valor ajustado en este punto es:

0 = 0 (4.37)

Y por lo tanto el intervalo de confianza de prediccin ser:

0 2 (1 + 0 ( )1 0 ) (|0 )
2,
(4.38)
2 (1 + )1 )
0 +
2,
0 ( 0

4.5.10 Coeficientes Normalizados de Regresin


En general, es difcil comparar en forma directa coeficientes de Regresin, porque la
magnitud de refleja las unidades de medida del regresor . Por lo general, las unidades
del coeficiente de Regresin son unidades de .

Por esta razn a veces ayuda trabajar con regresores y variables de respuesta escalados,
que produzcan coeficientes de Regresin adimensionales. A esos coeficientes
adimensionales se les suele llamar coeficientes estandarizados de Regresin
(Montgomery 2006).

4.5.11 Escalamiento normal unitario


El primer mtodo para obtener los coeficientes estandarizados emplea el escalamiento
normal unitario para los regresores y la variable de respuesta esto es:


= , = 1, 2, , , = 1, 2, , (4.39)

37
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

= , = 1, 2, ,
(4.40)

En donde la varianza muestral del regresor es:

2
=1( )
2
= (4.41)
1

Y la varianza muestral de la respuesta es:

=1( )2
2 = (4.42)
1

Con estas nuevas variables, el modelo de Regresin se transforma en:

= 1 1 + 2 2 + + + , = 1, 2, , (4.43)

Al centrar las variables represoras y la de respuesta, se elimina la ordenada al origen. Por


lo tanto, el estimador de b por mnimos cuadrados es:

= ()1 (4.44)

4.5.12 Escalamiento de Longitud Unitaria


Es el segundo escalamiento que se usa con frecuencia est representado con la siguiente
ecuacin:


= 1 , = 1, 2, , , = 1, 2, , (4.45)
2


0 = 1 , = 1, 2, , (4.46)
2

En donde la suma de cuadrados corregida para el regresor es:


2
= ( ) (4.47)
=1

38
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

En funcin de esas variables, el modelo de Regresin es:

0 = 1 1 + 2 2 + + + , = 1, 2, , (4.48)

El vector de los coeficientes de Regresin por mnimos cuadrados es:

= ()1 0 (4.49)
Los coeficientes obtenidos de estos escalamientos se llaman coeficientes estandarizados
de Regresin. La relacin entre los coeficientes originales y los estandarizados de
Regresin es:

1
= ( ) 2, = 1, 2, , (4.50)

0 = (4.51)
=1

Estas ecuaciones nos sirven para obtener los valores sin el escalamiento antes realizado
para su correcto y ms cmodo manejo en los clculos (Montgomery 2006).

4.5.11 Modelo de Segundo Orden


Los diseos de segundo orden son aquellos que permiten estudiar los efectos de
interaccin y efectos cuadrticos, aparte de los efectos lineales. Se utilizan ante la
necesidad de explorar la relacin o interaccin entre variables de proceso, as como una
superficie ms compleja.

La seleccin de estos diseos depende de las caractersticas del problema, pero deben
en general cumplir ciertos requerimientos como capacidad para realizar estimaciones
eficientes de los coeficientes del modelo y medir tanto el error experimental como la
posible presencia de falta de ajuste. Un modelo de segundo orden podemos representarlo
como:

39
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356
1

= 0 + + + 2 + (4.52)
=1 =2 =1 =1

Es fcil observar que las interacciones entre variables de proceso y los cuadrados de las
mismas, dependen completamente de las variables lineales, por lo que al considerar
dichas interacciones se tiene dependencia lineal entre las variables de la matriz de
diseo. Debido a esto, la inversa de la matriz utilizada en la estimacin est mal
condicionada, lo que induce al problema llamado Multicolinealidad.

4.6 Multicolinealidad
El uso y la interpretacin de un modelo de Regresin mltiple dependen, con frecuencia,
en forma explcita o implcita, de los estimados de los coeficientes individuales de
Regresin. Cuando hay dependencias casi lineales entre los regresores, se dice que
existe el problema de Multicolinealidad.

La Multicolinealidad, es la existencia de relaciones casi lineales entre las variables


independientes, lo cual crea estimaciones inexactas e infla los errores estndar de los
coeficientes del modelo, error tipo 1 de las pruebas t, falsos valores significativos y
degrada la previsibilidad del modelo. Estos problemas pueden detectarse de la siguiente
manera:

1- Los Factores de inflacin de la Varianza (VIF) por parte del modelo de Mnimos
Cuadrados que se definen en la ecuacin, son medidas tiles para la deteccin.
Estos valores representan una medida importante de la Multicolinealidad ya que
sta ser mayor mientras ms grande sea el valor de dichos elementos.
2- Si la prueba F para la significacin del modelo es significativa, pero las pruebas
individuales de los coeficientes del modelo no son significativas, hay presencia de
Multicolinealidad.

Si la eleccin del modelo lineal increment la Multicolinealidad, es necesario simplificar el


modelo mediante el uso de tcnicas de seleccin de variables. Si una o 2 observaciones
indujeron la Multicolinealidad, es preferible que se eliminen. Hay que tener cuidado con la
eleccin de variables; cuando no es posible esto, se utiliza el mtodo Ridge.

40
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

Para generar el modelo de Ridge, es esencial estimar la llamada Constante de


Proporcionalidad k (Lawless and Wang, 1976). Existe un valor de k distinto de cero para
el cual el MSE de es menor que la varianza del estimador por mnimos cuadrados,
siempre y cuando sea acotado (Hoerl y Kennard, 1970; a,b). Como funcin de k para
(0,1) , tiene las condiciones necesarias para que sea un estimador de error
cuadrtico medio ms pequeo que el del modelo propuesto por mnimos cuadrados
(Theobald, 1974).

A medida que la Multicolinealidad crece entre las variables regresoras que determinan el
comportamiento de una variable de respuesta, los coeficientes estimados por MC del
modelo polinomial que modela ese comportamiento, se vuelven errticos e impredecibles,
debido a los efectos desastrosos que la Multicolinealidad tiene sobre su varianza,
afortunadamente la RR minimiza este problema al contraer los coeficientes de MC,
logrando coeficientes ajustados con menor varianza, dando estabilidad a la prediccin del
modelo (R. Pia et al, 2005).

La Multicolinealidad de las variables independientes afectan la eficiencia de los


parmetros estimados mediante Mnimos Cuadrados, MRR es una de las principales
tcnicas propuestas para corregir este problema una vez detectada la Multicolinealidad y
as obtener parmetros sesgados, pero con un error estndar menor (Garca A. et al,
2006).

Se utiliza la Regresin Ridge como un ajuste del polinomio completo de segundo orden,
dndole estabilidad a sus coeficientes estimados y como consecuencia confiabilidad al
modelo cannico y al punto estacionario de las Xs que determinan las condiciones
operacionales del proceso o sistema bajo estudio (R. Pia et al, 2006).

4.6.1 Fuentes de Multicolinealidad


Hay cuatro fuentes de Multicolinealidad principales:

1- El mtodo de recoleccin de datos empleado puede originar problemas de


Multicolinealidad cuando el analista slo muestra el sub espacio de la regin de los
regresores.

41
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

2- Restricciones en el modelo o en la poblacin que se muestra. Alguna restriccin


fsica puede causar este fenmeno ya que cuando hay restricciones como esta,
habr Multicolinealidad independientemente del mtodo de recoleccin que se
emplee.
3- En la eleccin del modelo al agregar trminos polinomiales al modelo de
Regresin se produce un deterioramiento en la matriz , adems si el rango de
es muy pequeo, el agregar un trmino puede producir Multicolinealidad. En
estos casos, es preferible un subconjunto de regresores para evitar esto.
4- Modelo Sobredefinido: Tiene ms variables regresoras que observaciones. Lo ms
comn es eliminar algunas de estas variables y tomar las importantes.

4.6.3 Diagnstico de la Multicolinealidad


Una medida muy sencilla de la Multicolinealidad, es la inspeccin de los elementos no
diagonales en . Si los regresores y son casi linealmente dependientes ser
prximo a la unidad.

4.6.4 Factores de Inflacin de la Varianza (VIF)


es el j-simo elemento diagonal de = ( )1 , puede escribirse de la forma =
(1 2 )1 , siendo 2 el coeficiente de determinacin obtenido cuando se hace la
Regresin de respecto a los dems 1 regresores. Si es ortogonal a los
regresores restantes, 2 es pequeo y es cercano a la unidad, mientras que si es
casi linealmente dependiente en algn subconjunto de los regresores restantes, 2 es
casi lineal y es grande. Como la varianza de los j-simos coeficientes de Regresin es
2 se puede considerar que es el factor en el que aumenta la varianza de debido
a dependencias casi lineales entre los regresores. El clculo de los factores de inflacin
de la varianza se realiza como sigue (Marquardt 1970):

= = (1 2 )1 (4.53)
Para cada trmino, el modelo mide el efecto combinado que tienen las dependencias
entre los regresores sobre la varianza de ese trmino. Si hay uno o ms VIF grandes, hay
Multicolinealidad. Por la experiencia, si los VIFS son mayores que 5 o 10, es indicio de
que los coeficientes asociados de Regresin estn mal estimados debido a la
Multicolinealidad (Montgomery 2006).

42
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

4.6.5 Anlisis del Eigensistema


Los valores propios pueden utilizarse para medir la Multicolinealidad. Si hay una o ms
dependencias lineales en los datos, uno o ms valores propios sern pequeos e implican
que hay dependencias casi lineales entre las columnas de X. Algunos analistas prefieren
utilizar el nmero de condicin de XX definido como:


= (4.54)

Nmero de condicin menor que 100, no hay problema grave de Multicolinealidad, de 100
a 1000 hay Multicolinealidad moderada a fuerte; mayor a 1000 es indicio de una fuerte
Multicolinealidad. Los ndices de condicin de la matriz XX son:


= , = 1, 2, , (4.55)

La cantidad de ndices de condicin que son grandes es una medida til de la cantidad de
dependencias casi lineales en la matriz XX.

4.6.6 Mtodos para Manejar la Multicolinealidad


Se han propuesto varias tcnicas para mejorar los problemas causados por la
Multicolinealidad. Entre los mtodos generales estn el reunir ms datos, el
respecificacin del modelo y el uso de mtodos de estimacin distintos de mnimos
cuadrados, diseados especficamente para combatir este problema.

4.6.7 Recoleccin de Datos Adicionales


Se ha sugerido la recoleccin de datos adicionales como el mejor mtodo para combatir la
Multicolinealidad (Farrar y Glauber 1967; Silvey 1969). Los datos adicionales se deben
reunir en una forma diseada para eliminar la Multicolinealidad. Desafortunadamente no
siempre es posible coleccionar ms datos, por restricciones econmicas o porque el
proceso estudiado ya no est disponible para muestreo. Aunque a veces est disponible
43
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

el proceso, puede ser inadecuado utilizarlos si amplan el recorrido de las variables


regresoras mucho ms all de la regin de inters del analista.

4.6.8 Re-especificacin del Modelo


Con frecuencia, la Multicolinealidad se debe a la eleccin del modelo, como cuando dos
regresores muy correlacionados se utilizan en la ecuacin de Regresin, la re-
especificacin en este caso puede aminorar el impacto de la Multicolinealidad. Un mtodo
es redefinir los regresores pero que se preserve el contenido de informacin de los
regresores originales, pero que reduzca el deterioramiento.

Otro mtodo es la eliminacin de las variables, esto es que si alguna de las variables
regresoras es casi linealmente dependientes, la eliminacin de uno de los regresores,
puede ayudar a combatir la Multicolinealidad. Frecuentemente es una tcnica muy
efectiva, sin embargo, podr no producir una solucin satisfactoria si se elimina uno de los
regresores con gran poder de explicacin en la respuesta, por lo que puede daar el nivel
predictivo del modelo (Montgomery 2006).

4.7 Regresin Ridge


Cuando se aplica el mtodo de mnimos cuadrados a datos no ortogonales, se pueden
obtener estimaciones muy malas de los coeficientes de Regresin. La varianza de los
estimadores por mnimos cuadrados, de los coeficientes de Regresin, puede estar muy
inflada. Eso implica que el valor absoluto de los estimados por mnimos cuadrados es
demasiado grande y que son muy inestables, indicando con esto que sus magnitudes y
signos pueden cambiar mucho con una muestra distinta.


44
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

Figura 4.3 Distribucin de Muestreo de Estimadores Insesgado


de

( )
Figura 4.4 Sesgados de (Apartado de Marquardt y Snee 1975)

El problema con el mtodo de mnimos cuadrados es el requisito de que sea un


estimador insesgado de .

Una forma de disminuir este problema es eliminar el requisito. Supngase que se puede
determinar un estimador sesgado de , por ejemplo que tenga menor varianza que el
estimador insesgado . El error cuadrtico medio del estimador se define como sigue:

( ) = ( )2 = ( ) + [( ) ]2 (4.56)

Es decir:

( ) = ( ) + ( )2

Ntese que MSE no es ms que la distancia esperada de a , elevada al cuadrado. Si


se permite una cantidad pequea de sesgo en , la varianza de se puede hacer ms
pequea, de tal modo que el MSE (Error Cuadrtico Medio) de sea menor que la
varianza del estimador insesgado de . La pequea varianza del estimador sesgado
implica tambin que es un estimador ms estable de que el estimador insesgado .
Uno de los procedimientos para la obtencin de estimadores sesgados de coeficientes de
Regresin, es la Regresin Ridge (o de Cresta), propuesta originalmente por Hoerl y
Kennard (1970a, b). El estimador Ridge se determina resolviendo una versin ligeramente

45
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

modificada de las ecuaciones normales. En forma especfica, el estimador de Ridge de


se define como la solucin de:

( + ) = (4.57)

Que es:

= ( + )1 (4.58)

En la que 0 es una constante elegida por el analista. El proceso se llama Regresin


Ridge porque las operaciones matemticas se parecen al mtodo de anlisis Ridge,
usado antes por Hoerl (1959), para describir el comportamiento de superficies de
respuesta de segundo orden. Ntese que cuando = 0, el estimador Ridge es igual al de
mnimos cuadrados.

El estimador Ridge es una transformacin lineal del estimador de mnimos cuadrados, ya


que:

= ( + )1

= ( + )1 ()

Por consiguiente, como ( ) = ( ) = , entonces es un estimador sesgado de


. Se suele llamar parmetro de sesgo a la constante . La matriz de covarianza de es:

( ) = 2 ( + )1 ( + )1 (4.59)
El error cuadrtico medio del estimador de cresta es:

( ) = ( ) + ( )2

= 2 [( + )1 ( + )1 ] + 2 ( + )2


2

= + 2 ( + )2 (4.60)
( + )2
=1

46
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

En donde son los eigenvalores de XX. El primer trmino de la ecuacin (4.59) es la


suma de las varianzas de los parmetros , y el segundo trmino es el cuadrado del
sesgo. Si > 0 el sesgo de aumenta al aumentar . Sin embargo, la varianza
disminuye al aumentar .

Al utilizar la Regresin Ridge, es importante escoger un valor para , tal que la reduccin
en el trmino de la varianza sea mayor que el aumento en el sesgo al cuadrado. Si se
puede hacer, el error cuadrtico medio del estimador Ridge ser menor que la varianza
del estimador , por mnimos cuadrados.

Hoerl y Kennard demostraron que existe un valor de distinto de cero, para el cual el
MSE de es menor que la varianza del estimador por mnimos cuadrados, siempre y
cuando sea acotado. La suma de cuadrados residuales es:


= ( ) ( )


( ) ( ) + ( )( ) (4.61)

Como el primer trmino del lado derecho de la ecuacin (4.60) es la suma de cuadrados
residuales, para los estimados por mnimos cuadrados, se ve cuando aumenta , la
suma de cuadrados residuales aumenta. En consecuencia, 2 disminuye al aumentar ,
as, el estimado Ridge, en general, no llegar a ser el mejor ajuste a los datos, pero ello
no nos debe preocupar mucho, porque nos interesa ms obtener un conjunto estable de
estimadores de los parmetros. Los estimadores Ridge pueden dar como resultado una
ecuacin que funcione mejor para predecir observaciones futuras en comparacin con el
de mnimos cuadrados. Adems, Hoerl y Kennard han sugerido que el valor de puede
determinarse mediante la inspeccin de la traza de Ridge, que es una grfica de los
elementos de en funcin de , para valores de que suelen estar en el intervalo de 0 a
1.

4.7.1 Mtodos para seleccionar k.


La eleccin de k mediante la traza de Ridge es un procedimiento subjetivo que requiere
criterio por parte del analista. Algunos autores han propuesto mtodos ms analticos para
47
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

la eleccin de k. Hoerl, Kennard y Baldwin (1975) sugieren que una eleccin ms


adecuada de k es:

2
= (4.62)

En donde y 2 se determinan con la solucin de mnimos cuadrados. Adems, en una
publicacin posterior, Hoerl y Kennard (1976) propusieron un procedimiento iterativo de
estimacin basado en la ecuacin (4.57). En forma especfica sugirieron la siguiente
secuencia de estimacin de y de .

2
: 0 =

2
(0 ): 1 =
(0 ) (0 )

2
(1 ): 2 =
(1 ) (1 )
.
.
.

El cambio relativo de se usa para terminar el procedimiento. Si:

+1
> 20 1.3

El algoritmo debe continuar.

Otra manera de obtener el valor de la constante de proporcionalidad fue propuesta por


Lawless and Wang (1976):

2 (4.63)
=
( )

48
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

Donde la ecuacin nos proporciona un valor directo para , no suele ser el ptimo pero es
un valor que sirve para la disminucin de los VIF.

4.7.2 Regresin Ridge y la Seleccin de Variables.


Los algoritmos normales para la seleccin de variables no funcionan bien cuando los
datos son muy multicolineales. Sin embargo, la seleccin de variables suele funcionar
bien cuando los regresores son ortogonales o casi ortogonales. Si los regresores se
hicieron ms ortogonales usando estimadores sesgados, la seleccin de variables puede
ser una buena estrategia. Hoerl y Kennard (1970b) sugieren basarse en la traza de Ridge
para seleccionar las variables. Adems, proponen las siguientes reglas para eliminar los
regresores del modelo:

1- Eliminar los regresores con coeficientes estandarizados pequeos, pero que


tienen poco poder de prediccin.
2- Eliminar los coeficientes que no mantienen su poder de prediccin, es decir los
que corren hacia cero.

Eliminar uno o ms de los regresores restantes, que tengan coeficientes inestables.

4.8 Regresin por componentes principales


Tambin se pueden obtener los estimadores sesgados de coeficientes de regresin con
un procedimiento llamado regresin por componentes principales.

= + (4.64)

En donde

= = = =

Donde = diag(1 , 2 , , ) es una matriz diagonal p x p de los eigenvalores de

Y es una matriz ortogonal cuyas columnas son los eigenvectores asociados con
1 , 2 , , . Las columnas de Z, que definen un nuevo conjunto de regresores
ortogonales, como

= [1, 2, , ]

Se llaman componentes principales.

49
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

El estimador de

= ()1 = 1 (4.65)

Y la matriz de covarianza de es

() = 2 ( )1 = 2 1 (4.66)

Un pequeo eigenvalor de indica que la varianza del coeficiente ortogonal de


regresin correspondiente ser grande. Ya que

= =1 =1 =

Varianza del j-esimo componente principal. Si todas las 1 son iguales a 1, los
regresores originales son ortogonales, mientras que si una es exactamente igual a
cero, esto implica una regresin perfectamente lineal entre los regresores originales. La
matriz de covarianza de los coeficientes estandarizados de regresin es

( ) = () = 1 2

La varianza de es una combinacin lineal de los regresores de los eigenvalores.

El mtodo de regresin por componentes principales combate la multicolinealidad al usar


en el modelo menos componentes que el conjunto completo de componentes principales.
Se eliminan los componentes principales que corresponden a eigenvalores cercanos a
cero, y se aplican los mnimos cuadrados a los componentes restantes. Esto es


= (4.67)

El estimador de componentes principales es









=
0
0

[ 0 ]

o bien, en trminos de los regresores normalizados,

=

= =1 1 1 (4.68)

50
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

La regresin por componentes principales permite tener una mejora considerable respecto
a mnimos cuadrados.

Captulo V
METODOLOGIA
En esta seccin se mostrarn las diferentes etapas para la elaboracin de este proyecto
de aplicacin, como se muestra en la Figura 5.1 es necesario realizar con detalla la
elaboracin de los siguientes pasos:

Descripcin del Problema

Obtencin de Datos

Variables de Prueba

Temperatura del Metal Temperatura del Molde Basculamiento Iteracin de


Temperaturas

Anlisis de Datos

VIF Anlisis de Varianza

Representacin del Modelo

Modelo por MC Modelo por Ridge Modelo por


Componentes

Validacin

Validacin Cruzada
2
2 press

51
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

Figura 5.1 Metodologa propuesta

1.- Obtencin de los datos: En esta etapa es necesario definir cmo se van a obtener
los datos. De qu forma se van a realizar las mediciones. Se realizar un diseo
experimental para poder establecer un nmero adecuado de muestras. Manipulando las
variables de entrada para obtener una muestra efectiva.

2.- Anlisis de los datos: En esta etapa se realiza una prueba de bondad de ajuste
Anderson-Darling para determinar la distribucin de los datos. Tambin se realizar un
anlisis de varianza para poder determinar los efectos ms importantes dentro de mi
experimento, ya que adems ste es necesario para poder realizar los modelos de
prediccin. Se realiza tambin un anlisis VIF para poder determinar si las variables de
entrada propuestas son realmente multicolineales.

3.- Representacin del modelo: En esta etapa una vez hecho el anlisis de los datos, se
procede a la generacin de los modelos de prediccin. Los modelos aqu propuestos son
el modelo de regresin Ridge, el modelo de regresin por componentes principales y el
modelo de regresin mltiple.

4.-Validacion: En esta etapa se verifica que los modelos de regresin con los estadsticos
, 2, y 2press en donde si se cumplen estos estadsticos se puede verificar que el
nmero de defectos se puede controlar con estas variables de entrada.

52
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

Captulo VI

EXPERIMENTACION Y APLICACION

En el este captulo se detallan las pruebas y anlisis para evaluar el efecto de los diversos
parmetros, para conocer cual modelo es el que predice mejor los datos para reducir el
nmero de defectos de mal llenado.

Siguiendo la metodologa se realizaron los siguientes pasos:

6.1 Descripcin de la experimentacin.


Para la realizacin de este proyecto se realiz una prueba con el material que se utiliza
para la elaboracin de este tanque es zamak; el cual es una aleacin de zinc con

aluminio, magnesio y cobre. Tiene dureza, alta resistencia a la traccin, densidad 6,6 3

y temperatura de fusin de 686 C. Se inyecta de manera caliente, de acuerdo a los
principios de operacin.

6.2 Obtencin de los Datos.


Se realiz un diseo factorial 2 en donde las variables que se consideran como entradas
fueron: temperatura del metal, temperatura del molde y basculamineto. Como respuesta
se consider el nmero de defectos de mal llenado. La matriz de datos de los valores
recolectados se muestra en la Tabla 6.1.

Tabla 6.1 Matriz de Datos recolectados del proceso de fundicin

Temperatura Temperatura Temp Metal * Mal Llenado


del Molde(K) Basculamiento del Metal (K) Temp Molde
390 20 760 296400 0
390 20 790 308100 15
440 20 760 334400 0
440 20 790 347600 28
390 35 760 296400 3
390 35 790 308100 2
440 35 760 334400 0
440 35 790 347600 29

53
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

6.3Anlisis de datos
Una vez obtenidos los datos recolectados en el experimento 23 , se decide primero
analizar el diseo factorial el cual se muestra en la Figura 6.1

Tabla 6.2 Efectos de coeficientes de regresin.

Termino Efecto T P
Constante 4088 2.62 0.079
Temperatura del Molde -10.923 -2.91 0.062
Bascula miento -0.15 -0.62 0.580
Temperatura del Metal -5.357 -2.66 0.077
Temp Metal*Temp 0.014333 2.96 0.060
Molde

Grfica de efectos principales para Mal Llenado


Medias de datos

Temp Molde Basculamiento


20

15

10

0
Media

390 440 20 35
Temp Metal
20

15

10

0
760 790

Figura 6.1 Efectos principales para la Respuesta.

Como se muestra en los datos representados en la Tabla 6.2. La variable que tiene mayor
efecto es la de la temperatura del metal, seguido por temperatura del molde. Se decide
colocar la iteraccion de estas dos temperaturas.

54
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

Se obtiene tambin un alto coeficiente de determinacin, el cual seala un alto porcentaje


de la variabilidad observada es explicada en el experimento, considerando los efectos
mencionados en este trabajo.

Los resultados obtenidos mediante el anlisis de varianza de cada uno de los mtodos se
muestran en las siguientes tablas:

Tabla 6.3 Anlisis de Varianza por Regresin Mltiple Ordinario

Fuente de Variacin Suma de Grados de Cuadrados


Cuadrados Libertad Medios

Regresin 0.9292 4 0.2323 9.8504

Residuales (Error) 0.0708 3 0.0236

Total 1 7

Tabla 6.4 Anlisis de Varianza por Regresin Ridge

Fuente de Variacin Suma de Grados de Cuadrados


Cuadrados Libertad Medios

Regresin 0.9175 4 0.2294 8.3388

Residuales (Error) 0.08254 3 0.02751

Total 1 7

Tabla 6.5 Anlisis de Varianza por Componentes Principales

Fuente de Variacin Suma de Grados de Cuadrados


Cuadrados Libertad Medios

Regresin 0.9292 4 0.2323 9.8432

55
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

Residuales (Error) 0.0708 3 0.0236

Total 1 7

Despus se hace una prueba VIF para verificar que exista multicolinealidad:

Tabla 6.6 Calculo de VIF de los estimadores por Regresin Mltiple Ordinario

Estimador VIF
1 276.560
2 2670.04
3 1
1 2 2946.0

Tabla 6.7 Calculo de VIF de los estimadores por Regresin Ridge

Estimador VIF
1 0.8874
2 0.8874
3 0.8874
1 2 0.8874

Tabla 6.8 Calculo de VIF de los estimadores por Regresin MPC

Estimador VIF
1 1
2 1
3 1
1 2 1

Una vez comprobado que existe multicolinealidad en las variables, como se muestra en la
tabla 6.3. Se procede a la modelacin. La tabla 6.8 y 6.9 muestran los VIF una vez hecho
los anlisis supuestos (Ridge y MPC).

56
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

6.5 Modelacin.
Los modelos que resultaron fueron los siguientes:

6.5.1 Regresin Mltiple


La grfica y ecuacin por regresin mltiple queda de la siguiente manera:

Respuesta con Minimos Cuadrados


30 Variable
Y original
Y estimada
25

20
Datos Y

15

10

0 1 2 3 4 5 6 7 8
Orden

Figura 6.2 Respuesta de Regresin Mltiple vs Real

= 0.3906( ) 0.0950() + 0.7494( )


+ 0.4539( )

6.5.2 Regresin Ridge


La grfica y ecuacin por regresin Ridge queda de la siguiente manera:

57
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

Grfica de dispersin de Ridge, Original vs. Orden


30 Variable
Ridge
Original
25

20

Datos Y
15

10

0 1 2 3 4 5 6 7 8
Orden

Figura 6.3 Respuesta de Regresin Ridge vs Real

= 0.3466( ) 0.0843() + 0.6651( )


+ 0.4028( )

6.5.2 Regresin por Componentes Principales


La grfica y ecuacin por componentes principales queda de la siguiente manera:

Respuesta con Componentes Principales


30 Variable
Y original
Y estimada
25

20
Datos Y

15

10

0 1 2 3 4 5 6 7 8
Orden

Figura 6.4 Respuesta por Componentes Principales vs Real

= 0.3906( ) 0.0950() + 0.7494( )


+ 0.4539( )

6.6 Validacin
Los resultados nos dicen que el modelo de regresin Ridge arroja los valores ms bajos
con respecto a 2 , sin embargo en la regresin Ridge no se ve muy afectado por
perturbaciones en la respuesta como se ve en las imgenes anteriores. El mtodo de

58
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

Componentes Principales y el modelo de Regresin Mltiple tienen valores iguales con


respecto al 2.

Se decidi as tomar el modelo de Componentes Principales para estimar los parmetros


de fundicin, ya que adems de arrojar valores altos de 2 elimina la multicolinealidad.

Tabla 6.9 Comparacin de mtodos de regresin lineal.

RMC Ridge R Componentes


R2 92.9248 91.75 92.9292
(p) 0.0236 0.0275 0.0236

Captulo VII
CONCLUSIONES

En la industria manufacturera se podran tener cambios drsticos, ya que normalmente


existen problemas de calidad relacionados con fundicin, muchas piezas resultan estar
fuera de especificacin, lo que podra ocasionar que ensambles no se solidifique en el
tiempo apropiado, el producto no funcione de manera apropiada, en la recoleccin de los
datos se puede presentar el caso donde exista multicolinealidad, es decir que exista una
dependencia lineal en los regresores por lo que es necesario utilizar mtodos estadsticos.

Por tal motivo el uso de los modelos de Regresin es til para realizar predicciones
acerca del comportamiento de un proceso, el mtodo comnmente utilizado para el ajuste
de tal modelo es el de Mnimos Cuadrados.

En algunas ocasiones, al utilizar Mnimos Cuadrados para la estimacin de parmetros


del modelo, se observa que la matriz de varianzas y covarianzas as como su respectiva
matriz de correlacin, se ve afectada por la llamada Multicolinealidad. Esto es, existe
dependencia lineal entre las columnas de la matriz de diseo y por consecuencia, la
matriz de varianzas y covarianzas es casi singular ocasionando parmetros inestables

59
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

estimaciones inestables del vector de parmetros, varianzas muy grandes de los


coeficientes estimados y prdida de potencia de las pruebas estadsticas.

Por ende se dio pie a esta aplicacin y el caso de estudio, el cual fue aplicado en un
proceso de fundicin.

El Objetivo General del proyecto era aplicar mtodos de regresin lineal para predecir el
comportamiento en el proceso de fundicin de aluminio, el cual se cumpli ya que se
aplicaron modelos como Regresin Mltiple, Ridge y por Componentes Principales.

Con este caso de estudio, se cumplieron tambin los objetivos especficos: por ejemplo se
cumpli con, verificar que existe multicolinealidad en los datos, la cual exista y se realiz
mediante el anlisis del factor de varianza (VIF). Se elimin la multicolinealidad entre las
variables regresoras del modelo, mediante la aplicacin de la Regresin Ridge y
Componentes Principales. Tambin se determin la ecuacin del modelo y se calcularon
los estadsticos 2 y para cada uno de los mtodos de Regresin Lineal. Y por
ltimo se cumpli con el objetivo especfico de determinar cul es el modelo ms
apropiado para llevar a cabo la optimizacin del proceso de fundicin, la cual esta
optimizacin se realizar en un trabajo futuro.

Con este trabajo de aplicacin, se responden algunas de las preguntas de investigacin,


por ejemplo, se logr generar los modelos de Regresin Ridge y Componentes
Principales, se realiz el anlisis estadstico para determinar cul de los modelos de
Regresin es mejor, que en este caso fue Regresin por Componentes Principales la cual
fue ligeramente mejor que la de Regresin Lineal Mltiple, la diferencia es que Regresin
por Componentes Principales es mejor porque elimina la multicolinealidad.

En este caso de estudio tambin se logr comprobar las hiptesis, tanto la general como
las especficas, ya que se pudo obtener la prediccin del proceso de fundicin mediante
Regresin Ridge y Componentes Principales.

Se obtuvieron los valores de los parmetros de las variables de entrada para disminuir el
tiempo de puesta en marcha del proceso de fundicin; y se elimin la multicolinealidad
entre las variables regresoras del modelo.

60
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

Con esto nos da pie para el trabajo futuro en el cual se propone una optimizacin para
encontrar los mejores parmetros de las variables involucradas en el proceso, sta
optimizacin podra ser mediante un algoritmo gentico o evolutivo.

61
Mtodos de Regresin Lineal, aplicados en el proceso de
fundicin de un tanque muerto de aluminio 356

Bibliografa
1. Guy L. Curry, Richard M. Feldman, (2011), Manufacturing Systems Modeling and Analysis,
Springer.
2. Montgomery, Peck, Vining (2006), Introduccin al Anlisis de Regresin Lineal, CECSA
3. Montgomery, (2004), Diseo y Anlisis de Experimentos, Wiley.
4. Gutirrez Pulido Humberto, (2008), Anlisis y Diseo de Experimentos, Mc Graw Hill
5. Douglas C. Montgomery, (2003), Applied Statistics and Probability for Engineers, Wiley.
6. Sanford Weisberg, (2005), Applied Linear Regression, Wiley.
7. Amit Sata and B. Ravi (2014) Comparison of Some Neural Network and Multivariate
Regression for Predicting Mechanical Properties of Investment Casting, ASM International
8. Jaynat K. Kittur, M.N Choudhari, M.B Parappagoudar, (2011), Modeling and multi-response
optimization of pressure die casting process using response surface methodology, Springer
9. Ryo Uemukai, (2010) Small sample properties of a ridge regression estimator when there
exist omitted variables.Springer.
10. D.Iono, A.Tanvir, A.Hedry (2000) The use of Principal Components Analysis in Analyzing
Variable Star Data. Elsevier.
11. Junyong Park (2016) Tolerance intervals from ridge regression in the presence of
multicollinearity and high dimension. Elsevier.
12. Yifei Wang, Xiandong Ma, Malcom J. Joyce (2016) Reducing sensor complexity for
monitoring wind turbine performance using principal component analysis. Elsevier.
13. Manjunath Patel G.C Et al. (2016) Squeeze casting process modeling by a convetional
statistical regression analysis approach. Elsevier.

62

You might also like