Professional Documents
Culture Documents
Con frecuencia es necesario estimar valores intermedios entre valores conocidos, y el método
más común empleado para este propósito es la interpolación polinomial.
Dados n + 1 puntos, existe uno y sólo un polinomio de grado n que pasa a través de todos los
puntos.
Pn (x) = a0 + a1 x + a2 x2 + · · · + an xn
La interpolación consiste en determinar el polinomio que pasa por los puntos dados y evaluarlo
en el punto intermedio deseado.
Notar que se trata de un polinomio de grado uno, y que la pendiente de la recta es una
aproximación de diferencias divididas finitas de la primera derivada
En general, cuanto menor sea la distancia entre los puntos, más exacta será la aproximación
Ejemplo
Agrupando términos:
P2 (x) = a0 + a1 x + a2 x2 (2)
donde
a0 = b0 − b1 x0 + b2 x0 x1
a1 = b1 − b2 x0 − b2 x1
a2 = b2
Interpolación cuadrática
b0 = f (x0 ).
f (x1 ) − f (x0 )
b1 =
x1 − x0
Por último, los resultados obtenidos para b0 y b1 se sustituyen en la ecuación (1) y ésta se
evalúa en x = x2 y luego de algunas manipulaciones algebraicas se resuelve para b2 obteniendo
el resultado:
f (x2 ) − f (x1 ) f (x1 ) − f (x0 )
−
x2 − x1 x1 − x0
b2 =
x2 − x0
Nótese que, al igual que en el caso de interpolación lineal, b1 aún representa la pendiente
de la lı́nea que une los puntos x0 y x1 . El último término, b2 (x − x0 )(x − x1 ), introduce la
curvatura de segundo orden en la fórmula.
Interpolación cuadrática
b0 = 0
1.386294 − 0
b1 = = 0.4620981
4−1
1.791759 − 1.386294
− 0.4620981
6−4
b2 = = −0.0518731
6−1
Sustituyendo estos valores en la ecuación (1) se obtiene la fórmula cuadrática:
Como se hizo anteriormente con las interpolaciones lineales y cuadráticas, se usan los puntos en
la evaluación de los coeficientes b0 , b1 , · · · , bn . Se requieren n+1 puntos: [x0 , f (x0 )], [x1 , f (x1 )] · · · ,
Usamos estos datos y las siguientes ecuaciones para evaluar los coeficientes
b0 = f (x0 )
b1 = f [x1 , x0 ]
b2 = f [x2 , x1 , x0 ]
..
.
bn = f [xn , xn−1 , · · · , x1 , x0 ]
f (xi ) − f (xj )
f [xi , xj ] = .
xi − xj
La diferencia dividida de segundo orden, es decir, la diferencia entre las dos diferencias
divididas de primer orden
f [xi , xj ] − f [xj , xk ]
f [xi , xj , xk ] = .
xi − xk
De manera similar, la diferencia dividida de orden n
Se debe notar que no es necesario que los datos usados en la última ecuación estén igualmente
espaciados o que los valores de la abscisa necesariamente se encuentren en orden ascendente.
Todas las diferencias pueden arreglarse en una tabla de diferencias divididas, en donde cada
diferencia se indica entre los elementos que la producen
Los coeficientes del polinomio de interpolación de Newton son los elementos de la primera fila
de la tabla.
Forma general de los polinomios de interpolación de Newton
−0.02041100 − (−0.05187311)
f [x3 , x2 , x1 , x0 ] = = 0.007865529
5−1
Forma general de los polinomios de interpolación de Newton
f (n+1) (ξ)
Rn = (xi+1 − xi )n+1
(n + 1)!
f (n+1) (ξ)
Rn = (x − x0 )(x − x1 ) · · · (x − xn )
(n + 1)!
donde ξ está en alguna parte del intervalo que contiene la incógnita y los datos
Cálculo del error en la interpolación polinomial de Newton
Al ser desconocida la derivada de la función, se usa una diferencia dividida finita que aproxima
la (n + 1)-ésima derivada:
Rn ∼
= f [xn+1 , nn , xn−1 , · · · , x0 ](x − x0 )(x − x1 ) · · · (x − xn ) (4)
f (x1 ) − f (x0 )
f [x1 , x0 ] =
x1 − x0
como
f (x1 ) f (x0 )
f [x1 , x0 ] = +
x1 − x0 x0 − x1
en lo que se conoce como forma simétrica. Sustituyendo esta expresión en el polinomio de
interpolación de Newton de grado 1 se obtiene
x − x0 x − x0
P1 (x) = f (x0 ) + f (x1 ) + f (x0 )
x1 − x0 x0 − x1
Simplificando se obtiene el polinomio de Lagrange de primer grado
x − x1 x − x0
P1 (x) = f (x0 ) + f (x1 )
x0 − x1 x1 − x0
Forma general del polinomio de interpolación de Lagrange
donde
n
Y x − xj
Li (x) =
x
j=0 i
− xj
j6=i
Q
donde designa el ”producto de”.
Forma general del polinomio de interpolación de Lagrange
(x − x1 )(x − x2 ) (x − x0 )(x − x2 )
P2 (x) = f (x0 ) + f (x1 )
(x0 − x1 )(x0 − x2 ) (x1 − x0 )(x1 − x2 )
(x − x0 )(x − x1 )
+ f (x2 )
(x2 − x0 )(x2 − x1 )
Rn ∼
= f [xn+1 , nn , xn−1 , · · · , x0 ](x − x0 )(x − x1 ) · · · (x − xn )
Polinomio de interpolación de Lagrange
(2 − 4)(2 − 6) (2 − 1)(2 − 6)
P2 (x) = 0+ 1.386294
(1 − 4)(1 − 6) (4 − 1)(4 − 6)
(2 − 1)(2 − 4)
+ 1.791760 = 0.5658444
(6 − 1)(6 − 4)
Como se esperaba, ambos resultados concuerdan con los que se obtuvieron al usar el polinomio
de interpolación de Newton.
Interpolación con interp1
% d e f i n i c i o n de l o s d a t o s
t =(0: pi / 4 : 2 ∗ pi ) ’
y = sin ( t )
% puntos a evaluar
Xq=(0: pi / 1 2 : 2 ∗ pi ) ’
% metodos a u t i l i z a r
Y q l i n = interp1 ( t , y , Xq , ’ l i n e a r ’ )
Yq cub = interp1 ( t , y , Xq , ’ c u b i c ’ )
Y q s p l = interp1 ( t , y , Xq , ’ s p l i n e ’ )
% grafica
plot ( t , y , ’ o ’ ,Xq , Y q l i n , Xq , Yq cub , Xq , Y q s p l ) ;
legend ( ’ ’ , ’ l i n e a l ’ , ’ c u b i c a ’ , ’ s p l i n e ’ )
∗
se pueden utilizar diferentes métodos de interpolación, en este caso usaremos interpolación lineal,
cúbica o mediante splines cúbicos, que es una interpolación usando trazadores, es decir, polinomios de
grado 3 definidos por partes
Interpolación con interp1
0.8
x = linspace ( 0 , 6 , 1 5 ) ;
0.7
y = 1 . / ( x +1);
p = polyfit (x , y , 2 ) 0.6
y1 = polyval ( p , x ) ; 0.5
plot ( x , y , ’ o ’ , x , y1 , ’− ’ ) ; 0.4
legend ( ’ y ’ , ’ y1 ’ )
0.3
0.2
0.1
0 1 2 3 4 5 6
∗
Notar que el polinomio de grado 2 no pasa por los puntos de la función original, matemáticamente el
polinomio que ajusta perfectamente un conjunto de 15 puntos es un polinomio de grado 14
Interpolación inversa
Los valores de f (x) y x son las variables dependiente e independiente, respectivamente. Los
valores de x con frecuencia están espaciados uniformemente. Un ejemplo simple es una tabla
de valores obtenida para la función f (x) = 1/x
x 1 2 3 4 5 6 7
f (x) 1 0.5 0.3333 0.25 0.2 0.1667 0.1429
Si se deben usar los mismos datos, pero se tiene un valor de f (x) y se desea determinar el
valor de x correspondiente, tenemos un caso de interpolación inversa.
Por ejemplo, para los datos anteriores, suponga que se le pide determinar el valor de x que
corresponda a f (x) = 0.3. En tal caso, como la función es conocida la respuesta correcta se
determina directamente, x = 1/0.3 = 3.3333.
En caso de no conocerse la forma de la función se podrı́an intercambiar los valores f (x) y
x (es decir, tan sólo graficar x contra f (x)) e interpolar. Por desgracia, cuando se invierten
las variables no hay garantı́a de que los valores de la nueva abscisa (f (x)) estén espaciados
uniformemente. Por ejemplo, para f(x) = 1/x el resultado es
que son p
0.375 ± (−0.375)2 − 4(0.041667)0.78333 5.704158
x= =
2(0.041667) 3.295842
Ası́, la segunda raı́z, 3.296, es una buena aproximación al valor verdadero: 3.333. Si se desea
una exactitud adicional, entonces podrı́a emplear un polinomio de tercer o cuarto grado junto
con uno de los métodos para la resolución de ecuaciones no lineales.
Extrapolación
Aunque en general cuanto mayor es el grado mejor es la interpolación, a veces los polinomios
de orden superior tienden a ser mal condicionados, es decir, a ser muy sensibles a los errores
de redondeo.
En 1901, Carl Runge publicó un estudio sobre las desventajas de la interpolación polinómica
de orden superior. Dada
1
f (x) =
1 + 25x2
que ahora se llama la función de Runge. Tomó valores de la función uniformemente espaciados
en el intervalo [-1, 1]. A continuación, utilizó la interpolación de polinomios de orden creciente
y encontró que al tomar más puntos, los polinomios y la curva original diferı́a considerablemente.
Además, la situación se deterioró considerablemente a medida que aumentaba el orden.
Desventajas de la interpolación polinomial
x = linspace ( − 1 , 1 , 5 ) ;
y = 1./(1+25∗ x . ˆ 2 )
xx = linspace ( − 1 , 1 ) ;
p = polyfit (x , y , 4 ) ;
yp = polyval ( p , xx ) ;
y r = 1 . / ( 1 + 2 5 ∗ xx . ˆ 2 )
plot ( x , y , ’ o ’ , xx , yp , xx , yr , ’−− ’ )
axis ([ −1 1 −0.5 2 ] )
legend ( ’ ’ , ’ p o l i n o m i o ’ , ’ runge ’ )
x = linspace ( − 1 , 1 , 1 1 ) ;
y = 1./(1+25∗ x . ˆ 2 )
xx = linspace ( − 1 , 1 ) ;
p = polyfit (x , y , 1 0 ) ;
yp = polyval ( p , xx ) ;
y r = 1 . / ( 1 + 2 5 ∗ xx . ˆ 2 )
plot ( x , y , ’ o ’ , xx , yp , xx , yr , ’−− ’ )
axis ([ −1 1 −0.5 2 ] )
legend ( ’ ’ , ’ p o l i n o m i o ’ , ’ runge ’ )
A pesar de usar un polinomio de grado mayor el ajuste se ha vuelto peor en los extremos del
intervalo.
Actividades
I El esfuerzo, en kips por pie cuadrado (kpc) de nueve muestras tomadas a distintas
profundidades en un estrato de arcilla son:
Profundidad, m 1.9 3.1 4.2 5.1 5.8 6.9 8.1 9.3 10.0
Esfuerzo, kpc 0.3 0.6 0.4 0.9 0.7 1.1 1.5 1.3 1.6
Utilice un polinomio de interpolación de Newton de grado 3 para obtener el esfuerzo
cortante a 3.8 m. Confirmar el resultado usando polyfit.
I Dada la siguiente tabla de vapor sobrecalentado:
En caso de que exista un error sustancial en los datos, la mejor estrategia para el ajuste de
curvas es encontrar una función de aproximación que se adapte a la forma o la tendencia
general de los datos, sin que necesariamente pase por todos los puntos individuales.
La forma más sencilla de hacer esto es trazar una lı́nea recta que ajuste mejor los puntos
(x1 , y1 ), (x2 , y2 ), ..., (xn , yn )
y = mx + b
donde m y b son coeficientes que representan la pendiente y el origen, respectivamente. Si los
puntos (x1 , y1 ), (x2 , y2 ), ..., (xn , yn ) estuvieran exactamente sobre la recta tendrı́amos
yi = mxi + b
Regresión lineal
yi = mxi + b + di
di = yi − mxi − b
Por lo tanto, el valor residual es la diferencia entre el valor real de y, y el valor aproximado,
mx + b, predicho por la ecuación lineal.
Criterios para un ajuste “mejor”
Una de las estrategias para la obtención de la mejor lı́nea a través de los datos serı́a minimizar
la suma de los errores residuales para todos los datos disponibles, como en
n
X n
X
di = (yi − mxi − b)
i=1 i=1
Una forma de eliminar el efecto de los signos podrı́a ser minimizar la suma de los valores
absolutos de las divergencias, como en
n
X n
X
|di | = |yi − mxi − b|
i=1 i=1
Este criterio puede producir un ajuste no único: cualquier lı́nea recta que cae dentro de las
lı́neas discontinuas reducirá al mı́nimo la suma de los valores absolutos de los residuos.
Criterios para un ajuste ”mejor”
La tercera estrategia para obtención de la mejor lı́nea es el criterio minimax. En esta técnica,
se elige la lı́nea que minimiza la distancia máxima que un punto concreto está de la lı́nea.
Esta estrategia es poco adecuada ya que da la influencia muy grande a un valor atı́pico, es
decir, un solo punto con un gran error.
Una estrategia que supera las deficiencias de los enfoques mencionados anteriormente es
reducir al mı́nimo la suma de los cuadrados de los residuos:
n
X n
X
Sr = d2i = (yi − mxi − b)2
i=1 i=1
Este criterio, de mı́nimos cuadrados, produce una lı́nea única para un conjunto dado de
datos.
Ajuste por mı́nimos cuadrados de una lı́nea recta
Para determinar los valores de los coeficientes m y b, derivamos la expresión de Sr con respecto
a cada coeficiente:
n
∂Sr X
= −2 (yi − mxi − b)
∂b i=1
n
∂Sr X
= −2 [(yi − mxi − b)xi ]
∂m i=1
X
Como b = nb, y se tiene un sistema de dos ecuaciones lineales simultáneas con dos
incógnita, m y b
n n
!
X X
yi = xi m + nb
i=1 i=1
n n n
! !
X X X
yi xi = x2i m+ xi b
i=1 i=1 i=1
n n
P Pn Pn
i=1 xi yi − i=1 xi i=1 yi
m= Pn n 2 (1)
n i=1 x2i −
P
i=1 x i
Ejemplo
En la fabricación del producto XXX, la cantidad de compuesto β presente es controlada
por la cantidad del ingrediente α utilizada en el proceso. Al fabricar un galón de XXX,
se registraron la cantidad de α usada y la cantidad de β presente, obteniéndose los datos
mostrados en la tabla.
α 3 4 5 6 7 8 9 10 11 12
β 4.5 5.4 5.7 6.6 7.0 7.7 8.5 8.7 9.5 9.7
Ajuste por mı́nimos cuadrados de una lı́nea recta
n n
P Pn Pn
i=1 xi yi − i=1 xi i=1 yi 10(598.6) − 75(73.4)
m= 2 = = 0.583
10(645) − 752
Pn n
n i=1 x2i −
P
i=1 x i
y = mx + b = 0.583x + 2.967
Utilizando esta ecuación podemos estimar el valor de β presente en el producto XXX. Por
ejemplo, si la α utilizada es 30 onzas/galón, entonces la β presente en el producto XXX
será 0.583(30) + 2.967 = 20.457 onzas/galón.
Ajuste por mı́nimos cuadrados de una lı́nea recta
Se puede demostrar que si se cumplen estos criterios, la regresión por mı́nimos cuadrados
proporcionará la mejor estimación de m y b. Esto se conoce en estadı́stica como principio de
máxima verosimilitud.
Además, si se cumplen estos criterios, la desviación estándar respecto la lı́nea de regresión se
puede determinar como s
Sr
sy/x = (3)
n−2
donde sy/x se denomina el error estándar de la estimación.
Cuantificación del error de regresión lineal
Para ello, volvemos a los datos originales y determinamos la suma total de los cuadrados
alrededor de la media de la variable dependiente (en nuestro caso, β) St que representa la
magnitud del error residual asociado con la variable dependiente antes del ajuste. Después
de realizar el ajuste, podemos calcular Sr , la suma de los cuadrados de los residuos alrededor
de la lı́nea de regresión que caracteriza el error residual que queda después del ajuste. La
diferencia entre las dos cantidades, St − Sr , cuantifica la reducción de error.
Debido a que la magnitud de esta cantidad es dependiente de la escala, la diferencia se
normaliza respecto a St para producir
St − Sr
r2 = (4)
St
Ejemplo
Calcule la desviación total estándar, el error estándar de la estimación, y el coeficiente de
correlación para el ajuste.
Por lo tanto, debido sy/x < sy , el modelo de regresión lineal tiene mérito. La medida de la
mejora se cuantifica por
28.364 − 0.404926
r2 = = 0.985723945
28.364
√
o r = 0.985723945 = 0.992836313. Estos resultados indican que 98.57% de la
incertidumbre original ha sido explicada por el modelo lineal.
Modelo lineal general
La regresión lineal es una poderosa técnica para el mejor ajuste lineal de un conjunto de
datos. Sin embargo, se basa en el hecho de que la relación entre las variables dependientes e
independientes sea lineal. Este no siempre es el caso, y el primer paso en cualquier análisis
de regresión deberı́a ser una inspección visual de los datos para determinar si se aplica un
modelo lineal.
A menudo un modelo lineal no es suficiente y es necesario una regresión polinómial. En otros
casos, se pueden utilizar transformaciones para expresar los datos de forma que sea aplicable
un modelo lineal.
El modelo lineal general de mı́nimos cuadrados es
y = b0 + b1 x + b2 x2 + b3 x3 + · · · + bm xm + d
Modelo lineal general
donde la matriz [X] es una matriz generalmente no cuadrada que se forma utilizando los
valores de la variable independiente de la manera siguiente:
xn ··· x21 x1 1
1
xn2 ··· x22 x2 1
[X] =
.. .. .. .. ..
. . . . .
xnm ··· x22 x2 1
[Y ]T = y1 y2 · · · ym
Modelo lineal general
El vector columna [B] contiene los coeficientes, es decir, las incógnitas del ajuste
[B]T = b0 b1 · · · bn
[D]T = d1 d2
··· dm
Pn Pn 2
La suma de los cuadrados de los residuos es Sr = i=1 yi − i=1 bj xj
Esta cantidad se minimiza tomando las derivadas parciales con respecto a cada uno de los
coeficientes e igualando a cero la ecuación resultante.
Se puede demostrar que esta última ecuación es equivalente a las ecuaciones normales desarrolladas
para la regresión lineal.
Este sistema de ecuaciones lineales se puede resolver utilizando cualquiera de las técnicas ya
estudiadas. Por ejemplo, podemos utilizar la matriz inversa para resolver este sistema:
Ejemplo
Los siguientes datos muestran los contaminantes atmosféricos yi (respecto de cierta norma
de calidad del aire) en intervalos de media hora, ti .
Determine el polinomio de segundo grado que mejor se ajusta a datos dados. Resolvemos
este problema utilizando MATLAB. Primero introducimos los datos:
X = [ ones ( size ( t ) ) t t . ˆ 2 ]
X =
1.0000 1.0000 1.0000
1.0000 1.5000 2.2500
1.0000 2.0000 4.0000
1.0000 2.5000 6.2500
1.0000 3.0000 9.0000
1.0000 3.5000 12.2500
1.0000 4.0000 16.0000
1.0000 4.5000 20.2500
1.0000 5.0000 25.0000
Modelo lineal general
>> X’*X
ans =
1.0e+03 *
0.0090 0.0270 0.0960
0.0270 0.0960 0.3780
0.0960 0.3780 1.5833
>> b=inv((X’*X))*(X’*y)
b =
−1.9317
2.0067
−0.3274
El polinomio cuadrático que mejor se ajusta a los datos es: y = −0.3274t2 + 2.0067t − 1.9317
Modelo lineal general
Cuando las técnicas de regresión polinomial directa no son apropiadas, en algunos de estos
casos se pueden utilizar transformaciones para expresar los datos en una forma que sea
compatible con la regresión lineal.
Un ejemplo es el modelo exponencial
y = aebx
donde a y b son constantes.
Este modelo se emplea en muchos campos de la ingenierı́a para caracterizar cantidades que
aumentan o disminuyen a una velocidad que es directamente proporcional a sus propias
magnitudes,por ejemplo el crecimiento poblacional o el decaimiento radioactivo.
Manipulando algebraicamente las expresiones como la anterior a menudo se pueden linealizar
Modelo exponencial
y = aebx
ln y = ln aebx
ln y = ln a + ln ebx
ln y = ln a + bx ln e
ln y = ln a + bx
1 b1 1
= +
y ax a
Problema
Con los datos
x 5 10 15 20 25 30 35 40 45 50
y 16 25 32 33 38 36 39 40 42 42
Problema
Ajuste de curvas con cftool
función r2 r
lı́nea recta 82% 0.7976
potencia 93% 0.9241
razón de crecimiento 98% 0.9781
parábola 94% 0.9327
Según los datos obtenidos el mejor ajuste se obtiene con la ecuación de la razón de
crecimiento.
Actividades