You are on page 1of 16

Sistemas de ecuaciones lineares

2.1 Sistemas Lineales


Muchas relaciones en naturaleza son lineares, significando que los efectos son proporcionales a sus causas. En la mecnica, por ejemplo, ley de newton segundo de movimiento, F =ma, dice que la fuerza es proporcional a la aceleracin, donde la masa es la constante de la proporcionalidad del objeto. Si sabemos la fuerza y la masa, podemos solucionar esta ecuacin linear para la aceleracin. En electricidad, la ley del Ohm, V = iR, dice que el voltaje a travs de un conductor es proporcional a la corriente que lo atraviesa, donde la resistencia es la constante de la proporcionalidad. Una vez ms si sabemos el voltaje y la resistencia, podemos solucionar para la corriente. En elasticidad, la ley de Hooke dice que la tensin es proporcional a la tensin, donde es mdulo la constante de la proporcionalidad de Young. En dimensiones ms altas, una relacin linear se expresa por una transformacin linear L que relacione un vector de las "causas" u con un vector de los "efectos" f, de modo que

Lu=f
Por ejemplo, la ley del ohm y la leyes de Kirchhoff nos permiten originar un sistema entero de ecuaciones que expresan la relacin linear entre los voltajes y las corrientes en un circuito entero compuesto de muchos conductores (vase el ejemplo 2.1). Como aprendimos en lgebra linear elemental, una transformacin linear entre dos espacios finito-dimensionales del vector es representada convenientemente por una matriz. En la notacin del matriz-vector, un sistema de ecuaciones algebraicas lineares tiene la forma

Ax =b donde A es una matriz conocida m x n , b es un m-vector , y x un n-vector. Si conocemos x, entonces una relacin tan linear nos permite predecir el efecto b de la causa x por la multiplicacin de la matriz-vector: b = Ax. Ms interesante, el sistema
linear puede permitirnos hacer la "ingeniera inversa": si sabemos el vector b de efectos, quisiramos poder determinar el vector correspondiente x de causas. Los mtodos numricos para lograr esto son el tema de este captulo. Incluso cuando las relaciones son no lineales, pueden ser aproximadas, a valores cerca de un cierto valor fijo especfico por una relacin linear. Esto es exactamente lo que hace la derivada en clculo: proporciona una tangente linear local de la aproximacin a una curva no lineal. Esta observacin forma la base para muchos mtodos numricos para solucionar problemas algebraicos no lineales. Incluso los problemas no algebraicos, tales como ecuaciones diferenciadas o integrales, se pueden aproximar en ltima instancia por un sistema de ecuaciones lineales algebraicas, que veremos ms adelante en este libro. Por estas razones, la solucin de los sistemas de ecuaciones lineares forma la piedra angular de muchos mtodos numricos para solucionar una variedad amplia de problemas de cmputo prcticos, y por lo tanto es necesario que nosotros seamos capaces de poder solucionar tales sistemas con exactitud y de manera eficientemente. Un sistema de ecuaciones lineales Ax =b hace la pregunta, "Puede el vector b expresarse como combinacin linear de las columnas de la matriz A? (Es decir," es mentira que b en span(A) = { Ax : x Rn}?"). Si es as se dice que el sistema es consistente, y los coeficientes de esta combinacin linear son dados por los

componentes del vector x de la solucin. All el alcalde puede no ser una solucin; y si hay una solucin, puede o puede no ser nica. En este captulo que consideraremos solamente los sistemas cuadrados, que signifique que m = n, es decir, la matriz tiene el mismo nmero de filas y columnas, o equivalente, los nmeros de las ecuaciones (filas de A y b) y desconocido (los componentes de x ) son iguales. Consideraremos los sistemas donde m n en el captulo 3. Para la simplicidad, centraremos nuestra atencin sobre todo en sistemas lineares verdaderos; los sistemas complejos se pueden tratar semejantemente. Ejemplo 2.1.Circuito Elctrico. Considere el circuito elctrico demostrado en fig. 2.1. Los voltajes dados V y las resistencias R, nosotros deseamos determinar las corrientes que resultan i en cada uno de los tres lazos en el circuito. Para hacerlo aplicamos las leyes fsicas siguientes: Ley Del Ohm: La cada de voltaje a travs de una resistencia R en la direccin de una corriente i es dada por iR. Ley De Kirchhoff: La cada de voltaje neta en un lazo cerrado es cero. Aplicando estas leyes a cada lazo en el circuito, obtenemos el sistema de tres ecuaciones lineares i1 R1+ (i1-i2)R2+(i1+i3)R3 + V1=0 (i2-i1) R2 + (i2+i3) R5 - V2=0 (i3-i1) R3 + i3R4+ (i3-i2) R5=0 Se puede escribir en forma de matriz como
R1+R2+R3 -R2 -R3 -R2 R2+R5 -R5 -R3 -R5 R3 4 5 +R +R i1 i2 i3

-V1 V2 0

As, este problema tiene la forma Ax = b y se puede solucionar usando los mtodos que estudiaremos en este captulo.

R1

i1 V1 R3 i3

R2

i2 R5

V2

R4
Figura 2.1: Circuito elctrico con los resistores y las fuentes del voltaje.

2.2 Existencia y unicidad


Una matriz A de n x n para ser no singulares debe satisface cualquiera de las condiciones equivalentes siguientes: 1. 2. 3. 4.

A tiene un inverso El det(A) 0 rango (A) = n


Para cualquier vector z 0, A z 0

De otra manera, la matriz es singular. La existencia y la unicidad de una solucin con un sistema de ecuaciones lineales Ax = b dependen de la matriz si es singular o no singular. Si la matriz un es no singular, entonces su inverso existe y el sistema Ax = b siempre tiene la solucin nica x = A -1 b independientemente del valor para b. Si, de otra parte, la matriz A es singular, entonces el nmero de soluciones es determinado por la parte derecha del vector b ; para un valor dado de b no puede haber ninguna solucin, pero si hay una solucin x, de modo que Ax = b, entonces nosotros tenemos A (x + z) = b para cualquier escalar , donde la z 0, es un vector tal que A z = 0 As, una solucin de un cuadrado, el sistema constante, singular, lineal no puede ser nico. Para una matriz dada A y la parte derecha vector b. las posibilidades son resumidas as:

nica solucin: A no singular , b arbitraria. Infinidad de soluciones : A singular , b span(A) (consistente ) Ninguna solucin : A singular , b span(A) (inconsistente) En dos dimensiones, cada ecuacin linear en el sistema determina una lnea recta en el plano. La solucin del sistema es el punto de la interseccin de las dos lneas. Si las dos lneas rectas no son paralelas, despus tienen un punto nico de la interseccin (el caso no singular). Si las dos lneas rectas son paralelas, entonces o no se intersecan en todos (ninguna solucin) o las dos lneas son iguales (cualquier punto a lo largo de la lnea es una solucin). En dimensiones ms altas, cada ecuacin determina un hiperplano. En el caso no singular, la solucin nica es el punto de la interseccin de todos los hiperplanos. Ejemplo 2.2 Singularidad y Nosingularidad. El sistema 2 x 2 2x1 + 3x2 = b1 5x1 + 4x2 = b2 O en la notacin de matriz-vector
Ax = 2 3 x1 = b1 = b
5 4 x2 b2

tiene una solucin nica sin importar el valor de b, puesto que la matriz A es no singular. Si b = [8 13] T, por ejemplo, entonces la solucin nica es x = [1 2] T. El sistema 2 x 2
Ax = 2 3 x1 = b1 = b
4 6 x2 b2

Por otra parte, tiene una matriz singular A, y por lo tanto puede no tener una solucin, dependiendo del valor de b, y no puede tener una solucin nica en ningn caso. Por ejemplo, si b = [ 4 7 ] T, entonces all no tiene ninguna solucin, mientras que si b = [ 4 8 ] T, entonces x=
(4-2)/3

es una solucin para cualquier nmero verdadero .

2.3 Sensibilidad y condicionamiento


Indicando los criterios para la existencia y la unicidad de una solucin a un sistema lineal A x=b, ahora consideramos la sensibilidad de la solucin x a las perturbaciones en los datos de entrada, que para este problema la matriz A y derecho-mano-lado vector b. Para medir tales perturbaciones, necesitamos una cierta nocin del "tamao" para los vectores y las matrices. El concepto escalar de la magnitud, del valor absoluto, o del mdulo se puede generalizar al concepto de las normas para los vectores y las matrices. 2.3.1 Normas Del Vector

Aunque una definicin ms general es posible, todas las normas del vector que utilizaremos son casos de las p-normas, que para un nmero entero p >0 y un nvector x se definen

| | x| | p =

( )
n

1p

| xi |

i= 1

Los casos importantes son: 1-norma:

| | x| |1

n i=1
n

| xi |

Llamado a veces la norma de Manhattan porque en el plano corresponde a la distancia entre dos puntos segn lo medido en "bloques de la ciudad." 2-norma:
| | x| | 2 =

( )
| xi |
2 i= 1

12

cul corresponde a la nocin generalmente de la distancia en espacio euclidiano, as que esto tambin se llama la norma euclidiana.

-norma: cul se puede ver como caso de limitacin como p .

| | x| |

max | xi |
1 i n

Todas estas normas dan resultados similares cualitativos , pero en ciertas circunstancias una norma particular puede ser la ms fcil de trabajar analticamente o de cmputo. La 1-norma o la -norma se utiliza generalmente en analizar la sensibilidad de soluciones a los sistemas lineares. Haremos uso extenso de las 2-normas ms adelante en otros contextos. Las diferencias entre estas normas se ilustran por R2 en la fig. 2.2, que demuestra la esfera de la unidad, { x : || x ||p = 1}, para p = 1,2, . (Nota que la esfera de la unidad, ms exacta se llama el crculo de la unidad en dos dimensiones, no es realmente "redonda" excepto en las 2-normas, de las cuales consigue su nombre.) La norma de un vector es simplemente el factor con el cual la esfera correspondiente de la unidad se debe ampliar o contraer para abarcar el vector.

Ejemplo 2.3 Normas Del Vector Para el vector x = [- 1.6, 1.2] T demostrado en fig. 2.2 || x ||1 = 2.8, || x ||2 = 2.0, || x || = 1.6
1.5

(-1.6,1.2)

2 1

-2.0

2.0

Figura 2.2: Esferas de la unidad en varias normas del vector. En general, para cualquier n-vector x, tenemos || x ||1 || x ||2 || x || por otra parte, tambin tenemos As || x ||1 n || x ||2, || x ||2 n || x || , y || x ||1 n || x ||

-1.5

para una n dada, cualesquiera dos de estas normas diferencian cerca en la mayora una constante, as que son todos equivalentes en el sentido que si uno es pequeo, deben todos ser proporcional pequeos (de hecho, todas las p-normas son equivalentes en este sentido). Por lo tanto, podemos elegir cualquier norma es la ms conveniente de un contexto dado. En el resto de este libro, un subndice apropiado ser utilizado para indicar una norma especfica, cuando sea necesario, pero el subndice ser omitido cuando no importe la norma particular utilizada. Para cualquier p-norma del vector, las propiedades importantes, donde x y y estn en cualquier vector: 1.||x|| > 0 si x 0. 2.|| x||=| |||x|| para algn escalar . 3.||x + y|| ||x||+||y|| (desigualdad del triangulo) En un tratamiento ms general, la definicin de una norma del vector se puede tomar para ser cualquier funcin de valores reales de un vector que satisfaga estas tres caractersticas. Observe que las primeras dos caractersticas juntas implican que ||x|| = 0 si, y solamente si, x =0. Una variacin til en la desigualdad del tringulo es | ||x||-||

y|| | ||x - y|| , lo cual tambin demuestra que una norma del vector es una funcin
continua.

2.3.2 Normas De la Matriz


Tambin necesitamos una cierta manera de medir el tamao o la magnitud de matrices. Una vez ms una definicin ms general es posible, pero todas las normas de la matriz que utilizaremos son definido en trminos de una norma subyacente del vector. Especficamente, dado una norma del vector, definimos la norma correspondiente de la matriz A de m x n
| | A| |

max
X= 0

| | Ax| | | | x| |

Tal norma de la matriz se dice que es inducida o subordinado a la norma del vector. Intuitivamente, la norma de una matriz mide el mximo que estira la matriz hacia a cualquier vector, segn lo medido en la norma dada del vector. Algunas normas de la matriz son mucho ms fciles de computar que otras. Por ejemplo, la norma de la matriz que corresponde a la 1-norma del vector es simplemente la suma absoluta mxima de la columna de la matriz,

| | A| |1

max
j

m i= 1
n j= 1

| aij |

y la norma de la matriz que corresponde al vector -norma es simplemente la suma absoluta mxima de la fila de la matriz, | | A| |

max
i

| aij |

la manera prctica de recordar stos es que las normas de la matriz convienen con las normas correspondientes del vector para una n x 1 matriz. Desafortunadamente, la norma de la matriz que corresponde a las 2-normas del vector no es as que fcil computar (vase la seccin 3.6.1). Ejemplo 2.4 Normas De la Matriz Para la matriz

A =

2 1 3

-1 0 -1

1 1 4

las sumas absolutas mximas de la columna y de la fila, respectivamente , dan: || A ||1= 6 y || A || =8

Para las 2-normas de esta matriz, vea el ejemplo 3.17. Las normas de la matriz que hemos definido satisfacen las caractersticas importantes siguientes, donde A y B son matrices cuales quiera: 1. || A ||>0 si A 0 2. || A || = | | || A || para algn escalar 3. || A + B || || A ||+|| B || 4. || A B || || A || || B || 5. || A x|| || A || || x || para algn vector x para cualquier vector x. En un tratamiento ms general, la definicin de una norma de la matriz se puede tomar para ser cualquier funcin con valor real de una matriz que satisface las primeras tres de estas caractersticas. Las dos caractersticas restantes, conocidas como submultiplicativa o consistencia condicionan, el alcalde no puede sostener para estas normas ms generales de la matriz, sino que sostienen siempre para las normas de la matriz inducidas por las p-normas del vector. Observe otra vez que las primeras dos caractersticas juntas implican que || A || = 0 si, y solamente si, A = 0.

2.2.3 NUMERO CONDICIONAL DE UNA MATRIZ El nmero de la condicin de una matriz cuadrada no singular A con respecto a una norma dada de la matriz se define como cond(A) = ||A|| ||A-1||. Esta convencin, cond(A) = si A es singular. Veremos en la seccin 2.3.4 que este concepto es constante con la nocin general del nmero de la condicin definida en la seccin 1.2.6 en que el nmero de la condicin de la matriz limita el cociente del cambio relativo en la solucin de un sistema linear a un cambio relativo dado en los datos de entrada. Ejemplo 2.5 numero condicional de la matriz Como puede ser verificado fcilmente por la multiplicacin de la matriz, la inversa de la matriz en el ejemplo 2.4 se da A As que ||A-1||1=4.5 As, tenemos cond1(A)=||A||1||A-1||1=64.5=27 y ||A-1||=3.5
-1

0.5 -0.5 -0.5

1.5 2.5 -0.5

-0.5 -0.5 0.5

Y cond (A)=||A||||A-1||=83.5=28 Para el nmero de la condicin de esta matriz usando las 2-normas, vea el ejemplo 3.17. Del ejemplo 2.5 vemos que el valor numrico del nmero de la condicin de una matriz de n x n depende de la norma particular usada (indicado por el subndice correspondiente), pero debido a la equivalencia de las normas subyacentes del vector, estos valores pueden diferenciar cerca en la mayora una constante fija (que dependa de n), y por lo tanto son igualmente tiles como medidas cuantitativas de condicionamiento. Desde entonces

| | A|| .| | A-1| | =

| | Ax| | max X= 0 | | x| |

). (

| | Ax| | min X= 0 | | x| |

-1

el nmero de la condicin de una matriz mide el cociente de estirar relativo mximo a contraerse relativo mximo que la matriz hace a cualquier vector distinto a cero. Otra manera de decir esto es que el nmero de la condicin de una matriz mide la cantidad de distorsin de la esfera de la unidad (en la norma correspondiente del vector) bajo transformacin por la matriz. Cuanto ms grande es el nmero de la condicin, torcido (relativamente largo y enrarezca) la esfera de la unidad se convierte cuando son transformado por la matriz. En dos dimensiones, por ejemplo, el crculo de la unidad en las 2-normas se convierte en una elipse cada vez ms cigarro-formada, y con la 1-norma o la norma, la esfera de la unidad se transforma de un cuadrado en un paralelogramo cada vez ms sesgado mientras que el nmero de la condicin aumenta. Ejemplo 2.6 numero de condicin de la matriz La figura 2.3 ilustra el efecto de cuatro diversas matrices en el crculo de la unidad en R2 usando las 2-normas. A1 rota el crculo de la unidad a la derecha por 30 grados pero no cambia la longitud euclidiana de ningn vector, as cond2(A1) = 1. A2 estira el vector e1 de la base por un facto de 2 y contrae el vector e2 de la base por un factor de 0.5, y stos son ambo mximos, as cond2(A2) = 2/0.5 = 4. A3 rota y tuerce el crculo de la unidad, pero el cociente mximo sigue siendo igual que con A2, as cond2(A3) = 4. Finalmente, A4 es una transformacin general bajo la cual el cociente mximo ocurre no ms de largo para los vectores de la base, pero el valor del mximo sigue siendo igual, as cond2(A4) = 4.

a2

a2 a1 a1

A1 = -0.5

0.87

0.5 0.87

cond2 (A1)=1

A2 = 0

0 0.5

cond2 (A2)=4

a2 a2 a1

a1

A3 =

1.73 -1

0.25 0.43

cond2 (A3)=4

A4 = 0.47

1.52

0.91 0.94

cond2 (A4)=4

Figura 2.3: Transformacin del crculo de la unidad en 2-normas por varias matrices. Las caractersticas importantes siguientes del nmero de condicin son fcilmente de la definicin y asimiento para cualquier norma: 1. Para cualquier matriz A, cond(A) 1. 2. Para la matriz identidad, cond(I) = 1.

3. Para cualquier matriz A y el escalar distinto de cero, cond(A) = cond(A). 4. Para cualquier matriz diagonal D = diag(di), cond(D) = ( max | di | / (min | di| ). 5. El nmero de la condicin es una medida de cmo se esta acercando una matriz a ser singular: una matriz con un nmero grande de la condicin (que cuantificaremos en la seccin 2.3.4) es casi singular, mientras que una matriz con un nmero de la condicin cerca de 1 est lejos de ser singular. Es obvia de la definicin que una matriz no singular y su inversa tienen el mismo nmero de la condicin. Esto est para razonar, desde entonces si una matriz es casi singular, despus su inversa est igualmente cerca de ser singular. Observe que el determinante de una matriz no es un buen indicador de la singularidad cercana: aunque una matriz A es singular si el det(A) = 0, la magnitud de un determinante distinto a cero, grande o pequeo, no da ninguna informacin sobre que tan cerca esta la matriz de ser singular. Por ejemplo, det(In) =n, para el cual puede ser arbitrariamente pequeo | |<1 Pues veremos pronto, la utilidad del nmero de la condicin consiste en la determinacin de la exactitud de soluciones a los sistemas lineares. La definicin del nmero de la condicin implica lo contrario de la matriz, as que computar su valor es obviamente una tarea no trivial. En hecho, computar el nmero de la condicin directamente de su definicin requerira substancialmente ms trabajo que solucionando el sistema linear que exactitud debe ser determinada usando el nmero de la condicin. En la prctica, por lo tanto, el nmero de la condicin se estima simplemente, a quizs dentro de una orden de la magnitud, como subproducto relativamente barato del proceso de la solucin. La matriz norma ||A|| es fcil de computar como la suma absoluta mxima de la columna (o suma de la fila, dependiendo de la norma usada). Est estimando ||A-1|| en el bajo costo que presenta un desafo. De las caractersticas de normas, entonces sabemos eso si z es la solucin a Az = y, entonces ||z||=||A-1y|| ||A-1|| ||y||, As que

| | z| | | | y| |

| | A-1 | |

de modo que este lmite se alcanza para un cierto vector ptimo elegido y. As, si podemos elegir un vector y tal que el cociente ||z||/||y|| es tan grande como sea posible, entonces tendremos una estimacin razonable para ||A-1||.

Ejemplo 2.7 Estimacin de la valoracin . Considere la matriz

A=

0 3 .91 0 7 .45

0.659 0.330

Si elegimos y = [ 0, 1.5]T, entonces z = [ - 7780, 10780]T, de modo que

| | A-1 | |
y por lo tanto

| | y| | 1

| | z| |1

1.238 x 10

cond1(A)=||a||1 ||A-1||1 1.370x1.238x104=1.696x104 resulta ser exacto al nmero de los dgitos demostrados. Las ramificaciones de este nmero relativamente grande de la condicin sern exploradas en los ejemplos 2.8 y 2.17.

El vector y en el ejemplo 2.7 fue elegido cuidadosamente para producir el cociente posible mximo ||z||/||y||, y por lo tanto el valor correcto para ||A-1||. Encontrar una y tan ptima sera excesivamente costoso, en general, pero una aproximacin til se puede obtener mucho ms barato. Uno heurstico debe elegir y como la solucin al sistema AT y = c, donde est un vector c que componentes son 1, con las muestras elegidas sucesivamente para hacer la y que resulta tan grande como sea posible. Otra estrategia es simplemente intentar algunas opciones al azar para y; tomar el cociente mximo entre ellas rinde generalmente una estimacin para el ||A -1|| que est bastante cercano para los propsitos prcticos. Un acercamiento alternativo para condicionar la valoracin es tratarlo como problema convexo de la optimizacin que se pueda solucionar muy eficientemente en la prctica usando un algoritmo heurstico. Otra opcin, al usar las 2-normas, es obtener el nmero de la condicin de la descomposicin singular del valor (vase la seccin 3.6.1), pero sta es excesivamente costoso a menos que el SVD se est computando ya de todos modos por otras razones. Afortunadamente, los usuarios no necesitan preocuparse de estos detalles, como la mayora de las buenas paquetes de software modernas para solucionar sistemas lineares proporcionan un perito eficiente y confiable de la condicin, basados en una puesta en prctica sofisticada de uno de los mtodos contorneados aqu (vase la tabla 2.1).

2.3.4 LIMITE DEL ERROR


Adems de ser un indicador confiable de la singularidad cercana, el nmero de la condicin tambin proporciona un lmite cuantitativo para el error en la solucin computada a un sistema linear, pues ahora demostraremos. Deje x ser la solucin al sistema lineal no singular Ax = b y x la solucion del sistema Ax=b+b con un lado derecho perturbado. Si definimos el Ax=A(x+x)= Ax+Ax=b+b Despus Ax=b,nosotros debemos tener Ax=b, y por lo tanto x = A-1b. Tomando normas, obtenemos las desigualdades ||b||=||Ax|| ||Ax|| ||x|| o ||x|| ||b||/||A||

Y ||x||=||A-1b|| ||A-1|| ||b|| Combinando estas desigualdades, obtenemos


| | x| | | | x| | | | A-1 | . | | b| | | | | A| | | | b| |

Por definicin ||A|| ||A -1|| = cond(A), as que nosotros por lo tanto obtenemos
| | x| | | | x| |

cond(A)

| | b| | | | b| |

As, el nmero de la condicin de la matriz es un "factor de la amplificacin" los lmites es el cambio relativo mximo en la solucin debido a un cambio relativo dado en el vector del derecho-mano-lado (compare con la nocin general del nmero de la condicin definida en la seccin 1.2.6). Un resultado similar celebra para los cambios relativos en las entradas de la matriz A. Si Ax = b y (A + E)x = b, entonces x=x-x=A-1(Ax-b)=A-1Ex Tomando normas, obtenemos la desigualdad ||x|| ||A-1|| ||E|| ||x|| Cul, sobre usar la definicin del cond (A), rinde el lmite
| | x| | | | x| |

cond(A)

| | E| | | | A| |

Como alternativa a las derivaciones algebraicas apenas dadas, el clculo se puede utilizar para estimar la sensibilidad de sistemas lineares. Introduciendo el parmetro del valor real, definimos A(t) = A + tE y el b(t) = b + tb, y consideramos el x(t) =x+tx al sistema linear A(t)x(t) = b(t). Distinguiendo esta ecuacin con respecto a t, obtenemos A'(t)x(t) + A(t)x'(t) = b'(t) o equivalente Ex(t) + A(t) x =b. Despus de evaluar en t = 0 y de cambiar, la ecuacin anterior se convierte x=A-1b-A-1Ex Tomando normas, obtenemos la desigualdad ||x|| ||A-1b|| + ||A-1Ex|| ||A-1|| ||b||+||A-1|| ||E|| ||x|| Dividiendo ambos lados por el ||x||, obtenemos
| | | A| | .| | A-1 | | | b| | | | A| | .| | x| | + | | A-1 | . | | A| | | | E| | | | | A| |

Igual a

| | | A | | .| | A-1 | .| | b| | | | A| | .| | x| |

| | A-1| | . | | A | | .| | E| | | | A| | | | b| | | | E| | + | | b| | | | A| |

Finalmente usando ||b|| ||A|| ||x|| y la definicin de cond(A)


| | x| | | | x| |

cond(A)

As, vemos otra vez que el cambio relativo en la solucin est limitado por los tiempos del nmero de la condicin el cambio relativo en los datos del problema. Una interpretacin geomtrica de estos resultados de la sensibilidad en dos dimensiones es que si las lneas rectas definidas por las dos ecuaciones son casi paralelas, despus su punto de la interseccin no se define agudamente si las lneas son un pedacito incierto debido a error del redondeo o de medida. Si, por otra parte, las lneas estn lejos de paralelo, perpendicular de la opinin casi, entonces su interseccin se define relativamente agudamente. Estos dos casos se ilustran en fig. 2.4, donde las lneas discontinuas indican la regin de la incertidumbre para cada uno de lnea llena, de modo que el punto de la interseccin en cada caso pudiera estar dondequiera dentro del paralelogramo sombreado. As, un nmero grande de la condicin se asocia a una incertidumbre grande en la solucin.

Para resumir, si los datos de entrada son exactos trabajar a mquina la precisin, despus un lmite razonable para el error relativo en la solucin computada a un sistema linear se da cerca
| | x-x| | | | x| |

cond(A) Emach

Una manera simple de interpretar estos resultados es que la solucin computada pierde sobre dgitos decimales del log10 (cond(A)) que concerniente a la exactitud de la entrada. La matriz en el ejemplo 2.7, por ejemplo, tiene una condicin mayor de 104, as que no contbamos con ningn dgito correcto en la solucin a un sistema linear con esta matriz a menos que los datos de entrada sean exactos a ms de cuatro dgitos decimales y se computa la solucin usando aritmtica con ms de cuatro dgitos decimales de precisin (vase los ejemplos 2.8 y 2.17). Como medida cuantitativa de la sensibilidad, el nmero de la condicin de la matriz desempea el mismo papel del problema de solucionar sistemas lineales -y rinde el mismo tipo de relacin entre delantero y al revs error-como la nocin general del nmero de la condicin definida en la seccin 1.2.6. Una diferencia importante, sin embargo, es que el nmero de la condicin de la matriz nunca es menos de 1. Antes de dejar el tema de determinar exactitud en trminos de la condicin numera, observa estas dos advertencias: ** el anlisis precedente que usa normas proporciona un lmite en el error relativo en los componentes ms grandes del vector de la solucin. El error relativo en los componentes ms pequeos puede ser mucho ms grande, porque una norma del vector es dominada por los componentes ms grandes

de un vector. Los lmites del error de Componentwise se pueden obtener pero son complicados algo para computar, y no perseguiremos este asunto. Los lmites de Componentwise estn de inters particular cuando el sistema se escala mal (vase la seccin 2.4.10). ** el nmero de la condicin de una matriz es afectado por el escalamiento de la matriz (vase el ejemplo 2.10). Un nmero grande de la condicin puede resultar simplemente del escalamiento pobre (vase el ejemplo 2.20), as como de singularidad cercana. El resellado de la matriz puede ayudar al anterior, pero no al ltimo (vase la seccin 2.4.10). 2.3.5 Residual Una forma para verificar una solucin a una ecuacin es substituirla en la ecuacin y considerar cmo los lados izquierdos y derechos emparejan de cerca. La residual de una solucin aproximada x del sistema lineal Ax=b es la diferencia r = b-Ax Si A es no singular, entonces en teora del error ||x||=||x - x|| = 0 si, y solamente si, ||r|| = 0. En la prctica, sin embargo, estas cantidades no son necesariamente pequeas simultneamente. Primero, observe que si el hacha de la ecuacin Ax = b es multiplicada por una constante distinta a cero arbitraria, entonces la solucin es inafectada, pero el residual es multiplicada por el mismo factor. As, la residual se puede hacer arbitrariamente grande o pequeo, dependiendo del escalamiento del problema, y por lo tanto el tamao de la residual es sin setido a menos que se considere concerniente al tamao de los datos del problema y de la solucin. Por esta razn, la residual relativa para la solucin aproximada x se define para ser ||r||/(||A|| ||x||) Para relacionar el error con la residual, observamos eso ||x||=||x-x||=A-1(Ax-b)||=-A-1r||||A-1||||r|| Dividiendo ambos lados por el ||x|| y con la definicin del cond(A), entonces tenemos
| | x| | | | x| |

cond(A)

| | r| | | | A | | .| | x| |

As, una residual relativa pequea implica un error relativo pequeo en la solucin cuando, y solamente cuando, bien-se condiciona A. Para ver las implicaciones de una residual grande, por otra parte, suponga que la solucin computada x satisface exactamente (A+E)x = b. Entonces ||r|| = ||b Ax|| = ||Ex|| ||IE|| ||x||, de modo que tengamos la desigualdad
| | r| | | | A | | .| | x| | | | E| | | |A| |

As, una residual relativa grande implica un error posterior grande en la matriz, que significa que el algoritmo usado para computar la solucin es inestable. Otra manera de decir esto es que un algoritmo estable producir invariable una solucin con una residual relativa pequea, independiente del condicionamiento del problema, y por lo tanto una residual pequea, por s mismo, vierte poca luz en la calidad de la solucin aproximada. Comentaremos ms lejos respecto a esta edicin en la seccin 2.4.5.

Ejemplo 2.8 pequea residual Considere el sistema linear

A=

0.913 0.457

X 0.254 0.659 = 1 = 0.127 = b X2 0.330

La cual vimos en el ejemplo 2.7. Considere dos soluciones aproximadas

x1 = -0.0827 0.5

x2= 0.999 -1.001

Las normas de sus residuales respectivas son ||r1||1=2.1x10-4 y ||r2||1=2.4x10-2 Cul es la solucin mejor? Nos tientan para decir el x1 debido a su residual mucho ms pequea. Pero la solucin exacta a este sistema es x = [ 1, - 1]T, como se confirma fcilmente, as que x2 es realmente mucho ms exacto que el x1 . la razn de este comportamiento que sorprende es que la matriz A es illconditioned, como vimos en el ejemplo 2.7, y debido a su nmero grande de la condicin, una residual pequea no implica un error pequeo en la solucin. Para ver cmo x1 fue obtenido, vea el ejemplo 2.17.

You might also like