You are on page 1of 30

Capítulo 3

Matrices y su Álgebra
3.1 El concepto de matriz
3.2 Operaciones con matrices
3.3 Propiedades de las operaciones con
matrices
3.4 La inversa de una matriz
3.5 Aplicación: Distribución de población

matrices 1
3.1El concepto de matriz
Como se vio en el capítulo anterior, la solución de sistemas de ecuaciones
lineales puede hallarse eficientemente utilizando solamente los coeficientes de
las incógnitas asociadas a los sistemas lineales. Este ordenamiento de números
se conoce como una matriz, y los elementos de esta matriz se llaman entradas
de la matriz. Ejemplos de matrices son:
1
 2 1    
 1 2   1
 
  3 0 ;  e 0 1 / 2 ; 2  1 0 1 ; 1
  4 5    
   0 0 0  1
 
El tamaño o dimensión de una matriz de define como el número de filas por el
número de columnas. En el ejemplo, la primera matriz es de dimensión 3x2, la
segunda es de 3x3, la tercera es de 1x4 y la cuarta es de 4x1. Si una matriz es
de dimensión 1xn, como en el tercer ejemplo, se llamará un vector fila,
mientras que una matriz nx1, como en el cuarto ejemplo, se llamará un vector
columna. En general se usarán las primeras letras mayúsculas del alfabeto
para denotar una matriz, es decir, se escribirán como A, B, C, etc.. Las
entradas de una matriz se denotarán como aij y representarán la entrada que se
encuentra en la fila i-ésima y la columna j-ésima.
matrices 2
Entonces, en general una matriz de dimensión mxn se puede representar
como
 a11 a12  a1n 
 
   a21
A  aij  

a22

 a2 n 
 
 
a am 2  amn 
 m1

Si la matriz es de dimensión nxn, se llama matriz cuadrada de orden n, y


las entradas a11, a22, ....,ann se dice que están sobre la diagonal principal de
A.
 a11 a12  a1n 
 
 a21 a22  a2 n 
    
 
a an 2  ann 
 n1

Dos matrices son iguales si tienen la misma dimensión y las entradas


correspondientes son iguales. Una matriz es cero, denotada con O, si todas
sus entradas son idénticamente igual a cero.

matrices 3
3.2 Operaciones con matrices
Definición (Suma de matrices): Sean A={aij} y B={bij} matrices de la
misma dimensión mxn. La suma A+B es la matriz C={cij} de dimensión
mxn, donde
cij = aij + bij ,
esto es, la suma de las entradas correspondientes.
Ejemplo:  1 2  4  1 0 2   0 2  2
       
 0 3  1   1  5  1  1  2  2 

Definición (Producto de una matriz por un escalar): Sea A={aij} una


matriz mxn y r un escalar. El producto rA del escalar r y la matriz A es la
matriz B={bij} de la misma dimensión de A tal que bij = r aij
Ejemplo:  1 0 2 6  2 0  4 12 
   
 2 1 0 0   4 2 0 0
2 
4 3 8 0  8 6 16 0 
   
 1 1  3 0    2  2  6 0 
 

matrices 4
Definición (Matriz transpuesta): Sea A={aij} una matriz mxn. La matriz
transpuesta, denotada como AT, es la matriz cuyas columnas son las filas
de A. Una matriz simétrica es aquella que es igual a su transpuesta, es
decir, A=AT. Evidentemente una matriz simétrica tiene que ser cuadrada.
Ejemplos:  1 4 
 1 0 2  
A     AT   0  2
 4  2 0 2 0 

 1 0 5   1 0 5 
   
A  0 6 8  A   0 6 8 
T

5 8 10  5 8 10 
 
Definición (Matriz Identidad): La matriz identidad de dimensión nxn,
denotada In , es la matriz cuyos elementos sobre la diagonal principal es
igual a 1, y todas las otras entradas son iguales a cero.
Ejemplo:
1 0 0
1 0  
I 2    I3   0 1 0 
 0 1  0 0 1
matrices
  5
Multiplicación de matrices:
Como ya se había visto en el capítulo anterior, un sistema de ecuaciones lineales,
por ejemplo 2x1 - 3x2=7
3x1 - x2=2,
tiene asociado una matriz A correspondiente a las incógnitas, y un vector b
correspondiente a los términos independientes, es decir,
 2  3 7
A    b   
 3 1  2
 x1 
Si ahora se escriben las incógnitas como un vector x   
se puede denotar el sistema de ecuaciones lineales  x2 
como Ax=b, es decir
 2  3  x1   7 
     
 3  1  x2   2 
Esta última ecuación sugiere la noción de multiplicación de una matriz A por un
vector columna x. Como noción preliminar, se introducirá el concepto de
producto escalar o producto punto de dos vectores.

matrices 6
Definición (Producto punto o escalar): Sean a un vector 1xn y b un vector
nx1, es decir,  b1 
 
 b2 
a   a1 a2  an 1 an  b  
 
 bn 1 
b 
 n 
entonces el producto punto o escalar, denotado como a.b o <a,b> se define
como
a.b  a, b  a1b1  a2b2   an 1bn 1  anbn

Ejemplo:  2 
 
  3
a  1 0  4 2  6  b 0 
 
 7 
 5 
 
a.b  a, b  (1)(2)  (0)(3)  (4)(0)  (2)(7)  (6)(5)  14
matrices 7
Definición (Multiplicación de matrices): Sean A={aik} una matriz de
dimensión mxn y B={bkj} una matriz de dimensión nxs. El producto AB es la
matriz C={cij} de dimensión mxs, donde la entrada cij de C es el producto punto
de la i-ésima fila de A y la j-ésima columna de B.

Nota: Obsérvese que el producto de dos matrices está definido solamente cuando
el número de columnas de A es igual al número de filas de B.

Ejemplo:
Fila 2 Columna 3

 2 1 0  3 8 5 4   12 20 10 4 
    
  3 5 8 .  6  4 0 4     71  84 1 16 
 0 7 8    4  5 2 1    74  68 16 36 

Posición c23
(-3)(5) + (5)(0) + (8)(2) = 1

matrices 8
En general, el elemento cij está dado por
n
cij   aik bkj ;
k 1

i  1,..., m
j  1,..., s
Por ejemplo, si A3x4 , B4x7 , C7x3 , los productos AB3x7, BC4x3 y CA7x4 están
definidos, mientras que no es posible multiplicar BA, AC y CB. Debe
observarse que el producto de matrices en general no es conmutativa, esto es,
aún cuando los productos AB y BA están definidos, no es necesariamente
cierto que AB=BA, como muestra el siguiente ejemplo

 1 2   0 1  4 9   0 1  1 2   3  4 
 .      .    
 3  4   2 5    8  17   2 5   3  4  13  16 

matrices 9
Algunas veces es deseable calcular una fila o una columna particular del
producto AB. El siguiente resultado permite obtenerlas:
* La j-ésima columna del producto AB=A[j-ésima columna de la matriz B]
* La i-ésima fila del producto AB=[i-ésima fila de la matriz A]B

Ejemplos:
4 1 4 3
1 2 4   12 27 30 13   1 
 . 0 1 3 1     1 2 4    27 
2 6 0   8 4 26 12   .  1   
2 7 5 2   2 6 0      4 
 7 
4 1 4 3
 
1 2 4 . 0 1 3 1   12 27 30 13
2 7 5 2 

 1 3 2   2   1    1  3  2   1 
             
 1 2  3 .  1    9  2 1   ( 1) 2   3  3     9 
 2 1  2  3    3  2  1   2   3
            
matrices 10
De este último ejemplo se puede concluir que la j-ésima columna del
producto AB puede verse como una combinación de las columnas de la
matriz A con los coeficientes de la j-ésima columna de la matriz B.
4 1 4 3
1 2 4   12 27 30 13 
 . 0 1 3 1    
2 6 0  8 4 26 12 
2 7 5 2  

12   1  2  4
   4   0   2 
8  2  6  0

 27   1   2  4
   1   ( 1)   7 
  4  2 6 0

 30   1  2  4
   4   3   5 
 26   2  6  0

13   1  2  4
   3   1   2 
12   2  6  0

matrices 11
3.3 Propiedades de las operaciones con matrices

Propiedades del producto punto o escalar


a) Propiedad conmutativa u.v=v.u
b) Propiedad distributiva u . (v + w) = u . v + u . w
c) Propiedad homogénea (r u) . v = u . (r v) = r (u . v)

Propiedades de las transpuestas


a) Transpuesta de la transpuesta ( AT )T = A
b) Transpuesta de la suma ( A + B )T = AT + BT
c) Transpuesta del producto ( AB )T = BT AT

matrices 12
Propiedades de la aritmética matricial

a) Conmutatividad de la suma A+B =B+A


b) Asociatividad de la suma (A + B) + C = A + (B + C)
c) Identidad para la suma A+ O = O +A=A
d) Ley distributiva izquierda r (A + B) = r A + r B
e) Ley distributiva derecha (r + s) A = r A + s A
f) Asociatividad del producto por un escalar (r.s) A = r (s A)
g) Asociatividad del producto de matrices A(BC) = (AB)C
h) Producto por matriz identidad IA=A y B I= B
i) Ley distributiva izquierda A (B + C) = AB + AC
j) Ley distributiva derecha (A + B) C = AC + BC

matrices 13
3.4 La inversa de una matriz
Recordando que un sistema de n ecuaciones lineales con n incógnitas
x1 ,x2 ,....,xn se puede expresar en la forma matricial
Ax=b
donde A es la matriz de coeficientes de nxn, x es el vector columna de nx1
 x1 
 
x 
x 2

 
x 
 n
y b es el vector columna de nx1 de valores constantes, se puede pensar que una
manera de resolver esta ecuación sería hallar una matriz C tal que CA=I, de
modo que
C(Ax)=Cb  (CA)x=Cb  Ix=Cb  x=Cb
Lo cual muestra que la solución al vector de incógnitas x debe ser el vector
columna Cb. La cuestión es saber cuándo existe una matriz C de nxn tal que
CA=I.

matrices 14
 4 9 
Por ejemplo, para la matriz A  no
 es difícil
 verificar que la matriz
 1  2
2 9
C   
satisface que  1 4 

 2 9   4 9  1 0
 
 1 4  1 
 0 1 
Se dice entonces que la matriz  2
C es una inversa
  de la matriz
 A. Esto se define
enseguida:

Definición (Inversa de una matriz): Sea A una matriz nxn. Una matriz C de nxn
es una inversa de A si CA=AC=I.
Teorema: Sea A una matriz nxn con inversa C tal que CA=AC=I. Si D es
otra matriz nxn tal que AD=I, entonces C=D.
Demostración: Como la multiplicación de matrices es asociativa, se tiene que
C(AD)=(CA)D, de donde, como AD=I y CA=I, se tiene que
C(AD)=CI=C y (CA)D=ID=D, por tanto, C=D.

matrices 15
Se denotará la inversa de una matriz A, cuando exista, como A-1. Entonces A
A-1 = A-1 A = I. Nótese que no se debe expresar A-1 como 1/A.

Definición: Una matriz cuadrada que tiene inversa se llama invertible. Una
matriz cuadrada que no tiene inversa se llama singular.

Teorema: La matriz A   a b



c d

es invertible si ad - bc 0, en cuyo caso la inversa está dada por la fórmula


 d b 
1  d  b   ad  bc 
ad  bc 
1
A   
ad  bc   c a   c a 
 
 ad  bc ad  bc 

Teorema: Sean A y B matrices invertibles nxn. Entonces:


a) AB es invertible
b) (AB)-1 = B-1 A-1

matrices 16
Definición: Si A es una matriz cuadrada, entonces se definen las potencias de
A como
A  I;
0
A  AA AA
n
 A (n  0)
 
n veces

Más aún, si A es invertible, entonces


A n  ( A1 ) n  A1A1 
 A
1

n veces

Teorema: Si A es una matriz cuadrada y r y s son enteros, entonces


Ar A s  Ar  s ( Ar ) s  Ars

Teorema: Si A es una matriz cuadrada invertible, entonces

a) A-1 es invertible y (A-1 )-1 = A.


b) An es invertible y (An )-1 = (A-1 )n para n=0,1,2,....
c) Para cualquier escalar k>0, la matriz kA es invertible y (kA)-1 = (1/k)A-1 .

matrices 17
Cálculo de las inversas:
Sea A={aij}una matriz nxn. Para hallar A-1 si es que existe, se debe encontrar
una matriz X={xij} nxn tal que AX=I, esto es, tal que
 a11 a12  a1n  x11 x12  x1n   1 0  0
    
 a21 a22  a2 n  x21 x22  x2 n   0 1  0
  
            
    
a
 n1 an 2  ann  xn1 xn 2  xnn   0 0  1 

Esto es un sistema de ecuaciones con n vectores de incógnitas, y entonces es


posible aplicar el Método de Gauss-Jordan para encontrar la inversa de A. La
idea es transformar, por medio de operaciones elementales por filas, la matriz
aumentada del sistema (A,I) a un sistema (I, A-1)
A-1 (A,I)  (A-1 A, A-1 I)  (I, A-1)

matrices 18
O sea, lo siguiente: A I
 a11 a12  a1n 1 0  0 
 
 a21 a22  a2 n 0 1  0 
        
 
a
 n1 an 2  ann 0 0  1 

Operaciones elementales por filas


(Método de Gauss-Jordan)

1 0  0 c11 c12  c1n 


 
0 1  0 c21 c22  c2 n 
       
 
0 0  1 cn1 cn 2  cnn 

I A-1
matrices 19
Solución del sistema de ecuaciones Ax=b
¿Cuando el sistema de ecuaciones con el mismo número de incógnitas que
ecuaciones
Ax=b
tiene solución única?

Evidentemente, de la discusión anterior, la solución es única cuando la


transformación de Gauss-Jordan lleva a una matriz identidad, en cuyo caso la
solución es de la forma
x=A-1b.
En el caso de la ecuación
Ax=0,
esta tiene solución única si y solo si A-1 existe. Sin embargo, en este último
caso, si la reducción de Gauss-Jordan lleva a una fila con todos los elementos
iguales a cero, entonces habrá infinitas soluciones. En el caso de que el
elemento del vector b correspondiente sea diferente de cero, entonces no
habrá solución.

matrices 20
Ejercicios:
a) Determine si el producto de dos matrices simétricas es simétrica
b) Demuestre que si una matriz A es simétrica e invertible, entonces la
inversa es simétrica.
c) Demuestre que si A y B son matrices simétricas, entonces la transpuesta de
A es simétrica y que A+B y A-B son simétricas.
d) ¿Cómo es la transpuesta de una matriz triangular superior?
e) ¿Cuando una matriz triangular (superior o inferior) es invertible?¿cómo es
la respectiva inversa?

matrices 21
Aplicación: Distribución de población
Consideremos situaciones en las que se por alguna razón se divide un
conjunto (una población) en varios subconjuntos de acuerdo a una regla dada.
Tómese por ejemplo el caso de que se divide a los ciudadanos de un país de
acuerdo con sus ingresos en pobres, ingreso medio y ricos. Otro ejemplo es la
división de los habitantes de México de acuerdo con el clima en el que viven:
caluroso, templado, frío. En general se hablará de la población (ciudadanos
de un país, habitantes de México) y de los estados (pobres, ingresos medios,
ricos; caluroso, templado, frío).
Con frecuencia las poblaciones constan de personas, pero pueden constar de
la población de automóviles, de presas-predadores, etc.
El interés aquí consiste en determinar como la distribución de población
puede cambiar de estado durante un período de tiempo (cuantos pobres se
vuelven ricos, cuántos de ingresos medios se vuelven pobres y cuántos ricos,
etc.). Las matrices pueden desempeñar un papel importante en este análisis.

matrices 22
La tendencia de una población a moverse entre n estados se puede describir
mediante una matriz nxn. Considérese una población distribuida entre n=3
estados 1,2 y 3. Se asumirá que se conoce la proporción de la población que
se encuentra en un estado j que se mueve al estado i en un determinado
periodo de tiempo. Esto se denotará como tij. La matriz formada con todos los
elementos tij se llamará una matriz de transición.
Tomemos como ejemplo la clasificación de un país en los estados:
Estado 1: Pobres
Estado 2: ingresos medios
Estado 3: Ricos
Supóngase que en un periodo de 20 años (alrededor de una generación), se
tienen los siguientes datos para la población y su descendencia:
a) De la gente pobre, el 19% pasó a ingresos medios y el 1% a ricos
b) De la gente de ingresos medios, el 15% pasó a pobre y el 10% a ricos.
c) De la gente rica, el 5% pasó a pobre, y el 30% a ingresos medios.
Entonces se pueden escribir las siguientes transiciones:

matrices 23
t11 = .8 (80% permaneció pobre);
t12 = .19 (19% de pobre a ingresos medios)
t13 = .01 (1% de pobre a ricos)
t21 = .15 (15% de ingresos medios a pobre )
t22 = .75 (75% permaneció en ingresos medios)
t23 = .10 (10% de ingresos medios a ricos)
t31 = .05 (5% de ricos a pobres)
t32 = .30 (30% de ricos a ingresos medios)
t33 = .19 (19% permaneció ricos)
por lo cual la matriz de transición está dada por
pobre medio rico
 .80 .15 .05  pobre
 
T   .19 .75 .30  medio
 .01 .10 .65 
  rico
Obsérvese que la suma de las entradas de cada columna es igual a 1, pues la
suma refleja el movimiento de toda la población durante el periodo de tiempo.

matrices 24
Supóngase que las proporciones iniciales de toda la población están dadas en el
vector x(0) de dimensión nx1, por ejemplo  x (0)  1 / 3 
 1   
x (0)   x2 (0)   1 / 3 
 x (0)  1 / 3 
 3   
indicaría que el total de la población estaría inicialmente dividida por igual entre
los estados. También la suma de las entradas de este vector x(0) debe ser igual a 1.
Ahora bien, ¿cuál es la proporción de la población que se encuentra en el estado 1
después del periodo de 20 años? Para esto, la proporción de la población del
estado 1 que permanece en el estado 1 es t11 , por lo que la contribución a la
proporción de toda la población que se encontrará en el estado 1 después de 20
años es precisamente t11 x1(0). De la misma manera la contribución de los estados
2 y 3 será t12 x2(0) y t13 x3(0) respectivamente. Así, después de 20 años, la
proporción del estado 1 es t11 x1(0) + t12 x2(0) + t13 x3(0), que es precisamente el
primer elemento del producto
 t11 t12 t13  x1 (0) 
  
Tx (0)   t 21 t 22 t 23  x2 (0) 
t t32 t33  x3 (0) 
 31
matrices 25
De manera similar se hallan las componentes de población del estado 2 y el
estado 3 después de un periodo de tiempo.
Supongamos ahora que la misma matriz de transición es válida para os
siguientes 20 años, y también para los sucesivos periodos, esto es, existe una
sucesión o cadena de periodos de 20 años para los cuales es válida la matriz
de transición. Una situación así se llama una cadena de Markov.

Definición: Una matriz de transición para una cadena de Markov de n estados


es una matriz de nxn con todos las entradas no negativas y con la propiedad
adicional de que la suma de las entradas de cada columna es igual a 1.
Las cadenas de Markov aparecen de manera natural en biología, economía,
psicología, y en muchas otras áreas. La entrada tij en una matriz de transición
T se conoce como la probabilidad de pasar del estado j al estado i en un
periodo de tiempo.
Ejemplo: Analizar la matriz 0 0 1
 
T  1 0 0
0 1 0 

matrices 26
Retomado el ejemplo anterior, si se quiere calcular el valor del estado después
de un periodo, tomando como condición inicial el vector anterior, entonces
este estado, que denotaremos como x(1), será:
 .8 .15 .05 1 / 3   1 / 3 
    
x (1)  Tx (0)   .19 .75 .3 1 / 3   1.24 / 3 
 .01 .1 .65    
 1 / 3   .76 / 3 
Asimismo, el estado x(2) después de otro periodo de 20 años será:
 .8 .15 .05  1 / 3  1.024 / 3 
    
x ( 2)  Tx (1)   .19 .75 .3 1.24 / 3   1.348 / 3 
 .01 .1 .65    
  .76 / 3   .628 / 3 

Nótese que el vector de estados x(2) = T x(1), pero dado que x(1) = T x(0),
entonces x(2) puede también escribirse como x(2) = T2 x(0), con T2 dada por
 .669 .2375 .1175 
 
T2   .2975 .621 .4295 
 .0335 .1415 .453 
 
matrices 27
Esto se puede extender a m periodos, es decir, una cadena de Markov con
matriz de transición T, tiene Tm como matriz de transición para m periodos, y el
estado después de m periodos está dado por x(m)=Tmx(0).
Definición: Una matriz de transición T es regular si para algún entero m, la
matriz Tm no tiene ninguna entrada igual a cero. Una cadena de Markov con una
matriz de transición regular se llama cadena regular.

Ejemplo: Verificar la matriz de transición del ejemplo anterior.


Es posible demostrar que si una cadena de Markov es regular, entonces después
de muchos periodos de tiempo (o cuando el tiempo tiende al infinito) , la
distribución de población entre los estados tiende a un valor fijo, o estado
estacionario.
Teorema: Sea T una matriz de transición regular. Entonces existe un única
vector columna s con entradas estrictamente positivas cuya suma es igual a 1 tal
que satisface
a) Para m suficientemente grande, todas las columna de Tm tienden al vector s
b) Ts = s
matrices 28
En conclusión, para obtener el estado estacionario es necesario resolver la
ecuación Ts = s
o lo que es lo mismo, la ecuación
(T - I) s = 0
que puede resolverse usando el Método de Gauss-Jordan, verificando que la
suma de las entradas del vector s sea igual a 1.

En resumen, para resolver este tipo de problemas, hay que efectuar el


procedimiento siguiente:

Paso 1: Escribir la matriz de transición T.


Paso 2: Verificar que la cadena de Markov es regular, esto es, T m no tiene
entradas cero para algún m.
Paso 3: Resolver la ecuación (T - I) s =0 con la restricción
s1 + s2 + ...+ sn = 1.

matrices 29
Ejemplo: Los habitantes de una comunidad con tendencias vegetarianas
acuerdan las reglas siguientes:
a) Nadie comerá carne dos días seguidos
b) Una persona que no coma carne un día, lanzará una moneda legal al aire y
comerá carne el día siguiente si y solo si, sale cruz.
Determinar la proporción de la población que no comen carne y las que sí
comen carne. No carne carne
Solución: La matriz de transición es T   0.5 1 No carne

 0.5 
 0  carne
 .75 .5 
Asimismo, T   
2
 .25  por lo que la cadena de Markov es
 .5 
regular.
  .5 1 0 
Resolviendo la matriz aumentada   se tiene que s1 = 2t; s2 = t, lo
que, junto con la restricción  .5  1 0 
s1 + s2 = 1, resulta en 2t + t = 1, de donde t=1/3 y en consecuencia, el estado
estacionario es  2 / 3
s   
 1/ 3 
matrices 30

You might also like