You are on page 1of 375

1

Note di Algebra lineare

Prof. Domenico Olanda

Anno accademico 2008-09


2

Prefazione

Questo volume raccoglie gli appunti di alcune lezioni di algebra lineare e geometria da me
svolte presso la Facoltà di Scienze dell'Università "Federico II" di Napoli.

La prima parte è dedicata allo studio degli spazi vettoriali di dimensione finita. La nozione di
determinante di una matrice quadrata e le ragioni del suo utilizzo sono gli aspetti essenziali del
secondo capitolo. Lo studio e la risoluzione dei sistemi di equazioni lineari è l’argomento
sviluppato nel terzo capitolo. Il quarto capitolo è dedicato allo studio dei prodotti scalari di uno
spazio vettoriale reale.
Il problema della triangolazione di una matrice quadrata e della diagonalizzazione di un
endomorfismo sono gli aspetti essenziali del quinto capitolo.
L’ ultimo capitolo, il sesto, è dedicato allo studio delle funzioni lineari simmetriche.

La vastissima letteratura sugli argomenti trattati non giustifica la stesura di queste note le
quali hanno solo lo scopo di aiutare gli studenti che hanno seguito le mie lezioni, nella
preparazione dell'esame. Sarà utile per lo studente integrare lo studio di questi appunti con la
lettura di qualche altro testo sugli stessi argomenti e di livello universitario.
3

CAPITOLO I

Spazi vettoriali
4

1. Gruppi abeliani.

Un'operazione (interna) ┴ in un insieme S è un'applicazione ┴: S xS ⎯


⎯→ S

di S xS in S . Denoteremo con x ┴y l'immagine di ┴ sulla coppia (x , y) e leggeremo " x


composto y " .

L'operazione è detta associativa se risulta :

∀ x,y,z ∈ S , (x ┴y ) ┴ z = x ┴ (y ┴ z).
L'operazione ┴ è detta commutativa se risulta :

∀ x,y ∈ S , x ┴y = y ┴ x.

Un elemento e di S è detto neutro rispetto all'operazione ┴ se risulta :

∀ x ∈ S, x┴e= e┴x=x

Evidentemente se esiste l'elemento neutro rispetto all'operazione ┴ esso è'unico Siano infatti e ed
e' due elementi neutri rispetto all'operazione ┴ , si ha allora e = e ┴e' = e'.

Sia (S, ┴ ) un insieme munito di un'operazione ┴ e dotata di elemento neutro e . Un elemento


x' è detto simmetrico dell'elemento x se risulta :

x ┴ x' = x' ┴ x = e

Se l'operazione ┴ è associativa il simmetrico di un elemento x se esiste , è unico . Siano infatti x'


ed x" due simmetrici dell'elemento x , si ha allora , in base alla definizione

x ┴ x' = x' ┴ x = x ┴ x" = x" ┴ x=e. e conseguentemente :

x'= x'┴ e= x'┴(x ┴ x")= (x'┴ x)┴ x" = e ┴ x" = x"

Sia S un insieme munito di un'operazione ┴ . La coppia (S, ┴) è detta un gruppo se sono


verificata le seguenti proprietà :

(i) l’ ’operazione ┴ è associativa ;

( ii ) esiste l'elemento neutro per l’operazione ┴ .

( iii ) ogni elemento di S è dotato di simmetrico .

Quando l'operazione ┴ è altresì commutativa il gruppo (S, ┴) è detto abeliano o commutativo .


5

Quando come segno per l'operazione si usa il simbolo + , si dirà che è stata adottata la
notazione additiva ed in tal caso l'elemento neutro, se esiste, si indica con 0 e viene detto zero ed
il simmetrico di un elemento x viene indicato con -x ed è detto opposto di x . Se come simbolo
.
per rappresentare l'operazione si usa il simbolo si dirà che è stata adottata la notazione
moltiplicativa ; in tal caso l'elemento neutro se esiste viene indicato con 1 e viene detto unità ed
1
il simmetrico di un elemento x viene indicato con x -1 o con e viene detto inverso di x .
x

Diamo ora alcuni esempi di gruppi .

ESEMPIO I . Sia Z = {…..-2 , -1 , 0 , 1 , 2 ….. } l’insieme degli interi relativi e +


l’usuale addizione tra interi. Lo studente verifichi che ( Z , + ) è un gruppo abeliano.

ESEMPIO II. Sia Q l'insieme dei numeri razionali e sia + l'usuale addizione tra numeri
razionali . Lo studente verifichi che la coppia (Q, +) è un gruppo abeliano.

ESEMPIO II’ . Sia Q* l'insieme dei numeri razionali non nulli e sia . l'usuale
moltiplicazione tra numeri razionali . Lo studente verifichi che (Q*, .) è un gruppo abeliano.

ESEMPIO III. Sia Rn l'insieme delle n-uple ordinate di numeri reali. Definiamo in Rn la
seguente operazione di addizione:

(xl, x2,..., xn) + (y1, y2,..., yn) = (xl + y1, x2 + y2 , ….., xn + yn)

Lo studente verifichi che ( Rn, + ) è un gruppo abeliano.

ESEMPIO IV. Una matrice A di tipo (m,n) (con m,n ∈ N ) ad elementi reali è una tabella
di mn numeri reali disposti su m righe ed n colonne.

Indicando con aij il numero che si trova nella riga di posto i e nella colonna di posto j A può così
scriversi

⎛ a 11 a 12 ........ a 1n ⎞
⎜ ⎟
⎜ a 21 a 22 ........ a 2n ⎟
A= ⎜ ⎟
...
⎜ ⎟
⎜a ⎟
⎝ m1 a m2 ........ a mn ⎠

o semplicemente con A = ( aij ) .


6

Indichiamo con M mn (R) l'insieme di tutte le matrici di tipo (m,n) con elementi reali.
Definiamo in M n,m (R) la seguente operazione di addizione :

( aij ) + ( b ij ) = ( aij + b ij )

Rispetto a tale operazione l'insieme M mn (R) è un gruppo abeliano avente come elemento neutro la
matrice 0 = ( 0 ) ad elementi tutti nulli e come opposto di ogni elemento A=(aij) la matrice
- A = (-aij)

ESEMPIO V . Sia R l’insieme dei numeri reali . Denotiamo con R [x1,x2,..,xn] l'insieme
dei polinomi di grado al più uno a coefficienti in R nelle indeterminate ( x1,.. xn ).
Se ao + aix1+...+ anxn e bo+b1x1+...+ bnxn

sono due siffatti polinomi si definisce somma dei due il seguente polinomio

ao + bo + (a1+ b1) x1 +....+ (an+ bn) xn

E' facile verificare che rispetto a tale operazione l'insieme R [x1,x2,..,xn] è un gruppo abeliano .

2. Nozione di campo.

Sia K un insieme con almeno due elementi e munito di due operazioni interne che indicheremo
.
rispettivamente con + e

.
Chiameremo somma e prodotto le due operazioni + e . Supporremo che l’operazione + abbia
elemento neutro che indicheremo con 0 ed esista un elemento diverso da 0 e che indicheremo con
1 che sia elemento neutro per l’operazione prodotto.
La terna (K, + , . ) è detta un campo se sono verificate

le seguenti proprietà :

1) (K , +) è un gruppo abeliano ;

2) il prodotto è associativo e commutativo ;

3) ogni elemento diverso da zero ha inverso ;


7

4) per ogni terna a,b,c di K si ha

a(b+c)= ab + ac

(proprietà distributiva del prodotto rispetto alla somma ).

In un campo valgono le seguenti ulteriori proprietà :

i) Per ogni a ∈ K risulta a0 = 0.

Dimostrazione. a(b+0) = ab = ab + a0 e ciò implica a0 = 0 .

ii) Il prodotto di due elementi è zero se e solo se uno dei due elementi è zero .

Si ha cioé

ab = 0 se e solo se a = 0 oppure b = 0.

Dimostrazione. Se a =0 oppure b=0 per la i) è ab = 0 . Viceversa supponiamo ab = 0 .

Se a = 0 l'asserto è provato ; se a ≠ 0 moltiplichiamo ambo i membri dell'uguaglianza ab=0 per


l'inverso a-1 di a . In tal modo si ha : a-1(ab)= a-l0 = 0 ; poiché il prodotto è associativo risulta
a-1(ab) = (a-1a)b = 1b = b = 0 e l'asserto è così provato.

Da quanto ora provato segue che se a e b sono due elementi di K diversi da zero allora il loro
prodotto ab è diverso da zero . Se poniamo K* = K -{0} allora è facile controllare che (K*, . ) è un
gruppo abeliano.

Sono esempi di campi : l'insieme dei numeri razionali ; l'insieme dci numeri reali; l'insieme
dei numeri complessi , (rispetto alle usuali operazioni di addizione e moltiplicazione).
8

3. Spazi vettoriali su un campo.

Sia (K , + , .) un campo i cui elementi saranno detti scalari e sia V un insieme i cui elementi
saranno detti vettori con due operazioni : una di addizione tra vettori

+:VxV ⎯
⎯→ V

e l'altra di moltiplicazione esterna

* :KxV ⎯
⎯→ V.

la quale fa corrispondere ad ogni coppia (α , v) scalare- vettore ancora un vettore indicato con

α* v

L’insieme V è detto uno spazio vettoriale sul campo K , rispetto alle operazioni + e * , se

sono verificate le seguenti proprietà :

(3.1) (V, +) è un gruppo abeliano ;

(3.2) α *v + α *w = α *(v + w)

(3.3) α *v + β *v = (α + β )*v

(3.4) 1*v = v (con 1 si è indicata l'unità di K)

(3.5) (α . β )*v = α *( β *v )

( per ogni coppia di scalari α , β e per ogni coppia di vettori v , w di V ).

Nel seguito per semplicità, scriveremo αβ anziché α . β ed αv anziché α*v . Indicheremo

usualmente con lettere greche gli scalari e con lettere latine i vettori. Il vettore nullo (elemento

neutro rispetto alla somma in V ) sarà indicato con 0 distinguendolo così dallo zero di K che sarà

indicato con 0.

Diamo ora alcuni esempi di spazi vettoriali :


9

ESEMPIO 1. Sia K un campo . Nell'insieme Kn (n ∈ N, n ≥ 2) delle n-ple ordinate di elementi di


K introduciamo le seguenti due operazioni di somma e prodotto:

(al,a2,...,an) + (bl,b2,...,bn) = (a1 + b1, a2 + b2,..., an + bn)

α * (al , a2,..., an) = (α al , α a2 …….α an)

E' non difficile controllare che rispetto a tali operazioni l'insieme Kn è uno spazio vettoriale su K .

Tale spazio è detto spazio vettoriale numerico di dimensione n sul campo K .

ESEMPIO 2. Nell'insieme Mm,n(K) delle matrici di tipo m,n ad elementi nel campo K

definiamo le seguenti due operazioni di addizione e prodotto esterno

( aij ) + ( b ij ) = ( aij + b ij )

α * ( aij ) = ( α aij )

Lo studente verifichi che rispetto a tali operazioni l'insieme Mm,n(K) è uno spazio vettoriale su K .

ESEMPIO 3. Denotiamo con K[x1,x2,..,xn] l'insieme dei polinomi di grado al più uno nelle
indeterminate ( x1,.. xn ) a coefficienti nel campo K. Definiamo in K[x1,x2,..,xn] le seguenti due
operazioni di addizione e prodotto esterno :

(ao + a1x1+...+ anxn) + (bo+b1x1+...+ bnxn) = ao + bo + (a1+ b1)x1 +....+ (an+ bn)xn

α*(ao + a1x1 +...+ anxn ) = α ao + α a1x1 +...+ α anxn

Si verifichi che rispetto a tali due operazioni l'insieme K[x1,x2,..,xn] è uno spazio vettoriale sul
campo K .

Analizziamo ora alcune proprietà valide in uno spazio vettoriale V su un campo K .


Ricordiamo che indicheremo con 0 il vettore nullo di V, cioè l'elemento neutro rispetto alla somma
10

definita in V, e con 0 lo zero di K .

1. Per ogni vettore v si ha 0 v = 0 .

Dimostrazione . Si scelga uno scalare α . Si ha :

(α + 0)v = α v + 0 v = α v

e questa comporta 0v = 0 .

2. Per ogni scalare α risulta α 0 = 0 .

Dimostrazione . Sia v un vettore, si ha :

α ( 0+ v)= α 0 + α v = α v

e questa comporta α 0 = 0 .

3. Per ogni scalare α e per ogni vettore v risulta :

αv=0 se e solo se è α = 0 oppure v = 0

Dimostrazione . Se α = 0 oppure è v = 0 allora per 1 e 2 è α v = 0.

Viceversa supponiamo α v =0 ed α ≠ 0. Moltiplicando ambo i membri dell’eguaglianza

1 1 1
α v =0 per si ha ( α v )= 0=0
α α α

da cui segue

1 1
( α v ) = ( α ) v = 1v = v = 0.
α α

4. Per ogni scalare α e per ogni vettore v si ha :

-(α v) = (-α)v = α(-v)

Dimostrazione. Da (α v) + (-α)v = 0v = 0 segue che è

(-α)v = -(α v). Da α v + α(-v) = α 0 = 0 segue che è α(-v) = -(α v).


11

Si osservi che dalla 4 segue che quando si moltiplica un vettore v per lo scalare -1 si
ottiene il vettore -v opposto di v .

Sia V uno spazio vettoriale sul campo K . Un sottospazio di V è un suo sottoinsieme non
vuoto H verificante le seguenti due proprietà :

( i ) v , w ∈ H => v + w ∈ H

( ii ) α ∈ K , v ∈ H => α v ∈ H

Ogni sottospazio contiene almeno il vettore nullo. Infatti poiché H è non vuoto esso possiede
almeno un vettore v. Moltiplicando v per 0 si ottiene , per la (ii) , ancora un vettore di H e quindi H
possiede il vettore nullo.

Evidentemente scegliendo H = {0} oppure H = V si realizza un sottospazio. Tali sottospazi sono


detti banali.

Come si possono costruire sottospazi non banali ? Vediamo.

Siano v1,v2, ...,vh , h vettori ed α l, α 2,…. α h, h scalari . Consideriamo il vettore w dato da

w = α l v1+ α 2 v2 +…. + α h vh

il vettore w così ottenuto si dice che è combinazione lineare dei vettori v1,v2, ...,vh o si dice
che w dipende linearmente dai vettori v1,v2, ...,vh .

Gli scalari α l, α 2,…. α h che figurano nella espressione w = α l v1+ α 2 v2 +…. + α h vh sono detti
i coefficienti della combinazione lineare .

Sia ora H l'insieme dei vettori w ciascuno dei quali sia una combinazione lineare dei vettori

v1,..., vh . Evidentemente H è un sottospazio di V ; esso è detto sottospazio generato dai vettori


v1,..., vh e viene indicato col simbolo [v1,v2, ...,vh ] .

Quando ogni vettore di V è esprimibile come combinazione lineare dei vettori vl,...,vh cioè
12

quando risulti V = [v1,..., vh] allora il sistema { v1,v2, ...,vh } è detto un sistema di generatori per
lo spazio vettoriale V e lo spazio V è detto finitamente generabile ( in quanto attraverso un numero
finito di suoi vettori si possono generare tutti gli altri ).

Noi supporremo sempre che lo spazio vettoriale V assegnato sia finitamente generabile e non

ridotto al solo vettore nullo.

A titolo di esempio si consideri lo spazio vettoriale V = R2 i cui vettori sono le coppie


ordinate di numeri reali. Si scelgano in V i seguenti sistemi di vettori :

S1 = {(1 , 0 ) , (0 , 1 )}

S2 = { (2 , 0 ) , (0 , 2 ) , ( 2 , 3 ) }

S3 = { (1 , 0 ) , (3, 1 ) }

S4 = { (1 , 0 ) , (4 , 0) }

I vettori di S1 sono un sistema di generatori in quanto ogni coppia ( a , b ) risulta una loro
combinazione lineare risultando precisamente

( a, b ) = a (1 , 0 ) + b (0 , 1 )

I vettori di S2 sono anch’ essi un sistema di generatori in quanto ogni altra coppia ( a , b )
risulta una loro combinazione lineare risultando ad esempio

a b
( a, b ) = (2 , 0 ) + (0 , 2) + 0 ( 2 , 3 )
2 2

I vettori di S3 sono anch’ essi un sistema di generatori se ogni altra coppia ( a , b ) risulta
una loro combinazione lineare cioè se sia possibile trovare due numeri α e β tali che risulti :

( a, b ) = α (1 , 0 ) + β (3 , 1 )

Questa relazione è equivalente a :


13

( a, b ) = (α + 3 β , β )

e quindi basta scegliere β = b ed α = a – 3b .

I vettori di S4 non sono un sistema di generatori in quanto le sole coppie che si possono
costruire con le coppie (1 , 0 ) , (4 , 0) sono le coppie del tipo (a , 0 ).
Si osservi che i vettori di S1 sono un sistema di generatori ma altresì risultano quelli di S2 .
Nel sistema S1 i due vettori sono entrambi essenziali perché con un solo dei due non si
potrebbe costruire l’altro. Nel sistema S2 l’ultimo vettore sembra invece svolgere un ruolo
marginale per la costruzione degli altri vettori . Come si può decidere ,in presenza di un sistema di
generatori, quali vettori siano indispensabili e quali no ?
Per rispondere a questa domanda occorre introdurre la seguente nozione dipendenza ed
indipendenza lineare di un sistema di vettori.
Siano assegnati h vettori v1,v2, ...,vh . Il vettore nullo è generato dai vettori v1,v2, ...,vh in modo
molto semplice quando si moltiplichi ognuno di essi per 0, si ha cioè :

0 = 0 v1+ 0 v2 +…. + 0 vh

Se questa è l’unica possibilità che abbiamo per costruire il vettore nullo a partire dai vettori
v1,v2, ...,vh allora tali vettori vengono detti linearmente indipendenti.

Quando i vettori non sono linearmente indipendenti essi vengono detti linearmente dipendenti.

Quindi ribadendo se i vettori v1,v2, ...,vh sono linearmente dipendenti allora esistono h scalari
α l, α 2,…. α h non tutti nulli , tali che risulti

α l v1+ α 2 v2 +…. + α h vh = 0

Le proposizioni che seguono aiutano a stabilire se alcuni vettori assegnati siano o meno
linearmente dipendenti .

Proposizione 3.1 I vettori v1,v2, ...,vh sono linearmente dipendenti se e solo se uno di
essi dipende dai rimanenti.
14

Dimostrazione. Supponiamo che i vettori v1,v2, ...,vh siano dipendenti. Esistono allora h
scalari α l, α 2,…. α h non tutti nulli , tali che risulti
(*) α l v1+ α 2 v2 +…. + α h vh = 0

supposto ad esempio che sia α l ≠ 0 dalla (*) segue :

1
v1= - (α 2v2 +…. + α hvh) = β2v2 + …. + βhvh
α1

αi
avendo posto βi = - i = 2,…, h , e quindi abbiamo mostrato che uno dei vettori , in questo
α1
caso v1 , dipende dai rimanenti. Viceversa supponiamo che uno dei vettori dipenda dai rimanenti e
per fissare le idee supponiamo sia l’ultimo di essi a dipendere dai rimanenti . Sia quindi
vh = α l v1+ α 2 v2 +…. + αh-1 vh-1 .
Da questa relazione segue

0 = α l v1 + α 2 v2 +…. + αh-1 vh-1 - vh = α l v1 + α 2 v2 +…. + αh-1 vh-1 + (-1 )vh

la quale mostra che i vettori sono linearmente dipendenti in quanto il vettore nullo è stato ottenuto
con scalari non tutti nulli figurando tra essi lo scalare -1 .
Dalla proposizione ora provata segue questa proprietà che ci sarà spesso utile nel seguito.

Proposizione 3.2 Siano v e w due vettori entrambi non nulli . I vettori v e w sono
dipendenti se e sole essi sono proporzionali.

Un’ altra conseguenza della proposizione 3.1 è la seguente

Proposizione 3.3 Se uno dei vettori v1,v2, ...,vh è il vettore nullo allora i vettori
v1,v2, ...,vh sono linearmente dipendenti. Se due dei vettori v1,v2, ...,vh sono tra loro
proporzionali allora i vettori v1,v2, ...,vh sono linearmente dipendenti.

Ovviamente la proposizione 3.1 che caratterizza i sistemi di vettori linearmente dipendenti


equivale alla proposizione che segue e che serve a caratterizzare i sistemi di vettori linearmente
indipendenti.
15

Proposizione 3.4 I vettori v1,v2, ...,vh sono linearmente indipendenti se e solo se nessuno
di essi dipende dai rimanenti.

Ritornando agli esempi precedenti possiamo allora osservare che :

1. I vettori di S1 sono indipendenti in quanto non proporzionali .


2. I vettori di S2 sono dipendenti in quanto il terzo vettore dipende dagli altri due.
3. I vettori di S3 sono indipendenti in quanto non proporzionali.
4. I vettori di S4 sono dipendenti in quanto proporzionali.

Le considerazioni che seguono giustificano l’importanza di poter stabilire se alcuni vettori


assegnati siano o meno dipendenti.
Siano assegnati h vettori e sia H = [v1,v2, ...,vh ] lo spazio da essi generato. Se i vettori
v1,v2, ...,vh sono dipendenti, uno di essi , supponiamo v1 , dipende dai rimanenti ed allora
facilmente si riconosce che lo spazio generato da v1,v2, ...,vh coincide con lo spazio W generato
dai soli vettori v2, ...,vh . Al fine di valutare da quali vettori sia costituito H sembra quindi non
essenziale la presenza del vettore v1 che può quindi essere eliminato. Se anche i vettori v2, ...,vh
fossero dipendenti allora uno di essi supponiamo sia v2 dipende dai rimanenti . Ma allora lo spazio
W generato da v2, ...,vh coincide con lo spazio T generato da v3, ...,vh e così anche v2 può
essere eliminato avendo constatato che risulta H = W = T = [v3,v4, ...,vh ] . Tale procedimento
iterato si arresterà quando non c’è più un vettore che dipende dai rimanenti e cioè quando i vettori
rimasti siano linearmente indipendenti .
Queste considerazioni mostrano che se i vettori v1,v2, ...,vh sono un sistema di generatori
per lo spazio V essi sono tutti essenziali se essi risultano indipendenti.

Un sistema di generatori indipendenti è detta una base dello spazio vettoriale.

Molto importante per ciò che segue è il seguente :

Teorema di Steinitz.
Siano assegnati due sistemi di vettori S ={ a1,a2, ...,am } e T = { b1,b2, ...,bt } . Se i
vettori di S sono linearmente indipendenti ed ognuno di essi dipende dai vettori di T allora il
numero dei vettori di S è minore o eguale al numero di vettori di T , risulta cioè m ≤ t .
Dimostrazione. Faremo la dimostrazione ragionando per induzione sulla cardinalità t di T .
16

Proviamo che il teorema è vero se t=1. Se t=1 allora T possiede un sol vettore b1 e noi dobbiamo
provare che anche S non può avere più di un vettore . Supponiamo per assurdo che S abbia almeno
due vettori a1,a2 . Poiché ogni vettore di S dipende dai vettori di T si ha
a1 = α b1 ed a2 = β b1 . Poiché i vettori di S sono indipendenti a1 non può essere il
vettore nullo e quindi è α ≠ 0 . Risulta allora
1 β
b1 = a1 e quindi è a2 = a1 . S ha quindi due vettori proporzionali e ciò è assurdo perché i
α α
suoi vettori sono linearmente indipendenti. Supponiamo quindi t > 1 e vero il teorema per t -1.
Poichè ogni vettore di S dipende dai vettori di T sussistono le seguenti relazioni :

a1 = α l b1+ α 2 b2 +…. + α t bt
a2 = β l b1+ β 2 b2 +…. + β t bt
…………..

am = γ l b1+ γ 2 b2 +…. + γ t bt

Poiché i vettori di S sono indipendenti a1 non può essere il vettore nullo e quindi almeno uno
degli scalari α l, α 2,…. α t è non nullo e supponiamo sia α l ≠ 0 . Dalla prima relazione si può
allora ricavare b1 come combinazione di a1 , b2, …,bt si ha cioè per b1 una espressione del tipo
b1 = δ l a1+ δ 2 b2 +…. + δ t bt
Sostituiamo ora tale espressione di b1 nelle relazioni

a2 = β l b1+ β 2 b2 +…. + β t bt
…………..

am = γ l b1+ γ 2 b2 +…. + γ t bt

rimaste e troviamo allora che valgono relazioni di questo tipo

a2 - k la1 = ζ2b2 +…. + ζ t bt


…………..

am - kma1= η 2 b2 +…. + η t bt
17

I vettori w2 = a2 - k la1 ,….. , wm = am - kma1 , in numero di m-1 sono indipendenti , in


quanto se uno di essi dipendesse dai rimanenti anche in S ci sarebbe un vettore che dipende dai
rimanenti, ed inoltre ognuno di essi dipende dai vettori b2,… , bt che sono in numero di t-1.
Poiché per t-1 il teorema è vero si ha m-1 ≤ t-1 e quindi è, come si voleva, m ≤ t.

Una prima importante conseguenza del teorema ora provato è la seguente

Proposizione 3.5 Sia V uno spazio vettoriale e sia B = { e1 , e2,…., en } una sua base di
cardinalità n . Ogni altra base di V ha cardinalità n.
Dimostrazione. Sia B’ = { b1 , b2,…., bt } un’ altra base di V .Applicando due volte il
teorema di Steinitz si ha n ≤ t e t ≤ n e quindi t = n .

Abbiamo così provato che le basi di uno spazio vettoriale finitamente generabile hanno tutte
la stessa cardinalità. Detta n la cardinalità comune a tutte le basi l’intero n è detto la
dimensione di V.
Al fine di fornire ulteriori interpetrazioni dell’intero n , dimensione di V , è molto utile la
seguente :
Proposizione 3.6 Se i vettori v1,v2, ...,vh, w sono dipendenti mentre i vettori
v1,v2, ...,vh sono indipendenti allora il vettore w dipende dai vettori v1,v2, ...,vh .
Dimostrazione. Per ipotesi poiché i vettori v1,v2, ...,vh, w sono dipendenti
esistono scalari (α , α l, α 2,…. α h ) non tutti nulli per cui risulti :

(*) α w + α l v1+ α 2 v2 +…. + α h vh = 0

Se fosse α = 0 avremmo da (*)


0w + α l v1+ α 2 v2 +…. + α h vh = 0 + α l v1+ α 2 v2 +…. + α h vh =

= α l v1+ α 2 v2 +…. + α h vh = 0

e questa per la supposta indipendenza dei vettori v1,v2, ...,vh comporterebbe altresì
α l=0 , α 2=0 , ..., α h =0 e quindi gli scalari (α , α l, α 2,…. α h ) sarebbero tutti nulli contro il
supposto. Pertanto risulta α ≠ 0 e quindi da (*) segue :
1
w=- (α l v1+ α 2 v2 +…. + α h vh ) = β l v1+ β 2 v2 +…. + β h vh
α
18

αi
avendo posto βi = - i= 1,2,.., h.
α

Possiamo ora provare la seguente

Proposizione 3.7 L’intero n è dimensione dello spazio vettoriale V se e solo se esso


esprime il massimo numero di vettori indipendenti che V possiede.
Dimostrazione. Supponiamo che lo spazio V abbia dimensione n e sia B={ e1 , e2,…., en }
una sua base. Se v1,v2, ...,vh sono h vettori indipendenti qualsiasi di V , poiché ognuno di essi
dipende dai vettori di B, in forza del teorema di Steinitz, risulta h ≤ n . Pertanto n è il massimo
numero di vettori indipendenti di V.
Viceversa supponiamo che V possegga n vettori indipendenti v1,v2, ...,vn e che tale numero
sia il massimo numero di vettori indipendenti che V possiede. Se w è un qualunque vettore diverso
dai vettori v1,v2, ..., vn allora il sistema v1,v2, ..., vn, w , ottenuto aggiungendo w ai vettori
v1,v2, ...,vn , avendo cardinalità n+1 è costituito da vettori linearmente dipendenti. Per la
proposizione 3.6, w è quindi combinazione lineare dei vettori v1,v2, ...,vn . Poiché anche i singoli
vettori vi dipendono da v1,v2, ...,vn allora v1,v2, ...,vn è un sistema di generatori per V e quindi
essendo tali vettori anche indipendenti essi costituiscono una sua base e pertanto V ha dimensione
n.

La proposizione 3.6 suggerisce un metodo per costruire insiemi di vettori indipendenti ed


una base di V . Vediamo come .
Si consideri un vettore v1 non nullo . Per la proprietà 3. di pag 9 il vettore v1 è
indipendente. Sia H1 = [v1 ] lo spazio generato da v1.
Se H1 = V allora {v1 } è una base di V . Se H1 ⊂ V allora sia v2 un vettore scelto in
V- H1 . I vettori {v1 , v2} per la proposizione 3.6 sono indipendenti. Sia H2 = [v1 , v2] lo spazio
generato dai vettori {v1 , v2}. Se H2 = V allora {v1 , v2} è una base di V. Se invece è H2 ⊂ V
possiamo scegliere un ulteriore vettore v3 in V - H2 che aggiunto ai vettori {v1 , v2} darà luogo
ad un sistema di tre vettori {v1 , v2, v3} indipendenti. Se lo spazio ha dimensione n tale
procedimento sarà iterato n volte e ci consentirà di costruire una base di V.
Abbiamo quindi provato la seguente
Proposizione 3.8 Sia V uno spazio vettoriale di dimensione n e siano e1 , e2 ,.., et ,
t , ( t < n ) , vettori indipendenti di V . Si possono allora aggiungere altri n-t vettori opportuni
et+1 , e t+2 ,.., en in modo che e1 , e2 ,.., et et+1 , e t+2 ,.., en sia una base di V .
19

Al fine di fornire alcune caratterizzazioni delle basi di uno spazio vettoriale ci è utile
richiamare alcune semplici definizioni . Sia X un sottoinsieme di un insieme S, ed X sia munito di
una certa proprietà “p” . Si dice che X è massimale rispetto alla proprietà “p” se ogni insieme Y
che contenga propriamente X non ha più la proprietà “p” . Si dice che X è minimale rispetto alla
proprietà “p” se ogni sua parte propria non ha più la proprietà “p” .
Siamo ora in grado di provare alcune importanti equivalenze:

Proposizione 3.9 Per un sistema S = {v1 , v2,…, vn} di vettori di uno spazio vettoriale V
sono equivalenti le seguenti affermazioni :

a) S è una base (cioè un sistema di generatori indipendenti )


b) S è massimale rispetto alla proprietà di essere indipendente
c) S è minimale rispetto alla proprietà di essere un sistema di generatori .
d) S è un sistema indipendente di cardinalità massima.
e) S è un sistema di generatori di cardinalità minima.

Dimostrazione. Proviamo che a) e b) sono equivalenti.


Mostriamo che a) implica b). Se aggiungiamo ad S un ulteriore vettore w il sistema
{v1 , v2,… , vn, w} è costituito da vettori dipendenti in quanto ,avendo supposto che {v1 , v2,…, vn}
sono un sistema di generatori , w è combinazione lineare di {v1 , v2,…, vn} . Pertanto l’insieme S
rispetto alla proprietà di essere costituito da vettori indipendenti è massimale. Viceversa
supponiamo di sapere che l’insieme S sia costituito da vettori indipendenti e sia massimale rispetto
a tale proprietà. Se aggiungiamo ad S un ulteriore vettore w il sistema {v1 , v2,… , vn, w} è
costituito da vettori dipendenti per la supposta massimalità di S rispetto alla proprietà di essere
costituito da vettori indipendenti. Per la proposizione 3.5, w è allora combinazione lineare dei
vettori di S . Per l’arbitrarietà di w e tenendo conto che ogni vettore vi dipende da v1 , v2,… , vn
è provato che S è un sistema di generatori.
Proviamo che a) è equivalente a c). Proviamo che a) implica c). Se si priva S= {v1 , v2,…, vn} di un
suo vettore ad esempio di v1 , i vettori{v2,…, vn} che restano non sono più un sistema di generatori
in quanto essendo {v1 , v2,…, vn} indipendenti nessuno dei suoi vettori può essere generato dai
rimanenti. Pertanto S è minimale rispetto alla proprietà di essere un sistema di generatori. Viceversa
se sappiamo che i vettori di S sono un sistema di generatori ma minimale rispetto a tale proprietà
allora i suoi vettori sono indipendenti . Infatti se fossero dipendenti uno di essi e, per fissare le idee,
20

sia il primo , dipende dai rimanenti. Ma allora come già visto in precedenza risulta [v2,…, vn] =
= [v1 , v2,…, vn] = V. Quindi anche T ={ v2,…, vn} è un sistema di generatori pur essendo una parte
propria di S il che va contro la supposta minimalità di S rispetto alla proprietà di essere un sistema
di generatori.
L’equivalenza tra a) e d) è stata già acquisita con la proposizione 3.7.
Proviamo infine l’equivalenza tra a) ed e). Proviamo che a) implica e). Se trovassimo t vettori
w1 , w2,…, wt che generano V per il teorema di Steinitz risulta n ≤ t . Quindi ogni altro sistema di
generatori ha cardinalità almeno n . L’intero n esprime quindi la minima cardinalità di un sistema di
generatori e quindi l’insieme S come sistema di generatori ha cardinalità minima. Viceversa se
sappiamo che S è un sistema di generatori e che come tale ha cardinalità minima allora i vettori
v1 , v2,…, vn che lo costituiscono sono indipendenti. Infatti se fossero dipendenti uno di essi e, per
fissare le idee, sia il primo , dipende dai rimanenti. Ma allora come già visto in precedenza risulta
[v2,…, vn]=[v1 , v2,…, vn]= V.Quindi anche T ={ v2,…, vn} è un sistema di generatori pur essendo
di cardinalità n-1 mentre avevamo supposto che n fosse la cardinalità minima di un sistema di
generatori.

Dalle proposizioni provate segue che se uno spazio vettoriale V finitamente generabile ha
dimensione n , l’ intero n può anche essere definito come il numero massimo di vettori
indipendenti che V possiede o come il numero minimo di generatori di V .

Possiamo ora valutare la dimensione dello spazio vettoriale numerico illustrato nell’esempio I .

ESEMPIO I. (Kn , + , . K) . In tale spazio i vettori (1, 0,.. , 0), (0, 1 ,0.. 0), …..,( 0, 0,.., 1)
sono un sistema di generatori in quanto risulta :

a1 (1,0,..0) + a2 (0,1,.. 0) + ... + an (0,0,...1) = ( a1 , a2, ... , an )

In particolare si ha che solo

0 (1,0,..0) + 0 (0,1,.. 0) + ... + 0 (0,0,...1) = (0 , 0, ... 0)

il che prova che essi sono anche indipendenti. I vettori (1, 0,.. , 0), (0, 1 ,0.. 0), …..,( 0, 0,.., 1)

sono quindi una base , detta base canonica , di Kn che ha quindi dimensione n .

Aver stabilito che la dimensione di Kn sia n ci consentirà di saper valutare

semplicemente anche la dimensione degli altri spazi vettoriali mostrati negli altri esempi II e III.
21

Per giustificare la nostra affermazione saranno molto utili le considerazioni che seguono.

Concludiamo tale numero illustrando un esempio di spazio vettoriale sul campo reale di

dimensione tre che sarà molto utilizzato nel capitolo dedicato alla geometria analitica.

ESEMPIO IV . Si consideri un punto A dello spazio reale S e sia VA l’insieme di tutti i


segmenti orientati AP di primo estremo A, al variare di P in S . Indicheremo con |AP | la
lunghezza del segmento AP . Quando P = A il segmento corrispondente AA ha lunghezza zero,
sarà chiamato segmento nullo, e sarà indicato con 0 .
Se v = AP e w = AP’ sono due elementi non nulli di VA si definisce somma di v e w il
segmento v + w = AT ottenuto col seguente procedimento

i ) se AP ed AP’ hanno direzione diversa , AT è la diagonale del parallelogramma di lati AP


ed AP’

ii ) se AP ed AP’ hanno la stessa direzione δ e lo stesso verso ν allora AT è il segmento che ha la


direzione δ e verso ν e lunghezza | AT | = |AP | + |AP’|.

iii) se AP ed AP’ hanno la stessa direzione δ ma verso opposto allora AT è il segmento nullo se
|AP|= |AP’|. Se invece è |AP| ≠ |AP’| ( supposto |AP| > |AP’| ) allora AT ha la direzione δ
il verso di AP e lunghezza | AT | = |AP | - |AP’|.

Se v = AP e w = 0 assumeremo v + 0 = v

Se v = AP ed α è un numero reale . Si definisce α v = AT il segmento così ottenuto .

Il segmento AT è nullo se α = 0 oppure se v = 0 .

Supposto v = AP non nullo ed α ≠ 0 , allora detta δ la direzione di AP e ν il verso di AP , il


segmento AT ha :

direzione δ , lunghezza | AT | = | α ||AP | , verso ν se α > 0 e verso opposto se è α < 0.

Si prova che l’insieme VA con le due operazioni ora definite è uno spazio vettoriale . I segmenti
AP saranno in seguito chiamati vettori geometrici applicati in A .
22

Lo spazio vettoriale VA ha dimensione tre come ora proveremo.

Siano e1 = A U1 , e2 = AU2 ed e3 = AU3 tre segmenti non nulli e non complanari .


Tali vettori sono tali che nessuno di essi può essere generato dagli altri due e sono quindi
indipendenti . Inoltre, riferendoci ai vettori indicati in figura ,

v’’

P
v
e3

A e2 b
e1
v’
a

Si ha

AP = v = v’ + v” = a + b + v”

Ma è , per opportuni scalari α , β , γ

a = α e1 , b = β e2 , v” = γ e3

e quindi è

v = a + b + v”= α e1 +β e2 +γ e3

I tre vettori e1, e2 , e3 sono quindi una base di VA che ha così dimensione tre .
23

4. Isomorfismi tra spazi vettoriali.


Siano assegnati due spazi vettoriali V e W costruiti sullo stesso campo K .
Una funzione f : V ⎯
⎯→ W tra V e W è detta un isomorfismo se essa è biettiva e
lineare cioè se valgono per essa le seguenti proprietà :

1. f è biettiva.
2. f ( v + v’ ) = f( v ) + f( v’ )
3. f ( αv ) = α f( v )

(per ogni coppia di vettori v , v’ e per ogni scalare α )

Se una funzione f di V in W verifica solo le proprietà 2. e 3. ma non è biettiva si dice che essa è una
funzione lineare di V in W.
Gli isomorfismi sono quindi particolari funzioni lineari perché sono quelle biettive .Quando
esiste un isomorfismo tra i due spazi vettoriali tali spazi vengono detti tra loro isomorfi.

Si prova facilmente che se f è un isomorfismo tale risulta anche la funzione f-1 e che
componendo due isomorfismi si ottiene ancora un isomorfismo.

Lo studente verifichi che se si associa ad un polinomio ao + a1x1+...+ anxn


la (n+1)-pla (ao , a1,….. an) dei suoi coefficienti si realizza un isomorfismo tra gli spazi vettoriali
K[x1,...,xn] e Kn+1.

Se si associa ad una matrice


⎛ a 11 a 12 ........ a 1n ⎞
⎜ ⎟
⎜ a 21 a 22 ........ a 2n ⎟
⎜ ... ⎟
⎜ ⎟
⎜a ⎟
⎝ m1 a m2 ........ a mn ⎠

il vettore numerico

( a11 a12…. a1n , a21 a22…. a2n , ……………., am1 am2…. amn )

di Kmn che si ottiene disponendo in sequenza ed in orizzontale una dopo l’altra le righe della
24

matrice si realizza un isomorfismo tra gli spazi vettoriali Mm,n(K) e Kmn .

Vediamo ora se per ogni spazio vettoriale possiamo trovarne un altro “ magari più semplice”
ad esso isomorfo. Vediamo.
Sia quindi V uno spazio vettoriale sul campo K di dimensione n e sia B = ( e1 , e2,…., en )
una sua base ordinata ( riferimento ). Poiché i vettori e1 , e2,…., en sono un sistema di generatori
per V ogni vettore v risulta una loro combinazione lineare si ha cioè

v = x1e1 +...+ xnen

I numeri (x1,…..,xn) che consentono di esprimere v come combinazione di ( e1 , e2,…., en ) sono


dette le coordinate di v nella base fissata.
Mostriamo ora che le coordinate di v sono univocamente determinate da v e che quindi v si può
scrivere in unico modo come combinazione lineare dei vettori e1 , e2,…., en . Supponiamo quindi
che v sia stato ottenuto anche attraverso gli scalari (y1,…..,yn) si abbia cioè

v = y1e1 +...+ yn en

Da
v = x1e1 +...+ xn en = y1 e1 +...+ yn en

segue
( x1 - y1 ) e1 + ( x2 – y2 ) e2 +…..+ ( xn – yn ) en = 0

e questa comporta , per l’indipendenza di e1 , e2,…., en ,

( x1 - y1 ) = ( x2 – y2 ) =…..= ( xn – yn ) =0

e cioè
x1 = y1 , x2 = y2,……, xn = yn

Pertanto gli unici scalari che danno luogo a v sono i numeri ( x1 , x2,…., xn ) .

Quanto provato ci consente quindi di costruire una funzione tra V e Kn associando ad ogni
25

vettore v di V la n-pla ( x1 , x2,…., xn ) delle sue coordinate

f:v∈ V ⎯
⎯→ ( x1 , x2,…., xn ) ∈ Kn

Tale funzione , come è facile verificare, è biettiva e lineare e quindi è un isomorfismo tra V e Kn ,
detto coordinazione di V nel riferimento fissato.
Abbiamo così provato la seguente importante

Proposizione 4.1 Ogni spazio vettoriale V sul campo K di dimensione finita n è isomorfo allo
spazio vettoriale numerico Kn.

Vediamo ora quali sono i vantaggi di aver acquisito un siffatto risultato.


Tali vantaggi appariranno chiari quando si siano provate alcune proprietà degli isomorfismi
che ora andiamo ad illustrare nelle proposizioni che seguono. Da qui in avanti

f : Vn ⎯
⎯→ Wm

è una applicazione lineare tra gli spazi vettoriali Vn e Wm costruiti sullo stesso campo K e
dimensione finita n ed m rispettivamente.

Una proprietà notevole delle applicazioni lineari è espressa dal seguente

Teorema fondamentale. Un applicazione lineare f : Vn ⎯


⎯→ Wm
è determinata quando si conoscono i valori che essa assume sui vettori di una base ordinata
(e1, e2,….,en ) di Vn .
Dimostrazione. Sia quindi (e1, e2,….,en ) una base ordinata di Vn e supponiamo di
conoscere i vettori immagine f(e1) , f ( e2) , …,f (en) Questa conoscenza ci permetterà di calcolare f
su un qualunque vettore v di Vn . Infatti sia v un qualunque vettore di Vn .
Poiché (e1, e2,….,en ) è una base esistono n scalari (α 1, α 2,…., α n ) per cui si abbia

v= α l e1+ α 2 e2 +…. + α n en

Applicando f a tale relazione, tenendo conto della sua linearità, si ha :


26

f(v)= α l f (e1)+ α 2 f ( e2) +…. + α n f (en)

la quale prova l’asserto.

Proposizione 4.2 Una applicazione lineare f tra V e W trasforma il vettore nullo di V nel
vettore nullo di W. Ne segue che se f è iniettiva in particolare se f è un isomorfismo esso trasforma
altresì un vettore non nullo di V in un vettore non nullo di W.
Dimostrazione. Sia v un vettore qualunque di V , per la linearità di f risulta
f(v) = f(v + 0)= f(v) + f(0)
da cui segue ovviamente f(0) = 0.
Se f è iniettiva ed è v ≠ 0 allora f(v) ≠ f(0) = 0

Proposizione 4.3 Una applicazione lineare f tra V e W trasforma vettori dipendenti di V in


vettori dipendenti di W. Inoltre se f è iniettiva essa trasforma altresì vettori indipendenti di V in
vettori indipendenti di W. Un isomorfismo conserva pertanto con la sua inversa la dipendenza e
l’indipendenza lineare in quanto trasforma vettori dipendenti di V in vettori dipendenti di W e
trasforma vettori indipendenti di V in vettori indipendenti di W.
Dimostrazione. Siano v1,v2, ...,vh , h vettori dipendenti di V. Poiché i vettori v1,v2, ...,vh,
sono dipendenti esistono scalari (α l, α 2,…. α h ) non tutti nulli per cui risulti :

α l v1+ α 2 v2 +…. + α h vh = 0

Applicando f ad ambo i membri, tenendo conto della linearità e della proposizione 4.2 si ha

α l f(v1)+ α 2 f(v2) +…. + α h f(vh ) = f( 0 ) = 0

la quale mostra che anche i vettori trasformati f(v1) , f(v2) ,…, f(vh ) sono dipendenti. Supponiamo
f iniettiva e siano v1,v2, ...,vh , h vettori indipendenti di V. Dobbiamo provare che anche i vettori
f(v1) , f(v2) ,…, f(vh ) sono indipendenti. Supponiamo quindi che (α l, α 2,…. α h ) siano scalari con
i quali si abbia

α l f(v1)+ α 2 f(v2) +…. + α h f(vh ) = 0

e vediamo se tali scalari sono tutti nulli.


27

Tale relazione per la linearità di f equivale a

f( α l v1+ α 2 v2 +…. + α h vh ) = 0

Poiché f è iniettiva l’unico vettore che si trasforma nel vettore nullo di W è il vettore nullo di V e
così è :

α l v1+ α 2 v2 +…. + α h vh = 0

Per la supposta indipendenza dei vettori v1,v2, ...,vh si ha allora α l=α 2=.α h =0 e ciò prova
che i vettori f(v1) , f(v2) ,…, f(vh ) sono indipendenti.

Sia
f:V ⎯
⎯→ W

una applicazione lineare tra gli spazi vettoriali V e W .


Possiamo considerare i sottoinsiemi di V e W seguenti:

N ={ v ∈ V , f(v)= 0 }

T = f(V) = { f(v) , v ∈ V }

Evidentemente N è non vuoto perché di esso fa parte il vettore nullo ed è un sottospazio di


V , detto il nucleo dell’applicazione f mentre T è un sottospazio di W ed è detto lo spazio
immagine di f .

Tali sottospazi, nucleo ed immagine, possono essere usati per valutare l’iniettività e
suriettività della funzione f.
Infatti la funzione f è suriettiva se solo se risulta T = W.
Inoltre
Proposizione 4.4 La funzione f è iniettiva se e solo se il suo nucleo è ridotto al vettore
nullo.
Dimostrazione. Se f è iniettiva abbiamo già osservato che l’unico vettore che si trasforma
28

nel vettore nullo è il vettore nullo e quindi è N={ 0 }. Viceversa supponiamo che sia N={ 0 }. Se
per due vettori v e v’ risulta f(v) = f(v’) si ha per la linearità di f , f( v-v’) = 0 e così v-v’ ∈ N.
Ma per ipotesi è N={ 0 } e quindi v - v’ = 0 e cioè è v = v’. Pertanto f è iniettiva .

Utile per ciò che segue è la seguente proposizione:

Proposizione 4.5. Sia f : V ⎯


⎯→ W una funzione lineare tra gli spazi vettoriali V e W. Se
e1 , e2,…., en sono generatori di V i vettori f(e1) , f(e2) ,…, f(en ) sono un sistema di generatori
per lo spazio immagine T = f(V). In particolare se f è un isomorfismo ed ( e1 , e2,…., en ) è una
base di V allora ( f(e1) , f(e2) ,…, f(en ) ) è una base di W.
Dimostrazione. Sia w un qualunque vettore di T= f(V) . Esiste allora un vettore v in V per
cui sia w = f(v). Poiché i vettori e1 , e2,…., en generano V si ha per opportuni scalari α l, α 2,…. α n

v = α l e1 + α 2 e2 +….+ α n en
Si ha allora

w = f(v) = f (α l e1 + α 2 e2 +….+ α n en )= α l f(e1 ) + α 2 f( e2 ) +….+ α n f( en )

la quale mostra che i vettori f(e1) , f(e2) ,…, f(en ) sono un sistema di generatori per lo spazio T. La
parte finale della proposizione è ovvia ricordando che un isomorfismo trasforma vettori
indipendenti in vettori indipendenti.

I sottospazi N e T nucleo ed immagine si “condizionano” a vicenda come mostra la


seguente

Proposizione 4.6. Sia f : V ⎯


⎯→ W una funzione lineare tra gli spazi vettoriali V e W.
Siano N e T gli spazi nucleo ed immagine di f. Detta n la dimensione di V ,risulta

(*) dimN + dimT = n

Dimostrazione. La proprietà (*) è ovvia se la funzione è iniettiva cioè se è N = { 0 }ed è


altrettanto vera se è N = V. Supponiamo quindi N non banale e sia h = dimN . Scelti h vettori
e1 , e2,…., eh indipendenti in N cioè una sua base aggiungiamo ad essi altri n-h vettori di V,
vh+1,vh+2, ...,vn in modo che i vettori e1 , e2,…., eh vh+1,vh+2, ...,vn siano una base di V.
29

Se ora mostriamo che i vettori f( vh+1), f(vh+2), ..., f(vn) sono una base per T si ha dimT= n-h
e quindi la (*).Cominciamo a provare che sono indipendenti.Siano α h+1 ,α h+2 , …. , α n scalari per i
quali risulti
α h+1 f( vh+1)+ α h+2 f(vh+2)+ …. + α n f(vn) = 0

Per la linearità di f la relazione scritta equivale a

f( α h+1 vh+1 + α h+2 vh+2 + …. + α n vn) = 0

la quale mostra che il vettore

α h+1 vh+1+ α h+2 vh+2 + …. + α n vn

appartiene al nucleo. Si ha quindi , per opportuni scalari α l, α 2,…. α h

α h+1 vh+1+ α h+2 vh+2 + …. + α n vn = α l e1 + α 2 e2,….+α h eh

Da questa relazione segue

α h+1 vh+1+ α h+2 vh+2 + …. + α n vn - α l e1 -α 2 e2,….-α h eh = 0

e quindi per l’indipendenza dei vettori e1 , e2,…., eh vh+1,vh+2, ...,vn si ha come si voleva
α h+1 = α h+2 = …. = α n = 0. Proviamo infine che sono un sistema di generatori per T. Sia w un
qualunque vettore di T= f(V) . Esiste allora un vettore v in V per cui sia w = f(v). Poiché i vettori
e1 , e2,…., eh vh+1,vh+2, ...,vn sono una base di V si ha per opportuni scalari α l, α 2,…. α n

v = α l e1 + α 2 e2 +….+ α h eh + α h+1 vh+1+ α h+2 vh+2 + …. + α n vn

da cui segue, tenendo conto della linearità di f e del fatto che i vettori e1 , e2,…., eh sono nel nucleo

w = f(v)= f(α l e1 + α 2 e2 +….+ α h eh + α h+1 vh+1+ α h+2 vh+2 + …. + α n vn)=


= α h+1 f(vh+1)+ α h+2 f( vh+2) + …. + α n f( vn)

la quale mostra che i vettori f(vh+1), f( vh+2) , …. ,f( vn) sono un sistema di generatori per lo spazio T.
30

Possiamo concludere tale numero provando la seguente importante

Proposizione 4.7 Due spazi vettoriali V e W costruiti sullo stesso campo e di dimensione
finita sono isomorfi se e solo se essi hanno la stessa dimensione.
Dimostrazione. Se c’è un isomorfismo f : V ⎯
⎯→ W tra V e W abbiamo già visto che se
e1 , e2,…., en è una base di V allora f(e1), f(e2) , …. ,f(en) è una base di W e quindi V e W
hanno la stessa dimensione n. Viceversa supponiamo che V e W abbiano entrambi la stessa
dimensione n . Se (e1 , e2,…., en ) è una base ordinata di V come già visto, associando ad ogni
vettore v = x1 e1+...+ xn en di V la n-pla ( x1 , x2,…., xn ) delle sue coordinate

f:v∈V ⎯
⎯→ ( x1 , x2,…., xn ) ∈ Kn

si realizza un isomorfismo tra V e Kn . Analogamente se (w1 , w2,…., wn ) è una base ordinata di


W , associando ad ogni vettore w = y1 w1+...+ yn wn di W la n-pla ( y1 , y2,…., yn ) delle sue
coordinate

g:w∈ W ⎯
⎯→ ( y1 , y2,…., yn ) ∈ Kn

si realizza un isomorfismo tra W e Kn . L’ applicazione

g-1 ° f : V ⎯
⎯→ W

essendo una funzione composta da isomorfismi è allora un isomorfismo tra V e W.

Come conseguenza di questo teorema possiamo allora valutare la dimensione degli spazi
vettoriali illustrati negli esempi II e III del n.3. Avendo già osservato che K[x1,x2,..,xn] è isomorfo a
Kn+1 e che Mm,n (R) è isomorfo a Kmn si ha per quanto ora provato che

dim K[x1,x2,..,xn]= n+1 e dimMm,n (R) = mn.

Concludiamo tale numero con una proposizione di cui faremo un grande uso nelle
applicazioni successive.
31

Proposizione 4.8 Sia f : V ⎯


⎯→ W un isomorfismo tra gli spazi vettoriali V e W.
Un vettore v di V è combinazione lineare dei vettori v1 , v2,…., vh se e solo se il vettore f(v) è
combinazione lineare dei vettori trasformati f(v1) , f(v2) …. ,f(vh) .
Dimostrazione. Supponiamo che v sia combinazione lineare dei vettori v1 , v2,…., vh si
abbia cioè v= α l v1 + α 2 v2 +….+ α h vh Applicando f e tenendo conto della sua linearità si ha che
è f(v)= α l f(v1 )+ α 2 f(v2 )+….+ α h f(vh).
Viceversa supponiamo che il vettore f(v) sia combinazione lineare dei vettori f(v1) , f(v2)
…. ,f(vh) si abbia cioè
f(v) = α l f(v1 )+ α 2 f(v2 )+….+ α h f(vh).
Tale relazione per la linearità di f equivale a
f(v) = f( α lv1 + α 2 v2 +…+ α h vh )
e questa per la iniettività di f comporta
v = α l v1 + α 2 v2 +….+ α h vh .

5. I sottospazi di uno spazio vettoriale.

In questo numero V è uno spazio vettoriale di dimensione finita n costruito su un campo K.

Sia H la famiglia di tutti i suoi sottospazi . La famiglia H ha le seguenti proprietà , di facile

dimostrazione.

1. per ogni H , T ∈ H,
H ⊆ T ⇒ dim H ≤ dimT
H⊂ T ⇒ dim H < dimT

2. l’intersezione di una famiglia di sottospazi è un sottospazio.

In generale l’unione di sottospazi non è un sottospazio. Mostriamo ciò con un esempio.


Nello spazio vettoriale V = R2 delle coppie ordinate di numeri reali si considerino i due
seguenti sottoinsiemi H e T .
H = {(a , 0 ) , a ∈ R }
T = {(0 , b) , b ∈ R}
32

Facilmente si riconosce che H e T sono sottospazi mentre il sottoinsieme X = H ∪ T non


è un sottospazio risultando ad esempio
(2, 0) ∈ X , (0, 5) ∈ X mentre (2,0) + (0,5) = (2 , 5) ∉ X.

La proprietà 2 consente la seguente definizione. Sia X un sottoinsieme di V. Si chiama


sottospazio generato da X il sottospazio [X] che si ottenga intersecando tra loro tutti i sottospazi
che contengono X.Tale sottospazio è ovviamente il più piccolo sottospazio (rispetto all’inclusione )
che contiene X.
Ha interesse considerare lo spazio X quando X sia l’unione di due sottospazi H e T .
Mostreremo ora che tale sottospazio [H ∪ T ] che si ottiene intersecando tra loro tutti i sottospazi
che contengono H e T coincide col seguente sottoinsieme di V
L = { a + b , a ∈ H , b ∈ T}
il quale contiene tutti i vettori che si ottengono sommando tra loro un vettore di H ed un vettore di
T. Evidentemente L è un sottospazio di V.
Quando si scelga b = 0 e si faccia variare a in H si riconosce che tra i vettori di L ci sono in
particolare tutti quelli di H. Analogamente quando si scelga a = 0 e si faccia variare b in T si
riconosce che tra i vettori di L ci sono in particolare tutti quelli di T. Pertanto L contiene sia H che
T. Inoltre se un sottospazio J contiene H e T allora contiene anche tutti i vettori a + b con
a ∈ H e b ∈ T e quindi contiene L. L è pertanto il più piccolo sottospazio che contiene H e T e
quindi coincide con lo spazio [H ∪ T ] da essi generato.Lo spazio [H ∪ T ] viene anche
indicato col simbolo H ∪ T o H + T.
La proprietà ora provata per i sottospazi H e T può essere estesa facilmente ad un numero
finito di t sottospazi H1 , H2 , …, Ht con t > 2 . Indicando con H1 + H2 + …+ Ht lo spazio
generato da H1 ∪ H2 ∪ … ∪ Ht si prova facilmente che esso coincide col sottospazio L
seguente
L = { a1 + a2 + .. + at , a1 ∈ H1 , a2 ∈ H2 , …, at ∈ Ht }

Proviamo infine la seguente importante proprietà :

3. per ogni H , T ∈ H si ha ( formula di Grassmann ).

(3.1) dim H + dim T = dim (H ∩ T) + dim (H + T)


33

Dimostrazione. Possiamo supporre che nessuno dei due sottospazi H e T sia contenuto
nell’altro altrimenti la (3.1) è ovvia.
Poniamo h = dim H e t = dim T e siano ( e1 , e2,…., eh ) e (w1 , w2,…., wt )
rispettivamente una base di H e una di T. Mostriamo che se H ∩ T = { 0 } allora i vettori
( e1 , e2,…., eh w1 , w2,…., wt ) costituiscono una base di H+T e così la (3.1) è provata .
Un vettore v di H + T è del tipo v = a + b con a ∈ H e b ∈ T. Essendo
( e1 , e2,…., eh) e (w1 , w2,…., wt ) basi di H e T si ha :

v = a + b = α l e1 +α 2 e2 + …..+ α h eh + β 1w1 + β 2 w2 + …..+ β t wt

la quale mostra che i vettori ( e1 , e2,…., eh w1 , w2,…., wt ) sono un sistema di generatori per
H+T. Se essi risultano altresì indipendenti allora sono una base. Siano quindi α l ,α 2 , …..,α h ,
β 1,β 2 , …..,β t scalari tali che risulti
α l e1 +α 2 e2 + …..+ α h eh + β 1w1 + β 2 w2 + …..+ β t wt = 0 .
Da questa segue
α l e1 +α 2 e2 + …..+ α h eh = - ( β 1w1 + β 2 w2 + …..+ β t wt ).

Posto a = α l e1 +α 2 e2 + …..+ α h eh e b = β 1w1 + β 2 w2 + …..+ β t wt

Ovviamente a ∈ H e b ∈ T. Inoltre –b ∈ T. Da a = -b segue allora che a ∈ H ∩ T e


b∈ H∩T. Ma essendo per ipotesi H ∩ T = { 0 }si ha a = 0 e b = 0. Ma

a = α l e1 +α 2 e2 + …..+ α h eh = 0 e b = β 1w1 + β 2 w2 + …..+ β t wt = 0

comportano essendo ( e1 , e2,…., eh ) e (w1 , w2,…., wt ) vettori indipendenti


α l =α 2 =…….=α h = β 1=β 2 =… …=β t= 0
come si voleva provare.
Supponiamo quindi che sia H ∩ T diverso dal vettore nullo e sia i = dim H ∩ T . Siano
( e1 , e2,…., ei ) vettori indipendenti di H ∩ T cioè una base di H ∩ T . Usando la proposizione
3.7 si possono trovare h -i vettori vi+1 , vi+2 ,…. , vh di H – (H ∩ T ) , scelti in modo che
( e1 , e2,…., ei vi+1 , vi+2 ,…. , vh ) sia una base di H e si possono trovare t -i vettori
wi+1 , wi+2 ,…. , wt di T – H ∩ T scelti in modo che ( e1 , e2,…., ei wi+1 , wi+2 ,…. , wt ) sia una
base di T. Se proviamo che i vettori ( e1 , e2,…., ei vi+1 , vi+2 ,…. , vh wi+1 , wi+2 ,…. , wt ) sono una
base per H + T , essendo in numero di i + h-i + t-i = h + t –i si ha
34

dim (H + T) = h + t –i = dim H + dim T – dim H ∩T

e cioè la (3.1).

Sia v un vettore di H+T . Il vettore v è del tipo v= a+b con a ∈ H e b ∈ T.


Essendo ( e1 , e2,…., ei vi+1 , vi+2 ,…. , vh ) una base di H e ( e1 , e2,…., ei wi+1 , wi+2 ,…. , wt ) una
base di T si ha

v = a + b = α l e1 +α 2 e2 + …..+ α i ei + α i+1 vi+1 +α i+2 vi+2 + …..+ α h vh + γ l e1 + γ 2 e2 + …..+


+ γ i ei + β i+1 wi+1 + β i+2 wi+2 + …..+ β t wt

la quale mostra che v è combinazione lineare dei vettori ( e1 , e2,…., ei vi+1 , vi+2 ,…. , vh wi+1 ,
wi+2 ,…. , wt ) i quali sono quindi un sistema di generatori per H + T . Mostriamo che sono
indipendenti . Siano α l ,α 2 ,…. , α h β i+1,β i+2 , ….., β t scalari tali che risulti

α l e1 +α 2 e2 + …+ α i ei + α i+1 vi+1 +α i+2 vi+2 + …+ α h vh + β i+1 wi+1 + β i+2 wi+2 + ….+ β t wt = 0

Da questa segue

(**) β i+1wi+1 + β i+2 wi+2 + …..+ β t wt = - ( α l e1 +α 2 e2 + …..+ α i ei + α i+1 vi+1 +


α i+2 vi+2 + …..+ α h vh )

Poniamo
b = β i+1w1 + β i+2 w2 + …..+ β t wt ed

a = α l e1 +α 2 e2 + …..+ α i ei + α i+1 vi+1 +α i+2 vi+2 + …..+ α h vh

Ora b ∈ T ed a ∈H . Quindi dall’essere b = -a segue che b ∈ H ∩ T.

Poiché e1 , e2 …..ei è una base di H ∩ T. si ha , per opportuni scalari δ l , δ 2 , ….., δ i

b = β i+1wi+1 + β i+2 wi+2 + …..+ β t wt = δ l e1 + δ 2 e2 + …..+ δ i ei

da questa segue

δ l e1 + δ 2 e2 + …..+ δ i ei - β i+1wi+1 - β i+2 wi+2 - …..- β t wt = 0


35

e questa comporta, essendo ( e1 , e2,…., ei wi+1 , wi+2 ,…. , wt ) una base,

δ l = δ 2 = …..=δ i = β i+1= βi+2 = …..=β t = 0

Ma se β i+1= βi+2 = …..=β t = 0 da (**) segue

α l e1 +α 2 e2 + …..+ α i ei + α i+1 vi+1 +α i+2 vi+2 + …..+ α h vh = 0

dalla quale segue, essendo ( e1 , e2,…., ei vi+1 , vi+2 ,…. , vh ) una base,

α l =α 2 = …..=α i = α i+1 =α i+2 = …..= α h = 0 .

Avendo provato che α l =α 2 = …..= α h = β i+1= β i+2 = …..=β t = 0 i vettori

(e1 , e2,…., ei vi+1 , vi+2 ,…. , vh wi+1 , wi+2 ,…. , wt ) sono indipendenti e l’asserto è provato.

Osserviamo esplicitamente che nella dimostrazione ora fatta abbiamo provato che se H e T
hanno in comune il solo vettore nullo unendo una base di H ad una base di T si ottiene un insieme
di vettori linearmente indipendente , base per lo spazio generato da H e T.
Tale proprietà con un semplice processo di induzione sul numero t di sottospazi può essere
così generalizzata .

Proposizione 5.1 Siano H1 , H2, …, Ht , t ( t ≥ 2 ) sottospazi di uno spazio vettoriale Vn


di dimensione n sul campo K. Se ogni Hi interseca nel solo vettore nullo lo spazio generato dai
rimanenti sottospazi allora unendo una base di H1 , con una base di H2 e .. con una di Ht si
ottiene un insieme di vettori linearmente indipendente , base per lo spazio H1+ H2 +…+ Ht
generato da H1 ∪ H2 ∪ … ∪ Ht .

Concludiamo tale numero introducendo una utile nozione. Due sottospazi H e T di uno
spazio vettoriale Vn sono detti supplementari se risulta

H ∩ T ={ 0 } e H + T = Vn

Per la formula di Grassmann già provata , se H e T sono supplementari risulta :

dim H + dim T = n
36

Si possono costruire sottospazi supplementari ?


La proposizione che segue da risposta al quesito posto.

Proposizione 5.2 Sia e1 , e2 , …, en una base di Vn .I sottospazi

H = [ e1 , e2 , …, et ] , T = [ et+1 , e t+2, …, en ]

generati rispettivamente da e1 , e2 , …, et e da et+1 , e t+2, …, en sono tra loro


supplementari.
Dimostrazione. Poiché { e1 , e2 , …, en } è una base di Vn allora per ogni vettore v
di Vn si ha :
(*) v = α1 e1 + α2 e2+ …+ αt et + αt +1 et+1 + αt+2 e t+2+ …+ αn en

Posto a = α1 e1 + α2 e2+ …+ αt et e b = αt +1 et+1 + αt+2 e t+2+ …+ αn en la relazione (*)


mostra che è v = a + b con a ∈ H e b ∈ T e che quindi è H + T = Vn .Proviamo
infine che è anche H ∩ T = { 0 } . Sia v un vettore di H ∩ T . Poichè e1 , e2 , …, et è

una base di H e et+1 , e t+2, …, en è una base di T, si ha per opportuni scalari α1 , α 2 …. α t ,

α t +1 , α t + 2 ….. α n

v = α1 e1 + α 2 e2+ …+ α t et = α t +1 et+1 + α t + 2 e t+2+ …+ α n en

Da questa segue

α1 e1 + α 2 e2+ …+ α t et - α t +1 et+1 - α t + 2 e t+2+ …- α n en = 0

e questa comporta , essendo i vettori e1 , e2 , …, en indipendenti, α1 = α 2 = α t = α t +1 = α t + 2

= …= α n = 0 .
Si ha quindi v = 0 e ciò mostra per l’arbitrarietà di v in H ∩ T che è H ∩ T = { 0 }.

La proposizione che segue “inverte” in un certo senso la proposizione ora provata


37

Proposizione 5.3 Siano H e T due sottospazi supplementari di dimensioni t e n-t .


Se { e1 , e2 , …, et } è una base di H e { et+1 , e t+2 …, en } è una base di T allora
{ e1 , e2 , …, et et+1 , e t+2 …, en } è una base di Vn.
Dimostrazione . Per la dimostrazione è sufficiente provare che i vettori e1 , e2 , …, et , et+1,
e t+2 …, en sono indipendenti . Siano quindi α1 , α 2 ,… α t , α t +1 , α t + 2 .. …, α n scalari per i
quali risulti
α1 e1 + α 2 e2+ …+ α t et + α t +1 et+1 + α t + 2 e t+2+ …+ α n en = 0
Da questa segue
α1 e1 + α 2 e2+ …+ α t et = - α t +1 et+1 - α t + 2 e t+2 - …- α n en

Posto
a= α1 e1 + α 2 e2+ …+ α t et e b = - α t +1 et+1 - α t + 2 e t+2 - …- α n en
si ha che a ∈ H e b ∈ T ma da a = b segue allora che è a = b ∈ H ∩ T . Ma essendo H
e T supplementari si ha H ∩ T = { 0 } e quindi è a = b = 0 .
Se il vettore
a = α1 e1 + α 2 e2+ …+ α t et = 0

si ha per l’indipendenza di e1 , e2 , …, et , α1 = α 2 =… = α t = 0
e da
b = - α t +1 et+1 - α t + 2 e t+2 - …- α n en = 0

si ha per l’indipendenza di et+1 , e t+2 …, en che è α t +1 = α t + 2 = …= α n = 0 e ciò prova


l’asserto.

Quando si tenga conto della proposizione 5.2 e della proposizione 3.7 del capitolo I è facile
verificare che sussiste la seguente proposizione

Proposizione 5.4. Sia H un sottospazio dello spazio vettoriale Vn. E’ sempre possibile
costruire un sottospazio T supplementare di H .

Concludiamo con una proprietà importante degli spazi supplementari.

Se H e T sono supplementari sappiamo che è per definizione Vn = H + T e che quindi ogni


38

vettore v dello spazio si ottiene come somma di un vettore a di H e di un vettore b di T . Noi


vogliamo mostrare che la decomposizione di v come somma di un vettore a di H e di un vettore
b di T è unica . Si ha cioè :

se v=a+b e v = a’ + b’ allora è a = a’ e b = b’ .

Infatti da a + b = a’ + b’ segue a - a’ = b’ - b e questa comporta che a - a’ ∈ H ∩ T e


b’ - b ∈ H ∩ T . Ma poiché è H ∩ T = { 0 } si ha a - a’ = 0 e b’ - b = 0 e quindi
come si voleva a = a’ e b’ = b .

A titolo di esempio si consideri lo spazio vettoriale R2 delle coppie ordinate di numeri reali.
In tale spazio i sottospazi H = { ( a, 0 ) , a ∈ R } e T = { (0 , b ) , b ∈ R } sono
supplementari ed in accordo con la proprietà sopra illustrata ogni vettore (a, b ) di R2

(a , b ) = ( a , 0 ) + ( 0 , b )

si scrive in un sol modo come somma di un vettore di H e di uno di T.


39

C A P I T O L O II

Matrici e determinanti
40

1. Introduzione.

Abbiamo visto al capitolo precedente che se in uno spazio vettoriale V di dimensione n e


costruito sul campo K si fissa un riferimento (e1 , e2,…., en ) è possibile costruire un isomorfismo
tra V e Kn . Tale isomorfismo associa ad ogni vettore v= x1 e1 +...+ xn en di V la n-pla
( x1 , x2,…., xn ) delle sue coordinate nel riferimento scelto.
Poichè un isomorfismo conserva la dipendenza e l’indipendenza lineare , allora stabilire se h
vettori v1 , v2,…., vh di V siano dipendenti o indipendenti equivale a spostare tale indagine sugli h
vettori numerici delle loro coordinate. Ma c’è un metodo “semplice e veloce” per stabilire se tali
vettori numerici sono dipendenti o indipendenti ? La risposta a questa domanda viene data
introducendo la nozione di determinante di una matrice quadrata , nozione di cui ora parleremo.

Preliminarmente è però essenziale fare le seguenti osservazioni.

Siano assegnati un certo numero di vettori numerici di ordine n e siano .

(a1,..., an) , (b1,..., bn), …………...., (w1,...., wn) .

Se supponiamo che essi siano dipendenti , esisteranno opportuni scalari α, β,…., γ non tutti
nulli tali che risulti :

α (a1,..., an) + β (b1,..., bn) + …….. ... + γ (w1,...., wn) = (0,…..,0).

Fissati s posti (i1,i2,...,is) tra i posti da 1 ad n si considerino i vettori numerici di ordine s ottenuti

considerando in ognuno dei vettori numerici assegnati solo le componenti di posto

ii,i2,..,is , cioè consideriamo i vettori ,ora di lunghezza s , seguenti

(ai1,ai2,...,ais) (bi1,bi2,...,bis) …. (wi1,wi2,...,wis)

E’ ovvio che anche essi sono dipendenti in quanto con gli stessi scalari α, β,…., γ non tutti nulli
sopra adottati si ha ancora :

α (ai1,ai2,...,ais) + β (bi1,bi2,...,bis) + …. + γ (wi1,wi2,...,wis) = ( 0,0 , ….,0 ).

Usando un linguaggio poco preciso ma espressivo possiamo riassumere l'osservazione fatta dicendo
41

che : se si " accorciano " dei vettori numerici dipendenti essi restano dipendenti .

Ne segue che se si " allungano " dei vettori numerici indipendenti essi restano indipendenti.

Mostriamo quanto detto con un esempio . Nello spazio V = R4 delle quaterne ordinate di
numeri reali i vettori ( 1 , 0 , 2 , 1 ) , ( 0 , 3 , 1 , 1 ) , (4 , 3 , 9 , 5 ) sono dipendenti risultando :

8 ( 1 , 0 , 2 , 1 ) + 2 ( 0 , 3 , 1 , 1 ) – 2 (4 , 3 , 9 , 5 ) = (0, 0, 0, 0)

Le tre coppie (2 ,1) , ( 1, 1 ) , (9, 5 ) ottenute “accorciando” le tre quaterne date (considerando di
ognuna solo gli ultimi due numeri) sono anch’ esse dipendenti risultando ancora

8 (2 , 1 ) + 2 (1 , 1 ) – 2 (9 , 5 ) = (0, 0)

Sempre nello stesso spazio le due quaterne ( 1 , 0 , 2 , 1 ) , ( 0 , 3 , 1 , 1 ) sono indipendenti in


quanto non proporzionali e così le due sestine

( 1 , 0 , 2 , 1 , 2 , 2 ) , ( 0 , 3 , 1 , 1 , 7 , 5)

ottenute aggiungendo ad ognuna di esse ulteriori due numeri sono ancora indipendenti.

Diamo ora la nozione di determinante di una matrice quadrata.

2 . Determinante di una matrice quadrata.

Ad una matrice quadrata A d’ordine n ad elementi in un campo K ,si può associare uno

scalare , elemento di K , detto determinante di A, e denotato con │A│ o detA al seguente

modo :

Se n=1 e cioè è A = ( a ) allora si pone detA = a .

Vediamo come si calcola il determinante quando è n ≥ 2 .

Sia quindi A una matrice quadrata d’ordine n con n ≥ 2 . Indichiamo la matrice A al seguente

modo :
42

⎛ a11 a12 …………. a1n ⎞


⎜ ⎟
⎜ a 21 a 22 …………a 2n ⎟
A= ⎜ ……….. ⎟
⎜ ⎟
⎜ ⎟
⎜ ⎟
⎝ a n1 a n2 …………a nn ⎠

Se aij è un elemento della matrice A , chiameremo complemento di aij il determinante della

matrice quadrata d’ordine n-1 ottenuta cancellando in A la riga i e la colonna j .Tale complemento

quando venga moltiplicato per ( -1 ) i+j è detto complemento algebrico di aij e viene denotato col

simbolo Aij . Si può provare che si ottiene lo stesso elemento di K , sia che si esegua questo

calcolo

ai1 Ai1 + ai2 Ai2 +……+ ainAin

lungo una qualunque riga i = 1,2,….,n di A e sia che si esegua questo calcolo

a1j A1j + a2j A2j +……+ anjAnj

lungo una qualunque colonna j = 1,2,…,n di A . Tale scalare viene chiamato determinante di A .

Riepilogando , per calcolare il determinante di A , si deve scegliere una riga o una colonna e poi

eseguire la somma dei prodotti degli elementi della linea scelta per i rispettivi complementi

algebrici .

Ora se la matrice A ha ordine due se n = 2 e cioè è

⎛ a 11 a 12 ⎞
A = ⎜⎜ ⎟
⎝ a 21 a 22 ⎟⎠
43

si ha A11 = a22 ed A12 = - a21

e pertanto risulta :

detA = a11 A11 + a12 A12 = a11 a22 - a12 a21 .

Avendo definito il determinante di A quando A ha ordine uno siamo stati in grado di calcolare il

determinante di A quando A ha ordine due . Ma allora sapremo calcolare il determinante anche

quando A ha ordine tre in quanto i complementi algebrici dei suoi elementi si otterranno attraverso

il calcolo di determinanti di matrici d’ordine due. Per le stesse ragioni, sapendo calcolare il

determinante di A quando essa ha ordine tre sapremo calcolare il determinante di A anche quando

ha ordine quattro e così via. Sappiamo quindi calcolare il determinante di A quando essa ha ordine n

se sappiamo calcolare il determinante di una matrice d’ordine n-1.

A titolo di esempio si voglia calcolare il determinante della matrice C reale d’ordine tre seguente :

⎛1 2 -1 ⎞
⎜ ⎟
C= ⎜2 0 4⎟
⎜4 2 8 ⎟⎠

Sviluppando il calcolo lungo la seconda riga si ha :

detC = 2 (-18) + 4 (6) = - 12 .

E’ utile osservare che nel calcolo del determinante della matrice C abbiamo scelto opportunamente

la seconda riga in quanto su tale riga uno degli elementi è zero e ciò ha ridotto quindi il numero

degli addendi da calcolare .

Se A è una matrice quadrata d’ordine n ed occorre calcolare il suo determinante è

auspicabile che su qualche riga o colonna figurino molti zeri perché ciò riduce il numero di calcoli
44

da effettuare. C’è una proprietà dei determinanti che viene incontro a questa nostra esigenza

Enunceremo tale proprietà omettendo la sua dimostrazione .

Sussiste allo scopo la seguente :

Proposizione 2.1 Il determinante di una matrice quadrata d’ordine n non cambia se si

aggiunge ad una sua riga ( o colonna ) una combinazione lineare delle altre righe ( o delle altre

colonne ).

Per il calcolo del determinante della matrice

⎛1 2 -1 ⎞
⎜ ⎟
C= ⎜2 0 4⎟
⎜4 2 8 ⎟⎠

possiamo applicare la proprietà ora enunciata per semplificarne il calcolo. A tale scopo possiamo

sommare alla terza riga di C la seconda riga moltiplicata per -2 e si ottiene la seguente matrice B

⎛1 2 -1 ⎞
⎜ ⎟
B= ⎜2 0 4⎟
⎜0 2 0 ⎟⎠

la quale per il teorema precedente ha lo stesso determinante di C . Sviluppando il determinante di B

secondo l’ultima riga si ha detB = det C = 2 (-6) = - 12 .

E’ evidente che se in una matrice una sua riga o colonna ha gli elementi tutti nulli allora il

determinante di tale matrice è zero. Ciò premesso in forza della proposizione 2.1 si ha questa ovvia

proprietà:

Proposizione 2.2 . Se in una matrice due righe ( o colonne ) sono uguali o proporzionali

allora il determinante è zero.

I teoremi che seguono sono molto importanti in quanto chiariscono il perché sia molto utile

saper calcolare questo scalare che abbiamo chiamato determinante . Proviamo la seguente
45

Proposizione 2.3 . Se le righe (o colonne ) di una matrice quadrata A sono vettori

dipendenti allora risulta detA = 0 .

Dimostrazione. Supponiamo che le righe di A siano dipendenti . Allora una di tali righe è

combinazione lineare delle altre e supponiamo ad esempio che l’ultima riga sia combinazione

lineare delle altre , risulti cioè an = α1a1 + α2a2 +…..+ αn-1an-1 . Se si somma ad an la seguente

combinazione lineare delle altre -α1a1 - α2a2 +…..- αn-1an-1 sappiamo che si ottiene una matrice B

che ha lo stesso determinante di A . Ma l’ultima riga di B ha tutti gli elementi eguali a zero e quindi

è detA=detB=0.

Dal teorema ora provato segue il seguente importante corollario:

Proposizione 2.4 . Se il determinante di una matrice quadrata A è diverso da zero allora

le righe e le colonne di A sono linearmente indipendenti .

Vediamo qualche utile applicazione delle cose dette. Supponiamo si voglia stabilire se le tre

quaterne (1,1,0,1) , (0,1,2,1) , (1,0,0,3) siano o meno linearmente indipendenti . Consideriamo

la matrice A che si ottiene assumendo come sue righe le quaterne date .


1
1
0
1

⎛ ⎞
0 1
1 0
2 0
1 3

⎜ ⎟
A= ⎜ ⎟
⎜ ⎟
⎝ ⎠

In tale matrice la sottomatrice quadrata


1 0 1
1 1 0
0 2 0

⎛ ⎞
⎜ ⎟
B= ⎜ ⎟
⎜ ⎟
⎝ ⎠

costituita dalle prime tre colonne di A ha il determinante diverso da zero (infatti esso è due )

e quindi per la proposizione 2.4 le sue righe sono indipendenti . Poiché le righe di A sono un

allungamento delle righe di B e poiché allungando vettori indipendenti essi restano indipendenti
46

si conclude che le quaterne assegnate sono linearmente indipendenti.

Concludiamo tale numero con qualche utile osservazione. E’ apparso chiaro dalla

definizione che il calcolo del determinante di una matrice quadrata A d’ordine n non sia agevole

quando l’ordine n è abbastanza grande. Ci sono però alcune matrici particolari per le quali il

calcolo del determinante non presenta difficoltà. Vediamo.

Una matrice A= ( aij) quadrata d’ordine n è detta triangolare ( bassa ) se

per ogni j > i , risulta aij = 0 mentre è detta triangolare ( alta ) se per ogni j < i è aij = 0 .

⎛ a 11 0 ………...... 0 ⎞ ⎛ a 11 a 12 …………. a 1n ⎞
⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 0……….0 ⎟ ⎜ 0 a 22 ………….a 2n ⎟
A= ⎜ a a 32 a 33 0…...0 ⎟ A= ⎜ 0 0 a 33 ……...a 3n ⎟
⎜ 31 ⎟ ⎜ ⎟
⎜ .. ⎟ ⎜ ... ⎟
⎜ ⎟ ⎜ ⎟
⎝ a n1 a n2 ………...a nn ⎠ ⎝ 0 0 0 ... 0 .... a nn ⎠

( triangolare bassa ) ( triangolare alta )

Gli elementi ( a11, a22 , …., ann ) della matrice A sono detti gli elementi della diagonale

( principale ) di A .

Una matrice A ( aij) quadrata d’ordine n è detta diagonale se risulta per ogni i ≠ j ,

aij = 0 .

Con un semplice ragionamento di induzione si prova facilmente che se A =( aij) è una

matrice quadrata d’ordine n ed A è triangolare o diagonale allora è

det A = a11. a22 . …..ann

cioè il suo determinante è il prodotto degli elementi della sua diagonale principale.
47

3. Prodotto di matrici.

Siano a = (a1 , a2 ,…… , an ) , b = (b1 , b2 ,…… , bn ) due n-ple ordinate di


elementi di un campo K .
Si definisce prodotto scalare di tali due n-ple, lo scalare

a x b = a1 b1 + a2 b2 +…… an bn

che si ottiene eseguendo la somma dei prodotti degli elementi di egual posto.
Siano A = (a ij ) e B = (b ij ) due matrici ad elementi nel campo K . La matrice A sia di

tipo (m , n ) e quella B di tipo ( n , p ) (quindi il numero di colonne di A deve esser eguale al


numero di righe di B ). In tale situazione si può definire prodotto delle due matrici ( righe per
colonne ) la matrice C = AB di tipo ( m , p ) il cui generico elemento cij si ottiene eseguendo il
prodotto scalare della riga i-sima di A con la colonna j-sima di B :

cij = ai x bj

Sia ora M = Mn ,R lo spazio vettoriale di tutte le matrici quadrate d’ordine n sul campo K . Se A
e B sono due elementi di M il loro prodotto ( che è eseguibile ) è ancora un elemento di M. Tale
prodotto non ha la proprietà commutativa . Mostriamo ciò con un esempio.
Siano A e B le seguenti matrici quadrate d’ordine tre :

⎛ 1, 1, 0 ⎞ ⎛ 1, 0 , 0 ⎞
⎜ ⎟ ⎜ ⎟
A= ⎜ 0, 0,0 ⎟ B= ⎜ 1, 0 , 0 ⎟
⎜ 0, 0, 0 ⎟ ⎜ 0, 0 , 0 ⎟
⎝ ⎠ ⎝ ⎠
Eseguendo il loro prodotto si ha :

⎛ 2, 0,0 ⎞
⎜ ⎟
AB = ⎜ 0 , 0 , 0 ⎟
⎜ 0, 0, 0 ⎟
⎝ ⎠

Mentre risulta :
48

⎛ 1, 1, 0 ⎞
⎜ ⎟
BA = ⎜ 1 , 1 , 0 ⎟
⎜ 0, 0, 0 ⎟
⎝ ⎠

Nell’insieme M la seguente matrice I ( detta matrice identica )

I = ( δij ) con δij = 0 se i ≠ j e δii = 0

⎛ 1 , 0 ,...., 0 ⎞
⎜ ⎟
⎜ 0 , 1 , .....,0 ⎟
I= ⎜ ⎟
.....
⎜ ⎟
⎜ 0, 0,.....,1 ⎟
⎝ ⎠

è l’elemento neutro rispetto al prodotto tra matrici. Risulta infatti per ogni matrice A di M

AI = IA = A.

Poiché la matrice I è diagonale si ha :

det I = 1.

Sia A una matrice quadrata d’ordine n . L’ inversa della matrice A, se esiste , è una matrice A-1
anch’essa quadrata d’ordine n , che abbia la seguente proprietà :

A A-1 = A-1 A = I .

Allo scopo di determinare quali matrici sono dotate di inversa ci è utile provare preliminarmente la
seguente proprietà :

Sia A una matrice quadrata d’ordine n . Risulta :

1. ai1 Aj1 + ai2 Aj2 +……+ ainAjn = detA se i = j


49

2. ai1 Aj1 + ai2 Aj2 +……+ ainAjn = 0 se i ≠ j

Occorre provare la 2, essendo la 1. vera per la definizione di determinante.

All’uopo consideriamo la matrice A

⎛ a 11 a 12 .................. ..a 1n ⎞
⎜ ⎟
⎜ .... ⎟
⎜ a a .............. ........a ⎟
⎜ i1 i2 in ⎟
A = ⎜ .. ⎟
⎜ ⎟
⎜ a j1 a j2 .............. .......a jn ⎟
⎜ .. ⎟
⎜ ⎟
⎜ a a ....................a ⎟
⎝ n1 n2 nn ⎠

e la matrice ausiliaria B , eguale alla matrice A tranne che nella riga di posto j dove presenta di
nuovo la riga ai

⎛ a 11 a 12 .................. ..a 1n ⎞
⎜ ⎟
⎜ .... ⎟
⎜ a a .............. .......a ⎟
⎜ i1 i2 in

B= ⎜ .. ⎟
⎜ ⎟
⎜ a i1 a i2 .............. .......a in ⎟
⎜ .. ⎟
⎜ ⎟
⎝ a n1 a n2 ....................a nn ⎠

Per tali matrici , (essendo in tutto eguali tranne che nella riga di posto j ), risulta

Aj1 = Bj1 , Aj2 = Bj2 , … …, Ajn = Bjn

E quindi è , come si voleva :

0= detB = bj1 Bj1 + bj2 Bj2 + .. + bjn Bjn = ai1 Aj1+ ai2 Aj2 + … +ain Ajn

Un’ altra utile proprietà , di cui omettiamo la dimostrazione , è la seguente :


50

Per ogni coppia di matrici A e B in M risulta

3. det (AB) = detA detB

Attraverso l’uso delle proprietà 1., 2. ,3 ora stabilite siamo ora in grado di provare la
seguente importante:

Proposizione 3.1 Una matrice quadrata A ammette inversa se e solo se essa ha il


determinante diverso da zero.
Dimostrazione . Se la matrice A ammette inversa esiste una matrice A-1 tale che risulti
A A-1 = I . Si ha det(A A-1) = detA det A-1 = det I = 1 da cui segue det A ≠ 0.
Viceversa supponiamo sia detA = k ≠ 0 . Tenendo conto delle 1 e 2 la matrice :

⎛ A11 A 21 ……………….. A n1 ⎞
⎜ ⎟
⎜ A12 A 22 ………………..A n2 ⎟
1 ⎜ ……….. ⎟
A-1 =
k ⎜ ⎟
⎜ ⎟
⎜ ⎟
⎝ A1n A 2n ………………. A nn ⎠

risulta l’inversa della matrice A .

4 . Rango di una matrice.

Sia assegnata una matrice

⎛ a 11 a 12 ........ a 1n ⎞
⎜ ⎟
⎜ a 21 a 22 ........ a 2n ⎟
A= ⎜ ⎟
...
⎜ ⎟
⎜a ⎟
⎝ m1 a m2 ........ a mn ⎠
51

una matrice di tipo (m ,n ) sul campo K. Indicheremo le sue m righe coi simboli a1 , a2,…., am e
le sue n colonne coi simboli a1 , a2,…., an Supponiamo di aver individuato nella matrice A , p
sue righe , per esempio le prime p , con queste proprietà :

i) a1 , a2,…., ap sono indipendenti

ii) ogni altra riga risulta una loro combinazione lineare.

Se a i1 , a i 2 ,…., a i t sono t righe indipendenti di A poiché ognuna di esse dipende da

a1 , a2,…., ap allora , per il teorema di Steinitz risulta t ≤ p.

Pertanto il numero massimo di righe indipendenti di A è p . Individuare nella matrice A un gruppo


di righe con le proprietà i) e ii) equivale quindi a determinare quale sia il numero massimo di righe
indipendenti che A possiede.

In modo analogo supponiamo che nella matrice A ci siano s colonne per esempio le prime s
con le seguenti proprietà :

j) a1 , a2,…., as sono indipendenti

jj) ogni altra colonna risulta una loro combinazione lineare.

Se a j1 , a j2 ,…., a j t sono t colonne indipendenti di A, poiché ognuna di esse dipende da

a1 , a2,…., as allora , per il teorema di Steinitz risulta t ≤ s .

Pertanto il numero massimo di colonne indipendenti di A è s . Individuare nella matrice A un


gruppo di colonne con le proprietà j) e jj) equivale quindi a determinare quale sia il numero
massimo di colonne indipendenti che A possiede. Mostreremo ora che p = s e cioè che il massimo
numero di righe indipendenti di A eguaglia il massimo numero di colonne indipendenti di A .

Il numero massimo di righe ( o colonne ) indipendenti di A è detto il rango di A .

Proviamo quindi la seguente

Proposizione 4.1 Il massimo numero di righe indipendenti di una matrice A eguaglia il


numero massimo di colonne indipendenti di A.

Dimostrazione. Possiamo supporre che la matrice A non abbia tutti gli elementi eguali a zero
52

altrimenti l’asserto è ovvio.

Siano a i1 , a i 2 ,…., a i p p righe di A con le proprietà i) e ii) e siano

a j1 , a j2 ,…., a j t t colonne di A con le proprietà j) e jj). Mostreremo che è p=t e ciò proverà
l’asserto.

Poiché le righe a i1 , a i 2 ,…., a i p generano tutte le altre si ha

( a1 ) = α l( a i1 )+α2( a i2 )+ …. + αp ( a i p )

( a2 ) = β l( a i1 ) + β2 ( a i2 )+ …. + βp ( a i p )

…..

……

( am ) = γl( a i1 ) + γ2 ( a i2 )+ …. + γp ( a i p )

Ora se volessimo descrivere la colonna di posto j di A dovremmo prendere l’elemento di


posto j nella prima riga , prendere l’elemento di posto j della seconda riga , prendere l’elemento di
posto j dell’ultima riga .

j j j j

(… a1 … …) = αl(… a i1 … …) + α2 (… a i 2 … …) + ….+ αp(… a i p … …)

(… a2 … …) = β l(… a i1 … …) + β 2 (… a i 2 … …) + ….+ β p(… a i p … …)

…..

…..

(… am … …) = γ l(… a i1 … …) + γ 2 (… a i 2 … …) + ….+ γp(… a i p … …)


53

e quindi si ha

⎛ a1j ⎞ ⎛ α1 ⎞ ⎛α2 ⎞ ⎛αp ⎞


⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜a 2j ⎟ ⎜ β1 ⎟ ⎜β2 ⎟ ⎜β p ⎟
⎜ ⎟ ⎜ .. ⎟ + a ⎜ .. ⎟ + ….. + a ⎜ ⎟
⎜ .. ⎟ = a i1 j
⎜ ⎟ i2 j ⎜ ⎟ ip j ⎜ .. ⎟
⎜ .. ⎟ ⎜ .. ⎟ ⎜ .. ⎟ ⎜ .. ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ a mj ⎟ ⎝ γ1 ⎠ ⎝ γ2 ⎠ ⎜ γp ⎟
⎝ ⎠ ⎝ ⎠

Abbiamo così provato che ogni colonna di A è combinazione lineare dei p vettori

⎛ α1 ⎞ ⎛α2 ⎞ ⎛αp ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ β1 ⎟ ⎜β2 ⎟ ⎜β p ⎟
⎜ .. ⎟ , ⎜ .. ⎟ , ….. , ⎜ ⎟
⎜ ⎟ ⎜ ⎟ ⎜ .. ⎟
⎜ .. ⎟ ⎜ .. ⎟ ⎜ .. ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎝ γ1 ⎠ ⎝ γ2 ⎠ ⎜ γp ⎟
⎝ ⎠
e conseguentemente essendo le colonne a j1 , a j2 ,…., a j t indipendenti si ha per il teorema di
Steinitz t ≤ p .
Nella matrice trasposta AT di A le righe di A sono le colonne di AT e le colonne di A sono
le righe di AT
Applicando alla matrice trasposta quanto già provato per A si ha allora p ≤ t e l’asserto è così
provato.
Illustreremo ora un teorema molto utile in quanto esso fornisce un metodo per il calcolo del
rango di una matrice.Prima però occorre dare alcune semplici definizioni.
Sia A una matrice di tipo m ,n sul campo K.

Si scelgano h righe a i1 , a i 2 ,…., a i h di A ed h colonne a j1 , a j2 ,…., a jh di A. La sottomatrice H

di A i cui elementi sono quelli che si trovano contemporaneamente sulle righe e colonne scelte sarà
da noi chiamata un minore d’ordine h di A.

Quindi la prima riga di H ha per elementi gli elementi della riga a i1 che occupano i posti

j1 , j2 ,…., jh . La seconda riga di H ha per elementi gli elementi della riga a i 2 che occupano i

posti j1 , j2 ,…., jh . L’ultima riga di H ha per elementi gli elementi della riga

a i h che occupano i posti j1 , j2 ,…., jh .Facciamo un esempio.


54

Sia A la seguente matrice

⎛ 1, 2 , 5 ,1, 0 ⎞
⎜ ⎟
A= ⎜ 3 , 3 , 2 , 0 , 4 ⎟
⎜ 1, 0 , 3 , 4 , 2 ⎟
⎝ ⎠

Se si scelgono la prima e la terza riga e la quarta e quinta colonna di A la matrice H che tali scelte
determinano è

⎛ 1, 0⎞
H= ⎜⎜ ⎟⎟
⎝ 4, 2⎠

Se si scelgono la prima e la seconda riga e la prima e la seconda colonna di A la matrice L che tali
scelte determinano è

⎛ 1, 2⎞
L= ⎜⎜ ⎟⎟
⎝ 3, 3 ⎠

Sia H il minore d’ordine h ottenuto scegliendo le righe a i1 , a i 2 ,…., a i h di A e le colonne a j1 ,

a j2 ,…., a jh di A. Fissate una ulteriore riga ai ed una ulteriore colonna aj con i ≠ i1 , i2 , …, ih

e j ≠ j1 , j2 ,…., jh il minore Hi,j d’ordine h+1 ottenuto scegliendo le righe a i1 , a i 2 ,…., a i h ,

ai di A e le colonne a j1 , a j2 ,…., a jh aj di A si chiama un orlato del minore H.

Riferendoci agli esempi precedenti, si ha ad esempio

⎛1 , 2, 1 ⎞ ⎛1 , 0, 1 ⎞
⎜ ⎟ ⎜ ⎟
L3,4 = ⎜ 3 , 3 , 0 ⎟ H 2,1 = ⎜ 4 , 2, 3 ⎟
⎜1 , 0, 4 ⎟ ⎜0 , 4 , 3 ⎟
⎝ ⎠ ⎝ ⎠

Siamo ora in grado di enunciare e provare il seguente importante


55

Teorema degli orlati. Sia A una matrice di tipo m,n sul campo K. Sia H un minore d’ordine h

di A ottenuto scegliendo le righe a i1 , a i 2 ,…., a i h di A e le colonne a j1 , a j2 ,…., a jh di A. Se

risulta :
1. detH= δ ≠ 0
2. detHi,j = 0 per ogni i e j ( i ≠ i1 , i2 , …, ih e j ≠ j1 , j2 ,…., jh )
allora :

i) le righe a i1 , a i 2 ,…., a i h sono indipendenti ed ogni altra riga risulta una loro

combinazione lineare
ii) le colonne a j1 , a j2 ,…., a jh sono indipendenti ed ogni altra colonna risulta una loro
combinazione lineare.
Ne segue che il rango di A è h.
Dimostrazione . Poiché H ha il determinante diverso da zero allora le sue righe e le sue

colonne sono indipendenti. Le righe a i1 , a i 2 ,…., a i h di A sono un allungamento delle righe di H

e quindi sono anch’esse indipendenti. Analogamente le colonne a j1 , a j2 ,…., a jh di A sono un


allungamento delle colonne di H e quindi sono anch’esse indipendenti. Mostriamo che ogni riga ai

di A è combinazione lineare delle righe a i1 , a i 2 ,…., a i h .

Per le ipotesi fatte le matrici Hi,1 , H i,2,….., H i,n ottenute orlando H con la riga di posto i e
tutte le colonne da 1 ad n hanno tutte il determinante eguale a zero.

⎛ a i1 j1 " a i1 jh a i11 ⎞
⎜ ⎟
⎜ " " " " ⎟
detHi,1 = det ⎜ =0
a " a i h jh a ih 1 ⎟
⎜ i h j1 ⎟
⎜ a ij " a ijh a i1 ⎟⎠
⎝ 1

⎛ a i1 j1 " a i1 jh a i1 2 ⎞
⎜ ⎟
⎜ " " " " ⎟
detHi,2 = det ⎜ =0
a " a i h jh a ih 2 ⎟
⎜ i h j1 ⎟
⎜ a ij " a ijh a i2 ⎟⎠
⎝ 1
56

⎛ a i1 j1 " a i1 jh a i1n ⎞
⎜ ⎟
⎜ " " " " ⎟
detHi,n = det ⎜ =0
a " a i h jh a ihn ⎟
⎜ i h j1 ⎟
⎜ a ij " a ijh a in ⎟⎠
⎝ 1

ora le matrici Hi,1 , H i,2,….., H i,n differiscono solo nell’ultima colonna per cui i complementi
algebrici degli elementi dell’ultima colonna di Hi,1 sono gli stessi di quelli degli elementi
dell’ultima colonna di H i,2 e di quelli degli elementi dell’ultima colonna di H i,n. Indichiamo tali
complementi algebrici con γ1 , γ2 , …, γh , δ . Sviluppando i determinanti di Hi,1 , H i,2,….., H i,n
secondo gli elementi dell’ultima colonna si hanno le seguenti relazioni scalari :

a i1 1 γ1 +…. + a i h 1 γh + a i1 δ = 0

a i1 2 γ1 +…. + a i h 2 γh + a i2 δ = 0

….

a i1 n γ1 +…. + a i h n γh + a in δ = 0

Tali relazioni sono equivalenti alla seguente relazione vettoriale

δ ai = - ( γ1 a i1 +…. + γh a i h )

e dividendo per δ , che è diverso da zero , si ha

1
ai = - ( γ1 a i1 +…. + γh a i h )
δ

la quale mostra che la riga ai è combinazione lineare delle righe a i1 ,…. , a i h .

Avendo provato che le righe a i1 ,…. , a i h sono indipendenti e che generano tutte le altre

allora è h il massimo numero di righe indipendenti. Poiché il massimo numero di righe


indipendenti eguaglia il massimo numero di colonne indipendenti allora anche le colonne
57

indipendenti a j1 , a j2 ,…., a jh sono in numero massimo e quindi ogni altra colonna risulta
una loro combinazione lineare. Il teorema è così completamente provato.
Il teorema ora provato oltre a fornire un metodo per il calcolo del rango ha questa importante
conseguenza espressa dalla seguente proposizione.

Proposizione 4.2 Sia A una matrice quadrata d’ordine n . Le righe e le colonne di A sono
dipendenti se e solo se il suo determinante è eguale a zero.

La proposizione 4.2 è ovviamente equivalente alla seguente

Proposizione 4.3 Sia A una matrice quadrata d’ordine n . Le righe e le colonne di A sono
indipendenti se e solo se il suo determinante è diverso da zero.
58

C A P I T O L O III

Sistemi di equazioni lineari


59

1.Sistemi di equazioni lineari

In questo capitolo studieremo i sistemi di equazioni lineari , cioè sistemi S di questo tipo

⎧a11x1 + a12 x 2 .. + a1n x n = c1


⎪a x + a x .. + a x = c
⎪ 21 1 22 2 2n n 2
S⎨
⎪..
⎪⎩a m1x1 + a m2 x 2 .. + a mn x n = c m

dove sia i coefficienti aij ed i termini noti ci sono elementi di un fissato campo K.
Quando i termini noti c1 ,c2,…,cn sono tutti eguali a zero il sistema è detto omogeneo.
Una soluzione del sistema è una n-pla ordinata ( y1 , y2,…., yn ) di elementi di K soluzione
delle equazioni del sistema cioè verificante

⎧a11y1 + a12 y 2 .. + a1n y n = c1


⎪a y + a y .. + a y = c
⎪ 21 1 22 2 2n n 2

⎪..
⎪⎩a m1y1 + a m2 y 2 .. + a mn y n = c m

Quando il sistema ha almeno una soluzione esso è detto compatibile .Quando esso non ha
soluzioni è detto incompatibile. Al fine di determinare condizioni che assicurino la
compatibilità del sistema S sono utili le seguenti considerazioni.

Assegnato un sistema

⎧a11x1 + a12 x 2 .. + a1n x n = c1


⎪a x + a x .. + a x = c

S ⎨ 21 1 22 2 2n n 2

⎪..
⎪⎩a m1x1 + a m2 x 2 .. + a mn x n = c m

possiamo considerare le seguenti due matrici : la prima , denotata con A , detta matrice
incompleta , o dei coefficienti è quella che ha per elementi i coefficienti delle incognite
60

⎛ a 11 , a 12 ,....a 1n ⎞
⎜ ⎟
⎜ a , a 22 .. a 2n ⎟
A = ⎜ 21 ⎟
..
⎜ ⎟
⎜ a , a ,. a ⎟
⎝ m1 m2 mn ⎠

La seconda , detta matrice completa , e denotata con A’

⎛ a11 , a12 ,....a1n c1 ⎞


⎜ ⎟
⎜ a 21 , a 22 .. a 2n c 2 ⎟
A’ = ⎜ ⎟
..
⎜ ⎟
⎜ a , a ,. a c ⎟
⎝ m1 m2 mn m ⎠

contiene oltre i coefficienti anche i termini noti disposti come sua ultima colonna.

Indichiamo con A1 , A2 , …., An le n colonne di A e con C la colonna dei termini noti.

⎛ a 11 ⎞ ⎛ a 12 ⎞ ⎛ a 1n ⎞ ⎛ c1 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
1 ⎜a ⎟ 2 ⎜a ⎟ n ⎜a ⎟ ⎜c ⎟
A = ⎜ 21 ⎟ A = ⎜ 22 ⎟ …… A = ⎜ 2n ⎟ C= ⎜ 2 ⎟
.. .. .. ..
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜a ⎟ ⎜a ⎟ ⎜a ⎟ ⎜c ⎟
⎝ m1 ⎠ ⎝ m2 ⎠ ⎝ mn ⎠ ⎝ m ⎠

Con tali notazioni il sistema S può essere scritto in modo equivalente nella seguente forma
vettoriale :

S: A1 x1+ A2 x2 + …. + An xn = C

Se ( y1 , y2,…., yn ) è una soluzione del sistema allora si ha

(1.1) A1 y1+ A2 y2 + …. + An yn = C

e questa mostra che il vettore C dei termini noti è combinazione lineare dei vettori A1 , A2 , …., An
61

colonne di A . Viceversa se il vettore C dei termini noti è combinazione lineare dei vettori
A1 , A2 , …., An , colonne di A cioè se si ha

(1.2 ) A1 y1+ A2 y2 + …. + An yn = C

allora ( y1 , y2,…., yn ) è una soluzione del sistema.


Ci sono quindi tante soluzioni quanti sono i modi in cui C si pùò ottenere come combinazione
lineare dei vettori A1 , A2 , …., An .

Abbiamo così stabilito questo importante criterio di compatibilità del sistema S.

Proposizione 1.1 Il sistema

⎧a11x1 + a12 x 2 .. + a1n x n = c1


⎪a x + a x .. + a x = c
⎪ 21 1 22 2 2n n 2
S⎨
⎪..
⎪⎩a m1x1 + a m2 x 2 .. + a mn x n = c m

ha soluzioni se e soltanto se il vettore C dei termini noti si pùò ottenere come combinazione
lineare dei vettori colonna A1 , A2 , …., An della matrice A .

Usando la proposizione 1.1 possiamo ora provare un altro teorema ( Rouchè-Capelli ) il


quale fornisce un altro criterio di compatibilità del sistema . Tale criterio è però più facilmente
utilizzabile nelle applicazioni.

Proposizione 1.2 Il sistema

⎧a11x1 + a12 x 2 .. + a1n x n = c1


⎪a x + a x .. + a x = c

S = ⎨ 21 1 22 2 2n n 2

⎪..
⎪⎩a m1x1 + a m2 x 2 .. + a mn x n = c m

ha soluzioni se e soltanto se le due matrici A ed A’ del sistema hanno lo stesso rango.


62

Dimostrazione. Indichiamo con p il rango di A e con p’ il rango di A’.Dobbiamo far vedere


che il sistema S ha soluzioni se e soltanto se risulta p = p’ .
Supponiamo dapprima che sia p = p’ e proviamo che il sistema S ha soluzioni.
Siano a j1 , a j2 ,…., a j p , p colonne indipendenti della matrice A. Tali colonne fanno parte

anche della matrice A’ e poiché per ipotesi anche A’ ha rango p , tali colonne indipendenti sono in
numero massimo. Ne, segue che ogni altra colonna di A’ è combinazione lineare delle colonne
a j1 , a j2 ,…., a j p . In particolare la colonna c dei termini noti dipende dalle colonne

a j1 , a j2 ,…., a j p e quindi da tutte le colonne di A. Per la proposizione 1.1 se la colonna c

dei termini dipende da tutte le colonne di A , S ha soluzioni.


Supponiamo ora che S abbia soluzioni e mostriamo che è p = p’ . Siano a j1 , a j2 ,…., a j p

p colonne indipendenti della matrice A ed in numero massimo cioè tali che ogni altra colonna di A
risulti una loro combinazione lineare. Se mostriamo che ogni colonna di A’ risulta combinazione
lineare delle colonne a j1 , a j2 ,…., a j p allora tali colonne sono un sistema massimo di colonne

indipendenti di A’ che ha così anche essa rango p . Una qualunque colonna a j di A’ diversa dalla
colonna c essendo anche colonna di A dipende da a j1 , a j2 ,…., a j p . Poiché per ipotesi il

sistema ha soluzioni , per la proposizione 1.1. la colonna c dipende dalle colonne di A . Ma


poiché le colonne di A dipendono da a j1 , a j2 ,…., a j p allora anche c dipende dalle colonne

a j1 , a j2 ,…., a j p . Avendo provato che ogni colonna di A’ dipende dalle colonne a j1 , a j2 ,….,

a jp resta provato che tali colonne sono colonne indipendenti di A’ ed in numero massimo per

cui p è il rango di A’ . Risulta quindi p’ = p ed il teorema è provato.

Facciamo un esempio per mostrare l’utilità del teorema ora provato.

Si voglia ad esempio stabilire per quale valore del parametro reale h il seguente sistema S
ha soluzioni .

⎧2x + y + hz = 4

S = ⎨x - 2y + 2z = 1
⎪3x + y + z = 5

Le due matrici A ed A’ del sistema S sono


63

⎛2 1 h ⎞ ⎛2 1 h 4 ⎞
⎜ ⎟ ⎜ ⎟
A = ⎜1 - 2 2 ⎟ A’ = ⎜1 - 2 2 1 ⎟
⎜3 1 1 ⎟⎠ ⎜3 1 1 5 ⎟
⎝ ⎝ ⎠

La matrice

⎛2 1 4 ⎞
⎜ ⎟
L = ⎜1 - 2 1 ⎟
⎜3 1 5 ⎟⎠

estratta da A’ ha determinante diverso da zero risultando det L = 4 e pertanto A’ ha rango tre .


3
La matrice A ha rango tre se e solo se risulta detA = 7h – 3 ≠ 0 . Pertanto per h ≠ il
7
3
sistema ha soluzioni , risultando p = p’ = 3 , mentre per h = il sistema non ha soluzioni
7
risultando p = 2 e p’ = 3 .

Le proposizioni 1.1 e 1.2 ora provate forniscono criteri per stabilire la compatibilità del
sistema ma non offrono metodi di determinazione delle soluzioni quando si sia accertato che queste
esistono.
Vedremo ora come si trovano le soluzioni di un sistema S quando si sia stabilito che le
soluzioni esistono.

Cominciamo col caso più favorevole .

Supponiamo che il sistema

⎧a11x1 + a12 x 2 .. + a1n x n = c1


⎪a x + a x .. + a x = c
⎪ 21 1 22 2 2n n 2
S = ⎨
⎪..
⎪⎩a n1x1 + a n2 x 2 .. + a nn x n = c n

abbia n equazioni ed n incognite . In tal caso la matrice A incompleta del sistema avendo n
righe ed n colonne è quadrata e quindi è possibile calcolare il suo determinante . Se risulta
64

det A ≠ 0

allora il sistema ha soluzioni in quanto risulta p = p’ = n . Proveremo ora che nelle ipotesi in cui
siamo il sistema ha una sola soluzione . Per provare ciò è utile scrivere il sistema in una forma
equivalente detta forma matriciale.

Denotata al solito con

⎛ a11 , a12 ,....a1n ⎞


⎜ ⎟
⎜ a , a .. a 2n ⎟
A = ⎜ 21 22 ⎟
..
⎜ ⎟
⎜ a , a ,. a ⎟
⎝ n1 n2 nn ⎠

la matrice incompleta del sistema e con X e C i seguenti vettori ( delle incognite e dei termini
noti )

⎛ x1 ⎞ ⎛ c1 ⎞
⎜ ⎟ ⎜ ⎟
⎜x2 ⎟ ⎜ c2 ⎟
X = ⎜ ⎟ C = ⎜ ⎟
.. ..
⎜ ⎟ ⎜ ⎟
⎜x ⎟ ⎜c ⎟
⎝ n ⎠ ⎝ n ⎠

si riconosce facilmente che il sistema S può essere scritto in modo equivalente nella seguente
forma matriciale :

A X = C
65

⎛ a11 , a12 ,....a1n ⎞ ⎛ x1 ⎞ ⎛ c1 ⎞


⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ a 21 , a 22 .. a 2n ⎟ ⎜x2 ⎟ ⎜ c2 ⎟
S: ⎜ .. ⎟ ⎜ .. ⎟ = ⎜ .. ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ a , a ,. a ⎟ ⎜x ⎟ ⎜c ⎟
⎝ n1 n2 nn ⎠ ⎝ n ⎠ ⎝ n ⎠

Poiché per ipotesi è det A= δ ≠ 0 la matrice A ammette inversa . Denotata con A-1 la
matrice inversa di A , moltiplicando ambo i membri di A X = C , per A-1 si ha che la
soluzione del sistema è unica ed è eguale a

(1.2) X = A-1 C

Possiamo ora rendere espliciti i valori ( x1 , x2,…., xn ) della soluzione trovata.


Ricordiamo che la matrice inversa di A ha nella riga di posto i , i complementi algebrici degli
elementi della colonna di posto i di A , ciascuno diviso per detA. Dalla (1.2) qui scritta
esplicitamente :

⎛ x1 ⎞ ⎛ A 11 , A 21 ,.... A n1 ⎞ ⎛ c1 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜x2 ⎟ 1 ⎜ A 12 , A 22 .. A n2 ⎟ ⎜c2 ⎟
⎜ .. ⎟= δ ⎜ .. ⎟ ⎜ .. ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜x ⎟ ⎜ A , A ,. ... A ⎟ ⎜c ⎟
⎝ n ⎠ ⎝ 1n 2n nn ⎠ ⎝ n ⎠

segue quindi , per ogni i = 1,2,…,n ,

A 1i c1 + A 2i c 2 + ... + A ni c n
(1.3) xi =
δ

i
Indichiamo ora con B la matrice che si ottiene dalla matrice A sostituendo la sua i-sima colonna

⎛ c1 ⎞
⎜ ⎟
⎜c ⎟
con la colonna ⎜ 2 ⎟ dei termini noti .
..
⎜ ⎟
⎜c ⎟
⎝ n ⎠
66

……… i ………

⎛ a 11 , a 12 ,.... c1 .. a 1n ⎞
⎜ ⎟
⎜ a 21 , a 22 ... c 2 .. a 2n ⎟
Bi = ⎜ .. ⎟
⎜ ⎟
⎜ a , a ,... c .. a nn ⎟
⎝ n1 n2 n ⎠

i
Poiché le matrici A e B differiscono solo nella colonna di posto i , allora i complementi
i
algebrici degli elementi della colonna i-sima di B sono eguali ai complementi algebrici degli
elementi della colonna i-sima di A. Ne segue che al numeratore della (1.3) ciascun elemento ci
i
della colonna i-sima di B è moltiplicato per il suo complemento algebrico. Il numeratore della
i
(1.3) è quindi il determinante della matrice B .
Abbiamo così provato il seguente importante risultato

Proposizione 1.3 Sia assegnato un sistema

⎧a11x1 + a12 x 2 .. + a1n x n = c1


⎪a x + a x .. + a x = c
⎪ 21 1 22 2 2n n 2
S= ⎨
⎪..
⎪⎩a n1x1 + a n2 x 2 .. + a nn x n = c n

avente n equazioni in n incognite . Se risulta det A ≠ 0 , il sistema ha una sola soluzione

( y1 , y2,…., yn ) che si determina al seguente modo ( regola di Cramer ):

det B1 det B 2 det Bn


y1 = , y2 = , …………… , yn =
detA detA detA

(avendo al solito indicato con Bi ( i= 1,2,…,n ) la matrice che si ottiene dalla matrice A
67

⎛ c1 ⎞
⎜ ⎟
⎜ c2 ⎟
sostituendo la sua i-sima colonna con la colonna ⎜ ⎟ dei termini noti ) .
..
⎜ ⎟
⎜c ⎟
⎝ n ⎠

Facciamo un esempio. Si vogliano determinare le soluzioni del seguente sistema

⎧x + y + z = 4

S = ⎨x - y + z = 2
⎪x + y - 3z = 0

Le due matrici del sistema sono

⎛ 1 1 1⎞ ⎛ 1 1 1 4⎞
⎜ ⎟ ⎜ ⎟
A = ⎜ 1 -1 1 ⎟ A’ = ⎜ 1 - 1 1 2 ⎟
⎜ 1 1 - 3⎟ ⎜ 1 1 - 3 0⎟
⎝ ⎠ ⎝ ⎠

Essendo detA = 8 per la proposizione 1.3 tale sistema ha una sola soluzione che si determina con
la regola di Cramer .Risulta allora

⎛ 4 1 1⎞
1 ⎜ ⎟ 16
x = det ⎜ 2 - 1 1 ⎟ = =2
8 ⎜ 0 1 - 3⎟ 8
⎝ ⎠

⎛ 1 4 1⎞
1 ⎜ ⎟ 8
y = det ⎜ 1 2 1 ⎟ = = 1
8 ⎜ 1 0 - 3⎟ 8
⎝ ⎠

⎛ 1 1 4⎞
1 ⎜ ⎟ 8
z = det ⎜ 1 - 1 2 ⎟ = = 1
8 ⎜ 1 1 0⎟ 8
⎝ ⎠
68

Rimangono ora da esaminare i sistemi di equazioni compatibili in cui il numero m di


equazioni è diverso dal numero n delle incognite e quelli in cui pur essendo m=n risulta
detA = 0.
Prima di passare all’esame di questi casi sono molto utili le seguenti considerazioni.

Supponiamo di avere un sistema di equazioni lineari

⎧a 11 x 1 + a 12 x 2 .. + a 1n x n + c1 = 0
⎪a x + a x .. + a x + c = 0
⎪⎪ 21 1 22 2 2n n 2

S = ⎨..
⎪a x + a x .. + a x + c = 0
⎪ m1 1 m2 2 mn n m

⎪⎩α1 x 1 + α 2 x 2 + .... + α n x n + α = 0

in cui una delle equazioni che qui abbiamo rappresentato , per distinguerla , con

α1x1 + α 2 x 2 .. + α n x n + α = 0

sia combinazione lineare di tutte le altre . Si abbia cioè

(1.4) α1x1 + α 2 x 2 .. + α n x n + α = λ1 ( a11x1 + a12 x 2 .. + a1n x n + c1 ) +


λ 2 ( a 21x1 + a 22 x 2 .. + a 2n x n + c 2 ) +…. + λ m ( a m1x1 + a m2 x 2 .. + a mn x n + c m )

Consideriamo il sistema

⎧a 11 x 1 + a 12 x 2 .. + a 1n x n + c1 = 0
⎪a x + a x .. + a x + c = 0

S’ = ⎨ 21 1 22 2 2n n 2

⎪ ..
⎪⎩a m1 x 1 + a m2 x 2 .. + a mn x n + c m = 0

ottenuto privando il sistema S dell’ equazione α1x1 + α 2 x 2 .. + α n x n + α = 0 .

Ogni soluzione ( y1 , y2,…., yn ) del sistema S è evidentemente soluzione anche del sistema S’.
69

Viceversa se ( y1 , y2,…., yn ) è una soluzione del sistema S’ , stante la (1.4) , essa è anche
soluzione del sistema S . In conclusione eliminando da S una equazione che sia combinazione
lineare delle altre si ottiene un sistema che ha una equazione in meno ma che ha le stesse soluzioni
del sistema S .

Al fine di determinare le soluzioni di un assegnato sistema S compatibile ci si può quindi


limitare a considerare solo quelle equazioni di S che siano indipendenti e tali che ogni altra
equazione sia una loro combinazione lineare.

Ma come si fa a selezionare queste “fortunate equazioni “ ? Vediamo.

Ricordiamo che lo spazio vettoriale K[x1 , x2,…., xn] dei polinomi di primo grado in n
variabili e lo spazio vettoriale numerico Kn+1 sono isomorfi , un isomorfismo essendo
l’applicazione

f : ( a1x1+ a2 x2 +….+ an xn + c ) ⎯
⎯→ ( a1, a2, .. .., an, c)

che associa al polinomio a1x1 + a2x2..+ anxn + c la n+1 –pla (a1, a2, .. an, c ) dei suoi coefficienti.

Sia ora assegnato un sistema S compatibile di m equazioni in n incognite.

⎧a11x1 + a12 x 2 .. + a1n x n + c1 = 0


⎪a x + a x .. + a x + c = 0

S = ⎨ 21 1 22 2 2n n 2

⎪ ..
⎪⎩a m1x1 + a m2 x 2 .. + a mn x n + c m = 0

e sia

⎛ a11 , a12 ,....a1n c1 ⎞


⎜ ⎟
⎜ a 21 , a 22 .. a 2n c 2 ⎟
A’ = ⎜ ⎟
..
⎜ ⎟
⎜ a , a ,. a c ⎟
⎝ m1 m2 mn m ⎠

la sua matrice completa. Ora le righe della matrice A’ sono le immagini tramite l’isomorfismo f
delle equazioni del sistema per cui un numero massimo di equazioni indipendenti del sistema si
otterrà in corrispondenza ad un numero massimo di righe indipendenti di A’ .
70

Ora poiché il sistema S è per ipotesi compatibile , le due matrici A ed A’ del sistema hanno lo
stesso rango e sia p il rango di A ed A’. Se H è la sottomatrice quadrata d’ordine p di A con
determinante diverso da zero ( ma che ha tutti i suoi orlati con determinante nullo ) che ci ha
permesso di stabilire il rango di A allora le p righe di A che concorrono alla formazione di H sono
un sistema massimo di righe indipendenti di A . Le stesse righe nella matrice A’ costituiscono
anche in A’ che anch’essa rango p , un sistema massimo di righe indipendenti di A’

Le equazioni corrispondenti a tali righe sono quindi indipendenti ed inoltre ogni altra equazione
risulta una loro combinazione lineare. Attraverso il calcolo del rango di A (uguale a quello di A’ )
utilizzando il teorema degli orlati , abbiamo così stabilito quali siano le equazioni del sistema S
che debbono essere mantenute e quali invece possono essere eliminate, senza alterare l’insieme
delle soluzioni del sistema. Quando si sia effettuata questa scelta il sistema ha sempre la seguente
forma :

ci sono nel sistema S , p equazioni ed n incognite con p ≤ n . Vediamo perché .

Inizialmente per il sistema, ci sono tre possibili casi :

Caso 1 . m = n ma è det A = 0
In tal caso il rango p di A è minore di n e quindi mantenendo le p equazioni indipendenti si hanno

p equazioni ed n incognite con p < n

Caso 2. m > n Ci siano cioè più equazioni che incognite . In tal caso la matrice A ha una forma di
rettangolo “ alto ma stretto” con m righe ed n colonne . Poiché il rango esprime il massimo
numero di colonne indipendenti risulta p ≤ n . Se p = n si ricade nel caso esaminato nella
proposizione 1.3 e pertanto possiamo supporre che sia p < n. Anche in questo caso mantenendo le
p equazioni indipendenti si hanno

p equazioni ed n incognite con p < n.

Caso 3. m < n . Ci siano cioè meno equazioni rispetto al numero di incognite . . In tal caso la
matrice A ha una forma di rettangolo “ basso ma largo ” con m righe ed n colonne. Poiché il rango
p di A esprime il massimo numero di righe indipendenti risulta p ≤ m < n. Anche in questo caso
mantenendo le p equazioni indipendenti si hanno
71

p equazioni ed n incognite con p < n.

Dopo quanto detto dobbiamo quindi prendere in considerazione un sistema S compatibile con p
equazioni indipendenti ed n incognite con p < n

⎧a11x1 + a12 x 2 .. + a1n x n + c1 = 0


⎪a x + a x .. + a x + c = 0
⎪ 21 1 22 2 2n n 2
S= ⎨
⎪..
⎪a p11x1 + a p2 x 2 .. + a pn x n + c p = 0

e vedere come si trovano le sue soluzioni.


Essendo le p equazioni del sistema indipendenti la matrice

⎛ a11 a12 ……………….. a1n ⎞


⎜ ⎟
⎜ a 21 a 22 ………………..a 2n ⎟
A= ⎜ ⎟
………..
⎜ ⎟
⎜ a a ………………. a ⎟
⎝ p1 p2 pn ⎠

incompleta del sistema ha rango p e quindi essa possiede una sottomatrice quadrata H d’ordine p
con il determinante diverso da zero corrispondente a p colonne indipendenti di A.
Per rendere semplice la scrittura, quindi solo per semplicità , supponiamo che siano le prime p
colonne di A a determinare con le sue p righe tale sottomatrice H.

⎛ a11 a12 ……a1p ………….. a1n ⎞


⎜ ⎟
⎜ a 21 a 22 ……a 2p …………..a 2n ⎟
A= ⎜ ⎟
⎜ ……….. ⎟
⎜ a a … a …………. a ⎟
⎝ p1 p2 pp pn ⎠
72

Se ora assegniamo alle incognite ( xp+1 , xp+2 , ……, xn ) i valori (yp+1 , yp+2 , ……, yn )

Il sistema S assume la seguente forma :

⎧a11x1 + a12 x 2 .. + a1p x p = − a1p +1y p +1 - .... - a1n y n − c1



⎪a 21x1 + a 22 x 2 .. + a 2p x p = - a 2p +1y p +1 - - a 2n y n − c 2
S’ = ⎨
⎪..
⎪a p11x1 + a p2 x 2 .. + a pp x p = - a pp +1y p +1 - ... - a pn y n − c p

cioè diventa un sistema con p equazioni e p incognite e con la matrice H dei suoi coefficienti
avente il determinante diverso da zero. Tale sistema per la proposizione 1.3 ha una sola
soluzione (y1 , y2 , ……, yp ) e così la n-pla

ζ = (y1 , y2 , ……, yp yp+1 , yp+2 , ……, yn )

è una soluzione del sistema S . Poiché i primi p valori della soluzione ζ sono determinati

dai valori yp+1 , yp+2 , ……, yn che ζ ha nei suoi ultimi n-p posti si hanno queste due utili
conseguenze .

i) due soluzioni ζ e η che abbiano eguali i valori di posto p+1 , p+2 ,…, n coincidono.

ii) indicando con S l’insieme delle soluzioni del sistema S , la funzione

f : (yp+1 , yp+2 , ……, yn ) ∈ Kn-p ⎯


⎯→ ζ = (y1 , y2 , ……, yp yp+1 , yp+2 , ……, yn ) ∈ S

è biettiva .

Essendo f biettiva si ha | Kn-p | = | S| e cioè le soluzioni del sistema S sono tante

quante le (n-p)-ple ordinate di elementi di K.


Se K è infinito come spesso accade ( in quanto esso spesso sarà il campo reale ) si dice
73

n-p
perciò che il sistema S ha ∞ soluzioni .
Poiché ogni soluzione è determinata sulla base della scelta dei valori yp+1 , yp+2 , ……, yn
assegnati alle incognite xp+1 , xp+2 , ……, xn , è evidente che le soluzioni del sistema
( spesso infinite ) non avendo un nesso tra loro debbono essere calcolate una per una
applicando di volta in volta la regola di Cramer. Questa difficoltà come ora vedremo può essere
superata dopo aver discusso della risoluzione dei sistemi omogenei.

2. Sistemi omogenei.

In questo numero studieremo i sistemi di equazioni lineari omogenei

⎧a11x1 + a12 x 2 .. + a1n x n = 0


⎪a x + a x .. + a x = 0

S = ⎨ 21 1 22 2 2n n

⎪..
⎪⎩a m1x1 + a m2 x 2 .. + a mn x n = 0

cioè quelli che hanno i termini noti tutti eguali a zero.


Sono ovvie le seguenti osservazioni.

a) Il sistema S omogeneo è compatibile una sua soluzione ( detta soluzione banale ) essendo
la n-pla (0,0,….,,0) .Ne segue che le due matrici A ed A’ hanno sempre lo stesso rango che
indichiamo con p .

b) se il rango p è eguale ad n il sistema ammette, in accordo con la proposizione 1.3, soltanto


la soluzione banale (0,0,….,,0).

n-p
Possiamo quindi supporre che sia p < n in modo che il sistema ammetta | K | soluzioni.

Denotiamo al solito con S l’insieme delle soluzioni del sistema S .

Ciò che distingue i sistemi omogenei rispetto a quelli non omogenei è la “qualità”

dell’insieme S delle soluzioni.

Infatti se il sistema è non omogeneo l’insieme S è un sottoinsieme di Kn .

Se invece il sistema è omogeneo si ha una importante proprietà espressa dalla seguente


74

Proposizione 2.1 Sia

⎧a11x1 + a12 x 2 .. + a1n x n = 0


⎪a x + a x .. + a x = 0

S = ⎨ 21 1 22 2 2n n

⎪..
⎪⎩a m1x1 + a m2 x 2 .. + a mn x n = 0

un sistema omogeneo con rango p. L’insieme S delle sue soluzioni è un sottospazio di Kn di

dimensione n-p.

Dimostrazione. Per rendere più semplice la dimostrazione usiamo la forma matriciale

AX=0

⎛ a 11 a 12 ........ a 1n ⎞ ⎛ x1 ⎞ ⎛0 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 ........ a 2n ⎟ ⎜x ⎟ ⎜0 ⎟
( dove al solito è A= ⎜ ⎟ X= ⎜ 2 ⎟ 0= ⎜ ⎟ )
... .. ..
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜a a ........ a ⎟ ⎜x ⎟ ⎜0 ⎟
⎝ m1 m2 mn ⎠ ⎝ n ⎠ ⎝ ⎠

per rappresentare il sistema dato.

⎛ y1 ⎞ ⎛ z1 ⎞
⎜ ⎟ ⎜ ⎟
⎜y ⎟ ⎜z ⎟
Se Y= ⎜ 2 ⎟ e Z= ⎜ 2 ⎟ sono due soluzioni del sistema allora è
.. ..
⎜ ⎟ ⎜ ⎟
⎜y ⎟ ⎜z ⎟
⎝ n ⎠ ⎝ n ⎠

AY = 0 e AZ = 0 da cui segue A( Y+Z ) = AY + AZ = 0 e questa mostra che anche


Y+Z è una soluzione del sistema. Se Y è una soluzione del sistema si ha AY = 0 se α
è uno scalare qualsiasi si ha A (α Y) = α AY = 0 e ciò mostra che anche α Y è una
soluzione .
75

Avendo provato che l’insieme S delle soluzioni di S ha le seguenti proprietà :

1) Y ∈S , Z ∈ S ⇒ Y+Z ∈ S
2) α ∈ K , Y ∈ S⇒ αY ∈ S

resta provato che S è un sottospazio di Kn . Proveremo ora che esso ha dimensione n-p .

Poiché A ha rango p per semplicità supporremo che le prime p righe e che le prime p
colonne di A siano indipendenti . L’insieme delle soluzioni del sistema S coincide allora con
l’insieme delle soluzioni del sistema ridotto S’ costituito dalle prime p equazioni di S .

⎧a11x1 + a12 x 2 + …. + a1n x n = 0


⎪a x + a x + … + a x = 0
⎪ 21 1 22 2 2n n
S’ = ⎨
⎪…
⎪a p1x1 + a p2 x 2 + … + a pn x n = 0

Per quanto detto al numero 1 di questo capitolo , ogni soluzione di S’ è determinata sulla base
della scelta dei valori yp+1 , yp+2 , ……, yn assegnati alle incognite xp+1 , xp+2 , ……, xn .
Sia allora

ζ p+1 = ( α1 , α2 , .., αp , 1 , 0,… ,0 )

la soluzione di S’ ottenuta assegnando alle incognite xp+1 , xp+2 , ……, xn i valori


(1, 0, 0,…,0)

ζ p+2 = ( β1 , β 2 , .., β p , 0 , 1,… ,0 )

la soluzione di S’ ottenuta assegnando alle incognite xp+1 , xp+2 , ……, xn i valori


(0, 1, 0,…,0)

e ….
76

ζn = ( γ1 , γ 2 , .., γ p , 0 , 0,… ,1 )

la soluzione di S’ ottenuta assegnando alle incognite xp+1 , xp+2 , ……, xn i valori


(0, 0, ,…,1)

Tali soluzioni sono n-ple indipendenti perché sono indipendenti gli n-p vettori numerici
(1, 0, 0,…,0) , (0, 1, 0,…,0) ,,,,,,,,,, (0, 0, ,…,1)

Sia ora Y = (y1 , y 2 , .., y p yp+1 , yp+2 , ……, yn ) una qualunque soluzione di S. Poiché

abbiamo provato che S è un sottospazio allora sono ancora soluzioni di S le seguenti n-ple

yp+1 ζ p+1 , yp+2 ζ p+2 , ….….., yn ζn

Ma sempre perché S è un sottospazio , sommando tra loro queste soluzioni si ottiene ancora

una soluzione . Ma la soluzione

ζ = yp+1 ζ p+1 + yp+2 ζ p+2 + , ….., + yn ζn

che si ottiene eseguendo questa somma , presenta anch’essa agli ultimi n-p posti i valori
yp+1 , yp+2 , ……, yn

ζ= ( …. … , yp+1 , yp+2 , ……, yn )

al pari di Y . Ne segue che è ζ=Y e ciò prova, per l’arbitrarietà di Y che le soluzioni

ζ p+1 , ζ p+2 , ….., ζn sono oltre che indipendenti anche un sistema di generatori per lo spazio

S. Lo spazio S ha quindi dimensione n-p e l’asserto è provato.


77

La proposizione ora provata non solo fornisce la dimensione dello spazio S delle soluzioni

del sistema S ma offre anche un metodo per determinare una sua base.

Facciamo un esempio.

Si vogliano determinare le soluzioni del seguente sistema omogeneo:

⎧2x + y + z + 2t = 0
S =⎨
⎩x + y + z + t = 0

La matrice di tale sistema

⎛ 2 , 1, 1, 2⎞
A = ⎜⎜ ⎟⎟
⎝ 1, 1, 1, 1 ⎠

⎛ 2, 1 ⎞
ha rango due risultando det ⎜⎜ ⎟⎟ = 1 e pertanto lo spazio S delle soluzioni è un
⎝ 1,1 ⎠

sottospazio di R4 di dimensione due. Una base di S si ottiene considerando le due soluzioni

di S che si ottengono assegnando alle incognite z e t una prima volta i valori ( 1 , 0 ) e


successivamente i valori ( 0 , 1 ). Troviamo quindi queste due particolari soluzioni .
Ponendo z = 1 e t = 0 , S diventa

⎧2x + y = − 1

⎩x + y = − 1

Applicando a tale sistema la regola di Cramer si trova x = 0 ed y = -1. Quindi la prima

soluzione di S è la quaterna ζ1 = ( 0 , -1 , 1, 0 )

Ponendo z = 0 e t = 1 , S diventa
78

⎧2x + y = - 2

⎩x + y = - 1

Applicando a tale sistema la regola di Cramer si trova x = -1 ed y = 0. Quindi la seconda

soluzione di S è la quaterna ζ2 = ( -1 , 0 , 0, 1 )

Lo spazio S delle soluzioni di S è quindi lo spazio generato dalle due quaterne trovate.

S= [( 0 , -1 , 1, 0 ) ,( -1 , 0 , 0, 1 ) ]

Ciò che ora faremo giustifica l’interesse mostrato per la risoluzione di un sistema omogeneo.

Sia assegnato un sistema di equazioni lineari non omogeneo

⎧a11x1 + a12 x 2 .. + a1n x n = c1


⎪a x + a x .. + a x = c
⎪ 21 1 22 2 2n n 2
S =⎨
⎪ ..
⎪⎩a m1x1 + a m2 x 2 .. + a mn x n = c m

e supponiamo sia compatibile in modo da avere interesse a ricercare le sue soluzioni.


Ponendo nel sistema S i termini noti c1 , c2 ,… , cn eguali a zero si ottiene un sistema
omogeneo

⎧a11x1 + a12 x 2 .. + a1n x n = 0


⎪a x + a x .. + a x = 0
⎪ 21 1 22 2 2n n
So ⎨
⎪..
⎪⎩a m1x1 + a m2 x 2 .. + a mn x n = 0

che è detto associato ad S .


Abbiamo gia’ visto che nel caso sia p=p’ = n il sistema S ha una sola soluzione che si
trova con la regola di Cramer. Se invece è p < n allora il sistema S ammette infinite soluzioni
ognuna delle quali va trovata assegnando a certe n-p incognite dei valori arbitrari ed applicando al
corrispondente sistema la regola di Cramer . Sembrerebbe così che per trovare tutte le soluzioni di
79

S sia necessario applicare la regola di Cramer molte volte ! Per fortuna non è così come ora
mostreremo.
Ci viene incontro la seguente

Proposizione 2.2 Sia assegnato un sistema

⎧a11x1 + a12 x 2 .. + a1n x n = c1


⎪a x + a x .. + a x = c

S = ⎨ 21 1 22 2 2n n 2

⎪..
⎪⎩a m1x1 + a m2 x 2 .. + a mn x n = c m

non omogeneo e compatibile . Tutte le soluzioni di S si ottengono sommando ad una sua soluzione
tutte le soluzioni del sistema

⎧a11x1 + a12 x 2 .. + a1n x n = 0


⎪a x + a x .. + a x = 0

So = ⎨ 21 1 22 2 2n n

⎪..
⎪⎩a m1x1 + a m2 x 2 .. + a mn x n = 0

omogeneo associato ad S .
Dimostrazione. Per rendere più semplice la dimostrazione usiamo la forma matriciale
AX = C e AX = 0 per rappresentare il sistema S ed il suo omogeneo associato. Indichiamo

inoltre con ζ una soluzione di S , con S l’insieme di tutte le soluzioni di S e con So il


sottospazio delle soluzioni di So .
Se η è una soluzione di So si ha A η = 0 . Poiché ζ è una soluzione di S si ha

A ζ = C ed allora si ha

A( ζ + η )= A ζ + Aη = C + 0 = C

Abbiamo così mostrato che addizionando alla soluzione ζ una soluzione di So si ottiene
ancora una soluzione di S . Se mostriamo che una qualunque soluzione di S si ottiene in questo
modo allora il teorema è provato. Sia quindi ζ’ una soluzione di S . Poiché ζ e ζ’ sono

soluzioni di S si ha A ζ = C e A ζ’ = C e quindi
80

A ( ζ’ - ζ ) = A ζ’ - A ζ = C -C=0

Pertanto η = ζ’ - ζ è una soluzione di So che sommata a ζ fornirà la soluzione ζ’


scelta.
In definitiva sommando a ζ tutte le soluzioni η di So si ottengono tutte le soluzioni di S e
l’asserto è così provato.
La proposizione ora provata risolve il problema che avevamo posto circa l’incombenza di dover
applicare la regola di Cramer molte volte per trovare le soluzioni di S.
Infatti per trovare ζ si applicherà la regola di Cramer una sola volta e per trovare le soluzioni
di So basterà trovare una sua base e per la sua determinazione si dovrà applicare la regola di
Cramer altre n-p volte.

Concludiamo tale numero esaminando come determinare in modo rapido le soluzioni di un


particolare sistema omogeneo che spesso incontreremo nelle applicazioni successive.

Si consideri un sistema omogeneo So con n-1 equazioni indipendenti ed n incognite .

⎧a11x1 + a12 x 2 .. + a1n x n = 0


⎪a x + a x .. + a 2n x n = 0
⎪ 21 1 22 2
S =⎨
⎪..
⎪⎩a n -1 ,1x1 + a n -1, 2 x 2 + … + a n -1, n x n = 0

Poichè il rango è n-1 la matrice

⎛ a 11 a 12 . ...... a 1n ⎞
⎜ ⎟
⎜ a 21 a 22 ..... a 2n ⎟
A= ⎜ ... ⎟
⎜ ... ⎟
⎜⎜ ⎟
⎝ a n -1 ,1 , a n -1, 2 ,… a n -1, n ⎟⎠

del sistema possiede almeno una sua sottomatrice quadrata d’ordine n-1 con il determinante
diverso da zero. Ora le soluzioni del sistema formano un sottospazio di dimensione 1 per cui per
determinare tutte le sue soluzioni basta determinare una sua soluzione (y1 , y2 ,…, yn ) non nulla.
Denotiamo con L1 , L2 , …, Ln le n matrici che si ottengono dalla matrice A cancellando
81

rispettivamente la prima , la seconda ,…, l’ultima colonna. Ognuna di tali matrici è quadrata
d’ordine n-1 e quindi di ognuna di esse si può calcolare il determinante. Indichiamo con

λ1 =det L1 , λ 2 = det L2 , … , λ n = det Ln


Come già osservato almeno uno dei numeri λ1 , λ2 , … , λ n non è zero . Vogliamo
provare che la n-pla non nulla

(y1 , y2 ,…, yn ) = ( λ1 , - λ 2 , … , (-1)n-1 λ n )

che si ottiene considerando gli n numeri ( λ1 , λ 2 , … , λ n ) ma presi a segno alterno è una

soluzione del sistema . Occorre provare che ( λ1 , - λ 2 , … , (-1)n-1 λ n ) è soluzione di ogni


equazione del sistema e che quindi se in ogni equazione del sistema si sostituiscono al posto delle
incognite (x1, x2, …., xn ) i numeri ( λ1 , - λ 2 , … , (-1)n-1 λ n ) si ottiene zero.
Vediamo.
Consideriamo le n-1 matrici quadrate d’ordine n , M1. M2 , … , M n-1, così ottenute:

M1 ha come prima riga la prima riga di A e le altre n-1 righe eguali alle righe di A.
M2 ha come prima riga la seconda riga di A e le altre n-1 righe eguali alle righe di A.

….
M n-1 ha come prima riga la riga di posto n-1 di A e le altre n-1 righe eguali alle righe di A.

⎛ ⎞
⎜ a 11 a 12 . ...... a 1n ⎟
⎜ ⎟
⎜ a 11 a 12 . ...... a 1n ⎟
M1 = ⎜ a 21 a 22 ..... a 2n ⎟
⎜ ... ⎟
⎜ ⎟
⎜ ... ⎟
⎜a , a a n -1, n ⎟⎠
⎝ n -1 ,1 n -1, 2 ,…
82

⎛ a 21 a 22 ....... a 2n ⎞
⎜ ... ⎟
⎜ ⎟
⎜ a 11 a 12 . ...... a 1n ⎟
M2 = ⎜ a 21 a 22 ..... a 2n ⎟
⎜ ... ⎟
⎜ ⎟
⎜ ... ⎟
⎜a , a a n -1, n ⎟⎠
⎝ n -1 ,1 n -1, 2 ,…
.
.
.
⎛ ⎞
⎜ a n -1 ,1 , a n -1, 2 ,… a ⎟
n -1, n
⎜ ⎟
⎜ a 11 a 12 . ...... a 1n ⎟
Mn-1 = ⎜ a 21 a 22 ..... a 2n ⎟
⎜ ... ⎟
⎜ ⎟
⎜ ... ⎟
⎜a , a a n -1, n ⎟⎠
⎝ n -1 ,1 n -1, 2 ,…

Ognuna di tali matrici avendo ciascuna due righe eguali ha il determinante eguale a zero.

Sviluppando det Mi i = 1,2,.. , n-1 secondo gli elementi della prima riga si ha :

det Mi = ai1 h1 + ai2 h2 + …, + ain hn = 0

avendo indicato con (h1, h2 ,…, , hn ) i complementi algebrici degli elementi della prima riga .
Ma i numeri ( λ1 , - λ 2 , … , (-1)n-1 λ n ) sono esattamente i complementi algebrici degli
elementi della prima riga e quindi si ha l’asserto.

Concludiamo con un esempio .

Si vogliano determinare le soluzioni del seguente sistema omogeneo.

⎧2x + 2y + 3z = 0
S= ⎨
⎩2x + y - 4z = 0

Questo sistema ha due equazioni indipendenti e tre incognite e quindi le terne che lo soddisfano
costituiscono un sottospazio di R3 di dimensione 1. Una terna non nulla che quindi fornisce una
base per lo spazio delle soluzioni si ottiene considerando i minori d’ordine due e presi a segno
alterno della matrice
83

⎛ 2, 2, 3⎞
A = ⎜⎜ ⎟⎟
⎝ 2 , 1, - 4 ⎠

dei coefficienti. Quindi una base per lo spazio delle soluzioni è la terna ( -11 , 14 , -2 ) . Poiché
tale spazio ha dimensione 1 le sue soluzioni si ottengono considerando la terna ( -11 , 14 , -2 ) e
tutte quelle ad essa proporzionali.
84

C A P I T O L O IV

Prodotti scalari
85

1. Prodotti scalari.

In questo capitolo Vn denoterà sempre uno spazio vettoriale di dimensione n definito sul
campo reale. Un prodotto scalare in Vn è una funzione

s : Vn x Vn → R

di Vn x Vn in R , simmetrica e bilineare , cioè avente le seguenti proprietà:

1. s( v , w ) = s( w , v )

2. s( v+v’ ,w ) = s( v, w ) + s( v’, w )

3. s(α v , w) = α s( v , w )

per ogni coppia di vettori v e w e per ogni scalare α .

Il numero reale s(v,w) associato da s alla coppia ordinata (v,w) è chiamato prodotto
scalare di v e w .

Dalle proprietà 1 , 2, 3 segue facilmente che s verifica inoltre le seguenti proprietà

2’. s( v , w+w’) = s( v, w ) + s( v , w’)

3’. s( v , α w) = α s( v , w )

e ciò giustifica il termine bilineare dato ad s.


Inoltre dalla 3’ segue che

s(v ,-w) = s(v , (-1)w ) = - s (v ,w )

Facilmente possiamo provare ora la seguente

Proposizione 1.1 Il prodotto scalare di s(v , w) di v con w è zero se uno dei due vettori è il
vettore nullo.
86

Dimostrazione. Supponiamo ad esempio sia w = 0 . Si ha

s(v ,0) = s(v , a + (-a))= s(v ,a) + s(v ,-a)= s(v,a) – s(v,a) = 0

Il prodotto scalare s si dice definito positivo se vale la seguente ulteriore proprietà

4. s(v , v) ≥ 0 ed inoltre s(v , v) = 0 se e solo se è v = 0

cioè :
il prodotto scalare di un vettore v con se stesso è un numero non negativo ed è zero se e solo se v
è il vettore nullo.

Ci sono due esempi importanti.

Esempio 1. Si consideri lo spazio vettoriale Rn delle n-ple ordinate di numeri reali. Come
già detto, si chiama prodotto scalare dei vettori a = ( a1, a2,….,an) e b = ( b1, b2,….,bn) il
numero reale

< a , b > = a1, b1 + a2 b2 + … + an bn

che si ottiene eseguendo la somma dei prodotti degli elementi di egual posto. Si verifica facilmente
che la funzione

< > : Rn x Rn → R

sopra definita è un prodotto scalare definito positivo in Rn . Tale prodotto scalare è chiamato
standard o euclideo.

Esempio 2 . Si consideri un punto A dello spazio reale e sia VA l’insieme di tutti i


segmenti orientati AP di primo estremo A. Come già visto in precedenza VA è uno spazio
vettoriale sul campo reale di dimensione tre .In tale spazio vettoriale si definisce prodotto scalare
dei vettori v = AP e w = AP’ il seguente numero reale

s ( v , w ) = | AP | | AP’| cos ϑ
87

avendo indicato con | AP | e | AP’| le lunghezze dei segmenti AP ed AP’ e con ϑ l’angolo
formato dalle rette AP ed AP’ .
Si prova che la funzione s : VA x VA → R sopra definita è un prodotto scalare definito positivo
dello spazio vettoriale VA .
Riferendoci a tale esempio geometrico osserviamo quanto segue : se v = AP è un vettore
si ha in base alla definizione :

s ( v , v ) = | AP | 2

Da cui segue quindi che

AP = s(v, v)
(i)

Inoltre se v = AP e w = AP’ sono due vettori non nulli si ha :

(ii) v è ortogonale a w se e soltanto se risulta s( v , w ) = 0.

Le proprietà (i) e (ii) ora illustrate suggeriscono le seguenti definizioni .

Sia Vn uno spazio vettoriale reale dotato di un prodotto scalare s definito positivo.

Chiameremo lunghezza o norma di un vettore v il seguente numero reale | v | non negativo

v = s(v, v)
(1 . 1)

Inoltre se v e w sono due qualunque vettori di Vn diremo che essi sono ortogonali e
scriveremo v ┴ w se risulta s( v , w ) = 0. In simboli

(1.2) v ┴ w ⇔ s( v , w ) = 0
88

Ovviamente per quanto già provato nella proposizione 1.1 si ha :

Proposizione 1.2 Il vettore nullo ha lunghezza zero ed è ortogonale ad ogni altro vettore.

Se v e w sono due vettori tra loro ortogonali anche i vettori α v e βw , per ogni coppia
di scalari α e β , sono tra loro ortogonali. Risulta infatti

s( α v , βw) = αβ s( v , w ) = 0.

Quindi “ accorciando “ o “ allungando” due vettori v e w tra loro ortogonali essi


restano ortogonali.

1
v
Quando si moltiplichi un vettore non nullo v per il numero k = il vettore

1
v
w = v che si ottiene ha lunghezza eguale ad 1 . Infatti risulta

1
w = s(w, w) s(kv, kv) = 2
k s(v, v ) s(v, v) = v
= =k | v | = 1.

Di qui in avanti Vn è uno spazio vettoriale reale dotato di un prodotto scalare s definito
positivo.

Molto importante è la seguente

Proposizione 1.3 Siano v1 , v2 ,……vh h vettori , ciascuno non nullo, e a due a due
ortogonali. Allora i vettori v1 , v2 ,……vh risultano linearmente indipendenti.
Dimostrazione. Siano α 1, α 2 ,…… α h h scalari per i quali risulta

α 1v1 + α 2v2 +……+ α hvh = 0

Se proviamo che è α 1=α 2 =…… =α h = 0 allora i vettori v1 , v2 ,……vh sono indipendenti


e l’asserto sarà provato. Proviamo ad esempio che è α 1 = 0 . Si ha , tenendo conto della
proposizione 1.1 e della bilinearità di s ,

(*) 0 = s ( 0 , v1 ) = s ( α 1v1 + α 2v2 +……+ α hvh , v1 ) =


89

= α 1 s ( v1 , v1 ) + α 2 s ( v2 , v1 ) +… …….+ α h s ( vh , v1 )

ora essendo per ipotesi v1 non nullo ed ortogonale a tutti gli altri vettori si ha

s ( v1 , v1 ) > 0 e s ( v2 , v1 ) =… = s ( vh , v1 ) = 0 .

Dalla relazione (*) trovata segue allora α 1 s ( v1 , v1 ) = 0 e quindi α 1 = 0 essendo

s ( v1 , v1 ) > 0 .

Con lo stesso ragionamento , attraverso il calcolo di s ( 0 , v2 ) , …, s ( 0 , vh ) si prova che è


anche α 2= ……=α h = 0 e quindi l’asserto.

La proposizione ora provata mostra che se siamo in grado di trovare nello spazio Vn , n
vettori non nulli e1, e2 , …., en a due a due ortogonali allora tali vettori essendo indipendenti
costiuiscono una base. Una siffatta base sarà detta ortogonale . Inoltre come abbiamo già osservato
è anche possibile rendere i vettori e1, e2 , …., en ciascuno di lunghezza 1 senza alterare la
reciproca ortogonalità . Una base e1, e2 , …., en che abbia i vettori a due a due ortogonali e
ciascuno di lunghezza 1 è detta ortonormale.

Vedremo in seguito che è molto utile disporre di una base ortonormale. Ma è sempre
possibile costruire una base ortonormale ?

Viene incontro a questa nostra esigenza la seguente proposizione la quale offre un


procedimento costruttivo per costruire una base ortogonale e quindi una base ortonormale .

Proposizione 1.4 Sia Vn uno spazio vettoriale reale dotato di un prodotto scalare s
definito positivo. Se e1, e2,…, et sono t (1 ≤ t < n ) vettori non nulli e a due a due ortogonali è
possibile determinare un vettore non nullo e t+1 ortogonale ai vettori e1, e2,…, et .
Dimostrazione . Sia wt+1 un vettore non appartenente al sottospazio H = [e1, e2,…, et ]
generato dai vettori e1, e2,…, et .Poichè il vettore wt+1 non appartiene al sottospazio
H = [e1, e2,…, et ] , per ogni scelta degli scalari α 1, α 2,……, α t il vettore
et+1 = wt+1 + α 1e1 + α 2e2 +……+ α t et
non è nullo e non appartiene ad H . Vediamo se è possibile scegliere gli scalari α 1, α 2,……, α t in
modo che il vettore et+1 risulti ortogonale ai vettori e1, e2,…, et .
90

Tenendo conto della bilinearità del prodotto scalare e del fatto che i vettori e1, e2,…, et sono a
due a due ortogonali si ha :

s ( et+1 , e1 ) = s ( wt+1 , e1 ) + α 1 s ( e1 , e1 )
s ( et+1 , e2 ) = s ( wt+1 , e2 ) + α 2 s ( e2, e2 )
…..
……
s ( et+1 , et ) = s ( wt+1 , et ) + α t s ( et , et )

Pertanto il vettore et+1 risulterà ortogonale ai vettori e1, e2,…, et cioè risulterà

s ( et+1 , e1 ) = s ( et+1 , e2 ) = ….= s ( et+1 , et ) = 0

quando si scelga :

s(w t+1 , e1 )
α1 = -
s(e1 , e1 )

s(w t+1 , e 2 )
α2 = -
s(e 2 , e 2 )
…..
…..

s(w t+1 , e t )
αt = -
s(e t , e t )

Ovviamente quando ai vettori e1, e2,…, et sia stato aggiunto il vettore et+1 ora costruito si
ottiene un insieme di t+1 vettori e1, e2,…, et ,et+1 ancora a due a due ortogonali sui quali si
può quindi ripetere il procedimento ora illustrato così da costruire un altro vettore et+2 ortogonale
ad essi .
Dopo n-t passi si perverrà quindi a costruire n vettori e1, e2,…, en a due a due ortogonali e
cioè, come si voleva, una base ortogonale .
Indaghiamo ora perché sia utile disporre nello spazio vettoriale Vn dotato di un prodotto
scalare s definito positivo, di un riferimento ortonormale cioè di una sua base B = ( e1, e2,…, en )
91

ordinata e ortonormale.
Siano v e w due qualsiasi vettori di Vn . Poichè B = ( e1, e2,…, en ) è una base esistono
opportuni scalari ( α 1, α 2,……, α n ) e (β 1, β 2,……, β n ) per cui si abbia

v = α 1e1 + α 2e2 + …+ α n en , w = β 1e1 + β 2e2 + …+ β n en

Tenendo conto che la base B è ortonormale e che quindi è :

s ( ei , ei ) = 1 per ogni i = 1, 2 ,…, n

s ( ei , ej ) = 0 per i ≠ j
si ha
s ( v , w ) = α 1 β 1 + α 2 β 2+ ……+ α n β n .

Concludendo, attraverso l’uso del riferimento ortonormale B, abbiamo reso semplice ed


elementare il calcolo del numero s ( v , w ) risultando tale prodotto scalare di v e w eguale al
prodotto scalare euclideo delle n-ple ( α 1, α 2,……, α n ) e (β 1, β 2,……, β n ) delle loro
coordinate nel riferimento B.

Sia sempre Vn uno spazio vettoriale reale dotato di un prodotto scalare s definito positivo .

Sia ora H un sottospazio di Vn .

Proviamo la seguente

Proposizione 1.5 . Il sottoinsieme

H ┴ = { w ∈ Vn : w ┴ v per ogni v ∈ H }

costituito dai vettori w ortogonali ad ogni vettore di H è un sottospazio . I sottospazi H ed H ┴


sono tra loro supplementari .
Dimostrazione . Il sottoinsieme H┴ è non vuoto perché di esso fa parte il vettore nullo.
Siano w e w’ due vettori di H ┴ . Per ogni vettore v di H si ha
s( w + w’ , v ) = s ( w , v ) + s ( w’ , v ) = 0
e questa prova , per l’arbitrarietà di v , che anche w + w’ è un vettore di H ┴ .
92

Siano w un vettore di H ┴ e sia α un numero reale . Risulta , per ogni vettore v di H ,


s (α w , v ) = α s ( w , v ) = 0
e questa prova , per l’arbitrarietà di v, che anche α w è un vettore di H ┴ .

Abbiamo così provato che H è un sottospazio. Proviamo ora che H ed H ┴sono tra loro
supplementari . L’asserto è ovvio se H è banale . Supponiamo quindi H non banale . Sia t = dimH
e sia e1, e2,…, et una base ortogonale di H. Completiamo la base e1, e2,…, et ortogonale di H
in una base B = { e1, e2,…, et et ,et+1 …. en } ortogonale di Vn aggiungendo opportuni n-t
vettori et+1 …. en . In forza della proposizione 5.2 del capitolo I l’asserto sarà provato se
mostriamo che H ┴ = [ et+1 …. en ].

Denotiamo con L = [ et+1 …. en ] il sottospazio generato dai vettori et+1 …. en . Se w è un


vettore di L si ha w = β t+1et+1 + ……+ β n en e conseguentemente per ogni vettore
v = α 1e1 + α 2e2 + …+ α n et di H si ha

s ( w , v ) = s(β t+1et+1 + ……+ β n en , α 1e1 + α 2e2 + …+ α n et ) = 0

essendo s ( ei , ej ) = 0 per i ≠ j . Pertanto per l’arbitrarietà di v, il vettore w è un vettore


di H ┴ .Abbiamo così provato che è L ⊆ H ┴ . Viceversa sia w un vettore di H ┴ . Poiché B è una
base si ha che esistono opportuni scalari α 1,α 2, … α n per cui risulti

(*) w = α 1e1 + α 2e2 + …+ α n et + α t+1et+1 + ……+ α n en

Poichè w è un vettore di H ┴ esso risulta ortogonale ai vettori e1 ,e2 …….et di H .

Si ha così s ( w , ei ) = 0 per ogni i = 1,2,…, t .

Ma poiché è 0 = s ( w , ei ) = α i s (ei , ei )

si ha α i = 0 per ogni i = 1,2,…, t essendo s (ei , ei ) > 0 .

Ma se α 1=α 2= …=α t = 0 allora da (*) segue

w = α t+1et+1 + ……+ α n en

la quale mostra che w è un vettore di L . Avendo quindi provato che è anche H ┴ ⊆ L si ha

L = H ┴ e la proposizione è provata.

Il sottospazio H ┴ ora illustrato è detto complemento ortogonale di H .


93

Osserviamo infine che è facile provare la seguente equivalenza

Proposizione 1.6 Sia Vn uno spazio vettoriale reale dotato di un prodotto scalare s
definito positivo . Siano e1, e2,…, et , t suoi vettori ed H = [e1, e2,…, et ] il sottospazio da essi
generato. Un vettore w è ortogonale a ciascuno dei vettori e1, e2,…, et se e solo se w
appartiene al sottospazio H ┴ .

Concludiamo con qualche utile applicazione delle cose provate in questo numero.

Si consideri un sistema omogeneo di m equazioni lineari ciascuna in n incognite.

⎧a11x1 + a12 x 2 .. + a1n x n = 0


⎪a x + a x .. + a x = 0
⎪ 21 1 22 2 2n n

⎪..
⎪⎩a m1x1 + a m2 x 2 .. + a mn x n = 0

e sia

⎛ a 11 a 12 ........ a 1n ⎞
⎜ ⎟
⎜ a 21 a 22 ........ a 2n ⎟
A= ⎜ ⎟
...
⎜ ⎟
⎜a a ........ a ⎟
⎝ m1 m2 mn ⎠

la matrice del sistema.

Una n-pla ( y1, y2, …, yn ) è soluzione del sistema S se e solo se essa è un vettore di Rn

ortogonale ai vettori riga della matrice A. Tenendo conto della proposizione 1.6 , l’insieme S
delle soluzioni di S coincide quindi col sottospazio ortogonale H ┴ del sottospazio

H = [a1, a2,…, am ] generato dalle righe di A.

Se la matrice A ha rango p allora dimH = p e così dim S = dim H ┴ = n-p.

Abbiamo così ritrovato il risultato già stabilito per i sistemi omogenei nella proposizione 2.1
del capitolo III.
94

CAPITOLO V

Triangolazione di una matrice quadrata e


diagonalizzazione di un endomorfismo.
95

1. Triangolazione di una matrice quadrata.

Abbiamo visto nei capitoli precedenti quanto sia utile il calcolo del determinante di una
matrice quadrata A d’ordine n ad elementi su un fissato campo K. Allo stesso tempo è apparso
chiaro come tale calcolo sia poco agevole quando l’ordine n di A sia molto grande.
Vogliamo ora illustrare un procedimento, traducibile in un programma per il computer ,che
consenta di semplificare tale calcolo.
Sia quindi

⎛ a 11 a 12 ……………a 1n ⎞
⎜ ⎟
⎜ a 21 a 22 ……………a 2n ⎟
A = ⎜ ……….. ⎟
⎜ ⎟
⎜ ⎟
⎜ ⎟
⎝ a n1 a n2 ……………a nn ⎠

una matrice quadrata d’ordine n ( n ≥ 2 ) ad elementi in un fissato campo K.


Supporremo ovviamente che nessuna riga di A e nessuna colonna di A sia il vettore nullo
altrimenti è già detA = 0.
Per comodità di scrittura indicheremo con a1 , a2, …., an le n righe di A.
Abbiamo già osservato parlando delle proprietà dei determinanti , che quando nella matrice A una
sua riga ai venga sostituita con la nuova riga a i + α a j , con α scalare non nullo e j ≠ i , si
ottiene una nuova matrice A’ che differisce da A solo nella riga di posto i ma che ha lo stesso
determinante di A. Quando si agisce sulla matrice A nel modo ora indicato si dice che si è effettuata
su A una trasformazione elementare sulle sue righe. Noi opereremo per semplicità ed omogeneità
solo sulle righe di A pur consapevoli che il procedimento che illustreremo potrebbe essere
effettuato anche sulle colonne di A.
Useremo questa simbologia

⎛ a 11 a 12 …………… a 1n ⎞ ⎛ a 11 a 12 …………… a 1n ⎞
⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 ……………a 2n ⎟ ⎜ a 21 a 22 ………… … a 2n ⎟
⎜ ⎟ ⎜ ⎟
⎜ ………..a i ....... ⎟ ---- T i ------- a i + α a j ------ > ⎜ …… ..a i + α a j. .... ⎟
⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎜ a a …………… a ⎟ ⎜ a a …………… a ⎟
⎜ n1 n2 nn ⎟ ⎜ n1 n2 nn ⎟
⎝ ⎠ ⎝ ⎠
96

per indicare che stiamo trasformando la riga ai di posto i con la nuova riga a i + α a j .

Vogliamo ora provare che

Proposizione 1.1 Con un numero finito di trasformazioni elementari sulle righe è possibile
trasformare la matrice A in una matrice B che ha lo stesso determinante di A ma che ha l’ultima
colonna eguale a ( 0, 0, …, 1 ).
In simboli

⎛ a 11 a 12 ……………a 1n ⎞ ⎛ b11 b12 …………… 0 ⎞


⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 ……………a 2n ⎟ ⎜ b 21 b 22 …………… 0 ⎟
A= ⎜ ……….. ⎟ -- T ----- T …. ----- T --- > B= ⎜ ⎟
1 2 k
⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎝ a n1 a n2 ……………a nn ⎠ ⎝ b n1 b n2 ……………1 ⎠

Una volta provata la proposizione 1.1 possiamo evidenziare i vantaggi che ne derivano.
Il vantaggio è che il determinante della matrice B è eguale al determinante della matrice H che si
ottiene cancellando nella matrice B l’ultima sua riga e l’ultima sua colonna.
Quindi con questo primo passo abbiamo ricondotto il calcolo del determinante di A al calcolo del
determinante di H che però ha ordine n-1.
Se la matrice H non possiede una riga o una colonna nulla possiamo ripetere sulla matrice H il
procedimento usato per trasformare A in B e così il determinante di H sarà eguale al determinante
di una matrice H’ d’ordine n-2. Avremo quindi

det A = det B = det H= det H’

Possiamo così ,iterando il procedimento un certo numero di volte, ricondurre il calcolo del
determinante di A , forse molto grande , al calcolo del determinante di una matrice A’ , abbastanza
piccola.

Proviamo quindi la proposizione 1.1


97

Dimostrazione . Iniziamo col caso più favorevole:


Caso 1 : ann = 1
Se ann = 1 allora il risultato si raggiunge facilmente. Infatti se la riga a i di posto i
( i < n ) ha l’ultimo elemento diverso da zero ed eguale ad h allora sommando alla riga a i

l’ultima riga moltiplicata per -h si ottiene una nuova matrice B che ha l’elemento bin = 0 ,come
desiderato.
In simboli :
⎛ a 11 a 12 …………… a 1n ⎞ ⎛ a 11 a 12 …………… a 1n ⎞
⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 ……………a 2n ⎟ ⎜ a 21 a 22 ……………a 2n ⎟
⎜ ⎟ ⎜ ⎟
⎜ ………..a i ....... h ⎟ ---- T i ------- a i + -h a n ------ > ⎜ .......... .......... .......... ..... 0 ⎟
⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎜ a n1 a n2 …………… 1 ⎟⎟ ⎜ a a ……………. 1 ⎟
⎜ ⎜ n1 n2 ⎟
⎝ ⎠ ⎝ ⎠

Quindi se nell’ultima colonna di A ci sono s elementi diversi da zero ( incluso 1 ) con s-1
trasformazioni elementari sulle sue righe si può pervenire ad una matrice B con l’ultima colonna
eguale a (0,0,…,1) come richiesto.

Caso 2 : ann = 0
Se ann = 0 allora poiché l’ultima colonna di A non è il vettore nullo esiste i , i < n tale
che sia ain ≠ 0 . Posto h = ain allora sommando all’ultima riga di A la riga a i moltiplicata per
1
si ottiene una matrice B che l’elemento bnn = 1
h
In simboli :

⎛ a 11 a 12 ……………a 1n ⎞ ⎛ a 11 a 12 …………… a 1n ⎞
⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 ……………a 2n ⎟ ⎜ a 21 a 22 ……………a 2n ⎟
⎜ ⎟ ⎜ ⎟
⎜ ………..a i ....... h ⎟ ---- T n ------- a n + 1 a i ------ > ⎜ ………..a i ....... h ⎟
⎜ ⎟ h ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎜ a a …………… 0 ⎟ ⎜ .......... ... ……………. 1 ⎟
⎜ n1 n2 ⎟ ⎜ ⎟
⎝ ⎠ ⎝ ⎠

Dopo questo primo passo ci siamo quindi ricondotti al caso 1 già esaminato.

Caso 3 : ann ≠ 0 e ann ≠ 1 ed esiste i < n tale che sia ain ≠ 0 .


Posto a = ann e h = ain allora sommando all’ultima riga di A la riga a i moltiplicata
98

− (a − 1)
per si ottiene una matrice B che l’elemento bnn = 1.
h
In simboli :

⎛ a 11 a 12 …………… a 1n ⎞ ⎛ a 11 a 12 …………… a 1n ⎞
⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 ……………a 2n ⎟ ⎜ a 21 a 22 ……………a 2n ⎟
⎜ ⎟ ⎜ ⎟
⎜ ………..a i ....... h ⎟ ---- T n ------- a n + − (a − 1) a i ------ > ⎜ ………..a i ....... h ⎟
⎜ ⎟ h ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎜ a a …………… a ⎟ ⎜ .......... ... ……………. 1 ⎟
⎜ n1 n2 ⎟ ⎜ ⎟
⎝ ⎠ ⎝ ⎠

Dopo questo primo passo ci siamo quindi ricondotti al caso 1 già esaminato.
Infine resta il
Caso4 : ann ≠ 0 e ann ≠ 1 e per ogni i < n è ain = 0 .
Sommando alla prima riga di A l’ultima riga di A si ricade nel caso 3.

In simboli

⎛ a 11 a 12 ……………..0 ⎞ ⎛ .......... . ……………a nn ⎞


⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 …………….0 ⎟ ⎜ a 21 a 22 ……………0 ⎟
⎜ ⎟ ---- T ------- a + a ------ > ⎜ ⎟
1 1 n
⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎝ a n1 a n2 …………… a nn ⎠ ⎝ a n1 a n2 ……………. a nn ⎠

Riepilogando, il procedimento ora illustrato applicato alla matrice A conduce alla matrice B

⎛ a 11 a 12 ……………a 1n ⎞ ⎛ b 11 b 12 …………… 0 ⎞
⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 ……………a 2n ⎟ ⎜ b 21 b 22 …………… 0 ⎟
A= ⎜ ……….. ⎟ -- T ----- T …. ----- T --- > B=
1 2 k
⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎝ a n1 a n2 ……………a nn ⎠ ⎝ b n1 b n2 ……………1 ⎠

Detta H la matrice formata dalle prime n-1 righe e n-1 colonne di B


99

⎛ b11 b12 …………… b1, n -1 ⎞


⎜ ⎟
⎜ b 21 b 22 …………… b 2, n -1 ⎟
⎜ ⎟
H= ⎜ ⎟
⎜ ⎟
⎜ ⎟
⎜ b n -1,1 b n -1,2 ……… b n -1, n -1 ⎟
⎝ ⎠

si ha det A = det B = det H.


Se H ha una riga o una colonna nulla è detH = 0. In caso contrario possiamo ripetere il
procedimento sulla matrice H “ normalizzandola “ cioè rendendo l’ultima sua colonna eguale a
( 0,0,…,1).
Ora ogni trasformazione elementare fatta sulle righe di H può ottenersi eseguendo la stessa
operazione sulle corrispondenti righe di B che presentano ormai l’ultimo numero eguale a zero.
Questa osservazione è in sostanza la dimostrazione della seguente proposizione che è corollario
della proposizione 1.1.
Supposto che tutte le matrici H che di volta in volta appaiono si possono normalizzare allora

Proposizione 1. 2 Con un numero finito di trasformazioni elementari sulle righe è possibile


trasformare la matrice A in una matrice B triangolare che ha lo stesso determinante di A che ha
b11= detA e bii=1 i ≠ 1
In simboli

⎛ a 11 a 12 ……………a 1n ⎞ ⎛ b 11 0 …………… 0 ⎞
⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 ……………a 2n ⎟ ⎜ b 21 1 …………… 0 ⎟
A= ⎜ ……….. ⎟ -- T ----- T …. ----- T --- > B=
1 2 k
⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎝ a n1 a n2 ……………a nn ⎠ ⎝ b n1 b n2 ……………1⎠
100

2. Diagonalizzazione di un endomorfismo.

Per ciò che segue è utile introdurre alcune semplici notazioni . Sia Vn uno spazio vettoriale
di dimensione finita n sul campo K. Sia

⎛ α 1 β 1 .... . γ 1 ⎞
⎜ ⎟
⎜ α 2 β 2 .....γ 2 ⎟
A= ⎜ ⎟
.....
⎜ ⎟
⎜ α β ......γ ⎟
⎝ n n n ⎠

una matrice quadrata d’ordine n ad elementi nel campo K. Se ( v1 , v2 ,….,vn) è una n-pla ordinata
di vettori di Vn col simbolo

⎛ α1 β1 .... . γ1 ⎞
⎜ ⎟
⎜ α 2 β 2 .....γ 2 ⎟
( v1 , v2 ,….,vn) ⎜ ⎟ = ( w1 , w2 ,….,wn)
.....
⎜ ⎟
⎜ α β ......γ ⎟
⎝ n n n⎠

vogliamo rappresentare la n-pla di vettori ( w1 , w2 ,….,wn) dove è :

w1 = α1 v1 + α 2 v2 +….+ α n vn

w2 = β1 v1 + β 2 v2 +….+ β n vn

….

wn = γ1 v1 + γ 2 v2 +……+ γ n vn .

Sia ora M(n, K) l’insieme delle matrici quadrate d’ordine n ad elementi su un fissato
campo K.
Le matrici quadrate non degeneri di M(n, K) cioè quelle che hanno il determinante diverso
da zero formano gruppo rispetto al prodotto (righe per colonne ) e tale gruppo , detto gruppo
lineare , viene indicato col simbolo GL (n,K).
Due matrici A’ e A di M(n, K) sono dette simili se esiste una matrice P non degenere tale che
risulti :
101

A’ = P-1 A P

Sia Vn uno spazio vettoriale sul campo K di dimensione finita n e sia

f : Vn ⎯
⎯→ Vn

una funzione lineare di Vn in sé . Un vettore v non nullo è chiamato un autovettore per la


funzione f se è trasformato da f in un vettore ad esso proporzionale , risulta cioè

(2.1) f (v ) = λ v

Lo scalare λ che figura nella (2.1) è chiamato l’autovalore dell’ autovettore v ed in ogni caso
esso è chiamato un autovalore della funzione f .
Se λ è un autovalore della funzione f possiamo considerare tutti gli autovettori di f che
hanno lo scalare λ come loro autovalore.
Denotiamo quindi con Vλ il seguente sottoinsieme di Vn

Vλ = { v ∈ Vn : f (v ) = λ v }

Il vettore nullo pur non essendo un autovettore per f verifica la (2.1) e quindi esso
appartiene al sottoinsieme Vλ .
Il sottoinsieme Vλ , come è facile verificare , è un sottospazio di Vn . Esso è chiamato
l’ autospazio corrispondente all’autovalore λ . I vettori non nulli di Vλ sono quindi tutti gli
autovettori di f che hanno lo scalare λ come autovalore.
La dimensione del sottospazio Vλ è chiamata la molteplicità geometrica dell’autovalore λ .
In seguito si troveranno le giustificazioni del perché abbiamo chiamato la dimensione di Vλ
in questo modo. Poiché gli autovettori sono vettori non nulli allora è sempre, per ogni autovalore λ,

dim Vλ ≥ 1

Ovviamente gli autovettori di autovalore zero sono tutti e soli i vettori non nulli del nucleo di f e
quindi essi esistono solo quando la funzione non è iniettiva.
102

Sia

⎛ a 11 a 12 .... a 1n ⎞
⎜ ⎟
⎜ a 21 a 22 .....a 2n ⎟
A= ⎜ ⎟
.....
⎜ ⎟
⎜ a a .....a ⎟
⎝ n1 n2 nn ⎠

una matrice quadrata d’ordine n ad elementi nel campo K . Denotiamo con Kn lo spazio vettoriale
numerico di dimensione n su K . Se

⎛ x1 ⎞
⎜ ⎟
⎜x2 ⎟
X= ⎜ ⎟
.
⎜ ⎟
⎜x ⎟
⎝ n⎠
è un elemento di Kn eseguendo il prodotto (righe per colonne ) di A per X si ottiene un altro
vettore Y

⎛ y1 ⎞ ⎛ a 11 a 12 .... a 1n ⎞ ⎛ x1 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜y ⎟ ⎜ a 21 a 22 .....a 2n ⎟ ⎜x2 ⎟
Y = ⎜ 2 ⎟= ⎜ ..... ⎟ ⎜. ⎟
.
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜y ⎟ ⎜ a a .....a ⎟ ⎜x ⎟
⎝ n⎠ ⎝ n1 n2 nn ⎠ ⎝ n⎠

di Kn , dove è esplicitamente :

⎧ y1 = a 11 x 1 + a 12 x 2 + ….. . + a 1n x n
⎪ y = a x + a x + ….. + a x
⎪ 2 21 1 22 2 2n n

⎪ ……..
⎪⎩ y n = a n1 x 1 + a n2 x 2 + ….. + a nn x n

La matrice A ci ha quindi consentito di costruire una funzione

A : Kn ⎯
⎯→ Kn
103

di Kn in sé che indicheremo egualmente con la lettera A in quanto saremo sempre in grado di


comprendere dal contesto se la lettera A rappresenta la matrice o la funzione che essa definisce.
La funzione A ora definita è lineare in quanto risulta , per ogni coppia X , X’ di vettori di Kn e
per ogni scalare α di K ,

1 . A( X + X’ ) = AX + AX’
2. A (α X ) = α ( AX )

Indicheremo con u1 , u2 , …. , un i vettori della base canonica di Kn

⎛1 ⎞ ⎛ 0⎞ ⎛ 0⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ 0⎟ ⎜1 ⎟ ⎜ 0⎟
u1 = ⎜ ⎟ , u2 = ⎜ ⎟ , …….., un = ⎜. ⎟
. .
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ 0⎟ ⎜ 0⎟ ⎜1 ⎟
⎝ ⎠ ⎝ ⎠ ⎝ ⎠

e con a1 , a 2 , …, a n i vettori colonna della matrice A .

Poiché una funzione lineare trasforma un sistema di generatori di Kn in un sistema di generatori


dello spazio immagine allora i vettori a1 , a 2 , …, a n essendo i trasformati tramite la funzione
lineare A dei vettori u1 , u2 , …. , un costituiscono un sistema di generatori per lo spazio immagine
della funzione lineare A . Ne segue che se la matrice A ha rango p allora lo spazio immagine ha
dimensione p e conseguentemente il nucleo della funzione A ha dimensione n-p. Se quindi A è
una matrice non degenere e quindi di rango n , la funzione lineare A è biettiva ed è quindi un
isomorfismo.
Proviamo che le uniche funzioni lineari di Kn in sé si ottengono come ora abbiamo descritto cioè
in corrispondenza ad una matrice quadrata A d’ordine n .
Sia quindi F : Kn → Kn una funzione lineare di Kn in sé .

Siano
⎛ a11 ⎞ ⎛1 ⎞ ⎛ a12 ⎞ ⎛ 0⎞ ⎛ a1n ⎞ ⎛ 0⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
1 ⎜ a 21 ⎟ ⎜ 0⎟ ⎜ a 22 ⎟ ⎜1 ⎟ a ⎜ 0⎟
a= =F ⎜. ⎟
2
a= = F ⎜ ⎟ , …….., a = ⎜ 2n ⎟ = F
n
⎜. ⎟
⎜. ⎟ ⎜. ⎟ . ⎜. ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ 0⎟ ⎜ ⎟ ⎜1 ⎟
⎝ a n1 ⎠ ⎝ ⎠ ⎝ an2 ⎠ ⎝ 0⎠ ⎝ a nn ⎠ ⎝ ⎠
104

i vettori che F associa ai vettori

⎛1 ⎞ ⎛ 0⎞ ⎛ 0⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ 0⎟ ⎜1 ⎟ ⎜ 0⎟ n
u1 = ⎜ ⎟ , u2 = ⎜ ⎟ , …….., un = ⎜ . ⎟ della base canonica di K .
. .
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ 0⎟ ⎜ 0⎟ ⎜1 ⎟
⎝ ⎠ ⎝ ⎠ ⎝ ⎠

⎛ a 11 a 12 .... a 1n ⎞
⎜ ⎟
⎜ a 21 a 22 .....a 2n ⎟
Sia A = ⎜ ⎟ la matrice quadrata le cui colonne sono date dai vettori
.....
⎜ ⎟
⎜ a a .....a ⎟
⎝ n1 n2 nn ⎠

a1 = F ( u1 ) , a 2 =F (u2 ) , .. , a n = F (un ) e sia A : Kn → Kn la funzione lineare

indotta su Kn dalla matrice A.

Poichè le funzioni lineari A ed F assumono gli stessi valori sui vettori di una base risultando

a1 = F ( u1 ) = A ( u1 ), a 2 =F (u2 ) = A(u2 ) , .. , a n = F (un ) = A (un )

allora esse coincidono .


Sia ora Vn uno spazio vettoriale sul campo K di dimensione finita n e sia

f : Vn ⎯
⎯→ Vn

una funzione lineare di Vn in sé .


Sia B = ( e1 , e2 ,….,en) una base ordinata di Vn . La funzione lineare f è determinata
quando si conoscano i vettori ( f ( e1 ) ,f ( e2 ) ,…., f ( en ) ) cioè i trasformati di f dei vettori
della base B. Indichiamo con

( α 1 , α 2,…., α n) le coordinate di f ( e1 ) nella base B

( β 1 , β 2,…., β n) le coordinate di f ( e2 ) nella base B


…..
….
( γ 1 , γ 2,…., γ n) le coordinate di f ( en ) nella base B
105

e sia Af la matrice avente per colonne tali vettori coordinati :

⎛ α1 β1 .... . γ1 ⎞
⎜ ⎟
⎜ α 2 β 2 .....γ 2 ⎟
Af = ⎜ ⎟
.....
⎜ ⎟
⎜ α β ......γ ⎟
⎝ n n n⎠

La conoscenza dei vettori ( f ( e1 ) ,f ( e2 ) ,…., f ( en ) ) consente la conoscenza di Af e


viceversa nota la matrice Af sono noti i vettori ( f ( e1 ) ,f ( e2 ) ,…., f ( en ) ) e quindi f .
Per tale ragione si dice che la matrice Af così costruita rappresenta f nella base B.

Per definizione è quindi

⎛ α1 β1 .... . γ1 ⎞
⎜ ⎟
⎜ α 2 β 2 .....γ 2 ⎟
( e1 , e2 ,….,en) ⎜ ⎟ = ( f ( e1 ) ,f ( e2 ) ,…., f ( en ) )
.....
⎜ ⎟
⎜ α β ......γ ⎟
⎝ n n n⎠

Il teorema che segue evidenzia una notevole proprietà della matrice Af che rappresenta f nella
base B.
Proposizione 2.1 Siano v un vettore di V e sia f (v) il suo trasformato.
Siano ( x1, x2 ,…, xn ) le coordinate di v nella base B e siano ( y1, y2 ,…, yn ) le
coordinate di f(v) nella base B . La funzione lineare
Af : Kn → Kn
trasforma le coordinate di v nelle coordinate di f(v) . Risulta cioè :

⎛ y1 ⎞ ⎛ α1 β1 .... . γ1 ⎞ ⎛ x 1 ⎞
⎜ ⎟ ⎜ ⎟⎜ ⎟
⎜ y2 ⎟ ⎜ α 2 β 2 .....γ 2 ⎟ ⎜ x 2 ⎟
⎜. ⎟ = ⎜ ..... ⎟ ⎜. ⎟
⎜ ⎟ ⎜ ⎟⎜ ⎟
⎜y ⎟ ⎜ α β ......γ ⎟ ⎜ x ⎟
⎝ n⎠ ⎝ n n n⎠ ⎝ n ⎠
106

Dimostrazione . Con le notazioni adottate si ha :

⎛ x1 ⎞
⎜ ⎟
⎜x2 ⎟
(i) ( e1 , e2 ,….,en) ⎜ ⎟ = v
.
⎜ ⎟
⎜x ⎟
⎝ n⎠
e per la linearità di f si ha :

⎛ x1 ⎞
⎜ ⎟
⎜x2 ⎟
( ii ) ( f ( e1 ) ,f ( e2 ) ,…., f ( en ) ) ⎜. ⎟ = f ( v )
⎜ ⎟
⎜x ⎟
⎝ n⎠

Inoltre è :

⎛ y1 ⎞
⎜ ⎟
⎜ y2 ⎟
( e1 , e2 ,….,en) ⎜ ⎟ = f ( v )
.
⎜ ⎟
⎜y ⎟
⎝ n⎠

⎛ α1 β1 .... . γ1 ⎞
⎜ ⎟
⎜ α 2 β 2 .....γ 2 ⎟
( e1 , e2 ,….,en) ⎜ ⎟ = ( f ( e1 ) ,f ( e2 ) ,…., f ( en ) )
.....
⎜ ⎟
⎜ α β ......γ ⎟
⎝ n n n⎠

Sostituendo tali espressioni nella ( ii ) si ha :

⎛ α1 β1 .... . γ1 ⎞ ⎛ x 1 ⎞ ⎛ y1 ⎞
⎜ ⎟⎜ ⎟ ⎜ ⎟
⎜ α 2 β 2 .....γ 2 ⎟ ⎜ x 2 ⎟ ⎜ y2 ⎟
( e1 , e2 ,….,en) ⎜ ⎟ ⎜. ⎟ = ( e1 , e2 ,….,en) ⎜ ⎟
..... .
⎜ ⎟⎜ ⎟ ⎜ ⎟
⎜ α β ......γ ⎟ ⎜ x ⎟ ⎜y ⎟
⎝ n n n⎠ ⎝ n ⎠ ⎝ n⎠

da cui segue per l’indipendenza dei vettori ( e1 , e2 ,….,en) che è :


107

⎛ α1 β1 .... . γ1 ⎞ ⎛ x 1 ⎞ ⎛ y1 ⎞
⎜ ⎟⎜ ⎟ ⎜ ⎟
⎜ α 2 β 2 .....γ 2 ⎟ ⎜ x 2 ⎟ ⎜y ⎟
⎜ ..... ⎟ ⎜. ⎟ = ⎜ 2⎟
.
⎜ ⎟⎜ ⎟ ⎜ ⎟
⎜ α β ......γ ⎟ ⎜ x ⎟ ⎜y ⎟
⎝ n n n⎠ ⎝ n ⎠ ⎝ n⎠

e cioè l’asserto.

Ricordiamo che la funzione ( coordinazione di Vn nella base B ) che associa ad ogni vettore v di
Vn il vettore ( x1, x2 ,…, xn ) delle sue coordinate nella base B è un isomorfismo di Vn in Kn .
Indicato con c : Vn → Kn tale isomorfismo la proposizione 2.1 ora provata mostra che è :

(2 . 2 ) f = c -1 ° Af ° c

La ( 2. 2 ) mostra che per calcolare f ( v ) si può utilizzare la matrice Af che d’ora in poi
indichiamo con

⎛ a 11 a 12 .... a 1n ⎞
⎜ ⎟
⎜ a 21 a 22 .....a 2n ⎟
Af = ⎜ ⎟
.....
⎜ ⎟
⎜ a a .....a ⎟
⎝ n1 n2 nn ⎠

la quale consente di calcolare le coordinate ( y1, y2 ,…, yn ) di f (v) note che siano le coordinate
( x1, x2 ,…, xn ) di v risultando :

⎧ y1 = a 11 x 1 + a 12 x 2 + ….. . + a 1n x n
⎪ y = a x + a x + ….. + a x
⎪ 2 21 1 22 2 2n n
(2 . 3) ⎨
⎪ ……..
⎪⎩ y n = a n1 x 1 + a n2 x 2 + ….. + a nn x n

Quando n è “molto grande” le (2. 3 ) pur consentendo il calcolo di f( v ) impongono molti


calcoli forse “ laboriosi “ a meno che la matrice Af non presenti “molti zeri” . Una situazione
favorevole si avrebbe se essa avesse la forma diagonale :
108

⎛ a11 0 .... .....0 ⎞


⎜ ⎟
⎜ 0 a 22 0..... 0 ⎟
Af =
⎜ ..... ⎟
⎜ ⎟
⎝ 0 0 ....... a nn ⎠

perché in tal caso le ( 2. 3 ) diventano

⎧ y1 = a11x1
⎪ y 2 = a 22 x 2


⎪ ……..
⎪⎩ y n = a nn x n

e cioè “ estremamente semplici “ .

Si pongono allora le seguenti due domande :

a) come cambia la matrice Af quando si cambia la base ?

b) come deve essere la base B affinchè Af risulti di forma diagonale ?

I teoremi che seguono danno risposta ai quesiti posti .

Proposizione 2.2 . Sia f : Vn → Vn una funzione lineare di Vn in sé . Siano

B = ( e1 , e2 ,….,en) e B’ = ( e’1 , e’2 ,….,e’n)

due basi ordinate di Vn . Le due matrici Af ed Af’ che rappresentano f nelle basi B e B’
rispettivamente risultano tra loro simili , risulta cioè :

A’f = P-1 Af P

con P matrice quadrata d’ordine n non degenere.


Dimostrazione. Denotiamo con
109

⎛ a 11 a 12 .... a 1n ⎞ ⎛ a'11 a'12 .... a'1n ⎞


⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 .....a 2n ⎟ ⎜ a'21 a'22 .....a'2n ⎟
Af = ⎜ ⎟ ed A’f =
..... ⎜ ..... ⎟
⎜ ⎟ ⎜ ⎟
⎜ a a .....a ⎟
⎝ n1 n2 nn ⎠ ⎝ a'n1 a'n2 .....a'nn ⎠

le matrici che rappresentano f nelle basi B e B’ ed indichiamo con P la matrice quadrata d’ordine
n avente per colonne le coordinate di e’1 , e’2, .. , e’n nella base B . Poiché il passaggio alle
coordinate è un isomorfismo le colonne di P al pari dei vettori e’1 , e’2, .. , e’n sono linearmente
indipendenti e quindi la matrice P è non degenere e quindi invertibile. Si ha allora :
⎛ p11 p12 .... p1n ⎞
⎜ ⎟
⎜ p 21 p 22 .....p 2n ⎟
(i) ( e1 , e2 ,….,en) = ( e’1 , e’2 ,….,e’n)
⎜ ..... ⎟
⎜ ⎟
⎝ p n1 p n2 .....p nn ⎠

dalla quale per la linearità di f segue

⎛ p11 p12 .... p1n ⎞


⎜ ⎟
(ii) ( f ( e1 ) ,f ( e2 ) ,…., f ( en ) ) ⎜ p 21 p 22 .....p 2n ⎟ = ( f ( e’1 ) ,f ( e’2 ) ,…., f ( e’n ) )
⎜ ..... ⎟
⎜ ⎟
⎝ p n1 p n2 .....p nn ⎠

D’altra parte per definizione è

⎛ a 11 a 12 .... a 1n ⎞
⎜ ⎟
⎜ a 21 a 22 .....a 2n ⎟
(iii) ( e1 , e2 ,….,en) ⎜ ⎟ = ( f ( e1 ) ,f ( e2 ) ,…., f ( en ) )
.....
⎜ ⎟
⎜ a a .....a ⎟
⎝ n1 n2 nn ⎠

⎛ a'11 a'12 .... a'1n ⎞


⎜ ⎟
⎜ a'21 a'22 .....a'2n ⎟
(iv) ( e’1 , e’2 ,….,e’n) = ( f ( e’1 ) ,f ( e’2 ) ,…., f ( e’n ) )
⎜ ..... ⎟
⎜ ⎟
⎝ a'n1 a'n2 .....a'nn ⎠
110

Sostituendo nella (iv) le espressioni di (i) , (ii), (iii) si ha :

⎛ p11 p12 .... p1n ⎞ ⎛ a'11 a'12 .... a'1n ⎞


⎜ ⎟⎜ ⎟
⎜ p 21 p 22 .....p 2n ⎟ ⎜ a'21 a'22 .....a'2n ⎟
( e1 , e2 ,….,en) =
⎜ ..... ⎟ ⎜ ..... ⎟
⎜ ⎟⎜ ⎟
⎝ p n1 p n2 .....p nn ⎠ ⎝ a'n1 a'n2 .....a'nn ⎠

⎛ a 11 a 12 .... a 1n ⎞ ⎛ p11 p12 .... p1n ⎞


⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 .....a 2n ⎟
= ( e1 , e2 ,….,en) ⎜ ⎜ p 21 p 22 .....p 2n ⎟
..... ⎟ ⎜ ..... ⎟
⎜ ⎟ ⎜ ⎟
⎜ a a .....a ⎟
⎝ n1 n2 nn ⎠ ⎝ p n1 p n2 .....p nn ⎠

Tale eguaglianza comporta , per l’indipendenza dei vettori e1 , e2 ,….,en , che è :

P A’f = Af P

da cui segue :
A’f = P-1 Af P
e cioè l’asserto.

Proposizione 2.3 . Sia f : Vn → Vn una funzione lineare di Vn in sé . Sia


B = ( e1 , e2 ,….,en) una base ordinata di Vn . La matrice Af che rappresenta f nella base B
ha la forma diagonale se e soltanto se i vettori e1 , e2 ,….,en della base B sono autovettori per
f.
Dimostrazione. La matrice Af collega i vettori e1 , e2 ,….,en ai loro trasformati
f ( e1 ) ,f ( e2 ) ,…., f ( en ) risultando :

⎛ a 11 a 12 .... a 1n ⎞
⎜ ⎟
⎜ a 21 a 22 .....a 2n ⎟
( e1 , e2 ,….,en) ⎜ ⎟ = ( f ( e1 ) ,f ( e2 ) ,…., f ( en ) )
.....
⎜ ⎟
⎜ a a .....a ⎟
⎝ n1 n2 nn ⎠
111

⎛ λ 1 0 .... ... 0 ⎞
⎜ ⎟
⎜ 0 λ 2 .......0 ⎟
Pertanto se la matrice Af è diagonale per esempio del tipo ⎜ ⎟
.....
⎜ ⎟
⎜ 0 0 .........λ ⎟
⎝ n ⎠

allora da
⎛ λ1 0 .... ... 0 ⎞
⎜ ⎟
⎜ 0 λ 2 .......0 ⎟
( e1 , e2 ,….,en) = ( f ( e1 ) ,f ( e2 ) ,…., f ( en ) )
⎜ ..... ⎟
⎜ ⎟
⎝ 0 0 .........λ n ⎠

segue che è :

(j) f ( e1 ) = λ1 e1 , f ( e2 ) = λ 2 e2 , …. .. , f ( en ) = λ n en

e ciò mostra che i vettori e1 , e2 ,….,en sono autovettori per f .


Viceversa se i vettori e1 , e2 ,….,en sono autovettori per f e valgono le relazioni (j) allora la
matrice Af avrà la forma
⎛ λ1 0 .... ... 0 ⎞
⎜ ⎟
⎜ 0 λ 2 .......0 ⎟
Af =
⎜ ..... ⎟
⎜ ⎟
⎝ 0 0 .........λ n ⎠
e cioè è diagonale.

La funzione lineare f si dice che è diagonalizzabile se esiste una base B tale che la matrice
Af che rappresenta f nella base B ha la forma diagonale .

Abbiamo quindi provato nella proposizione precedente il seguente fondamentale

Teorema I . Una funzione lineare f : Vn → Vn è diagonalizzabile se e soltanto se lo


spazio vettoriale Vn ha una base costituita da autovettori di f .

Questo teorema ci invita quindi a ricercare gli autovettori della funzione f e sperare che ne
esistano n indipendenti.
112

Ma come si ricercano gli autovettori di f ? E’ chiaro che la ricerca degli autovettori equivale
alla ricerca degli autovalori di f . Quindi vediamo come si ricercano gli autovalori di f .

Sia quindi f : Vn → Vn una funzione lineare di Vn in sé .


B= ( e1 , e2 ,….,en) sia una base ordinata di Vn ed Af = ( aij ) sia la matrice che
rappresenta f nella base B . Abbiamo già detto che la matrice Af induce una applicazione
lineare che indichiamo sempre con Af di Kn in sé

Af : Kn → Kn

la quale, come già visto , ha la proprietà di trasformare le coordinate di un vettore v di Vn nelle


coordinate del vettore f(v) .
Ora se
v = x1 e1 +x2 e2 + …. + xn en

è un vettore di Vn ed è autovettore per f di autovalore λ allora è :

f(v ) = λ v = λ (x1 e1 +x2 e2 + …. + xn en ) = λ x1 e1 + λ x2 e2 + …. + λ xn en

e quindi f(v ) ha coordinate ( λ x1, λ x2, …. λ xn ) . Poiché Af trasforma le coordinate di


v nelle coordinate di f(v ) si ha

⎛ a 11 a 12 .... a 1n ⎞ ⎛ x1 ⎞ ⎛ λx1 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ a 21 a 22 .....a 2n ⎟ ⎜x2 ⎟ ⎜ λx 2 ⎟
(*) ⎜ ..... ⎟ ⎜. ⎟ = ⎜ .. ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ a a .....a ⎟ ⎜x ⎟
⎝ n1 n2 nn ⎠ ⎝ n⎠ ⎝ λx n ⎠

e questa mostra che il vettore non nullo ( x1 , x2 , .., xn ) di Kn è autovettore per la funzione lineare
Af anch’esso con autovalore λ .
Viceversa se il vettore non nullo ( x1 , x2 , .., xn ) di Kn è autovettore per la funzione lineare Af
con autovalore λ allora vale la relazione (*) e quindi il vettore v non nullo

v = x1 e1 +x2 e2 + …. + xn en
113

determinato da ( x1 , x2 , .., xn ) è trasformato nel vettore

f(v ) = λ x1 e1 + λ x2 e2 + …. + λ xn en =λ v

ed quindi v è un autovettore per f con autovalore λ .

Abbiamo così mostrato che l’isomorfismo

c : Vn → Kn

trasforma con la sua inversa gli autovettori di f negli autovettori di Af ed inoltre che le due
funzioni f ed Af hanno gli stessi autovalori. Se λ è un autovalore per f e quindi anche per Af
possiamo considerare l’autospazio V λ di Vn corrispondente all’autovalore λ e l’autospazio K λ
di Kn corrispondente all’autovalore λ . Per quanto mostrato si ha :

c ( Vλ ) = Kλ e c-1 ( K λ ) = V λ

In particolare osserviamo che essendo c un isomorfismo i due sottospazi Vλ e Kλ hanno la


stessa dimensione e quindi la molteplicità geometrica di λ non cambia sia che esso venga
considerato autovalore di f e sia che esso venga pensato come autovalore di Af.
Poiché le funzioni lineari f ed Af hanno gli stessi autovalori , per trovare gli autovalori
di f basterà determinare quelli di Af . Come si può stabilire se uno scalare λo assegnato è
autovalore per Af ?
Lo scalare λo è autovalore per Af se esiste un vettore non nullo X di Kn che sia
autovettore di Af con autovalore λo, cioè che verifichi la relazione

(a) Af X = λo X

⎛ x1 ⎞ ⎛ a 11 a 12 .... a 1n ⎞
⎜ ⎟ ⎜ ⎟
⎜x ⎟ ⎜ a 21 a 22 .....a 2n ⎟
Posto X= ⎜ 2⎟ ed Af = ⎜ ⎟
. .....
⎜ ⎟ ⎜ ⎟
⎜x ⎟ ⎜ a a .....a ⎟
⎝ n⎠ ⎝ n1 n2 nn ⎠
114

la (a) esplicitamente è il seguente sistema di equazioni lineari nelle incognite (x1,x2,….,xn)

⎧ a 11 x 1 + a 12 x 2 + ….. . + a 1n x n = λ o x 1
⎪ a x + a x + ….. + a x = λ x
⎪ 21 1 22 2 2n n o 2

⎪ ……..
⎪⎩ a n1 x 1 + a n2 x 2 + ….. + a nn x n = λ o x n

che può essere anche scritto al seguente modo

⎧(a 11 - λ ο ) x 1 + a 12 x 2 + .. + a 1n x n = 0
⎪a x + ( a - λ ) x + .. + a x = 0
⎪ 21 1 22 ο 2 2n n

⎪ ..
⎪⎩a n1 x 1 + a n2 x 2 + .. + ( a nn - λ ο ) x n = 0

Ma tale sistema omogeneo ha una soluzione non banale se e soltanto se risulta

⎛ a 11 - λ o a 12 .... ..........a 1n ⎞
⎜ ⎟
⎜ a 21 a 22 - λ o .......a 2n ⎟
det ⎜ ⎟ =0
.....
⎜ ⎟
⎜a a n2 ..... a nn - λ o ⎟⎠
⎝ n1

Abbiamo quindi determinato la condizione cui deve soddisfare λo per essere autovalore di Af :

λo è autovalore di Af se sottraendo nella matrice Af agli elementi a11, a22, ….,ann della sua
diagonale lo scalare λo si ottiene una matrice con determinante zero .

Detta t una variabile possiamo allora considerare il seguente determinante

⎛ a 11 - t a 12 ..........a 1n ⎞
⎜ ⎟
⎜a a 22 - t .......a 2n ⎟
p(t) = det (Af – It ) = det ⎜ 21 ⎟
.....
⎜ ⎟
⎜a a n2 ..... a nn - t ⎟⎠
⎝ n1
115

che sviluppato fornisce un polinomio di grado n e le cui radici , ma solo quelle appartenenti a K,
forniscono gli autovalori della funzione Af e quindi di f .

Il polinomio

p(t) = det (A – I t ) = (-1)n t n + ........

è chiamato il polinomio caratteristico della funzione f .

Tale polinomio è di nostro interesse avendo stabilito che sussiste la seguente

Proposizione 2.4. Uno scalare λo di K è autovalore della funzione f se e solo se è p(λo ) =0 .

Osserviamo infine che se λo è un autovalore di Af allora è

⎛ a 11 - λ o a 12 .... ..........a 1n ⎞
⎜ ⎟
⎜ a 21 a 22 - λ o .......a 2n ⎟
det ⎜ ⎟= 0
.....
⎜ ⎟
⎜a a ..... a - λ ⎟
⎝ n1 n2 nn o ⎠

⎛ a 11 - λ o a 12 .... ..........a 1n ⎞
⎜ ⎟
⎜ a 21 a 22 - λ o .......a 2n ⎟
e quindi la matrice ⎜ ⎟ ha rango r < n . Lo spazio delle soluzioni del
.....
⎜ ⎟
⎜a a ..... a - λ ⎟
⎝ n1 n2 nn o ⎠

sistema
⎧(a 11 - λ ο ) x 1 + a 12 x 2 + .. + a 1n x n = 0
⎪a x + ( a - λ ) x + .. + a x = 0
⎪ 21 1 22 ο 2 2n n

⎪ ..
⎪⎩a n1 x 1 + a n2 x 2 + .. + ( a nn - λ ο ) x n = 0

ha allora , come sappiamo , dimensione n-r . Ma lo spazio delle soluzioni del sistema è
l’autospazio K λo corrispondente all’autovalore λo e quindi

se il rango della matrice (A – I λo ) è r l’autovalore λo ha molteplicità geometrica n-r .


116

Sia ora sempre λo un autovalore della funzione Af . Poiché lo scalare λo è radice del polinomio
caratteristico p( t ) allora per un il teorema di Ruffini risulta che tale polinomio è divisibile per
( t - λo) . Si ha cioè
p ( t ) = ( t - λo) q(t)
con q(t) polinomio di grado n-1 .
Se λo non è radice di q(t) cioè si ha q(λo ) ≠ 0 allora λo è detta una radice semplice del
polinomio p(t ) .
Se invece risulta q(λo ) = 0 allora , riapplicando il teorema di Ruffini , si ha
q(t) = ( t - λo) g(t)
con g(t) polinomio di grado n-2 e quindi
p ( t ) = ( t - λo)2 g(t)
Se risulta g(λo ) ≠ 0 allora λo è detta una radice doppia del polinomio p(t) .
Iterando il ragionamento si perviene alla seguente definizione .
La radice λo del polinomio p(t) si dice che ha molteplicità algebrica s se risulta

p ( t ) = ( t - λo)s ξ(t) e ξ (λo) ≠ 0

Ad un autovalore λo della funzione lineare A abbiamo quindi assegnato due interi :

il primo χ (λo) = dim Vλ 0 è la sua molteplicità geometrica ( e questo intero ci

informa su quanti autovettori indipendenti di autovalore λo possiamo trovare )

il secondo µ (λo) è la sua molteplicità algebrica ( e questo intero ci informa su quante


volte λo appare tra le radici del polinomio caratteristico )

Noi proveremo ora che la molteplicità geometrica dell’autovalore λo non supera mai quella
algebrica . Prima di far ciò è essenziale provare la seguente

Proposizione 2.5 Il polinomio caratteristico della funzione lineare f è indipendente dalla


base scelta per rappresentare f .
Dimostrazione. Siano quindi B e B’ due basi ordinate di Vn e siano Af ed A’f le matrici
che rappresentano f nelle due basi B e B’ . Per quanto visto nella proposizione 2.2 le due matrici
Af ed A’f sono simili tra loro e quindi esiste una matrice P non degenere per cui si abbia
117

A’f = P-1 Af P . Si ha allora

det (A’f –I t) = det (P-1 Af P – I t ) = det (P-1 Af P – P-1 I t P ) = det [P-1 (Af - I t ) P] =
= det P-1 det (Af - I t ) det P = det (Af - I t )

essendo det P-1 det P = 1 .

Proviamo ora che :

Proposizione 2.6 Sia λo un autovalore di f . La molteplicità geometrica di λo non supera


la molteplicità algebrica di λo .
Dimostrazione .Supponiamo che l’autovalore λo abbia molteplicità geometrica s . Nel-
l’ autospazio Vλ 0 corrispondente all’ autovalore λo si possono quindi scegliere s autovettori

(e1, e2 ,…,es ) di autovalore λo e tra loro indipendenti. Per la proposizione 3.8 del capitolo I, si
possono aggiungere ai vettori (e1, e2 ,…,es ) altri n-s vettori ws+1 , ws+2 , … , wn in modo
che i vettori (e1, e2 ,…,et , ws+1 , ws+2 , … , wn ) siano una base di Vn . Tenendo conto che è
f (e1 )= λo e1 , f (e2 )= λo e2 , … , f ( es) = λo es
la matrice Af che rappresenta f nella base B ha la seguente forma

⎛ λ o 0 .... ... 0 ....... ⎞


⎜ ⎟
⎜ 0 λ o .......0 ....... ⎟
⎜ .. ⎟
⎜ ⎟
Af = ⎜ 0 0 ....... λ o ....... ⎟
⎜ ⎟
⎜0 0 0 a s +1 , s +1 .. a s +1 n ⎟
⎜ ........ ⎟
⎜⎜ ⎟
⎝0 0 0 a n , s +1 .. ... a nn ⎟⎠

Si ha quindi

p ( t ) =det (Af – I t ) = ( λo - t )s g(t)

e questa mostra che la molteplicità algebrica di λo è almeno s . L’ asserto è così provato.


Osserviamo esplicitamente che la proposizione 2.6 ora provata ha la seguente conseguenza.
Sia λo un autovalore della funzione lineare f e supponiamo che sia radice del polinomio
118

caratteristico p(t) di f con molteplicità algebrica 1 , cioè sia una radice semplice di p(t). Per la
proposizione 2.6 ora provata risulta allora
dim Vλ 0 ≤ 1

ma poiché è anche dim Vλ 0 ≥ 1 si ha

dim Vλ 0 = 1.

Riassumendo : ogni radice semplice del polinomio caratteristico è tale che la sua
molteplicità geometrica eguaglia quella algebrica .

Per i nostri scopi sono molto utili le proposizioni che seguono.

Proposizione 2.7. Siano v1 ,v2,…,vh , h autovettori per la funzione lineare f e siano


λ1 , λ2 , …. , λh i loro corrispondenti autovalori . Se gli autovalori λ1 , λ2 , …. , λh sono distinti
gli autovettori v1 ,v2,…,vh sono linearmente indipendenti .
Dimostrazione. Ragioniamo per induzione sul numero h di autovettori . Se h=1 l’asserto è
vero in quanto un autovettore , essendo un vettore non nullo , risulta da solo linearmente
indipendente. Supponiamo quindi h > 1 e vero l’asserto per h-1 .
Supponiamo per assurdo che i vettori v1 ,v2,…,vh siano linearmente dipendenti . Poiché per
l’ipotesi d’induzione v1,v2,…,vh-1 sono indipendenti , il vettore vh è combinazione lineare di
v1,v2,…,vh-1 . Si ha quindi che esistono opportuni scalari α 1, α 2 , ……, α h-1 per cui risulti

( j. ) vh = α 1v1 + α 2v2 +……+ α h-1vh-1

Applicando ad ambo i membri della ( j.) la funzione lineare f si ha , tenendo conto che i vettori v1
,v2,…,vh sono autovettori di autovalori λ1 , λ2 , …. , λh

(jj) λh vh = α 1 λ1v1 + α 2 λ2 v2 +……+ α h-1 λh-1 vh-1

Moltiplicando ambo i membri della ( j.) per lo scalare λh si ha :

(jjj) λh vh = α 1 λh v1 + α 2 λh v2 +……+ α h-1 λh vh-1


119

Sottraendo tra loro la (jj ) e la ( jjj ) si ha :

(jv) 0 = α 1 (λh - λ1)v1 + α 2 (λh - λ2) v2 +……+ α h-1 (λh - λh-1) vh-1

Poiché , per l’ipotesi d’induzione i vettori v1,v2,…,vh-1 sono linearmente indipendenti , la ( jv )


sussiste solo con scalari tutti nulli, e pertanto si ha :

( ** ) α 1 (λh - λ1) = 0 , α 2 (λh - λ2) = 0 , ……. , α h-1 (λh - λh-1) = 0

Essendo gli autovalori λ1 , λ2 , …. , λh-1, λh tra loro distinti risulta

λh - λ1 ≠ 0 , λh – λ2 ≠ 0 , ……., λh – λh-1 ≠ 0

e qundi dalla ( ** ) segue che è α 1 = 0 , α 2 = 0 , ….., α h-1 = 0 . Ma allora dalla ( j ) segue


che è vh = 0 e ciò è assurdo , essendo vh un autovettore.

Proposizione 2.8. Se λ1 , λ2 , …. , λh sono h autovalori distinti per la funzione lineare f


allora gli autospazi Vλ 1 , Vλ 2 , ….., Vλ h ad essi corrispondenti sono tali che ciascuno di essi

interseca nel solo vettore nullo lo spazio generato dai rimanenti.


Dimostrazione. Per semplicità proviamo che è

Vλ 1 ∩ ( Vλ 2 + …..+ Vλ h ) = { 0 }
Sia v un vettore di Vλ 1 ∩ ( Vλ 2 + …..+ Vλ h ) e supponiamo per assurdo che v sia non nullo e

quindi un autovettore . Poiché v appartiene al sottospazio Vλ 2 + …..+ Vλ h allora è

(i ) v = v2 + …. + vh

con v2 ∈ Vλ 2 , … , vh ∈ Vλ h

Applicando ad ambo i membri della (i) la funzione lineare f si ottiene , ricordando che
v ∈ Vλ 1 e che v2 ∈ Vλ 2 , … , vh ∈ Vλ h

(ii) λ1v = λ2 v2 +……+ λhvh


120

Moltiplicando ambo i membri della (i) per lo scalare λ1 si ha

(iii) λ1v = λ1 v2 +……+ λ1vh

Sottraendo tra loro la (ii) e la (iii) si ha :

(iv) 0 = (λ2- λ1)v2 + …… + (λh - λ1) vh

Poiché gli autovalori λ2 , …. , λh sono distinti , per la proposizione (2.7), gli autovettori
v2 ,…. ,vh sono linearmente indipendenti e quindi la (iv) può sussistere solo con scalari tutti
nulli. Si ha quindi λ1 = λ2 = …. = λh e ciò contraddice l’ipotesi che gli autovalori siano distinti
tra loro.

Le due proposizioni ora provate hanno importanti conseguenze come ora faremo vedere.
Ricordiamo che il problema che abbiamo posto e che stiamo studiando è il seguente :

Una funzione lineare è sempre diagonalizzabile ?

Una risposta al problema è data dal Teorema I il quale afferma che f è diagonalizzabile se
e solo se esiste una base B di Vn costituita da autovettori per la funzione lineare f .
Ma tale base esiste sempre ? Vediamo.
Un caso favorevole è espresso dalla seguente :

Proposizione 2.9 Sia f : Vn → Vn una funzione lineare . Se il polinomio caratteristico


p(t) di f ha n radici λ1 , λ2 , …. , λn in K distinte tra loro allora f è diagonalizzabile.
Dimostrazione. Siano v1,v2,…,vn n autovettori corrispondenti agli autovalori
λ1 , λ2 , …. , λn . Per la proposizione 2.7 gli autovettori v1,v2,…,vn sono linearmente
indipendenti e quindi costituiscono una base per lo spazio Vn . L’asserto segue quindi dal Teorema I
.

Cosa si può dire se invece il polinomio p(t) ha radici multiple sempre nel campo K ?

La proposizione che segue risponde a tale quesito ed inoltre fornisce una risposta completa
121

al problema della diagonalizzabilità della funzione lineare f .

Proposizione 2.10 Sia f : Vn → Vn una funzione lineare . La funzione f è


diagonalizzabile se e solo se il polinomio caratteristico p(t) di f ha n radici λ1 , λ2 , …. , λn
in K ciascuna con molteplicità geometrica eguale a quella algebrica.
Dimostrazione. Supponiamo che f sia diagonalizzabile. Per il Teorema I esiste allora una
base B = { e1,e2,…,en } costituita da autovettori per f . Raggruppiamo tali autovettori mettendo
insieme quelli che hanno lo stesso autovalore. Siano λ1 , λ2 , …. , λt gli autovalori distinti forniti
dagli autovettori e1,e2,…,en . Sia

T1 il sottoinsieme di B costituito da tutti gli autovettori di autovalore λ1 .


T2 il sottoinsieme di B costituito da tutti gli autovettori di autovalore λ2 .
…….
Tt il sottoinsieme di B costituito da tutti gli autovettori di autovalore λt .

Siano n1 , n2 , …, nt le cardinalità di T1, T2 ,….., Tt e siano s1 , s2,….., st le molteplicità


algebriche degli autovalori λ1 , λ2 , …. , λt .
Poiché ogni autospazio V λi i = 1,2,…,t contiene i vettori di Ti , i = 1,2,…,t si ha
:
n1 ≤ dim V λ 1 ≤ s1

n2 ≤ dim V λ 2 ≤ s2

……………

nt ≤ dim V λ t ≤ st

Si ha allora

n = n1 + n2 + …+ nt ≤ dim V λ 1 + dim V λ 2 + ….+ dim V λ t ≤ s1 + s2 +….. + st ≤ n

Da tale diseguaglianza segue :


s1 + s2 +….. + st = n
e questa mostra che le radici λ1 , λ2 , …. , λt contate con la loro molteplicità sono in numero di n.
Inoltre da
122

n = n1 + n2 + …+ nt ≤ dim V λ 1 + dim V λ 2 + ….+ dim V λ t ≤ s1 + s2 +….. + st = n

segue che per nessun i = 1,2,…,t può essere dim V λ i < si altrimenti è n < n .
Quindi è :

dim V λ 1 = s1, dim V λ 2 = s2 , ….., dim V λ t = st

e ciò mostra che le radici λ1 , λ2 ,…. , λt hanno ciascuna molteplicità geometrica eguale a quella
algebrica.
Viceversa supponiamo ora che il polinomio caratteristico di f abbia n radici
ζ 1, ζ 2,…, ζ n nel campo K e che ognuna di esse abbia molteplicità algebrica eguale a quella
geometrica . Raggruppiamo le radici mettendo insieme quelle eguali tra loro. Siano
λ1 , λ2 , …. , λt le radici distinte che figurano tra le n radici ζ 1, ζ 2,…, ζ n .
Supponiamo che

λ1 appaia s1 volte tra le radici ζ 1, ζ 2,…, ζ n .


λ2 appaia s2 volte tra le radici ζ 1, ζ 2,…, ζ n .
….
λt appaia st volte tra le radici ζ 1, ζ 2,…, ζ n .

Quindi
λ1 ha molteplicità algebrica s1 .
λ2 ha molteplicità algebrica s2 .
…..
λt ha molteplicità algebrica st .

ed inoltre è ovviamente
s1 + s2 +….. + st = n.

Poiché per ipotesi la molteplicità algebrica è eguale a quella geometrica si ha :

dim V λ 1 = s1, dim V λ 2 = s2 , ….., dim V λ t = st


Siano ora

B1 una base di V λ 1 , B2 una base di V λ 2 , ……, Bt una base di V λ t .


123

Essendo gli autovalori λ1 , λ2 , …. , λt distinti gli autospazi Vλ 1 , Vλ 2 , ….., V λ t ad essi

corrispondenti sono tali che ciascuno di essi interseca nel solo vettore nullo lo spazio generato dai
rimanenti ed allora per la proposizione 5.1 del capitolo I , unendo le basi B1 , B2,….. , Bt si
ottiene un insieme B costituito da s1 + s2 +….. + st = n autovettori indipendenti di Vn, cioè
una base di autovettori.
Per il Teorema I allora f è diagonalizzabile e l’asserto è completamente provato.

Concludiamo con qualche esempio.

Esercizio 1.
Sia assegnata la seguente matrice reale

⎛1 0 1⎞
⎜ ⎟
A = ⎜1 1 1 ⎟
⎜1 0 1 ⎟⎠

Si consideri la funzione lineare A : R3 → R3 indotta dalla matrice A .


Si determini il nucleo di A e si stabilisca se essa ha una base di autovettori cioè se è
diagonalizzabile .

Svolgimento.

I vettori X = (x,y,z) del nucleo di A sono quelli per cui risulti AX = 0 .

Tali vettori sono quindi le soluzioni del seguente sistema omogeneo :

⎧x + z = 0

⎨x + y + z = 0
⎪x + z = 0

Tale sistema è ovviamente equivalente a


124

⎧x + z = 0

⎩x + y + z = 0

le cui soluzioni sono il sottospazio di dimensione 1 generato da (-1 , 0 , 1 ). Il nucleo di A non è


ridotto al solo vettore nullo e quindi (-1 , 0 , 1 ) è un autovettore di autovalore 0.
La matrice A rappresenta la funzione lineare A nella base canonica di R3 e pertanto
il polinomio caratteristico di A è :

⎛1 - t 0 1⎞
⎜ ⎟
det (A – I t ) = ⎜1 1- t 1 ⎟ = ( 1 – t ) [ ( 1 – t )2 - 1] = t ( 1 – t ) ( t – 2 )
⎜1 0 1 - t ⎟⎠

Gli autovalori di A sono quindi i numeri 0 , 1, 2 . Tali valori sono distinti e quindi A è
diagonalizzabile per la proposizione 2.9.

Esercizio 2. Si consideri la seguente matrice reale

⎛1 0 2⎞
⎜ ⎟
A = ⎜0 1 2⎟
⎜0 0 2 ⎟⎠

e sia A : R3 → R3 la funzione lineare indotta da A .

A ( x , y , z ) = ( x+2z , y+2z , 2z)

Si stabilisca se tale funzione ha una base di autovettori e cioè se è diagonalizzabile .

Svolgimento.
La matrice A rappresenta la funzione lineare A nella base canonica di R3. Pertanto il polinomio
caratteristico di A è dato da :
125

⎛1 - t 0 2⎞
⎜ ⎟
det (A – I t ) = ⎜ 0 1- t 2 ⎟ ( 1 – t )2 (2 – t )
⎜0 0 2 - t ⎟⎠

Le radici di tale polinomio sono i numeri 1 e 2 .


Il numero 2 è una radice semplice mentre 1 è una radice doppia.
Gli autovettori di autovalore 1 si ottengono attraverso le soluzioni de seguente sistema omogeneo.

0x + 0y + z = 0

Esse sono quindi un sottospazio S di dimensione due. Due soluzioni indipendenti di tale sistema
sono (1,0,0) e (0,1,0) e quindi è S = [ (1,0,0) , (0,1,0) ] .
L’autospazio corrispondente all’autovalore 1 è quindi S = [ (1,0,0) , (0,1,0) ].
Avendo controllato che la molteplicità geometrica di 1 è eguale a quella algebrica la funzione
lineare A è diagonalizzabile per la proposizione 2.10.

Esercizio 3.
Una funzione lineare f : R3 → R3 assume i seguenti valori
f (1,0,0) = (2,0,0)
f(0,1,0) = (0,0,0)
f(0,1,1) = (2,2,0)
Si determini f e si dica se è diagonalizzabile.
Svolgimento. Poiché i vettori (1,0,0) , (0,1,0) , (0,1,1) sono indipendenti in quanto è
⎛1 0 0⎞
⎜ ⎟
det ⎜ 0 1 0 ⎟ ≠ 0
⎜0 1 1⎟
⎝ ⎠
essi costituiscono una base di R3 .La conoscenza dei valori che f assume su tali vettori determina
quindi f . Vediamo.
Poiché { (1,0,0) , (0,1,0) , (0,1,1) } è una base un qualunque vettore (x, y, z) di R3 risulta una

loro combinazione lineare si ha cioè per opportuni scalari α , β , γ

(i) (x, y, z) = α (1,0,0) + β (0,1,0) + γ (0,1,1) = ( α , β + γ , γ )

da (i) segue
126

α= x
β + γ =y
γ =z
e cioè per realizzare l’eguaglianza (i) , occorre scegliere :
α= x , β =y–z, γ =z.

Si ha quindi

(x, y, z) = x(1,0,0) +y-z (0,1,0) +z (0,1,1)

Essendo f lineare si ha allora

f(x, y, z) = x f(1,0,0) + (y-z ) f (0,1,0) + z f(0,1,1)

ma è per ipotesi f (1,0,0) = (2,0,0) , f(0,1,0) = (0,0,0) , f(0,1,1) = (2,2,0)


e quindi è :

f(x, y, z) = x (2,0,0) + (y-z ) (0,0,0) + z (2,2,0) = (2x +2z , 2z , 0 )

La funzione f è così determinata.


Determiniamo ora la matrice Af che rappresenta f nella base assegnata . Si ha

f (1,0,0) = (2,0,0) = 2(1,0,0) +0 (0,1,0) + 0 (0,1,1)


f(0,1,0) = (0,0,0) = 0(1,0,0) +0 (0,1,0) + 0 (0,1,1)
f(0,1,1) = (2,2,0) = 2(1,0,0) +2 (0,1,0) + 0 (0,1,1)

e quindi è :

⎛ 2 0 2⎞
⎜ ⎟
Af = ⎜ 0 0 2 ⎟
⎜0 0 0⎟
⎝ ⎠

Il polinomio caratteristico di f è quindi


127

⎛2− t 0 2 ⎞
⎜ ⎟
p( t ) = det ⎜ 0 − t 2 ⎟ = t2 (2-t)
⎜ 0 − t ⎠⎟
⎝ 0

Gli autovalori di f sono quindi 0 (radice doppia) e 2 radice semplice.


L’autospazio corrispondente all’autovalore 0 si ottiene in corrispondenza alle soluzioni del sistema
omogeneo

⎧2x + 2z = 0

⎩2z = 0
che ha rango due essendo le due equazioni indipendenti .Le soluzioni di tale sistema costituiscono
quindi un sottospazio di dimensione 1, con base ( 0 , -4 , 0) , base ottenuta in corrispondenza ai
minori presi a segni alterni della matrice dei coefficienti del sistema

⎛ 2 0 2⎞
⎜ ⎟
⎝0 0 2⎠
Pertanto la molteplicità geometrica di 0 è uno e quindi non coincide con la sua molteplicità
algebrica che è due.
La funzione f non è quindi diagonalizzabile.
128

Capitolo VI

Funzioni lineari simmetriche


129

1.- Il gruppo lineare ed il gruppo ortogonale.

In questo numero useremo le seguenti notazioni.


Se x =(x1, x2,….,xn) ed y =(y1, y2,….,yn) sono due n-ple ordinate di numeri reali col simbolo
< x , y > = x1 y1+ x2 y2 +….+xn yn
rappresenteremo il loro prodotto scalare euclideo.
Inoltre se A = (aij) è una matrice quadrata d’ordine n ad elementi reali indicheremo coi simboli
a1, a2,….,an le sue righe e con a1 , a2 ,…, an le sue colonne.
Mantenendo queste notazioni ricordiamo che se A = (aij) e B = (bij) sono due matrici
quadrate d’ordine n il loro prodotto AB (eseguito righe per colonne) è la matrice quadrata C = (cij)
in cui è :

cij = < ai , bj >

Sia n un intero maggiore o eguale a due e sia GL(n,R) l’insieme di tutte le matrici quadrate
d’ordine n ad elementi reali e che siano non degeneri cioè quelle dotate di inversa. Tali matrici
come sappiamo sono tutte e sole quelle che hanno il determinante diverso da zero.
Il prodotto di due matrici A e B non degeneri è non degenere in quanto è
det(AB)= detAdetB ≠ 0 .
Inoltre il prodotto tra matrici è associativo , la matrice identica I ( d’ordine n) è non degenere ed
ogni matrice non degenere ha l’inversa. Per queste ragioni l’insieme GL(n,R) è un gruppo detto
gruppo lineare.
Nel seguito denoteremo per ogni matrice A non degenere con At la sua trasposta ( cioè la
matrice avente per colonne le righe di A e per righe le colonne di A ) e con A-1 la sua inversa.
Per ciò che segue sono utili le seguenti relazioni di facile dimostrazione.
Siano A e B due matrici non degeneri . Risulta :

(1.1) (AB) -1 = B-1 A-1 (AB) t = B t A t

Abbiamo già visto che una matrice A col determinante diverso da zero è invertibile e però
,quando n è grande, la costruzione della sua inversa è faticosa in quanto coinvolge il calcolo dei
complementi algebrici degli elementi di A.
Per questa ragione sono di un certo interesse le matrici non degeneri per le quali sia facile il
130

calcolo della loro inversa. Fanno parte di questa famiglia le matrici ortogonali di cui ora ci
occuperemo.

Una matrice A non degenere è detta ortogonale se risulta :

(1.2) A-1 = A t

Per riconoscere se una matrice è ortogonale sono utili le seguenti proposizioni.

Proposizione 1.1 Se A è una matrice ortogonale allora si ha detA = + 1.


Dimostrazione. Si ha
det I = det(A A-1)=detAdet A-1 = detA det A t = (detA )2 = 1
da cui segue l’asserto.
La proposizione ora provata fornisce una condizione solo necessaria per la ortogonalità di
una assegnata matrice . In forza di tale proposizione una matrice che abbia determinante diverso da
-1 e 1 non è ortogonale.
La condizione non è però sufficiente come mostra il seguente esempio. Si consideri la
matrice

⎛2 3⎞
A = ⎜⎜ ⎟
⎝1 2 ⎟⎠

il cui determinante è eguale ad 1 . La matrice A non è ortogonale in quanto risulta A A t ≠ I.


Una condizione necessaria e sufficiente è invece fornita dalla seguente:

Proposizione 1.2 Una matrice A è ortogonale se e solo se risulta AA t = I.


Dimostrazione . Se A è ortogonale è A-1 = A t e quindi risulta AA t = I.
Viceversa se AA t = I allora è AA t = A A-1 e quindi, per la legge di cancellazione valida
in un gruppo , si ha A t = A-1 .
La proposizione mostra quindi che per controllare se A t coincide con l’inversa di A non è
necessario controllare che essa è permutabile con A.

Con analoga dimostrazione si prova la seguente :


131

Proposizione 1.3 Una matrice A è ortogonale se e solo se risulta A t A = I.

La Proposizione 1.2 ora provata è equivalente alla seguente :

Proposizione 1.4 . Una matrice A è ortogonale se e solo se le sue righe sono una base
ortonormale di Rn.
Dimostrazione . Se A è ortogonale risulta A A t = I e quindi ricordando che le colonne di
A t sono le righe di A quando si esegue il prodotto AA t righe per colonne, di fatto si moltiplicano
le righe di A tra di loro e quindi è, essendo
A At = I :

per ogni i = 1,2,…,n < ai , ai > = 1


e per i ≠ j < ai , ai > = 0

e queste mostrano che le righe di A sono una base ortonormale di Rn .Viceversa se le righe di A
sono una base ortonormale di Rn cioè si ha :

per ogni i = 1,2,…,n < ai , ai > = 1


e per i ≠ j < ai , ai > = 0

allora risulta A A t = I e quindi per la proposizione 1.2 la matrice A è ortogonale.

La proposizione ora provata mostra quindi quale sia il modo di costruire una matrice
ortogonale .
Con argomentazioni del tutto analoghe quando si tenga conto della Proposizione 1.3 e della
circostanza che righe di A t sono le colonne di A si perviene
alla seguente :

Proposizione 1.5 . Una matrice A è ortogonale se e solo se le sue colonne sono una base
ortonormale di Rn.
Abbiamo già visto che una matrice quadrata d’ordine n ad elementi reali ,
132

⎛ a 11 a 12 .... a 1n ⎞
⎜ ⎟
⎜ a 21 a 22 .....a 2n ⎟
A= ⎜ ⎟
.....
⎜ ⎟
⎜ a a .....a ⎟
⎝ n1 n2 nn ⎠

induce su Rn , spazio vettoriale numerico reale di dimensione n , un’applicazione lineare che


denotiamo sempre con A ,
A : Rn → Rn

quando si faccia corrispondere al vettore

⎛ x1 ⎞
⎜ ⎟
⎜x ⎟
x= ⎜ 2⎟
.
⎜ ⎟
⎜x ⎟
⎝ n⎠
il vettore

⎛ y1 ⎞ ⎛ a 11 a 12 .... a 1n ⎞ ⎛ x1 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ y2 ⎟ ⎜ a 21 a 22 .....a 2n ⎟ ⎜x2 ⎟
y = ⎜ ⎟= ⎜ ..... ⎟ ⎜. ⎟
.
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜y ⎟ ⎜ a a .....a ⎟ ⎜x ⎟
⎝ n⎠ ⎝ n1 n2 nn ⎠ ⎝ n⎠

ottenuto moltiplicando, righe per colonne , la matrice A per il vettore x .Tale applicazione è un
isomorfismo se la matrice A è non degenere.
Nel seguito denoteremo con
⎛1 ⎞ ⎛ 0⎞ ⎛ 0⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ 0⎟ ⎜1 ⎟ ⎜ 0⎟
u1 = ⎜ ⎟ , u2 = ⎜ . ⎟ ,………., un = ⎜. ⎟
.
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ 0⎟ ⎜ 0⎟ ⎜1 ⎟
⎝ ⎠ ⎝ ⎠ ⎝ ⎠
i vettori della base canonica di Rn . L’ isomorfismo A trasforma i vettori u1 , u2 ,…, un della
base canonica di Rn nei vettori colonna a1 , a2 ,…, an della matrice A.

I teoremi che seguono caratterizzano le matrici ortogonali attraverso le proprietà di tale


133

isomorfismo.
Proviamo che :
Proposizione 1.6 Una matrice non degenere A è ortogonale se e solo se l’isomorfismo A
conserva il prodotto scalare cioè risulta , per ogni coppia x , y di Rn
(1.3) < x , y > = < Ax , Ay > .

Dimostrazione. Se A è ortogonale risulta A-1 = A t e quindi si ha :

< Ax , Ay > = (Ax ) t Ay = x t A t Ay = x t I y = x t y = < x , y >

e cioè la (1.3).
Viceversa se vale la (1.3) si ha :

< ui , uj > = < A ui , A uj > = < ai , aj >


e quindi è :
< ai , aj > = 1 per i = j e < ai , aj > = 0 per i ≠ j

e ciò prova che A è ortogonale per la proposizione 1.3.

Proviamo ora la seguente

Proposizione 1.7 Una matrice non degenere A è ortogonale se e solo se l’isomorfismo A


conserva la lunghezza dei vettori, cioè per ogni vettore x di Rn risulta :
(1.4) ‫׀‬x‫׀ = ׀‬Ax‫׀‬.
Dimostrazione. Se la matrice A è ortogonale allora per la proposizione precedente
l’isomorfismo A conserva il prodotto scalare e quindi la lunghezza dei vettori. Viceversa
supponiamo valga la (1.4). Si ha , per i e j diversi tra loro :

‫׀‬ui + uj ‫׀ = ׀‬A(ui + uj )‫׀ = ׀‬A ui + A uj‫׀ =׀‬ai + aj ‫׀‬

da cui segue :
‫׀‬ui + uj ‫׀‬2 = ‫׀‬ai + aj ‫׀‬2
Si ha allora :
‫׀‬ui + uj ‫׀‬2 = < ui + uj , ui + uj > = < ui, ui > + < uj , uj > + 2 < ui, uj > = 2
134

essendo < ui, ui > = < uj , uj > = 1 e < ui, uj > = 0.

‫׀‬ai + aj ‫׀‬2 = < ai + aj, ai + aj > = < ai, ai > + < aj , aj > + 2 < ai, aj > = 2.

Poiché per ipotesi è < ai, ai > = < ui, ui > = 1 e < aj , aj > = < uj , uj > = 1 si ha
allora < ai, aj > = 0.

Da < ai, ai > = 1 ed < ai, aj > = 0 segue che A è ortogonale per la proposizione 1.5.
Concludiamo provando la seguente:

Proposizione 1.8 Una matrice non degenere A è ortogonale se e solo se l’isomorfismo A


trasforma una base ortonormale di Rn in una base ortonormale di Rn .
Dimostrazione . Se A è ortogonale allora l’isomorfismo A per quanto provato conserva le
lunghezze e l’ortogonalità ed inoltre essendo un isomorfismo trasforma una base in una base . Così
una base ortonormale di Rn è trasformata in una base ortonormale di Rn. Viceversa se
l’isomorfismo A trasforma una base ortonormale di Rn in una base ortonormale di Rn allora A è
ortogonale, per la proposizione 1.5, in quanto le sue colonne, essendo i trasformati della base
canonica di Rn , sono anch’esse una base ortonormale di Rn .

2. Applicazioni lineari simmetriche.


In questo numero Vn denota uno spazio vettoriale reale di dimensione finita n e dotato di
un prodotto scalare
s : Vn x Vn → R
definito positivo . Abbiamo già visto che se
f : Vn → Vn
è un’applicazione lineare di Vn in sé allora quando si scelga una base ordinata
B = ( e1 , e2 ,…, en) di Vn si può considerare la matrice Af che rappresenta f nella base scelta.
Tale matrice , quadrata d’ordine n , ha per colonne le coordinate nella base B dei vettori
f(e1) , f(e2) ,…, f(en)
ed è utile per il calcolo della funzione f in quanto, come abbiamo già visto , l’endomorfismo , che
indichiamo con A , che Af induce su Rn
A : Rn → Rn
135

fa corrispondere al vettore

⎛ x1 ⎞
⎜ ⎟
⎜x ⎟
x= ⎜ 2⎟
.
⎜ ⎟
⎜x ⎟
⎝ n⎠
delle coordinate di un vettore v di Vn il vettore

⎛ y1 ⎞ ⎛ a 11 a 12 .... a 1n ⎞ ⎛ x1 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜y ⎟ ⎜ a 21 a 22 .....a 2n ⎟ ⎜x2 ⎟
y = ⎜ 2 ⎟= ⎜ ..... ⎟ ⎜. ⎟
.
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜y ⎟ ⎜ a a .....a ⎟ ⎜x ⎟
⎝ n⎠ ⎝ n1 n2 nn ⎠ ⎝ n⎠

delle coordinate di f(v) rispetto alla base B.


Ovviamente tale calcolo diviene semplice , anche con n grande, quando tale matrice ha la
forma diagonale. Tale matrice ha però la forma diagonale se e solo se la base B scelta è una base di
autovettori per f . Abbiamo altresì visto che non sempre esiste una base di autovettori per f .
Quando tale base ”speciale” esiste la funzione lineare viene detta diagonalizzabile.
Scelta la base ordinata B = ( e1 , e2 ,…, en) di Vn si può considerare oltre alla matrice Af che
rappresenta f nella base B, anche la matrice quadrata
S= ( sij ) con sij = s( ei , ej)
d’ordine n che rappresenta il prodotto scalare s nella base B. Così come la matrice Af può
essere usata per il calcolo di f , anche la matrice S può essere usata per il calcolo di s. Vediamo.
Siano v e w due vettori di Vn .
Sia x= ( x1 , x2 ,…, xn) il vettore delle coordinate di v nella base B e sia y= ( y1 , y2 ,…, yn) il
vettore delle coordinate di w nella base B. Si ha :

v = x1 e1+ x2 e2 +…+xn en , w = y1 e1+ y2 e2 +…+yn en

Tenendo conto della bilinearità del prodotto scalare s si ha :

s(v , w ) = s (x1 e1+ x2 e2 +…+xn en , y1 e1+ y2 e2 +…+yn en ) = ∑


i, j
sij xi yj
136

Quando la base scelta è ortogonale allora è


sij = s( ei , ej) = 0 per i ≠ j
e così la matrice S ha la forma diagonale ed allora il calcolo del numero s(v , w ) è più semplice
risultando
s(v , w ) = s11 x1 y1 + s22 x2 y2 + …. + snn xn yn

Se la base B è ortonormale allora è

per ogni i= 1,2,..,n sii = s(ei , ei) = 1

e per i ≠ j sij = s(ei , ej) = 0

e così risulta S = I . In tal caso, come già visto, è :

s(v , w ) = x1 y1 + x2 y2 + …. + xn yn = < x , y >.

Da quanto detto segue che per rendere contemporaneamente diagonali le due matrici Af ed S che
rappresentano nella base B scelta , rispettivamente f ed s, la base B deve essere una base di
autovettori per f a due a due ortogonali.Ci sono alcune funzioni lineari speciali che sono dotate di
una base di autovettori a due a due ortogonali, come noi vogliamo, e che sono quindi
diagonalizzabili. Tali funzioni lineari sono le funzioni lineari simmetriche di cui ora ci
occuperemo.
Sia quindi Vn uno spazio vettoriale reale di dimensione finita n , dotato di un prodotto
scalare
s : Vn x Vn → R
definito positivo e sia
f : Vn → Vn

un’applicazione lineare di Vn in sé.


L’applicazione lineare f è detta simmetrica se per ogni coppia di vettori v e w di Vn risulta
:

(2.1) s ( v , f(w) ) = s ( f (v) , w ).


137

Ci sono funzioni lineari simmetriche ? La risposta è affermativa.


Infatti sia A una matrice quadrata d’ordine n reale e simmetrica.
L’ applicazione lineare
A : Rn → Rn

che la matrice A induce su Rn è simmetrica . Infatti essendo A = At risulta :

< x , Ay > = xt A y = xt At y = < Ax , y >

Sulla base della definizione è difficile controllare se una funzione lineare assegnata risulti
simmetrica. Risulta pertanto utile la seguente :

Proposizione 2.1. La funzione lineare f è simmetrica se e solo se la matrice che


rappresenta f in una base ortonormale di Vn risulta simmetrica.
Dimostrazione. Supponiamo che la funzione lineare f sia simmetrica e sia
B = ( e1 , e2 ,…, en) una base ortonormale di Vn. Indichiamo con A la matrice che rappresenta f
nella base B. Bisogna controllare che la matrice A risulta simmetrica.
Poiché la matrice A ha per colonne le coordinate di f(e1) , f(e2) , …, f(en) si ha fissati due indici i
e j distinti tra loro :
f(ei) = a1i e1 + a2i e2 + …+ ani en
f(ej) = a1j e1 + a2j e2 + …+ anj en
Si ha allora , essendo la base B ortonormale , :
s (f(ei) , ej ) = aji
s (f(ei) , ej ) = aij
e poiché f è simmetrica risulta s (f(ei) , ej ) = s (f(ei) , ej ) e cioè aji = aij .
Viceversa supponiamo che la matrice A che rappresenta f nella base ortonormale B risulti
simmetrica e proviamo che f è simmetrica.
Siano quindi v e w due vettori di Vn e siano
⎛ x1 ⎞ ⎛ y1 ⎞
⎜ ⎟ ⎜ ⎟
⎜x2 ⎟ ⎜ y2 ⎟
x= ⎜ ⎟ ed y= ⎜ ⎟
. .
⎜ ⎟ ⎜ ⎟
⎜x ⎟ ⎜y ⎟
⎝ n⎠ ⎝ n⎠
138

le loro coordinate nella base B. Si ha :

v = x1 e1+ x2 e2 +…+xn en , w = y1 e1+ y2 e2 +…+yn en

Ora ,come abbiamo già ricordato, la matrice A che rappresenta f nella base B , trasforma le
coordinate di v nelle coordinate di f(v) e le coordinate di w nelle coordinate di f(w). Inoltre poiché
la base è ortonormale il prodotto scalare di due vettori coincide col prodotto scalare euclideo delle
loro coordinate. Si ha allora :

s ( f(v) , w ) = < Ax , y > = xt At y


s (v , f(w) ) = < x , Ay > = xt A y

Poiché A è per ipotesi simmetrica si ha A = At e quindi


s ( f(v) , w ) = s (v , f(w) )
il che prova che f è simmetrica.
Come conseguenza della proposizione ora provata si ha facilmente che le uniche
applicazioni lineari simmetriche di Rn in sé sono quelle indotte su Rn da matrici simmetriche.

Per ciò che segue è importante la seguente :

Proposizione 2.2 Le radici del polinomio caratteristico di una funzione lineare f


simmetrica sono tutte reali.
Dimostrazione. Come già sappiamo il polinomio caratteristico di una funzione lineare f è
indipendente dalla base scelta per rappresentare f. Scegliamo quindi in Vn una base B ortonormale
e sia A la matrice simmetrica reale che rappresenta f nella base B. Sia λo una radice del
polinomio p(t) = det(A –It) caratteristico di f e sia y = (y1,y2,…,yn) una soluzione non nulla del
sistema omogeneo ( A – I λo) x = 0. Si ha quindi A y = λo y , esplicitamente è :

a11 y1 + a12 y2 +….+ a1n yn = λo y1


(*) a21 y1 + a22 y2 +….+ a2n yn = λo y2
……
an1 y1 + an2 y2 +….+ ann yn = λo yn
139

indichiamo con :
_

y1 il numero complesso coniugato del numero y1


_

y2 il numero complesso coniugato del numero y2

……
_

yn il numero complesso coniugato del numero yn

_ _

Ora moltiplichiamo la prima delle eguaglianze (*) per y1 , la seconda per y2 e l’ultima per
_

yn e poi sommiamo membro a membro. Si ha allora :

_ _ _ _ _

a11 y1 y1 + a22 y2 y2 + … + ann yn y


n
+ a12 ( y2 y1 + y1 y 2 ) + …+

_ _ _ _ _

+ a1n ( yn y1 + y1 y n ) = λo (y1 y1 + y2 y 2 + …+ yn y n )

Ora essendo la soluzione (y1,y2,…,yn) non nulla si ha che il coefficiente


_ _ _

(y1 y1 + y2 y 2 + …+ yn y n ) di λo è un numero reale positivo ed è reale anche il termine a


_

primo membro in quanto i numeri aij sono reali , i termini yi yi sono reali ed altrettanto risultano

_ _

reali i termini ( yi y j + yj yi ) in quanto ciascuno di essi coincide col suo complesso coniugato.

Pertanto λo risultando rapporto di due numeri reali è reale.

Siamo ora in grado di provare il seguente teorema fondamentale.

Proposizione 2.3. Sia f : Vn → Vn una funzione lineare di Vn in sé. Esiste una base
ortonormale di autovettori per f se e solo se f è simmetrica.
Dimostrazione. Se esiste una base B ortonormale di autovettori per f la matrice A che
rappresenta f nella base B è diagonale e quindi simmetrica. Ma se A è simmetrica la funzione f è
simmetrica per la Proposizione 2.1.
140

Supponiamo ora che f : Vn → Vn sia una funzione lineare simmetrica e proviamo che
esiste una base ortonormale di autovettori. Ragioniamo per induzione sulla dimensione n dello
spazio vettoriale Vn .
Se n = 1 allora è f : V1 → V1 . Sia w un vettore non nullo di V1. Poiché la
dimensione di V1 è uno allora w costituisce una base di V1 e quindi risulta f(w) =λ w. Pertanto w
1
è un autovettore per f e così w è un autovettore di lunghezza 1 e costituisce una base
w

ortonormale per V1 .
Supponiamo quindi n > 1 e vero il teorema per n-1. Sia λ1 un autovalore di f e sia e1 un
autovettore di autovalore λ1 con lunghezza eguale ad 1. Poiché e1 è non nullo lo spazio H1= [ e1
] da esso generato ha dimensione 1. Sia W il sottospazio complemento ortogonale del sottospazio
H1 . Come sappiamo il sosttospazio W è supplementare di H1 e quindi esso ha dimensione n-1.
Consideriamo la restrizione di f al sottospazio W e proviamo che essa è una funzione di W in W.
Infatti sia w un vettore di W e proviamo che anche f(w) appartiene a W . Infatti , essendo f
simmetrica , risulta :

s ( f(w) , e1 ) = s ( w , f(e1) ) = s ( w , λ1e1 ) = λ1 s ( w , e1 ) = 0

Pertanto è f : W → W ma poiché è dimW = n -1 allora per l’ipotesi di induzione


esiste in W una base (e2 , e3, …, en ) ortonormale di autovettori per f . Aggiungendo ai vettori
(e2 , e3, …, en ) il vettore e1 si ottiene una base (e1, e2 , e3, …, en ) ortonormale di Vn costituita
da autovettori per f .

Il teorema ora provato pur mostrando che una funzione lineare simmetrica è dotata di una
base ortonormale di autovettori non fornisce un metodo per costruire tale base .
Il teorema che segue ci aiuta a risolvere questo problema .

Proposizione 2.4 Sia f : Vn → Vn una funzione lineare simmetrica di Vn in sé. Due


autovettori v e w di f che abbiano autovalori distinti sono tra loro ortogonali.
Dimostrazione. Siano v e w due autovettori per f con autovalori λ e η distinti tra loro.
Vogliamo provare che v e w risultano tra loro ortogonali e cioè che è s ( v , w ) = 0 . Infatti si ha
per la simmetria di f :
(**) s ( f(v) , w ) = s ( v , f(w) )

ed essendo v e w autovettori di autovalori λ e η la (**) diventa :


141

s (λ v , w ) = s ( v , ηw )

da questa segue ancora :

λ s (v , w ) = η s ( v , w ) .

Si ha quindi ( λ - η ) s (v , w ) = 0 ed essendo λ - η ≠ 0 in quanto i due autovalori λ e η


sono distinti si ha s (v , w ) = 0 come si voleva provare.

Per la costruzione della base ortonormale di autovettori per f ora possiamo procedere al
seguente modo.
Attraverso il polinomio caratteristico determiniamo gli autovalori di f . Tali autovalori sono
n e tutti reali e ciascuno ha molteplicità algebrica eguale a quella geometrica in quanto f essendo
simmetrica è diagonalizzabile (cfr. proposizione 2.4).
Siano λ1 , λ2 …. λ t gli autovalori distinti di f e siano H1 , H2 ,…, Ht i corrispondenti
autospazi. Si costruisca in ogni sottospazio Hi una base Bi ortonormale . Unendo tra loro le basi
B1 , B2 , …, Bt si ottiene una base ortonormale di autovettori per f .
Un altro modo di procedere , più adatto alle applicazioni , è il seguente. Si fissi in Vn una
base B=(e1, e2 , e3, …, en ) ortonormale e si consideri la matrice A simmetrica che rappresenta f
nella base fissata. L’ applicazione lineare

A : Rn → Rn

indotta da A è simmetrica ed è quindi dotata di una base ortonormale di autovettori .


Come sappiamo f ed A hanno gli stessi autovalori ed inoltre ogni autovettore di A è il vettore delle
coordinate nella base B di un autovettore per f .
Siano quindi
⎛ α1 ⎞ ⎛ β1 ⎞ ⎛ γ1 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜α2 ⎟ ⎜β2 ⎟ ⎜ γ2 ⎟
p1 = ⎜ ⎟ , p2 = ⎜ . ⎟ ,……….., pn = ⎜. ⎟
.
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜α ⎟ ⎜β ⎟ ⎜γ ⎟
⎝ n⎠ ⎝ n⎠ ⎝ n⎠

n autovettori di A a due a due ortogonali e ciascuno di lunghezza 1.


I vettori
142

v1 = α1 e1+ α 2 e2 +. ….+ α n en

v2 = β1 e1+ β 2 e2 +. ….+ β n en

. …..
vn = γ1 e1+ γ 2 e2 +. ….+ γ n en

sono quindi autovettori per f . Inoltre essendo la base B ortonormale risulta

s ( vi , vj) = < pi, pj >

e quindi (v1, v2 ,. …, vn ) è una base ortonormale di autovettori per f.

Facciamo qualche esempio.

Esercizio.
Si stabilisca se la seguente funzione lineare
f( x , y ) = ( 2x + y , x + 2y)
di R2 in sé è simmetrica . In caso affermativo si determini una base ortogonale di autovettori per f .

Svolgimento. Si consideri la base canonica B = {(1,0) , (0,1) } di R2 . Tale base è


ortonormale e la matrice che rappresenta f in tale base è la seguente :

⎛2 1⎞
A = ⎜⎜ ⎟
⎝1 2 ⎟⎠
Poiché A è simmetrica la funzione f è simmetrica.
Gli autovalori di f sono le radici del polinomio caratteristico
⎛2 - t 1⎞
p(t) = ⎜⎜ ⎟⎟ = ( 2-t )2 - 1 = t2 – 4t +3 = 0
⎝ 1 2 - t ⎠
e sono quindi i numeri 1 e 3 .Gli autovettori di A sono anche autovettori per f in quanto la base B è
la base canonica. Gli autovettori di autovalore 1 si ottengono attraverso le soluzioni del sistema
omogeneo
x+y=0
e sono quindi (1 , -1) e tutti i suoi multipli.
Gli autovettori di autovalore 3 si ottengono attraverso le soluzioni del sistema omogeneo
143

-x + y = 0
e sono quindi (1 , 1) e tutti i suoi multipli. Pertanto {(-1,1) , ( 1, 1) } è una base ortogonale di
1
autovettori ognuno dei quali ha lunghezza 2 . Moltiplicando ciascuno di essi per si ottiene
2
una base ortonormale di autovettori.
144

Forme bilineari
145

Forme bilineari

Prima di addentrarci nell’argomento richiamiamo alcune nozioni che ci serviranno in seguito.


Una matrice A quadrata d’ordine n che sia invertibile è detta ortogonale se la sua inversa coincide
con la sua trasposta .

A ortogonale < = > At = A-1

Indichiamo con a1 a2 ….. an le righe della matrice A e con a1 a2 … an le sue colonne.


Se A è ortogonale da A At = I segue che

⎧1 se i = j
(*) ai x aj = ⎨
⎩0 se i ≠ j

e ciò mostra che le righe di A sono una base ortonormale di Rn. Viceversa se le righe di A sono
una base ortonormale di Rn allora si ha A At = I e quindi At = A-1 il che mostra che A è una
matrice ortogonale .
Analogamente se A è ortogonale da At A = I segue che

⎧1 se i = j
(*) ai x aj = ⎨
⎩0 se i ≠ j

e ciò mostra che le colonne di A sono una base ortonormale di Rn. Viceversa se le colonne di A
sono una base ortonormale di Rn allora si ha At A = I e quindi
At = A-1 il che mostra che A è una matrice ortogonale .
Ricordiamo ora due utili definizioni.
Due matrici quadrate A ed A’ d’ordine n sul campo K si dicono simili se esiste una matrice
P invertibile tale che risulti :

A’ = P-1 A P

si dicono congruenti se esiste una matrice P invertibile tale che risulti


146

A’ = Pt A P

Matrici simili ,come già visto, hanno gli stessi autovalori e lo stesso rango mentre matrici
congruenti hanno lo stesso rango ma in generale non gli stessi autovalori.

Sia Vn = Vn(R) uno spazio vettoriale di dimensione n sul campo reale. Una applicazione
g : Vn x Vn ----- > R
( v , w ) ---- > g ( v , w )

è detta una forma bilineare se valgono le seguenti proprietà :

1. g ( α v , w ) = α g ( v , w)
2. g ( v + v’ , w ) = g(v , w) + g ( v’ , w )
3. g (v , α w ) = α g ( v , w)
4. g ( v , w + w’ ) = g(v , w) + g ( v , w’)

La forma bilineare g è detta simmetrica se risulta

g(v,w) =g(w,v) per ogni coppia di vettori v e w.

Ovviamente se g è simmetrica le proprietà 1., 2. sono equivalenti alle proprietà 3., 4.

Esempi di forme bilineari di Rn si ottengono al seguente modo.


Si consideri una matrice A = ( aij) reale quadrata d’ordine n e sia
gA : Rn x Rn → R
l’ applicazione così definita :
gA ( x , y ) = x t A y

avendo al solito indicato con x ed y i vettori numerici


⎛ x1 ⎞ ⎛ y1 ⎞
⎜ ⎟ ⎜ ⎟
⎜x2 ⎟ ⎜ y2 ⎟
x= ⎜ ⎟ ed y = ⎜ ⎟
. .
⎜ ⎟ ⎜ ⎟
⎜x ⎟ ⎜y ⎟
⎝ n⎠ ⎝ n⎠
Esplicitamente è :
147

gA ( x , y ) = a11x1y1+a12x1y2+…+a1nx1yn + a21x2y1+a22x2y2+…+a2nx2yn +………+


+ an1xny1+ an2xny2 +….+ annxnyn

Se la matrice A è simmetrica si ha :

gA ( x , y ) = x t A y = y t A t x = y t A x = gA ( y , x )

e quindi la forma bilineare che essa definisce è simmetrica.


Le forme bilineari ora introdotte sono rilevanti come mostra ciò che segue.

Sia quindi Vn = Vn(R) uno spazio vettoriale di dimensione n sul campo reale. e

g : Vn x Vn ----- > R
( v , w ) ---- > g ( v , w )
una forma bilineare di Vn .

Come si può calcolare facilmente il numero g ( v , w ) ? Vediamo.

Fissiamo nello spazio vettoriale Vn una sua base B = ( e1 , e2, …, en ) . Denotiamo per
ogni i , j = 1,2,…,n con

aij = g ( ei , ej )

e sia A = ( aij ) la matrice così determinata. La matrice A così costruita si dice che rappresenta g
nella base B. Se v e w sono due vettori si ha :

v = x1e1 +...+ xnen , w = y1e1 +...+ ynen

e quindi si ha . tenendo conto che g è bilineare ,

(3.1) g ( v , w ) = g ( x1e1 +...+ xnen , y1e1 +...+ ynen ) =


= a11x1y1+a12x1y2+…+a1nx1yn + a21x2y1+a22x2y2+…+a2nx2yn +………+
+ an1xny1+ an2xny2 +….+ annxnyn
148

Se indichiamo con

⎛ x1 ⎞ ⎛ y1 ⎞
⎜ ⎟ ⎜ ⎟
⎜x ⎟ ⎜y ⎟
x= ⎜ 2⎟ ed y = ⎜ 2⎟
. .
⎜ ⎟ ⎜ ⎟
⎜x ⎟ ⎜y ⎟
⎝ n⎠ ⎝ n⎠

le coordinate dei vettori v e w nella base B allora l’espressione (3.1) sopra espressa può scriversi in
forma matriciale al seguente modo :

g ( v , w ) = xt A y
Quindi risulta
g ( v , w ) = xt A y = gA ( x , y )

Come cambia la matrice A cambiando la base B ? Vediamo.

Sia B’ = ( e’1 , e’2 ,….,e’n) un’ altra base dello spazio vettoriale e sia P la matrice di
passaggio dalla base B alla base B’. La matrice P ha per colonne le coordinate dei vettori e’i di B’
rispetto alla base B ed è quindi invertibile. Si ha quindi

⎛ ⎞
⎜ ⎟
( e1 , e2 ,….,en) ⎜ P ⎟ = ( e’1 , e’2 ,….,e’n)
⎜ ⎟
⎝ ⎠

Denotiamo con A’ la matrice che rappresenta g nella base B’ e per ogni coppia di vettori v e w con

⎛ x'1 ⎞ ⎛ y'1 ⎞
⎜ ⎟ ⎜ ⎟
⎜ x'2 ⎟ ⎜ y'2 ⎟
x’ = ⎜ ⎟ ed y’ = ⎜ ⎟
. .
⎜ ⎟ ⎜ ⎟
⎜ x' ⎟ ⎜ y' ⎟
⎝ n⎠ ⎝ n⎠
149

le coordinate dei vettori v e w nella base B’. Si ha

⎛ x'1 ⎞ ⎛ x'1 ⎞ ⎛ x1 ⎞
⎜ ⎟ ⎛ ⎞⎜ ⎟ ⎜ ⎟
⎜ x'2 ⎟ ⎜ ⎟ ⎜ x'2 ⎟ ⎜x2 ⎟
v = ( e’1 , e’2 ,….,e’n) ⎜ ⎟ = ( e1 , e2 ,….,en) ⎜ P ⎟ ⎜ ⎟ = ( e1 , e2 ,….,en) ⎜. ⎟
. ⎜ ⎟ ⎜. ⎟
⎜ ⎟ ⎝ ⎠⎜ ⎟ ⎜ ⎟
⎜ x' ⎟ ⎜x ⎟
⎝ n⎠ ⎝ x'n ⎠ ⎝ n⎠

⎛ y'1 ⎞ ⎛ y'1 ⎞ ⎛ y1 ⎞
⎜ ⎟ ⎛ ⎞⎜ ⎟ ⎜ ⎟
⎜ y'2 ⎟ ⎜ ⎟ ⎜ y'2 ⎟ ⎜ y2 ⎟
w = (e’1 , e’2 ,….,e’n) ⎜ ⎟ = ( e1 , e2 ,….,en) ⎜ P ⎟ ⎜ ⎟ = ( e1 , e2 ,….,en) ⎜. ⎟
. ⎜ ⎟ ⎜. ⎟
⎜ ⎟ ⎝ ⎠⎜ ⎟ ⎜ ⎟
⎜ y' ⎟ ⎜y ⎟
⎝ n⎠ ⎝ y'n ⎠ ⎝ n⎠

da cui segue quindi

P x’ = x e P y’ = y

Si ha allora

g ( v , w ) = xt A y = x’t P t A P y’ = x’t A’ y’

da cui segue

A’ = P t A P

Abbiamo così provato che cambiando la base B con la base B’ , la matrice A legata alla base B
cambia , e la nuova matrice A’ legata alla nuova base B’ è congruente alla matrice A.
Una rappresentazione piuttosto semplice della forma bilineare g si ha quando essa è
simmetrica. Vediamo.
Supponiamo quindi ora che la forma bilineare g sia simmetrica .
Fissiamo una base B=( e1 , e2 ,….,en) nello spazio vettoriale e sia A la matrice che
rappresenta g nella base B. Poichè g è simmetrica la matrice A è simmetrica. La funzione lineare di
Rn in sè indotta da A che è così definita
150

⎛ y1 ⎞ ⎛ x1 ⎞
⎜ ⎟ ⎛ ⎞⎜ ⎟
⎜ y2 ⎟ ⎜ ⎟ ⎜x2 ⎟
⎜. ⎟ = ⎜ A ⎟⎜ ⎟
⎜ ⎟ ⎜ ⎟ ⎜. ⎟
⎜y ⎟ ⎝ ⎠⎜ ⎟
⎝ n⎠ ⎝xn ⎠
è una funzione lineare simmetrica . Pertanto per quanto già visto essa ammette una base
ortonormale di auto vettori. Esistono quindi n vettori p1 , p2 ,…, pn di Rn a due a due ortogonali e
ciascuno di lunghezza uno che sono autovettori per la funzione A. Indicando con λ1 , λ2 , …. ,
λn gli autovalori degli autovettori p1 , p2 ,…, pn si ha quindi :

(3.2) A p1 = λ1 p1 . A p2 = λ2 p2 , …….. , A pn = λ2 pn

Sia P la matrice quadrata d’ordine n le cui colonne sono gli autovettori p1 , p2 ,…, pn e D
la matrice diagonale avente sulla diagonale gli autovalori λ1 , λ2 , …. , λn .

Se ci è utile possiamo disporre le colonne pi nella matrice P in modo che le prime s colonne
siano costituite dagli autovettori con autovalore positivo , poi quelle con autovalore negativo ed
infine quelle con autovalore zero. In tal modo sulla diagonale della matrice D appaiono nei primi s
posti gli autovalori positivi , poi quelli negativi e poi sempre zero.

Le relazioni (3.2) sopra scritte equivalgono alla seguente eguaglianza tra matrici

⎛ ⎞⎛ ⎞ ⎛ ⎞⎛ ⎞
⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟
⎜ A ⎟⎜ P ⎟ =⎜ P ⎟⎜ D ⎟
⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟
⎝ ⎠⎝ ⎠ ⎝ ⎠⎝ ⎠

Da A P = P D segue
P-1A P = D

Poiché la matrice P è ortogonale si ha allora :

P-1A P = Pt A P = D.

Se B’ = ( e’1 , e’2 ,….,e’n) è la base di Vn ottenuta attraverso l’uso della matrice ortogonale P
151

⎛ ⎞
⎜ ⎟
( e1 , e2 ,….,en) ⎜ P ⎟ = ( e’1 , e’2 ,….,e’n)
⎜ ⎟
⎝ ⎠

Per quanto abbiamo prima visto la matrice A’ che rappresenta g nella base B’ è Pt A P e cioè è la
matrice D .L’espressione di g nella base B’ diventa allora :

(3.3) g(v,w) = λ1x1 y1+ λ2 x2 y2 +…. , λt xt yt t≤n

avendo indicato con λ1 , λ2 , …. , λt gli autovalori non nulli della matrice A.


Poiché la matrice A è congruente alla matrice D essa ha lo stesso rango di D la quale ha rango pari
al numero di autovalori diversi da zero.
Se al posto della base iniziale B avessimo scelto un’altra base B° allora la nuova matrice A° legata
alla base B° anch’essa, seguendo lo stesso procedimento, sarebbe stata congruente ad una matrice
diagonale D° avente sulla diagonale gli autovalori di A°.
Poiché A ed A° sono congruenti esse pur non avendo gli stessi autovalori hanno lo stesso rango e
quindi D e D° hanno lo stesso rango. Per tale ragione D e D° avranno sulla diagonale lo stesso
numero di elementi diversi da zero.
Si conclude così che nell’espressione

g(v,w) = λ1x1 y1+ λ2 x2 y2 +…. , λt xt yt t≤ n

cambiando base possono cambiare i coefficienti ma resta invariato il numero di addendi di tale
espressione in quanto non cambia il numero di autovalori diversi da zero.

Se
g : Vn x Vn → R

è una forma bilineare simmetrica si chiama forma quadratica associata a g l’applicazione


q : Vn → R

così definita :
q(v) = g (v , v)
152

Per quanto precede si è visto che è possibile determinare una opportuna base
B=( e1 , e2 ,….,en) dello spazio vettoriale nella quale la matrice che indichiamo con D legata a tale
base è di forma diagonale e l’espressione di q è del tipo :

q(v) = λ1 x 12 + λ2 x 22 +…. , λt x 2t t≤ n

Possiamo inoltre ritenere lecito che i primi s autovalori siano positivi ed i rimanenti quelli negativi.
La seguente matrice J diagonale è non degenere ed essendo diagonale coincide con la sua
trasposta.

Usando tale matrice possiamo cambiare la base B in un’altra base


B’ = ( e’1 , e’2 ,….,e’n) ottenuta al seguente modo

⎛ ⎞
⎜ ⎟
( e1 , e2 ,….,en) ⎜ J ⎟ = ( e’1 , e’2 ,….,e’n)
⎜ ⎟
⎝ ⎠
Nella base B’ così ottenuta la matrice che rappresenta g è ora la seguente Jt D J
153

⎛1 ⎞
⎜ ⎟
⎜ 1 ⎟
⎜ 1 ⎟
⎜ ⎟
Jt D J = ⎜ −1 ⎟
⎜ −1 ⎟
⎜ ⎟
⎜ 0 ⎟
⎜ 0 ⎟
⎝ ⎠

e l’espressione di q rispetto a tale base diventa :

q(v) = x 12 + x 22 +…. + x s2 - x s2+1 -…- x 2t t≤ n

Abbiamo già visto che qualunque sia la base scelta all’inizio il numero di autovalori non nulli
rimane costante. Ciò che vale ulteriormente è che il numero di autovalori positivi rimane costante e
quindi nell’espressione

q(v) = x 12 + x 22 +…. + x s2 - x s2+1 -…- x 2t t≤ n

il numero di 1 e -1 è costante.
Supponiamo che in due basi differenti B e B’ si trova che l’espressione di q è

q(v) = x 12 + x 22 +…. + x s2 - x s2+1 -…- x 2t t≤ n nella base B

q(v) = x 12 + x 22 +…. + x 2m - x 2m +1 -…- x 2t t≤ n nella base B’

Mostreremo che risulta m = s e quindi le due espressioni coincidono. Tale rappresentazione si


chiama la forma canonica di q ed il numero di 1 e -1 che in essa figurano è detta la segnatura della
forma.

Supponiamo per assurdo che sia m ≠ s e per fissare le idee sia s > m.
Siano L e T i seguenti sottospazi di Vn

L = {v ∈ Vn : xs+1=xs+2=..=xn= 0 nella base B }


154

T = {v ∈ Vn : x1 = x2 =….= xm = 0 nella base B’ }

I due sottospazi sono evidentemente isomorfi il primo a Rs ed il secondo a Rn-m.


Pertanto per la formula di Grassmann si ha :

dim (L ∩ T ) = dim L + dim T – dim ( L + T ) ≥ s + n-m – n = s-m > 0

Esiste pertanto un vettore v non nullo comune ad L e a T.


Calcolando allora q(v) si ha q(v) > 0 essendo le coordinate xs+1,xs+2,…xn di v nella base B tutte
nulle . Lo stesso vettore v nella base B’ ha le coordinate x1 ,x2 ,…., xm
tutte nulle e quindi è q(v) ≤ 0. L’ asserto è così provato.
Concludiamo con qualche utile osservazione :
Se A= ( aij ) è una matrice reale quadrata d’ordine n abbiamo già visto che essa induce in Rn
una forma bilneare , che abbiamo indicato con gA , ponendo :

gA ((x1,x2,…,xn) , (y1,y2,…,yn) ) = a11x1y1+a12x1y2+…+a1nx1yn + a21x2y1+a22x2y2+…+a2nx2yn


+………+
+ an1xny1+ an2xny2 +….+ annxnyn

Se indichiamo con B = ( u1, u2 ,…,un ) la base canonica di Rn si ha facilmente

gA (ui, uj) = aij

e così è A stessa la matrice che rappresenta gA nella base canonica.


Ne segue che se A è una matrice non simmetrica per qualche coppia di indici i e j si ha aij ≠ aji e
quindi gA (ui , uj) ≠ gA (uj , ui) . Pertanto la forma bilineare è simmetrica se e solo se A è una
matrice simmetrica.
Se A è simmetrica l’ espressione
gA ((x1,x2,…,xn) , (y1,y2,…,yn) ) = a11x1y1+a12x1y2+…+a1nx1yn + a21x2y1+a22x2y2+…+a2nx2yn
+………+
+ an1xny1+ an2xny2 +….+ annxnyn
quando la si calcoli sulla coppia ((x1,x2,…,xn) , (x1,x2,…,xn) ) diventa
a11x1x1+a12x1x2+…+a1nx1xn + a21x2x1+a22x2x2+…+a2nx2xn +………+
+ an1xnx1+ an2xnx2 +….+ annxnxn
155

e tenendo conto che è aij = aji la forma quadratica associata ha la seguente espressione :
a11 x 12 + a22 x 22 +…. + ann x 2n + 2 a12x1x2 + ….+ 2 a1nx1xn +………+ 2 an-1 nxn-1xn
Si conclude che se si vuole risalire alla matrice A attraverso l’espressione della forma quadratica si
deve tener conto che il numero che accompagna il monomio xixj è il doppio di aij .
A titolo di esempio la matrice simmetrica associata alla seguente forma quadratica di R2

q (x ) = 3 x 12 + 8 x 22 + 4 x1x2

è la seguente
⎛3 2⎞
A = ⎜⎜ ⎟⎟
⎝ 2 8⎠
156

Indice
Capitolo I. Spazi vettoriali
1. Gruppi abeliani……………………………………………………………………4
2. Nozione di campo ………………………………………………………………..6
3. Spazi vettoriali su un campo ……………………………………………………..8
4. Isomorfismi tra spazi vettoriali…………………………………………………..23
5. I sottospazi di uno spazio vettoriale ……………………………………………..31

Capitolo II - Matrici e determinanti

1. Introduzione……………………………………………………………………40
2. Determinante di una matrice quadrata………………………………………….41
3. Prodotto di matrici………………………………………………………………47
4. Rango di una matrice…………………………………………………………. 50

Capitolo III – Sistemi di equazioni lineari

1 . Sistemi di equazioni lineari …………………………………………………… 59


2. Sistemi omogenei…………………………………………………………………73

Capitolo IV – Prodotti scalari.

1. Prodotti scalari…………………………………..……………………………….84

Capitolo V – Triangolazione di una matrice quadrata- Diagonalizzazione di un endomorfismo.

1. Triangolazione di una matrice quadrata …………………………………………. 94


2. Diagonalizzazione di un endomorfismo……………………………………….. …..99
157

Capitolo VI – Funzioni lineari simmetriche


1. Il gruppo lineare ed il gruppo ortogonale …………………………………………. 128
2. Applicazioni lineari simmetriche……………… ………………………………… 133
3. Forme bilineari ……………………………………………………………………..145
1

Note di geometria

Prof. Domenico Olanda

Anno accademico 2008-09


2

Prefazione

Questo testo raccoglie alcune lezioni di geometria da me svolte negli anni accademici
2008-2009 per gli studenti del corso di laurea in Matematica

dell’ Università degli studi di Napoli “ Federico II “.


Il primo capitolo è dedicato alla geometria analitica del piano e dello spazio.
Nel secondo capitolo , attraverso le nozioni di piano affine e proiettivo, c’è un
approccio ai fondamenti della geometria del piano reale.
Un approccio simile è dedicato allo spazio nel quinto capitolo.
I capitoli terzo e quarto sono dedicati allo studio delle coniche del piano proiettivo
complesso.
Il sesto capitolo è dedicato allo studio delle quadriche dello spazio proiettivo complesso
di dimensione tre.
L’ ultima parte è una sintetica esposizione delle nozioni più importanti di topologia
generale.
Il libro si conclude con una personale valutazione dei nuovi ordinamenti didattici.

Prof. Domenico Olanda


3

Capitolo I

La geometria analitica del piano e dello spazio


4

1. Introduzione

In questo capitolo analizzeremo alcuni risultati di geometria analitica utilizzati nelle


applicazioni. Spesso ci sarà il solo riferimento al risultato senza la sua dimostrazione.
Prima di addentrarci nell’esposizione ,allo scopo di facilitare la lettura di questo argomento,
è utile ricordare due risultati di algebra lineare acquisiti nella prima parte .

Il primo risultato che richiamiamo è un semplice, ma molto utile teorema .

Teorema. Se in uno spazio vettoriale h vettori { v1 , v2 ,…… vh } sono indipendenti mentre


{v1 , v2 ,…vh , w} sono dipendenti allora il vettore w dipende dai vettori v1 , v2 ,…… vh .

Il secondo risultato che richiamiamo è il seguente .

Indichiamo con V = R[ x, y ,z] lo spazio vettoriale dei polinomi di grado al più uno nelle variabili
x,y,z a coefficienti reali. L’ applicazione

ƒ : V -----> R4

(ax + by + cz + d ) -----> (a , b , c , d )

che associa al polinomio ax + by + cz + d la quaterna dei suoi coefficienti è un isomorfismo


tra gli spazi vettoriali V ed R4 .

Per tale ragione la dipendenza tra polinomi può essere ricondotta alla corrispondente
dipendenza tra i vettori numerici dei loro coefficienti.

Così a titolo di esempio il polinomio ax + by + cz + d dipende dai polinomi


a’x + b’y + c’z + d’ e a”x + b”y + c”z + d” se e solo se la quaterna (a , b , c , d ) dipende
dalle due quaterne (a’ , b’ , c’ , d’) e (a” , b” , c” , d”) .
Il risultato che abbiamo ora richiamato vale ovviamente in generale , può essere cioè esteso allo
5

spazio vettoriale dei polinomi in n variabili , e l’averlo ricordato per i polinomi a tre variabili è
motivato dalla circostanza che ci troveremo spesso in questa situazione .

Svilupperemo la nostra rassegna analizzando contemporaneamente risultati di geometria


piana e dello spazio allo scopo di evidenziare l’unità dei metodi usati nell’uno e nell’altro caso e
l’ identità di risultati quando si ha a che fare con rette di un piano o con piani dello spazio.
Supporremo noto il concetto di riferimento cartesiano nel piano e nello spazio e la capacità di
assegnare in un riferimento fissato le coordinate ai punti del piano o dello spazio. Ricordiamo solo
che nel piano le coordinate di un punto sono costituite da una coppia ordinata di numeri reali
mentre nello spazio le coordinate di un punto sono una terna ordinata di numeri reali.
Riterremo d’ora in poi che sia sempre fissato un riferimento monometrico ortogonale.

Se r è una retta del piano ed A e B sono due suoi punti distinti le componenti del vettore
(AB) nel riferimento fissato sono date dai seguenti due numeri reali :

λ= xB – xA µ = yB - y A

Questi due numeri reali non entrambi nulli (essendo A e B distinti ) forniscono la misura relativa
dei segmenti evidenziati in neretto in figura, proiezioni di (AB) sugli assi del riferimento. Si noti
che se si ruota “un poco“ (AB) questi due numeri cambiano e precisamente uno dei due aumenta e
l’altro diminuisce. Pertanto questi due numeri aumentano entrambi o diminuiscono entrambi se e
solo se si allunga o si accorcia (AB) ; di più esse ,ad esempio, si triplicano se (AB) si triplica , si
dimezzano se (AB) si dimezza e così via.
6

I numeri reali ( λ , µ ) vengono chiamati numeri direttori della retta r e la loro determinazione è
molto utile per le applicazioni . Se i punti A e B vengono sostituiti da altri due punti distinti C e D
allora è (CD) = ρ (AB) (dove ρ è un numero reale non nullo ) e quindi è :

λ’= ( xD – xC ) = ρ (xB – xA ) = ρ λ , µ’ = ( yD - y C) = ρ (yB - y A) = ρ µ

Pertanto i numeri direttori di r sono una coppia di numeri reali non entrambi nulli e definiti a
meno di un fattore di proporzionalità non nullo.

Analogamente se siamo nello spazio ed r è una sua retta scelti due punti distinti A e B su r , i tre
numeri reali ( non tutti e tre nulli )

λ= xB – xA , µ = yB - yA , ν = zB - z A

sono chiamati i numeri direttori di r . Per le stesse argomentazioni precedenti i numeri


(λ , µ , ν ) numeri direttori di r sono mai tutti e tre nulli contemporaneamente e sono definiti
a meno di un fattore di proporzionalità non nullo .

I numeri direttori , una volta noti , possono essere utilizzati per valutare l’eventuale parallelismo tra
rette sia nel piano e sia nello spazio. Sussistono infatti le seguenti equivalenze :

Teorema 1 . Due rette r ed r’ del piano sono parallele se e solo se esse hanno gli stessi numeri
direttori (cioè i numeri direttori ( λ, µ ) di r sono eguali o proporzionali ai numeri ( λ ’, µ’ )
direttori di r’) .

Teorema 2 . Due rette r ed r’ dello spazio sono parallele se e solo se esse hanno gli stessi numeri
direttori (cioè i numeri direttori ( λ, µ, , ν ) di r sono eguali o proporzionali ai numeri direttori
( λ’, µ’ , , ν’ ) di r’ ) .

Ricordiamo che se (AB) e (CD) sono due vettori non nulli del piano o dello spazio, si
7

definisce loro prodotto scalare il numero reale ξ che si ottiene eseguendo il seguente calcolo

ξ = | AB | | CD | cosφ

avendo indicato con | AB | e | CD | le lunghezze dei due segmenti e con φ l’angolo che essi
formano. Ovviamente i due segmenti risultano tra loro ortogonali se e solo se il loro prodotto
scalare si annulla . Avendo scelto il riferimento monometrico ed ortogonale allora è ben noto che
risulta

ξ = | AB | | CD | cosφ = λ λ’ + µ µ’

avendo indicato con ( λ , µ ) le componenti di (AB) e con (λ’, µ’ ) le componenti di (CD).


Analogamente se (AB) e (CD) sono vettori dello spazio risulta

ξ = | AB | | CD | cosφ = λ λ’ + µ µ’ + ν v’

avendo indicato con ( λ , µ , ν ) le componenti di (AB) e con (λ’, µ’, v’ ) le componenti di


(CD).

I numeri direttori una volta noti possono essere quindi utilizzati per valutare l’eventuale
ortogonalità tra rette sia nel piano e sia nello spazio.

Sussistono infatti le seguenti equivalenze :

Teorema I . Due rette r ed r’ del piano sono ortogonali se e solo se risulta :

λ λ’ + µ µ’ = 0

Teorema II . Due rette r ed r’ dello spazio sono ortogonali se e solo se risulta :

λ λ’ + µ µ’ + ν ν’ = 0
8

Questi teoremi mostrano come sia essenziale saper determinare di una retta i suoi numeri
direttori . Si possono dedurre tali numeri da una rappresentazione della retta ? Vediamo.

Intanto , come si rappresenta una retta ? C’è un modo di rappresentare allo stesso modo
una retta sia che essa sia una retta del piano o dello spazio. Vediamo come .

Sia r una retta del piano e siano A e B due suoi punti distinti . Un punto P(x,y) del piano
appartiene ad r se e solo se risulta

(AP) = ρ (AB)

o equivalentemente se e solo se :

( x- xA , y - yA ) = ρ ( xB – xA , yB - yA )

Pertanto le coordinate di (x,y) di P sono espresse dalle seguenti relazioni

⎧x = x A + ρ ( x Β − x A )
(1) ⎨
⎩y = y A + ρ ( y Β − y A )

Le (1) forniscono al variare del parametro ρ nel campo reale le coordinate (x,y) dei punti di r e
per questo motivo vengono chiamate le equazioni parametriche di r .

Si noti che nelle (1) i due numeri che accompagnano il parametro ρ sono i numeri direttori di r.
Pertanto se la retta r è rappresentata parametricamente i numeri direttori sono i due numeri che
accompagnano il parametro ρ .

Sia ora r una retta dello spazio e siano A e B due suoi punti distinti . Un punto P(x,y,z)) dello
spazio appartiene ad r se e solo se risulta

(AP) = ρ (AB)
9

o equivalentemente se e solo se :

( x- xA , y - yA , z - zA ) = ρ ( xB – xA , yB - yA , zB - zA)

Pertanto le coordinate di (x,y,z) di P sono espresse dalle seguenti relazioni

⎧ x = x A + ρ(x B − x A )

(2) ⎨ y = y A + ρ(y B − y A )
⎪ z = z + ρ(z −z )
⎩ A B A

Le (2) forniscono al variare del parametro ρ nel campo reale le coordinate (x,y,z) dei punti di r e
per questo motivo vengono chiamate le equazioni parametriche di r .

Si noti che nelle (2) i tre numeri che accompagnano il parametro ρ sono i numeri direttori di r.
Pertanto se la retta r è rappresentata parametricamente i numeri direttori sono i tre numeri che
accompagnano il parametro ρ .

Sia r una retta del piano ed A e B due suoi punti distitnti . Un punto P (x,y) del piano appartiene
ad r se e solo se risulta (AP) = ρ (AB) cioè se e solo se i due vettori AP ed AB sono dipendenti .
Poiché il passaggio alle componenti di un vettore è un isomorfismo allora la dipendenza dei due
vettori (AP) ed (AB) equivale alla dipendenza dei vettori numerici ( x- xA , y - yA ) ,
( xB – xA , yB - yA ) . Questi due vettori numerici sono dipendenti se e solo se risulta :

⎛ x y 1⎞
⎛x - xA , y - yA ⎞ ⎜ ⎟
(1*) det ⎜⎜ ⎟⎟ = det ⎜ x A y A 1 ⎟ = 0
⎝xB - xA , yB - yA ⎠ ⎜ x y 1⎟
⎝ B B ⎠
10

Sviluppando tale determinante si ottiene un’equazione di primo grado in x ed y del tipo

(i) ax + by + c = 0

soddisfatta da tutte e sole le coppie (x, y) coordinate dei punti di r . La (i) è detta la
rappresentazione cartesiana di r . Ovviamente ogni equazione proporzionale alla (i) avendo le
stesse soluzioni di (i) rappresenta sempre la retta r .
Si prova facilmente che , viceversa , un’equazione di primo grado in x e y rappresenta una retta del
piano.
Quindi una retta del piano può essere rappresentata o in forma parametrica o in forma cartesiana.
Per esempio rappresentiamo la retta per i punti A(2,5) e B (4 , 8) .
Usando la (1) tale retta si rappresenta con

⎧x = 2 + 2 ρ
(a) ⎨
⎩ y = 5 + 3ρ

Usando (1*)

⎛x y 1⎞
⎜ ⎟
det ⎜ 2 5 1 ⎟ =0
⎜4 8 1 ⎟⎠

si ha :

(b) 3x - 2y +4 =0.

Si noti che all’equazione (b) si poteva pervenire anche usando la rappresentazione parametrica (a).
Infatti da (a) segue
11

x−2 y−5
ρ = ρ =
2 3

e quindi eguagliando si ha l’equazione (b).

Ora se la retta r è rappresentata con l’equazione

ax + by + c = 0

come si possono calcolare i suoi numeri direttori ? Vediamo .


Se A (xA , yA ) e B (xB , yB ) sono due punti di r allora le loro coordinate verificano
l’equazione ax + by + c = 0 e pertanto si ha :

a xB + b yB + c = 0

a xA + b yA + c = 0

Sottraendo membro a membro le due relazioni sopra scritte si ha :

a (xB – xA ) + b (yB – yA ) =0

o equivalentemente

⎛xB - xA yB - yA ⎞
det ⎜⎜ ⎟⎟ = 0
⎝ -b a ⎠

La relazione sopra scritta mostra che la coppia ( - b , a ) è proporzionale alla coppia


( xB – xA , yB – yA ) che è appunto una coppia di numeri direttori di r . Pertanto se la retta è
rappresentata dall’equazione ax + by + c = 0 allora una coppia di numeri direttori di r è data dalla
coppia (-b , a ).
Possiamo allora riformulare i teoremi 1 ed I al seguente modo :

Teorema 2 . Due rette del piano r ed r’ rappresentate da


12

r : ax + by + c = 0
r’ : a’x + b’y + c’ = 0

sono parallele se e solo se risulta (-b , a ) = (-b’ , a’) o equivalentemente

(j) ( a , b ) = ρ (a’ , b’ ) .

A questa conclusione si poteva pervenire direttamente senza utilizzare il teorema 1 in quanto la


condizione (j) equivale a

⎛a b ⎞
det ⎜⎜ ⎟⎟ =0
⎝ a' b' ⎠

e tale condizione è necessaria e sufficiente affinché il sistema

⎧ ax + by + c = 0

⎩ a' x + b' y + c' = 0

abbia infinite soluzioni o nessuna soluzione.

Il teorema I può quindi essere così altresì enunciato

Teorema II ’ . Due rette del piano r ed r’ rappresentate da

r : ax + by + c = 0

r’ : a’x + b’y + c’ = 0

sono ortogonali se e solo se risulta


13

aa’ + bb’ = 0

Concludiamo tale numero cercando di rappresentare tutte le rette che passino per un fissato punto
A( xo , yo ) . Tale insieme di rette viene chiamato fascio di rette di centro A .

Siano r ed r’ due rette per A ( xo , yo ) rappresentate da :

r : ax + by + c = 0

r’ : a’x + b’y + c’ = 0

Poichè A appartiene sia ad r che ad r’ le sue coordinate soddisfano entrambe le equazioni. Ne


consegue che se consideriamo un’equazione del tipo

(** ) α(ax + by + c) + β ( a’x + b’y + c’ ) = 0

con ( α , β ) ≠ (0,0 ) ottenuta combinando linearmente le due equazioni date, essa


rappresenta una retta ancora per il punto A in quanto le coordinate di A la soddisfano qualunque sia
la scelta dei coefficienti α e β . Se ogni retta per A si ottiene mettendo nella (**) un opportuno
valore di α ed un opportuno valore di β allora al variare di questi due parametri α e β la
(**) descrive tutte le rette per A e quindi rappresenta il fascio di rette di centro A.
Sia quindi r” una qualunque retta per A rappresentata dall’equazione :

r” : a”x + b”y + c” = 0

Il sistema formato dalle tre equazioni

⎧ ax + by + c = 0

⎨ a' x + b' y + c' = 0
⎪ a”x + b”y + c” = 0

14

risulta compatibile in quanto la coppia ( xo , yo ) è una sua soluzione. Ne consegue che la matrice
completa ha lo stesso rango di quella incompleta e quindi ha rango due .
Risulta allora

⎛a b c ⎞
⎜ ⎟
det ⎜ a' b' c' ⎟ =0
⎜ a" b" c" ⎟
⎝ ⎠

Le tre righe di tale matrice sono quindi dipendenti e poiché le prime due sono indipendenti allora la
terza è combinazione lineare delle prime due e così si ha l’asserto.
Due rette per il punto A( xo , yo ) di semplice rappresentazione sono quelle per A parallele agli
assi coordinati cioè le rette di equazione

x - xo = 0 ed y - yo = 0

e pertanto, per ciò che precede, l’equazione

α ( x - xo ) + β (y - yo) = 0

al variare di α , β rappresenta tutte le rette per A e per tale motivo viene chiamata l’equazione
del fascio di rette di centro A.

2. Rette e piani dello spazio.

Sia ora π un piano dello spazio e siano A, B , C tre punti di π distinti e non allineati. Un
punto P(x,y,z) dello spazio appartiene al piano π se e solo se i vettori
(AP) , (AB), (AC) sono dipendenti o equivalentemente se e solo se le tre terne

( x- xA , y - yA , z - zA ), ( xB – xA , yB - yA , zB - zA) , (xC – xA , yC - yA , zC - zA)

sono dipendenti. Ma allora il punto P(x,y,z) dello spazio appartiene al piano se e solo se risulta
15

⎛ x -x A y -y A z -z A ⎞
⎜ ⎟
det ⎜ x B -x A y B -y A z B -z A ⎟ = det
⎜ x -x z C -z A ⎟⎠
⎝ C A y C -y A
⎛x y z 1⎞
⎜ ⎟
⎜ xA yA zA 1⎟
=0
⎜x y z 1⎟
⎜ B B B

⎜x y zC 1 ⎟⎠
⎝ C C

Sviluppando il determinante sopra scritto si ottiene un’ equazione di primo grado in x, y , z del tipo

ax + by + cz + d = 0

soddisfatta da tutte e sole le terne (x, y, z) coordinate dei punti P di π . Ovviamente ogni
equazione proporzionale ad essa avendo le stesse soluzioni rappresenta pur sempre il piano π.
Si prova facilmente che , viceversa , un’equazione di primo grado in x . y, z rappresenta un piano
dello spazio .

A titolo di esempio si voglia rappresentare il piano π per i tre punti A ( 1 , 0 , 0 ) B(0,1,2)


C(1 , 1 , 3). Per le argomentazioni precedenti l’equazione di tale piano si ottiene sviluppando il
determinante :

⎛x y z 1⎞
⎜ ⎟
⎜1 0 0 1⎟
det ⎜ =0
0 1 2 1⎟
⎜ ⎟
⎜1 1 3 1⎟⎠

Si ha quindi che il piano richiesto ha equazione : x + 3y – z – 1 = 0.

Siano π e π’ due piani dello spazio rappresentati rispettivamente da :

π: ax + by + cz + d = 0
16

π’ : a’x + b’y + c’z + d’ = 0

E’ ben noto che il sistema S

⎧ ax + by + cz + d = 0
S: ⎨
⎩ a' x + b' y + c' z + d' = 0

formato dalle due equazioni che rappresentano i piani π e π’ ha soluzioni se e solo se le due
matrici
⎛a b c ⎞ ⎛a b c d⎞
A = ⎜⎜ ⎟⎟ A’ = ⎜⎜ ⎟
⎝ a' b' c' ⎠ ⎝ a' b' c' d' ⎟⎠

hanno lo stesso rango .

Se il rango di A è due allora anche A’ ha rango due e quindi il sistema S ha infinite soluzioni. In
questo caso quindi i due piani hanno una retta in comune ed il sistema S fornisce una
rappresentazione di tale retta .
Se la matrice A ha rango uno allora bisogna controllare il rango di A’ . Se anche A’ ha rango uno
allora le due righe di A’ sono proporzionali e quindi i due piani dati coincidono e sono quindi
paralleli ( impropriamente ) . Se il rango di A’ è due il sistema S non ha soluzioni e quindi i due
piani non avendo punti in comune sono tra loro paralleli ( propriamente ). La conclusione delle
nostre argomentazioni può essere riassunta nel seguente teorema analogo al teorema 1.1 già
stabilito per due rette di un piano .

Teorema 2.1 Siano π e π’ due piani dello spazio rappresentati rispettivamente da :

π: ax + by + cz + d = 0

π’ : a’x + b’y + c’z + d’ = 0

I piani π e π’ sono paralleli se e solo se risulta


17

( a , b , c ) = ρ ( a’ , b’ , c’ )
Abbiamo così visto che una retta r dello spazio può essere rappresentata in due modi : in forma
parametrica oppure con un sistema di due equazioni rappresentative di due piani distinti che la
contengono.

Sia r una retta dello spazio rappresentata dal seguente sistema S:

⎧ ax + by + cz + d = 0
r: ⎨
⎩ a' x + b' y + c' z + d' = 0

Come si possono dedurre i numeri direttori di r da tale rappresentazione ? Vediamo.


Se A (xA , yA , zA ) e B ( xB , yB , zB ) sono due punti di r allora le loro
coordinate verificano il sistema S che rappresenta r , e quindi valgono le seguenti relazioni :

a xB + b yB + c zB + d = 0
a xA + b yA + c zA + d = 0

a’ xB + b’ yB + c’ zB + d’ = 0
a’ xA + b’ yA + c’ zA + d’ = 0

Dalle relazioni sopra scritte , sottraendo membro a membro , si ha :

⎧ a (x B - x A ) + b (y B - y A ) + c (z B - z A ) = 0
(ii) ⎨
⎩ a' (x B - x A ) + b' (y B - y A ) + c' (z B - z A ) = 0

Le (ii) mostrano che i tre numeri direttori ( xB - xA , yB - yA , zB - zA ) che stiamo cercando


sono una soluzione non nulla del sistema omogeneo (nelle incognite , m n ) seguente :
18

⎧ a + bm + c n = 0

⎩ a' + b' m + c' n = 0

e quindi essi possono ottenersi ( come già visto nel capitolo III ) calcolando, a segno alterno, i
determinanti delle matrici

⎛ b c⎞ ⎛ a c ⎞ ⎛a b ⎞
⎜⎜ ⎟ , ⎜⎜ ⎟⎟ , ⎜⎜ ⎟⎟
⎝ b' c' ⎟⎠ ⎝ a' c' ⎠ ⎝ a' b' ⎠

ottenute dalla matrice

⎛a b c ⎞
⎜⎜ ⎟⎟
⎝ a' b' c' ⎠

dei coefficienti cancellando la prima ,la seconda e la terza colonna.

Siano r una retta dello spazio rappresentata parametricamente da :

⎧ x = x o + ρλ

r: ⎨ y = y o + ρµ
⎪ z = z + ρυ
⎩ o

e π un piano rappresentato dall’ equazione ax + by + cz + d = 0 . Un punto P della retta r


ha coordinate (xo + ρ λ , yo + ρµ , zo + ρ ν ) e tale punto appartiene anche al piano se
le sue coordinate soddisfano l’equazione del piano cioè se vale la seguente eguaglianza :

(jjj) a ( xo + ρ λ ) + b (yo + ρ µ ) + c (zo + ρ ν ) + d = 0 .

Quindi ogni valore di ρ che renda soddisfatta la (jjj) dà luogo ad un punto della retta che giace
19

anche nel piano. Bisogna quindi determinare le soluzioni della (jjj ) pensata come equazione in ρ .
La (jjj) come equazione in ρ è di primo grado e del tipo :

(jjj) Aρ + B = 0

Avendo posto :

A=aλ + bµ + cν e B = a xo + + b yo + c zo + d .

−B
Ora se risulta A ≠ 0 l’equazione (jjj) ha una sola soluzione data da ρ = ed in tal caso
A
−B
il piano e la retta hanno un solo punto in comune quello corrispondente al valore ρ =
A
trovato.
Se invece A = 0 ed è B = 0 allora ogni valore di ρ soddisfa (jjj) e quindi ogni punto della
retta giace nel piano . Quindi se A = 0 e B = 0 la retta giace nel piano . Se A = 0 ma è B≠ 0
allora la (jjj) non ha soluzioni e quindi nessun punto della retta giace nel piano.

Le argomentazioni sopra fatte portano quindi ad enunciare il seguente teorema.

Teorema 2.2 Una retta r dello spazio di numeri direttori ( λ , µ , ν ) ed un piano π


rappresentato dall’equazione ax + by + cz + d = 0 sono paralleli se e solo se risulta :

a λ + b µ + c ν = 0.

Sia π un piano passante per l’origine delle coordinate e sia

ax + by + cz = 0

l’equazione che lo rappresenta .


20

Consideriamo il punto A ( a, b , c ) di coordinate (a,b,c). Tale punto è distinto dall’origine,


essendo ( a, b , c ) ≠ (0,0,0 ) e non appartiene al piano π in quanto aa + bb + cc > 0 .
Se P (x , y , z ) è un punto del piano π risulta ax + by + cz = 0 e ciò mostra che i due
vettori OA ed OP sono tra loro ortogonali . Abbiamo così mostrato che il vettore OA è
ortogonale ad ogni vettore OP del piano e quindi OA è ortogonale al piano . La retta OA che ha
numeri direttori ( a, b , c ) è quindi ortogonale al piano di equazione ax + by + cz = 0 .
Ovviamente un piano parallelo a π conserva gli stessi coefficienti (a , b , c ) ed una retta parallela
alla retta OA conserva gli stessi numeri direttori e così è provato il seguente teorema :

Teorema 2.3 Una retta r di numeri direttori ( λ , µ , ν ) risulta ortogonale ad un


piano di equazione ax + by + cz + d = 0 se e solo se risulta

( λ , µ , ν) = ρ ( a, b , c )

Siano ora dati due piani π e π’ distinti e non paralleli e sia t la retta ad essi comune.
I piani π e π’ siano rappresentati rispettivamente da

π: ax + by + cz + d = 0

π’ : a’x + b’y + c’z + d’ = 0

Si consideri un punto A non appartenente ai due piani e siano r la retta per A ortogonale a π ed r’ la
retta per A ortogonale a π’ . La retta r essendo ortogonale a π ha numeri direttori (a , b , c ) ed r’
essendo ortogonale a π’ ha numeri direttori ( a’ , b’ , c’ ). Il piano determinato da r ed r’ è
21

ortogonale alla retta t e contiene il quadrilatero di lati r, r’,s, s’ , avendo indicato con s la retta
π ∩ π” e con s’ la retta π’ ∩ π” .

Facendo riferimento alla figura gli angoli α e β opposti tra loro in questo quadrilatero sono
ovviamente tra loro supplementari essendo retti gli altri due. Inoltre i piani π e π’ sono tra loro
ortogonali se e solo se β è un angolo retto. Valgono così le seguenti equivalenze :

π π
π ┴ π’ <=> β = <=> α = < = > r ┴ r’
2 2
Ne segue che i due piani sono ortogonali se e solo se tali risultano le due rette r ed r’. Tenendo
conto del teorema II di pagina 4 resta provato il seguente

Teorema 2.4 Due piani π e π’ rappresentati rispettivamente da

π: ax + by + cz + d = 0

π’ : a’x + b’y + c’z + d’ = 0

sono tra loro ortogonali se e solo se risulta


22

a a’ + b b’ + c c’ = 0

3. Fasci di piani

Sia r una retta rappresentata dal sistema

⎧ ax + by + cz + d = 0
r: ⎨
⎩ a' x + b' y + c' z + d' = 0

l’ insieme di tutti i piani che contengono la retta r è chiamato fascio di piani di asse r.
Sia P (xo , yo , zo ) un punto qualsiasi di r . Allora P con le sue coordinate soddisfa entrambe le
equazioni del sistema . Ne consegue che se consideriamo un’equazione del tipo

(** ) α(ax + by + cz + d ) + β ( a’x + b’y + c’z + d’ ) = 0

con ( α , β ) ≠ (0,0 ) ottenuta combinando linearmente le due equazioni date, essa


rappresenta ancora un piano per la retta r in quanto le coordinate di P soddisfano tale equazione
qualunque sia la scelta dei coefficienti α e β . Se ogni piano per r si ottiene mettendo nella (**)
un opportuno valore di α ed un opportuno valore di β allora al variare di questi due parametri α
e β la (**) descrive tutti i piani per r e quindi rappresenta il fascio di piani di asse r .
Sia quindi π” un qualunque piano per r rappresentato dall’equazione :

π” a’’x + b’’y + c’’z + d’’ = 0 .

Il sistema formato dalle tre equazioni

⎧ ax + by + c z + d = 0

⎨ a' x + b' y + c' z + d' = 0
⎪ a”x + b”y + c”z + d" = 0

23

ha infinite soluzioni fornite dalle coordinate dei punti di r . Pertanto le due matrici del sistema
hanno lo stesso rango . Ora la matrice incompleta

⎛a b c ⎞
⎜ ⎟
A= ⎜ a' b' c' ⎟
⎜ a" b" c" ⎟⎠

ha rango due altrimenti il sistema avrebbe una unica soluzione e così anche quella completa

⎛a b c d ⎞
⎜ ⎟
A’ = ⎜ a' b' c' d' ⎟
⎜ a" b" c" d" ⎟
⎝ ⎠
deve avere rango due . Pertanto le tre righe di A’ sono dipendenti e poiché le prime due sono
indipendenti si ha che la terza riga è combinazione delle prime due. Si ha così l’asserto.

4. – Stelle di piani .

In tale numero cercheremo di rappresentare tutti i piani che passino per un fissato punto
A( xo , yo , zo) . Tale insieme di piani viene chiamato stella di piani di centro A .

Siano π , π’ e π” tre piani per A ed aventi in comune il solo punto A. I piani π , π’ e π”


siano rappresentati da

π : ax + by + cz + d = 0

π’ : a’x + b’y + c’z + d’ = 0

π” : a”x + b”y + c”z + d” = 0

Poiché i tre piani dati hanno in comune il solo punto A allora il sistema formato dalle tre equazioni
che rappresentano i tre piani π , π’ e π” ha una sola soluzione e quindi la sua matrice incompleta
24

ha il determinante diverso da zero.


Inoltre poichè A appartiene sia a π sia a π’ e sia a π’’ le sue coordinate soddisfano tutte e
tre le equazioni. Ne consegue che se consideriamo un’equazione del tipo

(*) α(ax + by + cz + d ) + β ( a’x + b’y + c’ z + d’)+ γ ( a’’x + b’’y + c’’z + d’’) = 0

con ( α , β , γ ) ≠ (0,0,0 ) ottenuta combinando linearmente le tre equazioni date, essa


rappresenta un piano, ancora per il punto A , in quanto le coordinate di A la soddisfano qualunque
sia la scelta dei coefficienti α , β e γ . Se ogni piano per A si ottiene mettendo nella (*) un
opportuno valore di α ,un opportuno valore di β ed un opportuno valore di γ allora al variare
dei parametri α , β e γ la (*) descrive tutti i piani per A e quindi rappresenta la stella di piani
di centro A.
Sia quindi π0 un qualunque piano per A rappresentato dall’equazione :

π0 : aox + boy + coz + do = 0

Il sistema formato dalle quattro equazioni

⎧ ax + by + cz + d = 0
⎪ a' x + b' y + c' z + d' = 0


⎪ a”x + b”y + c”z + d" = 0
⎪⎩ a o x + b o y + co z + d o = 0

risulta compatibile in quanto la terna ( xo , yo , zo ) è una sua soluzione. Ne consegue che la matrice
completa ha lo stesso rango di quella incompleta e quindi ha rango tre.
Risulta allora

⎛a b c d ⎞
⎜ ⎟
⎜ a' b' c' d' ⎟
det ⎜ =0
a" b" c" d" ⎟
⎜ ⎟
⎜a b c d o ⎟⎠
⎝ o o o

Le quattro righe di tale matrice sono quindi dipendenti e poiché le prime tre sono indipendenti
allora la quarta è combinazione lineare delle prime tre e così si ha l’asserto.
Tre piani per il punto A(xo , yo , zo) di semplice rappresentazione sono quelli per A paralleli ai
25

piani coordinati cioè i piani rappresentati da :

x - xo = 0 y - yo = 0 z - zo = 0

pertanto, per ciò che precede, l’equazione

α ( x - xo ) + β (y - yo) + γ (z - zo ) = 0

al variare di α , β e γ rappresenta tutti i piani per A e per tale motivo viene chiamata l’equazione
della stella di piani di centro A .

Concludiamo con alcuni esercizi . Prima di far ciò evidenziamo alcune


semplici proprietà d'incidenza tra, punti , rette e piani dello spazio utili per le
applicazioni .

1. Siano dati un punto A ed una retta r non contenente A.

a) C’ è una sola retta per A parallela ad r .

b) C' è un sol piano che contiene A ed r . In tale piano giacciono tutte le rette per
A incidenti r .
c) C' è un sol piano per A ortogonale ad r . In tale piano giacciono tutte le rette
per A ortogonali ad r .

2. Siano dati un punto A ed un piano π non contenente A.

a) C'è un sol piano per A parallelo a π . Tale piano contiene tutte le rette per
A parallele a π .

b) C’ è una sola retta per A ortogonale a π .

3. Siano dati una retta r ed un piano π non contenente r . La retta r sia incidente il
26

piano ma non sia ortogonale al piano

a) C’è un sol piano per r ortogonale a π .

4. Siano date due rette r ed s tra loro sghembe.

a) C’ è un sol piano per r parallelo ad s .

Concludiamo con qualche esercizio .

Fissato nello spazio un riferimento monometrico ortogonale, siano dati il punto


A (1 , 1, 2) il piano π rappresentato da 2x + y -3z + 1 = O e la retta r rappresentata da

⎧ x - 2y = 0
r: ⎨
⎩ x+z-2 =0

Si rappresentino

1. La retta per A parallela ad r .

2. La retta per A ortogonale a π

3. Il piano per A parallelo a π .

4. Il piano per A ortogonale ad r

5. Il piano per A ed r .

6. Il piano per r ortogonale a π.

7. La retta per A incidente r e parallela a π .

8. La retta per A incidente r ed ortogonale ad r .

Soluzioni .
Come già detto i numeri direttori di r si ottengono attraverso i minori (presi a segno
alterno ) della matrice

⎛1 -2 0⎞
⎜⎜ ⎟
⎝1 0 1 ⎟⎠
27

e pertanto sono (-2 , -1 , 2 ) o una terna proporzionale come ad esempio ( 2 , 1 , -2 ).

Quesito 1.
La retta richiesta dovendo essere parallela ad r deve avere gli stessi numeri direttori
di r quindi essa si rappresenta parametricamente al seguente modo:

⎧ x = 1 + 2ρ

⎨ y =1+ ρ
⎪ z = 2 − 2ρ

Quesito 2 .
La retta richiesta per essere ortogonale a π deve avere numeri direttori
proporzionali ai coefficienti (a,b,c) dell’equazione del piano. Pertanto la retta richiesta si
rappresenta parametricamente al seguente modo:

⎧ x = 1 + 2ρ

⎨ y =1+ ρ
⎪ z = 2 − 3ρ

Quesito 3.
Il piano richiesto , dovendo passare per A ha una rappresentazione del tipo
a(x-1) + b(y-1) + c(z-2) = 0 (stella di piani di centro A )
Inoltre tale piano dovendo essere parallelo a π deve soddisfare la condizione di parallelismo
tra piani. Bisogna pertanto scegliere (a , b ,c) proporzionali a (2 , 1 , -3 ). Il piano
richiesto ha quindi equazione 2(x-1) + (y-1) -3(z-2) = 0 cioè 2x + y -3z + 3 = 0.

Quesito 4 .
Il piano richiesto , dovendo passare per A ha una rappresentazione del tipo
a(x-1) + b(y-1) + c(z-2) = 0 (stella di piani di centro A )
Inoltre tale piano dovendo essere ortogonale ad r deve avere i coefficienti (a ,b,c )
proporzionali ai numeri direttori di r che sono (2, 1, -2). Il piano richiesto ha quindi
equazione
2(x-1) + (y-1) -2(z-2) = 0
cioè 2x + y -2z + 1 = 0.
28

Quesito 5.
Un qualunque piano per la retta r si rappresenta ( al variare dei parametri h e k )
con l’equazione
h(x-2y) + k (x+z-2) =0 .

Tale piano (h+k)x -2hy + kz -2k = 0 contiene il punto A se le coordinate di A sono una sua
soluzione quindi se h+ k -2k +2k -2k = h-k = 0. Quindi è h=k e pertanto il piano richiesto
è (scegliendo h = k =1 ) 2x-2y +z -2= 0.

Quesito 6.
Un qualunque piano per la retta r si rappresenta ( al variare dei parametri h e k )
con l’equazione
h(x-2y) + k (x+z-2) =0 .
Tale piano (h+k)x -2hy + kz -2k = 0 è ortogonale al piano π se è soddisfatta la condizione
di ortogonalità tra piani cioè se è 2(h+k) -2h -3k = -k=0 . Quindi è
k = 0 e pertanto il piano richiesto è (scegliendo h = 1) x – 2y = 0.

Quesito 7
La retta richiesta dovendo passare per A ed incidere r si trova sul piano che contiene
A ed r. Dovendo inoltre passare per A ed essere parallela a π si trova sul piano per A
parallelo a π. Quindi la retta richiesta dovendo stare su questi due piani è la retta comune a
questi due piani e quindi si rappresenta con

⎧ 2x − 2y + z - 2 = 0

⎩ 2 x + y - 3z + 3 = 0
Quesito 8
La retta richiesta dovendo passare per A ed incidere r si trova sul piano che contiene
A ed r. Dovendo inoltre passare per A ed essere ortogonale ad r si trova sul piano per A
ortogonale a r. Quindi la retta richiesta dovendo stare su questi due piani è la retta comune
a questi due piani e quindi si rappresenta con

⎧ 2x − 2y + z - 2 = 0

⎩ 2x + y - 2z + 1 = 0
29

Capitolo II
Piani affini e proiettivi
30

1. Piani affini e proiettivi.

Un piano affine è una coppia ( α , R ) dove α è un insieme non vuoto i cui elementi
sono detti punti ed R è una famiglia di parti proprie, ognuna di cardinalità almeno due , i cui
elementi sono detti rette verificante le seguenti proprietà :

1. due punti appartengono ad una unica retta.


2. dati una retta l ed un punto p non appartenente ad l esiste una sola retta per p ad

intersezione vuota con l ( unicità della parallela )

3. esistono tre punti non allineati.

Sia ( α , R ) un piano affine . Due rette r ed r’ le diciamo parallele se è r = r’


oppure è r ∩ r’ = ∅ . Tale relazione è, come è facile controllare , una relazione
d’equivalenza nell’insieme R delle rette del piano.
Per la proprietà 2 (unicità della parallela ) una retta r insieme a tutte le sue parallele
fornisce una partizione dei punti del piano.
Inoltre una retta r e tutte le sue parallele definiscono un fascio improprio di rette del
piano.
L’insieme di tutte le rette passanti per un fissato punto p viene chiamato fascio proprio di
rette di centro p.

Un piano proiettivo è una coppia ( π, L ) dove π è un insieme non vuoto i cui elementi
sono detti punti ed L è una famiglia di parti proprie di π i cui elementi sono detti rette
verificante le seguenti proprietà :

a) due punti appartengono ad una unica retta.


b) due rette distinte si intersecano in un unico punto.
c) esistono quattro punti a tre a tre non allineati .

Le proprietà a) , b) , c) sono equivalenti ad

a) due punti appartengono ad una unica retta.


b) due rette distinte si intersecano in un unico punto.
31

c’) ogni retta ha almeno tre punti .

Dimostrazione.
Supponiamo che siano verificate le proprietà a) , b) , c) e siano A , B , C , D i
quattro punti a tre a tre non allineati che il piano possiede. Sia L una retta qualsiasi di π .
Uno dei punti A , B , C , D non appartiene ad L e sia , per fissare le idee , il punto A.
Poiché A , B , C , D sono punti a tre a tre non allineati allora risultano distinte le tre rette
AB , AC , AD . Tali rette intersecano L in tre punti distinti e così L ha almeno tre punti.
Viceversa supponiamo siano verificate le proprietà a) , b) , c’) . Siano L ed L’ due
rette distinte (esse esistono perché le rette sono parti proprie) e sia O il punto che hanno in
comune. Poiché ogni retta ha almeno tre punti possiamo scegliere su L – {O } due punti
distinti A e B e su L’ – {O } due punti distinti C e D . I quattro punti A, B, C , D sono a tre
a tre non allineati e l’asserto è così provato.

Il primo risultato importante relativo a tali strutture è il seguente :

Proposizione 1.1. Le rette di un piano affine sono equipotenti . Le rette di un piano


proiettivo sono equipotenti.
Dimostrazione . Sia ( α , R ) un piano affine e siano r ed r’ due sue rette tra loro
incidenti. Sia y il punto comune ad r ed r’. Siano p un punto di r distinto da y e sia p’ un
punto di r’ distinto da y . Sia t la retta pp’. Per ogni punto x di r sia t’ la retta per x
parallela a t e sia x’ il punto di incontro tra t’ ed r’. La corrispondenza x Æ x’ è biettiva
onde è | r | = | r’ | . Se le rette r ed r’ sono tra loro parallele si consideri la retta t che unisce un
punto p di r con un punto p’ di r’. Essendo la retta t incidente sia r che r’ risulta per ciò che
precede | r | = | t | e | r’ | = | t | onde è ancora | r | = | r’ | .
Sia ora ( π , L ) un piano proiettivo e siano r ed r’ due rette distinte incidenti tra loro nel
punto y . Siano p un punto di r distinto da y e sia p’ un punto di r’ distinto da y . Sia t la retta
pp’. Poiché t ha almeno tre punti c’è su t un punto z distinto da p e p’. Il punto z non
appartiene quindi né ad r né ad r’ . Per ogni punto x di r sia x’ il punto di r’ intersezione tra
la retta r’ e la retta [x z]. La corrispondenza xÆ x’ è biettiva onde è | r | = | r’ | .

Per gli scopi di questa trattazione supporremo che gli insiemi α e π sostegni dei due piani ,affine
e proiettivo, siano infiniti e che tali risultino le loro rette.
32

Due piani affini ( α ,R ) e ( α ’ , R ’ ) si dicono isomorfi se esiste una biezione


f : α Æ α’ tra i sostegni α ed α ’ che trasforma rette di α in rette di α ’ .
E’ facile controllare che se f è un isomorfismo anche la funzione inversa f-1 è un
isomorfismo in quanto trasforma le rette di α ’ nelle rette di α .
Evidentemente se due piani affini sono isomorfi allora la cardinalità delle rette di α
eguaglia la cardinalità delle rette di α ’
Due piani proiettivi ( π , L ) e ( π’ , L ‘) si dicono isomorfi se esiste una biezione
f : π → π’ tra i sostegni π ed π’ che trasforma rette di π in rette di π’ .
E’ facile controllare che se f è un isomorfismo, anche la funzione inversa f-1 è un
isomorfismo in quanto trasforma le rette di π’ nelle rette di π .
Evidentemente se due piani proiettivi sono isomorfi allora la cardinalità delle rette di π
eguaglia la cardinalità delle rette di π’ .
Osservando le due definizioni date, di piano affine e piano proiettivo, si osserva che la
differenza di fondo è che in un piano affine ci sono rette ad intersezione vuota ( rette parallele
tra loro ) mentre in un piano proiettivo due rette hanno sempre un punto in comune.
L’ aspetto comune è che in entrambe le strutture per due punti passa una sola retta.
Mostreremo ora come ogni piano affine possa , con l’aggiunta di opportuni nuovi punti e
nuove rette, essere trasformato in un piano proiettivo . E’ chiaro a priori che i punti che
aggiungeremo dovranno far sì che due rette che nel piano affine hanno intersezione vuota nel
nuovo piano abbiano un punto in comune.
Vediamo come si effettua questa costruzione.
Sia r una retta del piano affine . Indichiamo con Or un oggetto da noi scelto e che
chiamiamo punto improprio ed ampliamo la retta r aggiungendo ad essa questo nuovo punto .
Ogni retta del piano ha quindi un nuovo punto ed il criterio che seguiremo per tale attribuzione è
il seguente :
Or = Os ⇔ r è parallela ad s

(esplicitamente : il punto Or aggiunto ad r coincide col punto Os aggiunto ad s se e solo se


r ed s sono rette tra loro parallele )
Pertanto con tale criterio una retta s parallela ad r sarà ampliata con lo stesso punto che
abbiamo aggiunto ad r ed in tal modo le due rette r ed s , prima tra loro parallele, risultano
ora incidenti nel punto Or che è ad esse comune .
33

Indichiamo con ∆ l’insieme di tutti i punti impropri Or al variare di r nel piano . Che
cardinalità ha ∆ ? Vediamo .
Si consideri un punto p del piano e sia Fp il fascio proprio di rette di centro p . Per ogni
retta r di Fp indichiamo sempre con Or il suo punto improprio . E’ chiaro che i punti Or al
variare di r in Fp sono tutti distinti tra loro ed esauriscono come ora vedremo l’insieme ∆ .
Infatti sia t una retta del piano non passante per p . Se r è l’unica retta per p parallela a t allora
il punto Ot aggiunto alla retta t coincide con il punto Or aggiunto alla retta r.
Pertanto i punti impropri sono tanti quante le rette per p . Chiameremo ∆ retta impropria.
Sia r una retta del piano e pensiamola ampliata col suo punto improprio Or . Sia p un punto
non appartenente ad r . Le rette per p sono tante quanti i punti di r ampliata . Infatti la
corrispondenza
x∈r → [p,x] ∈ Fp
che associa ad un punto x di r la retta [p,x] che unisce p ed x è biettiva.
Pertanto anche una retta r del piano quando la si pensi ampliata col suo punto improprio ha
tanti punti quante le rette di un fascio proprio.
Si consideri ora l’insieme π = α ∪ ∆ ottenuto aggiungendo ad α i nuovi punti ,
quelli impropri. Per distinguere i punti di π tra vecchi e nuovi , chiameremo propri i punti di π
che sono punti di α ed impropri i punti π di che sono punti di ∆ . Sia ora L la seguente
famiglia di parti di π . Chiameremo rette gli elementi di L . Per ogni retta r del piano
affine indichiamo con r* = r ∪ { Or } il sottoinsieme di π ottenuto aggiungendo ad r il suo
punto improprio Or . Le rette di π elementi di L sono ∆ , detta retta impropria , e tutte le
rette ampliate r* al variare di r nel piano affine ( α , R ). Le rette r* sono dette proprie.
Ora proveremo che la coppia ( π , L ) è un piano proiettivo.
Siano p e p’ due punti distinti di π . Se p e p’ sono entrambi propri , detta r la retta di
α per essi, allora r* è l’ unica retta di π che contiene tali due punti. Se p e p’ sono entrambi
impropri allora ∆ è l’unica retta che contiene tali due punti. Se p è proprio e p’ = Os è
improprio allora detta r l’unica retta di ( α , R ) per p parallela ad s si ha che r* è l’ unica
retta di π che contiene i due punti p e p’ .
Siano ora l ed l’ due rette distinte di ( π , L ). Se una delle due è la retta impropria, per
esempio sia l’ = ∆ allora la retta l essendo propria possiede un solo punto improprio che è
quindi l’unico punto che essa ha in comune con l’ . Possiamo quindi supporre che entrambe le
rette l ed l’ siano proprie . Poniamo quindi l = r ∪ { Or } ed l’ = s ∪ {Os } . Se le rette r ed
s del piano ( α , R ) sono parallele allora è Or = Os e quindi l ed l’ hanno in comune
34

tale punto Or . Se r incide s nel punto p allora p è il punto comune ad l ed l’ .


Poiché ogni retta r di ( α , R ) ha almeno due punti allora ogni retta r* ampliata ha
almeno tre punti e così ogni fascio proprio di rette con centro un punto p di α ha almeno tre
rette. Ne segue che anche la retta ∆ ha almeno tre punti.
Abbiamo così provato che la coppia ( π , L ) è un piano proiettivo.

Il piano proiettivo così ottenuto viene chiamato l’ampliamento proiettivo del piano affine.

Possiamo ora far vedere che ogni piano proiettivo è isomorfo ad uno ottenuto come
ampliamento di un piano affine . Vediamo.
Sia quindi ( π , L ) un piano proiettivo e sia Lo una sua retta. Priviamo il piano proiettivo
della retta Lo e di tutti i suoi punti . Quindi consideriamo ciò che rimane dopo questa
depauperazione . Denotiamo con α l’insieme ottenuto privando π dei punti di Lo . Le rette di
α sono le rette L di π , distinte da Lo , ciascuna privata del punto che essa ha in comune con
Lo. Indicando con
R = { l = L – ( L ∩ Lo ) , L ≠ Lo L ∈ L }
la famiglia di tali rette possiamo ora far vedere che la coppia ( α , R ) è un piano affine .
Siano p e p’ due punti distinti di α . Essendo p e p’ punti distinti di π c’è una sola retta L nel
piano proiettivo che contiene questi due punti . La retta l = L – ( L ∩ Lo ) è quindi l’unica retta
di α per tali due punti. Sia ora l = L – L ∩ Lo una retta di α e p un punto di α non
appartenente ad l . Sia L’ la retta del piano proiettivo che unisce i punti p e po = L ∩ Lo .
La retta l’ = L’ – {po} è l’unica retta di α per p parallela ad l .
Poiché in α esistono almeno due rette esistono tre punti non allineati. La coppia ( α , R ) è
quindi un piano affine .
Sia po un punto di Lo . Consideriamo tutte le rette L di π distinte da Lo passanti per po ,
Ognuna di tali rette , privata del punto po , dà luogo ad una retta l del piano affine. Ne segue
che tutte le rette l ottenute in corrispondenza alle rette L per po sono tra loro a due a due
parallele e costituiscono quindi nel piano α un fascio improprio. Se si aggiunge ad ognuna di
tali rette il punto po come loro punto improprio si ottiene un piano proiettivo isomorfo al piano
( π , L ) ( l’identità realizza infatti un isomorfismo tra questi due piani) .

Mostreremo ora due esempi . Il primo sarà un esempio di piano affine .Il secondo sarà un
esempio di piano proiettivo. Per entrambi gli esempi ci serviremo del campo dei numeri reali
(perché questo è utile ai nostri scopi ) ma la costruzione che faremo sarebbe possibile ed eguale
35

se sostituissimo il campo reale con un altro campo .

2. Esempio di piano affine: Il piano affine numerico reale.

Sia R il campo dei numeri reali . Sia α = R2 l’insieme delle coppie ordinate di
numeri reali . Chiameremo punti gli elementi di α . Se p = ( x , y ) è un punto i due
numeri x e y saranno chiamati le sue coordinate . Il numero x è chiamato l’ascissa di p
mentre il numero y è chiamato l’ordinata di p .
Consideriamo una terna ordinata di numeri reali ( a , b , c ) con la condizione che (a, b )
≠ ( 0 , 0 ). Con la nostra scelta , i tre numeri ( a , b , c ) ci consentono di poter considerare la
seguente equazione di primo grado nelle variabili x ed y :

(1) ax + by + c =0

Ci sono infinite coppie ( x1 , y1 ) che sono soluzioni dell’equazione (1) anzi tali coppie
sono in numero pari alla cardinalità | R | di R . Infatti se è ad esempio a ≠ 0 le coppie
-by-c
soluzioni della (1) sono al variare di y in R tutte e sole le seguenti ( , y ).
a
Tutte le soluzioni dell’equazione (1), essendo infinite coppie ordinate di numeri reali ,sono
quindi un sottoinsieme infinito di α . Tale sottoinsieme r sarà chiamato retta e l’equazione
(1) che l’ha definito sarà chiamata la sua equazione. Si dice anche che l’equazione (1)
rappresenta tale retta.
E’ chiaro che se ( a’ , b’ , c’ ) è proporzionale ad ( a , b , c ) e si ottiene da ( a , b , c )
moltiplicando questa per un numero diverso da zero allora le due equazioni

ax + by + c =0 e a’ x + b’ y + c’ = 0

hanno le stesse soluzioni e quindi definiscono la stessa retta .


La famiglia di tutte le rette r di R2 sarà indicata con RR .
Se r è una retta ed
(1) ax + by + c =0
è l’equazione che l’ha definita possiamo descrivere i punti di r al seguente modo . Ricordiamo che i
punti di r sono le coppie ( x1 , y1 ) che sono soluzioni dell’equazione a x + b y + c = 0.
36

Ora se ( x0 , y0 ) è un punto di r allora ( x0 , y0 ) è una soluzione dell’equazione


a x + b y + c = 0 . Per quanto visto nel capitolo riguardante lo studio dei sistemi di equazioni
lineari, tutte le soluzioni S dell’ equazione (1) si ottengono aggiungendo ad una sua soluzione
tutte le soluzioni dell’equazione
(2) ax + by =0
omogenea associata. D’altra parte lo spazio delle soluzioni di a x + b y = 0 è un sottospazio So
di R2 di dimensione uno e quindi tali soluzioni sono determinate tutte attraverso la conoscenza di
una soluzione non nulla . La coppia ( -b , a ) è una soluzione non nulla dell’equazione
ax + by =0
e quindi per quanto detto, essa è una base dello spazio So delle soluzioni , che sono quindi tutte del
tipo ρ ( -b , a ) con ρ numero reale . Per semplicità di scrittura poniamo

λ = -b µ = a
e tale coppia ( λ , µ ) ( base di So ) sarà chiamata coppia di numeri direttori di r . E’
evidente che una coppia ( λ ’ , µ ’ ) proporzionale a ( λ , µ ) secondo un fattore di
proporzionalità non nullo è anch’essa base di So e quindi è anch’essa una coppia di numeri direttori
di r . I numeri direttori di r sono quindi non unici , non entrambi nulli, e definiti a meno di un
fattore di proporzionalità non nullo.
Abbiamo ricordato che tutte le soluzioni dell’equazione a x + b y + c = 0 si ottengono
sommando ad una sua soluzione ( x0 , y0 ) tutte le soluzioni dell’equazione ax + by =0
omogenea associata. Conservando le notazioni sopra introdotte si ha allora che le coppie ( x , y )
soluzioni dell’equazione a x + b y + c = 0 sono tutte descrivibili al seguente modo :

( x , y ) = ( x0 , y0 ) + ρ ( λ , µ )

Si conclude quindi che i punti ( x , y ) di r si ottengono al variare del parametro reale ρ con
le seguenti formule
⎧ x = x 0 + ρλ
(3) ⎨
⎩ y = y0 + ρµ
Quando si rappresentino i punti di una retta r in questo modo si dice che r è stata rappresentata
parametricamente ( in quanto è il parametro ρ che variando in R permette di descrivere tutti i
suoi punti ).
E’ utile osservare che le infinite coppie ( x, y ) che si ottengono al variare di ρ in R con
37

formule del tipo


⎧ x = x 0 + ρλ

⎩ y = y0 + ρµ
dove è ( λ , µ ) ≠ ( 0 , 0 ) sono i punti di una retta in quanto tali coppie sono le soluzioni di
un’equazione del tipo ax + by + c = 0. Infatti supposto che sia ad esempio λ ≠ 0 si ha :

x-x o
ρ =
λ
e quindi
x-x o
y = y0 + µ
λ

⎧ x = x 0 + ρλ
Pertanto le coppie (x , y ) descritte da ⎨ sono le soluzioni dell’equazione
⎩ y = y0 + ρµ

µ x - λ y + λ y0 - µ x 0= 0

e quindi sono i punti di una retta .

Siano ora r ed r’ due rette e siano


(1) ax + by + c =0
ed
(2 ) a’ x + b’ y + c’ = 0

le equazioni che definiscono r ed r’ . Vogliamo stabilire quando r incide r’ o quando r è parallela


ad r’ . Un punto ( x0 , y0 ) appartiene sia ad r che ad r’ se la coppia ( x0 , y0 ) è soluzione di
entrambe le equazioni e quindi se essa è soluzione del sistema S formato dalle due equazioni
assegnate. Viceversa una soluzione di tale sistema S fornisce un punto comune alle due rette.
Occorre quindi discutere il sistema S formato dalle due equazioni :
⎧a x + b y + c = 0
S: ⎨
⎩a' x + b' y + c' = 0
Siano
38

⎛a b⎞ ⎛a b c⎞
A= ⎜ ⎟ A’ = ⎜ ⎟
⎝ a' b' ⎠ ⎝ a' b' c' ⎠

le due matrici , incompleta e completa , del sistema S.


Se
⎛a b⎞
det ⎜ ⎟≠ 0
⎝ a' b' ⎠

allora il sistema S ha una sola soluzione e quindi le due rette r ed r’ sono tra loro incidenti.
⎛a b⎞
Se det ⎜ ⎟= 0 allora il rango di A è uno . Se A’ ha rango due il sistema S non ha
⎝ a' b' ⎠
soluzioni e quindi le due rette sono tra loro parallele. Se A’ ha rango uno allora le sue righe sono
proporzionali e quindi le due rette r ed r’ sono coincidenti e quindi pur sempre parallele.
In ogni caso detA = 0 comporta che r ed r’ sono parallele. Viceversa se r ed r’ sono parallele,
per ciò che precede , è necessariamente det A = 0.
Abbiamo così provato la seguente :

Proposizione 2.1 Due rette r ed r’ rappresentate da


r: ax + by + c =0
r’ : a’ x + b’ y + c’ = 0
⎛a b⎞
sono parallele se e solo se risulta det ⎜ ⎟= 0 o equivalentemente se e solo se la coppia
⎝ a' b' ⎠
(a , b ) è proporzionale alla coppia ( a’ , b’ ).

Poichè risulta

⎛a b⎞ ⎛ -b a ⎞
det ⎜ ⎟ = det ⎜ ⎟
⎝ a' b' ⎠ ⎝ -b' a' ⎠

allora ricordando che (-b , a ) è una coppia di numeri direttori di r e (-b’ , a’ ) è una coppia di
numeri direttori di r’ possiamo riformulare la proposizione 1.1 al seguente modo :

Proposizione 2.2 Due rette r ed r’ rappresentate da


39

r: ax + by + c =0
r’ : a’ x + b’ y + c’ = 0

sono parallele se e solo se esse hanno gli stessi numeri direttori.

Sia r una retta rappresentata dall’equazione ax +by + c = 0 . Per quanto precede


l’equazione

(1.1) ax + by + k = 0

rappresenta ,al variare di k in R , tutte le rette parallele ad r . Per questa ragione essa rappresenta il
fascio improprio costituito da r e da tutte le sue parallele.

Concludiamo tale numero cercando di rappresentare tutte le rette che passino per un fissato punto
P =( xo , yo ) . Tale insieme di rette viene chiamato fascio proprio di rette di centro P .

Siano r ed r’ due rette per ( xo , yo ) rappresentate da :

r : ax + by + c = 0

r’ : a’x + b’y + c’ = 0

Poichè il punto ( xo , yo ) appartiene sia ad r che ad r’ le sue coordinate soddisfano entrambe le


equazioni. Ne consegue che se consideriamo un’equazione del tipo

(** ) α(ax + by + c) + β ( a’x + b’y + c’ ) = 0

con ( α , β ) ≠ (0,0 ) ottenuta combinando linearmente le due equazioni date, essa


rappresenta una retta ancora per il punto ( xo , yo ) in quanto le coordinate di tale punto la
soddisfano qualunque sia la scelta dei coefficienti α e β . Se ogni retta per ( xo , yo ) si ottiene
mettendo nella (**) un opportuno valore di α ed un opportuno valore di β allora al variare di
questi due parametri α e β la (**) descrive tutte le rette per ( xo , yo ) e quindi rappresenta il
40

fascio di rette di centro tale punto.


Sia quindi r” una qualunque retta per ( xo , yo ) rappresentata dall’equazione :

r” : a”x + b”y + c” = 0

Il sistema formato dalle tre equazioni

⎧ ax + by + c = 0

⎨ a' x + b' y + c' = 0
⎪ a”x + b”y + c” = 0

risulta compatibile in quanto la coppia ( xo , yo ) è una sua soluzione. Ne consegue che la matrice
completa ha lo stesso rango di quella incompleta e quindi ha rango due .
Risulta allora

⎛a b c ⎞
⎜ ⎟
det ⎜ a' b' c' ⎟ =0
⎜ a" b" c" ⎟
⎝ ⎠

Le tre righe di tale matrice sono quindi dipendenti e poiché le prime due sono indipendenti allora la
terza è combinazione lineare delle prime due e così si ha l’asserto.
Due rette per il punto ( xo , yo ) di semplice rappresentazione sono

x - xo = 0 ed y - yo = 0

e pertanto, per ciò che precede, l’equazione

(3) α(x - xo) + β (y - yo ) = 0

al variare di α e β con ( α , β ) ≠ ( 0 , 0 ) rappresenta tutte le rette per il punto ( xo , yo ) .


L’ equazione (3) è chiamata l’equazione del fascio proprio di rette di centro ( xo , yo ) .
Siamo ora in grado di provare la seguente :

Proposizione 2.2 La coppia ( R2 , RR ) è un piano affine.


41

Dimostrazione. Siano (x1 ,y1) e (x2 ,y2 ) due punti distinti. Una retta che contenga tali due
punti deve essere rappresentata da una equazione ax + by + c = 0 che abbia le due coppie (x1 ,y1)
e (x2 ,y2 ) tra le sue soluzioni. Pertanto dovrà essere :
⎧a x1 + b y1 + c = 0
(**) ⎨
⎩a x 2 + b y 2 + c = 0
Tale sistema omogeneo nelle incognite ( a , b , c ) ha la matrice dei coefficienti
⎛ x1 y1 1 ⎞
⎜ ⎟
⎝ x 2 y 2 1⎠
di rango due in quanto i due punti (x1 ,y1) e (x2 ,y2 ) sono distinti . Le soluzioni del sistema (**)
sono quindi un sottospazio di R3 di dimensione uno ed una sua base si ottiene attraverso i minori
⎛ x1 y1 1 ⎞
d’ordine due della matrice ⎜ ⎟ presi a segni alterni.
⎝ x 2 y 2 1⎠
Le terne ( a, b , c) non nulle da noi cercate sono quindi infinite e tutte proporzionali tra loro. Esse
quindi definiscono tutte la stessa retta che è quindi l’unica passante per i due punti (x1 ,y1) e
(x2 ,y2 ) distinti assegnati.
Sia ora l una retta definita dall’equazione ax + by + c = 0 e sia (xo , yo) un punto non
appartenente ad l . Per ciò che precede una qualunque retta per (xo , yo) è rappresentata da
un’equazione del tipo
α(x - xo) + β (y - yo ) = 0
Tra esse l’unica retta parallela ad l è quella che si ottiene scegliendo α e β proporzionali ad a e
b . Pertanto c’è una sola retta per (xo , yo) parallela ad l ed essa è rappresentata dall’equazione

a(x - xo) + b (y - yo ) = 0

Poiché una retta r è un sottoinsieme proprio di R2 allora tre punti , due scelti su r ed uno
fuori da r , sono tre punti non allineati del nostro piano α .
Resta così provato che la coppia ( R2 , RR ) è un piano affine. Tale piano affine è
detto piano affine numerico reale.

Per le applicazioni è molto utile la seguente osservazione .


Dalla dimostrazione fatta segue che l’equazione della retta che congiunge i punti distinti
(x1, y1) e (x2, y2) si ottiene sviluppando il seguente determinante :
42

⎛x y 1⎞
⎜ ⎟
det ⎜ x 1 y 1 1 ⎟ =0
⎜ ⎟
⎝ x 2 y 2 1⎠

3. Il piano affine numerico complesso.


Abbiamo già detto che la costruzione fatta per ottenere il piano affine numerico reale
2
( R , RR ) è indipendente dal fatto che il campo usato sia quello dei numeri reali. Lo stesso
risultato si ottiene se si considera al posto del campo reale un qualsiasi campo K.
A noi interessa ora il caso in cui il campo K sia il campo dei numeri complessi C .
Partendo dal campo complesso C possiamo quindi costruire un piano affine
2
( C , RC ) che ha come punti le coppie ordinate ( a, b ) di numeri complessi e come rette i
sottoinsiemi di C 2 ognuno dei quali è l’insieme delle soluzioni di un’equazione

ax + by + c = 0 a , b , c ∈ C , (a , b) ≠ ( 0 , 0 )

di primo grado non identica a coefficienti complessi.


Un punto (a,b) di C 2 si dirà reale se ( a, b) sono entrambi numeri reali . Il punto (a,b) di
C 2 si dirà immaginario se i due numeri complessi non sono entrambi reali
Osserviamo che il piano affine reale ( R2 , RR ) è contenuto nel piano affine
( C 2 , RC ) nel senso ora precisato.
Sia
ax + by + c = 0 a , b , c ∈ R , (a , b) ≠ ( 0 , 0 )
un’ equazione a coefficienti reali . Essa determina due rette l ed L la prima del piano
( R2 , RR ) e la seconda del piano ( C 2 , RC ) a seconda che si vogliano considerare le
sue soluzioni reali o le sue soluzioni complesse.

l = { ( x , y ) ∈ R2 , ax +by + c = 0 }
L = { ( x , y ) ∈ C2 , ax +by + c = 0 }

E’ ovvio che è l ⊂ L quindi ogni retta del piano reale è parte di una retta del piano complesso.
La retta L si può quindi pensare come un “allungamento” di l . Non tutte le rette del piano
complesso sono allungamenti di quelle reali. Vediamo.
43

Una retta L del piano complesso rappresentata dall’equazione


ax +by + c = 0 a , b , c ∈ C , (a , b) ≠ ( 0 , 0 )
si dirà reale se (a , b , c ) è proporzionale ad una terna di numeri reali. Quando la retta è reale
essa ha quindi infiniti punti reali ed infiniti punti immaginari.

E’ ben noto che il campo complesso è dotato di un automorfismo non identico detto
coniugio che si ottiene associando ad ogni numero complesso z = a + ib il numero complesso
z = a - ib .
Quando z è un numero reale (cioè è b = 0) allora risulta z = z . Viceversa se risulta z = z allora
è 2ib =0 e quindi b = 0 e pertanto z è reale .
Associando ad ogni punto ( z1 , z2) del piano complesso C2 il punto di ( z1 , z2 ) si ottiene un
isomorfismo del piano complesso in sé . Tale isomorfismo trasforma la retta

L: ax +by + c = 0 a , b , c ∈ C , (a , b) ≠ ( 0 , 0 )

nella retta L , detta coniugata di L , seguente :

L : a x + by + c = 0
Ricordiamo ora che l’equazione della retta che congiunge i punti distinti (x1, y1) e (x2, y2)
si ottiene sviluppando il seguente determinante :

⎛x y 1⎞
⎜ ⎟
det ⎜ x 1 y 1 1 ⎟ =0
⎜ ⎟
⎝ x 2 y 2 1⎠

Pertanto è facile controllare che la retta che congiunge due punti reali è reale ed è reale altresì la
retta che congiunge due punti complessi e coniugati.
Da ciò segue allora facilmente che:

Proposizione 3.1 Una retta è reale se e solo se essa coincide con la sua complessa
coniugata.

Se una retta L non è reale essa , per ciò che precede , ha al più un punto reale.
44

Facilmente si ha che :

Proposizione 3.2 Una retta L non reale ha un punto reale se e solo se essa incide la sua
complessa coniugata.

A titolo di esempio la retta

L: ix -y=0

ha (0,0) come suo unico punto reale . Infatti se x ≠ 0 è reale , y = ix è non reale e quindi (x, y ) è
immaginario. Se x è non reale ancora (x, y ) è immaginario.

Sempre per esemplificare la retta x + y + i = 0 non ha punti reali ed è infatti parallela alla sua
coniugata x + y – i = 0 .

4. Nozione di riferimento reale .


In questo numero col simbolo ( α o , R o ) rappresenteremo il piano della geometria elementare
che viene sempre nella nostra mente identificato coi punti e le rette di una qualunque superficie
piana che ricada sotto i nostri sensi. Questi punti e rette (che sono parti proprie del piano) si
assumono come concetti primitivi e non vengono definiti ma si ritiene che essi abbiano le due
proprietà seguenti.

a) due punti distinti appartengono ad una unica retta.


b) Dati una retta r e un punto p fuori di r c’è una unica retta per p ad intersezione vuota con
r.
Pertanto l’idea di piano che abbiamo “interiorizzato” è quella di piano affine. L’unico
problema che spesso si ha è che per tracciare delle linee o dei cerchi , per misurare angoli,
segmenti etc .su tale piano occorre avere a disposizione degli strumenti (riga , compasso,
goniometro, metro etc. ) . Sembra quindi utile disporre di un piano affine isomorfo a
( α o , R o) in cui queste stesse operazioni si possano eseguire solo attraverso l’utilizzo di regole
di calcolo che ci preoccuperemo appunto di acquisire. Vediamo come si procede.
Per realizzare il nostro scopo occorre intanto introdurre la nozione di riferimento su una retta , e
la nozione di riferimento in un piano .
45

Iniziamo col definire un riferimento su una retta.


Sia r una retta del piano. Scegliamo come positivo uno dei due versi in cui si può percorrere
la retta r .Scegliamo poi un punto O sulla retta e fissiamo una unità di misura u .Il verso scelto
→ →
sia indicato con v . La terna R = ( O , u , v ) è detta un riferimento reale della retta r .
Il punto O è chiamato origine del riferimento.
A che serve fissare un riferimento su r ? Vediamo.
Se A e B sono due punti di r indicheremo con ‫׀‬AB‫ ׀‬la misura assoluta del segmento AB fatta
rispetto all’ unità u .

A B

B A

Nel disegno fatto i punti A e B scelti hanno, nei due casi, posizioni reciproche diverse e però
individuano entrambi un segmento di lunghezza due .
Pertanto la conoscenza della lunghezza assoluta del segmento AB non ci fornisce informazioni
sulla posizione reciproca dei due punti. Per ovviare a questa difficoltà si introduce il concetto di
misura relativa di un segmento. Siano quindi A e B due punti della retta r. Quando A=B il
segmento AB è detto nullo ed ad esso si attribuisce misura nulla. Supponiamo quindi A
distinto da B . La misura relativa del segmento AB che viene indicata con (AB) è il numero
reale seguente :
(AB ) = ‫ ׀‬AB ‫׀‬ se A precede B nel verso fissato
(AB) = - ‫ ׀‬AB ‫ ׀‬se A segue B nel verso fissato.
Riferendoci sempre al disegno fatto si ha quindi nel primo caso (AB ) = 2 e nel secondo
caso (AB ) = - 2.

Sussiste la seguente proprietà di cui omettiamo la dimostrazione .

Per ogni terna A , B , C di punti di r si ha :

(4.1) (AB ) + (BC ) = (AC ) .


46

Introdotta la nozione di misura relativa di un segmento , possiamo ora associare ad ogni punto
P della retta r il numero reale xP = (OP) che chiamiamo l’ ascissa di P nel riferimento R.
Per la definizione data il punto O ha ascissa zero i punti che seguono O hanno ascissa positiva
e quelli che precedono O hanno ascissa negativa. E’ evidente che la corrispondenza introdotta

c: P∈ r → xP ∈ R

è biettiva ed è chiamata coordinazione della retta r .


Si osservi esplicitamente che l’utilizzo del riferimento ha reso possibile istituire la
corrispondenza c .
Utilizzando la proprietà (1.1) si ha

(OA ) + (AB ) = (OB)


da cui segue :
(4.2) (AB ) = (OB) - (OA ) = xB - xA .

Conoscendo l’ ascissa di ogni punto è possible quindi calcolare la misura relativa di un segmento
utlizzando la formula (4.2).
Parliamo ora di riferimento del piano.
Siano x ed y due rette del piano incidenti tra loro. Sia O il punto comune alle due rette
→ →
x ed y . Fissiamo su x un verso vx positivo e su y un verso vy positivo . Fissiamo infine una unità

di misura u .

La terna Rx = ( O , u , vx ) è un riferimento della retta x ed analogamente la terna

Ry = ( O , u , vy ) è un riferimento della retta y .

La quaterna R= ( x , y , Rx , Ry ) è chiamata riferimento reale ( monometrico) del piano.


Quando le due rette x ed y sono ortogonali il riferimento è detto ortogonale.

Per ogni punto P del piano indichiamo con Px la proiezione di P su x lungo la direzione di
y e con Py la proiezione di P su y lungo la direzione di x .
47

Py P

O
Px

La corrispondenza

P ∈ αo → ( Px , Py ) ∈ x x y
è ovviamente biettiva.
Ma Px che sta su x , determina un numero reale a = (O Px) ( la sua ascissa nel riferimento
Rx ) e Py che sta su y , determina un numero reale b = (O Py) ( la sua ascissa nel riferimento Ry
di y ).
Pertanto possiamo associare al punto P la coppia ordinata di numeri reali ( a , b) corrispondente alla
coppia di punti (Px , Py ).
La corrispondenza
(Px , Py ) → ( a , b) ∈ R2

è ovviamente biettiva e quindi la corrispondenza

(*) c : P ∈ αo → ( a , b) ∈ R2

è anch’essa biettiva. I due numeri a e b associati a P sono chiamati le coordinate di P nel


riferimento R . Il numero a = (O Px) è detto l’ascissa di P , il numero b = (O Py) è detto
l’ordinata di P .
Mostreremo più in avanti che quando P descrive una retta del piano le sue coordinate (x,y) sono
tutte e sole le soluzioni di un’equazione di primo grado non identica in due variabili del tipo
48

ax + by + c = 0

Quando avremo acquisito questo risultato la corrispondenza (*) diviene un isomorfismo tra il piano
affine ( α o , R o ) ed il piano affine numerico reale α (R) = ( R2 , R R ) ampiamente descritto in
precedenza.
Osserviamo inoltre che attraverso l’isomorfismo c descritto in (*) ad ogni isomorfismo ψ del piano
( α o , R o ) in sè corrisponde un isomorfismo c°ψ °c-1 del piano ( R2 , R R ) in sè e viceversa ad
ogni isomorfismo φ del piano ( R2 , R R ) in sè corrisponde un isomorfismo c-1 ° φ ° c del
piano ( α o , R o ) in sé.
Pertanto l’aver descritto tutti gli isomorfismi del piano ( R2 , R R ) in sè consente altresì una
rappresentazione del gruppo degli isomorfismi del piano ( α o , R o ) in sé.

5. Le coordinate omogenee.
Abbiamo già visto che un piano affine può divenire , con l’aggiunta di nuovi punti ( i punti
impropri ) ed una nuova retta ( retta impropria ) un piano proiettivo.
Nel piano reale della geometria elementare che indicheremo sempre con ( α o , R o ) se si
fissa un riferimento reale ogni punto determina due coordinate ( x , y ) che sono due numeri
reali . Viceversa ogni coppia ( x, y ) di numeri reali determina un punto del piano. In tale
rappresentazione i punti del piano sono in corrispondenza biettiva con le coppie ordinate di
numeri reali ed i punti di una retta sono in corrispondenza biettiva con le soluzioni di una
equazione di primo grado del tipo ax + by + c = 0.
Ora se aggiungono i punti impropri come si può estendere la coordinazione anche ai nuovi
punti ? Come si rappresentano le rette ampliate col loro punto improprio ? Vediamo.
Bisogna per far ciò introdurre le coordinate omogenee di un punto sia esso proprio o improprio
in un riferimento reale R fissato.
Sia P un punto proprio e supponiamo che nel riferimento R esso abbia coordinate (2 , 3 ) .
Chiameremo coordinate omogenee di P nel riferimento R una terna ordinata (x1 , x2 , x3 ) di
numeri reali con x3 ≠ 0 e tale che sia :

x1 x2
(*) =2 =3
x3 x3

Ovviamente una terna (x1 , x2 , x3 ) “ facile “ che verifica la proprietà (*) è la terna ( 2, 3 , 1 )
49

ma anche ( 4 , 6 , 2 ) va bene e così ogni terna del tipo (2 ρ , 3ρ , ρ ) con ρ ≠ 0 . Una


qualsiasi di queste terne attraverso le formule (*) restituisce la coppia (2,3 ) e quindi il punto P .
Pertanto le coordinate omogenne di un punto proprio P di coordinate (xo , yo) sono tre numeri
(x1 , x2 , x3 ) con x3 ≠ 0 e verificanti la seguente proprietà :

x1 x2
(*) = xo = yo
x3 x3

La terna (x1 , x2 , x3 ) avendo x3 ≠ 0 è non nulla e dovendo verificare le (*) è non unica ma
determinata a meno di un fattore di proporzionalità non nullo.
Se il punto P=Or è improprio ed è quello aggiunto alla retta r di equazione ax + by + c = 0
allora si definiscono coordinate omogenee di P tre numeri (x1 , x2 , x3 ) con x3 = 0 e con
(x1 , x2) = ( λ , µ ) eguali ad una coppia di numeri direttori di r . Tenendo conto che anche i
numeri direttori di una retta sono non entrambi nulli e definiti a meno di un fattore di
proporzionalità non nullo, allora anche le terne ( λ , µ , 0) usate per rappresentare P
(improprio) sono non nulle e definite a meno di un fattore di proporzionalità non nullo.
Ricordando che (-b ,a) è una coppia di numeri direttori di r , il punto improprio di r si
rappresenta con la terna ( -b , a , 0 ) o una ad essa proporzionale.
E’ facile controllare che si passa a tale rappresentazione per i punti del piano ampliato allora
anche le rette vengono rappresentate in modo diverso .
Si consideri un’equazione omogenea di primo grado non identica ed in tre variabili
(x , y , t ) del tipo
(**) ax + by + ct = 0
E’ chiaro che se (x1 , x2 , x3 ) è una soluzione non nulla dell’equazione ax + by + ct = 0 anche la
terna ( ρ x1 , ρ x2 , ρ x3 ) con ρ ≠ 0 , è soluzione della stessa equazione per cui ha senso dire
che un punto del piano ampliato verifica con le sue coordinate omogenee l’equazione data. E’
altresì evidente che due equazioni ax + by + ct = 0 ed a’x + b’y + c’t = 0 hanno le stesse
soluzioni se e solo se esse sono proporzionali.
Ciò premesso, se risulta ( a, b ) = ( 0 , 0 ) l’ equazione ax + by + ct = 0 diventa
t=0
Tale equazione ha come soluzioni tutte le terne ( h , k , 0) e queste rappresentano tutti i punti
impropri del piano . Quindi t = 0 rappresenta la retta impropria del piano .
Se invece è ( a, b ) ≠ ( 0 , 0 ) allora l’equazione ax + by + c = 0 rappresenta una retta r del
50

piano non ampliato . I punti di tale retta r quando siano rappresentati in coordinate omogenee
verificano l’equazione omogenea
ax + by + ct = 0.
Poiché soddisfa tale equazione anche la terna ( -b , a , 0 ) allora l’equazione omogenea
ax + by + ct = 0.
rappresenta la retta r ampliata col suo punto improprio.

6. I punti immaginari.
Il piano della geometria elementare sarà ancora denotato con (αo , Ro).
Se nel piano (αo , Ro) si fissa un riferimento R reale ad ogni coppia ordinata ( x , y ) di numeri reali
corrisponde un punto p di αo e la corrispondenza , che indichiamo con ω ,
ω : (x,y) ∈ R2 → p ∈ αo
diventa un isomorfismo tra il piano affine numerico reale ( R2, RR) ed (αo , Ro) .
I punti p di αo hanno per coordinate due numeri reali e per tale motivo vengono detti reali.
Così come il piano affine ( R2 , RR ) è parte del piano affine complesso ( C2 , RC ) ,
ci chiediamo se sia possibile aggiungere nuovi punti al piano (αo , Ro) in modo da ottenere un
nuovo piano (α*o , R*o) ( di cui (αo , Ro) è una parte ) e che risulti isomorfo al piano (C2 , RC).
Faremo vedere che ciò è possibile purchè si aggiungano al piano (αo , Ro) dei nuovi punti che
chiameremo immaginari.
Di più mostreremo che fissato un riferimento R reale nel piano (αo , Ro) , si può costruire una
funzione biettiva
Ω : (x,y) ∈ C2 → p ∈ α*o
che risulta un isomorfismo tra i piani ( C2 , RC ) e (α*o , R*o) e la cui restrizione a R2 coincide
con ω .
Dobbiamo quindi introdurre il concetto di punto immaginario. Vediamo.
Cerchiamo una possibile definizione per un punto reale. I punti reali non sono definiti
perché sono assunti come concetti primitivi .
Se p è un punto reale cioè è un punto di αo ed abbiamo fissato un riferimento R ad esso
corrisponde una coppia di numeri reali ( le sue coordinate ) . Supponiamo ad esempio che a p
corrisponda la coppia (2 , 3). Per pensare al punto p non basta nominare la coppia (2,3) ma
occorre anche precisare il riferimento R che ha determinato tale coppia. Infatti cambiando il
riferimento R con un nuovo riferimento R’ e ponendo ad esempio l’origine coincidente con p
51

allora a p corrisponderebbe ora nel nuovo riferimento R’ la coppia (0,0) e non più la coppia (2,3).
Pertanto la coppia (2,3) nel riferimento R’ non ci farebbe più pensare a p ma ad un punto diverso
da p. Per pensare a p nel riferimento R’ serve la coppia (0,0)
Pertanto p è identificato sia attraverso la coppia ( (2,3) , R ) e sia attraverso la coppia
( (0,0) , R’ ) .Ci sono delle formule che consentono di conoscere le coordinate di un punto p in un
riferimento R’ note che siano le coordinate dello stesso punto in un altro riferimento R . Tali
formule dette di passaggio da un riferimento all’altro sono di questo tipo :

⎧ x' = ax + by + c ⎛a b⎞
(*) ⎨ con det ⎜ ⎟ ≠ 0
⎩ y' = a'x + b'y + c' ⎝ a' b' ⎠
Pertanto se tali formule sono quelle di passaggio tra R ed R’ allora se al posto di x ed y si
sostituiscono i numeri 2 e 3 ,coordinate di p nel riferimento R , si otterrà x’ =0 ed y’ = 0 che
sono appunto le coordinate di p nel riferimento R’ .
Due coppie (( x0 , y0) , R ) ed (( x’0 , y’0) , R ‘ ) si dicono equivalenti se sostituendo nelle
formule (*) di passaggio da R ad R ‘ al posto di x ed y i numeri x0 ed y0 si ottengono a primo
membro x’0 ed y’0 .Tale relazione è come è facile vedere , d’equivalenza e pertanto si possono
considerare le relative classi d’equivalenza. Ritornando all’esempio fatto possiamo dire che la
classe [ (( 2 , 3) , R ) ] può essere identificata col punto p . Nella classe [ (( 2 , 3) , R ) ] a
fianco di ogni riferimento reale si trovano le coordinate di p in quel riferimento. La classe
[ (( 2 , 3) , R ) ] potrebbe quindi essere assunta come definizione di p.
Questa idea ci suggerisce come introdurre i nuovi punti quelli che chiameremo immaginari.
Nel seguito C è il campo dei numeri complessi, e ( C2, RC ) è il piano affine numerico che C
ci consente di costruire.

Consideriamo le coppie ( (a , b) , R ) dove (a , b) è una coppia ordinata di numeri


complessi non entrambi reali ed R è un riferimento reale del piano α .
Due siffatte coppie ( (a , b) , R ) ed ( (a’ , b’) , R’ ) le diremo equivalenti se
sostituendo nelle formule di passaggio da R ad R’

⎧ x' = mx + ny + c ⎛m n⎞
(**) ⎨ con det ⎜ ⎟ ≠ 0
⎩ y' = m'x + n'y + c' ⎝ m' n' ⎠
52

al posto di x ed y i numeri a e b si ottiene x’ = a’ ed y’ = b’.


Tale relazione è d’equivalenza e così ogni classe d’equivalenza [( (a , b) , R )] sarà
chiamata punto immaginario. Indichiamo con I l’insieme di tutti i punti immaginari.
⎛m n c⎞
Si noti che poiché nelle formule (**) i coefficienti ⎜ ⎟ sono numeri reali allora se le coppie
⎝ m' n' c' ⎠
( (a , b) , R ) ed ( (a’ , b’) , R’ ) sono equivalenti anche i due numeri (a’ , b’) sono complessi
e non entrambi reali .
Se p* = [( (a , b) , R )] è un punto immaginario chiameremo i due numeri complessi
(a , b) le sue coordinate nel riferimento R . Se ( (a’ , b’) , R’ ) è equivalente a
( (a , b) , R ) allora (a’ , b’) sono le coordinate di p* nel riferimento R’ .
Quando si fissi un riferimento reale allora ogni punto p di α* = α ∪ I determina una
coppia di numeri complessi (a ,b) i quali sono entrambi reali se p ∈ α cioè è reale , e sono
complessi e non entrambi reali se p ∈ I , cioè p è immaginario.
Fissato un riferimento reale R abbiamo così una biezione

Ω : (a , b ) C x C → p ∈ α*

Chiamiamo retta di α* l’immagine tramite Ω di una retta del piano affine numerico
( C2, RC ). Così facendo si dà una struttura di piano affine anche all’insieme α* . Inoltre la
funzione Ω diventa un isomorfismo tra questi due piani affini.

7. Il piano proiettivo numerico reale.

In tale numero daremo un esempio di piano proiettivo. Per la sua costruzione useremo il
campo dei numeri reali (perché ciò è utile ai nostri scopi) ma la costruzione , come si vede , può
esser fatta a partire da un qualsiasi campo.
Quando si usi il campo dei numeri reali il piano proiettivo che si ottiene con questa
costruzione è chiamato piano proiettivo numerico reale.
Quando si usi il campo dei numeri complessi il piano proiettivo che si ottiene con questa
costruzione è chiamato piano proiettivo numerico complesso.

Passiamo alla sua costruzione.


53

Consideriamo lo spazio vettoriale reale R3 . Priviamo tale spazio del vettore nullo (0,0,0).
Nell’insieme R3 - (0,0,0) introduciamo la seguente relazione ~ .
Due terne non nulle (y1, y2 , y3 ) ed (z1 , z2, z3) le diciamo in relazione ~ tra loro se sono
proporzionali tra loro , se esiste quindi un numero reale k ≠ 0 tale che sia

(z1 , z2, z3) = k (y1, y2 , y3 )

La relazione ~ è evidentemente una relazione d’equivalenza nell’ insieme R3 - (0,0,0) .


Denotiamo con
π = R3 - (0,0,0) / ~
l’insieme quoziente R3 - (0,0,0) / ~ . Chiamiamo punti gli elementi di π .
Se p= [(y1, y2 , y3 )] è la classe d’equivalenza della terna (y1, y2 , y3 ) allora essa è per definizione
un punto e poiché la terna (y1, y2 , y3 ) determina tale punto allora i numeri (y1, y2 , y3 ) sono
chiamati le coordinate omogenee o proiettive di p .
Poiché una terna non nulla e proporzionale a ( y1, y2 , y3 ) determina lo stesso punto p allora le
coordinate omogenee di p non sono uniche e sono definite a meno di un fattore non nullo di
proporzionalità. Poiché la terna (y1, y2 , y3 ) determina la classe p= [(y1, y2 , y3 )] allora per
rappresentare il punto p useremo spesso semplicemente una terna (y1, y2 , y3 ) delle sue coordinate
senza indicare esplicitamente la classe [(y1, y2 , y3 )] che tale terna determina.
Sia ora

(1) a x1 + b x2 + c x3 = 0

un’equazione omogenea a coefficienti reali, di primo grado, e non identica.


Le soluzioni di tale equazione costituiscono un sottospazio di dimensione due di R3. Pertanto se
(y1, y2 , y3 ) è una soluzione non nulla dell’equazione (1) anche tutte le terne non nulle ad essa
proporzionale sono ancora soluzione dell’equazione (1). Se pertanto un punto p= [(y1, y2 , y3 )]
soddisfa con le sue coordinate l’equazione (1) ciò non dipende dalle coordinate scelte per
rappresentare il punto p. Ha senso così considerare i punti di π che soddisfano con le loro
coordinate l’equazione (1). Si ottiene così un sottoinsieme l di π che chiameremo retta.
L’ equazione ax1 + bx2 + cx3 = 0 che ci ha permesso di definire il sottoinsieme l è detta
l’equazione della retta l .
Riepilogando . Assegnata una terna non nulla (a , b , c) di numeri reali si definisce retta di
54

equazione ax1 + bx2 + cx3 = 0 il seguente sottoinsieme l(a , b , c) di π :

l(a , b , c) = { [(y1, y2 , y3 )] ∈ π : ay1 + by2 + cy3 = 0 }

E’ ovvio che se (a , b , c) ed (a’ , b’ , c’) sono due terne non nulle e proporzionali tra loro allora le
due equazioni ax1 + bx2 + cx3 = 0 ed a’x1 + b’x2 + c’x3 = 0 hanno le stesse soluzioni e così
esse definiscono la stessa retta. Viceversa se due rette coincidono allora le due equazioni che le
rappresentano sono proporzionali. Pertanto anche le rette sono tante quante le classi di equivalenza
di R3 - (0,0,0) / ~ .
Indichiamo con L la famiglia di tutte le rette l(a , b , c) di π al variare di (a , b , c) in
R3 - (0,0,0). Possiamo ora provare che :

Proposizione 7.1 La coppia ( π , L ) è un piano proiettivo.


Dimostrazione. Siano p1 e p2 due punti distinti e siano (y1, y2 , y3 ) e (z1, z2 , z3 ) le loro
coordinate proiettive. Una retta l(a , b , c) di π conterrà i due punti p1 e p2 se risulta :

⎧ay1 + by 2 + cy3 = 0
S :⎨
⎩az1 + bz 2 + cz3 = 0
Tale sistema inteso come sistema nelle incognite (a, b, c) ha la seguente matrice dei coefficienti
⎛ y1 , y 2 , y3 ⎞
⎜ ⎟
⎝ z1 , z 2 , z3 ⎠
che ha rango due ,essendo p1 e p2 due punti distinti . Pertanto le soluzioni del sistema omogeneo S
costituiscono un sottospazio di dimensione uno di R3 . Una terna non nulla (a , b ,c ) che è
soluzione di S si ottiene in corrispondenza ai minori d’ordine due , presi a segni alterni , della
⎛ y1 , y 2 , y3 ⎞
matrice ⎜ ⎟ . Ci sono quindi infinite terne (a , b ,c ) non nulle che verificano il sistema S
⎝ z1 , z 2 , z3 ⎠
e però esse sono tutte proporzionali tra loro. Tali terne definiscono così una unica retta che contiene
i punti p1 e p2 .
Siano ora l(a , b , c) ed l(a’ , b’ , c’) due rette distinte . Un punto p = [(y1, y2 , y3 )] appartiene ad
entrambe se risulta :
⎧ay1 + by 2 + cy3 = 0
S: ⎨
⎩a'y1 + b'y 2 + c'y3 = 0
Il sistema S è omogeneo e la matrice
55

⎛a , b , c⎞
⎜ ⎟
⎝ a' , b' , c' ⎠
dei coefficienti di tale sistema ha rango due , essendo le due rette distinte. Pertanto le soluzioni di
tale sistema costituiscono un sottospazio di dimensione uno di R3 . Ci sono quindi infinite terne
non nulle (y1, y2 , y3 ) che soddisfano S e sono tutte proporzionali tra loro. Una terna non nulla
(y1, y2 , y3 ) che soddisfa S può ottenersi in corrispondenza ai minori d’ordine due, presi a segni
⎛a , b , c⎞
alterni, della matrice ⎜ ⎟ . Ma se le terne non nulle (y1, y2 , y3 ) sono infinite e tutte
⎝ a' , b' , c' ⎠
proporzionali tra loro allora esse definiscono un unico punto che è il punto comune alle due rette
assegnate.
Sia l una retta rappresentata dall’equazione ax1 + bx2 + cx3 = 0 .Poichè tale equazione è non
identica uno dei suoi coefficienti è non nullo .
Supposto sia a ≠ 0 fanno parte della retta i tre punti distinti
−b −c −b−c
( ,1,0), ( , 0 , 1) , ( , 1 , 1).
a a a
E’ così provato che ogni retta ha almeno tre punti e che quindi la coppia ( π , L ) è un piano
proiettivo . L’asserto è così provato.

Per le applicazioni è molto utile la seguente osservazione .

Dalla dimostrazione fatta segue che l’equazione della retta che congiunge i punti distinti
(y1, y2 , y3 ) e (z1, z2 , z3 ) si ottiene sviluppando il seguente determinante :

⎛ x1 x 2 x 3 ⎞
⎜ ⎟
det ⎜ y 1 y 2 y 3 ⎟ =0
(7.1)
⎜ ⎟
⎝ z1 z 2 z 3 ⎠

Le rette di un piano proiettivo possono essere rappresentate anche parametricamente .


Vediamo come.
Sia L una retta del piano e sia

(1) ax1 + bx2 + cx3 = 0


56

la sua equazione.
Una terna (x1 , x2 , x3 ) non nulla , soluzione di tale equazione , fornisce le coordinate
proiettive di un punto di tale retta L . Ora tutte le soluzioni (x1 , x2 , x3 ) dell’equazione (1) , che è
omogenea , costituiscono un sottospazio di dimensione due di R3 . Pertanto esse sono note quando
siano determinate due sue soluzioni indipendenti. Siano quindi A (y1 , y2 , y3 ) e B (z1 , z2 , z3 )
due punti distinti della retta L. Poiché A e B sono distinti le due terne (y1 , y2 , y3 ) e (z1 , z2 , z3 )
sono non nulle e non proporzionali e quindi forniscono due soluzioni indipendenti dell’equazione
( 1) .
Ne segue che ogni altra soluzione (x1 , x2 , x3 ) dell’equazione (1) risulta una loro
combinazione lineare . Si ha così che ogni altra soluzione (x1 , x2 , x3 ) dell’equazione (1) è del
tipo :
(*) (x1 , x2 , x3 ) = λ (y1 , y2 , y3 ) + µ (z1 , z2 , z3 ) .

Poiché le due terne (y1 , y2 , y3 ) e (z1 , z2 , z3 ) sono indipendenti nella (*) si avrà
(x1 , x2 , x3 ) = (0 , 0 , 0 ) soltanto ponendo λ= 0 e µ = 0 .
Così se nella (*) si sceglie la coppia ( λ , µ ) ≠ ( 0 , 0) si ottiene una terna
(x1 , x2 , x3 ) ≠ (0 , 0 , 0 ) e quindi rappresentativa di un punto della retta.
Una coppia ( λ ’, µ ’) proporzionale alla coppia ( λ , µ ) fornirà una terna (x’1 , x’2 , x’3 )
proporzionale alla precedente e quindi rappresentativa dello stesso punto.
I punti della retta L hanno quindi coordinate proiettive (x1 , x2 , x3 ) espresse dalla formula (*) o
esplicitamente da :

⎧x 1 = λy1 + µz1

⎨x 2 = λy 2 + µz 2
⎪x = λy + µz
⎩ 3 3 3

Quando i punti della retta L sono rappresentati in questo modo si dice che la retta è
rappresentata parametricamente.

Osserviamo esplicitamente che alla stessa conclusione si poteva pervenire ricordando che un
punto appartiene alla retta L se e solo se le sue coordinate (x1 , x2 , x3 ) verificano la ( 7.1 ).

Importante osservazione.
57

Quando il piano reale della geometria elementare è ampliato con i punti impropri esso
diventa proiettivo e se si fissa un riferimento reale e si assegnano ai suoi punti propri ed impropri
le coordinate omogenee si realizza un isomorfismo tra tale piano ed il piano proiettivo numerico
reale ora descritto.

Proviamo infine a fare un quadro riassuntivo delle cose dette per avere una visione chiara
d’assieme.
Oggetto fisico Tipo di piano Modello matematico ad esso isomorfo

( R2 , RR )
Piano reale Piano affine Piano affine numerico reale

Piano reale + Piano proiettivo


( R3 - (0,0,0) / ~ , L )
punti impropri
Piano proiettivo numerico reale

Piano reale + ( C2 , RC )
punti immaginari Piano affine Piano affine numerico complesso

Piano reale +
( C3 - (0,0,0) / ~ , L )
punti immaginari+ Piano proiettivo
punti impropri Piano proiettivo numerico complesso

Alcune precisazioni .
Col termine piano reale si intende una qualunque superficie piana che ricada sotto i nostri
sensi e della quale si considerino i punti e le rette in essa contenute.
Nel testo tale piano è stato chiamato spesso il piano della geometria elementare ed è stato
indicato col simbolo (αo , Ro).
L’isomorfismo col modello numerico si ottiene sempre attraverso l’uso di un riferimento
reale.
58

8. Le questioni metriche del piano affine numerico reale ( R2 , RR ) .


Questo numero è dedicato ad un approfondimento delle proprietà del piano affine numerico
reale ( R2 , RR ) .Tali proprietà si riflettono in proprietà del piano reale che è ad esso isomorfo
quando in esso sia stato fissato un riferimento reale . Di più riterremo ,ma le ragioni di tale ipotesi
appariranno chiare più avanti , che il riferimento scelto sia monometrico ortogonale.
Per quello che ora tratteremo è utile ricordare alcune cose . L’ insieme R2 sostegno del
nostro piano affine numerico è altresì uno spazio vettoriale reale di dimensione due che riterremo
munito del prodotto scalare s (definito positivo) euclideo,

s ( (a ,b) , (a’ , b’) ) = aa’ + bb’

Siano L ed L’ due rette rappresentate da :

L : ax + by + c = 0

L’ : a’x + b’y + c’ = 0

Per quanto precede le due rette l ed l’ rappresentate da :

l : ax + by = 0

l’ : a’x + b’y = 0

sono parallele la prima ad L e la seconda ad L’ . I punti (x,y) della retta l sono un sottospazio So
di dimensione uno dello spazio vettoriale R2 ed i punti (x , y ) della retta l’ sono anch’essi un
sottospazio S’o di dimensione uno dello spazio vettoriale R2 . I vettori di So sono la coppia (-b , a
) e tutte le coppie proporzionali ad essa . I vettori di S’o sono la coppia (-b’ , a’ ) e tutte le coppie
proporzionali ad essa. Se le coppie (-b , a ) e (-b’ , a’ ) sono ortogonali tra loro cioè risulta :
aa’ + bb’ = 0
allora i due sottospazi So e S’o sono ortogonali tra loro e precisamente ognuno dei due è il
complemento ortogonale dell’altro.
Le due rette L ed L’ le diremo ortogonali se le due rette l ed l’ ad esse parallele e
pensate come sottospazi di R2 sono tra loro ortogonali .
59

Riepilogando : due rette L ed L’ rappresentate da :

L : ax + by + c = 0

L’ : a’x + b’y + c’ = 0

sono ortogonali se e solo se risulta :

(1*) aa’ + bb’ = 0.

Se r è una retta rappresentata da :

r : ax + by + c = 0

allora

(2*) -bx + ay + k = 0

rappresenta , al variare di k in R , il fascio improprio costituito da tutte le rette ortogonali ad r .

Per ciò che segue occorre introdurre alcune nozioni riguardanti uno spazio vettoriale reale che sia
munito di un prodotto scalare definito positivo.
Sia V uno spazio vettoriale reale dotato di un prodotto scalare definito positivo s.
Indicheremo al solito per ogni vettore v di V con ‫ ׀‬v ‫ ׀‬la sua lunghezza definita come
sappiamo attraverso
‫ ׀‬v‫=׀‬ s(v,v) .
Siano ora v e w due vettori. Per ogni numero reale t consideriamo il vettore v + t w , che si
combinazione lineare di v e w con i numeri reali 1 e t .
Qualunque sia t risulta :
s (v + t w , v + t w ) ≥ 0
Si ha allora per ogni t
s (w , w) t2 + 2 s (v , w ) t + s (v, v) ≥ 0.
Ma se tale polinomio nella variabile t non assume valori negativi il suo discriminante è minore o
eguale a zero .
60

Si ha quindi :
[ s (v , w ) ] 2 - s (v , v) s (w, w) ≤ 0.
Da cui segue
[ s (v , w ) ] 2 ≤ s (v , v) s (w, w)
Cioè :
[ s (v , w ) ] 2 ≤ ‫׀‬v ‫ ׀‬2 w ‫ ׀‬2
Da cui infine :
(*)
s (v , w ) ≤ ‫׀‬v ‫׀ ׀‬w ‫׀‬

Definiamo ora distanza tra v e w la lunghezza del vettore v-w.


Si ha quindi
d (v , w) = ‫׀‬v-w ‫= ׀‬ s(v-w, v-w) .
La funzione
d : VxV → [0, ∞ [

ora definita è una metrica in V in quanto verifica le seguenti tre proprietà :

1. d (v , w) = 0 ⇔ v=w
2. d (v , w) = d (w, v)
3. d (v , w) ≤ d (v , z) + d (z , w)

Le proprietà 1 e 2 sono evidenti . Basta quindi provare la proprietà 3.


Tenendo conto della disuguaglianza (*) si ha :

‫ ׀‬v-w ‫׀‬2 = s (v-w , v-w ) = s (v-z +z -w, v-z +z -w) = s (v-z , v-z) + s (z-w , z-w) +
+ 2 s (v-z , z -w) ≤ ‫׀‬v-z ‫׀‬2 + ‫׀‬z-w ‫׀‬2 + 2 ‫׀‬v-z ‫׀׀‬z-w ‫ ׀ ( = ׀‬v-z ‫׀‬+ ‫׀‬z-w‫ ) ׀‬2

Si ha quindi
‫׀‬v-w ‫׀ ≤ ׀‬v-z ‫׀‬+ ‫׀‬z- w ‫׀‬

e cioè la proprietà 3.
61

Lo spazio ( V , d) è quindi uno spazio metrico .

Siano infine x=( x1 , y1 ) e y =( x2 , y2 ) due punti distinti del piano α . Pensando


sempre R2 come spazio vettoriale munito del prodotto scalare euclideo, possiamo considerare il
vettore x - y = (x1 - x2 , y1 - y2 ) la cui lunghezza è la distanza tra i due vettori x ed y e che
sarà assunta come distanza tra i punti ( x1 , y1 ) e ( x2 , y2 ) . Quindi chiamiamo

d (( x1 , y1 ) , ( x2 , y2 ) ) = ‫ ׀‬x - y ‫= ׀‬ (x 2 - x1 )2 + (y 2 - y1 ) 2

La funzione d : α x α → R ora introdotta è una metrica nel piano α in quanto


verifica le seguenti tre proprietà :

(1) d ( p1 , p2 ) = 0 ⇔ p1 = p2
(2) d ( p1 , p2 ) = d ( p2 , p1 )
(3) d ( p1 , p3 ) ≤ d ( p1 , p2 ) + d ( p2 , p3 )

Pertanto (R2 , d) è quindi uno spazio metrico .

9. Il gruppo strutturale del piano affine ( R2 , RR ) .


In questo numero troveremo una descrizione di tutti gli isomorfismi del piano affine
numerico reale ( R2 , RR ) .
Ricordiamo che un isomorfismo del piano ( R2 , RR ) è una biezione

f : (x , y ) ∈ R2 → (x’ , y’ ) ∈ R2

tra i punti del piano che trasformi rette in rette.


Un punto (a , b) è detto unito nell’affinità f se risulta f (a , b) = (a , b) .
Ogni isomorfismo del piano è detto un’ affinità del piano. Evidentemente componendo due
affinità si ottiene una affinità. Inoltre poiché l’ identità è una affinità e l’inversa di una affinità è
una affinità tutte le affinità del piano costituiscono un gruppo, il gruppo delle affinità , che
indicheremo con G ( R2 ).
Ricordiamo ora che le matrici quadrate d’ordine due ad elementi reali e non degeneri cioè
62

⎛a b⎞
A= ⎜ ⎟
⎝ a' b' ⎠
che abbiano il determinante diverso da zero quando si esegua tra esse il prodotto (righe per
colonne) costituiscono un gruppo che viene indicato usualmente con GL(2 , R).
Abbiamo già visto nel capitolo riguardante gli endomorfismi di uno spazio vettoriale che gli
isomorfismi dello spazio vettoriale R2 in sè sono soltanto le funzioni di R2 in sè che ogni
matrice A non degenere induce.
⎛a b⎞
Precisamente se A = ⎜ ⎟ è una matrice quadrata non degenere la funzione , che
⎝ a' b' ⎠
indichiamo sempre con A

(*) A: ( x , y ) ∈ R2 → ( ax +by , a’x + b’y) ∈ R2

è un isomorfismo di R2 in sè . Un qualunque isomorfismo di R2 in sè è di questo tipo , si


ottiene cioè in corrispondenza ad una matrice A non degenere .
La funzione A descritta in (*) quando la si pensi come corrispondenza tra i vettori di R2 è un
isomorfismo di R2 in sè , quando la si pensi come una corrispondenza tra i punti del piano è un
isomorfismo del piano che ha unito il punto (0 , 0). Per dar corpo alla nostra affermazione occorre
provare che la corrispondenza tra i punti del piano che al punto (x, y ) fa corrispondere il punto
(x’,y’) dato da :

⎧ x' = ax + by ⎛a b⎞
(**) ⎨ con det ⎜ ⎟ ≠ 0
⎩ y' = a'x + b'y ⎝ a' b' ⎠
⎛a b⎞
è un isomorfismo del piano, cioè è biettiva e trasforma rette in rette . Poiché det ⎜ ⎟ ≠ 0 allora
⎝ a' b' ⎠
la corrispondenza descritta in (**) è biettiva. Sia ora r una retta definita dall’equazione

(+) mx + ny + p = 0

Attraverso l’uso della matrice inversa si possono invertire le formule (**) ottenendo relazioni di
questo tipo :
⎧ x = cx' + dy'
(***) ⎨
⎩ y = c'x' + d'y'
Sostituendo in (+) le espressioni trovate in (***) si riconosce che anche i punti (x’ , y’)
63

corrispondenti dei punti (x,y) sono anch’essi soluzione di un’equazione del tipo
m’x + n’y + p’ = 0
e quindi sono i punti di una retta r’ che è la trasformata della retta r .

⎛a b⎞
Riepilogando per ogni matrice A = ⎜ ⎟ non degenere la corrispondenza
⎝ a' b' ⎠

⎛x⎞ ⎛ x' ⎞ ⎛ a b ⎞⎛ x ⎞
A: ⎜ ⎟ → ⎜ ⎟=⎜ ⎟⎜ ⎟
⎝ y⎠ ⎝ y' ⎠ ⎝ a' b' ⎠⎝ y ⎠

è una affinità del piano e tale affinità trasforma il punto (0,0) in sé .

Ci sono affinità che non lasciano fisso (0 , 0) e che quindi non possono essere legate ad isomorfismi
di R2 in sè. Vediamo .
Fissiamo una coppia ordinata di numeri reali ( m , n ) con m ed n non entrambi nulli .
Consideriamo la seguente corrispondenza tra i punti del piano

T(m,n) : ( x , y ) ∈ R2 → ( x’ , y’ ) ∈ R2

con
⎧ x' = x + m
(++) ⎨
⎩ y' = y + n

La corrispondenza T(m,n) è ,come ora proveremo una affinità . Essa trasforma (0,0) nel punto
(m,n) . La corrispondenza T(m,n) è detta traslazione del piano . E’ evidente che la
corrispondenza T(m,n) è biettiva . Inoltre se r è una retta rappresentata dall’equazione
ax +by + c = 0 si ha , da (++) ,

x = x’ – m ed y = y’ - n
e quindi si ha
a (x’ – m) + b (y’ - n ) + c = 0

e così i punti (x’ , y’) sono le soluzioni dell’equazione


64

ax’ + by’ + c’ = 0
con c’ = -am –bn +c .

Pertanto i punti (x’ , y’) trasformati dei punti (x, y ) di r sono anch’essi punti di una retta r’ che
come si vede dalla sua rappresentazione è parallela ad r . La corrispondenza T(m,n) è quindi
un’affinità priva di punti uniti e che trasforma ogni retta in una ad essa parallela.
Quando si assuma m=0 ed n=0 la corrispondenza T(0,0) è l’identità . In tal modo l’identità può
far parte delle traslazioni del piano.
⎛a b⎞
Se A = ⎜ ⎟ è una matrice quadrata non degenere possiamo considerare l’affinità da essa
⎝ a' b' ⎠
indotta e se (m , n ) è una coppia ordinata di numeri reali , possiamo considerare la traslazione
T(m,n) .
La funzione T(m,n) ° A che si ottenga componendo tra loro le due affinità è una affinità del
piano che al punto ( x, y ) fa corrispondere il punto (x’ , y’ ) dove è :

⎧ x' = ax + by + m ⎛a b⎞
(**) ⎨ con det ⎜ ⎟ ≠ 0
⎩ y' = a'x + b'y + n ⎝ a' b' ⎠

Proveremo ora il seguente importante :

Teorema I Una qualunque affinità del piano si ottiene componendo una traslazione ed
un’affinità A indotta da un isomorfismo di R2 in sè .

Prima di fare la dimostrazione occorre introdurre una definizione . Una terna ordinata di
punti non allineati del piano è detta un riferimento del piano.
E’ chiaro che un’ affinità del piano trasforma un riferimento in un riferimento.
La terna ordinata

R
0 = ( (0 , 0) , (1 , 0 ) , (0 , 1 ) )
è detta riferimento fondamentale .
Proveremo in appendice il seguente teorema ( la cui dimostrazione, non banale, è esposta
in appendice per quegli studenti che avessero interesse a conoscerla )
65

Teorema fondamentale .
L’ unica affinità che trasforma in sé il riferimento fondamentale è l’identità.

Possiamo ora provare il Teorema I.


Dimostrazione. Sia

ϕ : R2 → R2
una affinità del piano. Se ϕ lascia fisso il riferimento fondamentale allora per il teorema
fondamentale è l’identità e quindi è :
ϕ = I = T(0,0) ° I ( I essendo la matrice identica)
Possiamo supporre quindi che l’affinità ϕ non lasci unito il riferimento fondamentale.
Se è :
ϕ (0,0) = ( 0, 0) , ϕ (1,0) = ( a, a’) , ϕ (0,1) = ( b, b’)
Le rette distinte y=0 ed x=0 le quali contengono (1,0) e (0,1) vengono trasformate in due rette
distinte per (0,0) e queste contengono la prima ( a, a’) e la seconda ( b, b’) . Ne segue che (b,b’)
non è proporzionale ad (a, a’) e quindi la matrice
⎛a b⎞ ⎛a b⎞
A = ⎜ ⎟ è non degenere cioè è det ⎜ ⎟ ≠ 0
⎝ a' b' ⎠ ⎝ a' b' ⎠
L’ affinità A trasforma come l’affinità ϕ anch’essa il riferimento fondamentale nel riferimento
-1
( (0,0) , (a, a’) , (b , b’ ) ). Ne segue che l’ affinità A ° ϕ trasforma in sé il riferimento
fondamentale e quindi essa , per il teorema fondamentale, è l’identità I .
Da A -1 ° ϕ = I segue ϕ = A = T(0,0) ° A.
Possiamo infine supporre che sia ϕ (0,0) = ( m , n) ≠ (0,0).
-1 -1
Consideriamo la traslazione T inversa della traslazione T(m,n) . L’ affinità T ° ϕ
trasforma (0 , 0) in sé e quindi è per quanto precede T -1 ° ϕ = A da cui segue
ϕ = T(m,n ) ° A e cioè l’asserto .

Abbiamo così caratterizzato il gruppo delle affinità del piano affine reale .

Sia F una figura del piano e supponiamo che F abbia una certa proprietà “ p “ . La proprietà
“ p “ si dirà una proprietà affine se è invariante rispetto al gruppo delle affinità cioè se per ogni
affinità ϕ del piano anche la figura ϕ (F) ha la proprietà “p”.
La geometria affine del piano consiste nella determinazione delle proprietà affini delle figure del
66

piano .

Quando il piano reale venga ampliato con i suoi punti immaginari ed i punti impropri esso
come visto diventa proiettivo. Usando le coordinate omogenee, i punti di tale piano, che
indichiamo con π, sono rappresentabili , in un riferimento reale fissato , con terne non nulle
(x1, x2 , x3 ) di numeri complessi e definite a meno di un fattore di proporzionalità non nullo. Inoltre
con tale rappresentazione un punto proprio è rappresentabile con una terna del tipo (y1, y2 , 1 ) ed
un punto improprio con (y1, y2 , 0 ).
Quando si consideri una matrice quadrata d’ordine tre ad elementi reali e non degenere

⎛ a 11 a 12 a 13 ⎞
⎜ ⎟
A= ⎜ a 21 a 22 a 23 ⎟ det A ≠ 0
⎜a a 32 a 33 ⎟⎠
⎝ 31

si può definire la seguente funzione del piano in sé :

ωA : P( x1, x2 , x3 ) ∈ π → P’(x’1, x’2 , x’3 ) ∈ π

con
⎧ x 1' = a 11 x 1 + a 12 x 2 + a 13 x 3
⎪⎪ 2

⎨ x 2 = a 21 x 1 + a 22 2 x 2 + a 23 x 3
'

⎪ '
⎪⎩ x 3 = a 31 x 1 + a 32 2 x 2 + a 33 x 3

Tale funzione è , come facilmente si verifica, un isomorfismo del piano in sé, chiamato proiettività
reale. E’ evidente che una matrice B proporzionale ad A secondo un fattore reale non nullo
definisce la stessa proiettività. Pertanto le proiettività reali costituiscono , rispetto alla usuale legge
di composizione di funzioni, un gruppo isomorfo ad un quoziente di GL(3,R).

Quando si considerino le matrici di GL(3,R) del tipo :

⎛ a 11 a 12 a 13 ⎞
⎜ ⎟ ⎛ a 11 a 12 ⎞
A= ⎜ a 21 a 22 a 23 ⎟ detA = det ⎜⎜ ⎟⎟ ≠ 0
⎜ 0 0 1 ⎟⎠ ⎝ a 21 a 22 ⎠

67

si ottiene un sottogruppo A(3,R) del gruppo GL(3,R) , e le proiettività da esse definite costituiscono
un sottogruppo, che indicheremo con A (3,R) , del gruppo delle proiettività reali. Le proiettività

definite dalle matrici del sottogruppo A(3,R) sono quindi rappresentate da equazioni del tipo :

⎧ x 1' = a 11 x 1 + a 12 2 x 2 + a 13 x 3
⎪⎪ '
⎨ x 2 = a 21 x 1 + a 22 2 x 2 + a 23 x 3
⎪ '
⎪⎩ x 3 = x 3

Una tale proiettività viene chiamata affinità del piano per queste ragioni .
Essa trasforma punti propri in punti propri , punti impropri in punti impropri , punti reali in punti
reali e punti immaginari in punti immaginari. La sua restrizione al piano affine è pertanto un’affinità
di tale piano. Per tale ragione il gruppo delle proiettività definite dalle matrici di A(3,R) sarà ancora
chiamato gruppo delle affinità del piano.

La geometria affine del piano proiettivo consiste nella determinazione delle proprietà delle
figure del piano che siano invarianti rispetto a tale gruppo.

Nel seguito riterremo che sul piano proiettivo agiscano soltanto tali affinità reali .

Appendice.

Ricordiamo preliminarmente il seguente risultato relativo al campo dei numeri reali .


Teorema . L’ unico automorfismo del campo reale è l’identità.
Accenniamo alla dimostrazione di questo teorema. Sia quindi
γ: R → R
un automorfismo del campo reale . L’applicazione γ è quindi biettiva ed ha le seguenti
due proprietà
1. γ (a + b) = γ (a) + γ (b)
2. γ (a b) = γ (a) γ (b)
68

Da 1 e 2 segue subito che è γ (0) = 0 , γ (1) = 1 e conseguentemente


1 1
γ (-a) = - γ (a) γ( ) = (a ≠ 0)
a γ (a )
Sia m un intero positivo . Possiamo scrivere
m = 1 + 1+ .. +1 (m volte)
e quindi è γ (m) = γ (1 + 1+ .. +1) = γ (1) + γ (1) + ….+ γ (1)= 1 + 1+ .. +1 = m.
Pertanto γ fissa i numeri interi non negativi.
Si ha allora
γ (- m) = - . γ (m) = - m .
e così γ fissa i numeri interi relativi .
m
Si ha allora che , per ogni numero razionale risulta :
n
m 1 1 1 m
γ( ) = γ (m ) = γ (m) γ ( ) = γ (m) =
n n n γ (n) n

Pertanto γ fissa i numeri razionali.


Se x è un numero irrazionale ed è rappresentato dalla successione (y 1, y2,….. ,yn ,…) di numeri
razionali allora è :
γ (x)= (γ (y 1), γ (y2),….. , γ (yn) ,…) = ( y 1, y2,….. ,yn ,…) = x.

L’ automorfismo γ è quindi l’identità e si ha così l’asserto.

Ora come annunciato proveremo il seguente.

Teorema fondamentale .
L’ unica affinità che trasforma in sé il riferimento fondamentale è l’identità.
Dimostrazione .
Sia quindi f : R2 → R2 un’ affinità del piano che trasforma in sé il riferimento
fondamentale cioè :
f (0,0) = (0,0) , f (1,0) = (1,0) , f (0,1) = (0,1)

Useremo spesso la seguente ovvia proprietà dell’affinità f :


(*)
Se r ed r’ sono due rette parallele tali risultano altresì le rette trasformate f ( r ) ed f ( r’ ) .
69

Per rendere più semplice l’ esposizione indicheremo :


con x la retta d’equazione y = 0 che congiunge (0,0) ed (1,0),
con y la retta d’equazione x = 0 che congiunge (0,0) ed (0,1)
con u la retta d’equazione x +y = 1 che congiunge (1,0) ed (0,1).

Poiché i tre punti (0,0) , (1, 0) , (0, 1) sono uniti in f tali risultato le rette x , y , u .

Si ha quindi :
f (x) = x , f (y) = y , f (u) = u .

Sia a un numero reale e sia ( a , 0 ) il punto dell’asse x di coordinate ( a, 0 ). Poiché f


trasforma in sé la retta x il punto ( a, 0 ) sarà trasformato da f in un punto (a’ , 0) sempre dell’ asse
x .
Possiamo allora considerare la seguente corrispondenza φ del campo reale R in sé :

φ : a∈ R → a’ ∈ R

Tale funzione φ è ovviamente biettiva . Inoltre essendo f(0,0) = (0,0) e f(1,0)= (1,0), si ha
φ(0) = 0 e φ(1) = 1 .Proveremo che tale funzione φ è un automorfismo del campo reale R.
Vediamo.

Abbiamo posto
f (a , 0 ) = ( φ(a) , 0 ) .

Osserviamo ora che la retta l parallela ad u passante per il punto (a, 0) ha equazione x + y = a .
Tale retta interseca la retta y nel punto ( 0 , a ). Poiché l è parallela ad u allora f(l ) è parallela
ad f(u) = u e quindi ad l . Poiché f(l ) deve contenere il trasformato di ( a , 0 ) allora f(l )
contiene il punto ( φ(a) , 0 ) e quindi essa interseca l’ asse y nel punto ( 0 , φ(a) ) . Pertanto il
punto (0,a) di y , che sta su l , è trasformato in punto di y che deve appartenere a f(l ) . Si ha
quindi :

f ( 0 , a ) = ( 0 , φ(a) )
70

Sia ( a, b ) un punto del piano . Siano t la retta per ( a, b ) parallela ad y e t’ la retta per
( a, b ) parallela ad x . La retta t che ha equazione x –a = 0 e la retta t’ ha equazione y –b =0.
La retta t contiene il punto (a , 0) di x e così la sua trasformata contiene il trasformato di tale
punto e cioè contiene ( φ(a) , 0 ). Analogamente la retta t’ contiene il punto (0 , b) di y e così la
sua trasformata f( t’ ) contiene il trasformato di tale punto e cioè contiene ( 0, φ(b) ).
Poiché t ed y sono parallele allora anche le loro trasformate f( t ) ed f(y ) = y sono parallele.
Poiché t’ ed x sono parallele allora anche le loro trasformate f( t’ ) ed f(x ) = x sono parallele.
Si conclude che f( t ) è parallela ad y e contiene il punto ( φ(a) , 0 ).Pertanto f( t ) ha equazione
x - φ(a) = 0 .
Analogamente f( t’ ) è parallela ad x e contiene il punto ( 0, φ(b)) e così f( t’ ) ha equazione
y - φ(b) = 0 .
Poiché (a , b ) è un punto di t ∩ t’ allora il trasformato di tale punto appartiene alle trasformate
f( t ) ed f( t’ ) . Abbiamo così provato che è :

f ( a , b ) = ( φ(a) , φ(b)).

La retta s per (a,b) parallela ad u ha equazione x + y = a + b ed essa interseca x nel punto


(a+b , 0). Poiché s è parallela ad u allora f(s) è parallela ad f(u) = u e contiene il trasformato del
punto (a,b).Pertanto f(s) è la retta parallela ad u e passante per il punto ( φ(a) , φ(b)) .
La retta f(s) ha quindi equazione x + y =φ(a) +φ(b) e quindi essa interseca la retta x nel punto
(φ(a) +φ(b) , 0 ) . Il punto (a+b , 0). comune ad s ed x è traformato quindi nel punto comune alle
rette trasformate f(s) ed f(x ) = x cioè nel punto (φ(a) +φ(b) , 0 ) .
71

(φ(a), φ(b))
(0,φ(b))

(a,b)
(0,b)
(0,1)

(φ(a),0)

(1,0) (a,0) (a+b,0) (φ(a) +φ(b),0)


(0,0)

Si ha quindi :

f( a+b , 0) = (φ(a)+φ(b) , 0 )

la quale mostra che è :


φ ( a+b) = φ(a) + φ(b).

Consideriamo due numeri a e b e consideriamo i due punti (a, 0) e (0, b). I loro trasformati per
quanto precede sono i punti (φ(a) , 0 ) e ( 0 , φ(b)) .
La retta l che unisce (0 ,1 ) con ( a , 0 ) ha equazione x + ay = a . La retta m per (0, b) ad essa
parallela ha quindi equazione x + a ( y –b) = x + ay – ab = 0. La retta m interseca quindi la retta x
nel punto (ab , 0 ).
Le rette l ed m sono tra loro parallele e quindi tali risultano anche le loro trasformate f(l ) ed
f(m ).
Poiché la retta l contiene (0 ,1 ) ed ( a , 0 ) allora la sua trasformata deve contenere i trasformati
di tali punti e cioè essa è la retta che unisce ( 0 , 1 ) e (φ(a) , 0 ) . Pertanto f(l ) ha equazione
x + φ(a) y = φ(a). La retta m contiene il punto (0,b) e quindi la retta f(m) deve contenere il suo
trasformato (0 , φ(b)) . Dovendo inoltre risultare f(m) parallela ad f(l ) si ha che la sua equazione
è: x + φ(a) ( y - φ(b)) = x + φ(a) y - φ(a) φ(b) = 0 .
La retta f(m) interseca quindi la retta x nel punto (φ(a) φ(b) , 0 ).
72

Il punto (ab , 0 ) comune ad m ed x è quindi trasformato nel punto comune alle loro trasformate
f(m) ed f(x) = x cioè nel punto (φ(a) φ(b) , 0 ).

(0,φ(b))

(0,b)

f(m)

m
(0,1)
f(l )

l
(ab,0)

(0,0) (a,0) (φ(a),0) (φ(a)φ(b),0)

Si ha quindi
f (ab , 0 ) = (φ(a) φ(b) , 0 ).

e questa mostra che è :


φ(ab) = φ(a) φ(b) .

La funzione φ costruita è quindi un automorfismo di R . La funzione φ è quindi l’identità e così


l’ affinità f , risultando
f(a , b) = (φ(a) , φ(b)) = ( a , b )
è l’identità.
L’ asserto è così provato.
73

Capitolo III

Circonferenza , ellisse , iperbole , parabola


74

1. La circonferenza.

Fissiamo nel piano reale un riferimento monometrico ed ortogonale R .


Siano Po ( xo , yo ) un punto del piano ed r un numero reale positivo.
Si chiama circonferenza di centro Po e raggio r l’insieme dei punti P del piano che hanno
distanza r da Po . Indichiamo con C tale insieme di punti e cerchiamo una sua rappresentazione
analitica . Sussistono le seguenti ovvie equivalenze :

P ( x , y ) ∈ C ⇔ d ( P , Po ) = r ⇔ ( x - xo) 2
+ ( y- yo) 2
= r ⇔ ( x – xo) 2 + ( y– yo) 2 = r2

Da queste segue quindi che appartengono alla circonferenza tutti e soli i punti del piano le cui
coordinate verificano l’equazione :

(1) ( x – xo) 2 + ( y– yo) 2 = r2

la quale può scriversi così :

(2) x2 + y2 + ax + by + c = 0

avendo indicato con a , b , c le seguenti quantità :

a = -2 xo , b = -2 yo , c = xo 2 + yo 2 - r2

L’ equazione
x2 + y2 + ax + by + c = 0

rappresenta quindi la circonferenza C nel riferimento R fissato.


E’ evidente che un’equazione proporzionale ad essa secondo un fattore di proporzionalità non nullo
avendo le stesse soluzioni, rappresenta lo stesso insieme di punti.

L’equazione x2 + y2 + ax + by + c = 0 che rappresenta C nel riferimento scelto è quindi di


secondo grado , manca del termine misto xy ed ha eguali i coefficienti di x2 e y2 .

Non sempre però un’equazione di questo tipo rappresenta una circonferenza . Vediamo perché.
75

Sia quindi assegnata l’equazione


x2 + y2 + ax + by + c = 0

essa rappresenta una circonferenza di centro Po ( xo , yo ) e raggio r (positivo) se risulta :

(3) x2 + y2 + ax + by + c = ( x – xo) 2 + ( y– yo) 2 - r2

L’eguaglianza (3) sussiste se risulta :

a = -2 xo , b = -2 yo , c = xo 2 + yo 2 - r2

Si ha quindi

a b
xo = - , yo = -
2 2

2 2 2 a2 b2
(4) r = xo + yo – c = + -c
4 4

Dalla (4) segue quindi che si troverà un numero r positivo ,raggio della circonferenza cercata ,
se si ha :

a2 b2
(5) + -c > 0
4 4

Riassumendo :
l’equazione x2 + y2 + ax + by + c = 0 che abbia a , b , c verificanti la proprietà (5) è
a b
l’equazione della circonferenza con centro nel punto Po = ( - , - ) e raggio r dato da :
2 2

2
a b2
(6) r = + -c .
4 4
76

Sia C una circonferenza del piano con centro nel punto Po ( xo , yo ) e raggio r positivo e sia

x2 + y2 + ax + by + c = 0

l’equazione che rappresenta C in un riferimento fissato . Sia P ( x , y ) un punto della


circonferenza. Esiste una sola retta per P che incontra C nel solo punto P essa è chiamata la retta
tangente a C nel punto P . E’ noto che tale retta tP coincide con la retta per P ortogonale alla
retta l che unisce P al centro Po .

P0 tP

I numeri direttori della retta l sono ( x - xo , y - yo ) e quindi la retta tP ha equazione :

tP : ( x - xo ) ( x - x ) + ( y - yo ) ( y - y ) = 0.

Quando il piano reale venga ampliato con i punti immaginari anche la circonferenza C
rappresentata dall’equazione a coefficienti reali
x2 + y2 + ax + by + c = 0
si arricchisce di ulteriori punti ( immaginari ) corrispondenti alle soluzioni complesse
dell’equazione che la rappresenta .
Quando al piano si aggiungano anche i punti impropri allora per rappresentare tutti i punti di
C propri ed impropri occorre che l’equazione x2 + y2 + ax + by + c = 0 di C sia resa
omogenea.
Pertanto l’equazione
x2 + y2 + a x t + b y t + ct2 = 0

rappresenta tutta la circonferenza C inclusi i suoi punti impropri.


77

Ma quali sono i punti impropri di C ? Vediamo.

E’ chiaro che i punti impropri di C sono quelli che essa ha in comune con la retta impropria
del piano che si rappresenta con l’equazione t = 0 . I punti impropri di C corrispondono quindi
alle soluzioni non nulle del seguente sistema S :
⎧ x 2 + y 2 + a x t + b y t + ct 2 = 0
S: ⎨
⎩t = 0
Le soluzioni cercate si ottengono quindi attraverso le soluzioni non nulle di :
⎧x 2 + y2 = 0
S: ⎨
⎩t = 0
E sono quindi ottenute attraverso le soluzioni di
⎧(x + iy)(x -iy) = 0
S: ⎨
⎩t = 0
che equivale a
⎧(x + iy) = 0 ⎧(x -iy) = 0
⎨ , ⎨
⎩t = 0 ⎩t = 0

Pertanto i punti impropri della circonferenza C sono due e sono immaginari e coniugati e sono
i punti
A∞ =( i , 1 , 0) e A∞' =( -i , 1 , 0 )

punti impropri delle rette complesse x + i y = 0 e x -i y = 0 .

I punti A∞ =( i , 1 , 0) e A∞' = ( -i , 1 , 0 ) sono chiamati i punti ciclici del piano .

Abbiamo così provato che una qualunque circonferenza reale quando la si pensi
immersa nel piano proiettivo complesso ha in comune con la retta impropria i punti ciclici del
piano.

Quando si assegni nell’insieme dei punti del piano reale una proprietà “p” si può considerare
il sottoinsieme che tale proprietà determina. Si può inoltre cercare di descrivere il luogo F dei punti
P del piano che godono della proprietà assegnata attraverso l’uso di una sua rappresentazione
analitica in un riferimento assegnato.
78

Abbiamo appena visto un primo esempio di questo problema. Infatti la proprietà


“p” P ha distanza r dal punto Po
è una proprietà definita tra i punti del piano ed il sottoinsieme C che essa determina è una
circonferenza della quale abbiamo trovato in un riferimento ortogonale una sua semplice
rappresentazione. Usando tale rappresentazione è stato poi più facile indagare sulle proprietà
dell’insieme C .
Percorrendo questa idea descriveremo ora altri ben noti insiemi di punti :
ellisse , iperbole , parabola
ognuno dei quali è definito attraverso una ben precisa proprietà . Ciò che accomuna tali luoghi è che
essi al pari della circonferenza sono rappresentati tutti in un riferimento fissato da una equazione di
secondo grado .Vediamo.

2. Ellisse.
Siano F ed F’ due punti distinti del piano e sia 2c la loro distanza. Fissato un numero
a>c consideriamo i punti P del piano che hanno la seguente proprietà :

d ( P , F ) + d ( P , F’) = 2a

Tale insieme di punti è chiamato ellisse e sarà ora denotato con E . I due punti F ed F’ sono detti
i fuochi dell’ellisse.
Cerchiamo ora una rappresentazione di tale insieme E . Per fare ciò disponiamo il
riferimento che sceglieremo ortogonale, in modo che l’asse x coincida con la retta che congiunge
F’ ed F e l’origine O col punto medio del segmento [F’ , F] . Orientamo gli assi in modo che F
abbia coordinate (c , 0) ed F’ abbia coordinate ( -c, 0).
79

Con tale scelta del riferimento si ha

P ( x , y )∈ E ⇔ d ( P , F ) + d ( P , F’ ) = 2a ⇔

2
( x - c) + y2 + ( x + c) 2
+ y 2 = 2a

Poniamo b2 = a2 – c2 .

Si hanno le seguenti equivalenze :

( x - c) 2
+ y2 + ( x + c) 2
+ y 2 = 2a ⇔

( x - c) 2
+ y 2 = 2a - ( x + c) 2
+ y2 ⇔

( x –c)2 + y2 – 4 a2 – (x + c) 2 – y2 = -4a ( x + c) 2 + y 2 ⇔

( c2 – a2)x2 –a2y2 = a2 (c2 –a2 ) ⇔

b2x2 –a2y2 = a2 b2 ⇔

x2 y2
+ 2 = 1 ( essendo c2 = a2 – b2 )
a2 b

Pertanto fanno parte dell’ellisse tutti e soli i punti P (x,y) del piano le cui coordinate soddisfano
l’equazione
x2 y2
+ = 1
a2 b2
o equivalentemente

b2x2 + a2y2 –a2b2 = 0

che rappresenta quindi l’ellisse nel riferimento scelto.


80

Quando il piano reale venga ampliato con i punti immaginari anche l’ellisse E rappresentata
dall’equazione a coefficienti reali
b2x2 + a2y2 –a2b2 = 0
si arricchisce di ulteriori punti ( immaginari ) corrispondenti alle soluzioni complesse
dell’equazione che la rappresenta.
Quando al piano si aggiungano anche i punti impropri allora per rappresentare tutti i punti di E
propri ed impropri occorre che l’equazione b2x2 + a2y2 –a2b2 = 0 di E sia resa omogenea.
Pertanto l’equazione
b2x2 + a2y2 –a2b2 t2 = 0

rappresenta tutti i punti propri ed impropri dell’ ellisse E .


I punti impropri dell’ellisse sono i punti che l’ellisse ha in comune con la retta impropria e
quindi si ottengono in corrispondenza alle soluzioni non nulle del seguente sistema S :

⎧b 2 x 2 + a 2 y 2 -a 2 b 2 t 2 = 0
S⎨
⎩t=0

Il sistema S è equivalente a :

⎧b 2 x 2 + a 2 y 2 = 0
S⎨
⎩t=0
Che può scriversi così
⎧b 2 x 2 - i 2 a 2 y 2 = 0

⎩t=0

Si ha quindi

⎧(bx- iay)(bx + iay) = 0



⎩t=0
Da cui segue :

⎧bx- iay = 0 ⎧bx + iay = 0


⎨ , ⎨
⎩t=0 ⎩t=0
81

I punti impropri dell’ellisse sono i seguenti due punti

A∞ ( ia , b , 0 ) A∞' (- ia , b , 0 )

immaginari e coniugati. La retta impropria è quindi esterna all’ellisse.

3. Iperbole.
Siano F ed F’ due punti distinti del piano e sia 2c la loro distanza. Fissato un numero
a < c consideriamo i punti P del piano che hanno la seguente proprietà :

| d ( P , F ) - d ( P , F’) | = 2a

Tale insieme di punti è chiamato iperbole e sarà ora denotato con I . I due punti F ed F’ sono
detti i fuochi dell’iperbole .
Cerchiamo ora una rappresentazione di tale insieme I. Per fare ciò disponiamo il
riferimento che sceglieremo ortogonale, in modo che l’asse x coincida con la retta che congiunge
F’ ed F e l’origine O col punto medio del segmento [F’ , F] . Orientamo gli assi in modo che F
abbia coordinate (c , 0) ed F’ abbia coordinate ( -c, 0).

Con tale scelta del riferimento si ha

P ( x , y )∈ I ⇔ | d ( P , F ) - d ( P , F’) | = 2a ⇔

⇔ | ( x - c) 2
+ y2 - ( x + c) 2
+ y 2 | = 2a
82

Poniamo b2 = c2 – a2 .

Con calcoli del tutto simili a quelli già illustrati per l’ellisse si trova che :

x2 y2
P ( x , y )∈ I ⇔ – = 1
a2 b2

Pertanto fanno parte dell’iperbole tutti e soli i punti P (x,y) del piano le cui coordinate soddisfano
l’equazione
x2 y2
– = 1
a2 b2
o equivalentemente

b2x2 – a2y2 – a2b2 = 0

che rappresenta quindi l’iperbole nel riferimento scelto.


Quando il piano reale venga ampliato con i punti immaginari anche l’iperbole I rappresentata
dall’equazione a coefficienti reali
b2x2 – a2y2 – a2b2 = 0
si arricchisce di ulteriori punti ( immaginari ) corrispondenti alle soluzioni complesse
dell’equazione che la rappresenta.
Quando al piano si aggiungano anche i punti impropri allora per rappresentare tutti i punti di I
propri ed impropri occorre che l’equazione b2x2 – a2y2 –a2b2 = 0 di I sia resa omogenea.
Pertanto l’equazione
b2x2 - a2y2 –a2b2 t2 = 0

rappresenta tutti i punti propri ed impropri dell’ iperbole I.


I punti impropri dell’ iperbole sono i punti che l’ iperbole ha in comune con la retta
impropria e quindi si ottengono in corrispondenza alle soluzioni non nulle del seguente sistema S :

⎧ b2x 2 - a 2 y2 - a 2b2 t 2 = 0
S: ⎨
⎩t = 0
83

Il sistema S è equivalente a :

⎧ b2x 2 - a 2 y2 = 0
S⎨
⎩t = 0
che può scriversi così

⎧ (bx - ay )(bx + ay ) = 0

⎩t = 0

Da cui segue :

⎧ bx - ay = 0 ⎧ bx + ay = 0
⎨ , ⎨
⎩t = 0 ⎩t = 0

I punti impropri dell’iperbole sono quindi i seguenti due punti reali e distinti

A∞ ( a , b , 0 ) A∞' (- a , b , 0 )

La retta impropria è quindi secante l’iperbole .

4. Parabola.
Siano F un punto e r una retta non contenente F. Sia 2p la distanza di F dalla retta r .
Consideriamo i punti P del piano che hanno la seguente proprietà :

d(P,F)=d(P,r)

Tale insieme di punti è chiamato parabola e sarà ora denotato con P . Il punto F è detto fuoco
mentre la retta r è chiamata direttrice .
Cerchiamo ora una rappresentazione di tale insieme P .
Per fare ciò disponiamo il riferimento che sceglieremo ortogonale, in modo che l’asse x
coincida con la retta m per F ortogonale ad r e l’origine O col punto medio del segmento [F , M]
M essendo il punto d’intersezione di m con r . Orientiamo gli assi in modo che F abbia
84

coordinate (p , 0) .

Con tale scelta del riferimento si ha

P ( x , y )∈ P ⇔ d ( P , F ) = d ( P , r) ⇔

2
( x - p) + y2 = ‫ ׀‬x + p ‫׀‬

Da questa elevando al quadrato segue :

(**) y2 - 2 p x = 0

e tale equazione rappresenta quindi la parabola P nel riferimento scelto.


Quando il piano reale venga ampliato con i punti immaginari anche la parabola P rappresentata
dall’equazione a coefficienti reali
y2 - 2 p x = 0
si arricchisce di ulteriori punti ( immaginari ) corrispondenti alle soluzioni complesse
dell’equazione che la rappresenta.
Quando al piano si aggiungano anche i punti impropri allora per rappresentare tutti i punti di P
propri ed impropri occorre che l’equazione y2 - 2 p x = 0 di P sia resa omogenea.
Pertanto l’equazione omogenea
y2 - 2 p x t = 0
85

rappresenta tutti i punti propri ed impropri della parabola P .


Quali sono i punti impropri della parabola P ? Vediamo .
I punti impropri della parabola P sono i punti che la parabola ha in comune con la retta
impropria e quindi si ottengono in corrispondenza alle soluzioni non nulle del seguente sistema S :

⎧ y2 - 2 p x t = 0
S: ⎨
⎩t = 0

Tale sistema è equivalente a

⎧ y2 = 0
S: ⎨
⎩t = 0

che ha nella terna ( 1 , 0 , 0) due soluzioni coincidenti .


Pertanto la parabola ha un solo punto improprio reale.
La retta impropria è quindi tangente alla parabola.

Le curve reali descritte in precedenza circonferenza , ellisse , iperbole , parbola sono anche
chiamate coniche per la ragione seguente.

Nello spazio scegliamo un piano πo e su di esso consideriamo una circonferenza C di


raggio r da noi scelto che abbia il centro in un punto di πo che chiamiamo Po. Consideriamo la retta
m per Po ortogonale a πo e su tale retta scegliamo un punto V distinto da Po .
L ‘ unione di tutte le rette VP ( generatrici ), al variare di P su C , è detto cono ( circolare
retto ) di vertice V e direttrice C .
Sia ora π un piano dello spazio non passante per il vertice V.
L’intersezione di π col cono è :

a) una circonferenza se π è ortogonale ad m .


b) una ellisse se π incide tutte le generatrici ma non è ortogonale ad m .
c) una iperbole se π incide tutte le generatrici tranne due .
d) una parabola se π incide tutte le generatrici tranne una.
86

Se il piano π passa per V allora l’intersezione di π col cono è :

1. una sola retta ( piano tangente )

oppure

2. due rette distinte ( piano secante )

Le curve reali che abbiamo descritto in questo capitolo ( circonferenza , ellisse , iperbole ,
parabola ) vengono chiamate coniche ( non degeneri ) in quanto ottenibili come sezioni piane di
un cono .
Inoltre tali curve reali ( circonferenza , ellisse , iperbole , parabola ) come già abbiamo
osservato quando le pensiamo immerse nel piano proiettivo complesso sono tutte rappresentate da
una

equazione omogenea di secondo grado in tre variabili a coefficienti reali .

Nel piano reale ampliato coi punti immaginari e coi punti impropri si scelga un riferimento
reale e si scelgano poi due rette reali r ed s rappresentate nel riferimento scelto dalle seguenti
equazioni a coefficienti reali :
87

r : ax + by + ct = 0
s : a’x + b’y + c’t = 0

E’ chiaro che l’equazione omogenea di secondo grado

(ax + by + ct )( a’x + b’y + c’t ) = 0

che si ottenga come prodotto delle due equazioni date rappresenta l’insieme r ∪ s . Mentre
l’equazione omogenea di secondo grado

(ax + by + ct )2 = 0

rappresenta sempre la retta r ( contata due volte ).


Una equazione omogenea a coefficienti reali in tre variabili può quindi essere la
rappresentazione di :

una circonferenza reale , di una ellisse , di una iperbole , di una parabola e di una coppia di rette
distinte o coincidenti .

( e queste come visto sono tutte le possibili sezioni di un piano col cono ).

Nel capitolo che segue daremo la definizione di conica e poi studieremo a fondo tali
insiemi di punti del piano.
Nello studio che faremo ci imbatteremo spesso a dover ricercare le soluzioni non nulle di
un’equazione omogenea di secondo grado in due variabili ( che qui indichiamo con λ e µ ) del
tipo :

(++) a λ2 + bλ µ + c µ2 = 0 .

ed è quindi utile sapere come si trovano le sue soluzioni non nulle.

E’ chiaro che se la coppia ( λ o , µ o ) verifica l’equazione (++) anche la coppia


( ρ λ o , ρ µ o ) con ρ ≠ 0 verifica l’equazione (++) .
Ora se è a ≠ 0 e ( λo , µ o ) è una soluzione non può essere µ o = 0 perché ciò
88

comporterebbe anche λ o = 0 . Pertanto è µ o ≠ 0 ed allora possiamo assumere µ o =1e


determinare λ o attraverso le soluzioni di
(+) a λ2 + bλ + c = 0 .
ottenuta appunto dalla (++) ponendo µ = 1.
Se λ 1 e λ 2 sono le soluzioni dell’equazione (+) le due coppie ( λ 1 , 1 ) e ( λ 2 , 1 ) sono le
soluzioni cercate dell’equazione (++).
Se a = 0 allora l’equazione (++) diviene

bλ µ + c µ2 = µ ( bλ + c µ ) = 0 .

e quindi le soluzioni sono ( 1 , 0 ) e ( -c , b ).


89

Capitolo IV

Le coniche
90

1. Le coniche del piano proiettivo complesso.

Nel piano proiettivo complesso che indicheremo con π ( nel quale sia fissato un riferimento
reale R ) si chiama conica
l’insieme dei punti P del piano verificanti con le loro coordinate omogenee un’equazione non
identica omogenea di secondo grado in tre variabili ( x , y, t ) a coefficienti complessi del tipo .

(1) a11x 2 + a22 y 2 + a33 t2 + 2 a12 xy + 2 a13 xt + 2 a23 yt = 0.

Quando i coefficienti aij dell’equazione (1) sono numeri reali ( o proporzionali a numeri reali) la
conica è detta reale .

E’ chiaro che ogni equazione proporzionale all’equazione (1) secondo un fattore di proporzionalità
non nullo , avendo le stesse soluzioni della (1) , rappresenta lo stesso insieme di punti.
E’ chiaro inoltre che poiché l’equazione (1) è omogenea se la terna non nulla ( y1, y2, y3 ) verifica
l’equazione (1) anche la terna ( ρ y1, ρ y2, ρ y3 ) con ρ ≠ 0 verifica l’equazione (1) sicchè ha
senso dire che un punto del piano soddisfa con le sue coordinate omogenee l’equazione (1).
Alla conica Г rappresentata nel riferimento scelto dall’equazione :

a11x 2 + a22 y 2 + a33 t2 + 2 a12 xy + 2 a13 xt + 2 a23 yt = 0.

si può associare la seguente matrice quadrata d’ordine tre simmetrica ottenuta utilizzando i
coefficienti aij dell’equazione della conica .

⎛ a 11 a 12 a 13 ⎞
⎜ ⎟
A= ⎜ a 21 a 22 a 23 ⎟ ( aij = aji )
⎜a a 32 a 33 ⎟⎠
⎝ 31

Si osservi ora esplicitamente che nell’equazione :

il numero che accompagna xy è il doppio di a12

il numero che accompagna xt è il doppio di a13


91

il numero che accompagna yt è il doppio di a23

pertanto una certa attenzione va posta quando si scrive la matrice A associata alla conica .

Ad esempio la matrice associata alla conica reale Г rappresentata da :

2x2 + 3 y2 + 2xt + 4 y t = 0

è la seguente :

⎛2 0 1⎞
⎜ ⎟
A = ⎜ 0 3 2⎟
⎜1 2 0⎟
⎝ ⎠

Vedremo in seguito che nella matrice A associata alla conica sono contenute molte
informazioni sulla conica stessa e per tale ragione occorre scriverla in modo corretto.

Studieremo ora in modo approfondito le coniche del piano già consapevoli che tra quelle
reali dovremo ritrovare quelle descritte in precedenza .

( coppia di rette distinte o coincidenti , circonferenza , ellisse , iperbole e parabola ).

Ma queste già descritte sono le uniche coniche reali o ce ne sono anche altre ? Vediamo.

Sia Г una conica rappresentata in un riferimento fissato dall’equazione

a11 x 12 + a22 x 22 + a33 x 32 + 2 a12 x1 x2 + 2 a13 x1 x3 + 2 a23 x2 x3 = 0

Ci è utile osservare che tale equazione può scriversi nei seguenti modi :

(a11 x1 + a12 x2 + a13 x3 ) x1 +

(a21 x1 + a22 x2 + a23 x3 ) x2 +


92

(a31 x1 + a32 x2 + a33 x3 ) x3 = 0

∑a
i, j
ij xi x j = 0 ( aij = aji ) (nella sommatoria gli indici i e j variano da 1 a 3)

⎛ x1 ⎞ ⎛ a 11 a 12 a 13 ⎞
⎜ ⎟ ⎜ ⎟
Xt A X = 0 dove è X = ⎜x2 ⎟ ed A= ⎜ a 21 a 22 a 23 ⎟ ( aij = aji )
⎜x ⎟ ⎜a a 32 a 33 ⎟⎠
⎝ 3⎠ ⎝ 31

Porremo inoltre a volte per semplicità :

f ( x1 , x2 , x3 ) = a11 x 12 + a22 x 22 + a33 x 32 + 2 a12 x1 x2 + 2 a13 x1 x3 + 2 a23 x2 x3

f1 ( x1 , x2 , x3 ) = a11 x1 + a12 x2 + a13 x3

f2 ( x1 , x2 , x3 ) = a21 x1 + a22 x2 + a23 x3

f3 ( x1 , x2 , x3 ) = a31 x1 + a32 x2 + a33 x3

Per la simmetria della matrice A sussiste questa utile eguaglianza che useremo spesso in seguito :

per ogni coppia di terne non nulle ( y1 , y2 , y3 ) e ( z1 , z2 , z3 ) si ha che sono eguali le


seguenti due quantità che indicheremo con

f(y / z) e f(z / y)

dove è :

f(y / z) = (a11 y1 + a12 y2 + a13 y3 ) z1 +

(a21 y1 + a22 y2 + a23 y3 ) z2 +

(a31 y1 + a32 y2 + a33 y3 ) z3


93

f ( z / y ) = (a11 z1 + a12 z2 + a13 z3 ) y1 +

(a21 z1 + a22 z2 + a23 z3 ) y2 +

(a31 z1 + a32 z2 + a33 z3 ) y3

2. Intersezione di una retta con una conica.


Sia Г una conica del piano π rappresentata, nel riferimento reale scelto, dall’equazione

a11 x 12 + a22 x 22 + a33 x 32 + 2 a12 x1 x2 + 2 a13 x1 x3 + 2 a23 x2 x3 = 0

e sia r una retta del piano passante per i punti Y e Z di coordinate ( y1 , y2 , y3 ) e

( z1 , z2 , z3 ) . Quando si rappresenti r in forma parametrica si riconosce che i punti di r hanno,


al variare dei parametri ( λ , µ ) ≠ ( 0 , 0 ) , coordinate del tipo

(x1 , x2 , x3 ) = λ (y1 , y2 , y3 ) + µ (z1 , z2 , z3 )


Cioè :
(x1 , x2 , x3 ) = ( λ y1 + µ z1, λ y2 + µ z2 , λ y3 + µ z3 )

Ci chiediamo per quali valori dei parametri ( λ , µ ) ≠ ( 0 , 0 ) il punto


( λ y1 + µ z1, λ y2 + µ z2 , λ y3 + µ z3 ) della retta r appartenga anche alla conica Г .

Ora il punto ( λ y1 + µ z1, λ y2 + µ z2 , λ y3 + µ z3 ) della retta r appartiene alla conica Г


se risulta :

(2.1) ∑a
i, j
ij ( λy i + µ z i ) ( λy j + µ z j ) = 0

L’ equazione (2.1) è una equazione omogenea di secondo grado nelle incognite λ e µ del tipo

(2.2) a λ2 + 2 b λ µ + c µ2 =0
94

avendo posto

a = ∑a
i, j
ij yi y j , b= ∑a
i, j
ij yi z j , c = ∑a
i, j
ij zi z j

Se l’equazione (2.2) è identicamente nulla cioè risulta a = b = c = 0 allora per ogni


scelta dei parametri λ e µ il punto di r di coordinate
( λ y1 + µ z1, λ y2 + µ z2 , λ y3 + µ z3 ) appartiene alla conica e qundi la retta r è contenuta
nella conica Г .
Se l’equazione (2.2) non è identicamente nulla allora essa ammette due soluzioni (distinte o
coincidenti ) in corrispondenza delle quali si trovano due punti (distinti o coincidenti) comuni alla
retta r ed alla conica Г .
Abbiamo così stabilito il seguente risultato:

Proposizione 2.1. Una retta del piano non contenuta nella conica ha in comune con essa
al più due punti .

Da tale risultato segue ovviamente che :

una retta che abbia almeno tre punti in comune con la conica è contenuta nella conica .

3. Le coniche degeneri.
Sia Г una conica del piano π rappresentata, nel riferimento reale scelto, dall’equazione

a11 x 12 + a22 x 22 + a33 x 32 + 2 a12 x1 x2 + 2 a13 x1 x3 + 2 a23 x2 x3 = 0

Se il polinomio

f ( x1 , x2 , x3 ) = a11 x 12 + a22 x 22 + a33 x 32 + 2 a12 x1 x2 + 2 a13 x1 x3 + 2 a23 x2 x3

è riducibile esso è il prodotto di due polinomi omogenei di primo grado (distinti o coincidenti) e
risulta quindi :

a11 x 12 + a22 x 22 + a33 x 32 + 2 a12 x1 x2 + 2 a13 x1 x3 + 2 a23 x2 x3 =


95

( a x1 + b x2 + c x3) ( a’ x1 + b’ x2 + c’ x3)

In tal caso la conica Г rappresentata dall’equazione

a11 x 12 + a22 x 22 + a33 x 32 + 2 a12 x1 x2 + 2 a13 x1 x3 + 2 a23 x2 x3 = 0

è l’unione delle due rette r ed s (distinte o coincidenti ) rappresentate rispettivamente da :

r : a x1 + b x2 + c x3 = 0
s : a’x1 + b’x2 + c’x3 = 0

Quando la conica è unione di due rette essa è detta degenere , semplicemente degenere
se le due rette sono distinte e doppiamente degenere se le due rette sono coincidenti.
Come si può valutare se una conica è degenere ? Vediamo.
Per fare ciò occorre introdurre la nozione di punto doppio.
Sia Г una conica. Un punto P della conica è detto doppio se esso ha la seguente
proprietà :

(*) ogni retta passante per P ha in comune con la conica il solo punto P oppure è contenuta
nella conica.

Un punto che non sia doppio è detto semplice.

Quando una conica è degenere essa possiede punti doppi . Infatti , riferendosi alle figure ,
96

r s
r =s

Se la conica è semplicemente degenere ed è l’unione delle due rette distinte r ed s allora ,


detto V il punto comune alle due rette esso è doppio per la conica ed è l’ unico punto doppio della
conica .

Se la conica è doppiamente degenere allora ogni suo punto è doppio.


Questa proprietà esaminata per le coniche degeneri caratterizza le coniche degeneri come mostra la
seguente

Proposizione 3.1. Una conica Г è degenere se e solo se essa possiede punti doppi.

Dimostrazione. Abbiamo già osservato che se la conica è degenere essa possiede punti
doppi. Supponiamo quindi che la conica possegga almeno un punto V doppio e proviamo che essa
è degenere. Sia P un punto della conica distinto da V . La retta r per V e P è contenuta nella
conica in quanto V è doppio. Se risulta Г = r allora Г è doppiamente degenere . Se invece
Г ⊃ r scegliamo un punto T di Г - r . La retta s che unisce V e T , è distinta da r
ed è contenuta in Г essendo V un punto doppio. Proviamo ora che risulta Г = r ∪ s .
Supponiamo per assurdo che risulti Г ⊃ r ∪ s .
Sia T un punto di Г non appartenente alle rette r ed s . Ogni retta l per T è contenuta

in Г .
Infatti ciò è ovvio se l passa per V ( che è doppio) ed è altrettanto vero se l non passa per V in

quanto in tal caso la retta l ha in comune con la conica Г i tre punti distinti T , M = l ∩ r ,

N=l ∩ s.

Se ogni retta per T è contenuta nella conica allora ogni punto del piano appartiene alla conica è
97

ciò è assurdo in quanto l’equazione che rappresenta la conica è non identica e quindi la conica è un
sottoinsieme proprio del piano.

Dalla proposizione ora provata seguono le seguenti ovvie proprietà :

a) se una conica possiede un sol punto doppio essa è semplicemente degenere.

b) se una conica possiede almeno due punti doppi A e B allora essa è doppiamente
degenere riducendosi alla retta che unisce A e B.

La proposizione 3.1 ora provata e che caratterizza le coniche degeneri sposta l’attenzione sulla
ricerca degli eventuali punti doppi della conica .
Ma come si trovano i punti doppi di una conica ? Vediamo .

Il teorema che segue fornisce la risposta al quesito posto.

Proposizione 3.2. Un punto P del piano è doppio per la conica Г rappresentata


dall’equazione
Г : ∑a
i, j
ij xi x j = 0 ( aij = aji )

se e solo se le sue coordinate ( y1 , y2 , y3 ) verificano le seguenti eguaglianze :

a11 y1 + a12 y2 + a13 y3 = 0

(3.1) a21 y1 + a22 y2 + a23 y3 = 0

a31 y1 + a32 y2 + a33 y3 = 0

Dimostrazione. Cominciamo a provare che se un punto ha coordinate verificanti le


eguaglianze (3 . 1) esso è un punto della conica ed è doppio per essa . Abbiamo già osservato che
risulta

∑a
i, j
ij yi y j = ( a11 y1 + a12 y2 + a13 y3 ) y1 + (a21 y1 + a22 y2 + a23 y3) y2 +

+ (a31 y1 + a32 y2 + a33 y3) y3


98

e pertanto , se valgono le (3.1), si ha ∑a


i, j
ij yi y j = 0 , il che prova che P è un punto della conica.

Proviamo ora che esso è doppio per la conica Г .

Sia Z un punto qualsiasi del piano distinto dal punto P e sia r la retta che unisce P con Z .

Siano ( z1 , z2 , z3 ) le coordinate di Z e sia

( x1 , x2 ,x3 ) = ( λ y1 + µ z1, λ y2 + µ z2 , λ y3 + µ z3 )

la rappresentazione parametrica della retta r .

Abbiamo già visto ( al numero 2 di questo capitolo) che gli eventuali punti comuni alla retta r ed
alla conica si trovano attraverso le soluzioni non nulle dell’equazione

a λ2 + 2 b λ µ + c µ2 =0

dove è :

a = ∑a
i, j
ij yi y j , b= ∑a
i, j
ij yi z j , c = ∑a
i, j
ij zi z j

Stante le (3.1) si ha allora a = 0 e b = 0 e pertanto l’ equazione

a λ2 + 2 b λ µ + c µ2 =0
diventa

c µ2 =0

Se anche c = 0 allora la retta r è contenuta nella conica se invece è c ≠ 0 allora


l’equazione c µ2 = 0 fornisce come sua unica soluzione la coppia ( 1 , 0 ) cui corrisponde il
punto P che diventa quindi l’unico punto che r ha in comune con Г .

Abbiamo provato così che se valgono le (3.1) allora P appartiene alla conica ed inoltre (vista
l’arbitrarietà del punto Z ) ogni retta per P o è contenuta in Г o ha in comune con Г il solo
punto P e ciò prova che P è doppio per Г .

Viceversa supponiamo che un punto P ( y1 , y2 ,y3 ) della conica Г sia doppio per essa e
proviamo che le sue coordinate ( y1 , y2 ,y3 ) verificano le (3 . 1 ).
99

Al solito sia Z un punto qualsiasi del piano distinto dal punto P e sia r la retta che unisce P
con Z . Siano ( z1 , z2 , z3 ) le coordinate di Z e sia

( x1 , x2 ,x3 ) = ( λ y1 + µ z1, λ y2 + µ z2 , λ y3 + µ z3 )

la rappresentazione parametrica della retta r .

I punti comuni alla retta r ed alla conica si trovano attraverso le soluzioni non nulle dell’equazione

a λ2 + 2 b λ µ + c µ2 =0

dove è :

a = ∑a
i, j
ij yi y j , b= ∑a
i, j
ij yi z j , c = ∑a
i, j
ij zi z j

Poiché P è un punto della conica allora è a = 0 . L’ equazione

a λ2 + 2 b λ µ + c µ2 =0
diventa così :
µ ( 2 b λ + c µ) =0
Si ha quindi la soluzione ( attesa ) (1 , 0) cui corrisponde P e l’altra soluzione si ottiene da
( 2 b λ + c µ) = 0.
Poiché P è doppio la retta PZ è contenuta in Г oppure ha in comune con Г il solo punto P e
quindi l’ equazione ( 2 b λ + c µ ) =0 deve o essere identicamente nulla o deve fornire
ancora come soluzione la coppia ( 1, 0 ) . In entrambi i casi ciò comporta che è b = 0 .
Pertanto qualunque sia Z ( z1 , z2 , z3 ) risulta allora che è :

b= ∑a
i, j
ij yi z j =0

Esplicitamente è :

b = (a11 y1 + a12 y2 + a13 y3 ) z1 +(a21 y1 + a22 y2 + a23 y3 ) z2 + (a31 y1 + a32 y2 + a33 y3 ) z3

ed esso è nullo , per ogni scelta del punto Z , e quindi per ogni scelta della terna ( z1 , z2 , z3 ).
100

Scegliendo

( z1 , z2 , z3 ) = ( 1, 0 , 0 ) , ( z1 , z2 , z3 ) = ( 0, 1 , 0 ) , ( z1 , z2 , z3 ) = ( 0, 0 , 1 )

si hanno le (3.1) e l’asserto è così provato.

La proposizione ora provata ha mostrato che determinare gli eventuali punti doppi della
conica equivale a determinare le eventuali soluzioni non nulle del seguente sistema omogeneo

⎧a 11 x 1 + a 12 x 2 + a 13 x 3 = 0

(3.2) S : ⎨a 21 x 1 + a 22 x 2 + a 2 3 x 3 = 0
⎪a x + a x + a x = 0
⎩ 31 1 32 2 33 3

che ha per matrice la matrice A della conica .

Pertanto , tenendo conto delle proposizioni ( 3. 1) e (3. 2 ) , si ha questa utilissima

Proposizione 3.3 Una conica Г rappresentata dall’equazione


Г : ∑a
i, j
ij xi x j = 0 ( aij = aji )

è degenere se e solo se risulta


det A = 0 .

Dimostrazione. Se Г è degenere essa possiede almeno un punto doppio P. Le coordinate dì P sono


quindi una soluzione non nulla del sistema omogeneo (3 .2) e così è det A = 0.
Viceversa se detA=0 il sistema (3 .2) ha soluzioni non nulle ed in corrispondenza a tali soluzioni si
hanno punti doppi per Г la quale è così degenere.

4. Coniche non degeneri . Tangente in un punto.

Sia Г una conica non degenere rappresentata da

∑a
i, j
ij xi x j = 0 ( aij = aji )

e sia P( y1 , y2 ,y3 ) un suo punto . Poiché è non degenere il punto P è semplice e così almeno una
delle tre relazioni (3 .1) è diversa da zero. Sia Z ( z1 , z2 , z3 ) un punto del piano distinto da P e
sia r la retta PZ . Come già visto i punti comuni alla retta PZ , rappresentata parametricamente da
101

( x1 , x2 ,x3 ) = ( λ y1 + µ z1, λ y2 + µ z2 , λ y3 + µ z3 )

si trovano attraverso le soluzioni non nulle dell’equazione

(4.1) a λ2 + 2 b λ µ + c µ2 =0

dove è :

a = ∑a
i, j
ij yi y j , b= ∑a
i, j
ij yi z j , c = ∑a
i, j
ij zi z j

Essendo a = 0 in quanto P ∈ Г , l’equazione (4.1) diventa :

( 4 .2) µ ( 2 b λ + c µ) =0

Tale equazione fornisce la soluzione (1 , 0) in accordo col fatto che P è comune ad r e Г . La


soluzione (1 , 0) sarà soluzione doppia della (4.2 ) e cioè la retta r interseca Г solo nel punto P se
e solo se risulta

b= ∑ai, j
ij yi z j =0

Abbiamo così provato che i punti Z del piano per cui la retta PZ incontri Г nel solo punto P sono
tutti e soli quelli per cui risulti :

(a11 y1 + a12 y2 + a13 y3 ) z1 +

(a21 y1 + a22 y2 + a23 y3 ) z2 +

(a31 y1 + a32 y2 + a33 y3 ) z3 =0

cioè sono tutti e soli i punti del piano le cui coordinate sono soluzione dell’equazione seguente

(4.3)

(a11 y1 + a12 y2 + a13 y3 ) x1 +(a21 y1 + a22 y2 + a23 y3 ) x2 + (a31 y1 + a32 y2 + a33 y3 ) x3 = 0

Tale equazione, che non è identica perchè P è semplice , rappresenta quindi l’unica retta per P che
interseca la conica Г nel solo punto P . Tale retta è chiamata retta tangente nel punto P.
102

5. Coniche reali non degeneri.

In questo numero tratteremo le coniche reali non degeneri cercando una loro classificazione.
Sia Г una conica reale non degenere rappresentata in un riferimento reale assegnato dall’equazione
a coefficienti reali seguente :

Г : ∑a
i, j
ij xi x j = 0 ( aij = aji )

Supporremo inoltre che essa sia dotata di punti reali.

(nota bene : la conica x2 + 2y2 + 3t2 = 0 pur essendo reale non ha punti reali .
Al contrario se essa ha un punto reale ogni retta reale per tale punto e che sia secante
intersecherà la conica in un altro punto reale e così la conica ha infiniti punti reali)

Poiché la conica Г è non degenere essa non contiene rette e così ogni retta del piano la
interseca in due punti distinti o coincidenti. Se la retta è reale allora i due punti di intersezione
sono entrambi reali o immaginari e coniugati.
In particolare ciò accade per i suoi punti impropri che sono i punti che la conica ha in comune
con la retta impropria che è una retta reale .

La conica Г è detta ellisse se possiede due punti impropri immaginari e coniugati.

La conica Г è detta iperbole se possiede due punti impropri reali e distinti.

La conica Г è detta parabola se possiede un sol punto improprio ( reale ).

Per stabilire se una conica è una ellisse , una iperbole o una parabola occorre quindi determinare
i suoi punti impropri e quindi occorre studiare le soluzioni non nulle del sistema S formato
dall’equazione della conica e da quella della retta impropria :

⎧ ∑ a ij x i x j = 0

S : ⎨ i, j
⎪⎩ x 3 = 0
103

Il sistema S è equivalernte al sistema seguente :

⎧ a x 2 + 2a 12 x 1 x 2 + a 22 x 22 = 0
S : ⎨ 11 1
⎩ x3 = 0

Le soluzioni non nulle di tale sistema saranno reali o immaginarie a seconda che il discriminante

2
∆ = 4 ( a 12 − a 11a 22 )

dell’equazione a11x12 + 2a12 x1x 2 + a 22 x 22 = 0 sia maggiore o eguale a zero o minore di zero.
Tenendo conto che nella matrice A della conica è :

a 11a 22 − a 2
12 = A 33

Si ha ∆ = - 4 A 33

Ne segue che risulta :

Г è una ellisse se è ∆ <0 ⇔ A 33 > 0


Г è una parabola se è ∆ =0 ⇔ A 33 = 0
Г è una iperbole se è ∆ > 0 ⇔ A 33 < 0

Ricordiamo che agiscono sul piano le affinità ( reali ) che sono le applicazioni del piano
in sé descrivibili con equazioni del tipo

⎧ x 1' = m11 x 1 + m12 2 x 2 + m13 x 3


⎪⎪ '
⎨ x 2 = m 21 x 1 + m 22 2 x 2 + m 23 x 3
⎪ '
⎪⎩ x 3 = x 3

⎛ m11 m12 ⎞
con mij numeri reali e det ⎜⎜ ⎟⎟ ≠ 0
⎝ m 21 m 22 ⎠
104

Tali isomorfismi del piano trasformano punti propri in punti propri , punti impropri in punti
impropri , punti reali in punti reali e punti immaginari in punti immaginari .
Per una conica avere due punti impropri , immaginari e coniugati , reali e coincidenti o reali
e distinti è quindi una proprietà invariante rispetto al gruppo delle affinità ed è quindi una
proprietà affine.
Per tale ragione la suddivisione delle coniche reali non degeneri in ellissi , parabole o
iperboli è chiamata la classificazione affine delle coniche reali non degeneri.

6. Polarità definita da una conica non degenere.


Sia Г una conica non degenere rappresentata in un riferimento reale assegnato dall’equazione
seguente :

Г : ∑a
i, j
ij xi x j = 0 ( aij = aji )

Poiché la conica è non degenere la sua matrice A(aij ) è non degenere e quindi è det A ≠ 0.

Sia P( y1 , y2, y3 ) un punto del piano. L’ equazione

(a11 y1 + a12 y2 + a13 y3 ) x1 +(a21 y1 + a22 y2 + a23 y3 ) x2 + (a31 y1 + a32 y2 + a33 y3 ) x3 = 0

( costruita utilizzando le coordinate ( y1 , y2, y3 ) di P ) è una equazione non identica


( altrimenti P sarebbe doppio e la conica sarebbe degenere) e quindi rappresenta una retta del
piano . Tale retta è chiamata la polare del punto P e sarà denotata col simbolo pP .
Associando al punto P la retta pP si realizza una applicazione p tra i punti del piano e le
rette del piano . Tale applicazione
p : P → pP
è chiamata polarità indotta dalla conica non degenere Г . Il punto P è chiamato il polo della
retta pP .
Le proposizioni che seguono illustrano alcune importanti proprietà della polarità p indotta
dalla conica Г .

Proposizione 6.1 La polarità è un’applicazione biettiva.


105

Dimostrazione. Sia r una retta del piano rappresentata da :

(6.1) r: ax + by + ct = 0

Un punto P ( y1 , y2, y3 ) del piano ha per polare la retta r se risulta pP = r cioè se


l’equazione

(a11 y1 + a12 y2 + a13 y3 ) x1 +(a21 y1 + a22 y2 + a23 y3 ) x2 + (a31 y1 + a32 y2 + a33 y3 ) x3 = 0

è l’equazione della retta r . Si ha quindi che P ( y1 , y2, y3 ) è polo di r se e solo se risulta :

⎧ a 11 y1 + a 12 y 2 + a 13 y 3 = a

(**) ⎨ a 21 y1 + a 22 y 2 + a 23 y 3 = b
⎪ a y +a y + a y =c
⎩ 31 1 32 2 33 3

Tale sistema inteso nelle incognite ( y1 , y2, y3 ) ha una sola soluzione ( z1 , z2, z3 ) in quanto,
essendo la conica non degenere, è det A ≠ 0. Sostituendo alla terna ( a, b , c ) la terna
proporzionale ( ρ a, ρ b , ρ c ) con ρ ≠ 0 si otterrà in corrispondenza la soluzione
( ρ z1 , ρ z2, ρ z3 ). Pertanto in corrispondenza a tutte le terne ( ρ z1 , ρ z2, ρ z3 ) soluzioni di (**)
si ha un solo punto P del piano avente per polare la retta r . La corrispondenza p è quindi
biettiva come si voleva provare.

Proposizione 6.2. Un punto P appartiene alla sua polare se e solo se esso appartiene alla
conica . In tal caso la sua polare coincide con la retta tangente in P .
Dimostrazione . Se P(y1 , y2, y3 ) è un punto della conica allora la sua polare pP
che è rappresentata da :

(a11 y1 + a12 y2 + a13 y3 ) x1 +(a21 y1 + a22 y2 + a23 y3 ) x2 + (a31 y1 + a32 y2 + a33 y3 ) x3 = 0

coincide con la retta tangente nel punto P (cfr. (4.3) ) . In tal caso quindi P appartiene alla sua
polare in quanto è
(a11 y1 + a12 y2 + a13 y3 ) y1 +(a21 y1 + a22 y2 + a23 y3 ) y2 + (a31 y1 + a32 y2 + a33 y3 ) y3 = 0
essendo P un punto della conica .
Viceversa se P(y1 , y2, y3 ) appartiene alla sua polare
106

(a11 y1 + a12 y2 + a13 y3 ) x1 +(a21 y1 + a22 y2 + a23 y3 ) x2 + (a31 y1 + a32 y2 + a33 y3 ) x3 =0


allora è
(a11 y1 + a12 y2 + a13 y3 ) y1 +(a21 y1 + a22 y2 + a23 y3 ) y2 + (a31 y1 + a32 y2 + a33 y3 ) y3 = 0
e questa prova che P è un punto della conica.

Abbiamo così provato che :


(6.3) P∈ Г ⇔ P∈ pP

Una importante proprietà della polarità p è espressa dal seguente :

Teorema di reciprocità. Se P(y1 , y2, y3 ) e Q (z1 , z2, z3 ) sono due punti distinti del
piano, . si ha
(6.4) Q ∈ pP ⇔ P ∈ pQ
Dimostrazione.
La polare di P è :
(a11 y1 + a12 y2 + a13 y3 ) x1 +(a21 y1 + a22 y2 + a23 y3 ) x2 + (a31 y1 + a32 y2 + a33 y3 ) x3 =0

che può scriversi sinteticamente , usando le notazioni introdotte al numero 1 , così :

f(y / x) =0

La polare di Q è :
(a11 z1 + a12 z2 + a13 z3 ) x1 +(a21 z1 + a22 z2 + a23 z3 ) x2 + (a31 z1 + a32 z2 + a33 z3 ) x3 =0

che può scriversi sinteticamente , usando le notazioni introdotte al numero 1 , così :

f(z / x) =0

Abbiamo, sempre al numero 1 , già osservato che poiché la matrice A della conica è simmetrica si
ha per ogni coppia di terne (y1 , y2, y3 ) e (z1 , z2, z3 )

(6.5) f(y / z) = f(z / y)

Dalla (6.5) segue quindi


107

f(y / z) =0 ⇔ f(z / y)=0

e questa prova l’asserto.

Siamo ora in grado di descrivere per ogni retta del piano quale sia il suo polo.

Sia r una retta del piano . Distinguiamo i due casi possibili :

a) r è tangente alla conica .


b) r è secante la conica .

Caso a) . Se la retta r è tangente alla conica nel punto P allora la polare di P è r e quindi P è il
polo di r . Nel caso in esame quindi il polo di r è il punto di contatto di r con la conica .

Caso b) . Se la retta r è secante la conica siano M e N i punti di intersezione di r con la


conica .

Sia m la retta tangente a Г nel punto M e sia n la retta tangente a Г nel punto N.
108

Sia P il punto comune alle rette distinte m ed n . Per ciò che precede è :

m = pM ed n = pN
Ora è P = m ∩ n = pM ∩ pN
e quindi P appartiene alla polare di M ed alla polare di N .
Per il teorema di reciprocità M ed N appartengono alla polare di P . Quindi la polare di P è la
retta r = MN e così P è il polo di r .

Per la biettività della polarità abbiamo così provato la seguente proposizione :

Proposizione 6.3. La polare di un punto P è la tangente in P se P è un punto della conica .


Se P non appartiene alla conica la sua polare è la retta che unisce i due punti di contatto delle
due rette tangenti che si possono condurre da P alla conica.

Dal teorema di reciprocità segue facilmente la seguente:

Proposizione 6.4. Quando un punto P descrive una retta m la sua polare descrive un fascio
di rette con centro il polo M della retta m .

7. Centro, diametri , asintoti , assi. Le equazioni canoniche.

Sia Г una conica non degenere reale e con punti reali rappresentata, nel riferimento reale
scelto, dall’equazione

a11 x 12 + a22 x 22 + a33 x 32 + 2 a12 x1 x2 + 2 a13 x1 x3 + 2 a23 x2 x3 = 0

Si chiama centro il polo della retta impropria.


Se la conica è una iperbole o una ellisse la retta impropria è secante e quindi non contiene il suo
polo. Pertanto per l’iperbole e per l’ellisse il centro è un punto proprio.
Se la conica è una parabola la retta impropria è tangente e quindi il suo polo è il punto di
tangenza . Pertanto per la parabola il centro è un punto improprio e coincide col suo unico
punto improprio. Indichiamo con C il centro della conica Г .
Per determinare le coordinate del centro di una iperbole o di una ellisse si può far uso del
teorema di reciprocità.
109

Poiché la retta impropria è per definizione la polare di C allora ogni punto improprio ha la polare
che passa per C.
Due punti impropri “ facili” sono (1 0 0 ) e (0 1 0 ) e le loro polari sono le rette distinte

a11 x1 + a12 x2 + a13 x3 = 0

a21 x1 + a22 x2 + a23x = 0

le quali , come detto , passano per il centro . Pertanto le coordinate del centro si ottengono
attraverso le soluzioni del sistema

⎧a 11 x 1 + a 12 x 2 + a 13 x 3 = 0

⎩a 21 x 1 + a 22 x 2 + a 23 x 3 = 0

Tale sistema è omogeneo e di rango due e quindi le sue soluzioni si ottengono attraverso i
minori d’ordine due e presi a segno alterno della matrice dei coefficienti

⎛ a 11 a 12 a 13 ⎞
⎜⎜ ⎟⎟
a a a
⎝ 21 22 23 ⎠

Utilizzando quindi le prime due righe della matrice A della conica si possono determinare le
coordinate del centro.

Diametri.
Si chiama diametro della conica la retta d polare di un punto improprio δ non
appartenente alla conica.
Quando il punto improprio appartiene alla conica la polare di tale punto ( la tangente in tale
punto ) è chiamato asintoto.

La retta impropria è la polare del centro e quindi , per reciprocità , i diametri e gli asintoti
essendo polari di punti impropri passano tutti per il centro.

Se la conica è una iperbole o una ellisse allora i diametri formano un fascio proprio essendo per
tali coniche il centro un punto proprio. Se la conica è una parabola allora i diametri formano un
fascio improprio essendo per tali coniche il centro un punto improprio.

Nel caso della parabola quindi i diametri sono tra loro paralleli.

Sia r una retta reale e sia δ il suo punto improprio . Supposto che tale punto non
110

appartenga alla conica possiamo considerare il diametro d ad esso corrispondente . Poiché δ


non appartiene alla conica la retta d non contiene δ e quindi la retta d non è parallela ad r .
Se d è ortogonale ad r allora d è detto asse .
Gli assi sono quindi particolari diametri .

Come si trovano gli assi ? Vediamo.

Se la conica Г è una parabola allora i diametri hanno una direzione fissa perché passano
tutti per il centro che coincide con l’unico punto improprio della parabola Г.
Pertanto se il punto improprio di Г ha coordinate ( l , m , 0 ) l’asse della parabola è la
retta d polare del punto improprio ( -m , l , 0 ). Tale asse interseca la parabola in un punto
proprio , detto vertice della parabola e nel suo punto improprio.
Disponendo il riferimento in modo che l’asse x coincida con la retta d e l’origine nel
vertice della parabola l’equazione della parabola

a11x 2 + a22 y 2 + a33 t2 + 2 a12 xy + 2 a13 xt + 2 a23 yt = 0.

diviene più semplice. Vediamo.

La polare del punto (0, 1 , 0) è la retta

a21 x + a22 y + a23 t = 0


111

e tale retta, per la scelta fatta sul riferimento , è la retta y = 0 . Pertanto è :

a12 = a23 = 0

Poiché l’origine (0 0 1) è un punto della parabola è anche a33 = 0.

La conica Г ha allora la seguente matrice

⎛ a 11 0 a 13 ⎞
⎜ ⎟
A = ⎜ 0 a 22 0 ⎟
⎜a 0 0 ⎟
⎝ 31 ⎠

Essendo Г una parabola è A33 = a11 a22 = 0 e detA ≠ 0 e quindi è a11 = 0 .

L’equazione di Г nel riferimento scelto è quindi del tipo

a22 y 2 + 2 a13 xt = 0

I punti propri della parabola sono quindi rappresentati dall’equazione :

a22 y 2 + 2 a13 x = 0

che è chiamata l’equazione canonica della parabola Г .

Supponiamo quindi che la conica Г sia una iperbole o una ellisse.


Consideriamo un qualsiasi punto improprio e siano ( λ , µ , 0 ) le sue coordinate e sia r una
retta che passa per esso.
La polare di tale punto improprio è la retta d rappresentata da:

d : (a11 λ + a12 µ ) x1 + (a21 λ + a22 µ ) x2 + (a31 λ + a32 µ ) x3 =0

I numeri direttori di tale retta sono .

( λ' , µ' ) = ( - (a21 λ + a22 µ ) , (a11 λ + a12 µ ) )

Pertanto le rette d ed r sono ortogonali se risulta λ λ ’ + µ µ ’ = 0 cioè :

( 7 . 1) - λ (a21 λ + a22 µ ) + µ (a11 λ + a12 µ ) = 0


112

La (7.1) sviluppata :

(7 .2 ) - a21 λ 2 + (a11 - a22 ) λ µ + a12 µ 2 = 0

è un’equazione omogenea di secondo grado e le sue soluzioni non nulle forniscono le “direzioni”
( λ , µ , 0 ) le cui polari sono gli assi della conica.
Ora il discriminante dell’equazione (7.2) è :

∆ = (a11 - a22 ) 2 + 4 a12 2

Se a11 = a22 = a12 = 0 la conica è una circonferenza e la (7.2) è identicamente nulla . Nel caso
della circonferenza ogni diametro è quindi un asse.
Se la conica non è una circonferenza allora è ∆ > 0 e quindi la (7.2) fornisce due soluzioni
reali e distinte .
Ci sono quindi due rette reali d e d’ che sono assi della conica se Г è una iperbole o una
ellisse. Gli assi d e d’ sono inoltre , per il teorema di reciprocità, ortogonali tra loro.
Disponendo il riferimento in modo che l’asse x sia la retta d e l’asse y sia la retta d’
l’equazione della conica diventa più semplice . Infatti sia

a11x 2 + a22 y 2 + a33 t2 + 2 a12 xy + 2 a13 xt + 2 a23 yt = 0.

l’equazione di Г .

La polare di ( 1, 0, 0 ) è la retta

a11 x + a12 y + a13 t = 0

e tale retta per le scelte fatte è la retta x = 0 . Pertanto è

a12 = a13 = 0

La polare di ( 0, 1, 0 ) è la retta

a21 x + a22 y + a23 t = 0

e tale retta per le scelte fatte è la retta y = 0 . Pertanto è :

a12 = a23 = 0
113

Con la scelta fatta per il riferimento l’ equazione diventa :

a11x 2 + a22 y 2 + a33 t2 =0.

e questa viene chiamata l’equazione canonica della conica Г .

Essendo la conica non degenere è det A = a11a22 a33 ≠ 0 e quindi è :

a11 ≠ 0 , a22 ≠ 0 , a33 ≠ 0

Dei tre numeri reali a11, a22 , a33 valutiamo quali sono positivi e quali negativi .

Avendo supposto che la conica è dotata di punti reali le possibilità per i segni dei numeri reali

a11, a22 , a33 sono riassunti nella seguente tabella

a11 a22 a33 Equazione di Г in coordinate non omogenee

+ + - b2x 2 + a2 y 2 = 1 (ellisse) o (circonferenza se a= b)

+ - - b2x 2 - a2 y 2 = 1 (iperbole)

- + - a2y 2 - b2 x 2 = 1 (iperbole)

Attraverso le equazioni canoniche abbiamo così riconosciuto che la parte reale e propria di una
conica reale non degenere e che sia dotata di punti reali è :

una “vera” circonferenza , una “vera” ellisse , una “vera” iperbole

una “vera” parabola .

nel senso descritto nel capitolo II .

L’aver chiamato ellisse , parabola o iperbole una conica reale non degenere e con punti reali è
quindi coerente con le nostre attese.
114

Capitolo V

Lo spazio proiettivo complesso di dimensione tre.


115

1. Lo spazio affine reale e complesso.

In questo numero S rappresenterà lo spazio reale tridimensionale . La famiglia delle rette di


S sarà rappresentata col simbolo L mentre col simbolo P rappresenteremo la famiglia dei piani
di S.
Due rette l ed l ’ di S si dicono parallele se coincidono oppure, nel caso siano distinte,
esse giacciono in uno stesso piano ed hanno intersezione vuota.
Due piani α e α’ si dicono paralleli se coincidono oppure , nel caso siano distinti , se
hanno intersezione vuota.
Una retta l ed un piano α sono paralleli se la retta è contenuta nel piano oppure , nel caso
non sia contenuta , essa ha intersezione vuota col piano.
Tre punti distinti si dicono allineati se essi appartengono ad una stessa retta, non allineati in
caso contrario.
La terna (S , L , P ) è chiamata spazio affine reale tridimensionale e per essa sono verificate
le seguenti proprietà :

1. Due punti distinti appartengono ad una unica retta.


2. Tre punti distinti e non allineati appartengono ad un unico piano.
3. Due piani distinti hanno intersezione vuota o si intersecano in una retta.
4. Una retta l non contenuta nel piano α o è parallela ad α oppure interseca α in un
unico punto.
5. Data una retta l ed un punto p non appartenente ad l esiste una sola retta l ’ per p
parallela ad l.
6. Dato un piano α ed un punto p non appartenente ad α esiste un sol piano α’ per p
parallelo ad α .

Le proprietà sopra elencate sono equivalenti alle seguenti :

1. Due punti distinti appartengono ad una unica retta.


2’. Una retta ed un punto che non si appartengano sono contenuti in un unico piano.
3. Due piani distinti hanno intersezione vuota o si intersecano in una retta.
4’. Una retta l che unisce due punti di un piano è tutta contenuta nel piano.
116

5. Data una retta l ed un punto p non appartenente ad l esiste una sola retta l ’ per p
parallela ad l.
6. Dato un piano α ed un punto p non appartenente ad α esiste un sol piano α’ per p
parallelo ad α .

Le proprietà sopra elencate mostrano che ogni piano dello spazio rispetto alle rette in esso
contenute è un piano affine.

Abbiamo già provato che quando nello spazio (S , L , P ) si introduca un riferimento reale R
e monometrico allora i suoi punti , le sue rette ed i suoi piani possono essere rappresentati al
seguente modo.
Ad ogni punto p si può associare una terna ordinata ( x, y, z) di numeri reali che si chiama
la terna delle coordinate di p nel riferimento R e tale corrispondenza , detta coordinazione dello
spazio , è biettiva .
Ogni piano si rappresenta con un’equazione
ax + by + cz + d = 0 con ( a , b , c) ≠ (0 , 0, 0 )
di primo grado e non identica in tre variabili.

Ogni retta si rappresenta o in modo parametrico con relazioni del tipo

⎧ x = x A + ρ(xB −xA )

l : ⎨ y = y A + ρ(yB − y A )
⎪ z = z + ρ(z −z )
⎩ A B A

(dove il parametro ρ varia nel campo reale)

o con un sistema del tipo :


⎧ ax + by + cz + d = 0
l : ⎨
⎩ a' x + b' y + c' z + d' = 0

a seconda se si pensi l come la retta che congiunge i punti distinti A( xA ,yA , z A) e


B ( xB ,yB , z B) oppure si pensi la retta l come la retta comune ai due piani α e α’ distinti tra
loro e rappresentati rispettivamente da :

α : ax + by + cz + d = 0 e α’: a’x + b’y + c’z + d’ = 0 .


117

Attraverso tali rappresentazioni abbiamo visto che è facile riconoscere se due rette sono tra
loro parallele , se due piani sono tra loro paralleli , se una retta ed un piano sono tra loro paralleli.
Così come il piano affine reale è stato da noi arricchito di nuovi punti , i punti immaginari ,
lo stesso procedimento può essere eseguito nello spazio (S , L , P ) .
Senza ripetere le motivazioni che portano alla definizione di punto immaginario (sarebbero
le stesse esposte nel caso del piano) puntiamo direttamente alla sua introduzione.
Anche nello spazio, quando si siano scelti due riferimenti reali R ed R’ , ci sono delle
formule che consentono di conoscere le coordinate di un punto p nel riferimento R’ note che siano
le coordinate dello stesso punto nel riferimento R. Tali formule ,dette di passaggio da un
riferimento all’altro, sono di questo tipo :

⎧x' = a 11 x + a 12 y + a 13 z + c 1

(*) ⎨y' = a 21 x + a 22 y + a 23 z + c 2
⎪z' = a x + a y + a z + c
⎩ 31 32 33 3

⎛ a 11 a 12 a 13 ⎞
⎜ ⎟
dove i numeri aij e ci sono reali ed inoltre è : det ⎜ a 21 a 22 a 23 ⎟≠0
⎜a a a ⎟
⎝ 31 32 33 ⎠

Consideriamo ora le coppie del tipo ( ( a , b , c) ; R ) dove la prima coordinata ( a , b , c) è


una terna ordinata di numeri complessi non tutti e tre reali e la seconda coordinata R è un
riferimento reale dello spazio.
Due siffatte coppie ( ( a , b , c) ; R ) e ( ( a’ , b’ , c’) ; R’ ) le diremo equivalenti se
sostituendo nelle formule (*) di passaggio da R ad R’ al posto di x , y , z i numeri a, b , c si
ottengono a primo membro i numeri a’ , b’ , c’ .
Tale relazione , come è facile controllare, è d’equivalenza ed ogni classe d’equivalenza è
chiamata punto immaginario.
Se p* = [( ( a , b , c) ; R ) ] è un punto immaginario i numeri complessi e non tutti reali
(a , b , c) vengono chiamati le coordinate di p* nel riferimento R .
Indichiamo con I l’insieme di tutti i punti immaginari e con S* = S ∪ I lo spazio
ottenuto aggiungendo ai punti reali i punti immaginari.
118

Quando si fissi un riferimento R reale dello spazio ogni punto p di S* ha le sue coordinate
(x, y , z) .
Tali coordinate sono tre numeri reali quando il punto p è reale e sono tre numeri complessi e
non tutti e tre reali quando il punto p è immaginario.
Utilizzando il coniugio ( c : x+iy → x-iy ) del campo complesso si può nello spazio S*
introdurre una biezione
_
c : p ∈ S* → p ∈ S*
che chiameremo egualmente coniugio la quale fa corrispondere al punto p di coordinate (x, y, z)
_
il punto p le cui coordinate sono i numeri complessi e coniugati dei numeri x , y, z..
_
Il punto p è chiamato il punto complesso e coniugato del punto p .
Evidentemente un punto è reale se e solo se coincide col suo complesso coniugato.

Se p non è un punto reale esso è distinto dal suo complesso coniugato e la retta che
_
congiunge p e p ha numeri direttori reali come è facile controllare .
Nello spazio S* si possono stabilire le stesse formule già provate per lo spazio reale. Noi
non faremo però la dimostrazione di queste formule. Un primo esempio è il seguente.

Se A( xA ,yA , z A) , B ( xB ,yB , z B) , C( xC ,yC , zC) sono tre punti distinti e non


allineati di S* il piano α che li congiunge è costituito dai punti p le cui coordinate (x, y , z)
verificano la seguente relazione :

⎛x y z 1⎞
⎜ ⎟
⎜ xA yA zA1⎟
det ⎜ =0
⎜ xB y B z B 1 ⎟⎟
⎜x y C z C 1⎟⎠
⎝ C

Sviluppando tale determinante lungo gli elementi della prima riga si riconosce che i punti
del piano α hanno coordinate (x, y , z) che sono tutte e sole le soluzioni di un’equazione di primo
grado non identica nelle variabili x , y, z del tipo
(**) ax + by + cz + d = 0
con a , b , c , d numeri complessi e con (a, b , c ) ≠ ( 0,0,0).
L’equazione (**) si dice che rappresenta il piano α . E’ evidente che un’equazione
119

proporzionale ad essa secondo un fattore complesso non nullo , ha le stesse soluzioni e quindi
rappresenta lo stesso piano.
Quando i coefficienti a , b , c , d sono reali o proporzionali a numeri reali il piano è detto
reale .In tal caso i punti reali di tale piano costituiscono allora un piano reale dello spazio S.
Tra i piani dello spazio S* ci sono quindi i vecchi piani di S arricchiti ciascuno di infiniti
nuovi punti immaginari.
Per ogni piano α rappresentato da :
α : ax + by + cz + d = 0
_
si può considerare il piano α complesso e coniugato ottenuto considerando i punti complessi e
_
coniugati dei punti di α . Il piano α è rappresentato da :
_ _ _ _ _
α : a x + by + c z + d = 0
cioè dall’equazione complessa e coniugata dell’equazione di α .

E’ facile controllare che sussiste la seguente equivalenza :

Proposizione 1.1 Un piano è reale se e solo se coincide col suo complesso coniugato.

Ci sono però piani nello spazio S* che non sono reali e quindi non riconoscibili come un
ampliamento di quelli di S . Tali piani ovviamente non possono possedere tre punti reali e non
allineati. Consideriamo quindi un piano α non reale .
E’ evidente che un eventuale punto reale di tale piano appartiene anche al piano complesso
e coniugato. Quindi gli eventuali punti reali del piano α vanno ricercati nell’intersezione di α con
_ _
α . Se α è parallelo ad α allora esso non ha punti reali
Ad esempio il piano rappresentato da
x–i=0
_
è parallelo ad α rappresentato da x + i = 0 ed è privo di punti reali in quanto i suoi punti sono
del tipo ( i , h , k ).
_
Se α possiede un punto po reale allora α ed α avendo in comune po hanno in comune
_
una retta l . Sia ora A un punto della retta l distinto da po e sia A il suo complesso coniugato
_
che apparterrà anch’esso alla retta l . Se A = A allora il punto A è reale e quindi la retta l
_
possedendo due punti reali è reale . Se A ≠ A allora i numeri direttori di l sono reali e quindi la
120

retta l è pur sempre reale. Ad esempio il piano rappresentato da


x + iy = 0
ha come unici punti reali i punti allineati (0 , 0 , k) con k reale .

Concludendo, abbiamo mostrato che nello spazio S* ci sono tre tipi di piani :

a) Piani reali che sono i piani di S ampliati ciascuno con i punti immaginari.
b) Piani totalmente immaginari .
c) Piani immaginari dotati di una retta reale.

Vediamo ora le rette di S*.


I punti della retta l* che unisce i due punti distinti A( xA ,yA , z A) e B ( xB ,yB , z B) di
S* hanno coordinate ( x, y , z ) espresse da
⎧ x = x A + ρ(x B −x A )

l* : ⎨ y = y A + ρ(y B − y A )
⎪ z = z + ρ(z −z )
⎩ A B A

(dove il parametro ρ varia ora nel campo complesso).

Queste formule, che rappresentano parametricamente la retta l*, mostrano che quando i
punti A e B sono reali , la sua parte reale , ottenuta in corrispondenza ai valori reali del parametro ρ
coincide con la retta reale di S congiungente A e B.
In tal modo si riconosce che alcune rette dello spazio complesso S* sono “un allungamento”
di quelle reali le quali si sono anch’esse arricchite di infiniti nuovi punti immaginari.
Vedremo però ora che nello spazio S* ci sono rette “nuove” che non sono di questo tipo.
Tali rette evidentemente hanno al più un punto reale.
Vediamo.
La retta l rappresentata da

⎧x + iy = 0
l : ⎨
⎩z = 0
ha un solo punto reale coincidente con (0 , 0, 0 ) .

La retta l rappresentata da
⎧x = i
l : ⎨
⎩z = 0
121

non ha punti reali.

Concludendo nello spazio S* ci sono tre tipi di rette :

a) Rette reali cioè quelle che posseggono due punti reali e quindi infiniti punti
reali.
b) Rette complesse prive di punti reali.
c) Rette complesse con un unico punto reale.

Denotiamo con L* l’insieme delle rette di S* e con P* l’insieme dei piani di S*.
La terna (S* , L* , P* ) è chiamata spazio affine complesso tridimensionale e per esso continuano a
valere le proprietà geometriche 1,2,3,4,5,6 già espresse per lo spazio affine reale (S , L , P ).

2. Lo spazio proiettivo reale e complesso di dimensione tre.

In questo numero mostreremo che lo spazio affine reale (S , L , P ) può essere ampliato con
l’aggiunta di nuovi punti , detti punti impropri. Aggregando tali nuovi punti in modo opportuno
alle rette di S ed ai piani di S ed agiungendo alcune nuove rette ed un nuovo piano si ottiene una
nuova struttura geometrica (S^ , L^ , P^ ) per la quale proveremo che valgono le seguenti
proprietà :

I. Due punti distinti appartengono ad una unica retta.


II. Due piani distinti si intersecano in una retta.
III. Una retta ed un punto che non si appartengano sono contenuti in unico piano.
IV. Una retta incontra un piano che non la contenga in un unico punto.

Lo spazio geometrico (S^ , L^ , P^) sarà chiamato spazio proiettivo reale tridimensionale.
Vediamo come si effettua questa costruzione.

Diamo prima alcune definizioni.


Nello spazio affine reale (S , L , P ) tutte le rette passanti per un fissato punto p definiscono
una stella propria di rette di centro p.
Tutte le rette parallele ad una retta l fissata costituiscono ( per la proprietà 5) una partizione
dei punti di S e tale famiglia di rette viene detta stella impropria di rette.
122

Dato un piano α e scelto un suo punto p si possono considerare tutte le rette per p
contenute in α . Tale famiglia di rette è detta fascio di rette ci centro p.
Tutti i piani passanti per un fissato punto p definiscono una stella di piani di centro p.
Tutti i piani passanti per una fissata retta l definiscono un fascio proprio di piani di asse l.
Tutti i piani paralleli ad un fissato piano α costituisco, per la proprietà 6 , una partizione
dei punti di S e definiscono un fascio improprio di piani ..

Vediamo ora come si costruisce lo spazio proiettivo.

Sia r una retta dello spazio affine reale (S , L , P ) .


Indichiamo con Or un oggetto da noi scelto e che chiamiamo punto improprio ed
ampliamo la retta r aggiungendo ad essa questo nuovo punto . Ogni retta dello spazio ha quindi
un nuovo punto ed il criterio che seguiremo per tale attribuzione è il seguente :

Or = Os ⇔ r è parallela ad s

(esplicitamente : il punto Or aggiunto ad r coincide col punto Os aggiunto ad s se e solo se


r ed s sono rette tra loro parallele )
Pertanto con tale criterio una retta s parallela ad r sarà ampliata con lo stesso punto che
abbiamo aggiunto ad r ed in tal modo le due rette r ed s , prima tra loro parallele, risultano
ora incidenti nel punto Or che è ad esse comune .
Indichiamo con ∆ l’insieme di tutti i punti impropri Or al variare di r nello spazio . Che
cardinalità ha ∆ ? Vediamo .
Si consideri un punto p dello spazio e sia Sp la stella di rette di centro p . Per ogni retta r
di Sp indichiamo sempre con Or il suo punto improprio . E’ chiaro che i punti Or al variare
di r in Sp sono tutti distinti tra loro ed esauriscono come ora vedremo l’insieme ∆ .
Infatti sia t una retta dello spazio non passante per p . Se r è l’unica retta per p parallela a t
allora il punto Ot aggiunto alla retta t coincide con il punto Or aggiunto alla retta r.
Pertanto i punti impropri sono tanti quante le rette di Sp per p . Chiameremo ∆ piano
improprio.
Anche i piani , oltre alle rette , vengono ampliati al seguente modo. Sia α un piano e sia r una
retta del piano . Aggiungiamo ai punti del piano il punto improprio Or della retta r. Se p è un
punto di α ed Fp è il fascio di rette di centro p allora i punti impropri aggiunti al piano α sono
evidentemente tutti e soli i punti impropri Or al variare di r in Fp . Tali punti Or costituiscono
123

la retta impropria del piano affine α e tale retta sarà denotata col simbolo ∆α .E’ evidente
che due piani tra loro paralleli hanno la stessa retta impropria. Consideriamo ora il seguente
spazio geometrico (S^ , L^, P^ ) :

I punti di S^ : sono i punti di S ( punti propri ) e l’insieme di tutti i punti impropri .

Le rette di L^ : sono le rette di L ciascuna ampliata col suo punto improprio e le rette
improprie ∆α al variare di α in P .

I piani di P^ : sono il piano improprio ∆ ed i piani di P ciascuno ampliato con i suoi punti
impropri e la sua retta impropria.

E’ non difficile ora controllare ( e tale verifica viene volutamente lasciata al lettore ) che lo
spazio (S^ , L^, P^ ) ora definito ha le proprietà I , II , III , IV già annunciate .

E’ evidente, inoltre , sulla base della costruzione fatta, che ogni piano del nuovo spazio è un
piano proiettivo.

Noi sappiamo che quando nello spazio reale ( S , L, P ) si sceglie un riferimento reale, i
suoi punti , le sue rette , i suoi piani possono essere rappresentati algebricamente e ciò consente
di tradurre e risolvere, con l’aiuto del calcolo algebrico, i molti problemi geometrici che si
possono porre.

L’ ampliamento ora fatto non fa perdere questa opportunità, in quanto saremo ancora una
volta in grado, fissato un riferimento reale , di rappresentare algebricamente i punti , le rette ed
i piani di (S^ , L^, P^ ) .
Vediamo come.
Per fare ciò occorre introdurre il concetto di coordinate omogenee di un punto.
Sia P un punto proprio e supponiamo che nel riferimento reale R fissato abbia coordinate
(2 , 3 , 5) . Chiameremo coordinate omogenee di P nel riferimento R una quaterna ordinata
(x1 , x2 , x3, x4 ) di numeri reali con x4 ≠ 0 e tale che sia :

x1 x2 x3
(*) =2 =3 =5
x4 x4 x4
124

Ovviamente una quaterna (x1 , x2 , x3, x4 ) “ facile “ che verifica la proprietà (*) è la quaterna
( 2, 3 , 5, 1 ) ma anche ( 4 , 6 , 10 , 2 ) va bene e così ogni quaterna del tipo
(2 ρ , 3 ρ , 5 ρ , ρ ) con ρ ≠ 0 . Una qualsiasi di queste quaterne attraverso le formule (*)
restituisce la terna (2, 3, 5 ) e quindi individua il punto P .

Pertanto le coordinate omogenee di un punto proprio P di coordinate (xo , yo , zo) sono


quattro numeri (x1 , x2 , x3, x4 ) con x4 ≠ 0 e verificanti la seguente proprietà :

x1 x2 x3
(*) = xo , = yo , = zo
x4 x4 x4

La quaterna (x1 , x2 , x3, x4 ) avendo x4 ≠ 0 è non nulla e dovendo verificare le (*) è non
unica ma determinata a meno di un fattore di proporzionalità non nullo.

Se P è un punto improprio ed esso è il punto Or aggiunto alla retta r , chiameremo coordinate


omogenee di P una quaterna ordinata (x1 , x2 , x3, x4 ) con x4 = 0 e con la terna
(x1 , x2 , x3) coincidente con una terna (λ , µ , ν) di numeri direttori della retta r. Poiché i
numeri direttori della retta r sono non tutti nulli e definiti anch’essi a meno di un fattore di
proporzionalità non nullo , allora ancora una volta le coordinate omogenee del punto P sono una
quaterna non nulla e definita a meno di un fattore di proporzionalità non nullo.

Nell’insieme R4 – (o,o,o,o) delle quaterne ordinate e non nulle di numeri reali diciamo
equivalenti due quaterne (y1 , y2 , y3, y4 ) e (z1 , z2 , z3, z4 ) se e solo se sono tra loro proporzionali
secondo un fattore di proporzionalità non nullo. Tale relazione, che indichiamo con σ , è
manifestamente d’equivalenza e ripartisce quindi l’insieme R4 – (o,o,o,o) in classi d’equivalenza.
Per quanto precede, quando nello spazio proiettivo reale si fissa un riferimento reale, quando
si associ ad ogni punto di S^ la quaterna delle sue coordinate omogenee si costruisce una biezione
tra i punti di S^ e le classi [ (y1 , y2 , y3, y4 ) ] d’equivalenza dell’insieme quoziente R4 –
(o,o,o,o) / σ .
L’insieme quoziente R4 – (o,o,o,o) / σ viene anche indicato col simbolo P3(R) e viene
chiamato sostegno dello spazio proiettivo numerico reale di dimensione tre.
Le ragioni di tale denominazione saranno più chiare in seguito attraverso l’introduzione degli spazi
125

proiettivi numerici su un campo K e di dimensione n ( n intero positivo ) qualsiasi.


Abbiamo visto quindi come si rappresentano i punti di S^ quando si sia fissato un riferimento reale.
Vediamo ora come si rappresentano i suoi piani. Supporemo sempre che nello spazio sia stato
fissato un riferimento reale R .
Proveremo ora che ad ogni piano π di P^ si può associare un’equazione di primo grado non
identica ed omogenea in quattro variabili del tipo
(j) a x1 + b x2 + c x3 + d x4 = 0
che lo “rappresenta” nel riferimento R . In che senso lo rappresenta ? Precisiamo questo aspetto.

Intanto è evidente che se una quaterna (y1 , y2 , y3, y4 ) non nulla è soluzione dell’equazione
a x1 + b x2 + c x3 + d x4 = 0 anche la quaterna ρ (y1 , y2 , y3, y4 ) con ρ ≠ 0 è soluzione
dell’equazione e così ha significato affermare che un punto verifica con le sue coordinate omogenee
l’equazione a x1 + b x2 + c x3 + d x4 = 0 .
L’affermazione : l’equazione a x1 + b x2 + c x3 + d x4 = 0 rappresenta il piano π ha il
seguente doppio significato.

2.1 Un punto p di π fornisce con le sue coordinate omogenee una soluzione dell’equazione.
2.2 Ogni soluzione non nulla dell’equazione fornisce le coordinate omogenee di un punto p di π
.

E’ chiaro che i punti rappresentati dall’equazione sono quelli corrispondenti alle sue soluzioni non
nulle e quindi ogni equazione proporzionale ad essa ,secondo un fattore di proporzionalità non nullo
, avendo le stesse soluzioni , rappresenta lo stesso insieme di punti .
Pertanto quando diremo che l’equazione a x1 + b x2 + c x3 + d x4 = 0 rappresenta il piano π
sottointenderemo che ogni equazione ad essa proporzionale , secondo un fattore di proporzionalità
non nullo, rappresenta pur sempre lo stesso piano π .

Sia ora π un piano dello spazio proiettivo (S^ , L^ , P^) . Se π è il piano improprio allora esso è
rappresentato dall’equazione
x4 = 0
Se π non è il piano improprio allora esso è del tipo : π = α ∪ ∆α con α piano di S cui sono
stati aggiunti i suoi punti impropri. I punti impropri di π sono i punti impropri delle rette contenute
nel piano α . Sia ora
(§) ax+by+cz+d=0
126

l’equazione che rappresenta il piano α nel riferimento R .Vogliamo ora far vedere che la stessa
equazione che rappresenta in S il piano α quando la si renda omogenea rappresenta il piano α
ampliato coi suoi punti impropri cioè il piano π . Vogliamo quindi mostrare che l’equazione
omogenea nelle variabili x, y, z , t

(§§) . ax+by+cz+dt=0

rappresenta il piano π .Occorre controllare che siano soddisfatte le due condizioni 2.1 e 2.2.
Sia p un punto del piano π . Se p è un punto di α , cioè , proprio, esso ha coordinate
( xo, yo, zo ) che verificano l’equazione (§) e quindi le sue coordinate omogenee ( xo, yo, zo, 1 )
verificano l’equazione (§§).
Se p è improprio esso è il punto improprio di una retta r contenuta in α Sia (λ , µ , ν) una
terna di numeri direttori della retta r. Poiché r è parallela ad α si ha , come sappiamo ,

aλ+bµ+cν =0

da cui segue che le coordinate omogenee ( λ , µ , ν , 0 ) di p verificano l’equazione (§§).


La condizione 2.1 è quindi verificata. Proviamo la 2.2.
Sia quindi ( y1, y2, y3, y4 ) una soluzione non nulla dell’equazione (§§) e vediamo se tale
quaterna è la quaterna delle coordinate omogenee di un punto p di π . Se è y4 ≠ 0 possiamo
1
considerare la quaterna ( z1, z2, z3, 1 ) ottenuta moltiplicando la quaterna ( y1, y2, y3, y4 ) per .
y4
Poiché l’equazione (§§) è omogenea e ( y1, y2, y3, y4 ) è una sua soluzione allora anche la quaterna
( z1, z2, z3, 1 ) è una sua soluzione . Si ha quindi
a z1 + b z2 + c z3 + d = 0
e ciò mostra che il punto proprio p di coordinate ( z1, z2, z3 ) è un punto di α ed ( y1, y2, y3, y4 )
sono le sue coordinate omogenee.
Se è y4 = 0 poniamo, per rendere meglio l’idea , ( y1, y2, y3, 0 ) = ( λ , µ , ν , 0 ).
Poiché per ipotesi la quaterna ( y1, y2, y3, 0 ) = ( λ , µ , ν , 0 ) verifica l’equazione (§§) si
ha :
a λ + b µ + c ν = 0.

Questa eguaglianza mostra che una retta di numeri direttori ( λ , µ , ν ) risulta parallela al
piano α e che quindi la quaterna ( λ , µ , ν , 0 ) è la quaterna delle coordinate omogenee di punto
127

improprio di α .L’ asserto è così provato.


Avendo trovato la rappresentazione dei piani dello spazio proiettivo vediamo come si
rappresentano le sue rette .
Sia quindi l una retta dello spazio proiettivo e siano π e π’ due piani che si intersecano
nella retta l . Siano inoltre a x + b y + c z + d t = 0 ed a’x + b’y + c’z + d’t = 0. Ovviamente le
soluzioni non nulle del sistema
⎧a x + b y + c z + d t = 0
l : ⎨
⎩a' x + b' y + c' z + d' t = 0
forniscono le coordinate omogenee dei punti della retta l .
Ricordiamo che tale sistema è omogeneo e le sue soluzioni costituiscono un sottospazio di
dimensione due essendo le nostre due equazioni indipendenti.Per descrivere quindi le sue soluzioni
è sufficiente trovare due sue soluzioni non nulle ed indipendenti. Ma ciò è facile. Infatti siano p1 e
p2 due punti distinti della retta l e siano ( y1, y2, y3, y4 ) ed ( z1, z2, z3, z4 ) le loro coordinate
omogenee. Le due quaterne ( y1, y2, y3, y4 ) ed ( z1, z2, z3, z4 ) sono non proporzionali in quanto
rappresentative di due punti distinti e forniscono quindi due soluzioni indipendenti del sistema
⎧a x + b y + c z + d t = 0

⎩a' x + b' y + c' z + d' t = 0
Ogni altro punto p della retta l ha per coordinate omogenee una quaterna ( x1, x2, x3, x4 )
che è una soluzione non nulla del sistema . La quaterna ( x1, x2, x3, x4 ) sarà esprimibile come
combinazione lineare delle due quaterne indipendenti ( y1, y2, y3, y4 ) ed ( z1, z2, z3, z4 ) che
costituiscono una base dello spazio delle soluzioni del sistema .
Attraverso la conoscenza delle coordinate ( y1, y2, y3, y4 ) ed ( z1, z2, z3, z4 ) di due punti
della retta siamo stati in grado di ricostruire come sono le coordinate dei punti di l.. I punti di l
sono tutti e soli quelli le cui coordinate omogenee ( x1, x2, x3, x4 ) sono descritte dalle seguenti
formule :

(*) ( x1, x2, x3, x4 ) = λ ( y1, y2, y3, y4 ) + µ ( z1, z2, z3, z4 ) con ( λ , µ ) ≠ ( 0 , 0)

dove i parametri λ e µ variano nel campo reale. Le formule (*) possono essere scritte in modo
equivalente al seguente modo :
128

⎧x 1 = λ y1 + µ z1

⎪x 2 = λ y2 + µ z2 con ( λ , µ ) ≠ ( 0 , 0)
(**) ⎨
⎪x 3 = λ y3 + µ z3
⎪x 4 = λ y4 + µ z4

e vengono chiamate le equazioni parametriche della retta l .


E’ evidente che se scelgono due valori ( λo , µo) dei parametri non tutti e due nulli si ottengono in
corrispondenza, nelle formule (**), le coordinate di un punto della retta l . Tale punto non cambia
se al posto di ( λo , µo) si scegliesse la coppia ( ρ λo , ρ µo) con ρ ≠ 0 . Pertanto le formule
(**) vanno usate con questa unica attenzione.
Dalle rappresentazioni trovate seguono queste utili equivalenze :

Proposizione 2.1 I punti A( a1, a2, a3, a4 ) , B ( b1, b2, b3, b4 ) , C( c1, c2, c3, c4 ) dello
spazio proiettivo S^ sono allineati se e solo se le quaterne ( a1, a2, a3, a4 ) , ( b1, b2, b3, b4 ) ,
( c1, c2, c3, c4 ) delle loro coordinate sono linearmente dipendenti.

Siano ora A( a1, a2, a3, a4 ) , B ( b1, b2, b3, b4 ) , C( c1, c2, c3, c4 ) tre punti non allineati dello
spazio. Tali punti determinano un piano che ha un’equazione del tipo
ax + by + cz + dt = 0
la quale deve essere quindi soddisfatta dalle coordinate dei punti assegnati. Si hanno così le seguenti
relazioni :
a a1+ b a2 + c a3 + d a4 = 0
(k) a b1+ b b2 + c b3 + d b4 = 0
a c1+ b c2 + c c3 + d c4 = 0

Essendo i punti A , B , C non allineati la matrice delle loro coordinate

⎛a1 a2 a3 a4 ⎞
⎜ ⎟
L= ⎜ b1 b2 b3 b4 ⎟
⎜c c 4 ⎟⎠
⎝ 1 c2 c3

ha rango tre e quindi le relazioni (k) , intese come sistema nelle incognite a , b , c, d permette di
determinare i coefficienti del piano. Per quanto visto sui sistemi di equazioni lineari la quaterna
(a, b , c ,d ) dei coefficienti del piano cercato può ottenersi utilizzando i determinanti dei minori
129

d’ordine tre , presi a segni alterni , della matrice L .


Ciò detto è provato che l’equazione del piano cercato possa ottenersi direttamente attraverso
il calcolo del seguente determinante :

⎛x y z t ⎞
⎜ ⎟
⎜ a1 a2 a3 a4 ⎟
det ⎜ 4 ⎟ = 0

⎜ b1 b2 b3 b4 ⎟
⎜⎜ ⎟
⎝ c1 c2 c3 c 4 ⎟⎠

La costruzione fatta per passare dallo spazio affine reale allo spazio proiettivo reale può
essere ripetuta allo stesso modo passando così dallo spazio affine complesso allo spazio proiettivo
complesso. La differenza unica è che le coordinate omogenee di un punto saranno ora quattro
numeri complessi non tutti nulli e definiti al solito a meno di un fattore di proporzionalità non
nullo. Un piano si rappresenterà con un’equazione omogenea di primo grado non identica in
quattro variabili ed a coefficienti complessi e nelle formule che esprimono la rappresentazione
parametrica di una retta i parametri variano ovviamente nel campo complesso.

3. Sfera coni e cilindri dello spazio affine reale.

a) La sfera.
Fissiamo nello spazio affine reale un riferimento monometrico ed ortogonale R .
Siano Po ( xo , yo , zo) un punto dello spazio ed r un numero reale positivo.

r
Po

Si chiama superficie sferica di centro Po e raggio r l’insieme dei punti P dello spazio che hanno
distanza r da Po . Indichiamo con Ω tale insieme di punti e cerchiamo una sua rappresentazione
analitica . Sussistono le seguenti ovvie equivalenze :
130

P ( x , y, z ) ∈ Ω ⇔ d ( P , Po ) = r ⇔ ( x - xo ) 2
+ ( y- y o ) 2 + (z -z o ) 2 = r

⇔ ( x – xo) 2 + ( y– yo) 2 + ( z– zo) 2 = r2

Da queste segue quindi che appartengono alla superficie sferica tutti e soli i punti dello spazio le cui
coordinate verificano l’equazione :

(1) ( x – xo) 2 + ( y– yo) 2 + ( z– zo) 2 = r2

la quale può scriversi così :

(2) x2 + y2 + z2 + ax + by + cz + d = 0

avendo indicato con a , b , c , d le seguenti quantità :

a = -2 xo , b = -2 yo , c = -2 zo , d = xo 2 + yo 2 + zo 2 - r2

L’ equazione
x2 + y2 + z2 + ax + by + cz + d = 0

rappresenta quindi la superficie sferica Ω nel riferimento R fissato.


E’ evidente che un’equazione proporzionale ad essa secondo un fattore di proporzionalità non nullo
avendo le stesse soluzioni, rappresenta lo stesso insieme di punti.

L’equazione x2 + y2 + z2 + ax + by + cz + d = 0 che rappresenta Ω nel riferimento


scelto è quindi di secondo grado , manca dei termini misti xy , xz , yz ed ha eguali i
coefficienti di x2 e y2 e z2.

Non sempre però un’equazione di questo tipo rappresenta una superficie sferica. Vediamo perché.
Sia quindi assegnata l’equazione
x2 + y2 + z2 + ax + by + cz + d = 0
essa rappresenta una superficie sferica di centro Po ( xo , yo , zo ) e raggio r (positivo) se risulta :

(3) x2 + y2 + z2 + ax + by + cz + d = ( x – xo) 2 + ( y– yo) 2 + ( z– zo) 2 - r2


131

L’eguaglianza (3) sussiste se risulta :

a = -2 xo , b = -2 yo , c = -2 zo , d = xo 2 + yo 2 + zo 2 - r2

Si ha quindi

a b c
xo = - , yo = - , zo = -
2 2 2

2 2 2 2 a2 b2 c2
(4) r = xo + yo + zo – d = + + -d
4 4 4

Dalla (4) segue quindi che si troverà un numero r positivo , raggio della superficie sferica
cercata , se si ha :

a2 b2 c2
(5) + + -d > 0
4 4 4

Riassumendo :

L ’ equazione x2 + y2 + z2 + ax + by + cz + d = 0

che abbia a , b , c , d verificanti la proprietà (5) è l’equazione della superficie sferica con
a b c
centro nel punto Po = ( - , - , - ) e raggio r dato da :
2 2 2

2
a b2 c2
(6) r = + + -d .
4 4 4

Sia Ω una superficie sferica dello spazio con centro nel punto Po ( xo , yo , zo) e raggio r
positivo e sia
132

x2 + y2 + z2 + ax + by + cz + d = 0

l’equazione che rappresenta Ω in un riferimento monometrico ed ortogonale fissato .


Sia P ( x , y , z ) un punto della superficie Ω.
Tutte le rette per P che intersecano Ω nel solo punto P sono chiamate le rette tangenti ad Ω nel
punto P . Tali rette giacciono tutte in uno stesso piano πP, detto piano tangente ad Ω nel punto P.
Tale piano è noto che sia il piano per P ortogonale alla retta Po P.

I numeri direttori della retta Po P sono ( x - xo , y - yo , z - zo ) e quindi il piano tangente πP


ha equazione :

πP : ( x - xo ) ( x - x ) + ( y - yo ) ( y - y ) + ( z - zo ) ( z - z ) = 0.

Quando lo spazio reale venga ampliato con i punti immaginari anche la superficie Ω
rappresentata dall’equazione a coefficienti reali
x2 + y2 + z2 + ax + by + cz + d = 0
si arricchisce di ulteriori punti ( immaginari ) corrispondenti alle soluzioni complesse
dell’equazione che la rappresenta .
Quando allo spazio si aggiungano anche i punti impropri allora per rappresentare tutti i
punti di Ω propri ed impropri occorre che l’equazione x2 + y2 + z2 + ax + by + cz + d = 0 di
Ω sia resa omogenea.
Pertanto l’equazione
x2 + y2 + z2 + a x t + b y t + cz t + dt2 = 0

rappresenta tutta la superficie sferica inclusi i suoi punti impropri.


Ma quali sono i punti impropri di Ω ? Vediamo.

E’ chiaro che i punti impropri di Ω sono quelli che essa ha in comune con il piano
improprio dello spazio che si rappresenta con l’equazione t = 0 .
I punti impropri di Ω corrispondono quindi alle soluzioni non nulle del seguente sistema S
:
133

⎧ x 2 + y 2 + z 2 + axt + byt +czt + dt 2 = 0


S: ⎨
⎩t = 0
Le soluzioni cercate si ottengono quindi attraverso le soluzioni non nulle di :
⎧ x 2 + y2 + z2 = 0
S: ⎨
⎩t = 0

La curva Г del piano improprio rappresentata da


⎧ x 2 + y2 + z2 = 0
Г: ⎨
⎩t = 0
è una conica totalmente immaginaria e raccoglie tutti i punti ciclici delle circonferenze che i piani
dello spazio tagliano su Ω . Tale conica è chiamata l’ assoluto dello spazio e per essa passano
tutte le superfici sferiche dello spazio.

b) Il cono.
Si consideri nello spazio reale un piano π e sia Г una sua conica non degenere. Sia inoltre V
un punto non appartenente al piano π . L’ unione di tutte le rette VP al variare di P su Г è

chiamato cono quadrico di vertice V


e direttrice Г .

Vediamo come si rappresenta il cono che indicheremo con C di vertice V e direttrice Г . Per
rendere semplice l’esposizione supporremo che V abbia coordinate ( 0 , 0 , 1 ) e Г sia la
conica (ellisse) del piano z=0 di equazione
134

⎧2x 2 + y 2 - 1 = 0
Г :⎨
⎩ z=0

Sia P (α , β , γ ) un punto di Г .
Poiché P è un punto di Г si ha γ = 0 e 2 α2 + β2 - 1= 0
La retta VP è allora rappresentata parametricamente al seguente modo :
⎧x = ρ α

VP : ⎨y = ρ β
⎪z = 1 - ρ

da cui segue
x y
ρ = 1 – z e quindi α = e β =
1-z 1-z

Sostituendo tali valori di α e β in 2 α2 + β2- 1 = 0 si ha :

C: 2 x2 + y2 – (1-z) 2 = 0
o equivalentemente
C: 2 x2 + y2 - z2 + 2z – 1 = 0.

L’equazione
2 x2 + y2 - z2 + 2z – 1 = 0

rappresenta quindi il nostro cono nel riferimento assegnato.


L’equazione trovata mostra che anche il cono, al pari della superficie sferica , si rappresenta
con un’equazione di secondo grado in x , y , z.
Quando lo spazio reale venga ampliato con i punti immaginari anche il cono C
rappresentato dall’equazione a coefficienti reali

2 x2 + y2 - z2 + 2z – 1 = 0

si arricchisce di ulteriori punti ( immaginari ) corrispondenti alle soluzioni complesse


dell’equazione che la rappresenta .
Quando allo spazio si aggiungano anche i punti impropri allora per rappresentare tutti i punti di
C propri ed impropri occorre che l’equazione 2 x2 + y2 - z2 + 2z – 1 = 0
135

di C sia resa omogenea. Pertanto l’equazione


2 x2 + y2 - z2 + 2z t – t2 = 0
rappresenta tutti i punti del cono propri ed impropri. I punti impropri essendo quelli comuni a C ed
al piano improprio sono i punti della conica Σ del piano improprio rappresentata da.
⎧2 x 2 + y 2 - z 2 = 0
Σ : ⎨
⎩t = 0

Tale conica impropria Σ è non degenere e dotata di punti reali.

c) il cilindro.
Si consideri nello spazio reale un piano π e sia una sua conica non degenere. Sia inoltre l
una retta non parallela al piano π . Sia P un punto Г di e sia lP la retta per P parallela alla
retta l . L’ unione di tutte le rette lP al variare di P su Г è chiamato cilindro di direttrice Г e
generatrici parallele ad l .

Г π

Vediamo come si rappresenta il cilindro che indicheremo con C . Per rendere semplice
l’esposizione supporremo che la retta l sia la retta rappresentata da :
136

⎧x = y
l : ⎨
⎩y = z

e la conica Г sia la conica (ellisse) del piano z=0 di equazione

⎧2x 2 + y 2 - 1 = 0
Г :⎨
⎩ z=0

Sia P (α , β , 0 ) un punto di Г . La retta lP è rappresentata da :


⎧x = α + ρ

lP : ⎨y = β + ρ
⎪z = ρ

da questa segue α = x – z e β = y – z . Poiché P è un punto di Г si ha :

2 α2 + β2 – 1 = 0
Sostituendo in essa i valori α = x – z e β = y – z si ha :

C: 2 ( x-z) 2 + ( y – z ) 2-1 = 0
o equivalentemente :
C: 2 x 2 + y2 + 3 z 2 – 2y z - 2x z - 1 = 0

che rappresenta quindi il cilindro C nel riferimento scelto.


L’equazione trovata mostra che anche il cilindro , al pari della superficie sferica e del cono si
rappresenta con un’equazione di secondo grado in x , y , z.
Quando lo spazio reale venga ampliato con i punti immaginari anche il cilindro C
rappresentato dall’equazione a coefficienti reali

2 x 2 + y2 + 3 z 2 – 2y z - 2x z - 1 = 0

si arricchisce di ulteriori punti ( immaginari ) corrispondenti alle soluzioni complesse


dell’equazione che la rappresenta .
Quando allo spazio si aggiungano anche i punti impropri allora per rappresentare tutti i punti di
137

C propri ed impropri occorre che l’equazione 2 x 2 + y2 + 3 z 2 – 2y z - 2x z - 1 = 0 di C sia


resa omogenea. Pertanto l’equazione

2 x 2 + y2 + 3 z 2 – 2y z - 2x z – t2 = 0

rappresenta tutti i punti del cono propri ed impropri. I punti impropri essendo quelli comuni a C ed
al piano improprio sono i punti della conica Σ del piano improprio rappresentata da.
⎧2 x 2 + y 2 + 3z 2 − 2 yz - 2xz = 0
Σ : ⎨
⎩t = 0

Tale conica impropria Σ essendo

2 x 2 + y2 + 3 z 2 – 2y z - 2x z = [ 2 ( x-z) ] 2 – i2 ( y – z ) 2

è degenere ed è l’unione delle seguenti rette complesse e coniugate.

⎧⎪ 2 ( x - z) + i ( y - z ) = 0 ⎧⎪ 2 ( x - z) - i ( y - z ) = 0
r :⎨ r’ : ⎨
⎪⎩ t = 0 ⎪⎩ t = 0
138

Capitolo VI

Le quadriche
139

1. Le quadriche dello spazio proiettivo complesso.

Nello spazio proiettivo complesso di dimensione tre che indicheremo con P ( nel quale sia
fissato un riferimento reale R ) si chiama quadrica
l’insieme Q dei punti dello spazio verificanti con le loro coordinate omogenee un’equazione non
identica omogenea di secondo grado in quattro variabili ( x , y, z, t ) a coefficienti complessi ,cioè
una equazione del tipo

(1) a11x 2 + a22 y 2 + a33 z2 + a44 t2 + 2 a12 xy + 2a13 xz + 2 a14 xt + 2 a23 yz + 2 a24yt + 2a34 zt = 0.

Quando i coefficienti aij dell’equazione (1) sono numeri reali ( o proporzionali a numeri reali) la
quadrica è detta reale .

Poiché l’equazione (1) è omogenea se la quaterna non nulla ( y1, y2, y3, y4 ) verifica l’equazione (1)
anche la quaterna ( ρ y1, ρ y2, ρ y3 , ρ y4) con ρ ≠ 0 verifica l’equazione (1) sicchè ha senso
dire che un punto dello spazio soddisfa con le sue coordinate omogenee l’equazione (1).

E’ chiaro inoltre che ogni equazione proporzionale all’equazione (1) secondo un fattore di
proporzionalità non nullo , avendo le stesse soluzioni della (1) , rappresenta lo stesso insieme di
punti.

Quando le variabili (x , y, z, t ) vengano indicate con ( x1, x2, x3, x4 ) l’equazione (1) sarà scritta
nella forma :

a11x1 2 + a22 x2 2 + a33 x3 2 + a44 x4 2 + 2 a12 x1 x2 + 2a13 x1 x3 + 2 a14 x1 x4 + 2 a23 x2 x3 + 2 a24 x2 x4 +


2a34 x3 x4 = 0.

Se π e π’ sono due piani dello spazio rappresentati rispettivamente da :

π : ax + by + cz + dt = 0
π’ : a’x + b’y + c’z + d’t = 0

allora l’equazione omogenea di secondo grado , non identica ,


140

( ax + by + cz + dt ) (a’x + b’y + c’z + d’t ) = 0

ottenuta moltiplicando tra loro le due equazioni , rappresenta ovviamente l’unione dei due piani .
Pertanto tra le quadriche dello spazio ci sono quelle che siano l’unione di due piani distinti o
coincidenti. Tali quadriche sono dette riducibili, doppiamente se i due piani sono coincidenti e
semplicemente se i due piani sono distinti.

B1=B2

Una quadrica riducibile è quindi rappresentata da una equazione

a11x 2 + a22 y 2 + a33 z2 + a44 t2 + 2 a12 xy + 2a13 xz + 2 a14 xt + 2 a23 yz + 2 a24yt + 2a34 zt = 0.

nella quale il polinomio

a11x 2 + a22 y 2 + a33 z2 + a44 t2 + 2 a12 xy + 2a13 xz + 2 a14 xt + 2 a23 yz + 2 a24yt + 2a34 zt

è riducibile cioè è prodotto di due polinomi di primo grado distinti o coincidenti.

Abbiamo anche visto nei numeri precedenti che tra le quadriche reali dello spazio ci sono
anche le sfere i coni ed i cilindri che sono appunto rappresentati, come abbiamo provato , in un
riferimento reale da equazioni omogenee di secondo grado non identiche in quattro variabili.
Alla quadrica Q rappresentata nel riferimento scelto dall’equazione :

a11x 2 + a22 y 2 + a33 z2 + a44 t2 + 2 a12 xy + 2a13 xz + 2 a14 xt + 2 a23 yz + 2 a24yt + 2a34 zt = 0.
141

si può associare la seguente matrice quadrata d’ordine quattro simmetrica ottenuta utilizzando i
coefficienti aij dell’equazione della quadrica .

⎛ a 11 a 12 a 13 a 14 ⎞
⎜ ⎟
⎜ a 21 a 22 a 23 a 24 ⎟
A= ⎜ ( aij = aji )
a a a a ⎟
⎜ 31 32 33 34 ⎟
⎜a a a a ⎟
⎝ 41 42 43 44 ⎠

Si osservi ora esplicitamente che nell’equazione :

il numero che accompagna xy è il doppio di a12


il numero che accompagna xz è il doppio di a13
il numero che accompagna xt è il doppio di a14
il numero che accompagna yz è il doppio di a23
il numero che accompagna yt è il doppio di a24
il numero che accompagna zt è il doppio di a34

pertanto una certa attenzione va posta quando si scrive la matrice A associata alla quadrica.

Ad esempio la matrice associata alla quadrica reale Q rappresentata da :

2x2 + y2 + 4zt + 6xy + 4yz + z2 + 4t2 = 0

è la seguente :

⎛2 3 0 0⎞
⎜ ⎟
⎜3 1 2 0⎟
A = ⎜
0 2 1 2⎟
⎜ ⎟
⎜0 0 2 4 ⎟⎠

Vedremo in seguito che nella matrice A associata alla quadrica sono contenute molte
informazioni sulla quadrica stessa e per tale ragione occorre scriverla in modo corretto.
142

Studieremo ora in modo approfondito le quadriche dello spazio già consapevoli che tra
quelle reali dovremo ritrovare :

( coppia di piani distinti o coincidenti , sfera , coni e cilindri ).

Ma queste già descritte sono le uniche quadriche reali o ce ne sono anche altre ? Vediamo.

Alcune notazioni sono ora introdotte al fine di rendere più semplice l’esposizione.

Sia Q una quadrica rappresentata in un riferimento reale fissato dall’equazione

a11x1 2 + a22 x2 2 + a33 x3 2 + a44 x4 2 + 2 a12 x1 x2 + 2a13 x1 x3 + 2 a14 x1 x4 + 2 a23 x2 x3 + 2 a24 x2 x4 +


2a34 x3 x4 = 0.

Tale equazione può scriversi nei seguenti modi :

(a11 x1 + a12 x2 + a13 x3 + a14 x4 ) x1 +

(a21 x1 + a22 x2 + a23 x3 + a24 x4 ) x2 +

(i) (a31 x1 + a32 x2 + a33 x3 + a34 x4 ) x3 +

(a41 x1 + a42 x2 + a43 x3 + a44 x4 ) x4 = 0

(ii) ∑a
i, j
ij xi x j = 0 ( aij = aji ) (nella sommatoria gli indici i e j variano da 1 a 4)

⎛ x1 ⎞ ⎛ a 11 a 12 a 13 a 14 ⎞
⎜ ⎟ ⎜ ⎟
⎜ x2 ⎟ ⎜ a 21 a 22 a 23 a 24 ⎟
(iii) Xt A X = 0 dove è X =⎜ ⎟ ed A= ⎜ ( aij = aji )
x a a a a ⎟
⎜ 3⎟ ⎜ 31 32 33 34 ⎟
⎜x ⎟ ⎜a a a a ⎟
⎝ 4⎠ ⎝ 41 42 43 44 ⎠
143

Porremo inoltre a volte per semplicità :

f ( x1 , x2 , x3 , x4 ) = a11x1 2 + a22 x2 2 + a33 x3 2 + a44 x4 2 + 2 a12 x1 x2 + 2a13 x1 x3 + 2 a14 x1 x4 +

+2 a23 x2 x3 + 2 a24 x2 x4 + 2a34 x3 x4

f1 ( x1 , x2 , x3 , x4 ) = a11 x1 + a12 x2 + a13 x3 + a14 x4

f2 ( x1 , x2 , x3 , x4 ) = a21 x1 + a22 x2 + a23 x3 + a24 x4

f3 ( x1 , x2 , x3 , x4 ) = a31 x1 + a32 x2 + a33 x3 + a34 x4

f4 ( x1 , x2 , x3 , x4 ) = a41 x1 + a42 x2 + a43 x3 + a44 x4

Per la simmetria della matrice A sussiste questa utile eguaglianza che useremo spesso in seguito :

per ogni coppia di quaterne non nulle ( y1, y2, y3, y4 ) e ( z1 , z2 , z3 , z4 ) si ha che sono eguali
le seguenti due quantità che indicheremo con

f(y / z) e f(z / y)

dove è :

f(y / z) = (a11 y1 + a12 y2 + a13 y3 + a14 y4 ) z1 +

(a21 y1 + a22 y2 + a23 y3 + a24 y4 ) z2 +

(a31 y1 + a32 y2 + a33 y3 + a34 y4 ) z3 +

(a41 y1 + a42 y2 + a43 y3 + a44 y4 ) z4

f ( z / y ) = (a11 z1 + a12 z2 + a13 z3 + a14 z4 ) y1 +

(a21 z1 + a22 z2 + a23 z3 + a24 z4 ) y2 +

(a31 z1 + a32 z2 + a33 z3 + a34 z4 ) y3

(a41 z1 + a42 z2 + a43 z3 + a44 z4 ) y4


144

2. Intersezione di una retta con una quadrica.

Sia Q una quadrica dello spazio proiettivo rappresentata, nel riferimento reale scelto,
dall’equazione

∑a
i, j
ij xi x j = 0 ( aij = aji ) (gli indici variano da 1 a 4)

e sia r una retta dello spazio passante per i punti Y e Z di coordinate ( y1 , y2 , y3 , y4 ) e

( z1 , z2 , z3 , z4 ) . Quando si rappresenti r in forma parametrica si riconosce che i punti di r


hanno, al variare dei parametri ( λ , µ ) ≠ ( 0 , 0 ) , coordinate del tipo

(x1 , x2 , x3 , x4) = λ ( y1 , y2 , y3 , y4 ) + µ ( z1 , z2 , z3 , z4 )
Cioè :
(x1 , x2 , x3 , x4) = ( λ y1 + µ z1, λ y2 + µ z2 , λ y3 + µ z3 , λ y4 + µ z4 )

Ci chiediamo per quali valori dei parametri ( λ , µ ) ≠ ( 0 , 0 ) il punto


( λ y1 + µ z1, λ y2 + µ z2 , λ y3 + µ z3 , λ y4 + µ z4 ) della retta r appartenga anche alla
quadrica Q .

Ora il punto ( λ y1 + µ z1, λ y2 + µ z2 , λ y3 + µ z3 , λ y4 + µ z4 ) della retta r appartiene alla


quadrica Q se risulta :

(2.1) ∑a
i, j
ij ( λy i + µ z i ) ( λy j + µ z j ) = 0

L’ equazione (2.1) è una equazione omogenea di secondo grado nelle incognite λ e µ del tipo

(2.2) a λ2 + 2 b λ µ + c µ2 =0

avendo posto

a = ∑a
i, j
ij yi y j , b= ∑a
i, j
ij yi z j , c = ∑a
i, j
ij zi z j
145

Se l’equazione (2.2) è identicamente nulla cioè risulta a = b = c = 0 allora per ogni


scelta dei parametri λ e µ il punto di r di coordinate
( λ y1 + µ z1, λ y2 + µ z2 , λ y3 + µ z3 , λ y4 + µ z4 ) appartiene alla quadrica e qundi la retta r è
contenuta nella quadrica Q .
Se l’equazione (2.2) non è identicamente nulla allora essa ammette due soluzioni (distinte o
coincidenti ) in corrispondenza delle quali si trovano due punti (distinti o coincidenti) comuni alla
retta r ed alla quadrica Q .
Abbiamo così provato la seguente :
Proposizione 2.1. Una retta dello spazio non contenuta nella quadrica Q ha in comune
con essa al più due punti .

Da tale risultato segue ovviamente che :

una retta che abbia almeno tre punti in comune con la quadrica è contenuta nella quadrica.

3. Intersezione di un piano con una quadrica.


Sia Q una quadrica dello spazio proiettivo e sia π un piano reale dello spazio.Al fine di
studiare la natura dell’insieme π ∩ Q possiamo ovviamente supporre che il piano non sia
contenuto nella quadrica. Inoltre per rendere facile la nostra indagine disponiamo il riferimento in
modo che π sia il piano z = 0 . Con tale scelta del riferimento sia
a11x 2 + a22 y 2 + a33 z2 + a44 t2 + 2 a12 xy + 2a13 xz + 2 a14 xt + 2 a23 yz + 2 a24yt + 2a34 zt = 0.
l’ equazione che rappresenta la quadrica Q .
Ovviamente i punti comuni al piano ed alla quadrica hanno coordinate che soddisfano il seguente
sistema

⎧a 11 x 2 + a 22 y 2 + + a 44 t 2 + 2 a 12 xy + + 2 a 14 xt + + 2 a 24 yt = 0.

⎩z = 0
e cioè sono i punti di una conica .

Resta così provato che :

Proposizione 3.1 Un piano dello spazio che non sia contenuto in una quadrica interseca la
quadrica in una conica.
146

4. Le quadriche degeneri.

Abbiamo già osservato che l’unione di due piani distinti o coincidenti è una quadrica.
Inoltre come già visto , se si considera una conica non degenere Г di un piano e poi un punto V
fuori dal piano , l’unione di tutte le rette Vp al variare di p sulla conica Г è una quadrica . Tale
quadrica che è un cono quadrico di vertice V e direttrice Г sarà chiamata cono se V è un punto
proprio e cilindro se V è un punto improprio.
Questi quattro tipi di quadriche:

a) unione di due piani coincidenti


b) unione di due piani distinti
c) cono
d) cilindro

sono dette degeneri .Più precisamente i tipi a) e b) degeneri e riducibili mentre i tipi c) e d)
degeneri ma non riducibili.
Al fine di trovare una caratterizzazione delle quadriche degeneri è importante la seguente
definizione.

Sia Q una quadrica dello spazio proiettivo. Un punto P della quadrica Q è detto doppio

se ogni retta per P o è contenuta nella quadrica o interseca la quadrica nel solo punto P .

Un punto che non sia doppio è detto semplice.

Le quadriche degeneri sono tutte dotate di punti doppi.

Precisamente :

se la quadrica è l’unione di due piani coincidenti ogni suo punto è doppio : tale quadrica
possiede quindi almeno tre punti doppi non allineati.
147

se la quadrica è l’unione di due piani distinti i punti doppi della quadrica sono i punti della
retta comune ai due piani : tale quadrica possiede più di un punto doppio ma i suoi punti doppi
sono allineati.

Se la quadrica è un cono o un cilindro il vertice V è l’unico punto doppio.

La situazione ora descritta caratterizza tali quadriche come le proposizioni che seguono mostrano.

Proposizione 4.1 Se una quadrica Q possiede almeno tre punti doppi non allineati essa è
l’unione di due piani coincidenti.
Dimostrazione. Siano A , B , C tre punti della quadrica Q e siano doppi e non allineati.
Sia π il piano determinato dai tre punti A , B , C . Le tre rette AB , AC , BC costituiscono i lati
di un triangolo e sono contenute nella quadrica in quanto i punti A , B , C sono doppi.
Per questa ragione il piano π avendo in comune con la quadrica tali rette non ha in comune con la
quadrica una conica ed è quindi contenuto nella quadrica . Se proviamo che la quadrica coincide
col piano π si ha l’asserto. Supponiamo per assurdo che contenga propriamente il piano π ed
esista quindi un punto T di Q fuori dal piano π . Poiché A , B , C sono doppi le rette TA , TB ,
TC sono contenute nella quadrica .
Segue allora che i piani γ = < TAB > , β = < TAC > , α = < TBC > sono contenuti nella quadrica
in quanto ciascuno di essi ha in comune con la quadrica tre rette. Sia K un punto dello spazio non
appartenente ai piani π , α , β , γ e sia π’ un piano per K e non passante per T . Siano l , l’ , l’’
le rette che il piano π’ ha in comune con i piani α , β , γ . Il piano π’ avendo in comune con
la quadrica le tre rette l , l’ , l’’ è contenuto nella quadrica e così K è un punto di Q .Ma allora
ogni punto dello spazio fa parte di Q e ciò non è possibile in quanto essendo l’equazione che
rappresenta Q non identica essa non può rappresentare tutti i punti dello spazio.

Proposizione 4.2 Se i punti doppi di una quadrica Q sono almeno due e tutti allineati
allora la quadrica Q è l’unione di due piani distinti.
Dimostrazione. Siano A e B due punti doppi distinti della quadrica Q . La retta l che
congiunge A e B è allora contenuta nella quadrica. Poiché Q contiene propriamente la retta l è
possibile scegliere un punto T su Q fuori dalla retta l . Le rette TA e TB fanno parte della
quadrica in quanto A e B sono doppi. Il piano π che unisce T ed l è quindi contenuto nella
quadrica avendo con essa in comune le tre rette distinte l , TA , TB. Se Q coincidesse col piano π
allora Q avrebbe almeno tre punti doppi non allineati contro il supposto. Quindi la quadrica Q
148

contiene propriamente il piano π ed è quindi possibile determinare un punto T’ su Q fuori da π.


Per le stesse ragioni esposte per il punto T il piano π’ che congiunge l e T’ è contenuto nella
quadrica Q . Proviamo ora che risulta Q = π ∪ π’ .
Supponiamo per assurdo che esista un punto K su Q e non appartenente ai piani π e π’.
Proveremo ora che ogni retta per K è contenuta nella quadrica il che è assurdo in quanto la
quadrica è un sottoinsieme proprio dello spazio.
Il piano α che congiunge l con K è contenuto nella quadrica avendo in comune con essa le
rette l , KA e KB . Quindi ogni retta per K che incida la retta l , essendo conenuta nel piano α ,
è contenuta nella quadrica. D’altra parte una retta per K che non incida la retta l interseca i piani
π e π’ in due punti distinti ed è quindi contenuta nella quadrica avendo con essa in comune tre
punti distinti.

Proviamo la seguente :

Proposizione 4.3 Se una quadrica Q contiene un piano essa è unione di due piani distinti o
coincidenti.
Dimostrazione. Supponiamo che la quadrica Q contenga un piano π . Se è Q = π si ha
l’asserto.Supponiamo quindi che Q contenga propriamente π e sia T un punto di Q fuori dal
piano π .
Sia l una retta di π e sia α il piano che congiunge T e la retta l .Se il piano α non è
contenuto in Q esso interseca la quadrica in una conica che è degenere ed è composta dalla retta
l e da un’altra retta t per T . Sia A il punto comune a π ed alla retta t . Si scelga ora una
retta r in π non passante per il punto A e sia β il piano determinato da T ed r . Tale piano β se
non è contenuto in Q interseca Q in una conica che è degenere ed è costituita dalla retta r ed
un’altra retta t’ per T . Il piano γ determinato dalle rette t e t’ è allora contenuto in Q in quanto
ha in comune con Q le tre rette distinte γ ∩ π , t , t’ . In ogni caso abbiamo provato che la
quadrica Q contiene l’unione di due piani distinti di cui uno è π e l’altro è α oppure β oppure
γ.
Sia π’ il piano diverso da π contenuto in Q e sia l la retta comune ai piani π e π’.
Possiamo ora provare che è Q = π ∪ π’ .
Supponiamo per assurdo che esista un punto K su Q e non appartenente ai piani π e π’.
Si scelga un punto L sulla retta l e sia r una retta per K distinta dalla retta s = [KL] e che
interseca i piani π e π’ in due punti distinti. La retta r è contenuta in Q avendo in comune con
Q tre punti distinti.
149

Il piano α determinato dalle rette s ed r è allora contenuto nella quadrica Q in quanto ha


in comune con Q le tre rette α ∩ π , α ∩ π’ ed r .
Abbiamo così provato che la retta s = [KL] è contenuta nella quadrica Q qualunque sia L
scelto su l . D’ altra parte ogni retta per K che non incida l interseca i due piani π e π’ in due
punti distinti e quindi fa parte di Q avendo con essa in comune tre punti distinti . Ma se ogni retta
per K è contenuta in Q allora Q coincide con tutti i punti dello spazio il che è assurdo.

Possiamo ora provare la seguente utile :

Proposizione 4.4 Se una quadrica Q contiene un solo punto doppio V essa è un cono
quadrico di vertice V .
Dimostrazione. Sia V l’unico punto doppio della quadrica Q e sia π un piano non
passante per V . Per la proposizione precedente il piano π non è contenuto nella quadrica Q e
quindi interseca la quadrica in una conica Г . La conica Г è non degenere in quanto se contenesse
una retta t il piano β determinato da V e t sarebbe contenuto in Q essendo V doppio.
Consideriamo il cono C di vertice V e direttrice Г e proviamo che è C = Q . E’ evidente che
ogni retta Vp al variare di p su Г è contenuta in Q essendo V doppio. Pertanto è C ⊆ Q .
Proviamo ora che ogni punto di Q è un punto del cono C e che è quindi Q = C .
Sia M un punto di Q che possiamo supporre diverso da V e non appartenente a Г . La
retta VM è contenuta in Q , essendo V doppio, ed interseca il piano π in un punto p
necessariamente appartenente a Г .
Pertanto M giace su una delle generatrici del cono ( la retta Vp) e quindi appartiene al
cono. L’ asserto è così provato.
Possiamo riassumere tutte le proposizioni precedenti nella seguente :

Proposizione 4.5 Una quadrica Q è degenere se e solo se possiede almeno un punto


doppio.

Una quadrica priva di punti doppi sarà quindi chiamata non degenere.

Le proposizioni provate e che caratterizzano le quadriche degeneri spostano l’attenzione sulla


ricerca degli eventuali punti doppi della quadrica .
Ma come si trovano i punti doppi di una quadrica ? Vediamo .
150

La proposizione che segue fornisce la risposta al quesito posto.

Proposizione 4.6 Un punto P dello spazio è doppio per la quadrica Q rappresentata


dall’equazione
Q : ∑a
i, j
ij xi x j = 0 ( aij = aji )

se e solo se le sue coordinate ( y1 , y2 , y3 , y4 ) verificano le seguenti eguaglianze :

a11 y1 + a12 y2 + a13 y3 + a14 y4 = 0

a21 y1 + a22 y2 + a23 y3 + a24 y4 = 0

(4.1) a31 y1 + a32 y2 + a33 y3 + a34 y4 = 0

a41 y1 + a42 y2 + a43 y3 + a44 y4 = 0

Dimostrazione. Cominciamo a provare che se un punto ha coordinate verificanti le


eguaglianze (4 . 1) esso è un punto della quadrica ed è doppio per essa . Abbiamo già osservato che
risulta

∑a
i, j
ij yi y j = ( a11 y1 + a12 y2 + a13 y3 + a14 y4 ) y1 + (a21 y1 + a22 y2 + a23 y3 + a24 y4) y2 +

+ (a31 y1 + a32 y2 + a33 y3+ a34 y4) y3 + (a41 y1 + a42 y2 + a43 y3 + a44 y4 ) y4

e pertanto , se valgono le (4.1), si ha ∑a i, j


ij yi y j = 0 , il che prova che P è un punto della

quadrica . Proviamo ora che esso è doppio per la quadrica .

Sia Z un punto qualsiasi dello spazio distinto dal punto P e sia r la retta che unisce P con Z .

Siano ( z1 , z2 , z3 ) le coordinate di Z e sia

(x1 , x2 , x3 , x4) = ( λ y1 + µ z1, λ y2 + µ z2 , λ y3 + µ z3 , λ y4 + µ z4 )

la rappresentazione parametrica della retta r .

Abbiamo già visto che gli eventuali punti comuni alla retta r ed alla quadrica si trovano attraverso
le soluzioni non nulle dell’equazione

a λ2 + 2 b λ µ + c µ2 =0
151

dove è : ( con gli indici i e j variabili tra 1 e 4 )

a = ∑a
i, j
ij yi y j , b= ∑a
i, j
ij yi z j , c = ∑a
i, j
ij zi z j

Stante le (4.1) si ha allora a = 0 e b = 0 e pertanto l’ equazione

a λ2 + 2 b λ µ + c µ2 =0
diventa

c µ2 =0

Se anche c = 0 allora la retta r è contenuta nella quadrica se invece è c ≠ 0 allora


l’equazione c µ2 = 0 fornisce come sua unica soluzione la coppia ( 1 , 0 ) cui corrisponde il
punto P che diventa quindi l’unico punto che r ha in comune con la quadrica .

Abbiamo provato così che se valgono le (4.1) allora P appartiene alla quadrica ed inoltre
(vista l’arbitrarietà del punto Z ) ogni retta per P o è contenuta in Q o ha in comune con Q il
solo punto P e ciò prova che P è doppio per Q .

Viceversa supponiamo che un punto P ( y1 , y2 ,y3 , y4 ) della quadrica Q sia doppio per
essa e proviamo che le sue coordinate (y1 , y2 ,y3 , y4 ) verificano le (4. 1 ).

Al solito sia Z un punto qualsiasi dello spazio distinto dal punto P e sia r la retta che
unisce P con Z . Siano ( z1 , z2 , z3, z4 ) le coordinate di Z e sia

(x1 , x2 , x3 , x4) = ( λ y1 + µ z1, λ y2 + µ z2 , λ y3 + µ z3 , λ y4 + µ z4 )

la rappresentazione parametrica della retta r .

I punti comuni alla retta r ed alla quadrica si trovano attraverso le soluzioni non nulle
dell’equazione

a λ2 + 2 b λ µ + c µ2 =0

dove è : ( con gli indici i e j variabili tra 1 e 4 )


152

a = ∑a
i, j
ij yi y j , b= ∑a
i, j
ij yi z j , c = ∑a
i, j
ij zi z j

Poiché P è un punto della quadrica allora è a = 0 . L’ equazione

a λ2 + 2 b λ µ + c µ2 =0
diventa così :
µ ( 2 b λ + c µ) =0
Si ha quindi la soluzione ( attesa ) (1 , 0) cui corrisponde P e l’altra soluzione si ottiene da
2 b λ + c µ = 0.
Poiché P è doppio la retta PZ è contenuta in Q oppure ha in comune con Q il solo punto P e
quindi l’ equazione 2 b λ + c µ = 0 deve o essere identicamente nulla o deve fornire ancora
come soluzione la coppia ( 1, 0 ) . In entrambi i casi ciò comporta che è b = 0 .
Pertanto qualunque sia Z ( z1 , z2 , z3 , z4 ) risulta allora che è :

b= ∑a
i, j
ij yiz j = 0

Esplicitamente è :

b = (a11 y1 + a12 y2 + a13 y3 + a14 y4 ) z1 +( a21 y1 + a22 y2 + a23 y3 + a24 y4 ) z2 +

(a31 y1 + a32 y2 + a33 y3 + a34 y4 ) z3 + ( a41 y1 + a42 y2 + a43 y3 + a44 y4 ) z4

ed esso è nullo , per ogni scelta del punto Z , e quindi per ogni scelta della quaterna
( z1 , z2 , z3 , z4 ).

Scegliendo

( z1 , z2 , z3 , z4 ) = ( 1, 0 , 0 ,0 ) , ( z1 , z2 , z3 , z4 ) = ( 0, 1 , 0, 0 ) ,
( z1 , z2 , z3 , z4 ) = ( 0, 0 , 1 ,0 ) , ( z1 , z2 , z3 , z4 ) = ( 0, 0 , 0, 1 ) ,
153

si hanno le (4.1) e l’asserto è così provato.

La proposizione ora provata ha mostrato che determinare gli eventuali punti doppi della
quadrica equivale a determinare le eventuali soluzioni non nulle del seguente sistema omogeneo

⎧a 11 x 1 + a 12 x 2 + a 13 x 3 + a 14 x 4 = 0
⎪a x 1 + a 22 x 2 + a 23 x 3 + a 24 x 4 = 0
⎪ 21
(4. 2) ⎨
⎪a 31 x 1 + a 32 x 2 + a 33 x 3 + a 34 x 4 = 0
⎪⎩a 41 x 1 + a 42 x 2 + a 43 x 3 + a 44 x 4 = 0

che ha per matrice la matrice A della quadrica .

Pertanto , tenendo conto delle proposizioni precedenti , si ha questa utilissima

Proposizione 4.7 Una quadrica Q rappresentata dall’equazione


Q : ∑a
i, j
ij xi x j = 0 ( aij = aji )

è degenere se e solo se risulta


det A = 0 .
Dimostrazione. Se Q è degenere essa possiede almeno un punto doppio P. Le coordinate dì P sono
quindi una soluzione non nulla del sistema omogeneo (4 .2) e così è det A = 0.
Viceversa se detA = 0 il sistema (4.2) ha soluzioni non nulle ed in corrispondenza a tali
soluzioni si hanno punti doppi per Q la quale è così degenere.

5. Piano tangente ad una quadrica in un suo punto semplice.

Sia Q una quadrica ( non riducibile ) rappresentata da

∑a
i, j
ij xi x j = 0 ( aij = aji )

e sia P( y1 , y2 ,y3 , y4 ) un suo punto semplice . Poiché il punto P è semplice almeno una delle
quattro relazioni (4 .1) è diversa da zero. Sia Z ( z1 , z2 , z3 , z4 ) un punto dello spazio distinto
da P e sia r la retta PZ . Come già visto i punti comuni alla retta PZ , rappresentata
154

parametricamente da

(x1 , x2 , x3 , x4) = ( λ y1 + µ z1, λ y2 + µ z2 , λ y3 + µ z3 , λ y4 + µ z4 )

si trovano attraverso le soluzioni non nulle dell’equazione

(5 .1) a λ2 + 2 b λ µ + c µ2 =0

dove è :

a = ∑a
i, j
ij yi y j , b= ∑a
i, j
ij yi z j , c = ∑a
i, j
ij zi z j

Essendo a = 0 in quanto P ∈ Q , l’equazione (5.1) diventa :

( 5 .2) µ ( 2 b λ + c µ) =0

Tale equazione fornisce la soluzione (1 , 0) in accordo col fatto che P è comune ad r e Q . Ora se
è

b= ∑ai, j
ij yi z j = 0

ed è c ≠ 0 la soluzione (1 , 0) sarà soluzione doppia della (5. 2 ) e cioè la retta r interseca Q solo
nel punto P , se invece è anche c = 0 l’equazione (5. 2 ) è identicamente nulla e la retta r è
contenuta in Q .

Abbiamo così provato che i punti Z dello spazio per cui la retta PZ incontri Q nel solo punto P o
sia contenuta in Q sono tutti e soli quelli per cui risulti :

(a11 y1 + a12 y2 + a13 y3 + a14 y4 ) z1 + (a21 y1 + a22 y2 + a23 y3 + a24 y4 ) z2 +

(a31 y1 + a32 y2 + a33 y3 + a34 y4 ) z3 + (a41 y1 + a42 y2 + a43 y3 + a44 y4 ) z4 = 0

cioè sono tutti e soli i punti dello spazio le cui coordinate sono soluzione dell’equazione seguente

(5.3) (a11 y1 + a12 y2 + a13 y3 + a14 y4 ) x1 + (a21 y1 + a22 y2 + a23 y3 + a24 y4 ) x2 +


155

(a31 y1 + a32 y2 + a33 y3 + a34 y4 ) x3 + (a41 y1 + a42 y2 + a43 y3 + a44 y4 ) x4 = 0

Tale equazione, che non è identica perchè P è semplice , rappresenta quindi un piano per P che è
chiamato piano tangente nel punto P.
Sia P un punto e sia πP il piano tangente in P . Per la sua stessa definizione se Z è un punto
di πP diverso da P la retta PZ è tangente a Q in P (incontra cioè Q nel solo punto P) oppure è
tutta contenuta nella quadrica. Q .
Poiché la sezione di un piano con una quadrica è una conica allora l’intersezione del piano
πP con la quadrica fornirà una conica che è necessariamente degenere .
Viceversa se in un punto P semplice della quadrica c’è un piano per P che interseca Q in
una conica degenere costituita da due rette per P o da una sola retta allora tale piano è
necessariamente il piano tangente a Q nel punto P .

6. Il gruppo strutturale.

Sia GL(4,R) il gruppo delle matrici reali quadrate d’ordine quattro non degeneri ad elementi
reali .
Sia A = ( aij ) una matrice non degenere elemento di GL(4,R) . La matrice A induce nello spazio
proiettivo complesso P un’ applicazione ωA biettiva quando si faccia corrispondere al punto P
di coordinate ( x1, x2, x3, x4 ) il punto P’ di coordinate (x '1 , x '2 , x '3 , x '4 ) con

(x '1 , x '2 , x '3 , x '4 ) date da :

x '1 = a11 x1 + a12 x2 + a13 x3 + a14 x4

x '2 = a21 x1 + a22 x2 + a23 x3 + a24 x4

x '3 = a31 x1 + a32 x2 + a33 x3 + a34 x4

x '4 = a41 x1 + a42 x2 + a43 x3 + a44 x4

Ovviamente se si moltiplica la matrice A per un fattore ρ ≠ 0 diverso da zero si ottiene una matrice

A’ che induce la stessa funzione indotta su P dalla matrice A . La funzione ωA indotta da A è


detta omografia reale ed essa è un isomorfismo dello spazio proiettivo in quanto essa è biettiva e
trasforma con la sua inversa rette in rette e piani in piani.
156

Nel gruppo GL(4 , R ) si considerino ora tutte le matrici A del seguente tipo :

⎛ a 11 a 12 a 13 a 14 ⎞
⎜ ⎟ ⎛ a 11 a 12 a 13 ⎞
⎜a a a 23 a 24 ⎟ ⎜ ⎟
A= ⎜ 21 22 con det ⎜ a 21 a 22 a 23 ⎟ ≠0
a a a 33 a 34 ⎟ ⎜a a a ⎟
⎜ 31 32 ⎟ ⎝ 31 32 33 ⎠
⎜0 0 0 1 ⎟⎠

Denotiamo con A(4 , R) l’inisieme di tutte le matrici del tipo sopra esposto. L’insieme A(4 , R) è
anch’esso un gruppo detto gruppo affine reale . Le applicazioni che le matrici A di A(4 , R)
inducono nello spazio proiettivo sono quindi di questo tipo
x '1 = a11 x1 + a12 x2 + a13 x3 + a14 x4

x '2 = a21 x1 + a22 x2 + a23 x3 + a24 x4

x '3 = a31 x1 + a32 x2 + a33 x3 + a34 x4

x '4 = x4

e sono chiamate affinità reali. Ogni affinità reale è un isomorfismo che trasforma punti reali in
punti reali, punti immaginari in punti immaginari , punti propri in punti propri e punti impropri in
punti impropri.
Noi riterremo che sullo spazio P agiscano tali affinità e le proprietà delle figure dello spazio
invarianti rispetto a tali trasformazioni saranno chiamate proprietà affini.
Sia Q una quadrica reale non degenere rappresentata in un riferimento reale da :

Xt A X = 0
Sia X’ = MX un’affinità dello spazio . Da X’ = MX segue , essendo detM ≠ 0 ,
X = M-1 X’ e quindi X t = X’ t (M-1)t
Si ha :
Xt A X = X’ t (M-1)t A M-1 X’ = 0

e quindi la quadrica Q viene allora trasformata nella quadrica Q’ rappresentata da :


157

X’ t A’X’ = 0

avendo posto A’ = (M-1)t A M-1 .


La quadrica Q’ trasformata della quadrica Q ha quindi una matrice A’ il cui determinante ha
lo stesso segno del determinante di A in quanto è :

det A’ = ( detM-1 )2 detA

Il segno del determinante di A ha quindi un significato geometrico essendo invariante per affinità.

7. Quadriche reali.

Nel presente numero Q rappresenterà una quadrica reale e cioè rappresentabile con un’equazione

∑a
i, j
ij xi x j = 0 ( aij = aji )

i cui coefficienti aij sono numeri reali. Supporremo che la quadrica Q sia dotata di punti reali.
Sia P un punto semplice e reale della quadrica Q e sia πP il piano tangente in P . Tale piano è
al pari di P reale ed interseca quindi Q in una conica γ reale. Tale conica γ , come abbiamo già
osservato, è degenere e quindi sono possibili tre eventualità :

a) γ è doppiamente degenere e cioè è una sola retta reale per P .


b) γ è semplicemente degenere ed è costituita da una coppia di rette reali per P.
c) γ è semplicemente degenere e è costituita da una coppia di rette complesse e coniugate per P.

Quando si verifica la circostanza a) il punto P è detto parabolico.


Quando si verifica la circostanza b) il punto P è detto iperbolico.
Quando si verifica la circostanza c) il punto P è detto ellittico.

Proveremo ora che le uniche quadriche che posseggono punti parabolici sono i coni ed i cilindri
mentre le quadriche non degeneri hanno soltanto punti iperbolici o ellittici.

Riassumendo :
158

quando un punto P è parabolico c’è una sola retta passante per P e contenuta nella quadrica.

quando un punto P non è parabolico ci sono due rette distinte per P contenute nella quadrica.

Possiamo provare ora la seguente :

Proposizione 7.1 . Sia Q una quadrica non riducibile in piani. Se Q possiede un punto P
parabolico ogni suo altro punto semplice è parabolico e Q possiede un punto doppio V. Q è quindi
un cono o un cilindro a seconda che V sia proprio o improprio.
Dimostrazione. Sia P il punto parabolico che Q possiede e sia πP il piano tangente in P. Sia
L la retta che tale piano ha in comune con Q. Sia P’ un altro punto di Q fuori dal piano πP . Il
punto P’ è semplice altrimenti il piano <P’, L> sarebbe contenuto in Q. Per il punto P’ non
possono passare due rette contenute in Q altrimenti esse intersecherebbero entrambe L ed il piano
<P’, L> sarebbe ancora contenuto in Q. Pertanto P’ è anch’ esso parabolico e sia L’ la retta per P’
contenuta in Q. Il piano πP’ tangente in P’ non può contenere la retta L altrimenti la retta [P’P]
sarebbe contenuta in Q e P non sarebbe parabolico. La retta L’ interseca il piano πP in un punto V
che risulta comune alle rette L ed L’ . Ogni punto W di L diverso da P e da V è parabolico in quanto
tutte le rette per W contenute nel piano πP e diverse da L sono tangenti . Pertanto il piano tangente
nel punto W coincide col piano tangente in P. Analogamente accade per ogni punto W’ della retta
L’ diverso da P’ e da V. Sia P” un punto di Q non appartenente ai piani πP e πP’ . Il punto P” è
semplice e la retta L” per esso contenuta in Q deve intersecare per ciò che precede, L ed L’
necessariamente nel punto V. Poichè per V passano tre rette contenute in Q allora V è doppio e si ha
così l’asserto.

Osserviamo esplicitamente quanto segue :

Se Q è un cono reale allora esso ha un unico punto doppio V che è proprio. Per tale ragione
la conica impropria del cono è non degenere in quanto se tale conica contenesse una retta r il
piano congiungente V ed r sarebbe contenuto nella quadrica.
Se invece Q è un cilindro reale il suo unico punto doppio è improprio ed esso è quindi doppio
anche per la conica impropria Г che è così degenere. Se Г si riduce ad una sola retta il cilindro è
detto parabolico .Se Г è unione di due rette reali e distinte il cilindro è detto iperbolico. Se Г è
159

unione di due rette immaginarie coniugate il cilindro è detto ellittico.

8. Quadriche reali non degeneri.

In questo numero considereremo le quadriche reali non degeneri e che siano dotate di punti
reali.
I punti reali di una quadrica reale non degenere sono tutti semplici e non parabolici e risultano
quindi iperbolici o ellittici . Noi ora mostreremo che essi sono tutti iperbolici o tutti ellittici.
Sussiste infatti la seguente :

Proposizione 8.1 Sia Q una quadrica reale non degenere e dotata di punti reali. Se la
quadrica Q ha un punto reale iperbolico ogni suo altro punto reale è iperbolico.
Dimostrazione. Sia P un punto reale ed iperbolico della quadrica Q e siano r ed r’ le due
rette reali passanti per P e contenute in Q . E’ chiaro che gli altri punti reali di r ed r’ sono
iperbolici. Sia quindi P’ un punto reale della quadrica Q fuori dal piano tangente πP . Il piano che
unisce P’ ed r è reale ed interseca quindi Q in una conica reale . Tale conica è degenere ed è
l’unione della retta r e di un’ altra retta reale t per P’ . Analogamente il piano che congiunge r’
con P’ è reale ed interseca quindi Q in una conica reale. Tale conica è degenere ed è l’unione della
retta r’ e di un’ altra retta reale t’ per P’. Abbiamo provato così che P’ è iperbolico.

Si può provare che sussiste la seguente proposizione di cui omettiamo la dimostrazione.

Proposizione 8.2 Sia Q una quadrica reale non degenere e dotata di punti reali
rappresentata da

∑a
i, j
ij xi x j = 0 ( aij = aji )

La quadrica Q ha i punti reali iperbolici se e solo se risulta

det A > 0.

Dalla proposizione 8.2 segue ovviamente la seguente:

Proposizione 8.3 Sia Q una quadrica reale non degenere e dotata di punti reali
160

rappresentata da

∑a
i, j
ij xi x j = 0 ( aij = aji )

La quadrica Q ha i punti reali ellittici se e solo se risulta

det A < 0 .

Le proposizioni 4.7 , 8.1 ed 8.2 confermano che il segno del determinante della matrice
della quadrica ha un significato geometrico.

Sia Q una quadrica reale non degenere . I punti impropri della quadrica sono i punti che la
quadrica Q ha in comune con il piano improprio. Poiché il piano improprio interseca Q in una
conica, tali punti sono quindi i punti di una conica , detta conica impropria e che indicheremo col
simbolo γ ∞ .

Poiché la quadrica è reale ed il piano improprio è un piano reale la conica γ ∞ è reale e


quindi per tale conica si hanno le seguenti possibilità :

⎧ in due rette reali e distinte


γ ∞ è degenere ⎨
⎩ in due rette immaginarie e coniugate

γ ∞ è non degenere e dotata di punti reali

γ ∞ è non degenere e priva di punti reali (totalmente immaginaria).

Quando la conica γ ∞ è degenere a quadrica Q è detta paraboloide.

Quando la conica γ ∞ è non degenere e dotata di punti reali la quadrica Q è detta


iperboloide .
Quando la conica γ ∞ è non degenere e totalmente immaginaria la quadrica Q è detta
ellissoide.
161

L’ essere per una quadrica un paraboloide , un iperboloide o un ellissoide è una proprietà


invariante per affinità e per tale ragione la suddivisione delle quadriche reali e non degeneri in
queste tre famiglie viene chiamata la classificazione affine delle quadriche reali.
Una retta reale contenuta nella quadrica Q ha un punto improprio reale e tale punto sarà un
punto reale della conica impropria. Da ciò segue che i punti reali di un ellissoide sono
necessariamente ellittici.

Ci sono invece due tipi di paraboloidi :

( paraboloide a punti ellittici )


162

( paraboloide a punti iperbolici )

E ci sono due tipi di iperboloidi :

iperboloide a punti iperbolici ( iperboloide ad una falda)


163

Iperboloide a punti ellittici ( iperboloilde a due falde ).

Le quadriche non degeneri contengono rette , rette reali se i punti sono iperbolici e rette
immaginarie se i punti sono ellittici. Vediamo come sono disposte tali rette sulla quadrica.
Consideriamo un punto P della quadrica e siano r ed s le due rette passanti per P e
contenute nella quadrica Q . Indichiamo con πP il piano tangente in P che contiene le due rette r
ed s . Per ogni punto x di r-{ P } indichiamo con sx l’altra retta per x contenuta nella quadrica.
La retta s e tutte le rette sx ( al variare di x ) sono evidentemente a due a due sghembe e definiscono

una schiera di rette che indicheremo con Σ.


Analogamente per ogni punto y di s-{ P } sia ry l’ulteriore retta per y contenuta nella
quadrica . La retta r e le rette ry ( al variare di y ) definiscono l’altra schiera di rette che sarà

indicata con Σ’ . Ogni retta contenuta nella quadrica diversa da r ed s interseca il piano πP in
un punto di r ∪ s differente da P e quindi appartiene ad una delle due schiere.

Sia sx una retta di Σ ed ry una retta di Σ’ . Il piano tangente πx in x che contiene le


rette r ed sx non contiene la retta ry . La retta ry interseca quindi il piano πx in punto che è
necessariamente un punto si sx essendo r ed ry sghembe tra loro.
Abbiamo così mostrato che tutte le rette di una quadrica non degenere si ripartiscono in due
famiglie di rette, dette schiere di rette, e tali schiere hanno la proprietà che rette della stessa schiera
risultano sghembe tra loro mentre rette di schiere diverse sono incidenti tra loro.

9. Polarità definita da una quadrica non degenere.


164

Sia Q una quadrica non degenere rappresentata in un riferimento reale assegnato


dall’equazione :

Q : ∑a
i, j
ij xi x j = 0 ( aij = aji )

Poiché la quadrica è non degenere la sua matrice A(aij ) è non degenere e quindi è det A ≠ 0.

Sia P( y1 , y2, y3 , y4) un punto dello spazio . L’ equazione

(a11 y1 + a12 y2 + a13 y3 + a14 y4 ) x1 +(a21 y1 + a22 y2 + a23 y3 + a24 y4 ) x2 +

(a31 y1 + a32 y2 + a33 y3 + a34 y4 ) x3 +(a41 y1 + a42 y2 + a43 y3 + a44 y4 ) x4 = 0

( costruita utilizzando le coordinate ( y1 , y2, y3 , y4) di P ) è una equazione non identica


( altrimenti P sarebbe doppio e la quadrica sarebbe degenere) e quindi rappresenta un piano
dello spazio. Tale piano è chiamato piano polare del punto P e sarà denotata col simbolo πp .
Associando al punto P il suo piano polare si realizza una applicazione p tra i punti dello
spazio ed i piani dello spazio. Tale applicazione
p : P → πp
è chiamata polarità indotta dalla quadrica non degenere Q . Il punto P è chiamato il polo del
piano πp .
Le proposizioni che seguono illustrano alcune importanti proprietà della polarità p indotta
dalla quadrica Q .

Proposizione 9.1 La polarità è un’applicazione biettiva.


Dimostrazione. Sia π un piano dello spazio rappresentato da :

(9.1) π: ax + by + cz + dt = 0

Un punto P( y1 , y2, y3 , y4) dello spazio ha per piano polare il piano π se risulta πP = π cioè
se l’equazione

(a11 y1 + a12 y2 + a13 y3 + a14 y4 ) x1 +(a21 y1 + a22 y2 + a23 y3 + a24 y4 ) x2 +

(a31 y1 + a32 y2 + a33 y3 + a34 y4 ) x3 +(a41 y1 + a42 y2 + a43 y3 + a44 y4 ) x4 = 0


165

è l’equazione del piano π . Si ha quindi che P( y1 , y2, y3 , y4) è polo di π se e solo se risulta :

⎧ a 11 y 1 + a 12 y 2 + a 13 y 3 + a 14 y 4 = a

⎪ a 21 y 1 + a 22 y 2 + a 23 y 3 + a 24 y 4 = b
(**) ⎨
⎪ a 31 y 1 + a 32 y 2 + a 33 y 3 + a 34 y 4 = c
⎪ a 41 y 1 + a 42 y 2 + a 43 y 3 + a 44 y 4 = d

Tale sistema inteso nelle incognite ( y1 , y2, y3 , y4) ha una sola soluzione ( z1 , z2, z3 , z4 ) in
quanto, essendo la quadrica non degenere, è det A ≠ 0.
Sostituendo alla quaterna ( a, b , c, d ) con la quaterna proporzionale ( ρ a, ρ b , ρ c , ρ d)
con ρ ≠ 0 si otterrà in corrispondenza la soluzione ( ρ z1 , ρ z2, ρ z3 , ρ z4 ).
Pertanto in corrispondenza a tutte le quaterne ( ρ z1 , ρ z2, ρ z3 , ρ z4 ). soluzioni di (**) si ha un
solo punto P dello spazio avente per piano polare il piano π . La corrispondenza p è quindi
biettiva come si voleva provare.

Proposizione 9.2 Un punto P appartiene al suo piano polare se e solo se esso appartiene
alla quadrica . In tal caso il suo piano polare coincide con il piano tangente in P.
Dimostrazione . Se P( y1 , y2, y3 , y4) è un punto della quadrica allora il suo piano polare
che è rappresentata da :

(a11 y1 + a12 y2 + a13 y3 + a14 y4 ) x1 +(a21 y1 + a22 y2 + a23 y3 + a24 y4 ) x2 +

(a31 y1 + a32 y2 + a33 y3 + a34 y4 ) x3 +(a41 y1 + a42 y2 + a43 y3 + a44 y4 ) x4 = 0

coincide con il piano tangente nel punto P . In tal caso quindi P appartiene a tale piano in
quanto è

(a11 y1 + a12 y2 + a13 y3 + a14 y4 ) y1 +(a21 y1 + a22 y2 + a23 y3 + a24 y4 ) y2 +

(a31 y1 + a32 y2 + a33 y3 + a34 y4 ) y3 +(a41 y1 + a42 y2 + a43 y3 + a44 y4 ) y4 = 0

essendo P un punto della quadrica.


Viceversa se P( y1 , y2, y3 , y4) appartiene al suo piano polare si ha :

(a11 y1 + a12 y2 + a13 y3 + a14 y4 ) y1 +(a21 y1 + a22 y2 + a23 y3 + a24 y4 ) y2 +

(a31 y1 + a32 y2 + a33 y3 + a34 y4 ) y3 +(a41 y1 + a42 y2 + a43 y3 + a44 y4 ) y4 = 0


166

e questa prova che P è un punto della quadrica .

Abbiamo così provato che :

(9.3) P ∈ πP ⇔ P∈ Q

Una importante proprietà della polarità p è espressa dal seguente :

Teorema di reciprocità. Se A(y1 , y2, y3 , y4 ) e B(z1 , z2, z3, z4 ) sono due punti distinti
dello spazio , si ha
(9.4) B ∈ πA ⇔ A ∈ πB
Dimostrazione.
Il piano polare di A è :
(a11 y1 + a12 y2 + a13 y3 + a14 y4 ) x1 +(a21 y1 + a22 y2 + a23 y3 + a24 y4 ) x2 +

(a31 y1 + a32 y2 + a33 y3 + a34 y4 ) x3 +(a41 y1 + a42 y2 + a43 y3 + a44 y4 ) x4 = 0


che può scriversi sinteticamente , usando le notazioni introdotte al numero 1 , così :

f(y / x) =0

Il piano polare di B è :

(a11 z1 + a12 z2 + a13 z3 + a14 z4 ) x1 +(a21 z1 + a22 z2 + a23 z3 + a24 z4 ) x2 +

(a31 z1 + a32 z2 + a33 z3 + a34 z4 ) x3 +(a41 z1 + a42 z2 + a43 z3 + a44 z4 ) x4 = 0

che può scriversi sinteticamente , usando le notazioni introdotte al numero 1 , così :

f(z / x) =0

Abbiamo, sempre al numero 1 , già osservato che poiché la matrice A della quadrica è simmetrica
si ha per ogni coppia di quaterne non nulle (y1 , y2, y3 , y4 ) e (z1 , z2, z3, z4 )

(9.5) f(y / z) = f(z / y)

Dalla (9.5) segue quindi


167

f(y / z) =0 ⇔ f(z / y)=0

e questa prova l’asserto.

Proposizione 9.3 I piani polari dei punti di una retta r formano un fascio di asse una retta
r’ che dicesi coniugata della retta r. Le rette r ed r’ sono ognuna il luogo dei poli dei piani per
l’altra.
Dimostrazione. Siano A e B due punti distinti della retta r . I piani polari πA e πB
sono distinti e quindi si intersecano in una retta r’ . Siano C e D due punti distinti della retta
r’. Poiché C e D appartengono ad r’ = πA ∩ πB per il teorema di reciprocità A e B
appartengono ai piani polari πA e πB . Si ha quindi r = πC ∩ πD e l’ asserto segue tenendo conto
del teorema di reciprocità.

Dalla proposizione ora provata segue che :

Proposizione 9.4 I piani polari di tre punti A , B , C non allineati formano una stella con
centro il polo del piano determinato dai punti A , B , C .

Possiamo ora fornire una descrizione geometrica del piano polare di un punto p.

Se il punto P è un punto della quadrica il piano polare di P è il piano tangente in P . Se il


punto P non appartiene alla quadrica il piano polare non passa per P ed è secante la quadrica . Detta
Г la conica non degenere comune a Q e πp si ha quanto segue. Per ogni punto y di Г possiamo
considerare il piano tangente πy. Poiché y appartiene a Г e quindi a πp , per il teorema di
reciprocità, πy passa per p e quindi la retta yp è tangente .
Viceversa sia t una retta per P e tangente a Q nel punto y. Poiché P sta sul piano polare
di y , per reciprocità il punto y sta sul piano polare di P ed è quindi un punto di Г .

La conica Г è quindi il luogo dei punti di contatto delle rette tangenti che si possono
condurre da p a Q ed il piano πp è il piano che contiene tali punti.

10. Centro e piani diametrali.

In questo numero la quadrica Q è non degenere e reale ed è rappresentata nel riferimento


168

reale ortogonale monometrico scelto da :

∑a
i, j
ij xi x j = 0 ( aij = aji )

Si chiama centro della quadrica il polo del piano improprio. Se la quadrica è un paraboloide il
piano improprio è tangente ed allora il centro è un punto improprio e coincide col punto di contatto
che il piano improprio ha con Q. Se la quadrica è un ellissoide o un iperboloide allora il piano
improprio è secante Q e quindi non contiene il suo polo. Nel caso dell’ellissoide e dell’iperboloide
il centro è quindi un punto proprio.
Per determinare le coordinate del centro si può far uso del teorema di reciprocità e della
proposizione 9.4. Pertanto i piani polari dei punti impropri e non allineati (1,0,0,0) (0,1,0,0)
(0,0,1,0) formano una stella di piani con centro il polo del piano improprio.
Pertanto le coordinate del centro si ottengono attraverso la soluzione del seguente sistema
omogeneo:
⎧ a 11 x 1 + a 12 x 2 + a 13 x 3 + a 14 x 4 = 0

⎨ a 21 x 1 + a 22 x 2 + a 23 x 3 + a 24 x 4 = 0
⎪a x +a x + a 33 x 3 + a 34 x 4 = 0
⎩ 31 1 32 2

che può ottenersi attraverso il calcolo dei minori d’ordine tre e presi a segni alterni della matrice

⎛ a 11 a 12 a 13 a 14 ⎞
⎜ ⎟
⎜ a 21 a 22 a 23 a 24 ⎟
⎜a a a a ⎟
⎝ 31 32 33 34 ⎠

⎛ a 11 a 12 a 13 ⎞
⎜ ⎟
dei suoi coefficienti. Ne segue che se det A44 = det ⎜ a 21 a 22 a 23 ⎟ =0 il centro è improprio e
⎜a a a ⎟
⎝ 31 32 33 ⎠
quindi si tratta di un paraboloide.

Se detA44 ≠ 0 allora la quadrica è un ellissoide o un iperboloide.

Si consideri nello spazio una retta reale r e sia δ il suo punto improprio che supponiamo non
appartenga alla quadrica. Il piano polare π δ di tale punto è reale ed è chiamato piano diametrale
169

coniugato alla direzione δ . Quando il piano polare π δ risulta ortogonale alla retta r esso è
detto piano assiale.
Per la ricerca degli eventuali piani assiali procediamo al seguente modo. Consideriamo un punto
reale ed improprio ( λ , µ , ν , 0 ) . Il piano polare di tale punto è :

(a11 λ + a12 µ + a13 ν ) x1 +(a21 λ + a22 µ + a23 ν ) x2 + (a31 λ + a32 µ + a33 ν ) x3 +

+ (a41 λ + a42 µ + a43 ν ) x4 = 0

Tale piano è ortogonale alla direzione considerata se esiste ρ ≠ 0 per cui risulti :

a11 λ + a12 µ + a13 ν = ρ λ

a21 λ + a22 µ + a23 ν = ρ µ

a31 λ + a32 µ + a33 ν = ρ ν

o equivalentemente :

(a11 - ρ ) λ + a12 µ + a13 ν = 0

a21 λ + ( a22 - ρ ) µ + a23 ν = 0

a31 λ + a32 µ + (a33 - ρ ) ν = 0

questo sistema ha soluzioni non nulle se risulta :

⎛ a 11 − ρ a 12 a 13 ⎞
⎜ ⎟
det ⎜ a 21 a 22 − ρ a 23 ⎟ = 0
⎜a a 32 a 33 − ρ ⎟⎠
⎝ 31

⎛ a 11 a 12 a 13 ⎞
⎜ ⎟
Poiché la matrice A44 = ⎜ a 21 a 22 a 23 ⎟ è simmetrica e reale il polinomio caratteristico
⎜a a a ⎟
⎝ 31 32 33 ⎠
det ( A44 - I ρ ) = 0 ha tre soluzioni reali, determinate le quali , si possono poi determinare le

direzioni ( λ , µ , ν , 0 ) cercate.
Perché tanta attenzione al centro ed ai piani assiali ? Vediamo .
170

Il centro della quadrica quando esso è un punto proprio risulta centro di simmetria per la
quadrica.
Infatti supposto che il centro sia proprio disponiamo il riferimento in modo che il centro
coincida con l’origine del riferimento. In tal modo il centro ha coordinate (0,0,0,1) e quindi il
sistema
⎧ a 11 x 1 + a 12 x 2 + a 13 x 3 + a 14 x 4 = 0

⎨ a 21 x 1 + a 22 x 2 + a 23 x 3 + a 24 x 4 = 0
⎪a x +a x + a 33 x 3 + a 34 x 4 = 0
⎩ 31 1 32 2

che fornisce le coordinate del centro deve essere soddisfatto dalla quaterna (0,0,0,1) .Ciò
comporta allora a14 = a24 = a34 = 0 e quindi nel riferimento scelto l’equazione della quadrica è :

a11x 2 + a22 y 2 + a33 z2 + a44 t2 + 2 a12 xy + 2a13 xz + 2 a23 yz = 0.

Tale equazione mostra che se un punto proprio di coordinate non omogenee ( x , y , z ) è punto della
quadrica anche il suo simmetrico ( -x . –y , -z ) rispetto all’origine è un punto della quadrica.

Sia δ una direzione reale e sia π il piano assiale coniugato a tale direzione.
Disponiamo il riferimento in modo che l’asse z abbia la direzione δ ed il piano xy sia il piano π
.Con tale scelta le coordinate di δ sono ( 0 , 0 , 1 , 0) e così π che è il suo piano polare è:

a31x + a32y + a33z + a34 t = 0

tale equazione deve essere la rappresentazione del piano xy che ha equazione z = 0 e quindi si ha
:
a31= a32 = a34 = 0

Nel riferimento scelto l’equazione della quadrica è allora (in coordinate non omogenee) :

a11x 2 + a22 y 2 + a33 z2 + a44 + 2 a12 xy + 2 a14 x + 2 a24y = 0.

Tale equazione mostra che se un punto proprio di coordinate (x, y, z) è un punto della quadrica
anche il suo simmetrico ( nella simmetria ortogonale di asse il piano π ) che ha coordinate
( x , y , -z) è anch’esso un punto della quadrica.
171

La nostra conclusione è che il centro se è un punto proprio è centro di simmetria ed i piani assiali
sono piani di simmetria per la quadrica.

Concludiamo con qualche semplice esercizio.

Si classifichino le quadriche rappresentate ( in coordinate non omogenee) da :

(a) Q : x2 - 4y2 + 2x -4z = 0

(b) Ω : -2y2 + 2xy - 4xz + 4yz = 0

Svolgimento (a) : l’equazione di Q in coordinate omogenee è x2 - 4y2 + 2xt -4zt = 0


e la matrice della quadrica Q è :

⎛1 0 0 1 ⎞
⎜ ⎟
⎜0 - 4 0 0⎟
A= ⎜
0 0 0 - 2⎟
⎜ ⎟
⎜1 0 - 2 0⎟
⎝ ⎠

Sii ha det A = 16 e quindi la quadrica è non degenere. La sua conica impropria è rappresentata
da:
⎧x 2 - 4y 2 + 2xt - 4zt = 0

⎩t = 0

che è degenere ed è costituita dalle due seguenti rette reali e distinte :

⎧x - 2y = 0 ⎧x + 2y = 0
r: ⎨ s: ⎨
⎩t = 0 ⎩t = 0

si conclude che la quadrica Q è un paraboloide a punti iperbolici.

Svolgimento (b) : l’equazione di Ω è -2y2 + 2xy - 4xz + 4yz = 0


e la matrice della quadrica Ω è :
172

⎛0 1 -2 0⎞
⎜ ⎟
⎜1 -2 2 0⎟
A= ⎜
-2 2 0 0⎟
⎜ ⎟
⎜0 0 0 0 ⎟⎠

Sii ha det A = 0 e quindi la quadrica è degenere. La quadrica possiede quindi punti doppi . Il
rango della matrice A è due in quanto risulta

⎛0 1 - 2 ⎞
⎜ ⎟
det ⎜ 1 - 2 2 ⎟ = 0
⎜- 2 2 0 ⎟
⎝ ⎠

Pertanto i punti doppi della quadrica Q sono i punti della retta rappresentata da :

⎧y - 2z = 0
r: ⎨
⎩x - 2y + 2z = 0

La quadrica è quindi unione di due piani passanti per la retta r . La retta s rappresentata da :

⎧x = 1
s : ⎨
⎩z = 0
interseca la quadrica nei due punti A = ( 1 , 0 , 0 ) e B = ( 1 , 1 , 0) . I piani che uniscono r con
A e B forniscono i due piani che compongono la nostra quadrica. Il piano y-2z = 0
manifestamente contiene r ed A . Determiniamo il piano per r e B.
Un qualunque piano per r è del tipo ( y -2z ) + k (x -2y + 2z ) = 0 ( al variare del parametro k)
Tale piano passa per il punto B se è k = 1. Pertanto l’altro piano è il piano x – y = 0.
Per controllare la correttezza del risultato trovato basta osservare che è :

-2y2 + 2xy - 4xz + 4yz = 2( y -2z )( x – y ).


173

Capitolo VII
Note di topologia generale

1. Spazi topologici.

Sia S un insieme non vuoto . Una famiglia A di parti di S i cui elementi sono chiamati
aperti è una topologia per S se essa verifica le seguenti proprietà :
174

1. Φ∈ A, S ∈ A

2. A ∈ A ed A’ ∈ A allora A ∩ A’ ∈ A

3. Per ogni famiglia { Ai } i ∈ I di aperti si ha ∪A i ∈A


i∈I

Si richiede quindi che :

il vuoto ed S siano aperti , che l’intersezione di un numero finito di aperti sia ancora un
aperto e che l’unione di un numero qualsiasi di aperti sia ancora un aperto.

La famiglia A i cui unici aperti siano il vuoto ed S è una topologia detta topologia banale.
La famiglia A i cui aperti siano tutti i sottoinsiemi di S è una topologia detta topologia
discreta.

A parte questi casi estremi , non sempre è facile la realizzazione di una famiglia A di parti di S
con le proprietà ora richieste per cui è utile la seguente:

Proposizione 1.1 Sia S un insieme e sia B una famiglia di parti di S che abbia le seguenti
proprietà :
a) B è un ricoprimento di S
b) l’intersezione non vuota di due elementi di B è unione di elementi di B.

La famiglia A di parti di S contenente il vuoto ed i sottoinsiemi che si possono ottenere


attraverso tutte le possibili unioni degli elementi di B è allora una topologia per S.

Dimostrazione. Per semplicità di esposizione precorrendo il risultato chiamiamo aperti gli


elementi di A .
Poiché B è un ricoprimento allora è S = ∪X e quindi S è un aperto . Siano A ed A’
X∈B

due aperti , elementi di A . Per definizione esistono due sottofamiglie F ed F’ di elementi


di B per cui risulta :
175

A= ∪X A’ = ∪Y
X∈F Y∈F'

Si ha allora .
A ∩ A’ = ( ∪ X ) ∩ ( ∪ Y ) = ∪ (X ∩ Y)
X∈F Y∈F' X, Y

Per la proprietà b) anche X ∩ Y è unione di elementi di B e così A ∩ A’ risultando


unione di elementi di B appartiene ad A e quindi è un aperto.
E’ evidente infine che per ogni famiglia { Ai } i ∈ I di aperti si ha ∪A i ∈A
i∈I

in quanto essendo ogni Ai una unione di elementi di B anche ∪A i risulta unione di


i∈I

elementi di B . Poiché anche il vuoto fa parte della famiglia A allora tale famiglia è , come
si voleva provare , una topologia per S.

La situazione favorevole descritta dalla proposizione ora provata si ha quando l’insieme S è


munito di una metrica , nozione di cui ora ci occupiamo.
Sia S un insieme non vuoto . Una metrica in S è una funzione

d : S x S → [ 0 , +∞ [

verificante le seguenti proprietà :

α . d ( x, y) = 0 se e solo se è x = y (proprietà di coincidenza )


β . d ( x, y) = d ( y, x) ( proprietà di simmetria )
γ . d ( x, y) + d ( y, z) ≥ d ( x, z) ( proprietà triangolare )

Chiameremo il numero reale non negativo d ( x, y) distanza di x da y. Se d è una metrica


in S la coppia ( S , d) è chiamato spazio metrico, ed S è detto il sostegno dello spazio
metrico.
Se ( S , d) è uno spazio metrico allora utilizzando la metrica d possiamo costruire
per S una topologia A e tale topologia si dice indotta dalla metrica d .
Vediamo come si procede.
Sia quindi ( S , d) uno spazio metrico. Siano y un elemento di S ed r un numero reale
positivo. Si chiama cerchio aperto di centro y e raggio r il seguente sottoinsieme
C(y , r) di S :
176

C(y , r) = { x ∈ S : d ( x, y) < r }

Poiché d(y , y) = 0 allora l’insieme C(y , r) non è vuoto in quanto y ∈ C(y , r). Sia ora B la
famiglia di tutti i cerchi aperti C(y , r) al variare di y in S ed r tra i numeri reali positivi.
Proveremo ora che la famiglia B verifica le proprietà a) e b) della proposizione 1.1 ed è
quindi in grado di generare una topologia. Per fare ciò è utile la seguente
Proposizione 1.2. Sia C = C(y , r) un cerchio aperto e sia z un suo punto . Esiste
un cerchio aperto C’ = C(z , r’) di centro z contenuto nel cerchio C.
Dimostrazione . Poiché z è un punto del cerchio C= C(y , r) si ha
d ( z , y) < r.
Sia r’ un numero positivo tale che risulti

(*) r’ < r - d ( z , y)

Proviamo che il cerchio aperto C’ con centro in z e raggio r’ è contenuto nel cerchio C. Sia
quindi x un punto di C’ e proviamo che è x appartiene a C. Si ha infatti , tenendo conto
di (*) e della proprietà triangolare ,

d ( x, y) ≤ d ( x, z) + d ( z , y) < r’ + d ( z , y) < r

Dalla proposizione ora provata segue che :


Proposizione 1.3 L’intersezione di due cerchi aperti se è non vuota è unione di
cerchi aperti.
Dimostrazione. Siano C e C’ due cerchi aperti ad intersezione non vuota. Sia x un
punto di C ∩ C’ . Per la proposizione 1.2 esiste un cerchio aperto I di centro x e raggio r
contenuto in C ed un cerchio aperto I ’ di centro x e raggio r’ contenuto in C’. Supposto ad
esempio r ≤ r’ si ha I ⊆ I’ e quindi I contiene x ed è contenuto in C ∩ C’ . L’ asserto
è così provato.
Abbiamo cosi provato che la famiglia B di tutti i cerchi aperti dello spazio metrico
( S , d ) verifica le proprietà a) e b) della proposizione 1.1.
Pertanto la famiglia Ad di parti di S costituita dal vuoto e da tutti i sottoinsiemi di S che siano
ciascuno una unione di cerchi aperti costituisce una topologia per S.
Tale topologia ”generata” dai cerchi aperti è detta topologia indotta dalla metrica. Tenendo
conto della proposizione 1.2 si ha facilmente la seguente caratterizzazione degli aperti di tale
177

topologia Ad .
Un sottoinsieme A di S è un aperto di tale topologia se e solo se esso ha la seguente proprietà
:

(**) Per ogni y di A esiste un cerchio aperto di centro y contenuto in A.

Analizzeremo in seguito molte proprietà importanti di tale topologia Ad .

E’ evidente che se ( S , d ) è uno spazio metrico allora ogni suo sottoinsieme X è a sua volta
uno spazio metrico quando lo si munisca della stessa metrica d pensata ristretta ad esso .

Un esempio importante di spazio metrico è il seguente .

Sia n un intero positivo e sia Rn lo spazio vettoriale delle n-ple ordinate di numeri
reali. Come abbiamo gia provato al n.8 cap.VII (fondamenti di geometria piana) si può
definire nello spazio Rn una distanza al seguente modo .
Siano x = ( x1, x2, …, xn ) ed y= ( y1, y2, …, yn ) due elementi di Rn . Si definisce
distanza euclidea di x da y il seguente numero reale

(+) d( x , y ) = (x 1 - y 1 ) 2 + (x 2 - y 2 ) 2 + .. + (x n - y n ) 2

Quando si pensa Rn munito di tale distanza euclidea, Rn è uno spazio metrico e la topologia
indotta da tale metrica euclidea è chiamata la topologia naturale di Rn

Quando è n = 1 siamo nel campo R dei numeri reali e la (+) diviene

d ( x, y ) = ‫ ׀‬x – y ‫׀‬

e così il cerchio aperto di centro y e raggio r è :

C ( y , r ) = { x ∈ R : d ( x, y ) < r } = { x ∈ R : ‫ ׀‬x – y ‫ < ׀‬r } =

= { x ∈ R : -r < x – y < r } = { x ∈ R : y - r < x < y + r }

l’intervallo aperto
] y-r , y+r [.
178

Se n = 2 ed è y = ( y1, y2 ) ed r è il raggio allora il cerchio aperto di centro y e


raggio r è , usando una rappresentazione piana di R2 attraverso l’uso di un riferimento
monometrico cartesiano, è davvero il cerchio racchiuso dalla circonferenza di centro y e
raggio r .

r
y

Se n=3 ed è y = ( y1, y2, y3 ) ed r è il raggio allora il cerchio aperto di centro y e raggio r


è , usando una rappresentazione di R3 attraverso l’uso di un riferimento monometrico
cartesiano, è la sfera aperta con centro in y e raggio r.

r
y

2. Chiusi di uno spazio topologico.

Sia (S ,A) uno spazio topologico . Come detto gli aperti elementi di A verificano le seguenti
179

proprietà :

1. Φ∈ A, S ∈ A

2. A ∈ A ed A’ ∈ A allora A ∩ A’ ∈ A

3. Per ogni famiglia { Ai } i ∈ I di aperti si ha ∪A i ∈A


i∈I

I complementari degli aperti vengono chiamati chiusi . Denotata con C la famiglia dei chiusi
di S si ha subito che la famiglia C ha le seguenti proprietà :

I. Φ ∈ C, S∈ C
II. C ∈ C ed C’ ∈ C allora C ∪ C’ ∈ C
III. Per ogni famiglia { Ci } i ∈ I di chiusi si ha ∩C i ∈C
i∈I

Esprimendo tali proprietà a parole : il vuoto ed S sono chiusi , l’unione di un numero finito di
chiusi è un chiuso e l’intersezione di un qualsiasi numero di chiusi è un chiuso.

E’ evidente che se C è una famiglia di parti di S con le proprietà I , II, III allora la
famiglia A dei complementari degli elementi di C verifica le proprietà 1, 2 , 3 e quindi
costituisce una topologia per S . Inoltre per lo spazio topologico ( S , A ) la famiglia C
diventa la famiglia dei chiusi.
Sia S uno spazio topologico e siano A e C le famiglie degli aperti e dei chiusi di S.
Utilizzando tali famiglie si possono definire le nozioni di interiore e di chiusura di un
sottoinsieme. Vediamo di che si tratta.
Sia X un sottoinsieme di S si definisce interno o interiore di X il più grande aperto
contenuto in X . Tale interiore si ottiene attraverso l’unione di tutti gli aperti contenuti in
°
X e viene indicato col simbolo X . Si ha quindi per definizione :
°
X = ∪A
A⊆X
A aperto

E’ facile controllare la seguente proprietà che caratterizza i sottoinsiemi aperti di S.


Proposizione 2.1 Un sottoinsieme A di S è aperto se e solo se coincide col suo
180

interiore.

° °
Tenendo conto che da X ⊆ Y segue X ⊆ Y si ha facilmente la seguente
proprietà :
° °
( X ∩ Y )° = X ∩ Y

Sia X un sottoinsieme di S si definisce chiusura di X il più piccolo chiuso


contenente X . Tale chiusura si ottiene attraverso l’intersezione di tutti gli chiusi

contenenti X e viene indicato col simbolo X . Si ha quindi per definizione :

X = ∩C
C ⊇X
C chiuso

E’ facile controllare la seguente proprietà che caratterizza i sottoinsiemi chiusi di S.

Proposizione 2.2 Un sottoinsieme C di S è chiuso se e solo se coincide con la sua


chiusura.

− −
Tenendo conto che da X ⊆ Y segue X ⊆ Y si ha facilmente la seguente
proprietà :
−−−−−−− − −
X∪ Y = X ∪ Y

Utilizzando la definizione non sempre è facile il calcolo della chiusura e


dell’interiore di un sottoinsieme assegnato. Un modo alternativo e a volte più agevole si
ottiene attraverso l’uso dei punti interni ad X o dei punti aderenti ad X. Vediamo di che si
tratta.

Per fare ciò ci serve però un concetto semplice ma fondamentale in topologia : il


concetto di intorno di un punto. Vediamo.

Sia quindi (S ,A) uno spazio topologico . Sia y un punto di S . Si definisce intorno
di y un qualunque sottoinsieme I contenente un aperto contenente y.
181

In simboli :

I ⊆ S intorno di y se e solo se esiste A ∈ A : y ∈ A ⊆ I.

Denoteremo col simbolo I(y) la famiglia di tutti gli intorni del punto y.

Per la definizione data è chiaro che un aperto che contenga y è un intorno di y.


Poiché l’intersezione di un numero finito di aperti è un aperto allora evidentemente
l’intersezione di un numero finito di intorni del punto y è anch’essa un intorno del punto y.

Nel seguito denoteremo con A(y) la famiglia di tutti gli aperti contenenti y.

Molto importante per il seguito è la seguente osservazione :

Una proprietà “p” è verificata in ogni intorno di y se e solo se essa è verificata in ogni
aperto che contiene y .

Per questa ragione quando dovremo verificare la validità di un certa proprietà utilizzeremo
anziché la famiglia I(y) la famiglia A(y) .

Più in generale una famiglia H(y) di intorni di y è detta sistema fondamentale d’


intorni per il punto y se in ogni intorno di y c’ è un intorno di y che faccia parte della
famiglia H(y) .

Evidentemente la famiglia A(y) costituisce per il punto y un sistema fondamentale


di intorni .

Utilizzando tale concetto anche l’osservazione fatta sopra può essere generalizzata al seguente
modo:

Una proprietà “p” è verificata in ogni intorno di y se e solo se essa è verificata in ogni
intorno di un sistema fondamentale di intorni di y .
182

Siamo ora in grado di introdurre la nozione di punto interno ad un sottoinsieme e di punto


aderente ad un sottoinsieme.

Un punto y di un sottoinsieme X si dice interno ad X se esiste un intorno di y contenuto in


X o equivalentemente se esiste un aperto contenente y e contenuto in X.

Poiché l’interiore di X è un aperto contenuto in X allora ogni punto che appartenga all’
interiore è punto interno ad X . Viceversa un punto che sia interno ad X appartiene ad un
aperto contenuto in X e quindi appartiene all’interiore di X. Pertanto l’interiore di X è
costituito da tutti e soli i punti interni ad X.

Un punto y di S si dice aderente al sottoinsieme X se ogni intorno di y contiene


almeno un punto di X o equivalentemente se ogni aperto contenente y contiene almeno un
punto di X.

Utilizzando tale concetto possiamo caratterizzare la chiusura di un sottoinsieme provando la


seguente :
Proposizione. 2.3 La chiusura di un sottoinsieme X coincide con l’insieme dei punti
aderenti ad X.
Dimostrazione. Proveremo l’asserto mostrando che sono equivalenti le seguenti
affermazioni :

i) y non appartiene alla chiusura di X


ii) y non è aderente ad X.

Proviamo che i) implica ii).



Se y ∉ X = ∩C
C ⊇X
allora esiste un chiuso Co contenente X cui y non appartiene . Detto

Ao l’aperto S - Co si ha y ∈ Ao ed inoltre è
Ao ∩ X = Φ e questo prova che y non è aderente ad X.

Proviamo che ii) implica i).


Se y non è aderente ad X esiste un aperto Ao contenente y e disgiunto da X. Il chiuso
Co = S - Ao contiene X e non contiene y . Pertanto y non appartiene alla chiusura di X.
183

Un’altra caratterizzazione della chiusura di un sottoinsieme X si ottiene attraverso l’uso della


nozione di punto di accumulazione. Vediamo.

Un punto y di S si dice d’accumulazione per il sottoinsieme X se in ogni intorno di


y c’è almeno un punto di X diverso da y o equivalentemente se in ogni aperto contenente y
c’è almeno un punto di X diverso da y.

L’insieme di tutti i punti di accumulazione per il sottoinsieme X è chiamato il


derivato di X ed è indicato con il simbolo D(X).

E’ evidente che i punti di accumulazione per X sono aderenti ad X ed è altresì evidente che
un punto aderente ad X e che non faccia parte di X è d’accumulazione per X. Pertanto si ha
la seguente eguaglianza :


X = X ∪ D(X)

la quale fornisce un’altra caratterizzazione della chiusura di X.

Un punto aderente ad X ed al complementare di X è detto di frontiera per X.


L’ insieme dei punti di frontiera viene denotato con Fr(X) e viene chiamato la
frontiera di X. Si ha facilmente la seguente eguaglianza :

X = X ∪ Fr(X)

la quale fornisce un’altra caratterizzazione della chiusura di X.

3. Funzioni continue.
Un isomorfismo tra due spazi topologici (S ,A) ed (S’ ,A ‘) è una applicazione
f : S → S’

biettiva tra i sostegni S ed S’ che con la sua inversa trasforma gli aperti dell’uno negli aperti
dell’altro e cioè abbia le seguenti due proprietà :
184

j) f (A) ∈ A ‘ per ogni aperto A di S


jj) f-1(A’) ∈ A per ogni aperto A’ di S’.

Un isomorfismo tra due spazi topologici viene anche chiamato omeomorfismo.

Se (S , A ) è uno spazio topologico . Indichiamo con Ω (S) l’insieme di tutti i suoi

omeomorfismi . Rispetto alla composizione di applicazioni l’insieme Ω (S) è un gruppo detto


gruppo strutturale dello spazio topologico (S , A ) .
Una proprietà “p” di una parte Y di S si dice topologica se per ogni omeomorfismo f di
S anche f(Y) ha la proprietà “p” .
Se ciò accade si dice che la proprietà “p” è invariante per omeomorfismi.
Lo studio dello spazio topologico (S , A ) consiste nella ricerca delle proprietà topologiche
delle figure di S .

Una applicazione

f : S → S’

tra due spazi topologici (S ,A) ed (S’ ,A ‘) è detta continua se

le controimmagini degli aperti di S’ sono aperti di S .

In simboli se per ogni aperto A’ di S’ risulta aperto il sottoinsieme di S

f-1(A’) = { x ∈ S : f (x ) ∈ A’ }

Un omeomorfismo tra due spazi topologici (S ,A) ed (S’ ,A ‘) è quindi una funzione biettiva
tra i sostegni che risulti continua insieme alla sua inversa.
C’è una nozione di continuità in un punto ( continuità locale ) che è connessa alla nozione di
continuità globale ora data . Vediamo.

Siano (S ,A) ed (S’ ,A ‘) due spazi topologici e sia

f : S → S’
185

una funzione di S in S’ .
Sia xo un punto di S e sia yo = f(xo) il suo trasformato . La funzione f si dice continua nel
punto xo se

C1) per ogni intorno I’ di yo esiste un intorno I di xo tale che risulti :


f ( I ) ⊆ I’

E’ come dire :

“ punti vicini ad yo provengono da punti vicini ad xo .”

La proprietà C1) è ovviamente equivalente alla seguente proprietà :

C2) Per ogni aperto A’ contenente yo esiste un aperto A contenente xo per cui si abbia :
f(A) ⊆ A’
o ancora

C3) la controimmagine di un intorno di yo è un intorno di xo .

C4) la controimmagine di ogni aperto A’ contenente yo è un intorno di xo .

Le due nozioni date , di continuità locale e globale , sono connesse tra loro come mostra la
seguente :

Proposizione 3.1. Siano (S ,A) ed (S’ ,A ‘) due spazi topologici . Una funzione
f: S → S’
di S in S’ è continua se e solo se essa è continua in ogni punto di S.
Dimostrazione. Supponiamo che f sia continua e proviamo che è continua in ogni punto di
S. Sia xo un punto qualsiasi di S e sia yo = f(xo) il suo trasformato. Poiché f è continua la
controimmagine di un aperto A’ contenente yo è un aperto e tale aperto contiene xo e quindi è un
intorno di xo . Vale quindi la proprietà c4) e così la funzione f è continua in xo .
Viceversa supponiamo che f sia continua in ogni punto di S e proviamo che è continua . Sia
A’ un qualsiasi aperto di S’ e sia A = f-1(A’) la sua
186

controimmagine. Supposto A non vuoto , per provare che A è aperto è sufficiente provare che ogni
suo punto è interno. Sia quindi xo un punto di A e sia yo = f(xo) il suo trasformato.
Poiché A = f-1(A’) allora è yo ∈ A’ e poiché f è continua in xo per la proprietà c4) la sua
controimmagine che è A è intorno di xo.

Le proposizioni che seguono forniscono delle condizioni necessarie e sufficienti affinché


una assegnata funzione tra due spazi topologici sia continua.

Proposizione 3.2 Una funzione f : S → S’ tra due spazi topologici (S ,A) ed


(S’ ,A ‘) è continua se e solo se la controimmagine di un chiuso di S’ è un chiuso di S.
Dimostrazione. Sia f continua e sia C’ un chiuso di S’. Sia A’ l’aperto di S’ per cui è
C’ = S’ – A’. Si ha f-1 ( C’) = f-1 ( S’ – A’) = S - f-1 ( A’).
Poichè f è continua si ha che f-1 ( A’) è un aperto di S e così f-1 ( C’) è un chiuso come si
voleva provare.
Viceversa supponiamo che la controimmagine di un chiuso sia un chiuso e proviamo che f è
continua. Occorre quindi provare che se A’ è un aperto di S’ allora
f-1 ( A’) è un aperto di S . Infatti da
S - f-1 ( A’) = f-1 ( S’ – A’)
e dall’ipotesi fatta segue che S - f-1 ( A’) è un chiuso e conseguentemente f-1 ( A’) è un aperto.

Proposizione 3.3 Una funzione f : S → S’ tra due spazi topologici (S ,A) ed (S’ ,A ‘) è
continua se e solo se trasforma punti aderenti ad un sottoinsieme X in punti aderenti al
sottoinsieme f(X).
Dimostrazione. Supponiamo f sia continua e sia xo un punto aderente al sottoinsieme X. Sia
yo = f(xo) il trasformato di xo e proviamo che yo è aderente ad f(X). Occorre quindi provare che in
ogni aperto A’ contenente yo c’è almeno un elemento di f(X). Poiché f è continua nel punto xo , in
corrispondenza dell’aperto A’ intorno di yo , c’è un aperto A contenente xo tale che f(A) ⊆ A’ .
Poiché xo è aderente ad X nell’intorno A di xo c’è almeno un punto x di X . Si ha allora che f(x)
appartiene ad A’ e ad f(X).
--- ------
Viceversa supponiamo che risulti f ( X ) ⊆ f ( X) per ogni sottoinsieme X .
Sia C’ un chiuso di S’ e sia C = f-1(C’) . Si ha f(C) ⊆ C’ da cui , essendo C’ chiuso,
------ --- ------ --- ---
f ( C) ⊆ C’ . Si ha allora f ( C ) ⊆ f ( C) ⊆ C’ e così è C ⊆ f-1(C’)= C. Pertanto è C = C il

che prova che C è un chiuso . Avendo provato che la controimmagine di un chiuso è un chiuso la
187

funzione è continua.

Al fine di individuare un’altra importante proprietà delle funzioni continue ci è utile


richiamare la nozione di successione convergente.
Sia ( S , A ) uno spazio topologico e sia l un punto di S. Una successione
x1, x2,…,xn ,…. di elementi di S è convergente ad l se
per ogni intorno I di l esiste un intero m tale risulti xn ∈ I per ogni n ≥ m.

o equivalentemente

per ogni aperto A contenente l esiste un intero m tale risulti xn ∈ A per ogni
n ≥ m.

L’elemento l cui la successione converge è anche detto limite della successione. Non sempre una
successione è convergente e non sempre il limite quando esiste è unico. Si ha unicità del limite se lo
spazio topologico è separato o di Hausdorff cioè gode della seguente proprietà :

H : Per ogni coppia di punti distinti x ed y esistono due intorni I ed I’ di x ed y tra loro disgiunti.

o equivalentemente

H : Per ogni coppia di punti distinti x ed y esistono due aperti A ed A’ contenenti il primo x ed il
secondo y tra loro disgiunti.

Possiamo infatti ora provare la seguente


Proposizione 3.4 Sia (S, A ) uno spazio topologico di Hausdorff. Una successione x1, x2,…,xn
,…. di elementi di S che sia convergente ammette un unico limite.
Dimostrazione. Supponiamo per assurdo che la successione x1, x2,…,xn ,…. ammetta due
limiti l ed l’ distinti tra loro. Siano I ed I’ due intorni di l ed l’ disgiunti tra loro. Poiché l è
limite della successione x1, x2,…,xn ,….

esiste un intero m tale che risulti xn ∈ I per ogni n ≥ m.


188

Poiché anche l’ è limite della successione x1, x2,…,xn ,….

esiste un intero m’ tale che risulti xn ∈ I’ per ogni n ≥ m’.

Si ha allora che xn ∈ I ∩ I’ per ogni n ≥ max { m , m’} , il che contraddice il


fatto che I ed I’ siano disgiunti.

Un’ altra importante proprietà delle funzioni continue è espressa dalla seguente
Proposizione 3.5 Una funzione continua f : S → S’ tra due spazi topologici (S ,A) ed
(S’ ,A ‘) trasforma una successione convergente in una successione convergente.
Dimostrazione. Sia x1, x2,…,xn ,…. una successione di elementi di S convergente ad xo .
Proviamo che la successione corrispondente
f ( x1), f ( x2),…, f ( xn) ,….
converge al punto f(xo). Sia A’ un aperto contenente f(xo). Poiché f è continua in xo esiste un
aperto A contenente xo tale che risulti f( A ) ⊆ A’. Ma poiché la successione x1, x2,…,xn ,….
ha per limite xo ed A è un intorno di tale punto si ha che
esiste un intero m tale che risulti xn ∈ A per ogni n ≥ m.
Ma allora per ogni n ≥ m risulta f ( xn) ∈ f( A ) ⊆ A’ e ciò prova che la successione f ( x1), f (
x2),…, f ( xn) ,…. ha per limite f(xo).

Concludiamo questo numero provando alcune semplici proprietà valide in uno spazio
topologico di Hausdorff .

Proposizione 3.4 Ogni punto di uno spazio topologico (S, A ) di Hausdorff è chiuso.
Dimostrazione. Sia y un punto di S e sia z un punto distinto da y e cioè un punto del
complementare di y . Poiché lo spazio è di Hausdorff esiste un aperto A contenente z e non y .
L’aperto A è contenuto in S - y e ciò prova che z è interno ad S - y.
Ogni punto di S - y è interno e quindi S - y è un aperto il che prova che y è un chiuso.

Proposizione 3.5 Sia (S, A ) uno spazio topologico di Hausdorff i cui aperti non vuoti siano
infiniti. Sia y un punto di accumulazione per il sottoinsieme X. In ogni intorno del punto y ci sono
allora infiniti punti di X diversi da y.
Dimostrazione. Possiamo ovviamente limitarci a verificare la proprietà in un aperto A che
189

contenga y . Poiché y è d’accumulazione per X nell’aperto A c’è un punto x1 di X diverso da y.


Poiché x1 è un chiuso l’insieme
A1 = A – x1 = A ∩ (S – x1)
è un aperto che contiene y. Poiché y è d’accumulazione per X nell’aperto A1 c’è un punto x2 di X
diverso da y e però esso è distinto anche da x1.
Posto
A2 = A - {x1 , x2} = A ∩ (S – {x1 , x2})
Essendo {x1 , x2} un chiuso l’insieme A2 è un aperto e contiene il punto y . Pertanto poiché y è
d’accumulazione per X nell’aperto A2 c’è un puno x3 di X diverso da y e che risulterà però distinto
anche da x1 e x2 .
Procedendo induttivamente si costruisce nell’ aperto A una successione
x1,x2, ….,xn …di punti di X distinti tra loro e distinti da y e l’asserto è così provato.
Di una certa importanza è la seguente

Proposizione 3.6 Siano f e g due funzioni continue di S in T . Se T è di Hausdorff ed f e g


coincidono su un sottoinsieme D denso di S allora f e g coincidono su tutto S.

Dimostrazione. Supponiamo per assurdo esista y di S per cui sia f(y) ≠ g(y). Poiché T è
di Hausdorff esistono due intorni U’ e V’ di f(y) e g(y) tra loro disgiunti. Poiché f e g sono
continue nel punto y esistono due intorni U e V di y tali che risulti f(U) ⊆ U’ e g(V) ⊆ V’. Per
la densità di D nell’intorno U ∩ V di y c’è almeno un punto d di D, Risulta f(d) ∈ U’ e g(d)
∈ V’
e quindi è f(d) ≠ g(d) essendo U’ e V’ disgiunti , mentre sull’insieme D è f = g.

4. Basi ed assiomi di numerabilità.Spazi separabili.

In questo numero daremo alcune nozioni topologiche utili per il seguito.


Sia (S ,A) uno spazio topologico . Una famiglia B di aperti di S è detta base per la topologia A
se ogni aperto non vuoto di S è unione di elementi di B .
Essendo S aperto la famiglia B è un ricoprimento di S. Inoltre l’intersezione di due elementi di B ,
essendo tale intersezione un aperto, è unione di elementi di B.
Lo spazio topologico è detto a base numerabile se ammette una base che sia finita o numerabile.

Uno spazio topologico è detto localmente a base numerabile se ogni suo punto ha un sistema
fondamentale di intorni che sia finito o numerabile.
190

Infine uno spazio topologico si dice separabile se possiede un sottoinsieme D finito o


numerabile che sia denso in S cioè tale che risulti
−−
D = S.

La proposizione che segue mostra che le nozioni ora date sono connesse tra loro.

Proposizione 4.1 Uno spazio topologico ( S ,A ) che sia a base numerabile è anche
localmente a base numerabile e separabile.
Dimostrazione. Denotiamo con B = {Bn }n ∈ N la base numerabile che lo spazio possiede.
Cominciamo a provare che lo spazio è localmente a base numerabile. Sia quindi y un suo punto e
proviamo che per tale punto esiste un sistema fondamentale di intorni finito o numerabile. Poiché B
è un ricoprimento di S ci sono elementi di B che contengono y . Indichiamo tale famiglia con
B y = { B ∈ B : y ∈ B}.
Tale famiglia di aperti è una famiglia di intorni di y ed è fondamentale oltre ad essere
ovviamente finita o numerabile. Infatti sia A un aperto che contenga y . Poiché B è una base
esiste una sua sottofamiglia F di B tale che risulti
A= ∪B
B∈F

Poiché y appartiene ad A allora esso appartiene ad un elemento Bo della famiglia F . Poiché


Bo ∈ B y e Bo è contenuto in A si ha l’asserto.
Proviamo ora che lo spazio è separabile. Facendo uso dell’assioma della scelta scegliamo un
elemento xn in ogni aperto non vuoto Bn della base B .
Indichiamo con D l’insieme degli elementi xn selezionati. L’insieme D è ovviamente
finito o numerabile ed è denso in S come ora proveremo. Sia y un punto di S e sia A un aperto
contenente y . Poiché A è aperto e B è una base l’aperto A è unione di elementi di B . In ognuno
di tali elementi è stato selezionato un elemento
di D quindi nell’aperto A ci sono elementi di D . Pertanto y è aderente a D e si ha quindi l’asserto.

5. Proprietà della topologia indotta da una metrica .

Sia ( S , d ) uno spazio metrico con metrica d. Abbiamo già visto che la metrica d consente di
introdurre in S una topologia Ad che viene detta indotta dalla metrica ed i cui aperti sono le unioni
191

di cerchi aperti. Vogliamo ora illustrare alcune importanti proprietà di tale topologia Ad .
Proposizione 5.1 Lo spazio topologico ( S , Ad ) è di Hausdorff.
Dimostrazione. Siano x ed y due punti distinti e sia r un numero reale positivo minore di
d(x, y)
. I cerchi aperti C(x , r) e C(y, r ) sono disgiunti . Se infatti per assurdo esistesse un punto
2
z comune ai due cerchi avremmo, per la proprietà triangolare , :
d(x, y) d(x, y)
d(x,y) ≤ d(x,z) +d(z,y)<r + r< + =d(x,y)
2 2
e ciò è assurdo.
Proposizione 5.2 Lo spazio topologico ( S , Ad ) è localmente a base numerabile.
1
Dimostrazione. Denotiamo per ogni punto y di S con Cy = { C (y , )} la famiglia numerabile
n
1
di intorni del punto y costituita dai cerchi aperti di centro y e raggio . Mostrando che tale
n
famiglia è fondamentale si ha l’asserto. Sia A un aperto contenente y e sia C ( y , r ) un cerchio
1
aperto di centro y e raggio r contenuto in A. Fissato un intero m tale che risulti < r si ha
m
1
C (y , ) ⊆ C(y,r) ⊆ A
m
e l’ asserto è provato.
Proposizione 5.3 Lo spazio topologico ( S , Ad ) è a base numerabile se e solo se è separabile.
Dimostrazione. Abbiamo già visto che se lo spazio è a base numerabile esso è separabile.
Occorre quindi provare che se ( S , Ad ) è separabile esso è a base numerabile. Sia quindi D un
sottoinsieme finito o numerabile denso in S cioè tale che risulti ad esso aderente ogni punto di S.
Denotiamo con
B = { C (y , q) y ∈ D , q ∈ Q+}
la famiglia dei cerchi aperti aventi centro in un punto y di D e raggio razionale positivo. Tale
famiglia di aperti è ovviamente numerabile ed è come ora proveremo una base per la topologia Ad .
Per provare ciò è sufficiente mostrare che ogni cerchio aperto è unione di elementi di B . Sia
quindi C ( x , r ) un cerchio aperto e z un suo punto . Se mostreremo che z appartiene ad un
aperto di B tutto contenuto nel cerchio C ( x , r ) si avrà l’asserto.
Abbiamo già visto nella proposizione del n. che è possibile determinare un cerchio aperto
ρ
C( z , ρ ) contenuto nel cerchio C ( x , r ) . Consideriamo il cerchio C( z , ) In tale cerchio
2
192

ρ
aperto c’è un punto y di D in quanto z è aderente al sottoinsieme D . Poiché y ∈ C( z , ) si ha
2
:
ρ
d(y,z)<
2
Sia ora q un numero razionale tale che
ρ
d(y,z)< q <
2
Il cerchio C ( y , q ) appartiene alla famiglia B contiene z e come ora proveremo è contenuto nel
cerchio C( z , ρ ) . Sia quindi t un elemento del cerchio C ( y , q ) e proviamo che t appartiene al

cerchio C( z , ρ ) .
Si ha infatti, usando la proprietà triangolare ,

ρ ρ
d ( t , z ) ≤ d ( t , y) + d ( y , z ) < q + q < + =ρ
2 2
L’ asserto è così provato.

Poichè uno spazio metrico è di Hausdorff allora come già visto una successione x1, x2,…,xn
,…. di punti di S, se è convergente , ammette un unico limite.

In uno spazio metrico ha significato per una successione anche tale definizione.

Una successione x1, x2,…,xn ,…. di punti dello spazio metrico (S , d) è detta di Cauchy
se è soddisfatta la seguente proprietà :

Per ogni ε > 0 esiste un intero m tale per ogni p, q ≥ m , si ha


d (xp , xq) < ε

La proposizione che segue lega tra loro le due nozioni di convergenza e di essere di Cauchy
per una successione.

Proposizione 5.2 Una successione x1, x2,…,xn ,…. di punti dello spazio metrico (S , d) che
sia convergente è di Cauchy.
Dimostrazione. Sia l il limite della successione x1, x2,…,xn ,…. . Sia ε un numero positivo e
193

ε ε
sia C ( l , ) il cerchio aperto di centro l e raggio . Per definizione di limite esiste un intero
2 2
m tale che per ogni n ≥ m risulta

ε
xn ∈ C ( l , )
2
Pertanto per ogni p, q ≥ m si ha , utilizzando la proprietà triangolare,

ε ε
d (xp , xq) ≤ d (xp , l ) + d ( l , xq ) < + =ε
2 2
e ciò prova l’asserto.

Osserviamo esplicitamente che esistono spazi metrici dotati di successioni di Cauchy ma


non convergenti come mostra il seguente esempio . Sia R+ l’insieme dei numeri reali positivi
1
dotato della metrica euclidea d(a , b) = | a - b | .In tale spazio la successione xn = è di Cauchy
n
in quanto ,come successione di R è convergente, ma non è convergente in R+ risultando
convergente a zero in R.
Uno spazio metrico in cui ogni successione di Cauchy risulta convergente è detto completo.
È ben noto che l’insieme dei numeri reali dotato della metrica euclidea è uno spazio metrico
completo.
Pertanto per una successione di numeri reali x1, x2,…,xn ,…. vale la seguente equivalenza .
x1, x2,…,xn ,…. convergente se e solo se x1, x2,…,xn ,…. è di Cauchy.

La proposizione che segue caratterizza i sottospazi completi di uno spazio metrico completo.

Proposizione 5.3 Sia ( S , d ) uno spazio metrico completo . Un suo sottoinsieme X è


anch’esso completo se e solo se X è chiuso.
Dimostrazione. Supponiamo che lo spazio metrico ( X , d ) sia completo e proviamo che
esso è chiuso. Sia y un punto di aderenza per X. Per ogni n , sia xn un punto di X scelto nel
1
cerchio aperto C ( y , ) . La successione x1, x2,…,xn ,….converge manifestamente al punto y e
n
quindi è di Cauchy. Ma poiché è di Cauchy ed X è completo essa converge ad un punto di X . Per
l’unicità del limite y è un punto di X. Pertanto contenendo tutti punti aderenti l’insieme X è un
chiuso.
194

Viceversa supponiamo che X sia chiuso e mostriamo che esso è completo. Occorre quindi
che provare che ogni sua successione di Cauchy è convergente ad un punto di X. Sia quindi x1,
x2,…,xn ,… una successione di punti di X e supponiamo sia di Cauchy. Poiché lo spazio S è
completo la successione di Cauchy x1, x2,…,xn ,… converge ad un punto y . Per definizione di
limite in ogni intorno di y ci sono punti della successione e quindi di X . Pertanto y è aderente ad
X. Ma poiché X è chiuso il punto y appartiene ad X . Avendo provato che la successione di Cauchy
x1, x2,…,xn ,… converge ad un punto di X resta provato che lo spazio metrico X è completo.

Uno spazio topologico ( S ,A ) si dice metrizzabile se esiste una metrica d in S tale che
risulti Ad = A cioè che induce su S la topologia A .

6. Esempi di spazi topologici.

Al fine di controllare la comprensione delle nozioni finora date è opportuno fornire un pò


di esempi. Sia R l’insieme dei numeri reali .

Esempio 1.
Come già visto , assumendo come aperti di R , il vuoto , R e tutti gli intervalli del tipo

]a , b [ con a ,b ∈ R.

e tutte le loro unioni si ottiene una topologia (indotta dalla metrica) che denoteremo con N per
l’insieme R ( essa è detta topologia naturale di R ).

Esempio 2.
Assumendo come aperti di R , il vuoto , R e tutti gli intervalli del tipo

]- ∞ , a [ con a ∈ R.

si ottiene una topologia che denoteremo con S per l’insieme R ( detta delle semirette sinistre
aperte ).
Essendo evidente che l’intersezione di due aperti è un aperto basta controllare che l’unione di aperti
è un aperto. Sia quindi
Ai = ]- ∞ , ai [ con ai ∈ R, i ∈ I
195

una famiglia di aperti . Detto a = sup ai è facile verificare che risulta :

∪ ]- ∞ , ai [ = ]- ∞ , a [
i

e ciò prova che l’unione di aperti è un aperto. Pertanto la famiglia S è una topologia per l’insieme
R.

Esempio 3.
Assumendo come aperti di R , il vuoto , R e tutti gli intervalli del tipo

]a, ∞ [ con a ∈ R.

si ottiene una topologia che denoteremo con D per l’insieme R ( detta delle semirette destre aperte
).
Essendo evidente che l’intersezione di due aperti è un aperto basta controllare che l’unione di aperti
è un aperto. Sia quindi
Ai = ] ai , ∞ [ con ai ∈ R, i ∈ I
una famiglia di aperti . Detto a = inf ai è facile verificare che risulta :

∪ ] ai , ∞ [ = ]a, ∞ [
i

e ciò prova che l’unione di aperti è un aperto. Pertanto la famiglia D è una topologia per l’insieme
R.

Esempio 4.
Assumendo come aperti di R , il vuoto , R e tutti gli intervalli del tipo

] -a , a [ con a ∈ R , a > o

si ottiene , come è facile verificare , una topologia per l’insieme R che denoteremo con Ωo.

Esercizio 1. Si consideri il sottoinsieme X = [ 2 , 7 [ . Si calcoli la sua chiusura ed il suo


interiore in ognuno degli spazi topologici
196

(R, N), (R, S), (R, D), (R, Ω o) sopra descritti.

Esercizio 2. Si consideri ora la seguente successione di punti di R


1
xn = 3 + n∈N
n

Si determinino per essa i punti di convergenza negli spazi topologici

(R, N), (R, S), (R, D), (R, Ω o) sopra descritti.

Esercizio 3. Si consideri la funzione f : R → R che associa al numero x il numero


2
x +4.
Si assuma che il codominio sia munito della topologia D . Si stabilisca con quale topologia delle

quattro topologie N , S , D , Ω o sopra descritte , deve essere munito il dominio R per rendere
continua la nostra funzione.
Si faccia poi lo stesso controllo per la funzione g : R → R che associa al numero x
il numero x + 4 . Si dica se in qualche caso g è un isomorfismo.

Esercizio4. Si stabilisca quale spazio topologico tra questi

(R, N), (R, S), (R, D), (R, Ω o)


da noi descritti è di Hausdorff.

7. Sottospazi di uno spazio topologico.

Sia ( S , A ) uno spazio topologico. Sia Y un sottoinsieme di S . La famiglia

AY = { Y ∩ A , A ∈ A}

di parti di Y i cui elementi sono le intersezioni di Y con gli aperti di Sè evidentemente una
topologia per Y che viene detta indotta da S su Y.
Quando si munisca Y di tale topologia AY lo spazio topologico ( Y , AY ) è detto sottospazio
197

dello spazio topologico ( S , A ) .


Quando l’insieme Y è un aperto gli aperti dello spazio topologico ( Y , AY ) coincidono con gli
aperti di S contenuti in Y e quindi ogni aperto di Y è un aperto di S . Se Y non è aperto non tutti
i suoi aperti sono aperti di S.
Ad esempio sia R munito della topologia naturale N e sia Y = [ 3 , 7 ].
L’insieme ] 5 , 7 ] = [ 3 , 7 ] ∩ ] 5 , 9 [ è un aperto di Y ma non è aperto di N .
Per questa ragione non tutte le proprietà della topologia A vengono ereditate dalla topologia AY
.

8. Spazi topologici connessi.

In questo numero ci occuperemo di una importante nozione topologica : la connessione .


Vediamo di che si tratta. Sia ( S , A ) uno spazio topologico . Lo spazio topologico è detto
sconnesso se esistono due aperti A ed A’ non vuoti e disgiunti la cui unione sia S. Se S è
sconnesso esso è quindi l’unione di due suoi aperti non vuoti e disgiunti. Uno spazio topologico non
sconnesso è connesso.
In maniera “ intuitiva “ se è sconnesso si può spezzare se è connesso è
“ tutto un pezzo”.
E’ evidente che se ( S , A ) è sconnesso ed è
S = A ∪ A’

con A , A’ aperti non vuoti e disgiunti, allora si A che A’ sono sottoinsiemi propri di S che
risultano sia aperti che chiusi , risultando per essi :

A’ = S – A ed A = S – A’ .

Per questa ragione nella definizione data la parola aperto può essere sostituita con la parola
chiuso.
Così in modo equivalente lo spazio topologico ( S , A ) è sconnesso se esistono due
chiusi C e C’ non vuoti e disgiunti la cui unione sia S.

Ovviamente la presenza di un sottoinsieme A proprio di S che sia contemporaneamente


aperto e chiuso garantisce che S è sconnesso risultando
198

S = A ∪ (S–A)

Un sottoinsieme Y dello spazio topologico S è detto connesso se risulta connesso lo


spazio topologico ( Y , AY ).
E’ evidente ma utile la seguente proprietà :

(*) se S è sconnesso ed è l’unione dei due aperti non vuoti disgiunti A ed A’ allora è sconnesso
ogni sottoinsieme Y che intersechi sia A che A’ in quanto si ha :
Y = Y ∩ S = Y ∩ ( A ∪ A’) = (Y ∩ A ) ∪ (Y ∩ A’)

Per stabilire se uno spazio è connesso risulta molto utile la seguente


Proposizione 8.1 Uno spazio topologico ( S , A ) è connesso se e sole se
vale la seguente proprietà :

© per ogni coppia x , y di punti d stinti di S esiste un sottoinsieme Y connesso che


contiene i punti x ed y.

Dimostrazione . Se lo spazio è connesso la proprietà © è manifestamente soddisfatta in


quanto basta scegliere Y = S . Supponiamo quindi valga la proprietà © e proviamo che lo spazio è
connesso.
Per assurdo sia S sconnesso . Esistono allora due aperti A ed A’ non vuoti e disgiunti la
cui unione è S . Sia x un punto di A ( che è non vuoto ) ed y un punto di A’ (che è non vuoto) e
sia Y il sottoinsieme connesso che li contiene entrambi.
Si ha :
Y = Y ∩ S = Y ∩ ( A ∪ A’) = (Y ∩ A ) ∪ (Y ∩ A’)
Ora gli insiemi Y ∩ A , Y ∩ A’ sono non vuoti , il primo contiene x ed il secondo
y , sono disgiunti perché tali sono A ed A’ e sono aperti di Y .
Pertanto Y risulta sconnesso e ciò è assurdo.

Dalla proposizione ora provata segue la seguente :


Proposizione 8.2 Sia ( S ,A ) uno spazio topologico e siano Y1 ed Y2 due suoi sottoinsiemi
connessi. Se Y1 ed Y2 hanno intersezione non vuota allora anche Y1 ∪ Y2 è un sottoinsieme
connesso.
Dimostrazione. Supponiamo per assurdo che l’insieme T = Y1 ∪ Y2 sia sconnesso.
199

Esistono allora due aperti di S e siano A1 ed A2 tali che risulti :

(**) T = ( T ∩ A1 ) ∪ ( T ∩ A2 )

con ( T ∩ A1 ) e ( T ∩ A2 ) non vuoti e disgiunti.

Poiché è Y1 ⊆ T ed Y2 ⊆ T si ha :

(a) Y1 = Y1 ∩ T = Y1 ∩ [ ( T ∩ A1 ) ∪ ( T ∩ A2 )] = (Y1 ∩ A1 ) ∪ (Y1 ∩ A2 )

(b) Y2 = Y2 ∩ T = Y2 ∩ [ ( T ∩ A1 ) ∪ ( T ∩ A2 )] = (Y2 ∩ A1 ) ∪ (Y2 ∩ A2 )

Sia yo un punto comune ad Y1 ed Y2 . Il punto yo stante (a) appartiene ad


Y1 ∩ A1 o ad Y1 ∩ A2 . Supponiamo che appartenga ad Y1 ∩ A1 . Deve essere allora vuoto
Y1 ∩ A2 altrimenti Y1 sarebbe sconnesso.
Poiché yo appartiene anche ad Y2 ed ad A1 da (b) segue che è non vuoto
Y2 ∩ A1 e quindi deve essere vuoto Y2 ∩ A2 altrimenti Y2 sarebbe sconnesso. Ma se sono vuoti
Y1 ∩ A2 e Y2 ∩ A2 risulta anche vuoto T ∩ A2 mentre esso è non vuoto.
Supponendo che yo appartenga Y1 ∩ A2 avremmo, con eguale ragionamento, che sarebbe
vuoto T ∩ A1 il che è assurdo . L’ asserto è così provato.

Utile è anche la seguente :


Proposizione 8.3 Sia ( S ,A ) uno spazio topologico. La chiusura di un sottoinsieme Y
connesso è anch’essa un sottoinsieme connesso.
--
Dimostrazione. Supponiamo per assurdo che la chiusura Y di Y sia sconnessa. Esistono
allora due aperti di S e siano A1 ed A2 tali che risulti :

-- -- --
(i) Y = ( Y ∩ A1 ) ∪ ( Y ∩ A2 )
-- --
con ( Y ∩ A1 ) e ( Y ∩ A2 ) non vuoti e disgiunti . Da (i) segue :

--
(ii) Y = Y ∩ Y = (Y ∩ A1 ) ∪ ( Y ∩ A2 ).
200

-- --
Poiché ( Y ∩ A1 ) e ( Y ∩ A2 ) sono disgiunti tali risultano anche (Y ∩ A1 ) e
-- --
( Y ∩ A2 ). Poiché ( Y ∩ A1 ) e ( Y ∩ A2 ) sono non vuoti esistono due punti a1 ed a2 con a1 in
-- -- --
Y ∩ A1 ed a2 in Y ∩ A2 . Ma se a1 appartiene ad Y allora esso è aderente ad Y e poiché A1
è un aperto che contiene a1 allora in A1 c’è almeno un punto di Y . Abbiamo così provato che
Y ∩ A1 è non vuoto . Con la stessa argomentazione fatta sul punto a2 si prova che Y ∩ A2 è
non vuoto .Abbiamo così provato , stante (ii) che Y è sconnesso contro il supposto.

La proprietà di essere connesso è una proprietà topologica in quanto si conserva per


omeomorfismi. Più in generale sussiste la seguente

Proposizione 8.4 Sia f : S → S’ una funzione continua tra due spazi topologici (S ,A)
ed (S’ ,A ‘) . Se X è un sottoinsieme connesso di S allora f(X) è un sottoinsieme connesso di S’ .
Dimostrazione. Supponiamo per assurdo che f(X) sia sconnesso. Sia ha allora che esistono
due aperti di S’ e siano A 1' ed A '2 tali che risulti

f(X) = (f(X) ∩ A 1' ) ∪ ( f(X) ∩ A '2 )

con f(X) ∩ A 1' ed f(X) ∩ A '2 non vuoti e disgiunti. Denotiamo con

A1 = f -1 (A 1' ) ed A2 = f -1 (A '2 )

Gli insiemi A1 ed A2 sono aperti perché f è continua ed inoltre (X ∩ A1) e


(X ∩ A2) sono disgiunti perché tali risultano f(X) ∩ A 1' ed f(X) ∩ A '2 .

Sia f(x1) appartenente ad f(X) ∩ A 1' e sia f(x2) appartenente ad f(X) ∩ A '2 .
Quindi x1 appartiene ad X ∩ A1 ed x2 appartiene ad X ∩ A2 .
Da
f(X) = (f(X) ∩ A 1' ) ∪ ( f(X) ∩ A '2 )
segue, passando alla controimmagine, e chiamando T la controimmagine di f(X) :

T = (T ∩ A1) ∪ ( T ∩ A2 )

Poiché T contiene X si ha :

X = X ∩ T = X ∩ [(T ∩ A1) ∪ ( T ∩ A2 )] =
201

= (X ∩ T ∩ A1) ∪ (X ∩ T ∩ A2) = (X ∩ A1) ∪ (X ∩ A2)

e ciò prova che X è sconnesso in quanto i due aperti (X ∩ A1) e (X ∩ A2)


sono non vuoti e disgiunti.

Ogni spazio topologico ( S , A ) che sia sconnesso è unione di parti connesse.


Vediamo perché.
Sia quindi ( S , A ) uno spazio topologico. Nell’ insieme S definiamo la seguente
relazione ≈ :

due punti distinti x ed y li diciamo equivalenti se esiste un sottoinsieme Y connesso di S che li


contiene.

La proposizione 8.2 assicura che tale relazione è di equivalenza e pertanto essa ripartisce S
in classi d’equivalenza ognuna delle quali viene chiamata componente connessa.
Sia Y = [ y ] una componente connessa .Evidentemente Y è un connesso ed è il più grande
connesso che contiene il punto y . Poiché la chiusura di un connesso è un connesso allora l’insieme
Y risulta anche chiuso.
E’ evidente infine che se lo spazio è connesso se solo se c’ è una sola classe d’equivalenza e
quindi una sola componente connessa.

9. I connessi di ( R , N ).
In questo numero caratterizzeremo i sottoinsiemi connessi di R che penseremo munito della
topologia naturale.
Richiamiamo preliminarmente un risultato relativo ad una caratterizzazione degli intervalli
di R . Un sottoinsieme I di R è un intervallo se e solo se esso ha la seguente proprietà :
(j) per ogni coppia di punti distinti x ed y di I con x <y l’ intervallo chiuso [ x , y ] è
contenuto in I .
Proviamo ora la seguente importante :

Proposizione 9.1 Ogni intervallo chiuso [ a , b ] di R è connesso .


Dimostrazione. Supponiamo per assurdo che l’intervallo [ a , b ] sia sconnesso. Esistono
202

allora due chiusi C1 e C2 non vuoti e disgiunti tali che risulti


[ a , b ] = C1 ∪ C2
Poiché [ a , b ] è chiuso i chiusi C1 e C2 sono chiusi di R. Potendoli rinominare possiamo
supporre che il numero b appartenga a C2. Poiché C1 è parte di [ a , b ] esso è limitato e b è
un suo maggiorante. Sia c = sup C1. Essendo c l’estremo superiore si ha che :
per ogni numero ε positivo esiste un elemento di C1 tra c- ε e c
e ciò prova che c è aderente a C1. Poiché C1 è chiuso allora c appartiene a C1 .
Si ha c ≤ b . se fosse c=b allora C1 e C2 non sarebbero disgiunti. Quindi è
c < b e l’intervallo ] c , b ] è allora contenuto in C2. Ne segue che c è anche aderente a C2
Pertanto c è comune a C1 e C2 e ciò è assurdo essendo C1 e C2 disgiunti.
Siamo ora in grado di fornire una caratterizzazione dei sottoinsiemi connessi di R munito
della topologia naturale. Sussiste infatti la seguente :

Proposizione 9.2 I sottoinsiemi connessi di R sono tutti e soli gli intervalli.


Dimostrazione. Se I è un intervallo esso ha la proprietà (j) e quindi esso è connesso
quando si tenga conto delle proposizioni 8.1 e 9.1.
Viceversa supponiamo che I sia connesso e proviamo che esso è un intervallo.Se per assurdo
I non è un intervallo esistono due punti distinti a e b di I con a < b tali che [ a , b ] non sia
contenuto in I . Esiste allora z :
a<z<b e z ∉I.

Posto A1 = I ∩ ]- ∞ , z [ ed A2 = I ∩ ] z , + ∞ [ si ha
I = A1 ∪ A2
e ciò prova che I è sconnesso essendo A1 e A2 aperti non vuoti ( a ∈ A1 e b ∈ A2 ) e disgiunti.

10. I connessi di Rn dotato della topologia naturale.

Siano y = ( y1 , y2 ,…, yn) e z = ( z1 , z2 ,…, zn) due punti distinti di Rn.


Si definisce retta per i punti y e z l’insieme dei punti x (t) = ( x1(t) , x2(t) ,…, xn(t)) così descritto
:
x1(t) = y1 + t (z1 – y1)
x2(t) = y2 + t (z2 – y2)
….
xn(t) = yn + t (zn – yn)
203

dove il parametro t varia in R. Quando t varia tra 0 ed 1 il punto x (t) descrive il segmento di
estremi y e z . Poiché la funzione
f : t ∈ R → x (t) ∈ Rn
è una funzione continua, allora il segmento di estremi y e z è un connesso in quanto immagine
tramite f dell’intervallo [ 0 ,1 ] che è un connesso.
Assegnata in Rn una (n+1)-pla ordinata di punti (z0 , z1 ,…., zn) si chiama poligonale di vertici
(z0 , z1 ,…., zn) il sottoinsieme P di Rn che si ottiene come unione dei segmenti [ zi-1 , zi] , i = 1,2,
.., n.
Con un semplice ragionamento, tenendo conto della proposizione 8.2 ,si vede facilmente che ogni
poligonale è un connesso di Rn .
Possiamo allora dare la seguente definizione . Un sottoinsieme Y di Rn si dice connesso
per poligonali se per ogni coppia di punti distinti y e z di Y esiste una poligonale di estremi y e
z contenuta in Y.
Per la proposizione 7.1 quando si tenga conto che la poligonale è un connesso è immediato
che un sottoinsieme che risulti connesso per poligonale è connesso.
Ci sono però sottoinsiemi connessi che non sono connessi per poligonale. Ad esempio se
n=2 si consideri la circonferenza Г di centro (0,0) e raggio 1 i cui punti
( x , y) sono descrivibili al seguente modo
x(t) = cost
y(t) = sent
dove t varia nell’intervallo [ 0 , 2π]. La funzione

f: t ∈ [ 0 , 2π] → ( cost , sent ) ∈ R2

è continua e quindi Г= f ( [ 0 , 2π] ) è un connesso ma non è connesso per poligonale.


Proveremo ora che le due nozioni di essere connesso o connesso per poligonale sono
equivalenti per gli insiemi aperti di Rn .
Sussiste infatti la seguente :
Proposizione 10.1 Un sottoinsieme A aperto di Rn è connesso se e solo se esso è
connesso per poligonali.
Dimostrazione. Sia A un insieme aperto di Rn. Se A è connesso per poligonali allora come
già osservato esso è connesso . Supponiamo quindi che sia connesso e proviamo che esso è anche
connesso per poligonali. Supponiamo per assurdo che A non sia connesso per poligonali . Esistono
204

quindi due punti distinti y e z di A tali che ogni poligonale di estremi y e z non è contenuta
in A.
Denotiamo con A1 ed A2 i seguenti due sottoinsiemi di A .

A1 = { x ∈ A : esiste una poligonale di estremi y ed x contenuta in A }

A2 = A – A1={ x ∈ A : non esiste una poligonale di estremi y ed x contenuta in A }

I due sottoinsiemi A1 e A2 sono non vuoti in quanto A1 contiene y ed A2 contiene z.


Proveremo ora che essi sono entrambi aperti e quindi si avrà un assurdo perché ciò comporterà che
A è sconnesso.
Proviamo che A1 è aperto. Sia x un punto di A1. Poiché A è aperto esiste un cerchio
aperto C di centro x tutto contenuto in A. Per ogni punto t di tale cerchio il segmento di estremi x e
t è contenuto in C e quindi in A. Poiché x è congiungibile con y con una poligonale contenuta in A
allora anche t è congiungibile con y con una poligonale contenuta in A . Pertanto il cerchio aperto
C è tutto contenuto in A1 che è quindi un aperto essendo intorno di ogni suo punto.
Proviamo che A2 è aperto. Sia x un punto di A2. Poiché A è aperto esiste un cerchio
aperto C di centro x tutto contenuto in A. Per ogni punto t di tale cerchio il segmento di estremi x e
t è contenuto in C e quindi in A. Se t fosse congiungibile con y con una poligonale contenuta in A
allora anche x risulterebbe congiungibile con y con una poligonale contenuta in A . Pertanto il
cerchio aperto C è tutto contenuto in A2 che è quindi un aperto essendo intorno di ogni suo punto.

11 . Spazi topologici compatti.

Un’altra nozione toplogica importante è la compattezza. Vediamo di che si tratta.


Uno spazio topologico ( S , A ) è detto compatto se ha la seguente proprietà :

(k) da ogni ricoprimento di aperti di S si può estrarre un ricoprimento finito.

In simboli :

Per ogni famiglia { Ai } i ∈ I di aperti tali che S = ∪ Ai esiste F ⊆ I con F finito

tale che sia

S= ∪ Aj , j∈ F
205

Un sottoinsieme Y dello spazio topologico ( S , A ) è detto compatto se risulta compatto


lo spazio topologico ( Y , A Y ).
E’ facile riconoscere che il sottoinsieme Y è compatto se e solo se è verificata la seguente
proprietà :

(k’) Per ogni famiglia { Ai } i ∈ I di aperti tali che Y ⊆ ∪ Ai esiste F ⊆ I con F finito

tale che sia

Y⊆ ∪ Aj , j∈ F

La compattezza è una proprietà topologica in quanto si conserva per omeomorfismi . Più in


generale sussiste la seguente :

Proposizione 11.1 Sia f : S → S’ una funzione continua tra due spazi topologici (S ,A)
ed (S’ ,A ‘) . Se X è un sottoinsieme compatto di S allora f(X) è un sottoinsieme compatto di S’ .
Dimostrazione. Per provare che f(X) è compatto basterà verificare la proprietà (k’) . Sia
quindi { A 'i } i ∈ I una famiglia di aperti di S’ tali che

f(X) ⊆ ∪A '
i .

Da questa segue, passando alla controimmagine , e chiamando per ogni i ∈ I


Ai = f-1 (A 'i )

X ⊆ f-1 [f(X)] ⊆ ∪ Ai , i∈ I

Ora essendo f continua, per ogni i ∈ I l’insieme Ai è un aperto e poiché X è compatto


esiste F ⊆ I con F finito tale che sia

X⊆ ∪ Aj , j∈ F

Da questa segue

f(X) ⊆ f ( ∪ Aj )⊆ ∪ f(Aj ) ⊆ ∪A '


j , j∈ F

e si ha quindi l’asserto.
206

Sono molto utili le proprietà espresse dalle due proposizioni che seguono.

Proposizione 11.2 Sia (S ,A) uno spazio topologico compatto. Un sottoinsieme Y chiuso di
S risulta compatto.
Dimostrazione. Sia { Ai }, i ∈ I una famiglia di aperti tali che sia

Y⊆ ∪ Ai , i∈ I .

Poiché Y è chiuso S-Y è un aperto e si ha ovviamente :

S = (S–Y) ∪ ∪ Ai , i∈ I .

Poiché S è compatto esiste F ⊆ I con F finito tale che sia

S = (S–Y) ∪ ∪ Aj , j∈ F

e da questa segue che è

Y ⊆ ∪ Aj , j∈ F

e ciò prova che Y è compatto.

Non sempre però un sottoinsieme compatto di uno spazio topologico è chiuso.


Sia ad esempio ( R , S ) lo spazio topologico ottenuto considerando come aperti di R , il vuoto, R e
tutte le semirette ] ∞ , a [ , a ∈ R sinistre aperte . In tale spazio un sottoinsieme Y ridotto ad
un singolo punto è compatto ma non è chiuso.

Sussiste però la seguente :


Proposizione 11.3 Sia (S ,A) uno spazio topologico di Hausdorff. Un sottoinsieme Y
compatto di S risulta chiuso.
Dimostrazione. Per provare che Y è chiuso basterà controllare che S-Y è aperto. Sia
quindi y un punto di S – Y . Per ogni punto x di Y si ha ovviamente
x ≠ y e quindi , essendo lo spazio di Hausdorff , esistono due aperti Ax e V xy l’uno contenente

x e l’ altro contenente y tra loro disgiunti. Si ha ovviamente :

Y ⊆ ∪A x
x∈Y
207

Essendo Y compatto esistono x1 , x2 , …, xn in Y tali che sia :


Y ⊆ A x1 ∪ A X 2 ∪ … ∪ A X n

Siano : V 1y l’ aperto contenente y e disgiunto da A x1

V 2y l’ aperto contenente y e disgiunto da A X2

……
V ny l’ aperto contenente y e disgiunto da A X n

L’insieme Vy = V 1y ∩ V 2y ∩ …. ∩ V ny è quindi un aperto contenente y ed esso come ora

proveremo , è disgiunto da Y .
Infatti se esiste z in Y ∩ Vy allora z appartenendo a Vy appartiene ad ognuno degli
aperti V 1y , V 2y ,…. , V ny ed appartenendo ad Y ( Y ⊆ A x1 ∪ A X 2 ∪ … ∪ A Xn ) esiste

j tra 1 ed n tale che il punto z appartiene ad A Xj . Pertanto z appartiene a

V yj ∩ A Xj il che è assurdo perché V yj e A Xj sono disgiunti .

L’aperto Vy è quindi contenuto in S- Y e così l’insieme S-Y , essendo intorno di ogni suo
punto, è un aperto e si ha così l’asserto.

Significativa è la seguente proprietà degli spazi compatti .

Proposizione 11.4 Ogni sottoinsieme infinito di uno spazio topologico compatto ha almeno
un punto di accumulazione.
Dimostrazione. Sia (S ,A ) uno spazio topologico compatto e sia Y un sottoinsieme infinito
di S Supponiamo per assurdo che Y non abbia punti di accumulazione. Per ogni x di S è allora
possibile trovare un aperto Ax tale che sia Ax ∩ Y = ∅ oppure Ax ∩ Y = { x }.
Si ha ovviamente S = ∪A x è poiché S è compatto esistono n punti x1,x2,..,xn di S per cui sia

S = A x1 ∪ A X 2 ∪ … ∪ A X n .

Si ha :

Y = Y ∩ S = Y ∩ ( A x1 ∪ A X 2 ∪ … ∪ A X n ) =

= ( Y ∩ A x1 ) ∪ ( Y ∩ A X 2 ) ∪ … ∪ ( Y ∩ A X n )
208

da cui segue che Y è finito essendo , per ogni i= 1,..,n | Y ∩ A xi | ≤ 1 .

12. I compatti di R dotato della topologia naturale.


Indichiamo con N la topologia naturale di R . ricordiamo che gli aperti di tale topologia
sono il vuoto , R , gli intervalli aperti e tutte le loro unioni.
Così come abbiamo caratterizzato i sottoinsiemi connessi di ( R , N ) proviamo a
caratterizzare i suoi sottoinsiemi compatti.
Premettiamo alcune nozioni . Un sottoinsieme Y di R si dice limitato se è contenuto in un
intervallo chiuso [ a , b ]. Perverremo alla caratterizzazione dei sottoinsiemi compatti di R dopo
aver acquisito la seguente :

Proposizione 12.1 Ogni intervallo chiuso e limitato [ a , b ] è compatto.


Dimostrazione. Sia { Ai } , i ∈ I una famiglia di aperti di R la cui unione contiene
[ a , b ] . Sia T il seguente sottoinsieme di [ a , b ]

T = {x ∈ [ a , b ] : esiste F ⊆ I con F finito : [ a , x ] ⊆ ∪ Aj , j∈ F}

L’ insieme T è non vuoto perché a ∈ T e perverremo all’ asserto se mostreremo che b ∈ T.


Poiché T è una parte di [ a , b ] esso è limitato superiormente e quindi possiamo considerare il
suo estremo superiore che indichiamo con c .

Risulta quindi a ≤ c ≤ b . Poiché [a,b] ⊆ ∪ Ai allora esiste un aperto Ah della

famiglia { Ai } che contiene a . Esiste allora un intervallo aperto ] a - δ , a + δ [ di centro a


contenuto in Ah . Fanno allora parte di T tutti i punti di [ a , b ] ∩ [ a , a + δ [ .

Quindi è a < c . Poiché c appartiene ad [ a , b ] ⊆ ∪ Ai esiste un aperto Aj della famiglia

{ Ai } che contiene c . Conseguentemente esiste un intervallo aperto I δ = ] c - δ , c + δ [


contenuto in Aj . Essendo c = sup T esiste y ∈ T tale che sia c - δ < y ≤ c .
Quindi c ∈ T .
Se fosse per assurdo c < b ogni punto z maggiore di c e minore di b ed appartenente ad
I δ ∩ ] c , b] farebbe parte di T .

La proposizione che segue fornisce una caratterizzazione dei sottoinsiemi compatti di


209

( R , N ).
Proposizione 12.2 Un sottoinsieme Y di ( R , N ) è compatto se e solo se esso è chiuso e
limitato.
Dimostrazione. Supponiamo che Y sia chiuso e limitato e proviamo che è compatto .
Poiché è limitato esso è contenuto in un intervallo chiuso [ a , b ] . Ma tale intervallo è un compatto
e quindi Y essendo un suo chiuso ( perché [ a , b ] è chiuso ) è un compatto (cfr. Proposizione 11.2).
Viceversa supponiamo che Y sia compatto e proviamo che è chiuso e limitato. Poiché
( R , N ) è di Hausdorff allora Y essendo compatto è chiuso per la proposizione 11.3. Inoltre esso
è limitato.
Infatti sia y un punto di Y e sia R = { An } la famiglia di aperti così definita :
per ogni n intero sia
An = ] y –n , y + n [

E’ chiaro che è Y⊆ ∪ An , n ∈ N e poiché Y è compatto Y è contenuto nell’unione di un

numero finito A m1 , A m2 ,… , A mt di tali aperti.

Detto m = max { m1 ,m2,..,mt } si ha

Y ⊆ A m1 ∪ A m2 ∪ …. ∪ A m t = ] y –m, y + m [ ⊆ [ y –m, y + m ]

e ciò prova che Y è limitato.

Il teorema ora provato per i sottoinsiemi di R è un caso particolare di un teorema generale


che caratterizza i sottoinsiemi compatti di Rn dotato della topologia naturale. Proveremo infatti
successivamente con argomentazioni del tutto simili , che i sottoinsiemi compatti di Rn , dotato
della topologia naturale , sono tutti e soli i sottoinsiemi chiusi e limitati.
Per fare ciò dobbiamo però prima introdurre la nozione di spazio prodotto di due spazi
topologici.

13. Spazio topologico prodotto.

Siano ( S1 , A1 ) ed ( S2 , A’2 ) due spazi topologici. Sia S = S1 x S2 il prodotto


cartesiano degli insiemi S1 ed S2 . Gli elementi di S sono quindi le coppie ordinate ( x1, x2 ) con
210

x1 ∈ S1 ed x2 ∈ S2 . La famiglia B di parti di S i cui elementi sono tutti i possibili prodotti


A1 x A2 con A1 ∈ A1 ed A2 ∈ A’2 verifica , come facilmente si controlla , le proprietà a) e b)
della proposizione 1.1 ed è quindi in grado di generare una topologia A su S i cui aperti sono il
vuoto , e tutte le possibili unioni di elementi di B . La topologia A di S così ottenuta è detta la
topologia prodotto delle due topologie A1 ed A’2 e lo spazio topologico ( S , A ) cosi ottenuto è
chiamato spazio topologico prodotto.
Evidentemente la definizione di spazio prodotto può essere estesa al caso in cui i fattori
siano un numero finito maggiore o eguale a due.
Lo spazio prodotto “eredita” le eventuali buone proprietà topologiche dei due spazi che lo
hanno generato. Noi per brevità non mostreremo in dettaglio questo aspetto anche se molte
dimostrazioni sono piuttosto semplici. Ci limitiamo quindi solo ad elencare alcune proprietà dello
spazio prodotto.

a) le due funzioni naturali ( proiezioni )

p1 : ( x1, x2 ) ∈ S1 x S2 → x1 ∈ S1

p2 : ( x1, x2 ) ∈ S1 x S2 → x2 ∈ S2

che legano lo spazio prodotto ai singoli spazi sono entrambe continue.

b) lo spazio prodotto di due spazi di Hausdorff è di Hausdorff.


c) Lo spazio prodotto di due spazi a base numerabile è a base numerabile.

d) lo spazio prodotto di due spazi connessi è connesso.


e) lo spazio prodotto di due spazi compatti è compatto.

14. I compatti di Rn dotato della topologia naturale.

In questo numero forniremo alcune caratterizzazioni dei sottoinsiemi compatti di Rn


munito della topologia naturale. Preliminarmente diamo alcune definizioni.
Sia y = ( y1,y2,…,yn) un punto di Rn e siano d1,d2,…,d n n numeri reali positivi.
Si definisce n-rettangolo aperto di centro y e semidimensioni (d1,d2,…,d n )
211

il seguente sottoinsieme di Rn .

K (y ,(d1,d2,…,d n )) =] y1 – d1 , y1 + d1 [ x ] y2– d2 , y2 + d2 [ x.. … x ] yn – d n, yn + d n [

L’ n-rettangolo chiuso di centro y e semidimensioni (d1,d2,…,d n ) è


il seguente sottoinsieme di Rn .

K (y ,(d1,d2,…,d n )) = [ y1 – d1 , y1 + d1 ] x [y2– d2 , y2 + d2 ] x.. … x [ yn – d n, yn + d n]

Quando è d1=d2= …=d n = d l’n-rettangolo viene chiamato n-cubo di centro y e di lato


2d.
Non è difficile provare che fissato un cerchio aperto C ( y , r ) di centro y e raggio r si
possono trovare due n-rettangoli aperti di centro y ed opportune semidimensioni , uno
contenuto nel cerchio C e l’altro contenente il cerchio C.
Gli n-rettangoli aperti di Rn al pari dei cerchi aperti hanno le proprietà a) e b) della
proposizione 1.1 e quindi definiscono anch’essi una topologia di Rn . Per l’osservazione fatta
prima un sottoinsieme che sia unione di cerchi aperti è anche unione di n-rettangoli aperti e
viceversa. Pertanto gli n-rettangoli aperti ed i cerchi aperti definiscono la stessa topologia su Rn .
La topologia naturale di Rn che è quella indotta dalla metrica euclidea può quindi anche
pensarsi come la topologia che si ottiene su Rn quando si faccia il prodotto di ( R , N ) n –volte.
Gli n-rettangoli chiusi essendo prodotto di intervalli chiusi di R sono prodotto di spazi
compatti e sono quindi anch’essi compatti.

Un sottoinsieme Y di Rn è detto limitato se esso è contenuto in un n-rettangolo o


equivalentemente in un cerchio.

Siamo ora in grado di provare la seguente :

Proposizione 13.1 Un sottoinsieme Y di Rn è compatto se e solo se esso è chiuso e


limitato.
Dimostrazione. Supponiamo che Y sia chiuso e limitato . Poiché esso è limitato allora esso
è contenuto in n-rettangolo chiuso K . Ma K , come già osservato , è un compatto e quindi Y
essendo un suo chiuso è anch’esso compatto.
212

Viceversa supponiamo che Y sia compatto. Poiché lo spazio Rn è di Hausdorff Y è chiuso.


Proviamo che è anche limitato. Infatti sia y un punto di Y e sia
R = { Cn } n ∈ N , la famiglia di cerchi aperti con centro in y e raggio n intero positivo.

E’ chiaro che è Y⊆ ∪ Cn , n ∈ N e poiché Y è compatto Y è contenuto nell’unione di un

numero finito C m 1 , C m 2 ,… , C m t di tali cerchi aperti.

Detto m = max { m1 ,m2,..,mt } si ha

Y⊆ C m 1 ∪ C m 2 ∪ … ∪ C m t = Cm

e ciò prova che Y è limitato.


Un’altra caratterizzazione dei sottoinsiemi compatti di è fornita dalla seguente

Proposizione 14.2 Un sottoinsieme K di Rn è compatto se e solo se ogni suo sottoinsieme Y


infinito ha almeno un punto di accumulazione in K.
Dimostrazione. Supponiamo K compatto ( quindi chiuso e limitato ) e sia Y un suo
sottoinsieme infinito.Per la proposizione 11.4 , Y ha almeno un punto di accumulazione e sia z tale
punto. Il punto z essendo di accumulazione per Y è aderente ad Y e quindi anche a K che contiene
Y . Ma K è chiuso e quindi il punto z appartiene a K.
Supponiamo che ogni sottoinsieme infinito di K abbia un punto di accumulazione in K e
proviamo che K è compatto. Sarà ovviamente sufficiente provare che K è chiuso e limitato. Prima
di provare ciò ricordiamo un risultato che abbiamo già provato ( Proposizione 3.5 ) ma del quale
faremo ora uso :
Poiché Rn è di Hausdorff ed i suoi aperti sono infiniti allora:

se z è un punto di accumulazione per il sottoinsieme X , in ogni aperto che contenga z ci


sono infiniti punti di X.

Proviamo quindi che K è chiuso e limitato nell’ipotesi che ogni suo sottoinsieme infinito
abbia un punto di accumulazione in K .
Cominciamo a provare che è limitato. Supponiamo per assurdo che K non sia limitato .
Fissiamo un punto y di K . Per ogni intero n , consideriamo il cerchio aperto di centro y e raggio
n . poiché K non è limitato esiste almeno un punto xn di K fuori dal cerchio C ( y , n) . Si ha quindi

per ogni n , d ( xn , y ) > n


213

inoltre è sempre possibile fare in modo che risulti

d ( xn+1 , y ) > d ( xn , y ).

In tal modo gli elementi della successione x1,x2,..,xn,.. di punti di K sono tutti distinti tra loro e
costituiscono quindi un sottoinsieme X infinito di K . Il punto y non è d’accumulazione per X in
1
quanto nel cerchio aperto C( y, ) non c’è alcun punto di X .Sia z un punto di K diverso da y e
2
sia C ( z , r ) un cerchio aperto di centro z e raggio r . Scelto un intero m tale che sia
m > d(y,z) + r
il cerchio C ( y , m ) di centro y e raggio m contiene il cerchio C ( z , r ). Infatti per ogni punto t
di C ( z , r ) si ha :

d( t , y ) ≤ d(t , z ) + d(z , y ) < r + d(z , y ) < m

Poichè tutti i punti xm,xm+1,..,xn,.. della successione sono fuori dal cerchio C(y, m) nel
cerchio C ( z , r ) ci sono al più un numero finito di elementi di X e così z non è d’accumulazione
per X. Il sottoinsieme X di K è infinito ma è privo di punti di accumulazione in K e ciò è contro
l’ipotesi.
Proviamo ora che K è chiuso. Sia z un punto di accumulazione per K. Per ogni intero n
1
consideriamo il cerchio aperto di centro z e raggio . Poiché z è d’accumulazione esiste in tale
n
cerchio un punto xn di K distinto da z . Si ha quindi
1
per ogni n d( xn , z ) <
n
Possiamo inoltre fare in modo che risulti altresì

per ogni n d ( xn+1 , z) < d ( xn , z ).

In tal modo gli elementi della successione x1,x2,..,xn,.. di punti di K così costruita , sono
tutti distinti tra loro e costituiscono quindi un sottoinsieme X infinito di K. Poiché per ogni n, è
1
d( xn , z ) < allora la successione x1,x2,..,xn,.. converge manifestamente al punto z .
n
Poiché X è infinito, per l’ ipotesi in cui siamo , esso ammette un punto y di accumulazione
214

in K . Se proviamo che z=y allora z è un punto di K e quindi K è chiuso in quanto contiene i suoi
punti di accumulazione.
Supponiamo per assurdo che sia z ≠ y . Poiché lo spazio è di Hausdorff esistono due cerchi
aperti C ( z , r ) e C ( y , r’ ) di centro z ed y disgiunti tra loro.
Poiché x1,x2,..,xn,.. converge al punto z esiste un intero m tale che i punti
xm,xm+1,..,xn,.. siano tutti nel cerchio C ( z , r ) . Conseguentemente nel cerchio
C(y , r’) ci sono solo un numero finito di elementi di X e ciò contraddice la proprietà che abbiamo
richiamato all’inizio relativa ai punti di accumulazione di uno spazio di Hausdorff.

15. Spazio topologico quoziente.

Concludiamo queste note con la nozione di spazio topologico quoziente. Vediamo di che si
tratta. Sia ( S , A ) uno spazio topologico . Sia R una relazione d’equivalenza definita
nell’insieme S . Lo spazio quoziente S/ R è come è noto, l’insieme i cui elementi sono le
classi di equivalenza che R crea.
Possiamo munire l’insieme S/ R di una topologia al seguente modo. Indichiamo con p
la funzione che associa ad ogni punto x di S la classe d’equivalenza di x che indichiamo con
[ x ].

p: x ∈ S → [ x ] ∈ S/ R

Ora una classe d’equivalenza [ x ] è un elemento di S/ R ma è anche un sottoinsieme


di S quando si pensa agli elementi che di essa fanno parte cioè quando si faccia la sua
controimmagine tramite p . Selezioniamo in S/ R una famiglia A ‘di parti al seguente modo.
Un sottoinsieme A’ di S/ R appartiene ad A ‘ e viene chiamato aperto se p-1 ( A’) è
un aperto di S. In sostanza bisogna considerare le classi che fanno parte di A’ come sottoinsiemi di
S e controllare che la loro unione dia un sottoinsieme aperto di S. Si controlla immediatamente che
la famiglia A ‘ ora definita è una topologia per l’insieme S/ R . Quando l’insieme S/ R si
munisca di questa topologia A ‘ lo spazio topologico che si ottiene viene chiamato spazio
topologico quoziente.
Per la definizione data, la funzione suriettiva
p: x ∈ S → [ x ] ∈ S/ R
quando la si pensi come funzione tra i due spazi topologici ( S , A ) ed ( S/ R , A‘ ) è una funzione
215

continua .
Come conseguenza si ha allora che se ( S , A ) è connesso o compatto tale risulta anche lo
spazio quoziente ( S/ R , A‘ ).
Facciamo un esempio . Consideriamo lo spazio topologico R2 dotato della topologia
naturale.
Due punti (x1 , y1) ed (x2 , y2) li diciamo R - equivalenti se risulta x1 = x2 .
Tale relazione R è d’equivalenza e nella classe [ ( a , b ) ] ci sono quindi tutte le coppie del tipo
(a,y).
Rappresentando R2 nel piano facendo uso di un riferimento monometrico ortogonale si ha
che le classi d’equivalenza sono le rette parallele all’asse y. Conseguentemente gli aperti dello
spazio topologico quoziente R2 / R sono strisce aperte del tipo ] a , b [ x R o unioni di strisce di
questo tipo.
La relazione R introdotta ha voluto identificare tutte le coppie del tipo (a , y) ( con a fisso
ed y variabile in R) col singolo numero a . La funzione
f : a∈ R→ [( a , y )] ∈ R2 / R
diventa quindi un omeomorfismo tra R (dotato della topologia naturale ) e lo spazio quoziente
R2 / R .
216

Quando io ero studente universitario i tempi dedicati all’insegnamento non


erano contingentati. I corsi duravano un tempo ragionevole e non c’erano
difficoltà a fare qualche lezione in più rispetto all’orario previsto. Tutto ciò
favoriva l’apprendimento e non c’era nessuna vessazione. I testi erano per lo
più consigliati e si poteva attraverso la loro consultazione ricostruire ed
approfondire quanto ascoltato a lezione.
Ora pare che il tempo scorra più rapidamente e tutto questo non si può più
realizzare.
Questo cambiamento di ritmi rende utile la stesura di questo libretto di
appunti in cui si riassumono sinteticamente i contenuti del corso di
Geometria II da me tenuto questo anno accademico.
Certo ci vorrebbero degli approfondimenti , ma questi vengono lasciati a
quegli studenti che trovano in queste note gli stimoli ed il gusto di una
conoscenza più profonda .
Prof. Domenico Olanda
217

“ Ascoltare senza ritenere


non è sapere”
Dante Alighieri

Indice

Capitolo I - Geometria analitica del piano e dello spazio. Pagina

1. Introduzione ……………………………………………………… 4
2. Rette e piani dello spazio ………………………………………… 14
3. Fasci di piani …………………………………………………… 22
4. Stelle di piani ………………………………………………… 23

Capitolo II - Piani affini e proiettivi

1. Piani affini e proiettivi……………………………………………………30


2. Il piano affine numerico reale…………………………………………… 35
3. Il piano affine numerico complesso………………………………………42
4. Nozione di riferimento reale ……………………………………………. 44
5. Le coordinate omogenee …………………………………………………48
6. I punti immaginari ……………………………………………………….50
7. Il piano proiettivo numerico reale ……………………………………….52
8. Le questioni metriche del piano affine numerico reale ………………….58
9. Il gruppo strutturale del piano affine numerico reale ……………………61

Capitolo III – Circonferenza , Ellisse , Iperbole , Parabola .

1 . La circonferenza …………………………………………………………74
2. L’ ellisse………………………………………………………………….78
3. L’iperbole…………………………………………………………………81
218

4. La parabola ……………………………………………………………….84

Capitolo IV – Le coniche .

1. Le coniche del piano proiettivo complesso……………………………….90


2. Intersezione di una retta con una conica …………………………………93
3. Le coniche degeneri ………………………………………………………94
4. Le coniche non degeneri . Tangente in un punto…………………………100
5. Le coniche reali non degeneri ……………………………………………102
6. Polarità definita da una conica non degenere…………………………… 104
7. Centro, diametri , asintoti , assi. Le equazioni canoniche……………… 108

Capitolo V – lo spazio proiettivo complesso di dimensione tre

1. Lo spazio affine reale e complesso ………………………… 115


2. Lo spazio proiettivo reale e complesso di dimensione tre………121
3. Sfera coni e cilindri dello spazio affine reale ………………… 129

Capitolo VI – le quadriche

1. Le quadriche dello spazio proiettivo complesso……………. 139


2. Intersezione di una retta con una quadrica ………………… 144
3. Intersezione di un piano con una quadrica ………………… 145
4. Le quadriche degeneri ……………………………………… 146
5. Piano tangente ad una quadrica in un suo punto semplice … 153
6. Il gruppo strutturale ………………………………………… 155
7. Quadriche reali ………………………………………………157
8. Quadriche reali non degeneri ……………………………… 159
9. Polarità definita da una quadrica non degenere…………… 164
10. Centro e piani diametrali ………………………………… 168

Capitolo VII – Note di topologia generale

1. Spazi topologici ………………………………………………174


2. Chiusi di uno spazio topologico …………………………… 179
3. Funzioni continue …………………………………………… 183
4. Basi ed assiomi di numerabilità. Spazi separabili…………… 189
5. Proprietà della topologia indotta da una metrica …………… 190
6. Esempi di spazi topologici ……………………………………194
7. Sottospazi di uno spazio topologico ………………………… 196
8. Spazi topologici connessi…………………………………… 197
9. I connessi di R dotato della topologia naturale……………… 201
10. I connessi di Rn dotato della topologia naturale …………… 202
11. Spazi topologici compatti …………………………………… 204
12. I compatti di R dotato della topologia naturale……………… 208
13. Spazio topologico prodotto……………………………………209
14. I compatti di Rn dotato della topologia naturale …………… 210
15. Spazio topologico quoziente………………………………… 214

You might also like