Professional Documents
Culture Documents
_
q r
_
(p q).
Siamo certi che luso delle parentesi risulti perfettamente chiaro. Daltra
parte, come gi`a si vede nel pur semplice esempio precedente, tale uso pu`o
essere piuttosto ingombrante. Lo si pu`o snellire introducendo una conven-
zione analoga a quella per cui ab + c va intesa come (ab) + c e non come
a(b + c). Secondo tale convenzione si sistemano i connettivi nel seguente
ordine gerarchico, a partire dal pi` u forte (cio`e quello che separa di pi` u)
no al pi` u debole: , , , , . Cos` lesempio precedente diventa
(p q) q r (p q)
con un bel risparmio di parentesi. Volendo, avremmo potuto risparmiare
anche sui connettivi; si pu`o infatti dimostrare che si possono tutti denire in
termini
(8)
dei soli e (oppure e ). Anche dei quanticatori ne sarebbe
bastato uno solo, in quanto si ha
(x)P(x) (x)P(x)
o, equivalentemente,
(x)P(x) (x)P(x).
(7)
Tale terminologia risale ai logici medievali.
(8)
Cio`e: facendo esclusivamente uso.
4
In altri termini, uno dei due quanticatori pu`o essere riguardato come unab-
breviazione di unespressione pi` u complessa nella quale compare laltro. Nello
stesso ordine di idee, si fa talvolta uso della notazione (!x)P(x) da leggersi
esiste uno ed un solo x tale che P(x). Anchessa, ovviamente, `e esprimibile
in termini degli altri connettivi:
(!x)P(x) (x)P(x) (x)(y)
_
P(x) P(y) x = y
_
.
1.3 Come denire gli insiemi
Diamo per scontato il concetto di insieme. Invero esso richiederebbe una
attenta discussione che per`o sarebbe probabilmente incomprensibile per uno
studente che appena inizia ad aacciarsi alle sottigliezze della matematica.
Per questo motivo, ed anche perche in fondo lassenza di tale discussione non
preclude la comprensione del seguito, preferiamo rimandarla a tempi migliori.
Aggiungiamo qui soltanto che appare ragionevole sostenere che la matematica
`e nata la prima volta che una mente pensante ha isolato un insieme di oggetti
dal suo contesto. Ci si renda conto che questa `e unastrazione lastrazione
primordiale, appunto giacche quellinsieme in quanto tale non esiste in
natura; ci`o che esiste, invece, sono i suoi elementi, non (gi`a) separati per`o da
tutto il resto.
Un generico insieme viene solitamente denotato con una lettera latina
maiuscola, ad es. A, B, C, . . . , X, Y, . . . mentre si usano lettere latine minu-
scole a, b, c, . . . , x, y, . . . per denotare gli elementi di un insieme. Il fatto che
un elemento a appartenga ad un insieme A si esprime con la notazione
a A
(leggi: a appartiene ad A oppure a `e un elemento di A). Se, viceversa, a non
appartiene ad A, si scrive
a , A .
Se, come abbiamo visto, ci siamo guardati bene dal denire il concetto (ge-
nerale) di insieme, ed anche, aggiungiamo ora, quello di relazione di apparte-
nenza che pure diamo per scontato
(9)
, di contro va precisato con grande
(9)
Quanto ne abbiamo detto poco pi` u sopra non era una sua denizione ma semplice-
mente la precisazione della notazione corrispondente. Tutta questa cura ad evitare
di cadere nella trappola di cercare di denire i concetti di insieme e di relazione di
appartenenza `e motivata dal fatto che essi sono concetti primitivi della teoria
assiomatica degli insiemi, ed in quanto tali deniti implicitamente dagli assiomi
della teoria. Ma su questi aspetti fondazionali che peraltro verranno ripresi nel
Cap.7 e poi denitivamente chiariti solo in corsi pi` u avanzati per il momento
abbiamo detto pern troppo.
5
chiarezza (anche perche in merito non `e raro trovare scritti degli spropositi)
come sia possibile denire particolari insiemi. Un primo modo il pi` u sem-
plice, in eetti, anche se raramente praticabile consiste nellelencare gli
elementi dellinsieme considerato. Una denizione di questo tipo viene detta
denizione estensiva. In questo caso lelenco degli elementi `e racchiuso da
parentesi grafe. Ad esempio lespressione
A := 3, 5, , +
sta ad indicare che linsieme A `e denito come quello
(10)
i cui elementi sono
esattamente i numeri 3, 5, ed il simbolo +. Va notato che lordine in cui
gli elementi sono stati elencati non ha alcuna importanza, come pure che
non ha alcun senso contare pi` u volte uno stesso elemento
(11)
. Questo fatto si
esprime, a livello formale, tramite il cosiddetto assioma di estensionalit`a
che precisa che due insiemi A e B sono uguali se e solo se hanno esattamente
gli stessi elementi; in formule:
A = B (x)
_
x A x B
_
.
Come si `e osservato pi` u sopra, non sempre `e possibile dare una denizione
estensiva; ci`o pu`o dipendere da ragioni diverse. Ad esempio, se linsieme
in questione ha un numero innito di elementi, chiaramente non `e possibile
elencarli tutti (in tempi niti, che, ahinoi!, son quelli che ci sono stati con-
cessi). Vedremo pi` u avanti che vi sono anche altri motivi per cui non si
possa utilizzare una denizione estensiva. In tali casi bisogna far uso di una
denizione di tipo intensivo, cio`e far ricorso ad una propriet`a P(x) che
caratterizzi tutti e soli gli elementi dellinsieme A cui siamo interessati. Si
scrive allora
A := x [ P(x) ,
formula che si legge: A `e linsieme di tutti gli x per cui vale la propriet`a
P(x). Ovviamente si ha
x A P(x) .
Qui occorre subito chiarire due aspetti essenziali. Innanzi tutto, va precisato
che gli oggetti x considerati vengono presi tra quelli che fanno parte di un
ambito U che, se non lo si `e esplicitato, deve esser determinato implicita-
mente dal contesto nel quale ci si `e posti. Ad esempio, se si sta facendo
(10) `
E questo il signicato del simbolo := che si legge uguale per denizione.
(11)
Ci`o vale nel caso si abbia a che fare con insiemi, che invece per altre totalit`a le
famiglie, ad esempio pu`o aver senso il fatto che un elemento compaia pi` u volte.
6
dellaritmetica U sar`a linsieme Z dei numeri interi, se invece si stanno di-
scutendo questioni geometriche U potrebbe essere linsieme delle gure piane.
Il secondo aspetto riguarda la propriet`a P(x) di cui si fa uso; infatti non ogni
propriet`a P(x) `e ammessa: occorre richiedere che P(x) sia un predicato, cio`e
che, per ogni elemento x U, P(x) sia sicuramente vera o falsa, escludendo
quindi tutte quelle propriet`a che, almeno per qualche x, sono prive di senso.
Ad esempio nel caso in cui U sia linsieme delle gure piane, la propriet`a
x ha un perimetro uguale a 1, a meno che non sia accompagnata da ul-
teriori precisazioni, non denisce alcun insieme perche esistono delle gure
per le quali non si pu`o parlare di perimetro. Per altro verso va ribadito che
aermare che P(x) deve essere sicuramente vera o falsa per ogni x U
non signica aatto come purtroppo talvolta capita di sentire o di leggere
che per ogni assegnato x U, noi si sappia eettivamente decidere se
P(x) `e vera o `e falsa
(12)
. Si consideri ad esempio la propriet`a x `e un alpino
caduto nella Campagna di Russia durante la II Guerra Mondiale (ora U `e
ad es. linsieme di tutti gli uomini); non v`e dubbio che, qualunque sia luomo
x, esso o `e un alpino caduto nella Campagna di Russia durante la II Guerra
Mondiale oppure no, e pur tuttavia vi sono sicuramente dei casi di alpini di-
spersi in quelloccasione per i quali non si pu`o esser certi se siano morti o non
si siano invece creati una nuova vita in Unione Sovietica. Pertanto linsieme
degli alpini caduti nella Campagna di Russia durante la II Guerra Mondiale
`e denito correttamente anche se per qualche uomo non sappiamo decidere
se gli appartenga oppure no
(13)
. Osserviamo pure che in casi di questo tipo
linsieme in questione, pur essendo nito, non ammette una denizione e-
stensiva. Va sottolineato che lo stesso pu`o avvenire addirittura per insiemi
niti decidibili; ad es. per linsieme x [ x
5
+a
4
x
4
+ +a
1
x+a
0
= 0, che
pur `e decidibile e nito. Infatti in generale non esiste un algoritmo per elen-
care i suoi elementi. Di contro, ogni insieme ammette sempre una denizione
intensiva: assegnato infatti A tramite una denizione estensiva
A := a
1
, a
2
, . . . , a
n
si ha pure
A = x [ x = a
1
x = a
2
. . . x = a
n
.
Utilizziamo subito quanto detto pi` u sopra per denire un particolare insieme
duso assai frequente, linsieme vuoto , la cui accettazione sore spesso
di resistenze psicologiche simili a quelle che hanno accompagnato lo zero nel
(12)
Insiemi soddisfacenti a questa condizione vengon detti decidibili, e indecidibili gli
altri.
(13)
In questo caso ci`o succede per motivi pratici, ma occorre tener presente che, nei
casi che interessano la matematica, limpossibilit`a di decidere pu`o essere teorica, cio`e
relativa alla natura stessa degli oggetti considerati.
7
corso della sua storia. Contrariamente a quanto qualcuno `e forse portato a
credere, sia in un caso che nellaltro non si tratta del nulla. Linsieme vuoto
, per quanto particolare, `e purtuttavia un insieme soggetto alle stesse regole
di tutti gli altri. Se ci convince poco denirlo come un insieme (in eetti:
lunico insieme) privo di elementi, possiamo far uso (tra le altre possibili)
della denizione formale seguente:
:= x [ x ,= x.
Siccome la propriet`a x ,= x `e, per ogni x, sicuramente vera o falsa (in
eetti `e sempre falsa), denisce correttamente un insieme, che per lappunto
risulta privo di elementi.
Un altro tipo di insiemi particolari sono quelli che contengono un solo
elemento, cio`e quelli della forma a; un insieme di questo tipo viene detto
singoletto. Non bisogna confondere il singoletto a con lelemento a che
gli appartiene. Ricordando che due cose sono uguali se e solo se ogni aer-
mazione valida per luna `e valida anche per laltra, possiamo osservare che
ad esempio laermazione x a `e vera se x `e a, `e invece falsa se x `e a;
ancora, `e certamente corretto aermare che a contiene un solo elemento
mentre in generale la stessa aermazione `e priva di senso se riferita ad a.
1.4 Relazione di inclusione. Operazioni tra insiemi
Si dice che un insieme A `e un sottoinsieme o una parte dellinsieme B o
anche che A `e incluso in B e si scrive A B quando ogni elemento
di A `e anche elemento di B:
A B (x)
_
x A x B
_
.
Se A B e A ,= B si parla di inclusione propria e si usa la notazione
A B. Osserviamo che la relazione di inclusione `e una relazione
i) riessiva: A A,
ii) antisimmetrica: se A B e B A allora A = B
e
iii) transitiva: se A B e B C allora A C.
Va anche notato che, qualunque sia linsieme A, si ha A; lasciamo allo
studente la dimostrazione di questo fatto. Linsieme formato con tutti i
sottoinsiemi di un dato insieme A viene detto insieme delle parti di A
e denotato con T(A). Si osservi che si ha T(A), A T(A) mentre,
se A ,= , A , T(A); similmente per ogni a A si ha a T(A) ma
a , T(A). Si invita lo studente a provare che se un insieme nito A
contiene n elementi allora il suo insieme delle parti T(A) ne contiene 2
n
.
8
Le operazione tra insiemi (pi` u precisamente: tra i sottoinsiemi di un
dato insieme) che vogliamo denire sono per ora
(14)
solo cinque: una unaria,
il passaggio al complementare (A e quattro binarie
(15)
, lunione A B,
lintersezione A B, il prodotto cartesiano A B e la dierenza in-
siemistica A B.
Se A `e un sottoinsieme di un insieme U, linsieme di tutti gli elementi
di U che non appartengono ad A viene detto complementare di A in U e
denotato col simbolo (
U
A:
(
U
A = x [ x U x , A .
Qualora, come per lo pi` u succede, non si corra il rischio di ingenerare con-
fusione si pu`o trascurare il riferimento esplicito allinsieme U e scrivere sem-
plicemente (A.
`
E facile vericare che si ha (((A) = A, cio`e il passaggio al
complementare `e unoperazione involutoria.
Dati due insiemi A, B, la loro unione AB si denisce come linsieme
costituito da tutti gli elementi che appartengono ad A o a B, ivi compresi
quelli che appartengono ad entrambi:
A B := x [ x A x B .
La loro intersezione AB `e invece linsieme costituito da tutti gli elementi
che appartengono sia ad A che a B:
A B := x [ x A x B .
Lasciamo allo studente la verica delle seguenti semplici formule:
A A = A = A A, A B = B A, A B = B A,
A = A, A = , A (A B) = A = A (A B).
Un po meno immediate sono le due seguenti formule di De Morgan:
((A B) = (A (B; ((A B) = (A (B .
Proviamo la prima; la seconda, che si dimostra in modo simile, viene lasciata
per esercizio allo studente. Occorre quindi provare che x ((A B)
(14)
Pi` u avanti, dopo che avremo introdotto il concetto di funzione, ne introdurremo
almeno unaltra, lelevamento a potenza B
A
.
(15)
Una operazione si dice unaria, binaria, ternaria, . . ., n-aria . . . a seconda vi inter-
vengano uno, due, tre, . . ., n, . . . elementi per volta.
9
x ((A (B). In eetti, sfruttando semplicemente le denizioni date, si
giustica la seguente catena di equivalenze:
x ((A B)
_
x (A B)
_
_
x A x B
_
_
x A
_
_
x B
_
_
x (A
_
_
x (B
_
x ((A (B) .
Prima di denire il prodotto cartesiano A B di due insiemi A e
B `e necessario chiarire il concetto di coppia ordinata (a, b); come dice
la parola stessa, si tratta della coppia di elementi a, b, distinguendo per`o il
primo elemento, a, dal secondo, b. Ne consegue che (a, b) = (c, d) se e solo
se a = c e b = d; pertanto se a ,= b allora (a, b) ,= (b, a). Non bisogna inoltre
confondere la coppia ordinata (a, b) con linsieme a, b costituito dai due
soli elementi a e b
(16)
. Ci`o premesso poniamo:
AB = x [ x = (a, b) a A b B .
Le tre operazioni binarie precedenti possono essere generalizzate in modo
ovvio al caso n-ario, n > 2. Un modo elegante per farlo `e fornito dalle
seguenti denizioni induttive:
A
1
. . . A
n
:=
_
A
1
. . . A
n1
_
A
n
A
1
. . . A
n
:=
_
A
1
. . . A
n1
_
A
n
A
1
. . . A
n
:=
_
A
1
. . . A
n1
_
A
n
.
Si usa anche denotare le tre operazioni n-arie precedenti con
n
i=1
A
i
,
n
i=1
A
i
e X
n
i=1
A
i
rispettivamente.
Inne deniamo la dierenza insiemistica AB come la totalit`a degli
elementi di A che non appartengono a B:
A B := x [ x A x , B .
1.5 Applicazioni
Unapplicazione (o funzione o mappa) f dallinsieme A allinsieme B
consiste, oltre che di A e B, anche di una legge che associa ad ogni elemento
a di A uno ed un solo elemento f(a) di B. Essa ver`a denotata con
f: A B
a f(a)
(16)
Per ragioni che diverranno chiare in seguito `e tuttavia importante osservare che la
nozione di coppia ordinata pu`o essere denita in termini di insiemi, ad es. (a, b) :=
{a, {a, b}}.
10
o anche con
A
f
B
a f(a)
.
Gli insiemi A e B vengono detti dominio e, rispettivamente, codominio
dellapplicazione f. Non `e forse inopportuno ribadire che lapplicazione f
non `e determinata se non si danno il suo dominio ed il suo codominio; la
sola legge che associa f(a) ad a non basta a denire f. Il che non toglie che,
per comodit`a, dominio e codominio possano venir sottintesi, a patto per`o che
siano facilmente individuabili dal contesto. Ad esempio assegnare la funzione
mediante x f(x) :=
1
1x
2
`e accettabile se si ricava dal contesto che il
suo dominio sia A := R 1, 1 e il suo codominio sia B := R oppure,
se si preferisce, A := Z 1, 1 e B := n
1
[ 0 ,= n Z; si osservi
che, nei due casi, si tratta di funzioni diverse ad onta del fatto che vengono
descritte tramite una stessa legge x f(x). Si noti pure che non esiste
alcuna applicazione da un dato insieme A ,= allinsieme vuoto , mentre
ve ne `e una ed una sola la cosiddetta applicazione vuota che pure si
denota col simbolo dallinsieme vuoto ad un dato B sia che B = sia
che B ,= .
Lelemento f(a) viene detto limmagine dellargomento a e, viceversa,
a viene detto controimmagine del valore f(a). Linsieme delle immagini
f(a) al variare di a in A viene indicato con Im(f). Linsieme
(a, f(a)) [ a A AB
viene detto graco della funzione f.
`
E facile vericare che se A ha m elementi e B ne ha n allora vi sono
esattamente n
m
applicazioni diverse da A a B. Per analogia si usa indicare
con la notazione B
A
la totalit`a delle applicazioni da A a B.
In matematica si fa uso frequente delle particolari applicazioni seguenti.
a) Lapplicazione identica 1
A
su A:
1
A
: A A
a 1
A
(a) := a
;
b) limmersione canonica i
A
(17)
di A B in B:
i
A
: A B
a i
A
(a) := a
;
(17)
Si osservi che 1
A
e i
A
forniscono un altro esempio di funzioni diverse caratterizzate
dalla stessa legge.
11
c) la funzione caratteristica
A
di A B:
A
: B 0, 1
x
A
(x) :=
_
1 se x A
0 se x , A
.
Si noti che non solo ogni sottoinsieme A B determina univocamente la sua
funzione caratteristica
A
, ma anche, viceversa, ogni funzione : B 0, 1
determina un sottoinsieme X
:= x B [ (x) = 1. Si ha inoltre
= e X
A
= A.
Come si `e detto ogni elemento a A deve avere una ed una sola im-
magine, ma pu`o accadere che
i) vi siano elementi diversi a, a
A, a ,= a
),
come pure che
ii) qualche elemento b B non abbia controimmagine in A.
Unapplicazione che non soddis la i) viene detta applicazione iniettiva
o ingettiva o che `e una iniezione mentre unapplicazione che non sod-
dis la ii) viene detta applicazione suriettiva o surgettiva o che `e una
suriezione. Inne si dir`a che unapplicazione `e bigettiva o che `e una
bigezione se `e contemporaneamente iniettiva e suriettiva. Ad esempio,
quanto detto pi` u sopra a proposito della funzione caratteristica di un sot-
toinsieme A di B assicura che sia bigettiva lapplicazione
: T(B) 0, 1
B
A
A
.
A due applicazioni f, g della forma f: A B e g: B C cio`e tali che
il codominio della prima coincida col dominio della seconda `e possibile
associare una nuova funzione h: A C, detta la composizione di f e g
(nellordine indicato) e denotata con la notazione h = g f, denita da
h(a) := g(f(a)). Va subito sottolineato che la composizione funzionale
non `e unoperazione commutativa, cio`e che g f e f g quandanche
abbiano senso entrambe in generale non sono uguali. Chiariamo con un
esempio quanto detto. Siano
f: R R
x 2x
3
x + 1
g: R R
x
1
1+x
2
.
12
In questo caso g f e f g hanno entrambe senso e si ha
g f: R R
x
1
1+(2x
3
x+1)
2
f g: R R
x
2
(1+x
2
)
3
1
1+x
2
+ 1
che, come si verica facilmente, sono diverse.
`
E immediato riconoscere che, per ogni f: A B, A, B ,= , si ha f
1
A
= f = 1
B
f. Daltra parte ci possiamo chiedere se esistono funzioni
f
, f
: B A tali che
f
f = 1
A
e f f
= 1
B
.
Tali funzioni, qualora esistano, vengono dette, rispettivamente, inversa si-
nistra e inversa destra della f. La domanda alla risposta precedente `e
fornita dal seguente teorema, il primo di un certo peso che incontriamo in
questi appunti.
Teorema 1.1: Una funzione f: A B ammette inversa sinistra se e solo
se `e iniettiva e ammette inversa destra se e solo se `e suriettiva.
Dimostrazione: Dividiamola in quattro parti:
Se f ammette inversa sinistra f
allora `e iniettiva
Si ha:
f(x) = f(x
) f
(f(x)) = f
(f(x
)) (f
f)(x) = (f
f)(x
)
1
A
(x) = 1
A
(x
) x = x
.
Se f `e iniettiva allora ammette inversa sinistra
Sia f
(z) = x; se invece
z B Im(f) poniamo f
(z) = x
0
, dove x
0
indica un arbitrario elemento
di A.
`
E immediato vericare che (f
f = 1
A
, cio`e f
allora `e suriettiva
Per ogni z B si ha z = (f f
)(z) = f(f
(z) A, rispetto a f.
Se f `e suriettiva allora ammette inversa destra
(18)
Si noti che per larbitrariet`a della scelta di x
0
, se Im(f) = B, vi sono pi` u inverse
sinistre della f.
13
Per ogni z B consideriamo il sottoinsieme A
z
:= x A [ f(x) = z A.
Per ipotesi tali sottoinsiemi di A sono non vuoti e a due a due disgiunti:
A
z
,= , z ,= t A
z
A
t
= .
Per ogni z B scegliamo ad arbitrio un elemento x
z
in A
z
e poniamo
f
(z) := x
z
.
`
E facile vericare che allora f
iN
X
i
`e vuoto:
iN
X
i
= , se e solo se esiste almeno un indice j N tale che X
j
= .
14
Cap. 2
Le successive estensioni del concetto di numero
I. Dai naturali agli interi
2.1 Operazioni sui naturali
Assumiamo come punto di partenza i numeri naturali
0, 1, 2, . . . , n, . . .
cio`e quei numeri che abbiamo conosciuto per primi e che, almeno in prima
istanza, ci sono serviti, e continuano a servirci, per contare. Il loro insieme
verr`a denotato con N.
Si noti che lo zero 0 `e stato da noi incluso in N; `e giusto avvisare che
questa convenzione non `e universalmente accolta. Alcuni autori preferiscono
partire con lunit`a 1. Forse ci`o `e dovuto anche al fatto che il concetto di
zero in quanto numero avente diritti e doveri simili a quelli di tutti gli
altri numeri `e, per la cultura occidentale, relativamente recente.
Dicevamo che inizialmente luomo si `e servito dei numeri naturali per
contare.
`
E ragionevole pensare che non ci abbia messo molto a capire che si
riesce a contare meglio se si acquisisce una conoscenza pi` u astratta di quei
numeri, se si impara ad esempio a sommarli e moltiplicarli in quanto tali e
non solo in quanto esprimenti propriet`a di insiemi. Ad esempio, appurato
che un gregge A di pecore ne contenga m ed uno B di capre ne contenga
n, `e pi` u facile calcolare che A B contiene m + n ovini ma, ovviamente,
ci`o `e possibile solo a patto di aver prima imparato a far le somme di numeri
naturali! piuttosto che contare gli elementi di A B.
Questa osservazione pu`o apparirvi banale ma vi invitiamo a riettere
sul fatto che, se ci`o avviene, pu`o darsi che sia solo perche per voi leseguire
la somma di naturali `e unoperazione cos` familiare che forse vi riesce perno
dicile il coglierne lastrattezza (rispetto alla concretezza del contare gli
elementi dellinsieme AB). Vi invitiamo anche a trarre da questa riessione
unaltra: che cio`e, in generale, il maggior o minor senso di astrattezza che ci
provoca la considerazione di un fatto (leggi: situazione, procedura, nozione,
. . . ) matematico `e spesso di natura (non logica ma) psicologica, dipende cio`e
solo dalla nostra maggiore o minore familiarit`a con quel fatto. E si badi che
15
questo `e vero nei due sensi: alle volte giudichiamo troppo astratti certi fatti
che invece ci sono solo poco familiari, altre volte (ed `e di questo tipo il caso
da cui le riessioni di questo capoverso hanno preso le mosse) non riusciamo a
cogliere cosa vi sia di astratto o formale in fatti per noi familiari. Giusto per
illustrare questo secondo aspetto con un altro esempio: allinizio di questo
capitolo abbiamo detto di assumere come punto di partenza i numeri naturali;
immagino che nessuno di voi si sia ribellato (ma a rigor di logica avrebbe
dovuto!) chiedendosi che cosa mai siano eettivamente questi oggetti e come
ne giustichiamo la somma, e il prodotto, e le propriet`a di queste operazioni
etc. Rassicuriamoci: non voglio qui aprire una discussione su questi temi
(che peraltro in qualche modo riprenderemo pi` u avanti) se non altro perche
ma `e proprio questo che volevo farvi osservare e che vorrei teneste sempre
presente! dubito che a fatica riuscireste a coglierne il succo; temo che
invece avreste la sensazione di esser indotti a pestar lacqua nel mortaio.
Se ne ho parlato `e solo lo ribadisco per invitarvi a tener presenti le
indicazioni che se ne traggono, al ne, da un lato, di non scoraggiarvi se vi
capiter`a (oh, se vi capiter`a!. . .) di bloccarvi di fronte ad una questione che
voi trovate troppo astratta e che invece `e solo poco familiare e dallaltro di
dare per scontati certi fatti (che invece andrebbero giusticati) solo perche,
essendovi familiari, vi appaiono ovvi.
Ritornando al discorso principale, cio`e allesigenza di acquisire una cono-
scenza astratta dei numeri naturali, vediamo subito che non son poche le
propriet`a di cui usualmente disponiamo. Non solo sappiamo sommare o
moltiplicare due numeri, ma facciamo senza problemi anche lunghi calcoli
con somme e prodotti incastrati tra loro in modo quanto mai arzigogolato: a
tal ne sappiamo servirci con grande disinvoltura di propriet`a astratte quali
le propriet`a associativa e commutativa di somma e prodotto, la propriet`a
distributiva della somma rispetto al prodotto
(1)
, etc. In alcuni casi sap-
piamo anche eseguire la sottrazione b a (o, il che `e lo stesso, risolvere
lequazione x+a = b) e la divisione b : a (cio`e risolvere lequazione ax = b), e
per questultimo problema alloccorrenza sappiamo metter in campo nozioni
ancor pi` u astratte quale quella di numero primo, di decomposizione in fattori
primi, etc.
Mi pare che non occorra per ora dilungarsi oltre sulla quantit`a di belle
cose che sappiamo fare con i numeri naturali. Bisogna invece soermarsi su
ci`o che non sempre si sa (non sempre si pu`o, in eetti!) fare, e cio`e la sot-
trazione e la divisione. In primo luogo per riconoscere che questa situazione
non ci piace aatto, e non solo per gli scomodi risvolti pratici, ma anche
per un certo nostro senso estetico in assenza del quale si fa poca strada in
matematica: questa storia che quelle operazioni talvolta si possono fare, e
talaltra no, ci pare poco armonica; anzi, a pensarci bene, ci sentiamo addirit-
(1)
Si vedano, nellAppendice 1, le denizioni formali di queste propriet`a.
16
tura defraudati che la viviamo come la mancanza di qualcosa di cui abbiamo
diritto. Questo qualcosa ancora non sappiamo cosa possa essere, ma la
sua assenza la percepiamo in tutta la sua concretezza
(2)
. Diciamo subito che
questa sgradevole sensazione `e stata da tempo superata con lintroduzione
di due nuovi insiemi numerici: da un lato linsieme Z dei numeri interi col
quale risolviamo il problema della sottrazione e dallaltro
(3)
linsieme Q dei
numeri razionali col quale, risolvendo anche il problema della divisione,
completiamo lopera (per il momento).
2.2 Conosciamo gli interi?
Ma andiamo per gradi e occupiamoci dapprima dellinsieme degli interi Z,
che peraltro conosciamo bene
Z = . . . , 3, 2, 1, 0, 1, 2, 3, . . .,
come pure conosciamo bene le regole di calcolo relative alle estensioni ad esso
delle vecchie operazioni di addizione e moltiplicazione tra naturali (pi` u per
meno, meno, meno per meno, pi` u, etc.etc.) nonche lestensione a Z di varie
altre nozioni gi`a usate per N (la usuale relazione dordine , ad esempio).
Tutto ci`o sembra scontato, ma una riessione pi` u attenta ci fa sospettare che
invece non sia tutto cos` liscio e tranquillo. In eetti, nelle righe precedenti
abbiamo pi` u volte usato il verbo conoscere, ma ora vi chiedo: Che cosa vuol
dire che conosciamo quegli oggetti e quelle propriet`a? Non sar`a che, an-
cora una volta, confondiamo il conoscere con laver familiarit`a con? In
eetti tale confusione non solo c`e, ma in un certo senso nora siete stati u-
cialmente (cio`e dalla scuola) autorizzati a farla. Dir`o di pi` u: tale confusione
`e ben poco criticabile se la si confronta con latteggiamento schizofrenico che
i matematici, nel corso della storia, hanno avuto nei confronti dei numeri
negativi, cio`e la parte nuova di Z rispetto ai vecchi naturali. Gli indiani li
usavano gi`a nel VII sec. d.C. In occidente durante il Rinascimento si inizi`o ad
usare il segno meno quasi alla stregua di un artizio di calcolo senza peraltro
accettare il concetto di numero negativo. Tale atteggiamento dur`o ancora
per tutto il 600 e anche oltre (allepoca cio`e di Cartesio, Pascal, Leibniz,
(2)
Questo fenomeno `e comunissimo in matematica ed `e stato, `e e sar`a una potente
molla i cui scatti fanno registrare signicativi momenti di progresso e di eettivo
arricchimento della matematica.
(3)
Non a caso diciamo da un lato . . . e dallaltro . . . anziche prima . . . e poi . . .
giacche se `e vero che da un punto di vista logico-algebrico conviene pensare di esten-
dere prima N a Z e poi Z a Q, tuttavia sia dal punto di vista della didattica (le
frazioni abbiamo imparato a conoscerle alle elementari ma i numeri negativi solo alle
medie) che storicamente le cose hanno avuto un diverso sviluppo.
17
Newton
(4)
); i matematici, pur essendo consapevoli ad esempio che 2 fosse
una radice quadrata di 4, parlavano di essa come di una radice ttizia o
di una falsa radice. Perno il grande Eulero nel 700 aveva ancora strane
idee sui negativi (pensava fossero pi` u grandi dell). Solo nel XIX sec. si `e
sistematicamente iniziato a pensarla come poi a noi `e stato trasmesso dalla
scuola media e come ancora la pensate. Tutto ci`o, se da un lato ci conforta
facendo svanire sul nascere un inquietante senso di colpa che gi`a andava af-
facciandosi allanimo nostro, dallaltro per`o non ci esime dal riconoscere che
quelle domande non sono oziose ma pongono un problema reale: che cosa
sono eettivamente i numeri interi? In altri termini: sforzandoci per un
attimo di dimenticare la dimestichezza con essi che ormai da tempo abbiamo
acquisito e immaginandoci di conoscere solo i naturali, come possiamo intro-
durre (. . . inventare, . . . scoprire, . . . denire, . . . che altro? . . .) dei nuovi
numeri con i quali sia possibile fare tutto ci`o che gi`a sapevamo fare con i
naturali e in pi` u anche la sottrazione senza limitazioni di sorta?
La risposta che, forse inconsciamente, avete dato nora a questa do-
manda `e proprio quella indicata pi` u sopra, e cio`e che i numeri interi sono
quelle cose che si indicano con i simboli 0, 1, 2, 3, . . . e con le quali si
opera nel modo che sapete. Perche dunque non ci accontentiamo pi` u di tale
risposta che peraltro, come si `e visto, `e stata il risultato di un lungo e faticoso
percorso conclusosi solo allinizio dellottocento?
Bene, a ci`o paradossalmente si potrebbe rispondere dicendo che in eetti
potremmo anche accontentarci, se non fosse che nel corso degli ultimi due
secoli si `e riusciti ad andare molto oltre quella concezione. I progressi com-
piuti non solo ci hanno fatto capire che `e possibile dare una risposta molto
pi` u soddisfacente a quel problema (parliamo sempre dellintroduzione degli
interi) ma hanno a tal punto modicato la temperie culturale complessiva
della matematica militante che almeno per oggetti cos` fondamentali come
i numeri quella risposta non risulta proprio pi` u accettabile. Il fatto `e che
si `e riusciti ad estendere a vari altri settori della matematica ci`o che Euclide
nel III sec. a.C. aveva fatto per la geometria elementare, vale a dire dar loro
una trattazione fortemente caratterizzata dal metodo assiomatico. Gli stessi
numeri naturali che allinizio di questo capitolo abbiamo detto di accogliere
acriticamente possono invece trovare fondamento in un contesto assiomatico,
gli assiomi di Peano
(5)
.
Rimandando il lettore ad altra parte di questi appunti per una pi` u ap-
profondita discussione sia delle teorie assiomatiche in generale che degli as-
(4)
Non c`e bisogno di ricordare che Rene DESCARTES (1596-1650; CARTESIO nella
versione latinizzata del suo cognome), Blaise PASCAL (1623-1662), Gottfried Wilhel
LEIBNIZ (1646-1716) e Isaac NEWTON (1642-1727) sono da annoverare tra i pi` u
grandi matematici e loso della storia.
(5)
Si tratta del piemontese Giuseppe PEANO (18581932), originale gura di matema-
tico cui siamo debitori anche di diversi altri importanti risultati.
18
siomi di Peano in particolare, ci interessa qui solo sottolineare che una delle
peculiarit`a delloperare matematico che il metodo assiomatico ha assunto, en-
fatizzandola, come suo carattere distintivo (non il solo, ovviamente) consiste
nel sistematico riuto di unaccettazione acritica di nuovi concetti quando
questi possano invece venir deniti in modo rigoroso in termini di altri con-
cetti introdotti in precedenza. Nel caso specico, il nostro riuto di accon-
tentarci di quanto detto pi` u sopra per introdurre gli interi `e motivato dal
fatto che oggi sappiamo sia denire i numeri interi che giusticarne le pro-
priet`a in termini di numeri naturali. Lo strumento che, senza lasciar spazio
ad alcuna ambiguit`a, ci consente di far ci`o prende il nome di passaggio al
quoziente ed `e di uso frequentissimo in matematica ( e non solo). Pur non
richiedendo, per essere descritto, un complesso apparato di nozioni prope-
deutiche anzi, forse proprio a causa della sua gran semplicit`a descrittiva
pu`o essere di qualche dicolt`a il riuscire a coglierne la reale portata e
profondit`a. Per questo motivo preferiamo rimandare ancora un po la sua
descrizione formale. Senza peraltro rinunciare nel caso che ci interessa
ora ad utilizzarlo almeno in modo per cos` dire criptico, cio`e cercando di
far capire come i numeri interi possano venir deniti in termini di naturali
seguendo su un piano concreto, non formale un lo di considerazioni
che peraltro corrispondono ad un uso puntuale del passaggio al quoziente.
2.3 Denizione dellinsieme Z degli interi
La considerazione da cui prendiamo le mosse `e relativa proprio allostacolo
che si `e incontrato e cio`e che in N non sempre `e possibile fare la sottrazione:
in taluni casi esiste un numero naturale r che sia la dierenza mn di altri
due m, n, cio`e che sommato con n dia m ci`o che ovviamente succede se
e solo se m n mentre in altri casi (precisamente quelli per cui m < n)
qualunque sia r N si ha m ,= n +r.
Abbiamo gi`a osservato che un idea ragionevole per superare tale ostacolo
consiste nel cercare un nuovo insieme di numeri pi` u ampio dei naturali nel
quale si possano far sempre non solo laddizione e la moltiplicazione ma
anche la sottrazione. Ammesso che lidea sia buona, come trovarlo? Come
spesso succede, la via viene indicata dal problema stesso, a patto di saper
interrogare le cose nel giusto modo, ci`o che spesso signica: con la necessaria
pazienza ed umilt`a. Limitandoci inizialmente a considerare coppie m, n per
cui m n, la prima idea cruciale consiste nellosservare che la dierenza r di
m e n, r = mn, compete, oltre che a m e n, anche a molte altre coppie di
numeri naturali (m
, n
), (m
, n
= m
, n
), (m
, n
), . . . che
godono di questa propriet`a verranno dette equivalenti:
(m, n) (m
, n
) (m
, n
)
19
Possiamo pertanto dire che la dierenza r `e quel qualcosa che hanno in co-
mune tutte (e sole) le coppie tra loro equivalenti ovvero identicando un
insieme con la propriet`a che caratterizza tutti e soli gli elementi dellinsieme
stesso che r `e proprio linsieme delle coppie tra loro equivalenti (m, n),
(m
, n
), (m
, n
, n
) allora (m
, n
, n
) e se (m
, n
) `e equivalente
a (m
, n
, n
, n
) siano equi-
valenti si pu`o esprimere non solo dicendo che le loro dierenze coincidono:
mn = m
= m
, n
= m
, n
), (m
, n
), . . .
di tutte le coppie equivalenti ad essa (e tra loro) e, esattamente come quando
m n, dire che tale classe `e la dierenza mn = m
= m
= . . .
Linsieme di tutte queste classi di coppie equivalenti viene chiamato insieme
dei numeri interi e denotato con Z. Ovviamente, ogni numero naturale r
pu`o essere caratterizzato in questo modo: r = [(r, 0)]
(immersione canonica)
Indicato con r = [(r, 0)]
= (m, n), (m
, n
), (m
, n
, m
), (n
, m
, n
) m+n
= n +m
,
e si scrive
(2.2) Z :=
N N
.
2.4 Operazioni sugli interi: la somma
Naturalmente, resta ancora da vericare che linsieme Z cos` denito soddisfa
a tutte le propriet`a richieste. Per maggior chiarezza elenchiamole ancora una
volta:
a) Vogliamo che su Z sia possibile denire una somma e un prodotto che,
qualora applicate a interi non negativi, coincidano con le analoghe operazioni
denite su N;
b) vogliamo che tali operazioni godano delle stesse propriet`a gi`a godute dalla
somma e prodotto denite su N, e cio`e che valgano le propriet`a associativa,
commutativa, distributiva, che 0 si comporti come elemento neutro rispetto
alla somma e 1 rispetto al prodotto;
c) vogliamo inoltre che si possa sempre fare la dierenza (operazione inversa
della somma) ovvero, equivalentemente, che per ogni n Z esista un n
Z
tale che n +n
= 0;
d) inne vogliamo poter estendere a Z lusuale relazione dordine sui naturali.
Non `e dicile mostrare che le richieste precedenti possono essere sod-
disfatte.
Iniziamo col denire su Z laddizione; avendo presente che (m n) +
(h k) = (m+h) (n +k), non `e dicile immaginare che occorrer`a porre
(2.3) [(m, n)]
+ [(h, k)]
:= [(m+h, n +k)]
.
Prima di procedere oltre, bisogna fermarsi per una considerazione impor-
tante. Nella (2.3) il simbolo := (uguale per denizione) sta a indicare
21
che la somma a sinistra `e denita come indica la parte destra. A prima
vista potrebbe sembrare tutto non solo legittimo ma anche tranquillo. Tale
denizione potrebbe per`o nascondere un inghippo che facilmente passa inos-
servato se non si ha pratica con cose di questo tipo. Diciamo subito che nel
nostro caso particolare tale inconveniente non si presenta; bisogna tuttavia
esserne consapevoli sia perche potrebbe presentarsi in casi simili sia soprat-
tutto perche, anche nel caso attuale, ntanto che non si sia provato che non si
verica, non possiamo accettare la denizione (2.3). Il fatto `e che nella (2.3)
si denisce una somma di classi, la classe [(m, n)]
, sfrut-
tando particolari rappresentanti delle classi stesse, cio`e gli elementi (m, n) e
(h, k). Bisogna provare che la classe somma, cio`e [(m+h, n+k)]
non dipende
da questi particolari rappresentanti: in caso contrario la somma varierebbe
al variare dei rappresentanti. Bisogna cio`e provare che se (m, n) (m
, n
)
e (h, k) (h
, k
+h
, n
+k
): in eetti,
sommando membro a membro m + n
= n + m
con h + k
= k + h
si ot-
tiene (m + h) + (n
+ k
) = (n + k) + (m
+ h
+ [(h, k)]
_
+ [(p, q)]
= [(m, n)]
+
_
[(h, k)]
+ [(p, q)]
_
In eetti, il primo membro vale
[(m+h, n +k)]
+ [(p, q)]
=
= [(m+ (h +p), n + (k +q)]
= [(m, n)]
+ [(h, k)]
= [(h, k)]
+ [(m, n)]
Si ha:
[(m, n)]
+[(h, k)]
= [(m+h, n+k)]
= [(h+m, k+n)]
= [(h, k)]
+[(m, n)]
.
(7)
In eetti tutto quanto ci serve controllare `e gi`a condensato nella relazione (mn) +
(h k) = (m + h) (n + k) che ci ha suggerito la (2.3) e nel fatto che le propriet`a
che andiamo a vericare per la somma (2.3) sono valide sui naturali.
22
III) Esistenza dellelemento neutro: si tratta dellelemento 0 := [(0, 0)]
;
in eetti:
[(m, n)]
+ [(0, 0)]
= [(m+ 0, n + 0)]
= [(m, n)]
.
IV) Esistenza dellopposto: [(m, n)]
:= [(n, m)]
. In eetti si ha:
[(m, n)]
+ [(n, m)]
= [(m+n, n +m)]
= [(0, 0)]
= 0.
Poiche la dierenza `e la propriet`a inversa della somma, `e proprio la
propriet`a precedente che garantisce la possibili`a di poter sempre eseguire la
sottrazione su Z.
V) Compatibilit`a dellimmersione canonica con laddizione: si ha
r [(r, 0)]
, s [(s, 0)]
e r + s [(r + s, 0)]
[(h, k)]
.
Si noti che tale denizione `e suggerita, come `e giusto che sia, dalla relazione
(m n)(h k) = (mh + nk) (mk + nh). Come gi`a per la somma (2.3),
anche in questo caso occorre in primo luogo provare che il prodotto denito
dipende solo dalle classi [(m, n)]
e [(h, k)]
= [(m
, n
)]
[(h, k)]
= [(m
, n
)]
[(h, k)]
. In
eetti, avendosi [(m, n)]
[(h, k)]
e [(m
, n
)]
[(h, k)]
= [(m
h+n
k, m
k +n
h)]
k +
n
h) = (mk + nh) + (m
h + n
k + n
h) = (m +
n
)h + (n +m
)k = (m
+n)h + (n
h +n
k).
Lasciamo come esercizio per lo studente la dimostrazione delle pro-
priet`a associativa e commutativa del prodotto, della propriet`a di-
stributiva del prodotto rispetto alla somma, del fatto che lelemento
1 = [(1, 0)]
[(s, 0)]
= [(rs, 0)]
;
b) pi` u per meno, meno: [(r, 0)]
[(0, s)]
= [(r 0 + 0 s, r s + 0 0)]
=
[(0, rs)]
;
c) meno per meno, pi` u: [(0, r)]
[(0, s)]
= [(0 0 +r s, r 0 + 0 s)]
=
[(rs, 0)]
.
2.6 Relazione dordine
Da ultimo deniamo su Z la relazione dordine nel modo seguente
(2.5) [(m, n)]
[(h, k)]
m+k n +h
(valendo, ai due lati di , contemporaneamente la disuguaglianza stretta <
o luguaglianza =).
Anche in questo caso lasciamo allo studente la prova della correttezza di tale
denizione e del fatto che si tratta di una relazione dordine
(8)
, cio`e che sia
riessiva, antisimmetrica e transitiva. Le nozioni di propriet`a riessiva
e transitiva vi sono gi`a note; per quanto riguarda la terza, diciamo che una
relazione xRy `e antisimmetrica se
xRy yRx = x = y.
Un modo diverso per introdurre la stessa (lo si provi!) relazione dordine `e
il seguente:
a b (c)(c N a +c = b) (a, b Z).
Si provi inoltre che relazione dordine su Z appena introdotta costituisce
unestensione della relazione dordine usuale sui naturali ed `e compatibile
con la somma
x y = x +z y +z (x, y, z Z)
(8)
Nozione gi`a incontrata nel Cap.1, a proposito della relazione di inclusione .
24
e con il prodotto per ogni intero positivo z
x y z > 0 = xz yz (x, y, z Z),
mentre se z `e negativo lordine viene invertito:
x y z < 0 = yz xz (x, y, z Z).
Unimportante conseguenza di questo fatto `e che ogni quadrato x
2
`e positivo
qualunque sia x ,= 0.
Siccome inoltre la relazione dordine su N gode della propriet`a
archimedea, cio`e
se 0 < a < b esiste un numero naturale n tale che na > b,
lo stesso vale (come subito si verica sfruttando questa propriet`a e giocando
con i segni) per la relazione dordine su Z.
Il complesso delle propriet`a precedenti (relative alle due operazioni di
addizione e moltiplicazione ed alla relazione dordine ) si esprime dicendo
che la quaterna (Z, +, , ) costituisce un anello ordinato archimedeo.
2.7 Potenze con esponente intero
Vogliamo ora illustrare come e in che senso sia possibile estendere
a esponenti interi qualunque la nozione di potenza. A scanso di equivoci,
precisiamo subito che se deniamo (ci`o che peraltro non pu`o ragionevolmente
essere messo in discussione) la potenza a
n
come il risultato del prodotto di
a per se stesso n volte, ci`o ha un senso solo per esponenti n interi positivi
e quindi a
n
non signica esattamente nulla se n `e negativo o nullo. Daltra
parte, niente vieta di attribuire anche in questi casi un conveniente signicato
alla potenza a
n
. Laggettivo conveniente sta ad indicare che il signicato
che si vuole cercare per a
n
con n 0 deve essere il pi` u naturale possibile,
deve cio`e accostarsi il pi` u possibile a quelle di a
n
con n > 0. Orbene una
delle ben note propriet`a elementari delle potenze `e espressa da
(2.6) a
n
: a
m
= a
nm
con n > m; m, n Z
uguaglianza che, ovviamente, non ha [ancora] alcun senso se n m. Siccome
per`o in tale caso si ha (come subito si verica per via diretta)
a
n
: a
n
= 1
e
a
n
: a
m
=
1
a
mn
con n < m
25
viene naturale porre
(2.7) a
0
:= 1
e
(2.8) a
n
:=
1
a
n
con n < 0
ci`o che garantisce al contempo un preciso signicato alla potenza a
n
per
ogni n Z e la validit`a delluguaglianza (2.6) per ogni coppia n, m Z.
Riassumendo, possiamo dire di aver assunto per convenzione le (2.7) e (2.8)
allo scopo di lasciar cadere in (2.6) la limitazione n > m.
26
Cap. 3
Insieme quoziente
3.1 Relazioni di equivalenza
Dato un insieme A, un qualunque sottoinsieme R del prodotto cartesiano
AA := (a, b) [ a, b A di A per se stesso verr`a detto relazione binaria
sullinsieme A. Se (a, b) R, si dir`a che a sta nella relazione R con b
e, pi` u semplicemente, si sciver`a aRb. Siamo interessati ad una particolare
classe di relazioni binarie, le relazioni di equivalenza. Si tratta di quelle che
soddisfano le tre propriet`a seguenti:
propriet`a riessiva: per ogni x A, si ha xRx;
propriet`a simmetrica: qualunque siano x, y A, si ha xRy = yRx;
propriet`a transitiva: per tutti gli x, y, z A, si ha xRy yRz = xRz.
Si dimostra facilmente che ciascuna delle tre propriet`a precedenti `e in-
dipendente (cio`e: non discende) dalle altre due. Aermazioni di questo tipo
si provano con un ragionamento standard: ssata lattenzione su due di
quelle propriet`a (scelte successivamente nei tre possibili modi) si esibisce
una relazione R che soddisfa le due propriet`a considerate ma non la terza.
Lasciamo allo studente il compito di trovare esempi di relazioni che servano
allo scopo.
Data una relazione dequivalenza R su un insieme A ed un elemento a
di A, si chiama classe dequivalenza di a linsieme [a]
R
:= x A [ aRx.
Proviamo che linsieme delle classi di equivalenza [a]
R
, al variare di a in A,
costituisce una partizione di A, e cio`e che tali classi sono i) non vuote:
[a]
R
,= , ii) a due a due disgiunte: [a]
R
,= [b]
R
[a]
R
[b]
R
= , e inne
che iii) ricoprono interamente A:
aA
[a]
R
= A. La i) e la iii) discendono
dal fatto che, qualunque sia a in A, per la propriet`a riessiva vi `e almeno
un elemento x A tale che aRx, e cio`e a stesso. Per provare poi la ii)
ragioniamo per assurdo: supponiamo che per particolari elementi a, b A
per cui [a]
R
,= [b]
R
, si abbia z [a]
R
[b]
R
; ma allora aRz e bRz, da cui,
per la simmetria, aRz e zRb e inne, per la transitivit`a, aRb. Sfruttando
questultima e ripetendo il ragionamento appena fatto, si dimostra che se aRt
allora anche bRt, e viceversa se bRt allora anche aRt, cio`e che [a]
R
= [b]
R
,
27
contro la nostra ipotesi.
Quanto precede prova che ad ogni relazione di equivalenza R sullinsieme
A resta associata una partizione di A; viceversa, ad ogni assegnata par-
tizione T dellinsieme A (che `e, ripetiamolo, una famiglia T = A
i
[ i I
di sottoinsiemi A
i
di A che vengono detti blocchi della partizione
che siano non vuoti, a due a due disgiunti e la cui unione
iI
A
i
coincida
con A) possiamo associare la relazione di equivalenza R
P
su A denita da:
aR
P
b i I(a A
i
b A
i
). In altri termini, due elementi a, b A
sono equivalenti se e solo se appartengono allo stesso blocco della partizione.
Per esercizio si provi che si tratta proprio di una relazione dequivalenza e
inoltre che se, partendo da una relazione dequivalenza R associamo a questa
una partizione T, e poi a questa partizione associamo la relazione R
P
, allora
questultima coincide con la relazione R da cui siamo partiti. Analogo risul-
tato (lo si enunci e provi!) vale prendendo le mosse iniziali da una partizione.
La partizione T associata ad una relazione dequivalenza R su A viene
detta insieme quoziente di A modulo R e denotata con
A
R
; inoltre
lapplicazione
p
R
: A
A
R
a [a]
R
viene detta proiezione canonica di A sullinsieme quoziente
A
R
.
Il processo descritto si chiama passaggio al quoziente o anche, tal-
volta, procedimento di denizione per astrazione. Che tale `e appunto,
come chiariremo meglio fra breve. Prima per`o `e forse opportuno rimpolpare
le denizioni precedenti con qualche semplice esempio.
3.2 Esempi
1) Un primo esempio `e fornito da quanto contenuto nel capitolo precedente.
Per ulteriore chiarezza sintetizziamolo ancora una volta. Si parte dallinsieme
A := N N = (a, b) [ a, b N e dalla relazione dequivalenza (a, b)
(c, d) a +d = b +c. Si ottiene Z :=
NN
f(x) = f(x
).
Si verica facilmente che si tratta di una relazione di equivalenza, detta nu-
cleo dequivalenza e denotata solitamente con ker(f). Vale la seguente
importante propriet`a (detta Primo teorema disomorsmo, la cui sem-
plice dimostrazione viene lasciata allo studente per esercizio): esiste una ed
una sola bigezione f
i
X
ker(f)
f
Im(f)
(cio`e tale che f = i f
p) dove p: X
X
ker(f)
`e la proiezione canonica di X
su
X
ker(f)
e i: Im(f) Y, y y `e limmersione canonica di Im(f) in Y .
5) Sia A la totalit`a degli insiemi niti; diremo che due di essi, a, b, sono
equipotenti in simboli, a b se esiste una corrispondenza biunivoca
f: a b da a su b (in altri termini, equipotenti `e sinonimo di bigettivi).
Si prova che la relazione di equipotenza `e di equivalenza. Passiamo al
quoziente
A
? Prendiamo ad esempio
linsieme nito a = x, x
, x
, y
e quindi [a]
sar`a pro-
prio la totalit`a degli insiemi di questo tipo, totalit`a che possiamo pertanto
identicare col numero naturale 3. Anzi, se per un attimo dimentichiamo
di conoscere i numeri naturali, possiamo denire il numero 3 proprio come
la classe dequivalenza [x, x
, x
. Di pi` u, seguendo
questa via possiamo anche denire le operazioni tra naturali, o anche la
usuale relazione dordine , e via via tutte le nozioni relative ai naturali
che siamo abituati ad usare. Giusto per chiarire questa aermazione, vedi-
amo come si denisce la somma [a]
+ [b]
: indicati con a
e b
due insiemi
equipotenti con a e b, rispettivamente, e tra loro disgiunti (a
= ),
poniamo
[a]
+ [b]
:= [a
.
Il prodotto invece va denito cos`:
[a]
[b]
:= [a b]
.
Ritornando ora nella condizione di chi conosce i numeri naturali, `e facile
convincersi che le operazioni appena denite sono proprio quelle di somma e
prodotto che conosciamo n da piccoli.
29
Con quanto precede, riusciamo pertanto ad evitare di dare per scontata
la conoscenza dei numeri naturali (ricordate che `e proprio quanto si dichiara-
va di accettare con la prima frase del 2.1!) che vengono invece deniti, nel
modo appena descritto, in termini di insiemi. In sostanza, tutto ci`o sposta il
punto di partenza, che si accetta senza pretendere ulteriori chiarimenti, dai
naturali agli insiemi. Ci`o che, insieme con considerazioni simili a questa e
relative ad altri settori della matematica, si esprime talvolta dicendo che la
teoria degli insiemi sta alla base della matematica , o anche la matematica
si fonda sugli insiemi.
3.3 Il concetto di numero cardinale
Le considerazioni del paragrafo precedente avrebbero tuttavia pi` u un carat-
tere generalmente losoco che non matematico in senso stretto se si limi-
tassero a fornire delle indicazioni sui fondamenti della matematica, se cio`e
non si accompagnassero a ben altri risultati (non pochi dei quali lo studente
incontrer`a nel prosieguo della lettura di queste dispense), in primo luogo
il concetto di numero cardinale che generalizza al caso innito quello di
numero naturale. Esso ci consentir`a di poter esprimere quanti sono gli ele-
menti di un insieme anche nel caso di insiemi inniti. Forse laspetto pi` u
sorprendente di tutto ci`o `e che la denizione di questo concetto segue stret-
tamente la falsariga della denizione (descritta nel numero 5 del paragrafo
precedente) del concetto di numero naturale. Lunica dierenza `e che ora
occorre applicare quelle considerazioni anche ad insiemi inniti.
Con ci`o il lettore ha gi`a, sostanzialmente, tutte (tutte, in eetti, fuorche
una, invero piuttosto arcana, di cui parleremo tra breve) le informazioni
sucienti ad esplicitare da solo la denizione di numero cardinale; ci`o che lo
invitiamo a provare a fare prima di procedere nella lettura. Sar`a comunque
un ottimo esercizio che gli consentir`a di apprezzare a fondo la sorprendente
semplicit`a di tale denizione.
Data comunque limportanza dellargomento preferiamo descriverla in
dettaglio qui di seguito. Come gi`a si accennava pi` u sopra, si tratta sem-
plicemente di ripetere per il caso di insiemi sia niti che inniti quanto in
precedenza abbiamo fatto nel caso dei soli insiemi niti. Lestensione al caso
innito della relazione di equipotenza non presenta alcuna dicolt`a; come
nel caso nito, due insiemi inniti a, b, sono equipotenti, a b, se esiste
una bigezione f: a b tra essi. Si tratta anche in questo caso di una re-
lazione di equivalenza che quindi, come in precedenza, pu`o essere utilizzata
per quozientare linsieme . . . di tutti gli insiemi (niti e inniti), verrebbe da
dire
(1)
.
`
E qui che si presenta il problema cui si accennava pi` u sopra. il fatto
(1)
Ricordiamo che il passaggio al quoziente richiede due cose, un insieme ed una re-
30
`e che linsieme . . . di tutti gli insiemi non esiste! Esiste, s
`
i, la totalit`a T di
tutti gli insiemi ma essa non `e un insieme; si prova infatti che laccettazione
del suo carattere di insieme porterebbe ad una contraddizione. Si noti che
il fatto che una totalit`a X sia un insieme comporta che X possa essere per-
cepito come un tuttuno, cio`e come una cosa cui abbia senso attribuire un
predicato individuale ovvero, equivalentemente, che possa essere riguardata
come elemento di altri insiemi. In altri termini, se X `e un insieme allora,
per qualche Y , si ha X Y . Tornando alla totalit`a T di tutti gli insiemi si
dimostra
(2)
che, se si vogliono evitare contraddizioni, non esiste alcuna altra
totalit`a Y tale che T Y . In termini intuitivi potremmo dire che T `e troppo
ampia per poter essere riguardata come un tuttuno; totalit`a di questo tipo
vengono oggi dette classi
(3)
.
Il problema pu`o essere risolto facilmente prendendo non linsieme . . . di
tutti gli insiemi ma un insieme di insiemi sucientemente ampio da contenere
tutti gli insiemi che via via ci fa comodo che vi siano; un insieme che abbia
come elementi non solo tutti gli insiemi niti ma ad es. anche gli insiemi
numerici N, Z, R etc., e poi ogni sottoinsieme di un insieme che sia suo ele-
mento, come pure lunione e lintersezione di una qualunque famiglia di suoi
elementi nonche linsieme delle parti T(a) di un qualunque suo elemento a.
Un insieme che quindi sia chiuso rispetto alle usuali operazioni insiemistiche.
Chiamiamo | tale insieme. Ci`o precisato, possiamo considerare linsieme
quoziente
U
verr`a
detta numero cardinale di a o anche cardinalit`a di a. Se a `e nito, il suo
numero cardinale altro non `e che il numero (naturale) dei suoi elementi; se in-
vece a `e innito, questo che in tal caso viene detto cardinale transnito
`e un concetto nuovo che non esisteva prima di Cantor.
Ci si potrebbe chiedere se per caso non capiti che tutti gli insiemi inniti
abbiano la stessa cardinalit`a (nel qual caso il concetto di cardinale transnito
sarebbe sinonimo di innito e tutto il discorso precedente sarebbe poco pi` u
che aria fritta). Fortunatamente le cose non stanno cos`, come verr`a provato
pi` u avanti. Nel 5.7 si vedr`a infatti che non esiste alcuna bigezione tra
linsieme N dei numeri naturali e linsieme R dei numeri reali ne, pi` u in
generale, tra un insieme a e il suo insieme delle parti T(a) (ci`o che comporta
che si possano costruire numeri cardinali transniti via via maggiori
(4)
). Di
lazione di equivalenza su di esso.
(2)
Tutta questa materia verr`a ripresa e approfondita nel corso di Algebra 2.
(3)
Ancora nella prima met`a del secolo scorso il termine classe veniva utilizzato come
sinonimo di insieme.
(4)
Per la denizione della relazione dordine sui cardinali transniti, come per lestensione
ad essi delle operazioni di somma, prodotto, etc. si rinvia alle dispense del corso di
Algebra 2.
31
contro, non `e dicile provare che sia linsieme Z egli interi che quello Q dei
razionali hanno la stessa cardinalit`a di N (si veda il 4.7).
Questo fatto si esprime anche dicendo che N, Z e Q hanno la cardi-
nalit`a del numerabile o anche che hanno
0
elementi mentre R e R Q
hanno la cardinalit`a o potenza del continuo ovvero c elementi
(5)
. In
generale si indicher`a con a la cardinalt`a di un insieme a e con 2
a
:= T(a)
quella del suo insieme delle parti. Si pu`o provare che 2
0
= c.
3.4 Ancora sul passaggio al quoziente
Vi capiter`a, nel corso dei vostri studi, di trovare una gran quantit`a di esempi
di passaggio allinsieme quoziente, a riprova del fatto che si tratta di una delle
costruzioni pi` u importanti della matematica (e non solo). Ora per`o ritornia-
mo alle considerazioni generali e, come annunciato pi` u sopra, spendiamo an-
cora qualche parola per chiarire ulteriormente il senso di questa costruzione.
Quanto diremo risulter`a tanto pi` u chiaro quanto pi` u ci si sforzer`a di con-
frontarlo con gli esempi riportati.
Innanzi tutto, occorre precisare una questione che, pur essendo di inte-
resse e carattere pi` u generale, interviene in modo essenziale nel chiarimento
del reale signicato del passaggio al quoziente. Ci riferiamo allidenticazione
tra un insieme e una propriet`a che ne caratterizzi gli elementi ed al fatto
che, contrariamente a quanto solitamente si pensi, spesso il primo precede
la seconda. In termini tecnici ci`o si esprimerebbe dicendo che in tal caso
lestensione di un insieme precede la sua intensione. In altri termini:
non sono poche le situazioni in cui anziche utilizzare una propriet`a nota P(x)
per denire un insieme X come quello di tutti gli x che godono della propriet`a
P(x), X := x [ P(x), viceversa partiamo dalla conoscenza per cos`
dire concreta dellinsieme X e ce ne serviamo per denire una propriet`a
P(x), quella appunto che aerma che x appartiene a X. Se ad esempio
consideriamo linsieme X delle cose rosse ci verrebbe forse da pensare che
la conoscenza della propriet`a x `e una cosa rossa preceda la conoscenza
di X, mentre invece `e vero proprio il contrario. Da piccoli inizialmente
non avevamo alcuna conoscenza della propriet`a x `e una cosa rossa e vi
siamo arrivati solo attraverso la conoscenza dellinsieme X: ad un certo
punto abbiamo espresso dicendo che x `e una cosa rossa il fatto che x
fosse un elemento di X. Tutto questo, in relazione al passaggio allinsieme
quoziente, `e rilevante allorche dopo aver introdotto la classe [a]
R
di equi-
valenza dellelemento a rispetto alla relazione dequivalenza R, per cui a
questo punto abbiamo della classe [a]
R
una caratterizzazione estensiva
(5)
Come si d`a un nome ai numeri naturali, cos` se ne d`a uno pure ai numeri cardinali.
Tali sono
0
(, che si legge alef, `e la prima lettera dellalfabeto ebraico) e c.
32
passiamo a considerare [a]
R
come un tutto unico (un insieme) e pensiamo
alla propriet`a di appartenere ad esso, propriet`a che `e la caratterizzazione
intensiva di [a]
R
.
`
E linsieme (al variare di a in A) di tali propriet`a, cos`
introdotte attraverso appunto il passaggio allinsieme quoziente, che costi-
tuisce la famiglia di nuovi concetti, che sono astratti se confrontati con la
concretezza dellinsieme A di partenza.
`
E per sottolineare questo aspetto
di produttore di concetti astratti che il passaggio allinsieme quoziente
viene talvolta (soprattutto in ambito logico) chiamato procedimento di
denizione per astrazione.
Unaltra osservazione che ci sembra importante sottoporre allattenzione
del lettore `e la seguente. A tutta lanalisi fatta in precedenza si potrebbe
obiettare che in fondo il procedimento di denizione per astrazione
o passaggio al quoziente che dir si voglia almeno a livello istintivo `e
sempre stato utilizzato dalluomo, e che quindi la dettagliata esplicitazione
che ne abbiamo fatto e la conseguente sintesi nella sua descrizione formale
risultano niente di pi` u che una pedante dissezione della pratica, che tutto
sommato lascia il tempo che trova. Lobiezione non sarebbe forse infondata
se quel procedimento venisse applicato solo alle situazioni oerte dalla vita
quotidiana. Bisogna per`o aver presente quelle di fronte alle quali si trova
luomo di scienza e particolarmente il matematico nel corso del suo
operare. In queste, succede spesso che, studiando una questione che pu`o
essere anche molto complessa e implicare la manipolazione di oggetti niente
aatto familiari, si intuisca prima timidamente e in modo confuso, poi via
via con sempre maggior convinzione una famiglia di concetti che hanno
tutta laria di giocare un ruolo centrale nella questione arontata, concetti
che ad onta degli sforzi del ricercatore
(6)
che quasi sente il cervello in
ebollizione continuano a non farsi aerrare in tutta chiarezza.
`
E proprio in
queste situazioni che non basta pi` u quella conoscenza inconsapevole che pure
in pratica era suciente in situazioni meno intricate, non si riesce cio`e pi` u ad
operare distinto un passaggio al quoziente. Di contro `e proprio la conoscenza
consapevole della descrizione formale di quel processo che viene in soccorso e
che suggerendo, come primo passo, di precisare una opportuna relazione
di equivalenza perviene a farci denire in modo preciso e rigoroso i nuovi
concetti, che si volevano aerrare, proprio come gli elementi del relativo
insieme quoziente.
(6)
O dello studente, che si trova a doversi impadronire di nozioni messe a punto in
precedenza da altri ma per lui del tutto nuove e spesso anche inizialmente astruse.
33
Cap. 4
Le successive estensioni del concetto di numero
II. Dagli interi ai razionali
4.1 Denizione di numero razionale
Si `e visto che linsieme Z degli interi `e dotato di unaddizione e di una molti-
plicazione che godono delle usuali propriet`a. Ovvero, per dirla in termini
moderni (cfr. Appendice 1), che la terna (Z, +, ) `e un anello. Tuttavia,
sempre per dirla nel linguaggio moderno, non forma campo, il che signica
semplicemente che non tutti gli elementi non nulli
(1)
ammettono inverso
moltiplicativo; considerato un elemento x, cos` si chiama un elemento x
tale che x x
esiste
viene indicato con x
1
.
`
E immediato riconoscere che in Z solo 1 e 1 am-
mettono inverso. Dato che la divisione
a
b
di a per b altro non `e che il prodotto
a b
1
di a per linverso di b, lesistenza dellinverso assicura la possibilit`a
di far la divisione, e viceversa. O meglio, nel nostro caso la non esistenza
dellinverso impedisce la possibilit`a di far la divisione, e viceversa. Un modo
equivalente per esprimere questa spiacevole situazione consiste nellosservare
che in Z lequazione
bx a = 0
se a ,= 0 e b ,= 1 non ammette soluzione, cio`e non esiste un intero x che
la soddis. Come si vede la situazione `e simile a quella che ci ha indotto
ad estendere N in Z. Ora occorre cercare un insieme di numeri pi` u vasto
di Z il quale non debba pi` u soggiacere alla limitazione indicata. Anche
in questo caso, sulla falsariga di quanto contenuto nel Cap.2, potremmo
produrre unanalisi puntuale che ci suggerisca i passi da compiere. Daltra
parte sospettiamo che il lettore ne abbia a sucienza di tutto questo spaccar
il capello in quattro e condiamo che ormai, alloccorrenza, sappia comunque
farlo anche da solo. Una sola indicazione, a gettar luce sul seguito: si tenga
presente che luguaglianza
a
b
=
a
equivale allaltra ab
= a
b.
Ci`o detto, bando agli indugi e deniamo sullinsieme Z (Z 0) la
(1)
La richiesta dellesistenza dellinverso di 0 `e assurda, giacche comporterebbe 1 = 0.
34
relazione dequivalenza
(4.1) (a, b) (a
, b
) ab
= a
b
(lasciamo allo studente il compito di vericare che sia riessiva, simmetrica e
transitiva); chiamiamo insieme dei numeri razionali linsieme quoziente
(4.2) Q :=
Z (Z 0)
.
Per indicarne gli elementi, in luogo di [(a, b)]
, b
) e (c, d) (c
, d
+
b
, b
) e (ac, bd) (a
, b
) ovvero che da
(4.5) ab
= a
b e cd
= c
d
si deduce
(4.6) (ad +bc)b
= (a
+b
)bd
e
(4.7) acb
= a
bd.
Per quanto concerne la (4.6), basta sostituire la (4.5) nel primo membro di
(4.6):
(ad +bc)b
= adb
+bcb
= a
bdd
+bb
d = (a
+b
)bd.
Inne la (4.7) si ottiene moltiplicando membro a membro le due (4.5). Tutto
ci`o garantisce la correttezza delle denizioni delladdizione e della moltipli-
cazione.
Lasciamo allo studente il compito di vericare (ma lo si faccia esplicita-
mente per iscritto!) che:
(i) le due operazioni precedenti sono associative, commutative e vale inoltre
la propriet`a distributiva della moltiplicazione rispetto alladdizione;
(ii) lo zero 0 :=
0
1
e lunit`a 1 =
1
1
sono elementi neutri per laddizione e, risp.,
per la moltiplicazione;
(iii) dato un razionale
a
b
, lelemento
a
b
`e il suo inverso additivo (opposto) e,
se a ,= 0, lelemento
b
a
`e il suo inverso moltiplicativo:
a
b
+
a
b
= 0,
a
b
b
a
= 1.
Come gi`a accennato allinizio di questo capitolo il fatto che valgano le pro-
priet`a precedenti si esprime sinteticamente dicendo che la terna (Q, +, ) `e
un campo. Si tratta in eetti del primo esempio di questa importante
struttura algebrica che ci capita di incontrare in questi appunti; altre ne
troveremo pi` u avanti.
4.3 Relazione dordine
Possiamo anche estendere a Q la relazione dordine gi`a presente in Z (cfr.
la ne del Cap.2). A tale scopo poniamo:
(4.8)
a
b
<
c
d
_
_
_
ad < bc se b e d hanno lo stesso segno
ad > bc se b e d hanno segno opposto
36
e
(4.9)
a
b
c
d
a
b
<
c
d
a
b
=
c
d
.
Naturalmente, occorre vericare che la relazione cos` denita gode
delle seguenti propriet`a:
i) dipende esclusivamente dalle classi
a
b
e
c
d
e non dalle coppie (a, b) e (c, d)
scelte a rappresentarle;
ii) `e riessiva, antisimmetrica e transitiva;
iii) eettivamente estende a Q la relazione dordine di Z. In altri termini: se
gli interi a, c sono tali che a < c allora si ha pure
a
1
<
c
1
;
iv) `e compatibile con laddizione e la moltiplicazione (nello stesso senso pre-
cisato, nel caso di Z, alla ne del 2.6). Ci`o si esprime anche dicendo che la
relazione dordine dota (Q, +, ) della struttura di campo ordinato.
Va da se che lasciamo tale verica come esercizio per lo studente.
4.4 Potenze con esponenti razionali
Verrebbe ora naturale aspettarsi di veder presa in considerazione la possi-
bilit`a di attribuire un ragionevole signicato a potenze con esponenti razio-
nali, cio`e ad espressioni del tipo
a
p
q
(p, q Z; q ,= 0).
Diciamo subito che ci`o pu`o eettivamente esser fatto e non richiede neppure
molta fatica. Siccome tuttavia si perverr`a a porre
(4.10) a
p
q
:=
q
a
p
(p, q Z; q ,= 0)
il lettore non avr`a dicolt`a a convenire sullopportunit`a di rinviare tale que-
stione alla ne del capitolo seguente dato che risulta che, anche se a Q e
a > 0, in generale a
p
q
non sar`a un numero razionale. A questo proposito,
per`o, non facciamoci scappare loccasione di ricordare la bella dimostrazione
euclidea della seguente importante proposizione.
Prop. 4.1 Siano m, n interi positivi; se n non `e della forma r
m
per qualche
intero r, allora
m
n =
p
q
per opportuni interi p, q, che non `e restrittivo supporre essere positivi e primi
tra loro. Dalla precedente si ricava
n q
m
= p
m
.
Consideriamo la decomposizione in fattori primi di n:
n = s
t
1
1
s
t
2
2
s
t
h
h
(dove i primi s
1
, s
2
. . . , s
h
sono tutti diversi). Conviene supporre ci`o che
non `e restrittivo (perche?) che gli esponenti t
1
, t
2
, . . . , t
h
siano tutti minori
di m. Sia s
t
uno qualunque degli s
t
i
i
, per cui si ha
(4.11) n q
m
= s
t
n
q
m
= p
m
con n
q
m
= p
m
= s
m
p
.
Poiche s `e un primo che non divide n
347
312 23
473
99000
=
=
2
323
839
99000
=
774
613
33000
.
Ci`o detto, va per`o anche aggiunto anche ad evitare di fornire una
volta di pi` u il anco alle n troppo frequenti, ingiuste critiche di pedanteria
rivolte ai matematici che lo studente pu`o tranquillamente dimenticare
come funziona la regoletta ricordata: dubito infatti che potr`a mai capitargli
di doverla usare. Non va invece dimenticato che esiste, cio`e che la cosa si
pu`o fare.
4.6 Relazione dordine su Q
Vogliamo ora introdurre alcune nozioni duso comune legate ad una
generica relazione dordine denita su un insieme X qualunque (e quindi
anche a quella appena introdotta su Q). Ci riferiamo alle nozioni di mi-
norante, minimo, estremo inferiore e minimale relative ad un dato
sottoinsieme Y di X nonche alle nozioni duali di maggiorante, massimo,
estremo superiore e massimale, le cui denizioni sono in tutto analoghe
alle prime, con la sola dierenza di sostituire il termine minore o uguale
col termine maggiore o uguale.
Un minorante [risp.: maggiorante] di Y `e un elemento m X che
sia minore [risp.: maggiore] o uguale di ogni elemento di Y . Notiamo che
pu`o capitare che un sottoinsieme Y non ammetta minoranti [risp.: maggio-
ranti] come pure che ne ammetta inniti. Ad esempio se X = Q e Y `e
linsieme dei razionali negativi allora Y non ammette alcun minorante ma
ammette inniti maggioranti. Un minorante [risp.: maggiorante] di Y che
appartenga allo stesso Y viene detto il minimo [risp.: massimo] di Y ; luso
dellarticolo determinativo `e giusticato dal fatto che se il minimo [risp.:
massimo] esiste, allora esso `e necessariamente unico. Ad es., scelti X = Q e
Y come sopra, Y non ammette massimo, mentre il suo complementare XY
ammette minimo, lo zero. In questo caso lo zero `e anche estremo superiore
di Y . Diremo infatti che un elemento m X `e lestremo inferiore [risp.:
39
estremo superiore] per il sottoinsieme Y X se m `e il massimo [risp.:
minimo] dellinsieme dei minoranti [risp.: maggioranti] di Y .
Gli insiemi ordinati (Z, ) e (Q, ), nonche, come vedremo pi` u avanti,
quello (R, ) dei numeri reali, rientrano in una classe piuttosto particolare
di insiemi ordinati, i cosiddetti ordini lineari o ordini totali o catene,
cio`e quegli insiemi ordinati che, per cos` dire, si distendono lungo una linea
priva di biforcazioni o, se si vuole, una catena. Pi` u precisamente: un insieme
ordinato (X, ) si dice linearmente ordinato se comunque si prendano
x, y X si ha o x y o y x, cio`e se x e y sono sempre confrontabili
in . Sullaltro versante stanno gli insiemi ordinati caratterizzati da una
struttura ad albero o a rete. Tale `e ad esempio linsieme delle parti
T(A) di un insieme A (che abbia pi` u di un elemento) ordinato dalla relazione
di inclusione . In riferimento ad insiemi ordinati di questo secondo tipo
presenta interesse la nozione di elemento minimale [risp.: massimale] di
un sottoinsieme Y X: viene cos` chiamato un elemento m di Y tale che,
qualunque sia y Y , non risulti y < m [risp.: m < y]. Ovviamente,
per gli insiemi linearmente ordinati le nozioni di elemento minimale [risp.:
massimale] e di minimo [risp.: massimo] si equivalgono.
4.7 Numerabilit`a di Q
Una sottoclasse importante della classe degli ordini totali `e quella degli
insiemi bene ordinati: si dice che un insieme ordinato (X, ) `e bene ordi-
nato, o anche che `e un buon ordine, se ogni suo sottoinsieme
(5)
ammette
minimo. Un famoso teorema dovuto a Zermelo il cosiddetto Teorema
del buon ordine
(6)
aerma che qualunque sia linsieme X esiste sempre
un buon ordine su di esso. A tale proposito osserviamo che `e facile denire
un buon ordine su un insieme X numerabile, cio`e un insieme innito i cui
elementi possano tutti esser contenuti in un elenco:
X = x
0
, x
1
, x
2
, x
3
, . . . , x
n
, . . .;
ci`o si esprime pi` u correttamente dicendo che X `e numerabile se esiste una
bigezione da N a X. Tenendo conto del fatto che (N, ) `e un buon ordine,
`e chiaro allora che, se f: N X `e una bigezione, allora lordine _ su X
denito da
x y f
1
(x) < f
1
(y)
(5)
Quindi anche i sottoinsiemi del tipo {x, y}, e pertanto o x < y oppure y < x, da cui
la linearit`a.
(6)
Si tratta di una proposizione equivalente allAssioma di scelta, ci`o che la dice lunga
sulla sua importanza e sulla sua problematicit`a.
40
`e anchesso un buon ordine. Cos` `e chiaramente un buon ordine su Z quello
consistente nel disporne gli elementi secondo lelenco seguente
Z = 0, 1, 1, 2, 2, 3, 3, . . .;
la bigezione corrispondente `e ora
f: N Z
n (1)
n+1
_
n+1
2
(7)
Pi` u avanti incontreremo anche un secondo procedimento diagonale di Cantor
che ci consentir` a di provare che invece linsieme R dei numeri reali non `e numerabile.
Il matematico tedesco di origine danese Georg CANTOR (18451918) `e stato il
fondatore della Teoria degli insiemi.
41
Va notato che allo stesso modo si pu`o provare che lunione
m=o
A
m
di uninnit`a numerabile
A
0
, A
1
, A
2
, . . . , A
m
, . . .
di insiemi numerabili
A
m
= a
m,0
, a
m,1
, a
m,2
, . . . , a
m,n
, . . .
`e numerabile:
a
0,0
a
0,1
a
0,2
a
0,3
a
0,4
a
0,5
a
1,0
a
1,1
a
1,2
a
1,3
a
1,4
a
1,5
a
2,0
a
2,1
a
2,2
a
2,3
a
2,4
a
3,0
a
3,1
a
3,2
a
3,3
a
4,0
a
4,1
a
4,2
42
Cap. 5
Le successive estensioni del concetto di numero
III. Dai razionali ai reali
5.1 Limiti di Q
Nei capitoli precedenti, partendo dai numeri naturali N e passando per gli
interi Z si `e nalmente trovato un insieme di numeri, quello Q dei razionali,
che `e chiuso rispetto alle quattro operazioni elementari, nel quale cio`e `e
sempre possibile eseguire non solo laddizione e la moltiplicazione ma anche
la sottrazione e la divisione, con lunica eccezione peraltro ineliminabile
della divisione per zero. Inoltre siamo riusciti ad estendere a Q anche
la relazione dordine . Si `e pure visto che, daltra parte, Q non `e chiuso
rispetto allestrazione di radice, neppure nel caso particolare della radice
quadrata.
Tutto ci`o si pu`o anche esprimere dicendo che tutte le equazioni alge-
briche lineari in una indeterminata
(1)
, cio`e quelle della forma ax +b = 0 con
a, b Q, ammettono sempre soluzione in Q. Non cos` le equazioni algebriche
di secondo grado ax
2
+bx +c = 0. Persino alcune di quelle particolarmente
semplici (ad esempio x
2
+1 = 0 oppure, come subito segue dalla Prop. 4.1,
x
2
2 = 0) non ammettono soluzione in Q. Lequivalenza fra le due diverse
formulazioni del problema `e semplicemente dovuta al fatto che, come tutti
sanno e come peraltro si prova senza dicolt`a per verica diretta, le soluzioni
dellequazione quadratica ax
2
+bx +c = 0 sono date dallespressione
b
b
2
4ac
2a
.
Siamo quindi da capo: occorre trovare un nuovo insieme di numeri, pi` u
grande di Q, nel quale sia possibile trovare le radici di tutte le equazioni
quadratiche. Vedremo, nel corso del presente e del nono capitolo, che questo
risultato potr`a essere conseguito ma che converr`a dividere il percorso in due
tappe. Prima per`o vogliamo illustrare brevemente come la necessit`a di un
ampliamento di Q si presenti anche in un contesto diverso dal precedente,
un contesto geometrico.
(1)
E quindi anche in pi` u indeterminate.
43
La Scuola pitagorica (VI sec. a.C.) aveva creduto di individuare nella
nozione di numero intero lo strumento principe per indagare tutta la real-
t`a. Ogni fenomeno naturale veniva descritto ed interpretato in termini di
numeri interi, o di altri concetti riconducibili ad essi (quali ad esempio i
razionali). Va detto che questa scelta che a noi oggi appare come decisa-
mente mistica e irrazionale non mancava tuttavia di avere in quel periodo
una forte connotazione razionale e addirittura scientica. Ci`o suggerivano
infatti, ad esempio, le scoperte in campo musicale dei pitagorici, per non
parlare dellenorme sviluppo che essi riuscirono ad imprimere alla ricerca
matematica, tanto che ancor oggi il Teorema di Pitagora `e senza dubbio
tra le poche proposizioni della matematica che sono universalmente note in
un ambiente di media cultura. Non tutto per`o funzion`o nel modo giusto e
proprio un caso particolare del Teorema di Pitagora costitu` la pietra dello
scandalo. Vediamo di che si tratta.
Ricordiamo che due segmenti di retta, diciamoli AB e CD, si dicono
commensurabili se, rispetto ad una opportuna unit`a di misura OU, la
misura di entrambi `e espressa da numeri interi:
AB = p OU, CD = q OU,
ovvero, equivalentemente, se la misura del primo rispetto al secondo `e espri-
mibile mediante un numero razionale:
AB =
p
q
CD.
Orbene qualcuno dei pitagorici prov`o che, per quanto piccolo venga scelto
il segmento OU da adottare come unit`a di misura, pur sempre tuttavia non
si riescono ad esprimere contemporaneamente mediante due numeri interi le
misure del lato e della diagonale di un quadrato. In altri termini, se vogliamo
approssimare mediante un numero decimale il rapporto tra la diagonale di un
quadrato e il suo lato, per quante cifre decimali si prendano in considerazione
non si riscontrer`a mai alcuna periodicit`a. La diagonale del quadrato e il
suo lato sono pertanto segmenti tra loro incommensurabili. In linguaggio
aritmetico, in virt` u del Teorema di Pitagora ci`o si esprime dicendo
2 non
`e un numero razionale. I pitagorici avevano quindi scoperto che non possia-
mo fare a meno di quelli che noi oggi chiamiamo numeri irrazionali, che,
insieme con i razionali, formano linsieme dei numeri reali. La leggenda
racconta che a causa di questa scoperta la Scuola pitagorica piomb`o nella
pi` u cupa disperazione, che esasper`o i caratteri esoterici della setta segnando
linizio della sua ne. Tutto ci`o `e paradossale da pi` u di un punto di vista.
Intanto ci`o che i pitagorici vissero come uno smacco ignominioso `e al contrario
risultato essere una delle pi` u grandi scoperte dellumanit`a. Scoperta che
peraltro confermava clamorosamente uno dei tratti pi` u peculiari di quella
44
(ma non solo quella) scuola di pensiero: il primato della teoria sulla pratica.
Va infatti tenuto presente che se da un lato nessuno scienziato o ingegnere o
economista pu`o fare a meno di alcuno dei vari assetti teorici che inquadrano
i numeri reali (lanalisi matematica, in primo luogo), daltro lato nessuno di
loro in pratica utilizzer`a mai in modo eettivo alcun numero reale che non
sia anche razionale. Con buona pace per tutta la retorica che infarcisce il
pensiero (?) di chi propugna la superiorit`a del fare sul sapere.
5.2 Sulle equazioni quadratiche
Riconsideriamo lesigenza di ampliare linsieme dei numeri razionali in modo
da poter sempre risolvere le equazioni quadratiche. Succede che ad un even-
tuale ampliamento X di Q che soddis tale condizione non sar`a possibile
estendere anche la relazione dordine dei razionali. Pi` u precisamente, si
ha il risultato seguente:
Prop. 5.1 Sia data lequazione ax
2
+ bx + c = 0 e supponiamo che essa
ammetta radici , in un opportuno ampliamento X di Q. (Non escludia-
mo che anche i coecienti a, b, c dellequazione possano essere in X.) Se il
discriminante := b
2
4ac della nostra equazione `e negativo allora non
`e possibile estendere a X la relazione dordine .
Dimostrazione: Ragionando per assurdo, supponiamo di aver esteso a X
la relazione dordine e iniziamo con losservare che considerazioni simili
a quelle che hanno giusticato lanaloga aermazione che concludeva il 2.6
provano che ogni quadrato z
2
di un elemento z X deve necessariamente
essere positivo. Ci`o premesso, si consideri la decomposizione
(2)
ax
2
+bx +c = a(x )(x ) = a(x
2
( +)x +),
da cui
b = a( +) e c = a.
Ne consegue
a
2
( )
2
= a
2
( +)
2
4a
2
= b
2
4ac = < 0.
Contraddizione!
Stanti cos` le cose e dal momento che non ci va di rinunciare allegramente
alla relazione dordine, possiamo vedere se, rinunciando provvisoriamente alla
(2)
Qui sfruttiamo tacitamente la propriet`a per cui se `e radice di un polinomio, allora
questo `e divisibile per x .
45
pretesa di poter risolvere tutte le equazioni quadratiche ed accontentandoci
invece di risolvere quelle che hanno discriminante := b
2
4ac non negativo
(giacche, come si `e visto nella proposizione precedente, sono proprio quelle a
discriminante negativo che creano problemi), non si riesca ora a trovare un
opportuno ampliamento X di Q nel quale si possa anche estendere la relazione
dordine. Il resto di questo capitolo sar`a dedicato a illustrare come questa
pi` u ragionevole richiesta potr`a essere soddisfatta, cio`e a costruire linsieme
R dei numeri reali e a studiarne le propriet`a elementari che mostrano che si
tratta proprio dellinsieme cercato.
Prima di procedere a tale costruzione, che avr`a una sua complessit`a,
sottolineiamo che le denizioni che seguono fanno uso esclusivo di concetti
gi`a noti, in particolare di quello di numero razionale; per cui si potr`a dire
che la costruzione dei reali si fonda sui razionali e quindi, in ultima
analisi, sui naturali (che tutto `e partito da l`). Questa considerazione `e
cruciale: se non fosse per essa, infatti, non si capirebbe il senso e la neces-
sit`a di tutta la costruzione che segue e sarebbe legittimo riutarsi di farla
cos` complicata ed accontentarsi invece dellidea intuitiva, vaga, imprecisa,
niente aatto rigorosa che nora abbiamo avuto dei reali e che in fondo ha
svolto egregiamente un suo ruolo in problemi e calcoli. Aggiungiamo pure,
per`o, che non siamo fanatici integralisti e quindi non vogliamo aatto negare
completamente valore a tale idea intuitiva: ora, come pure in altre situazioni
simili, si tratter`a solo di precisarla e quindi di rendere rigoroso quello stesso
concetto intuitivo. Non `e detto, tuttavia, che il riconoscere che si sta facendo
proprio questo non richieda un certo sforzo di pensiero.
5.3 Sezioni di Dedekind
Prima di appesantire il discorso con denizioni rigorose che possono tuttavia
apparire astratte e scostanti, e quindi poco comprensibili, sprechiamo ancora
qualche parola per illustrare, a livello intuitivo, la via che si vuole seguire.
Riprendiamo per un attimo in considerazione la
2, cio`e quelleventuale
numero che elevato al quadrato d`a 2:
2
= 2. Per il momento sappiamo
che tra i numeri che gi`a conosciamo, cio`e tra i razionali, tale numero non c`e
e che perci`o `e tra quelli che vogliamo denire. Supponiamo per un istante di
aver gi`a dato tale denizione e di aver provato che linsieme X cos` denito
soddis pure a tutte le altre richieste indicate pi` u sopra, ivi comprese quelle
relative alla relazione dordine
(3)
. Avr`a allora senso considerare gli insiemi
A := x Q [ x < e A
:= x Q [ x >
(3)
Per cui, in particolare, sar`a corretto dedurre x
2
<
2
< y
2
da 0 < x < < y, per
x, , y X.
46
in cui ciascun elemento del primo `e minore di ogni elemento del secondo.
Viene quindi spontaneo pensare di identicare con la coppia (A, A
) di
sottoinsiemi di Q deniti pi` u sopra e assumere questa come una denizione
(in termini di numeri razionali) di stesso. Detto cos` sembrerebbe un circolo
vizioso giacche gli insiemi A e A
:= x Q [ x > 0 x
2
> 2
riottenendo gli stessi insiemi di prima ma senza far riferimento ad e ren-
dendo quindi legittima
(4)
la denizione
:= (A, A
).
Mi auguro che tutto questo renda facilmente comprensibile il senso del se-
guito.
Def. 5.1: Si dice che una coppia (A, A
e maggiore di ogni
elemento di A. A questo proposito si noti che se per caso vi fosse un tale elemento
= , e fosse ad es. < (ci`o che non `e restrittivo assumere), allora un eventuale
razionale x compreso tra e apparterrebbe sia ad A che ad A
, mentre A A
=
. Quindi lesistenza, oltre che di , anche di un tale razionale x comporterebbe
una contraddizione. Il fatto `e per`o che le nostre richieste su X non comportano
aatto che tra due dati elementi distinti e di X vi sia sempre un razionale!
Fortunatamente non lo escludono neppure, che altrimenti la scelta (suggerita dalle
considerazioni precedenti e illustrata nel paragrafo seguente) di denire i reali come
sezioni di Dedekind non funzionerebbe. (La condizione che tra due dati elementi
distinti e di X vi sia sempre un razionale si esprime dicendo che linsieme Q dei
razionali `e ovunque denso sullinsieme R dei reali.)
Queste osservazioni suggeriscono pure che, rinunciando certo allidea di denire i reali
come sezioni di Dedekind, si potrebbe contestualmente lasciar cadere la condizione
che tra due elementi distinti di X vi sia sempre almeno un razionale e purtuttavia
riuscire a trovare un insieme X che soddis a tutte le altre nostre richieste.
`
E proprio
ci`o che `e riuscito a fare il logico-matematico statunitense di origine tedesca Abra-
ham ROBINSON (1918-1974) con la scoperta dei cosiddetti reali non-standard,
la cui teoria, detta analisi non-standard, `e (almeno) altrettanto soddisfacente che
lanalisi classica. Una delle caratteristiche distintive dei reali non-standard `e la pre-
senza tra loro di innitesimi attuali; vi sono cio`e dei reali non-standard positivi
indichiamo con uno di essi pi` u piccoli di ogni reale non-standard che non
sia esso stesso un innitesimo attuale. Ci`o comporta che tra e + non vi sia
alcun razionale. Unaltra conseguenza signicativa `e che i reali non-standard non
costituiscono un campo ordinato archimedeo (come invece i reali usuali); vale a
dire: presi due reali non-standard , , con 0 < < , non necessariamente esiste
un intero positivo n tale che n > . Il lettore interessato pu`o trovare maggiori det-
tagli in Lanalisi nonstandard di M.Davis e R.Hersch, Le Scienze, n.40, settembre
1972.
(5)
Il tedesco Richard DEDEKIND (18311916) `e stato il primo matematico a porsi
esplicitamente il problema della sistemazione di una teoria generale dei numeri reali.
Un altro grande matematico che, come vedremo, ha svolto un ruolo da pioniere in
questo campo, `e stato Georg Cantor, il fondatore della Teoria degli insiemi.
47
1) costituiscono una partizione di Q, cio`e A A
= Q e A A
= ;
2) ogni elemento di A `e minore di ogni elemento di A
;
3) per ogni elemento a A vi `e almeno un elemento b A maggiore di a,
cio`e A non ammette elementi massimali [ovvero, equivalentemente in questo
caso, A non ammette massimo].
Va notato che un sottoinsieme proprio non vuoto A di Q che, oltre che
alla condizione 3), soddis anche alla
(6)
4) se a A e b < a allora b A
determina univocamente una sezione di Dedekind, e cio`e la sezione (A, CA).
Potremmo quindi, senza incorrere in alcun inconveniente, riferirci a sot-
toinsiemi siatti anziche a sezioni di Dedekind, ma preferiamo seguire una
tradizione consolidata. Si tenga per`o ben presente questa osservazione, che
altrimenti nel seguito non si capirebbe perche talvolta ci accontenteremo di
prendere in considerazione il solo primo elemento della coppia (A, A
).
Def. 5.2: Deniamo linsieme R dei numeri reali come linsieme di tutte
le sezioni di Dedekind.
Occorre mostrare che linsieme R dei reali cos` denito soddisfa a tutte
le condizioni richieste, vale a dire
I) che `e possibile denire in R le quattro operazioni elementari +, , , : e
che esse soddisfano alle usuali propriet`a;
II) che si pu`o denire su R una relazione dordine ;
III) che si pu`o immergere Q in R in modo che le suddette operazioni e la re-
lazione dordine risultino unestensione delle analoghe operazioni e relazione
dordine su Q;
IV) inne, che in R ammette soluzione ogni equazione quadratica a discri-
minante non negativo.
Procediamo con ordine. In quanto segue indicheremo con = (A, A
),
= (B, B
), = (C, C
) e = (D, D
) ,= 0 per il
quale tutti gli elementi in A
), dove X := a
[ a
)
viene denito ponendo Y := y [ y < (a
)
1
per qualche a
; se poi `e
negativo si pone
1
:= (()
1
). Ci`o premesso poniamo:
+ : R R R
(, ) + = = (C, C
)
(addizione)
dove C := a +b [ a A b B;
: R R R
(, ) := + ()
(sottrazione);
: R R R
(, ) = = (D, D
)
(moltiplicazione)
dove: i) se , 0, D
:= a
[ a
)
(immersione canonica)
dove R := x Q [ x < r.
Al solito, lasciamo allo studente la verica di I), II) e III). Invece, per
quanto riguarda la IV) ovvero, equivalentemente, per lesistenza della
radice quadrata di un arbitrario reale non negativo r osserviamo esplici-
tamente che, posto
:= (S, S
) dove S
:= x Q [ x > 0 x
2
r,
resta denito correttamente un reale non negativo per il quale
2
= r;
poich`e ci`o non vale per alcun altro reale non negativo (lo si provi! [sugge-
rimento: si sfrutti il fatto che la dierenza di due quadrati `e uguale a . . .]),
49
avremo
r =
(7)
. Con ragionamento simile si pu`o provare anche lesistenza
nei reali della radice n-esima di un arbitrario reale non negativo r per ogni
intero positivo n. Anche in questo caso si pu`o provare che esiste un solo reale
positivo soddisfacente a tale condizione; pi` u avanti, tuttavia, vedremo che,
accanto eventualmente allopposto di quello (nel caso n pari), se n > 2 vi sono
sicuramente anche altre radici n-esime in tutto ve ne sono esattamente n
da ricercarsi tra i numeri complessi non reali.
5.4 Teorema di completezza di Dedekind
Ci si potrebbe chiedere se, denendo, esattamente come nel paragrafo prece-
dente, delle sezioni di Dedekind non pi` u dellinsieme Q dei razionali ma di
quello R dei reali appena deniti, queste nuove sezioni non possano venir
utilizzate allo stesso modo delle precedenti per denire un nuovo insieme
di numeri, pi` u ampio di quello dei reali. E poi ripetere ancora e ancora
il procedimento. Fortunatamente la risposta a tale domanda `e negativa,
come assicura il seguente importante teorema, del quale tralasciamo la di-
mostrazione.
Prop. 5.2 (Teorema di completezza di Dedekind) Sia A un sottoin-
sieme proprio di R. Se A `e un ideale dordine che non ammette massimo
cio`e, se A soddisfa alle condizioni 3) e 4) del paragrafo precedente allora
esiste in R uno ed un solo elemento tale che A = x R [ x < .
La nuova sezione (A, R A) ci farebbe quindi riottenere il reale , che
viene perci`o detto elemento separatore delle due classi complementari A
e R A.
5.5 Denizione cantoriana di numero reale
Vi `e anche un altro modo, dovuto a Cantor, per denire i numeri reali in
termini di numeri razionali. Da un certo punto di vista esso `e anche pi` u
interessante di quello di Dedekind: fa uso di un procedimento che, con le
dovute modiche, pu`o essere applicato anche ad altre costruzioni. Sfortu-
natamente richiede nozioni meno elementari di quelle messe in campo nora.
Per questo motivo ed anche perch`e le due denizioni (di Dedekind e di Can-
tor) di numero reale sono equivalenti, non ci pare opportuno esporre in modo
particolareggiato anche la denizione di Cantor. Data la sua importanza, non
possiamo per`o neppure esimerci quanto meno dallaccennare allidea che sta
(7)
Con la notazione
r denoteremo quella positiva delle due opposte determinazioni
della radice.
50
alla base di tale denizione.
Ricordiamo che si dice che il numero reale `e il limite di una successione
di numeri reali
a
0
, a
1
, a
2
, . . . , a
n
, . . . ,
o anche che tale successione converge ad , e si scrive
= lim
n
a
n
,
se, comunque si prenda il numero positivo , esiste sempre un indice n
tale
che, per ogni indice n > n
, si abbia
[ a
n
[ < .
Pu`o capitare di chiedersi se una successione a
0
, a
1
, a
2
, . . . , a
n
, . . . ammetta
limite senza per`o avere alcun buon candidato per tale ruolo, per cui la
denizione precedente non pu`o esser daiuto. In tal caso viene in soccorso il
cosiddetto Criterio generale di convergenza di Cauchy
(8)
che aerma
che la successione (1) converge in R se e solo se comunque si prenda il numero
positivo , esiste sempre un indice n
, si ha
[a
n
a
m
[ < .
Chiamiamo successione di Cauchy una successione di numeri razio-
nali che soddis al criterio precedente; a ciascuna di queste successioni resta
quindi associato uno ed un solo numero reale, il suo limite. Viceversa
ogni reale pu`o essere riguardato come il limite di una successione di nu-
meri razionali. Tale corrispondenza non `e tuttavia biunivoca: due diverse
successioni di numeri razionali, a
0
, a
1
, a
2
, . . . , a
n
, . . . e b
0
, b
1
, b
2
, . . . , b
n
, . . .,
possono infatti avere lo stesso limite. In tal caso per`o la successione dif-
ferenza a
0
b
0
, a
1
b
1
, a
2
b
2
, . . . , a
n
b
n
, . . . converge a zero. Chiameremo
equivalenti due successioni di Cauchy (a
n
) e (b
n
) in simboli, (a
n
) (b
n
)
la cui successione dierenza converge a zero. Indicato con o linsieme di
tutte le successioni di Cauchy, vi `e allora una corrispondenza biunivoca tra
linsieme quoziente
S
.
Su tale insieme `e possibile denire oltre che le quattro operazioni elementari
anche la relazione e lestrazione di radice e provare che tutto ci`o costituisce
(8)
Il francese Augustin-Louis CAUCHY (17891857) `e stato uno dei pi` u grandi mate-
matici del XIX secolo.
51
una risposta al problema posto allinizio del capitolo. Inoltre, pur se le
costruzioni di Dedekind e di Cantor sono profondamente diverse si dimostra
tuttavia che le due strutture ottenute sono isomorfe, cio`e che i reali secondo
Dedekind e quelli secondo Cantor sono sostanzialmente la stessa cosa, ci`o che
peraltro `e intuitivamente ovvio.
5.6 Potenze con esponenti reali
Siamo ora in grado di riprendere la questione lasciata in sospeso nel 4.4, cio`e
la possibilit`a di attribuire un ragionevole signicato a potenze con esponenti
razionali
a
p
q
(p, q Z; q ,= 0)
cui aggiungiamo ora unanaloga questione relativa ad esponenti reali
a
( R).
Occupiamoci innanzi tutto della prima. Abbiamo gi`a detto che viene del
tutto naturale porre
(5.1) a
p
q
:=
q
a
p
(p, q Z; q ,= 0).
La giusticazione di questa scelta `e molto simile a quella che, nel 2.7, ci ha
indotto a porre
a
0
:= 1, e a
n
:=
1
a
n
(n < 0);
in quel caso tale scelta garantiva la validit`a della formula
a
n
: a
m
= a
nm
per ogni coppia di interi n, m. Similmente, nel caso attuale, la 5.1 garantisce,
come facilmente si verica, che la formula
(a
n
)
m
= a
nm
valga non solo per n, m interi ma anche per n, m razionali arbitrari e, vice-
versa, questultima vale per n, m razionali arbitrari solo se vale la 5.1.
Passiamo alle potenze a
) in R. Ricordiamo
in primo luogo che se x A e x
allora si ha x < x
e quindi a
x
< a
x
.
Consideriamo poi il sottoinsieme B di Q costituito da tutti i razionali y
minori
(9)
o uguali ad a
x
per qualche x A. Tale insieme B soddisfa, come
(9)
Si tenga presente che anche se y `e razionale non `e detto che esista un razionale z tale
che a
z
= y, cio`e non necessariamente log
a
(y) Q.
52
facilmente si verica, alle condizioni 3) e 4) del 5.4 e quindi, posto B
= CB,
la coppia (B, B
:= (B, B
).
Lasciamo allo studente la verica della validit`a, anche in questo caso, delle
usuali propriet`a elementari delle potenze:
a
= a
+
, a
: a
= a
, (a
= a
.
5.7 Potenza del continuo
Nel 4.7 abbiamo visto che linsieme N degli interi e quello Q dei raziona-
li sono numerabili.
`
E banale osservare che ogni insieme innito (innito
secondo lintuizione comune di tale termine
(10)
) X ammette sicuramente un
sottoinsieme numerabile: si prenda un elemento x
0
, e poi un elemento x
1
diverso da x
0
, e poi un elemento x
2
diverso da x
0
e da x
1
, e cos` via . . .
allinnito. Ci`o induce lidea che, tra gli insiemi inniti, quelli numerabili
siano i pi` u piccoli. Nasce allora spontanea la domanda: ma poi, ne esistono
di pi` u grandi o, al contrario, tutti gli insiemi inniti sono numerabili?
Esistono cio`e degli insiemi inniti X tali che, comunque si formi un elenco
costituito da loro elementi
x
0
, x
1
, x
2
, x
3
, . . . , x
n
, . . . ,
vi sar`a sempre almeno un elemento (e quindi inniti elementi) di X non
compreso nel suddetto elenco? Tra i meriti di Cantor va certamente annove-
rato quello di essersi posto questa domanda e di averne trovato la risposta
positiva dimostrando che linsieme R dei numeri reali non `e numerabile. Ve-
diamo come. Osserviamo intanto che basta dimostrare che non `e numerabile
(10)
Abbandonando il punto di vista intuitivo e assumendone uno rigoroso, potremmo,
invertendo tale aermazione, dire che per denizione, un insieme `e innito se am-
mette un sottoinsieme numerabile. Questo `e uno dei tanti modi equivalenti per
denire il concetto di insieme innito. Uno di questi in qualche modo simile al
precedente ma pi` u soddisfacente giacche non fa uso neppure della nozione di insieme
numerabile `e dovuto a Dedekind, secondo il quale un insieme X va detto innito
se ammette un sottoinsieme Y equipotente con esso, cio`e tale che X e Y siano
legati da una bigezione. Unaltra denizione ancora la si deve al logicomatematico
polacco Alfred TARSKI (19011983): un insieme X `e nito se ogni sottoinsieme
non vuoto dellinsieme di parti P(X) ammette un elemento minimale; per cui, vice-
versa, `e innito se esiste una famiglia X
1
, X
2
, . . . , X
n
, . . . di sottoinsiemi di X cia-
scuno dei quali contenga propriamente il successivo: X X
1
X
2
. . . X
n
. . .
Come dire: X `e innito se gli posso togliere qualche elemento, e poi ancora qualcuno,
e poi di nuovo qualcun altro . . . e cos` via . . . senza che laverlo svuotato completa-
mente mi costringa a fermarmi.
53
linsieme di numeri contenuti nellintervallo aperto I := x R [ 0 < x < 1.
Questultima aermazione viene provata facendo uso del secondo procedi-
mento diagonale di Cantor. Dopo aver osservato che la rappresentazione
decimale del generico elemento a di I `e del tipo
a = 0, a
0
a
1
a
2
a
3
. . . a
n
. . .
dove con a
n
si `e denotata la (n + 1)-esima cifra decimale di a, consideriamo
un eventuale elenco di tutti gli elementi di I:
x
0
= 0, x
0,0
x
0,1
x
0,2
x
0,3
. . . x
0,n
. . .
x
1
= 0, x
1,0
x
1,1
x
1,2
x
1,3
. . . x
1,n
. . .
x
2
= 0, x
2,0
x
2,1
x
2,2
x
2,3
. . . x
0,n
. . .
.
.
.
.
.
.
.
.
.
x
m
= 0, x
m,0
x
m,1
x
m,2
x
m,3
. . . x
m,n
. . .
.
.
.
.
.
.
.
.
.
dove x
m,n
denota la (n + 1)-esima cifra decimale dellm-esimo elemento
dellelenco. Consideriamo ora il numero
y = 0, y
0
y
1
y
2
y
3
. . . y
n
. . .
cos` denito: la sua n-esima cifra decimale y
n
vale 1 se la n-esima cifra
decimale x
n,n
delln-esimo numero del precedente elenco `e diversa da 1, e
vale 0 in caso contrario. Ovviamente tale numero y appartiene a I ma non
pu`o certamente esser contenuto in quellelenco: dovrebbe occupare infatti
una diciamo la h-esima posizione, ma ci`o `e assurdo giacche la sua
h-esima cifra decimale `e sicuramente diversa dalla h-esima cifra decimale
dellh-esimo numero dellelenco.
Il risultato precedente `e della massima importanza: ha aperto uno squar-
cio nel mondo dellinnito
(11)
, mondo che in precedenza si era presentato
avvolto da una spessa nebbia che occultava le profonde dierenze che pure
vi sono tra gli insiemi inniti. Per ora ne `e stata messa in evidenza una:
la possibilit`a di contenere un dato insieme innito in un opportuno elenco,
ovviamente innito, o, di contro, il fatto che il dato insieme sia troppo nu-
meroso per costringerne gli elementi a disporsi tutti in un elenco. Tra i
primi insiemi vi sono, come si `e visto, N, Z e Q; tra i secondi R e quindi
anche linsieme R Q dei numeri irrazionali.
(11)
Sarebbe pi` u corretto dire degli insiemi inniti (cfr. la nota (9) di questo capitolo),
che il termine innito anche nella stessa matematica (per non parlare della sica o
addirittura della losoa) esprime tanti concetti diversi tra loro e dal precedente. Per
questo motivo (ma non solo) quando interviene il concetto di innito va in generale
raccomandata la massima cautela.
54
Sempre utilizzando il secondo procedimento diagonale di Cantor, si
pu`o dimostrare che linsieme T(X) delle parti di un insieme innito X `e
uninnit`a pi` u grande di X. Infatti, se per assurdo esistesse una bigezione
f: X T(X), x f(x) allora, posto Y := y [ y X y , f(y) e
z := f
1
(Y ) X, si otterrebbe la contraddizione z Y z , Y .
Senza addentrarci oltre in questa materia, che compete ad un corso avan-
zato di Teoria degli insiemi, osserviamo solo che questo risultato garantisce
lesistenza di insiemi inniti via via pi` u grandi:
X < T(X) < T(T(X)) < T(T(T(X))) < . . .
55
Cap. 6
Propriet`a degli interi
Il Teorema fondamentale dellaritmetica
6.1 Lanello Z degli interi
Nel Cap.2 abbiamo introdotto linsieme dei numeri interi
Z = . . . , 2, 1, 0, 1, 2, . . .
ed abbiamo denito su di esso due operazioni binarie, laddizione + e la
moltiplicazione , che godono delle propriet`a seguenti:
1) sono entrambe associative e commutative;
2) ammettono entrambe un elemento neutro, rispettivamente lo zero 0 e
lunit`a 1;
3) ogni elemento x Z ammette inverso additivo x: x + (x) = 0;
4) la moltiplicazione `e distributiva rispetto alladdizione.
Tutto ci`o si esprime nel linguaggio dellalgebra moderna dicendo che la
terna (Z, +, ) costituisce un anello commutativo con unit`a, mentre se ci
si riferisce alle sole prime tre propriet`a precedenti si dice che (Z, +) costituisce
un gruppo abeliano
(1)
e che (Z, ) costituisce un monoide commutativo.
Si coglie bene limportanza della propriet`a distributiva 4) se si nota che,
stabilendo un preciso legame tra queste due ultime strutture, essa completa
la dotazione in Z di una struttura quella di anello sostanzialmente pi` u
ricca del semplice giustapporsi delle due strutture di gruppo additivo e di
monoide moltiplicativo.
Anche semplicemente sfruttando le quattro propriet`a precedenti (oltre
che tirando invece in ballo la denizione di intero in termini di numeri na-
turali) possono essere dimostrate le usuali elementari propriet`a note come
regole dei segni e quella per cui 0 x = 0 per ogni x. Pertanto queste
ultime valgono anche in ogni altro anello. Valgono invece in Z ma non
necessariamente in altri anelli le due ulteriori propriet`a elementari:
(1)
Laggettivo abeliano che si usa in relazione alla sola struttura di gruppo e che
ricorda il grande matematico norvegese Niels ABEL (18021829) `e sinonimo di
commutativo.
56
5) se x ,= 0 e x y = x z allora y = z (regola di semplicazione);
6) se x ,= 0 e x y = 0 allora y = 0 (assenza di divisori dello zero).
Lasciamo allo studente lonere di dedurle dalla denizione di intero data
nel Cap.2. Osserviamo per`o che sono tra loro equivalenti. Infatti da xy = xz
consegue (per la propriet`a distributiva) che x (y z) = 0; da questo e da
x ,= 0 per la 6) si deduce y z = 0 e quindi y = z; ergo 6)5). Viceversa,
5)6): da x ,= 0 e x y = 0 = x 0 per la 5) si deduce y = 0.
Si `e anche denita in Z una relazione dordine , che anzi `e risultata
essere un ordine lineare (se x , y allora y < x) per giunta compatibile con
laddizione (x < y x+z < y +z) e la moltiplicazione (x < y x z < y z
per ogni z > 0, mentre x < y x z > y z se z < 0). Vale inoltre la
propriet`a archimedea: presi ad arbitrio due interi a, b, con a < b, esiste
sempre un intero n tale che na > b. Con linguaggio moderno: Z `e un
anello ordinato archimedeo. Riconsiderando per un istante la 5) e la 6),
`e interessante notare che possono anche essere dedotte dalla compatibilit`a
della moltiplicazione con (unitamente con le 1)4)), e valgono quindi in
ogni anello linearmente ordinato. Basta provare la 5). Se fosse y ,= z, per
cui, ad es., y < z, si avrebbe o x y < x z (se x > 0), oppure x y > x z (se
x < 0); in entrambi i casi x y ,= x z, contro lipotesi. Lassurdo prova che
y = z.
6.2 Divisione euclidea
Prop. 6.1 (Esistenza e unicit`a di quoziente e resto) Dati due numeri
interi a e b > 0, esiste una ed una sola coppia di interi q e r tali che
a = qb +r, 0 r < b .
Gli interi q e r vengono detti quoziente e, rispettivamente, resto nella
divisione euclidea di a (dividendo) per b (divisore).
Dimostrazione: Proviamo dapprima lesistenza. Essendo Z un anello or-
dinato archimedeo, esister`a sicuramente qualche intero p tale che pb > a;
pertanto linsieme P := p Z [ pb > a `e non vuoto; poiche `e anche
limitato inferiormente, ammetter`a minimo, diciamolo q + 1. Si ha allora:
qb a < (q + 1)b e quindi 0 a qb < b.
Ne consegue:
a = qb +r con 0 r := a qb < b.
`
E cos` provata lesistenza della coppia quoziente/resto. Si noti che il ragiona-
mento precedente funziona perfettamente anche per ogni intero a (eventual-
mente negativo) minore di b
57
Resta da provare lunicit`a. A tale scopo supponiamo che esistano due
coppie siatte
a = qb +r, 0 r < b;
a = q
b +r
, 0 r
< b.
Sottraendo membro a membro si ottiene
0 = (q q
)b + (r r
).
Se q q
,= 0, dalle disuguaglianze 0 r, r
< b consegue [r r
[ < b
[b(qq
)b+(rr
). Pertanto
q = q
e quindi pure r = r
.
Siamo certi che nessuno sentir`a il bisogno che gli venga ricordato lalgoritmo
euclideo di divisione per la ricerca di quoziente e resto.
Se il resto r della divisione di a per b `e nullo si dice che a `e un multiplo
di b o, equivalentemente, che b `e un divisore di a; in simboli: b[a (leggi:
b divide a o anche b `e un divisore di a). La restrizione allinsieme Z
+
degli interi positivi della relazione essere un divisore di `e una relazione
dordine, cio`e `e riessiva, antisimmetrica e transitiva. Nel caso dellintero
insieme Z continua a valere la propriet`a transitiva, ma non quella riessiva (a
causa della presenza dello zero) ne quella antisimmetrica, perche due elementi
opposti h ,= 0 e h dividono ciascuno laltro senza tuttavia coincidere.
Fissato un elemento h in Z, consideriamo linsieme hZ := nh [ n Z
costituito da tutti i multipli di h. Si verica immediatamente che hZ `e
chiuso rispetto alladdizione (cio`e a, b hZ a + b hZ), contiene lo
zero e contiene lopposto di ogni suo elemento. Equivalentemente: hZ `e
chiuso rispetto alla sottrazione. Questo si esprime dicendo che hZ `e un
sottogruppo del gruppo additivo Z. Vale anche il viceversa, e cio`e ogni
sottogruppo H di Z `e necessariamente della forma hZ. Infatti, indicato con
h il pi` u piccolo intero positivo contenuto in H, questultimo dovr`a contenere
pure h, e quindi anche h + (h) = 0, e pi` u in generale per ogni n Z
anche nh, giacche, se n > 0, nh = h + h + + h
n volte
mentre nh =
(h) + (h) + + (h)
(n) volte
se n < 0. Ne consegue hZ H. Daltra
parte, sia a un arbitrario elemento di H; la divisione per h d`a: a = qh + r
con 0 r < h; ma r = a qh in quanto dierenza di due elementi di H `e
esso stesso elemento di H e quindi, per la minimalit`a di h, deve aversi r = 0.
Pertanto a = qh e quindi H hZ. Resta cos` completata la dimostrazione
della seguente
Prop. 6.2 Sia H Z; H `e un sottogruppo del gruppo additivo Z se e solo
se H `e della forma H = hZ := nh [ n Z
Lelemento h viene detto il generatore del sottogruppo H = hZ.
58
6.3 Massimo comun divisore Algoritmo euclideo
Dati due interi a, b viene detto loro massimo comun divisore e si
scrive: d =M.C.D.(a, b), o anche d = (a, b) quel numero positivo d che
divide sia a che b e che a sua volta viene diviso da un qualunque altro divisore
comune. In formule: d = (a, b) se
d[a d[b
_
(c[a c[b) c[d
_
.
Dualmente, un intero positivo m viene detto minimo comune multiplo
di a e b in simboli: m =m.c.m.(a, b), o anche m = [a, b] se m `e un
multiplo sia di a che di b che, a sua volta, divide ogni altro multiplo comune.
In formule: m = [a, b] se
a[m b[m
_
(a[c b[c) m[c
_
.
Si sarebbe anche potuto dire che il massimo comun divisore di a e b `e il pi` u
grande fra i divisori comuni ad a e b e che il loro minimo comune multiplo
`e il pi` u piccolo fra i multipli comuni ad a e b. Non v`e dubbio che tali
formulazioni siano pi` u facilmente comprensibili delle precedenti (e non a
caso cos` le avevamo imparate alle scuole elementari). Tuttavia esse fanno
uso della relazione dordine e per questo motivo contrariamente a quelle
non hanno senso nel caso di un anello non ordinato. Non dimentichiamo
mai che, almeno in matematica, vale sempre la pena di pagare il prezzo di
qualche piccola dicolt`a in pi` u per ottenere una maggiore generalit`a.
Prop. 6.3 Sia d := (a, b) il massimo comun divisore dei due numeri interi
a e b > 0. Esistono allora degli interi r, s tali che
d = a r +b s.
Dimostrazione: Consideriamo linsieme D costituito da tutti gli interi
della forma a m+b n al variare di m e n in Z: D := a m+b n [ m, n Z.
`
E facile vericare che D `e chiuso rispetto alladdizione e inoltre contiene lo
zero 0 = a 0 + b 0 e lopposto a (m) + b (n) di ogni suo elemento
a m+b n; equivalentemente: D `e chiuso rispetto alla sottrazione. Pertanto
D `e un sottogruppo di Z e quindi in virt` u della Prop. 6.2 deve essere
della forma D = dZ per un opportuno intero positivo d. Poiche ovviamente
d D, vi sono degli interi r, s tali che
d = a r +b s.
Inoltre, poiche a, b D = dZ, d divide sia a che b: d[a, d[b. Daltra parte, se
c[a, c[b, cio`e a = a
c e b = b
c, allora d = a r +b s = a
c r +b
c s =
59
(a
r +b
segue a x + b y = c con x = r c
e y = s c
e b = d b
si trae a x+b y = d (a
x+b
y) = c, e quindi d[c.
Due interi a, b tali che il loro massimo comun divisore sia 1: (a, b) = 1,
vengono detti primi fra loro o anche relativamente primi.
Corollario 6.5 : Dati gli interi a, b, esistono degli interi r, s tali che
1 = r a +s b
se e solo se (a, b) = 1.
Nel 8.3 vedremo che esistono innite coppie r, s tali che d = (a, b) = ar+bs,
e mostreremo come trovarle tutte. Comunque, un modo per trovarne una
`e fornito dallalgoritmo euclideo per la ricerca del massimo comun
divisore (a, b) di due interi a, b. Vediamo di che si tratta.
Non essendo restrittivo il supporre che sia 0 < b a, iniziamo col
dividere a per b:
a = q
1
b +r
1
con 0 r
1
< b;
se r
1
,= 0, come secondo passo dividiamo b per r
1
:
b = q
2
r
1
+r
2
con 0 r
2
< r
1
< b;
se poi anche r
2
,= 0, dividiamo r
1
per r
2
:
r
1
= q
3
r
2
+r
3
con 0 r
3
< r
2
< r
1
< b;
di nuovo, se anche r
3
,= 0, dividiamo r
2
per r
3
:
r
2
= q
4
r
3
+r
4
con 0 r
4
< r
3
< r
2
< r
1
< b;
e cos` di seguito . . . se lultimo resto ottenuto r
i
`e non nullo dividiamo
lultimo divisore r
i1
per r
i
ottenendo:
r
i1
= q
i+1
r
i
+r
i+1
con 0 r
i+1
< r
i
< r
i1
< . . . < r
3
< r
2
< r
1
< b.
60
`
E chiaro che, generandosi in tal modo una sequenza decrescente di interi non
negativi b = r
0
> r
1
> r
2
> r
3
> . . . > r
i
> r
i+1
0, tale processo non pu`o
continuare indenitamente. Pertanto si avr`a certamente un indice h tale che
r
h+1
= 0:
r
h1
= q
h+1
r
h
con r
h
> 0.
Proviamo che allora lultimo resto non nullo r
h
`e il massimo comun divisore
cercato: r
h
= (a, b). Consideriamo in primo luogo un intero c che divida
sia a che b; seguendo la catena delle uguaglianze precedenti si vede allora
che c deve dividere anche r
1
, e dividendo sia b che r
1
dovr`a dividere anche
r
2
, e cos` di seguito . . . dividendo sia r
h2
che r
h1
dovr`a dividere anche
r
h
. Daltra parte, luguaglianza r
h1
= q
h+1
r
h
mostra che r
h
divide intanto
r
h1
; sostituendo nelluguaglianza precedente si ha
r
h2
= q
h
r
h1
+r
h
= q
h+1
q
h
r
h
+r
h
= (q
h+1
q
h
+ 1)r
h
,
per cui r
h
divide non solo r
h1
ma anche r
h2
. Risalendo a ritroso la catena
delle uguaglianze precedenti e iterando il ragionamento precedente si vede
che, in ultima analisi, r
h
dovr`a dividere sia a che b. In conclusione: r
h
`e un
divisore comune di a e b che `e un multiplo di ogni altro divisore comune e
quindi r
h
= (a, b). Inne ricavando r
1
dalla prima uguaglianza della catena e
sostituendolo nella seconda, e poi ricavando r
2
dalluguaglianza cos` ottenuta
e sostituendolo nella terza, e cos` via . . . si perviene ad esprimere r
h
= (a, b)
come combinazione lineare di a e b: (a, b) = a r +b s.
Le nozioni di massimo comun divisore, minimo comune multiplo,
elementi relativamente primi si generalizzano immediatamente dal caso
di due interi a, b a quello di un arbitrario insieme nito a
1
, . . . , a
n
di interi.
6.4 Il teorema fondamentale dellaritmetica
Un numero intero p ,= 1 viene detto primo se gli unici suoi divisori sono
1 e p; in caso contrario si dir`a composto.
I numeri primi sono tra gli oggetti pi` u importanti ma, tutto sommato,
anche pi` u misteriosi della matematica. Se ne intuisce bene limportanza
tramite il seguente Teorema fondamentale dellaritmetica che li indica
essere i mattoni con cui si costruiscono tutti gli altri numeri interi, le cui
propriet`a dipendono da quali e quanti mattoni siatti vengono utilizzati
in tale costruzione
(2)
. La si coglier`a ancora meglio quando, nellambito di
(2)
Un esempio eclatante viene oerto dalla pi` u moderna tecnica per la cifratura di
messaggi segreti, tecnica che si fonda su un intero dato dal prodotto di due primi
molto grandi.
61
corsi pi` u avanzati, si scoprir`a che propriet`a dei numeri primi giocano sor-
prendentemente un ruolo chiave in questioni allapparenza molto distanti
dallaritmetica, e viceversa. Il loro mistero risiede invece nel fatto che, ad
onta dellenorme mole di studi che sono stati loro dedicati e delle innumerevoli
loro propriet`a che tali studi hanno messo in luce, tuttavia non si riesce an-
cora a cogliere la loro struttura complessiva ne trovano ancora risposta alcune
tra le pi` u famose congetture della matematica che, direttamente o indiretta-
mente, li riguardano. Tale dicolt`a induce a ritenere che esse, anche quelle
di facile enunciazione
(3)
, nascondano nella loro ermeticit`a qualcosa di molto
profondo che i matematici ancora non riescono neppure ad intuire.
Noi naturalmente li soreremo appena, limitandoci a considerarne sola-
mente le propriet`a pi` u elementari. Iniziamo col provare che
Teorema 6.6 (Euclide) : Esistono inniti numeri primi.
Dimostrazione: Di questo teorema esistono, com`e facilmente immagina-
bile, molte dimostrazioni. Quella che riportiamo qui di seguito, che `e forse
la pi` u elegante, `e dovuta ad Euclide. Procede per assurdo. Supposto infatti
che vi siano solo un numero nito di primi, diciamo p il maggiore tra loro e
consideriamo il numero q := p! + 1 = 1 2 3 p + 1. Poiche, se si divide
q per uno qualunque intero positivo minore o uguale a p si ottiene sempre
1 come resto, dovr`a esserci almeno un altro primo maggiore di p e minore o
uguale a q, ci`o che contraddice lipotesi sulla nitezza dellinsieme dei primi.
con n > n
. Se n
`e primo allora
n = p
1
n
`e composto vi `e un
primo positivo p
2
(eventualmente uguale a p
1
) che divide n
: n
= p
2
n
,
per cui n = p
1
p
2
n
con n > n
> n
. Se n
`e primo allora n = p
1
p
2
n
> n
> . . . di
interi positivi. Pertanto dopo un certo numero, diciamolo s 1, di passi si
avr` a la decomposizione cercata: n = p
1
p
2
p
s
.
Resta da provare che essa `e essenzialmente unica. A tal ne sia n =
q
1
q
2
q
t
una nuova decomposizione in fattori primi dello stesso numero n.
Non `e restrittivo supporre che sia i p
i
che i q
j
siano tutti positivi e che sia
t s. Per il Lemma 6.7 il primo q
1
, dividendo n, dovr`a dividere almeno
uno dei fattori p
i
; supponiamo che sia proprio p
1
: q
1
[p
1
. Questo comporta
q
1
= p
1
, e quindi p
2
p
3
p
s
= q
2
q
3
q
t
. Iterando tale ragionamento
successivamente per q
2
, q
3
, . . . , q
t
, otteniamo via via q
1
= p
1
, q
2
= p
2
, q
3
=
p
3
, . . . , q
t
= p
t
e, se t < s, p
t+1
p
t+2
p
s
= 1. Ma questultima `e assurda,
e quindi anche t = s, ci`o che completa la dimostrazione del teorema.
Corollario 6.10: Dati gli interi a e b, sia d := (a, b) ed m := [a, b]. Allora
a b = d m.
63
6.5 Il crivello di Eratostene
Alle scuole elementari abbiamo imparato, sfruttando la successione
2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, . . .
dei numeri primi, a decomporre in fattori primi un numero intero come pure,
sfruttando tale decomposizione, a calcolare il massimo comun divisore di
due interi assegnati a e b nonche il loro minimo comune multiplo come il
prodotto dei fattori primi comuni ad a e b presi col minimo esponente e,
rispettivamente, come il prodotto dei fattori primi comuni e non comuni
presi col massimo esponente.
Tutto questo, ribadiamolo, richiede per`o che si conosca la successione
dei primi, almeno no allultimo primo minore o uguale alla radice quadrata
(con N
(con N
(4)
Dal matematico greco ERATOSTENE (276 circa194 circa a.C.) cui se ne attribuisce
la scoperta. Eratostene, che oper`o ad Alessandria, fu anche rinomato astronomo
e geografo. Tra laltro, immaginando la Terra sferica, calcol`o con ragionamento
corretto e con buona approssimazione la misura del meridiano terrestre.
64
(con N
, A
, A
, A
, A
, A
, A
, . . . In
particolare: se il quinto postulato `e indipendente dagli altri assiomi della
geometria euclidea allora non vi sono motivi interni alla stessa geometria
per preferire questa a quella fondata sul complesso degli altri assiomi unita-
mente con la negazione del quinto postulato, cio`e tenendo conto del fatto
che questultimo pu`o essere negato in due modi diversi con una delle due
teorie che, accanto agli altri assiomi, ammettono luna, detta geometria
iperbolica, che data una retta ed un punto P fuori di essa, per P passa
pi` u di una parallela alla retta data, e, laltra, detta geometria ellittica
o riemanniana
(12)
, che data una retta ed un punto P fuori di essa, per
P non passa alcuna parallela alla retta data. Con terminologia che si rif`a
allopera di Saccheri, tali geometrie vengono anche dette dellangolo acuto
e, rispettivamente, dellangolo ottuso giacche in esse la somma degli angoli
interni di un triangolo vale meno risp.: pi` u di un angolo piatto.
Chiarito questo aspetto, occorre riproporre la questione: come si pu`o
provare che una proposizione A non consegue da un insieme A
, A
, A
, . . .
di altre proposizioni ovvero, se si preferisce, che la teoria T
fondata su
A, A
, A
, A
, A
, A
per
la quale gli assiomi A
, A
, A
2), e cos` di
seguito. Per gli assiomi 3) e 4), nessuno di questi elementi
1,
2,
3, . . . pu`o es-
sere uno degli elementi 0, 1, 2, 3, . . . inclusi in precedenza. Insomma, linsieme
M := 0, 1, 2, 3, . . .
1,
2,
1,
2,
3, . . ..
`
E esattamente
ci`o che assicura il postulato che ancora manca:
5) Principio di induzione matematica.
Sia P N. Se i) 0 P e se n P s(n) P allora P = N.
Equivalentemente:
Sia T una propriet`a denita su tutto N. Se T(0) e T(n) T(s(n)) allora
75
vale T(n) per ogni n N.
A questo punto `e chiaro che i cinque assiomi precedenti ammettono come
modello essenzialmente unico quello formato dalla familiare successione
dei numeri naturali, da cui aveva preso le mosse il nostro discorso: ci`o ci
convince che possa considerarsi concluso il percorso che da una conoscenza
intuitiva dellaritmetica porta ad una sua descrizione formalizzata in accordo
con le norme delle moderne teorie assimatiche. Ci raorza tale convinzione
il fatto che non `e dicile, come vedremo tra breve, denire a partire da
quegli assiomi e da quelle nozioni primitive sia a) la consueta relazione
dordine (cfr. 2.6) che b) le usuali operazioni elementari e stabilirne le
ben note propriet`a (si noti che gli assiomi non parlano di somma, prodotto,
etc.).
Per quanto riguarda la prima potremmo innanzi tutto denire lordine
stretto < nel modo seguente: dapprima richiediamo che 1) (n)(n < s(n)) e
poi completiamo lopera mediante la chiusura transitiva, cio`e imponiamo che
2) se n < m e m < r allora n < r. Inne poniamo n m (n = mn < m).
Passando alle operazioni elementari, osserviamo innanzi tutto che il
Principio di induzione matematica giustica quella particolare forma di ra-
gionamento che si dice per induzione e che il lettore ha sicuramente utiliz-
zato svariate volte. Forse egli ha invece meno dimestichezza con le cosiddette
denizioni induttive. Si tratta, volendo denire una funzione c che associ
il naturale c(n) a ciascun n N, di denire (a) c(0) e poi (b) denire c(s(n))
utilizzando c(n)
(18)
. Ad esempio ecco qui di seguito la denizione induttiva
della somma m+ n (dove m `e sso), cio`e della funzione che associa m+ n
a n:
m+ 0 := m, m+s(n) := s(m+n) .
Allo stesso modo possiamo introdurre il prodotto m n:
m 0 := 0, m s(n) := m n +m;
e lesponenziale m
n
m
0
:= 1, m
s(n)
:= m
n
m;
come pure il fattoriale n! :
0! := 1, (s(n))! := n! s(n).
Lasciamo al lettore il noioso compito di provare le usuali propriet`a (as-
sociativit`a, commutativit`a, etc.) per le operazioni cos` denite.
(18)
Naturalmente tale procedura va giusticata: indicato infatti con I N la totalit`a
dei naturali n N per i quali c(n) `e denito, col Principio dinduzione si prova
facilmente che si ha I = N.
76
Cap. 8
Classi dei resti modulo n
8.1 Denizioni e prime propriet`a
Fin dalle scuole elementari siamo abituati a suddividere linsieme Z dei nu-
meri interi in due classi disgiunte, quella dei numeri pari e quella dei nu-
meri dispari, cio`e dei numeri che sono o, rispettivamente, non sono multipli
di 2. Sappiamo tutti inoltre che la somma di due pari, come pure la somma
di due dispari, `e pari mentre la somma di un pari ed un dispari `e dispari. Di
contro `e pari il prodotto di due interi uno almeno dei quali sia pari mentre
in caso contrario il prodotto `e dispari. Indicando con P e D la propriet`a
di essere pari o, rispettivamente, dispari, possiamo esprimere sinteticamente
quanto appena osservato facendo uso delle seguenti tavole di addizione e
moltiplicazione:
(8.1)
+ P D
P P D
D D P
P D
P P P
D P D
In particolare, per x P, D si ha
(8.2) P +x = x = x +P, D x = x = x D
Se inoltre anche y, z P, D `e facile vericare che
(8.3) (x +y) +z = x + (y +z), (xy)z = x(yz)
(propr. associativa della somma e del prodotto),
(8.4) x +y = y +x, xy = yx
(propr. commutativa della somma e del prodotto) e inne
(8.5) x(y +z) = xy +xz
(propr. distributiva del prodotto rispetto alla somma).
77
Se in luogo dei simboli P e D usiamo i simboli 0 e 1 rispettivamente, le
tabelle (8.1) diventano
(8.1
)
+ 0 1
0 0 1
1 1 0
0 1
0 0 0
1 0 1
mentre le (8.2) sono ora
(8.2
) 0 +x = x = x + 0, 1 x = x = x 1
che appaiono forse pi` u accettabili perche pi` u familiari: in eetti, con lunica
eccezione costituita dal fatto che ora 1+1 vale 0 e non 2, le (8.1
)
e (8.2
) e (2
) e (8.2
) [p]
mod n
= [q]
mod n
.
Inoltre, ci si riferir`a a tutta questa materia parlando di congruenza modulo
n e linsieme delle n classi dei resti modulo n si denoter`a con Z
n
:
(8.8) Z
n
=
_
[0]
mod n
, [1]
mod n
, [2]
mod n
, . . . , [n 1]
mod n
_
.
Quando sia chiaro dal contesto quale sia il modulo ssato n e non vi sia alcuna
ambiguit`a in merito `e duso tralasciare il riferimento mod n e scrivere
quindi semplicemente p q o [p] = [q]. Anzi, per semplicit`a, spesso si
indica la classe dei resti [p]
mod n
(con p = nh + r) col pi` u piccolo intero
non negativo che essa contiene (cio`e r): r = [p]
mod n
. Cos` ad es., con
riferimento alla congruenza modulo 5, si indicher`a semplicemente con 2
la classe 5h + 2 [ h Z; ancora, in questo contesto, uguaglianze del tipo
2+3 = 0 non vanno interpretate come relative agli interi (e quindi ovviamente
false) ma come relazioni tra le classi dei resti, cio`e 2 + 3 = 0 va interpretata
come [2]
mod 5
+ [3]
mod 5
= [0]
mod 5
.
La generalizzazione dal caso n = 2 al caso di un modulo n qualunque
va ben oltre a quanto contenuto pi` u sopra. In eetti anche nel caso generale
avviene quanto avevamo gi`a osservato per i pari e i dispari, e cio`e che la
richiede luso di teorie matematiche per niente elementari (algebra commutativa,
geometria algebrica, teoria delle basi di Grobner, etc.) che non sono pi` u legate al
grado del sistema. Naturalmente, la considerazione iniziale non `e sempre valida.
Un bellesempio di eccezione ad essa `e costituito dalla storia dellUltimo Teorema di
Fermat, di cui si parler`a pi` u oltre.
80
suddivisione in classi di congruenza modulo n `e compatibile con
somme e prodotti. Questa frase esprime sinteticamente il contenuto della
seguente proposizione formale.
Prop. 8.1 Se x x
(mod n) e y y
+y
(mod n) e xy x
(mod n).
Dimostrazione: La relazione x x
= hn
per qualche h; similmente, y y
+ y
) = (h + k)n, da cui x + y x
+ y
(mod n) allora x + y x
+ y (mod n) e
xy x
y (mod n).
Va notato che mentre della prima parte del corollario precedente vale
il viceversa (anzi questo coincide con quella: x + y x
+ y (mod n)
(x + y) + (y) (x
(mod n), a meno che il fattore y non sia primo con n. Questo fatto `e una
conseguenza immediata del Corollario 8.5.
La Prop. 8.1 `e di somma importanza; si potrebbe anzi dire che `e pro-
prio tale proposizione che giustica linteresse per lo studio delle congruenze
modulo n. In soldoni essa aerma che uguaglianze di espressioni contenenti
somme e prodotti di interi si conservano se si passa alla congruenza modulo
n, cio`e se si sostituisce ogni intero col suo resto modulo n, o, pi` u in generale,
con un qualunque altro intero congruo ad esso modulo n. Questo fatto ci
consente di estendere a Z
n
quanto gi`a osservato per P, D, cio`e di denire
anche su Z
n
una somma
(8.9) [x]
mod n
+ [y]
mod n
:= [x +y]
mod n
ed un prodotto
(8.10) [x]
mod n
[y]
mod n
:= [xy]
mod n
.
Va infatti sottolineato che se non valesse la Prop. 8.1 tali denizioni non
sarebbero corrette giacche allora il prodotto delle due classi di congruenza
[x]
mod n
e [y]
mod n
non dipenderebbe esclusivamente dalle classi stesse ma
varierebbe al variare degli elementi x [x]
mod n
e y [y]
mod n
scelti a
rappresentarle! Lasciamo per esercizio allo studente il compito di tradurre
81
questa osservazione in una prova formale, come pure di dimostrare che per
la somma (8.9) ed il prodotto (8.10) valgono le propriet`a associativa, com-
mutativa, distributiva, ed inoltre che, per ogni [x]
mod n
Z
n
, si ha
(8.11)
[0]
mod n
+ [x]
mod n
:= [x]
mod n
, [x]
mod n
+ [x]
mod n
:= [0]
mod n
,
e
(8.12) [1]
mod n
[x]
mod n
:= [x]
mod n
.
Quanto precede pu`o essere espresso nel linguaggio dellalgebra astratta di-
cendo che le operazioni di somma + e prodotto dotano linsieme
Z
n
della struttura di anello commutativo e che lapplicazione
(8.13)
Z Z
n
m [m]
mod n
`e un morsmo danelli. Anzi, in virt` u del seguente Corollario 8.5, se n `e
primo, allora (e solo allora) Z
n
`e dotato della struttura di campo
(3)
.
Prima di studiare altre, pi` u signicative propriet`a della teoria delle con-
gruenze, illustriamone alcune semplici applicazioni .
a) Il conto della serva.
Supponiamo di voler vericare la correttezza del risultato di un conto
della spesa
(8.14) xy +x
+x
+ =
che si componga di una lunga lista xy + x
+ x
+ di somme di
prodotti, senza volerci sobbarcare la fatica di rifare tutti i calcoli indicati.
Se luguaglianza (8.14) `e corretta allora, qualunque sia lintero positivo n, `e
pure corretta la congruenza
(8.15) xy +x
+x
+ (mod n)
e pertanto, in virt` u della Prop. 8.1, anche luguaglianza
(8.15
) [xy +x
+x
+ ] = [x][y] + [x
][y
] + [x
][y
] + = []
(3)
Ci`o equivale a dire che se n `e primo allora il prodotto dota Z
n
\ {0} della struttura
di gruppo. Per le denizioni formali di gruppo, anello, campo e morsmo si rimanda
allAppendice 1.
82
(qui [. . .] sta per [. . .]
mod n
) e che quindi
(4)
, di contro, se, per qualche n,
risulta
(8.16) xy +x
+x
+ , (mod n)
cio`e
(8.16
) [x][y] + [x
][y
] + [x
][y
] + ,= []
allora luguaglianza di partenza `e sicuramente falsa. Pertanto, ssato un
modulo n, ad es. n = 2, se passando ai resti modulo n si ottiene una disu-
guaglianza, siamo certi che il conto della spesa `e sbagliato. Daltra parte, se
lespressione modulo 2 `e corretta, non siamo aatto sicuri che lo sia anche il
conto della spesa: potrebbe infatti capitare che il risultato , pur errato, sia
tuttavia congruo, modulo 2, a quello giusto. Possiamo per`o allora ripetere
lo stesso test con la congruenza modulo 3, e, ancora una volta, se ottenia-
mo un risultato negativo siamo sicuri che il conto della spesa `e sbagliato
ma se otteniamo un risultato positivo non possiamo esser certi di niente,
giacche potrebbe essere sbagliato ma congruo anche modulo 3 (e quindi
complessivamente modulo 6) a quello giusto. Forse a questo punto ci viene
il sospetto maligno che tutto ci`o sia un mezzo imbroglio. Rassicuriamoci: in
eetti dopo qualche tentativo con esito positivo, fatto con moduli diversi
(5)
,
possiamo concludere che, seppur ci manchi la certezza, `e tuttavia ragione-
vole ritenere abbastanza alta la probabilit`a che anche il conto della spesa
sia giusto. Conviene che, su qualche esempio che pu`o proporre lui stesso,
lo studente esegua eettivamente il procedimento indicato per convincersi di
quanto, ad onta della sua lunga descrizione, sia invece rapido ed ecace.
b) La prova del nove.
Daltra parte una qualche esperienza del trucco indicato pi` u sopra il
lettore deve pur averla. Vi ricordate infatti la prova del nove? Si tratta di
questo: per vericare la correttezza del conto (8.14) si sostituisce ciascuno
dei numeri x, y, x
, y
][y
] +[x
][y
] +
= [] mod 9. In eetti se ad esempio indichiamo con a
0
, a
1
, a
2
, . . . , a
s
le successive cifre decimali del numero x, per cui x = a
0
+ a
1
10 + a
2
10
2
+
+a
s
10
s
, tenendo conto che 10 (e quindi anche 10
2
, 10
3
, ) `e congruo a 1
modulo 9, si ha x = a
0
+a
1
10 +a
2
10
2
+ +a
s
10
s
a
0
+a
1
+a
2
+ +a
s
(mod 9). Svanisce cos` il mistero della prova del nove.
c) Criteri di divisibilit`a.
Ragionamenti simili a quello appena fatto consentono di giusticare i
ben noti criteri di divisibilit`a. Li ricordate?
Quello della divisibilit`a per 3 (risp. per 9): un numero `e divisibile per 3
(risp. per 9) se tale `e la somma delle sue cifre. Qui si ragiona esattamente
come pi` u sopra, perche 10 `e congruo a 1 sia modulo 3 che modulo 9.
Oppure quello della divisibilit`a per 11: un numero `e divisibile per 11 se
tale `e la somma delle sue cifre prese con segni alterni. Qui si sfrutta il fatto
che 10 (e quindi anche 10
3
, 10
5
, , 10
2s+1
, ) `e congruo a 1 modulo 11
mentre 10
2
, 10
4
, , 10
2s
, sono congrui a 1 modulo 11.
Anche il criterio di divisibilit`a per 5 si pu`o giusticare in modo simile.
Lasciamo ci`o come esercizio per il lettore.
8.2 Congruenze algebriche. Il Teorema di Eulero-Fermat
e il Teorema di Wilson
Le congruenze algebriche sono esattamente lanalogo, modulo n, delle equazioni
algebriche, cio`e equazioni della forma
(8.17) a
m
x
m
+a
m1
x
m1
+ +a
1
x +a
0
0 (mod n)
dove a
m
, 0 (mod n); ovviamente nella (8.17) sia tutti i coecienti a
i
che
le eventuali soluzioni x sono determinati modulo n e quindi, in ultima analisi,
non `e restrittivo assumere che siano minori di n. Con questa convenzione
(che nel seguito spesso adotteremo tacitamente) `e immediato osservare che
ogni congruenza (8.17) ammette un numero nito (eventualmente nullo) di
soluzioni. Ci`o premesso, iniziamo col provare il risultato seguente.
Prop. 8.3: La congruenza lineare
(6)
ax b (mod n) ammette soluzione
qualunque sia b se e solo se a `e primo con n, cio`e (a, n) = 1.
(6)
Qui, esattamene come per le usuali equazioni algebriche, il termine lineare indica
che lincognita vi compare con grado 1.
84
Dimostrazione: Preliminarmente osserviamo che se (a, n) = 1 allora e
solo allora le classi dei resti
(8.18) a [0]
mod n
, a [1]
mod n
, a [2]
mod n
, . . . , a [n 1]
mod n
sono tutte diverse: infatti, se fosse a[i]
mod n
= a[j]
mod n
allora a(ij) = hn
per qualche h, e quindi un qualunque fattore primo p di n non potendo
dividere a (giacche (a, n) = 1) deve dividere i j; ne consegue che n stesso
divide i j; dal momento che i e j sono entrambi minori di n, ci`o comporta
che i j = 0, cio`e [i]
mod n
= [j]
mod n
. Di contro, se (a, n) = d, 1 < d < n,
allora, posto n = dn
e a = da
, si ha a [n
]
mod n
= a
[dn]
mod n
=
[0]
mod n
= a [0]
mod n
, e quindi gli elementi in (8.18) non sarebbero tutti
diversi tra loro.
Da tutto ci`o consegue che, se (a, n) = 1, vi `e sicuramente una (ed una
sola) delle (8.18) diciamola [h]
mod n
tale che a [h]
mod n
= [b]
mod n
.
Ne discende che ax b (mod n) per tutti e soli gli interi x [h]
mod n
. Ci`o
prova la condizione suciente.
Viceversa, se (a, n) ,= 1, allora nella lista (8.18) vi `e qualche ripetizione
e quindi essa non contiene tutte le n classi dei resti modulo n; ne consegue
che, per qualche b, la congruenza lineare ax b (mod n) non ammette
soluzione.
Corollario 8.4: La congruenza lineare ax b (mod n) ammette soluzione
se e solo se il massimo comun divisore d := (a, n) divide b.
Dimostrazione: Sia a = a
d e n = n
d, per cui (a
, n
) = 1. Se la con-
gruenza ax b (mod n) ammette soluzione, allora per un opportuno h si
avr`a ax+hn = b, da cui d(a
x+hn
x+hn
= b
, vale
a dire alla congruenza a
x b
(mod n
] Z
n
di un elemento [a] Z
n
per cui (a, n) = 1 ma, in
85
virt` u della nitezza di Z
n
, consente anche di determinarlo in modo eettivo:
basta infatti calcolare successivamente gli elementi della lista (8.18) e prima
o poi si trova certamente quello che vale 1.
`
E chiaro daltra parte che se
n non `e piccolo tale processo rischia di essere eccessivamente dispendioso
in termini di tempo e quindi, alla n ne, impraticabile. Fortunatamente
disponiamo di alcuni risultati che consentono un calcolo pi` u rapido di [a
].
Uno di questi
(7)
`e il famoso Teorema di EuleroFermat
(8)
. Prima di darne
lenunciato soermiamoci su una funzione che vi gioca un ruolo essenziale. Ci
riferiamo alla cosiddetta funzione di Eulero (n) che d`a il numero degli
interi pi` u piccoli di n e primi con n. Tale funzione si calcola facilmente
sfruttando il Teorema fondamentale dellaritmetica e il seguente
Teorema 8.6: Sia p un numero primo e siano a e b interi primi tra loro:
(a, b) = 1. Allora
(8.19) (p
r
) = p
r1
(p 1)
e
(8.20) (ab) = (a)(b).
Questultima si esprime dicendo che `e una funzione moltiplicativa.
Infatti, indicando con m = p
r
1
1
p
r
2
2
p
r
s
s
la decomposizione in fattori
primi di m, da (8.19) e (8.20) consegue
(8.21) (m) =
i=1,2,...,s
p
r
i
1
i
_
p
i
1
_
= m
i=1,2,...,s
_
1
1
p
i
_
Ad esempio si ha
(72) = (2
3
)(3
2
) = 2
2
(2 1) 3(3 1) = 24 = 72
_
1
1
2
__
1
1
3
_
.
Alla dimostrazione del Teorema 8.6 occorre premettere il
Lemma 8.7: Precisato che per sistema completo di residui modulo a si
intende un qualunque insieme di a interi mai due dei quali congrui modulo a,
siano a, b e c interi e sia (a, b) = 1; se x percorre M, un sistema completo di
(7)
Un altro, valido se il modulo `e primo, `e il Teorema di Wilson che vedremo pi` u oltre.
(8)
Il francese Pierre de FERMAT (16011665) e lo svizzero Leonard EULER (1707
1783) sono da annoverare tra i grandi geni la cui opera ha rinnovato la matematica.
86
residui modulo a, allora anche bx+c percorre un sistema completo di residui
modulo a, diciamolo M
.
Dimostrazione: Basta provare che, nelle attuali ipotesi, mai due distinti
elementi bx + c e by + c dellinsieme M
:= am
1
= a, am
2
, . . . , am
(m)
.
Pertanto
am
1
am
2
a m
(m)
m
1
m
2
m
(m)
(mod m)
e quindi, applicando la legge di cancellazione, la (8.22).
Una dimostrazione alternativa, che fa uso di alcune semplici propriet`a
della teoria dei gruppi che studieremo in Algebra 2, `e la seguente. Proviamo
preliminarmente che linsieme M forma gruppo rispetto alla moltiplicazione.
Infatti, da un lato se (m
i
, m) = 1 e (m
j
, m) = 1, allora (m
i
m
j
, m) = 1;
inoltre, in virt` u del Corollario 8.5, ogni m
i
M ammette inverso (in M).
Poiche quindi M `e un gruppo nito di ordine o(M) = (m), lordine di un
qualunque elemento m
i
M `e, per il Teorema di Lagrange, un divisore
di (m) e quindi m
(m)
i
= 1. Inne, per ogni a primo con m, da a m
i
(mod m), si trae a
(m)
m
(m)
i
1 (mod m).
Corollario 8.8: Se a `e primo con m e se r 1 (mod (m)), allora
(8.22
) a
r
a (mod m).
Il nome che `e stato attribuito al precedente teorema `e dovuto al fatto che
esso esprime la generalizzazione dovuta a Eulero di un precedente teorema
enunciato da Fermat e relativo al caso in cui il modulo m = p sia primo.
Corollario 8.9 (Piccolo teorema di Fermat): Se p `e primo e a non `e
multiplo di p, allora
(8.23) a
p1
1 (mod p)
Corollario 8.10 (Teorema di Fermat): Se p `e primo, allora per ogni
intero a si ha
(8.23
) a
p
a (mod p)
Si `e visto pi` u sopra che in Z
n
sono invertibili tutti e soli gli elementi
a primi con n, ci`o che comporta che Z
n
sia un campo o solo un anello a
seconda che n sia un numero primo o un numero composto. Questo fatto sta
alla base di varie dierenze strutturali tra i due casi. Ad esempio, se n non `e
88
primo poniamo n = rs allora pur essendo r, s , 0 (mod n) tuttavia
r s 0 (mod n). Elementi r, s siatti vengono detti divisori dello zero.
`
E facile provare che invece non ve ne sono in Z
p
, con p primo. Se infatti,
per x, y , 0 (mod p) si avesse x y 0 (mod p) allora, moltiplicando
ambo i membri per linverso y
di y si avrebbe x xyy
0 y
= 0, contro
lipotesi. Questo risultato consente di ripetere per Z
p
la dimostrazione di
unimportante propriet`a, gi`a nota allo studente per le equazioni algebriche
nel campo razionale (o reale o complesso).
Prop. 8.11: Sia p un intero positivo arbitrario; la congruenza algebrica
(8.24) a
m
x
m
+a
m1
x
m1
+ +a
1
x +a
0
0 (mod p)
ammette una soluzione x
1
se e solo se il polinomio a
m
x
m
+ a
m1
x
m1
+
+a
1
x +a
0
`e divisibile per x x
1
:
(8.24
)
a
m
x
m
+a
m1
x
m1
+ +a
1
x +a
0
(x x
1
)(b
m1
x
m1
+ +b
1
x +b
0
)
(mod p)
Dimostrazione: La condizione suciente `e immediata. Viceversa, sup-
posto che x
1
sia una soluzione di (8.24):
a
m
x
m
1
+ +a
1
x
1
+a
0
0 (mod p),
si ha
a
m
x
m
+ +a
2
x
2
+a
1
x +a
0
(a
m
x
m
+ +a
2
x
2
+a
1
x +a
0
) (a
m
x
m
1
+ +a
2
x
2
1
+a
1
x
1
+a
0
) =
= a
m
(x
m
x
m
1
) + +a
2
(x
2
x
2
1
) +a
1
(x x
1
) =
= a
m
(x x
1
)
_
x
m1
+x
m2
x
1
+ +xx
m2
1
+x
m1
1
_
+
+a
2
(x x
1
)(x +x
1
) +a
1
(x x
1
) =
= (xx
1
)[a
m
(x
m1
+x
m2
x
1
+ +xx
m2
1
+x
m1
1
) + +a
2
(x+x
1
) +a
1
]
che `e la decomposizione cercata.
Corollario 8.12 (Lagrange, 1768): Sia p primo; la congruenza algebrica
(8.24) a
m
x
m
+a
m1
x
m1
+ +a
1
x +a
0
0 (mod p)
ammette al pi` u m soluzioni.
89
Dimostrazione: Se la (8.24) non ammette soluzioni, non v`e niente da
dimostrare. Viceversa supponiamo che x
1
sia una soluzione di (8.24). Al-
lora, per la proposizione precedente, vale la decomposizione (8.24
). Poiche
ovviamente x x
1
, 0 per ogni x ,= x
1
, il fatto che in Z
p
non siano presenti
divisori dello zero assicura che una eventuale radice diversa da x
1
debba es-
serlo dellespressione entro parentesi quadra, che `e di grado m1. Iterando
il ragionamento, dopo un numero nito di passi si perviene al risultato enun-
ciato.
Ovviamente, pu`o succedere che il numero delle radici della congruenza
(8.24) sia minore di m. Ad esempio la congruenza x
2
2 0 (mod 3) non
ammette alcuna soluzione.
Un altro risultato ben noto nel caso classico che vale anche in quello
attuale `e il seguente.
Prop. 8.13: Sia p primo; il polinomio
(8.25) a
m
x
m
+a
m1
x
m1
+ +a
1
x +a
0
(a
i
< p)
ammette ununica decomposizione (modulo p) in fattori irriducibili.
Dimostrazione: Per semplicit`a ne tralasciamo la dimostrazione, che co-
munque ricalca (o, se si vuole, `e un caso particolare di) quella valida nel caso
pi` u generale dei polinomi a coecienti su un campo.
Sottolineiamo il fatto che se il modulo p non `e primo ne il Corollario
8.12 ne la Prop. 8.13 sono pi` u veri: ad es., per p = 6 si ha x
2
5x + 6
x(x 5) (x 2)(x 3), per cui x
2
5x + 6 da un lato ammette quattro
radici 0,5,2 e 3 e dallaltro ammette due diverse decomposizioni in fattori
irriducibili.
Un altro interessante risultato valido nel caso di un modulo p primo `e
fornito dal seguente:
Teorema 8.14 (Teorema di Wilson): Sia p primo; allora
(p 1)! 1 (mod p)
Dimostrazione: Proviamo dapprima che in Z
p
gli unici inversi di se stessi
sono gli elementi 1 e p 1 1. Infatti se x Z
p
ha come inverso se stesso,
allora x
2
1 0, e quindi (x 1)(x + 1) 0. Poiche Z
p
`e un campo, non
ha divisori dello zero e quindi o x 1 oppure x 1 p 1 mod.p.
90
Se p ,= 2, se ne deduce che nel prodotto
(p 1)! = 1 2 . . . (p 2) (p 1)
tutti i fattori ad eccezione del primo e dellultimo si distribuiscono a coppie
di inversi mod.p e quindi
(p 1)! p 1 1 (mod p)
Nel caso p = 2, per verica diretta: 1! = 1 1 (mod 2).
Come si `e gi`a osservato, il Teorema di Wilson pu`o essere utilizzato
in alternativa al Piccolo Teorema di Fermat per calcolare linverso di
un elemento modulo un primo p. Cos`, se p = 11 linverso ad es. di 7 `e 11x
con x = 1234568910 = 24307210 28610 = 1660 55 = 25 3;
infatti 7 (11 3) = 56 1.
8.3 Unimportante applicazione pratica: la crittograa
a chiave pubblica
Lidea della crittograa a chiave pubblica venne avanzata nel 1976 da due
matematici della Stantford University (CA, USA), W.Die e M.Hellman.
Essi auspicavano un metodo che consentisse a chiunque di cifrare un messag-
gio mediante una chiave alluopo resa pubblica ma solamente allazienda o
allente interessato detentori di una seconda chiave segreta di decifrarla
con luso di questultima. I vantaggi di un tale metodo sono evidenti; ma
come fare a realizzarlo?
Il testimone venne raccolto da tre matematici del MIT, R.Rivest, A.Sha-
mir e L.Adleman. Lalgoritmo da essi trovato `e noto come sistema RSA,
dalle iniziali dei loro nomi. Esso viene utilizzato non solo per garantire la si-
curezza della trasmissione dei rapporti segreti governativi o delle transazioni
bancarie, ma anche ogni volta che usiamo in Internet la nostra carta di cre-
dito per un qualunque aquisto.
Lalgoritmo in questione si giova essenzialmente di fue fatti: la dicolt`a
attuale (anche con luso dei pi` u potenti calcolatori elettronici) della decom-
posizione in fattori di numeri molto grandi ed il Teorema di Eulero-Fermat.
Supponiamo infatti che n sia il prodotto di due numeri primi, n = pq, che
in pratica si avr`a cura di scegliere molto grandi. Tale numero n costituir`a la
chiave (che sar`a resa pubblica) necessaria per cifrare un messaggio ma, come
vedremo, serviranno p e q per decifrarlo. Va osservato che ogni messaggio
pu`o essere epresso mediante una sequenza di interi. Per comodit`a possiamo
pensare, ad es., che il messaggio che vogliamo comunicare sia costituito dal
numero della nostra carta di credito; diciamolo m. Con le ipotesi fatte su p
91
e q, m risulter`a minore di entrambi e quindi primo con n. Osservato che si
ha (n) = (p 1)(q 1), il Teorema di Eulero-Fermat ci assicura che
m
(n)+1
m (mod n).
Si scelgano r, h, e k (eventualmente r = 1) di modo che
s := r (n) + 1 = hk;
si ha allora
m
s
= m
hk
= (m
h
)
k
t
k
m (mod n)
con t m
h
(mod n) . La congruenza precedente suggerisce il trucco nale:
viene reso pubblico anche h ma non k !!! per cui chi invia il messaggio
cifrato comunica solo t m
h
(mod n). Chi di dovere elever`a quindi t alla
potenza k-esima e otterr`a il messaggio m in chiaro.
Illustriamo con un semplice esempio quanto detto. Supponiamo che sia
m = 10 il numero della nostra carta di credito con cui vogliamo pagare
un biglietto aereo via Internet. Per evitare che tale numero possa essere
intercettato da persone non autorizzate (ed eventualmente utilizzato per usi
illeciti) supponiamo che la Compagnia abbia scelto: (i) p = 11 e q = 17 per
cui n = 1117 = 187; (ii) r = 1, per cui s:=(187)+1 = 1016+1 = 723; (iii)
h = 7 e quindi k = 23. I codici pubblici sono pertanto n = 187 e h = 7. Non
appena digitiamo il numero 10 della carta di credito nello spazio indicato dal
computer, il software che gestisce lacquisto del biglietto aereo (`e questo che
svolge il ruolo di agente codicatore) calcola
m
h
= 10
7
= 187 53475 + 175 175 (mod 187)
ed `e t = 175 il numero che viene trasmesso al computer della Compagnia
aerea; questultimo quindi calcola
t
k
= 175
23
= (175
5
)
4
175
3
= (187 877705130 + 65)
4
(187 28659 + 142)
65
4
142 = 2534788750 = 187 13555020 + 10 10
ottenendo cos` il numero della carta di credito cui addebitare il costo del
biglietto aereo.
Un sistema del tutto diverso `e quello della crittograa a chiave privata.
In questo caso chi invia il messaggio (A) come pure chi lo vede ricevere (B)
scelgono entrambi una propria chiave, poniamo u e v rispettivamente, che
conservano segreta. Detto al solito m il numero che costituisce il messaggio,
A invia a B il prodotto um; a sua volta B moltiplica um per la propria chiave
e rispedisce il risultato uvm ad A. A questo punto A divide il numero uvm
92
per u e invia il quoziente vm a B; a questi basta dividere quanto ricevuto
per la propria chiave per conoscere il messaggio m. Come si vede un faticoso
ma ecace avanti e indietro; che ha per`o un difetto: se il nemico riesce ad
intercettare tutti e tre i passaggi, allora `e in grado di decifrare il messaggio.
Perche?
8.4 Equazioni diofantee
Precisiamo subito che si dicono diofantee quelle equazioni algebriche (=
polinomi uguagliati a zero) in una o pi` u incognite che hanno per coecienti
numeri interi o numeri razionali, il che poi nel caso concreto `e la stessa
cosa (lo si provi!) e delle quali interessano esclusivamente le eventuali
soluzioni intere. Laggettivo che le qualica proviene da Diofanto, famoso
matematico alessandrino vissuto nel III sec. d.C. che si distinse per lo studio
dei numeri interi.
Tralasciando i casi banali, lequazione diofantea pi` u semplice `e quella
considerata nella proposizione seguente.
Prop. 8.15: Lequazione lineare in due variabili
(8.26) ax +by = c.
ammette soluzione se e solo se il massimo comun divisore d := (a, b) di a e
b divide c.
Dimostrazione:
`
E immediato vericare che sicuramente essa non ammette
soluzione se d := (a, b) non divide c: in tal caso infatti, passando ai resti
modulo d, si annullerebbe il primo membro, ma non il secondo, della (8.26).
Daltra parte, se invece d := (a, b) divide c, proviamo che la (8.26) ammette
sicuramente soluzione. Posto a = da
, b = db
(per cui (a
, b
) = 1) e c = dc
,
la (8.26) equivale a
(8.26
) a
x +b
y = c
con (a
, b
) = 1
Ora, per la Prop. 8.3, sappiamo che la congruenza
a
x c
(mod b
)
ammette sicuramente una soluzione (anzi innite soluzioni) x e quindi che
per tale x e per un opportuno y (che dipende dallx scelto) si avr`a
a
x = c
y
93
da cui la (8.26), e quindi la (8.26).
Possiamo provare che se d := (a, b) divide c allora la (8.26) ammette
soluzione anche ragionando in modo diverso, e precisamente sfruttando lal-
goritmo euclideo per la ricerca del massimo comun divisore d := (a, b) di a e
b. Questo infatti consente di determinare due interi u, v tali che
(8.27) au +bv = d;
da questa consegue subito
a(uc
) +b(vc
) = dc
= c;
pertanto la (8.26) ammette la soluzione x = uc
, y = vc
.
A completamento della proposizione precedente, va anche osservato che,
qualora sia risolubile, lequazione diofantea (8.26) ammette innite soluzioni,
e precisamente tutte quelle della forma
(8.28) x = x
0
+kb
, y = y
0
ka
dove x
0
, y
0
indica una qualunque di esse. In un senso (cio`e che (8.28) for-
nisca una soluzione di (8.26)) la prova consiste in una facile verica diretta.
Viceversa, supposto che entrambe le coppie x, y e x
0
, y
0
siano soluzione di
(8.26):
ax +by = c, ax
0
+by
0
= c,
sottraendo membro a membro si ha
a(x x
0
) +b(y y
0
) = 0
e quindi, dividendo per d,
(8.29) a
(x x
0
) +b
(y y
0
) = 0.
Poiche, ovviamente, b
(yy
0
), occorre che divida a
(xx
0
)
e quindi, dato che (a
, b
) = 1, anche xx
0
. Similmente si prova che a
divide
y y
0
. Ne consegue che luguaglianza
x x
0
b
=
y y
0
a
= k
(conseguenza della (8.29)) vale per un k intero. Da ci`o la (8.28).
La Prop. 8.15 `e di grande importanza. Vediamone subito uninteres-
sante applicazione.
94
Teorema 8.16 (Teorema cinese del resto): Se m `e primo con n, (m, n) =
1, allora qualunque siano gli interi r ed s la coppia di congruenze
(8.30) x r (mod m), x s (mod n)
ammette una soluzione comune, che `e univocamente determinata modulo
mn.
Dimostrazione: Da quanto provato pi` u sopra consegue che, giacch`e (m, n) =
1, esistono certamente due interi u, v tali che r s = um + vn. Ovvia-
mente lintero x := r um = s + vn soddisfa entrambe le congruenze
(8.30). Per provare la seconda parte del teorema, consideriamo unaltra
eventuale soluzione x
(mod mn).
Altre semplici equazioni diofantee intervengono in questioni elementari.
Tale `e ad esempio lequazione x
2
+y
2
z
2
= 0, le cui soluzioni intere (x, y, z)
sono chiamate terne pitagoriche giacche possono essere assunte come mi-
sure dei cateti e dellipotenusa di un triangolo rettangolo. Soprattutto per
illustrare con un esempio come alcune semplici considerazioni di aritmeti-
ca elementare possono vantaggiosamente coniugarsi con altre relative alle
congruenze, in primo luogo proviamo qui di seguito che
Prop. 8.17: Le terne pitagoriche sono tutte e sole quelle della forma x =
r
2
s
2
, y = 2rs e z = r
2
+s
2
dove r, s Z e r s.
Dimostrazione. Non `e restrittivo considerare solo il caso in cui x, y e z
sono primi fra loro. Da ci`o e da x
2
+y
2
z
2
= 0 consegue allora che sono anche
primi a due a due e quindi che non possono esservene due pari. Proviamo
che, daltra parte, x e y non possono essere entrambi dispari. Infatti se per
assurdo fosse x = 2n + 1 e y = 2m + 1 allora sarebbe z
2
= x
2
+ y
2
=
4n
2
+4n +1 +4m
2
+4m+1 = 4(n
2
+n +m
2
+m) +2 2(mod.4); daltra
parte, in tal caso anche x
2
e y
2
sarebbero dispari e quindi z
2
pari per cui
z
2
0(mod.4). Contraddizione. Quanto precede comporta (ad es.)
(8.31) x dispari, y pari (y = 2y), z dispari.
Ci`o premesso, consideriamo
(8.32) y
2
= z
2
x
2
= (z +x)(z x).
I due fattori z + x e z x non possono avere fattori primi comuni diversi
da 2: infatti un eventuale primo p ,= 2 che li dividesse entrambi dividerebbe
95
pure la loro somma 2z e la loro dierenza 2x, e quindi sia z che x, contro
lipotesi. Lo stesso ragionamento prova che z + x e z x, pur ammettendo
2 come fattore comune, tuttavia non sono divisibili per 4. Ne consegue che
p :=
z+x
2
e q :=
zx
2
sono primi fra loro. Per (8.31) e (8.32) si ha
y
2
= pq
e poiche p e q sono primi fra loro, da ci`o segue che sono essi stessi dei quadrati:
z +x
2
= p = r
2
,
z x
2
= q = s
2
per cui
z = r
2
+s
2
, x = r
2
s
2
e inoltre
y
2
= pq = r
2
s
2
, cio`e y = 2rs.
Collegata allequazione x
2
+y
2
z
2
= 0 `e unaltra equazione diofantea
forse la pi` u famosa di tutte e cio`e x
n
+y
n
z
n
= 0 dove n `e un intero
maggiore di 2. Vale la pena sprecare due parole per accennare alla storia,
sorprendente quanto istruttiva, di questa equazione. Il primo ad occuparsene
`e stato Fermat proprio in occasione delle sue riessioni, suggeritegli dalla let-
tura di un trattato di Diofanto, sulle terne pitagoriche. In margine alla pagina
che proponeva come problema la ricerca di tutte le terne pitagoriche Fermat
aggiunse (pi` u o meno testualmente) che invece per ogni n > 2 lequazione
x
n
+ y
n
z
n
= 0 non ammette soluzioni intere non banali (cio`e con x, y
e z tutti e tre non nulli) e che lui aveva trovato una bella dimostrazione di
questo risultato ma che purtroppo lesiguit`a del margine gli impediva di ri-
portarla. Neanche altrove, tra le carte lasciate da Fermat, si `e trovata la
misteriosa dimostrazione. Come tutti, anche Fermat era fallibile (e gli `e suc-
cesso di lasciare ai posteri aermazioni che poi si sono rivelate false) ma era
pur sempre un matematico di primo piano e prima di bollare come falsa una
sua aermazione `e meglio per evitare brutte gure procurarsi prima le
prove. Ai posteri `e restato quindi il compito che si `e rivelato essere arduo
quantaltri mai
(9)
di trovare una dimostrazione dellUltimo Teorema di
Fermat (cos`, impropriamente
(10)
, venne chiamata quella aermazione) o di
confutarlo, ad esempio esibendo una soluzione. Per oltre trecento anni molti
matematici illustri e no si sono sforzati senza successo di risolvere il
(9)
Certo, pensando alla semplicit`a della soluzione dellequazione x
2
+ y
2
z
2
= 0,
nessuno se lo aspetterebbe!
(10)
Unaermazione che si immagina essere vera ma della quale manca una prova rigorosa
si chiama (non teorema ma) congettura.
96
problema
(11)
. Solo di recente (1993) un matematico inglese, Andrew Wiles,
`e riuscito a trovarne una dimostrazione, pare particolarmente complessa
(12)
.
Ma torniamo a noi e cerchiamo di capire meglio come lo studio delle
equazioni diofantee possa trarre vantaggio dalle congruenze. Lidea generale
`e presto detta: avendo da discutere
(13)
una data equazione diofantea, da
quanto detto pi` u sopra risulta chiaro che se essa ammette soluzione allora
ammetter`a soluzione anche ogni equazione ottenuta da essa per passaggio ai
resti modulo n, qualunque sia n
(14)
. Questo fatto pu`o essere sfruttato in vario
modo. Dato che non `e qui nostra intezione di dedicarci approfonditamente
allo studio delle equazioni diofantee, accontentiamoci di chiarire tale idea
(15)
con lausilio di un semplice esempio. Si consideri lequazione diofantea 6x
3
+
x
2
9x +1 = 0; passando ai resti modulo 3 si ottiene x
2
+1 0 (mod 3).
Poiche, come si verica facilmente per via diretta, questa congruenza non
ammette soluzione, lo stesso vale anche per lequazione diofantea considerata.
Per esercizio lo studente pu`o dimostrare che si ottiene analogo risultato anche
per le equazioni diofantee seguenti: 3x
2
+2 = y
2
, 7x
3
+2 = y
3
, x
2
+y
2
+z
2
=
1255 (suggerimento per questultima: si passi ai resti modulo 8).
(11)
Naturalmente sono stati ottenuti molti risultati parziali, a partire dal primo passo
compiuto da Eulero che prov`o che quellaermazione `e vera per n = 3. In relazione
a quanto osservato nella nota (2) va tenuto presente che il tentativo di generalizzare
ad ogni nuovo valore di n, n = 4, 5, . . ., la dimostrazione valida per ln prededente si
`e costantemente rivelato fallimentare.
(12)
Chi volesse soddisfare maggiori curiosit`a in proposito pu`o rivolgersi ai due piacevoli
libri seguenti: A.D.Aczel: Lenigma di Fermat, Il Saggiatore, 1998; S.Singh: LUltimo
Teorema di Fermat, Rizzoli, 1997
(13)
Cio`e decidere se essa ammette o meno soluzioni e, in caso aermativo, trovarle tutte.
(14)
Va osservato in proposito che non `e vero il contrario, che cio`e non `e vero che se
unequazionre diofantea non ammette soluzione allora non `e risolubile neppure una
corrispondente congruenza. Ad esempio, mentre lequazione x
2
2 = 0 non ammette
soluzioni intere, di contro la congruenza x
2
2 0 (mod 7) `e soddisfatta per x = 3
e per x = 4.
(15)
Si noti pure che essa `e gi`a stata utilizzata nella Prop. 8.15 per provare che lequazione
diofantea ax +by = c non ammette soluzione se d := (a, b) non divide c.
97
Cap. 9
Le successive estensioni del concetto di numero
IV. Dai reali ai complessi
9.1 Denizioni e prime propriet`a
Nel Cap. 5 si `e visto che, a causa della Prop. 5.1, non `e opportuno passare
direttamente dal campo Q dei razionali ad una sua estensione nella quale
siano risolubili tutte le equazioni di secondo grado. Ci`o daltra parte non `e
neppure possibile perche il passaggio attraverso i numeri reali `e comunque
obbligato. Infatti questi ultimi sono indispensabili per denire linsieme C
dei numeri complessi che `e per lappunto linsieme
C := R R
delle coppie ordinate di numeri reali. Linsieme R stesso pu`o essere riguardato
come un sottoinsieme di C qualora lo si identichi con limmagine dellim-
mersione canonica
i: R C
a (a, 0)
.
Come vedremo tra breve, in luogo delle coppie ordinate di numeri reali sar`a
pi` u comodo usare una diversa rappresentazione dei numeri complessi; tut-
tavia `e importante lavere introdotto C come come quadrato cartesiano di R
per sottolineare che la sua denizione non richiede altro che i reali e la teoria
elementare degli insiemi, in omaggio al nostro proposito di riutare di tirar
fuori alcunche dal cilindro del prestigiatore.
Limmersione canonica risulta anche essere un morsmo di campi qualora
si deniscano su C le operazioni di addizione, +, e di moltiplicazione, ,
nel modo seguente:
+ : C C C (addizione)
((a, b), (c, d)) (a +c, b +d)
: C C C (moltiplicazione)
((a, b), (c, d)) (ac bd, ad +bc)
98
Prima di vericare che C `e dotato della struttura di campo dalle due opera-
zioni appena denite, conviene rivolgere la nostra attenzione al particolare
numero complesso i := (0, 1) detto unit`a immaginaria che risulta
essere la radice quadrata di 1 :
i
2
= (0, 1) (0, 1) = (1, 0) = 1 R.
Facendo uso di questo possiamo infatti rappresentare il complesso (a, b) nella
forma a +ib, giacche si ha
(a, b) = (a, 0) + (0, b) = (a, 0) + (0, 1)(b, 0) = a +ib .
In tale rappresentazione somme e prodotti di complessi si eseguono come se
fossero polinomi nella variabile i, salvo poi eventualemte semplicare me-
diante la relazione i
2
= 1:
(a +ib) + (c +id) = (a +c) +i(b +d),
(a +ib) (c +id) = ac +ibc +iad +i
2
bd = (ac bd) +i(ad +bc).
`
E immediato vericare che rispetto a tali operazioni linsieme C dei complessi
`e dotato della struttura di anello commutativo con unit`a (cio`e che gode delle
propriet`a 1)4) di 6.1); per concludere che `e addirittura un campo basta
provare che ogni complesso non nullo z = a + ib ammette inverso. A tal
ne associamo a z il numero complesso z
= 2a che il
prodotto N(z) := zz
= a
2
+ b
2
(questultimo detto norma di z) sono
numeri reali; semplici calcoli provano che vale anche il viceversa, cio`e che due
numeri complessi (non reali) z e t tali che z +t, zt R sono necessariamente
complessi coniugati
(1)
. Dallespressione della norma si trae
1 = z
z
N(z)
e quindi linverso di z = a +ib ,= 0 `e
z
1
=
z
N(z)
=
a
a
2
+b
2
i
b
a
2
+b
2
.
(1)
Per inciso, questo d`a una dimostrazione (diversa da quella che sfrutta la formula
risolutiva) del fatto che se unequazione quadratica a coecienti reali x
2
+x+ = 0
ammette una radice complessa allora ammette anche la sua complessa coniugata:
infatti, dette z e t le sue radici, deve aversi z + t = , zt = R. Sempre
sfruttando lapplicazione z z
1!
2
2!
i
3
3!
+
4
4!
+i
5
5!
+ =
=
_
1
2
2!
+
4
4!
_
+i
_
3
3!
+
5
5!
_
=
(3)
In eetti, avendo a che fare con serie, occorrerebbe maggior cautela nellestendere
ad esse le propriet`a delle somme nite; in particolare, nel caso attuale, bisognerebbe
giusticare luso della propriet`a commutativa della somma, che qui si utilizza e che
tuttavia non vale nel caso generale.
101
= cos +i sin ;
questo giustica la posizione seguente:
e
i
:= cos +i sin .
Notiamo esplicitamente che la formula precedente estende la nozione di
potenza al caso di esponente complesso:
a+ib
=
a
ib
=
a
e
ib ln
=
a
_
cos(b ln ) +i sin(b ln )
_
.
La notazione esponenziale e
i
risulta particolarmente comoda quando si
debbano moltiplicare dei numeri complessi:
(9.1)
_
e
i
__
e
i
_
= ()e
i(+)
;
inoltre:
z
1
= (e
i
_
1
=
1
e
i
=
1
_
cos i sin
_
.
Osserviamo che la (9.1) ha uninteressante interpretazione geometrica: lope-
ratore moltiplicazione per il complesso e
i
che associa a e
i
il complesso
e
i(+)
si traduce, nel piano di Gauss, nelloperatore rotazione (in senso
antiorario) intorno allorigine di un angolo .
Un altro calcolo che la notazione z = e
i
consente di eseguire rapida-
mente `e lelevamento a potenza di un numero complesso,
= z
=
_
e
i
_
e
i
,
con esponente reale e quindi anche, in particolare, lestrazione di radice di
un complesso: t =
n
e
i
n
dove
n
e
i
n
sia eettivamente una radice n-esima di z = e
i
; daltra parte per`o sappi-
amo dal Teorema fondamentale dellalgebra che lequazione t
n
z = 0 am-
mette n soluzioni nel campo complesso e quindi che vi sono n radici n-esime
di z. Noi ne abbiamo trovato una; e le altre n 1? Non `e dicile svelare
larcano: basta osservare che si ha
z = e
i
= e
i(+2h)
h = 0, 1, 2, . . .
(4)
Non si dimentichi che il raggio vettore `e per denizione un numero reale positivo!
102
e quindi
(9.2)
n
z =
n
e
i(
n
+
2h
n
)
h = 0, 1, 2, . . .
il cui secondo membro non assume sempre lo stesso valore al variare di h.
Pi` u precisamente si ha
e
i(
n
+
2h
n
)
= e
i(
n
+
2h
n
)
h
mod n
h
.
Pertanto, al variare di h la (9.2) assume esattamente n valori diversi
n
z =
n
e
i(
n
+
2h
n
)
h = 0, 1, . . . , n 1
Osserviamo che per = 1 e = 0 si ottengono le n radici n-esime
dellunit`a:
h
= e
i
2h
n
h = 0, 1, . . . , n 1
su cui torneremo nel capitolo seguente.
Per maggior chiarezza poniamo
Arg z := arg z + 2h
per cui ad es. la (9.2) pu`o essere scritta anche nella forma
(9.2
)
n
z =
n
e
i
Arg z
n
.
Analogo discorso occorre fare per il caso in cui lesponente sia un reale
qualunque, correggendo cos` una delle formule precedenti:
= z
=
_
e
i(+2h)
_
e
i(+2h)
.
la quale, come facilmente si verica, ammette un numero di valori nito o
innito a seconda che sia razionale o irrazionale, rispettivamente.
A questo punto, se anche lesponente `e un complesso qualunque, =
a +ib, `e facile fare i conti:
z
=
_
e
i(+2h)
_
=
_
e
i(+2h)
_
a+ib
=
a+ib
e
i(+2h)(a+ib)
=
=
a
ib
e
b(+2h)
e
ia(+2h)
= e
a ln b2hb
e
i(b ln +a+2ha)
e, come si vede, al variare di h, il modulo di z
e
i
= z = e
i(+2h)
e quindi
= ln = ln [z[ e = + 2h = Arg z.
Pertanto il logaritmo di z `e dato da
u = Ln z = ln [z[ +iArg z = ln +i( + 2h);
lespressione
ln z = ln [z[ +i arg z = ln +i
viene detta parte principale del logaritmo di z.
Il fatto che sia la funzione esponenziale che quella logaritmica possano
assumere pi` u valori ci impedisce di considerarle funzioni nel senso precisato
in 1.5. Per rimettere a posto le cose bisognerebbe introdurre il concetto di
supercie di Riemann, che lo studente incontrer`a nei corsi di Analisi e di
Geometria superiore.
104
Cap. 10
Polinomi in una indeterminata
Il teorema fondamentale dellalgebra
10.1 Denizioni e prime propriet`a
Un polinomio a(x) di grado n in una indeterminata x a coecienti in C `e
una qualunque espressione della forma
(10.1) a(x) = a
0
+a
1
x +a
2
x
2
+ +a
n
x
n
=
n
i=0
a
i
x
i
(a
i
C, a
n
,= 0).
In simboli, il grado del polinomio a(x) si suole indicare con deg(a). Il ter-
mine a
n
x
n
(rispettivamente, il coeciente a
n
) viene detto termine (risp.:
coeciente) direttore di a(x). Se a
n
= 1, allora a(x) viene detto monico.
Linsieme di tutti i polinomi in una indeterminata x a coecienti in
C verr`a denotato con C[x]. Se si restringe il campo dei coecienti da C
a R o a Q avremo R[x] e, rispettivamente, Q[x]. Pi` u in generale, se A `e
un qualunque anello (vedi Appendice 1), si potr`a parlare dellinsieme A[x]
dei polinomi a coecienti in A. Cos`, ad esempio, ha senso considerare
anche Z[x], o Z
m
[x], o ancora M
m
[x] (M
m
=insieme delle matrici quadrate
dordine m). Naturalmente le propriet`a dei polinomi dipendono fortemente
dallanello dei coecienti considerato, e in particolare dal fatto che tale anello
sia o meno un campo (vedi Appendice 1). Per maggiore generalit`a e salvo
esplicita indicazione contraria, ci riferiremo allinsieme K[x] dei polinomi a
coecienti in un campo K qualunque:
(10.1
) a(x) = a
0
+a
1
x +a
2
x
2
+ +a
n
x
n
=
n
i=0
a
i
x
i
(a
i
K, a
n
,= 0).
Il lettore che eventualmente provi disagio per tale astrazione pu`o tranquil-
lamente, almeno ad una prima lettura, riguardare K come il campo C, o
R, o Q. Riallacciandoci ad unaermazione precedente, notiamo pure che
tuttavia alcune delle aermazioni che seguono (ad es. la Prop.10.1 e i suoi
Corollari) non valgono pi` u se linsieme dei coecienti anziche un campo `e
solo un anello (come, ad es., in Z[x]).
105
Va sottolineato che lespressione (10.1
) lespressione
(10.1
) (a
0
, a
1
, a
2
, . . . , a
n
, 0, 0, . . .)
cio`e una successione i cui termini, da un certo punto in poi, sono tutti nulli.
Successioni di questo tipo vengono dette successioni a supporto nito.
Linsieme di tutte le successioni a supporto nito di elementi di K viene
denotato con K
(N)
. Poiche la corrispondenza
(10.2)
K[x] K
(N)
a
0
+a
1
x +a
2
x
2
+ +a
n
x
n
(a
0
, a
1
, a
2
, . . . , a
n
, 0, 0, . . .)
`e una bigezione, K[x] K
(N)
, possiamo addirittura identicare a
0
+ a
1
x +
a
2
x
2
+ +a
n
x
n
con (a
0
, a
1
, a
2
, . . . , a
n
, 0, 0, . . .), e cio`e riguardare questultima
espressione come un modo diverso per rappresentare un polinomio formale.
Tale identicazione `e compatibile anche con le operazioni di addizione e
moltiplicazione che qui di seguito deniamo e che dotano K[x] e, rispetti-
vamente, K
(N)
della struttura di anello, per cui la bigezione K[x] K
(N)
`e
un isomorsmo danelli.
106
Laddizione e la moltiplicazione su K[x] sono denite nel modo seguente:
+ : K[x] K[x] K[x]
_
n
i=0
a
i
x
i
,
m
j=0
b
j
x
j
_
max(n,m)
h=0
(a
h
+b
h
)x
h
;
equivalentemente:
+ : K
(N)
K
(N)
K
(N)
_
(a
0
, a
1
, a
2
, . . .), (b
0
, b
1
, b
2
, . . .)
_
(a
0
+b
0
, a
1
+b
1
, a
2
+b
2
, . . .)
;
: K[x] K[x] K[x]
_
n
i=0
a
i
x
i
,
m
j=0
b
j
x
j
_
n+m
h=0
_
h
j=0
a
j
b
hj
_
x
h
;
equivalentemente:
: K
(N)
K
(N)
K
(N)
_
(a
0
, a
1
, . . .), (b
0
, b
1
, . . .)
_
_
a
0
b
0
, a
0
b
1
+a
1
b
0
, . . . ,
h
j=0
a
j
b
hj
, . . .
_
`
E immediato riconoscere che tali operazioni dotano K[x] [risp.: K
(N)
] della
struttura di anello commutativo (vedi A.3 dellAppendice). Si tratta di un
anello molto simile a quello Z degli interi. Il lettore dovrebbe sforzarsi di
cogliere nelle propriet`a incontrate nel corso della scuola media superiore
come pure in quelle che vedr`a qui di seguito per la prima volta sia le
precise analogie che le importanti dierenze tra questi due anelli. Le prime
sono dovute soprattutto al fatto che i due anelli citati sono, come suol dirsi nel
linguaggio dellalgebra astratta, domini a ideali principali. Pur rinviando
lo studio di questi particolari anelli ad un successivo corso, dedicato alle
principali strutture algebriche astratte, la cosa `e tuttavia di tale importanza
che, anche nellattuale contesto in cui si `e deciso di trattare in modo alquanto
informale gli argomenti discussi, ci pare opportuno chiarire quella nozione.
10.2 La divisione euclidea
Iniziamo dal concetto di ideale, che `e comunque una delle nozioni basilari
della teoria degli anelli. Cos` viene chiamato un sottogruppo additivo I di un
anello A tale che se x I e a A allora ax, xa I. Ad esempio, ssato un
elemento g in un anello commutativo A, linsieme I := (g) := ag [ a A
`e, come si verica facilmente, un ideale di A, che si dice esser generato
dallelemento g. Ideali di questo tipo vengono detti principali. In gene-
rale vi sono anche ideali che non sono principali. Nel caso per`o dellanello Z
degli interi e di quello K[x] dei polinomi a coecienti in un campo K ogni
ideale `e di quel tipo.
`
E questo fatto che si esprime dicendo che si tratta di
domini a ideali principali. Laermazione precedente va provata. Per
107
quanto concerne Z essa discende dal fatto che gi`a ogni sottogruppo additivo
(e quindi anche, a maggior ragione, ogni ideale) di Z `e di quella forma (cfr.
Prop.6.2). Nel caso di K[x] la dimostrazione `e simile a quella. Anche ora
occorre sfruttare la divisione euclidea. Pertanto dimostriamo preliminar-
mente la seguente proposizione.
Prop. 10.1 (Esistenza e unicit`a di quoziente e resto): Dati due poli-
nomi a(x) e b(x) ,= 0 in K[x] (K campo), esiste una ed una sola coppia di
polinomi q(x) e r(x) tali che
(1)
a = qb +r, 1 deg(r) < deg(b) .
I polinomi q(x) e r(x) vengono detti quoziente e, rispettivamente, resto
nella divisione euclidea di a(x) (dividendo) per b(x) (divisore).
Dimostrazione: Sia a(x) = a
n
x
n
+ a
n1
x
n1
+ + a
0
, b(x) = b
m
x
m
+
b
m1
x
m1
+ + b
0
, con a
n
, b
m
,= 0. Se n < m, basta porre q(x) := 0 e
r(x) := a(x). Se invece n m, poniamo
q
1
(x) :=
a
n
b
m
x
nm
e
r
1
(x) := a(x) q
1
(x)b(x) =
_
a
n1
a
n
b
m
b
m1
_
x
n1
+ =
= r
1,h
x
h
+r
1,h1
x
h1
+ +r
1,0
,
dove h = deg(r) n 1 < deg(a). I polinomi q
1
(x) e r
1
(x) vengono detti
primo quoziente parziale e, risp., primo resto parziale.
Se deg(r
1
) < deg(b), poniamo q(x) := q
1
(x) e r(x) := r
1
(x). Se invece
deg(r
1
) deg(b), poniamo
q
2
(x) :=
a
n
b
m
x
nm
+
r
1,h
b
m
x
hm
(secondo quoziente parziale)
r
2
(x) := a(x) q
2
(x)b(x) = r
2,k
x
k
+r
2,k1
x
k1
+ +r
2,0
(secondo resto parziale),
per cui k = deg(r
2
) < deg(r
1
) < deg(a). Ancora una volta, se deg(r
2
) <
deg(b), allora si pu`o porre q(x) := q
2
(x) e r(x) := r
2
(x). In caso contrario
possiamo iterare il processo precedente. Poiche il grado dei successivi resti
parziali va decrescendo ed `e comunque un intero 1, quel procedimento
non pu`o iterarsi allinnito e, prima o poi, si trova un resto parziale r
s
(x)
per cui deg(r
s
) < deg(b). Allora la coppia q(x) := q
s
(x) e r(x) := r
s
(x) `e
quella cercata.
(1)
Ricordiamo che convenzionalmente si `e posto deg(0) = .
108
Ci`o prova, costruttivamente, lesistenza della coppia quoziente/resto ma
non che essa `e unica. Infatti, nel ragionamento fatto, niente esclude che possa
esistere unaltra coppia q
(x), r
b +r
, 1 deg(r), deg(r
) < deg(b)
si ricava
b(q q
) + (r r
) = 0 .
Se fosse q ,= q
, si avrebbe
deg(r r
)),
in contraddizione con la precedente. Pertanto
r(x) r
(x) = 0, q(x) q
(x) = 0 ,
e quindi lunicit`a della coppia quoziente/resto.
Corollario 10.2: Lanello K[x] dei polinomi in una indeterminata a co-
ecienti in un campo K `e un dominio a ideali principali, cio`e `e un anello
commutativo in cui ogni ideale `e principale.
Dimostrazione: Sia I un ideale di K[x] e sia d(x) il polinomio monico di
grado minimo in I.
`
E facile provare che esiste uno ed un solo polinomio
siatto. Dimostriamo che si ha I = (d), cio`e che ogni elemento p(x) di I `e
necessariamente un multiplo di d(x). A tal ne dividiamo p(x) per d(x):
p(x) = d(x) q(x) +r(x) con deg(r) < deg(d).
Da questa si ricava
r(x) = p(x) d(x) q(x).
Poiche d(x) I allora d(x)q(x) I; daltra parte I `e, per denizione, chiuso
anche rispetto alla sottrazione e quindi da p(x) I e d(x) q(x) I si deduce
che r(x) = p(x) d(x) q(x) I. Questultima, insieme con deg(r) < deg(d)
e con la denizione di d(x), comporta r(x) = 0, e quindi p(x) = d(x) q(x),
come volevasi dimostrare.
Ricordando che un elemento K si dice radice o zero del polinomio
p(x) K[x] se si ha p() = 0, si ha pure lulteriore importante conseguenza
della divisione:
Corollario 10.3: Sia K una radice del polinomio p(x) K[x]. Allora
p(x) `e divisibile per x .
109
Dimostrazione: Dividendo p(x) per x si ottiene
(10.3) p(x) = (x ) q(x) +r(x)
dove r pu`o avere solo grado 0 o grado , e quindi deve necessariamente
essere una costante, eventualmente nulla. Ponendo x = in (10.3), si vede
che si verica proprio questultima possibilit`a, e quindi che x divide p(x).
Si dice che una radice Kdi p(x) K[x] `e una radice di molteplicit`a
r, o anche che `e una radice r-upla, per p(x) se si ha
p(x) = (x )
r
q(x) con q() ,= 0.
Corollario 10.4: Un polinomio p(x) di grado n a coecienti in un campo
K ha al pi` u n radici in K. Pi` u precisamente: se
1
, . . . ,
s
K sono le radici
di p(x), di molteplicit`a r
1
, . . . , r
s
rispettivamente, si ha r
1
+ +r
s
n.
Dimostrazione:
`
E una conseguenza immediata del Corollario 10.3.
10.3 Il Teorema fondamentale dellalgebra
Senza fare ulteriori ipotesi sul campo K laermazione del Corollario 10.4
non pu`o essere migliorata, vale a dire che pu`o capitare che il numero delle
radici sia eettivamente inferiore a n, anche quando si tenga conto della loro
molteplicit`a. Ad esempio i polinomi x
2
2 Q[x] e x
2
+1 R[x] non hanno
alcuna radice nei rispettivi campi dei coecienti Q e R. Vale tuttavia il
seguente
Teorema 10.5 (Teorema fondamentale dellalgebra): Sia a(x) un poli-
nomio di grado n in una indeterminata a coecienti in C,
(10.4) a(x) = a
0
+a
1
x +a
2
x
2
+ +a
n
x
n
=
n
i=0
a
i
x
i
(a
i
C, a
n
,= 0) .
Esistono allora s( n) numeri complessi
1
, . . . ,
s
C tali che
a(x) = a
n
(x
1
)
r
1
(x
2
)
r
2
(x
s
)
r
s
con r
1
+ +r
s
= n.
Dimostrazione: Viene omessa.
Un campo K per il quale valga un risultato analogo al precedente viene
detto algebricamente chiuso. Tale `e quindi il campo complesso C, ma
110
non quello reale R ne quello razionale Q. A questo proposito citiamo, anche
stavolta senza dimostrarlo, un altro importante risultato:
Prop. 10.6: Ogni campo K ammette unestensione K
(cio`e un campo K
di K in cui ci`o
accade contemporaneamente per tutti i polinomi in K
= i:
a() = 0 a(
) = 0.
Dimostrazione:
`
E facile vericare che la trasformazione (detta coniugio)
: C C, z = x + iy z
) e
(0) = 0, e quindi a(
) = 0.
Corollario 10.8: Un polinomio a(x) a coecienti in R di grado dispari
ammette almeno una radice reale.
Dimostrazione:
`
E unimmediata conseguenza della proposizione prece-
dente.
10.4 Massimo comun divisore e minimo comune multiplo
Le nozioni di massimo comun divisore e di minimo comune multiplo
di due polinomi si deniscono, e si denotano, in modo in tutto e per tutto
simile alle analoghe nozioni relative agli interi (cfr. 6.3). Parimenti simili
sono gran parte delle propriet`a relative a tali nozioni. Ad esempio, vale
unaermazione analoga alla Prop. 6.3 :
111
Prop. 10.9 : Sia d := (a, b) il massimo comun divisore dei due polinomi
a(x) e b(x). Esistono allora dei polinomi r(x), s(x) tali che
d = a r +b s.
Dimostrazione: Tenendo presente il Corollario 10.2, la dimostrazione
segue la falsariga di quella della Prop. 6.3 .
Come pure quelle analoghe ai Corollari 6.4 e 6.5:
Corollario 10.10: Dati i polinomi a(x), b(x), esistono dei polinomi (x),
(x) tali che
a(x) (x) +b(x) (x) = c(x)
se e solo se il massimo comun divisore d = (a, b) di a(x) e b(x) divide c(x).
In particolare, per opportuni (x), (x) si ha
(10.5) a(x) (x) +b(x) (x) = 1
per opportuni polinomi (x), (x) se e solo se (a, b) = 1.
Dimostrazione: Analoga a quella del Corollario 6.4.
Anche nel caso dei polinomi, come gi`a in quello degli interi (vedi 6.3), la
ricerca del massimo comun divisore d(x) di due polinomi a(x) e b(x), nonche
quella dei polinomi (x), (x) per cui vale la (10.5), pu`o essere condotta
tramite lalgoritmo euclideo delle divisioni successive. Anzi, nel caso
attuale tale algoritmo `e tanto pi` u importante in quanto non si dispone per
i polinomi di una procedura eettiva di decomposizione in fattori primi,
che invece per gli interi forniva un algoritmo alternativo a quello euclideo
per la ricerca del massimo comun divisore. Lasciamo al lettore il compito
di tradurre, per il caso dei polinomi, la descrizione dellalgoritmo euclideo
data in 6.3 (lunica dierenza tra i due casi consiste nel fatto che laddove
si sfruttava la decrescenza dei resti occorre ora sfruttare quella dei relativi
gradi).
10.5 Formule di Girard
(2)
-Newton
Dato in K[x] un polinomio monico
(10.6) a(x) = x
n
+a
n1
x
n1
+ +a
2
x
2
+a
1
x +a
0
denotiamo con
1
,
2
, . . . ,
n
le sue n radici in una opportuna estensione del
campo K (eventualmente coincidente con K stesso):
(10.7) a(x) = (x
1
)(x
2
) (x
n
)
(2)
Albert GIRARD (15901633), matematico ammingo.
112
Sviluppando i prodotti a secondo membro di questultima e confrontando il
risultato con (10.4), si ottengono facilmente le relazioni
(10.8)
a
n1
= (
1
+
2
+ +
n
)
a
n2
=
1
2
+
1
3
+ +
n1
n
a
n3
= (
1
3
+
1
4
+ +
n2
n1
n
)
a
2
= (1)
n2
(
1
2
n2
+ +
3
n1
n
)
a
1
= (1)
n1
(
1
2
n1
+ +
2
n1
n
)
a
0
= (1)
n
(
1
2
n
)
Le (10.8), che esprimono i coecienti del polinomio a(x) in funzione delle sue
radici
1
,
2
, . . . ,
n
, vengono dette formule di Girard-Newton. Merita
osservare che le espressioni a secondo membro sono polinomi simmetrici
nelle radici
1
,
2
, . . . ,
n
e anzi (considerati eventualmente a meno del
segno) vengono detti funzioni simmetriche elementari nelle variabili
1
,
2
, . . . ,
n
. Questa aermazione va chiarita. Una funzione f(
1
, . . . ,
n
)
nelle variabili
1
,
2
, . . . ,
n
viene detta simmetrica se, qualunque sia la
permutazione i
1
, i
2
, . . . , i
n
degli indici 1, 2, . . . , n, si ha
f(
1
,
2
, . . . ,
n
) = f(
i
1
,
i
2
, . . . ,
i
n
).
Vale il seguente risultato:
Proposizione 10.11: Sia f(x
1
, x
2
, . . . , x
n
) un polinomio simmetrico nelle
variabili x
1
, x
2
, . . . , x
n
. Esiste allora un polinomio g(y
1
, y
2
, . . . , y
n
) in n va-
riabili tali che, indicati con
1
(x
1
, x
2
, . . . , x
n
) = x
1
x
2
x
n
, . . . ,
n
(x
1
, x
2
, . . . , x
n
) = x
1
+x
2
+ +x
n
i polinomi simmetrici elementari nelle variabili x
1
, x
2
, . . . , x
n
, si ha
f(x
1
, x
2
, . . . , x
n
) = g(
0
,
1
, . . . ,
n1
) .
Pur omettendo, per brevit`a, la dimostrazione di questo importante risul-
tato, merita tuttavia la pena almeno di informare il lettore che essa `e costrut-
tiva. Vale a dire che essa indica come costruire il polinomio g(
0
,
1
, . . . ,
n1
)
a partire dal polinomio f(x
1
, x
2
, . . . , x
n
) assegnato.
113
10.6 Radici n-esime dellunit`a
Dicesi equazione binomia unequazione della forma
x
n
a = 0 (0 ,= a C).
Le sue n radici
0
,
1
, . . . ,
n1
vengono dette radici n-esime di a e indicate
genericamente col simbolo
n
a o, meglio, a
1
n
. Posto a = e
i
= (cos +
i sin ), 0 < R, come si `e visto in 9.2 quelle radici sono tutte espresse da
(10.9)
h
=
n
e
i(
n
+
2h
n
)
(h = 0, 1, . . . , n 1)
dove
1
n
indica lunica radice reale positiva n-esima di . In particolare, per
a = 1, i valori
(10.10)
h
= e
i
2h
n
(h = 0, 1, . . . , n 1)
vengono detti radici n-esime dellunit`a. Poiche, come subito si verica,
si ha
0
= 1,
h
k
=
[h+k]
mod n
,
1
h
=
nh
,
h
=
h
1
,
linsieme delle radici n-esime dellunit`a,
:=
0
,
1
, . . . ,
n1
,
forma un sottogruppo del gruppo moltiplicativo dei complessi non nulli.
Il fatto che uno qualunque degli elementi
h
si possa esprimere come
potenza di uno di essi, ad es. di
1
, si esprime dicendo che `e un gruppo
ciclico e che
1
`e un suo generatore. Se n > 2, vi sono altri generatori di
; uno qualunque di essi verr`a detto radice primitiva n-esima dellunit`a.
`
E facile provare che le radici primitive n-esime sono in numero di (n).
Ricordando che la funzione di Eulero (n) d`a il numero degli interi minori di
n e primi con n (cfr. 8.2), questa aermazione `e una conseguenza immediata
della proposizione seguente.
Prop. 10.12 : La radice n-esima dellunit`a
h
=
h
1
, con
1
= e
i
2
n
, `e
primitiva se e solo se h `e primo con n, (h, n) = 1.
Dimostrazione: La condizione (h, n) = 1 `e necessaria e suciente anche
esistano due interi x, y tali che
hx +ny = k per ogni k 0, 1, . . . , n 1,
114
e quindi tali che
k
=
k
1
=
hx+ny
1
= (
h
1
)
x
(
n
1
)
y
=
x
h
.
10.7 Formule risolutive delle equazioni algebriche di grado
minore di 5
A tutti sono note le formule
(10.11) x =
b
a
e
(10.12) x =
b
b
2
4ac
2a
che forniscono le soluzioni delle equazioni algebriche di primo, ax +b = 0, e,
rispettivamente, di secondo grado, ax
2
+bx+c = 0. Si osservi che in (10.11)
e (10.12) i valori di tali soluzioni sono espressi in funzione dei coecienti
tramite espressioni nelle quali si `e fatto esclusivamente uso delle quattro ope-
razioni elementari e dellestrazione di radice quadrata. Per esprimere questo
fatto si suol dire che quelle soluzioni sono ottenute per radicali quadratici.
Pi` u in generale, si dir`a ottenute per radicali quando viene consentito luso
anche di radicali di indice superiore al secondo.
Passando alle equazioni algebriche
(3)
generali (cio`e, senza alcuna con-
dizione particolare sui coecienti) di grado superiore al secondo, va subito
detto che anche per quelle di terzo e quarto grado (ma non pi` u per quelle
di grado superiore al quarto) vi sono delle formule risolutive per radicali
(4)
.
La loro scoperta va ascritta a vanto di diversi algebristi italiani del Rinasci-
mento.
`
E stato Cardano
(5)
a renderle di dominio pubblico nella sua opera
(3)
Ricordiamo che unequazione algebrica `e un polinomio eguagliato a zero.
`
E bene non
dimenticare di indicare tale aggettivo, giacche esistono molti altri tipi di equazioni,
ad esempio quelle trigonometriche, o alle dierenze, o dierenziali, o integrali, etc.etc.
(4)
Questa aermazione pu`o essere fuorviante. Non va infatti interpretata intendendo
che le soluzioni delle equazioni di terzo e quarto grado possano sempre essere deter-
minate mediante algoritmi esclusivamente e strettamente algebrici. Infatti almeno
nel caso in cui il discriminante dellequazione (10.12) `e negativo (trattasi del terzo
dei casi esaminati pi` u sotto), occorrendo estrarre la radice cubica di complessi (non
reali), non `e possibile evitare luso delle funzioni trascendenti seno e coseno, come
indica la (10.7).
(5)
Gerolamo CARDANO (15011576), matematico e professore universitario a Bologna
e a Milano, che tuttavia non disdegnava il gioco dazzardo, la medicina e lastrologia,
la cui frequentazione era, allora non meno che nei giorni nostri, piuttosto redditizia.
115
Ars magna del 1545, ma la scoperta va attribuita a Del Ferro
(6)
e Tartaglia
(7)
per quella di terzo grado e a Ferrari
(8)
per quella di quarto. Tali formule sono
decisamente meno semplici delle (10.11) e (10.12); qui di seguito le descri-
viamo tralasciando, per semplicit`a, di indicare come si ottengono.
Il primo passo per risolvere lequazione di terzo grado (anche detta
equazione cubica)
(10.13) x
3
+ax
2
+bx +c = 0 (a, b, c C)
consiste nel trasformarla, mediante la sostituzione
x = y
a
3
,
in una priva del termine quadratico:
(10.14) y
3
+py +q = 0,
dove p = b
a
2
3
e q = c
ab
3
+
2a
3
27
.
Indicata con una radice primitiva terza dellunit`a (cio`e = e
i
2
3
, e
quindi
2
= e
i
2
3
) e con e due delle (tre pi` u tre
(9)
) radici cubiche
=
3
q
2
+
_
q
2
4
+
p
3
27
, =
3
q
2
_
q
2
4
+
p
3
27
che inoltre soddisno la condizione
=
p
3
,
le tre soluzioni della (10.12) sono:
(10.15) y
1
= +, y
2
= +
2
, y
3
=
2
+ .
Consideriamo ora il caso in cui i coecienti dellequazione cubica ini-
ziale, e quindi anche quelli della (10.14), siano reali e vediamo cosa si pu`o
(6)
Scipione DEL FERRO (1465ca1526), anchegli professore di matematica allUniver-
sit`a di Bologna.
(7)
Nicol`o FONTANA (1500ca1557), detto TARTAGLIA, bresciano, ebbe come
peraltro buona parte dei protagonisti di queste vicende una vita travagliata.
(8)
Ludovico FERRARI (15221565), segretario del Cardano.
(9)
Si conviene che il radicale quadratico che compare vada preso nella sua determi-
nazione positiva (a meno di un eventuale fattore i).
116
dire riguardo alla realit`a o meno delle radici. Come `e facilmente intuibile, in
questa questione gioca un ruolo essenziale lespressione
q
2
4
+
p
3
27
che pi` u sopra
compare sotto il segno di radice quadrata. Notiamo subito che essa coincide,
a meno di un fattore costante, col discriminante del polinomio y
3
+py +q
(cio`e col risultante di y
3
+py +q e del suo derivato 3y
2
+p; cfr. 10.9):
=
1 0 p q 0
0 1 0 p q
3 0 p 0 0
0 3 0 p 0
0 0 3 0 p
= 27q
2
+ 4p
3
= 4 27
_
q
2
4
+
p
3
27
_
.
Si distinguono tre casi:
1) Se = 0, allora possiamo assumere = e quindi
y
1
= 2, y
2
= ( +
2
) = y
3
;
la presenza di una radice doppia comporta, in virt` u della Prop.10.7, che
tutte e tre le radici siano reali.
2) Se > 0, lespressione
q
2
che compaiono in e,
rispettivamente, sono complessi coniugati; pertanto tutti i (tre pi` u tre)
valori che e possono assumere sono complessi. Daltra parte, poiche per
il Corollario 10.8 almeno uno degli zeri deve essere reale, non `e restrittivo
supporre che lo sia y
1
= +. Da ci`o e da =
p
3
R si deduce che e
sono le radici dellequazione quadratica z
2
(+)z + = 0 a coecienti
reali, e quindi, tenendo conto dellosservazione precedente, sono due numeri
complessi coniugati. Posto
= e
i
, = e
i
,
si ha
y
2
= +
2
= e
i
e
i
2
3
+e
i
e
i
2
3
= 2 cos
_
+
2
3
_
e
y
3
=
2
+ = e
i
e
i
2
3
+e
i
e
i
2
3
= 2 cos
_
2
3
_
per cui anche y
2
e y
3
sono reali. Resta cos` provata la proposizione seguente.
Prop. 10.13 : Se lequazione cubica (10.11) ha coecienti reali, allora
lequazione (10.12) associata (e quindi anche la (10.11) stessa) possiede
1) una radice doppia e una semplice oppure una radice tripla (ovviamente
reali in entrambi i casi) se = 0;
2) una radice reale e due complesse coniugate se > 0;
3) tre radici reali e distinte se < 0.
Passiamo ora a considerare lequazione generale di quarto grado (anche
detta biquadratica):
x
4
+ax
3
+bx
2
+cx +d = 0 (a, b, c, d C)
Analogamente al caso precedente, inizialmente conviene ricondurla, mediante
la sostituzione
x = y
a
4
,
ad una priva del termine cubico:
(10.16) y
4
+py
2
+qy +r = 0.
118
Lidea giusta per risolvere questultima consiste nel cercare di trasformarla
in una della forma
(10.17)
_
y
2
+A
_
2
B
2
_
y +C
_
2
= 0 (A, B, C costanti)
in modo da ricondurre poi la soluzione a quella delle due equazioni quadratiche
(10.18)
_
y
2
+A
_
+B
_
y +C
_
= 0,
_
y
2
+A
_
B
_
y +C
_
= 0.
Questidea pu`o essere realizzata in pi` u passi. Il primo consiste nellintroduzione
di un parametro ausiliario che consente di riscrivere la (10.14) nella forma
(10.19)
_
y
2
+
p
2
+
_
2
_
2y
2
qy +
_
2
+p r +
p
2
4
_
_
= 0.
A questo punto si sceglie in modo tale che la parentesi quadra in (10.17) sia
il quadrato di un binomio della forma B(y +C); ci`o comporta che annulli
il discriminante del polinomio quadratico entro la parentesi quadra:
(10.20) q
2
4 2
_
2
+p r +
p
2
4
_
= 0.
La precedente `e unequazione cubica in . Indicata con
0
una delle sue
radici e sostituitala ad nella (10.17), si ottiene:
(10.21)
_
y
2
+
p
2
+
0
_
2
2
0
_
y
q
4
0
_
2
= 0,
da cui le due equazioni quadratiche cercate:
(10.22)
_
y
2
+
p
2
+
0
_
+
_
2
0
_
y
q
4
0
_
= 0,
(10.22
)
_
y
2
+
p
2
+
0
_
_
2
0
_
y
q
4
0
_
= 0.
10.8 Cenni alle equazioni algebriche di grado 5
Gli sforzi di molti matematici
(10)
del 600 e del 700 per trovare formule
risolutive per radicali dellequazione generale di quinto grado e/o di grado
(10)
Tra questi occorre almeno ricordare litalo-francese Joseph Louis LAGRANGE (1736
1813), sicuramente uno dei pi` u grandi della sua epoca, i cui risultati in questo campo
hanno aperto la strada alle ricerche di Abel e Galois e hanno contribuito alla nascita
dellalgebra moderna (si pensi ad esempio al suo teorema sui gruppi niti).
119
superiore sono stati tanto accaniti quanto frustranti. Solo nel 1799 litaliano
Runi
(11)
, sospettando che ci`o che si andava cercando non lo si trovava
semplicemente perche non esisteva, pervenne a dimostrare (invero in modo
non completamente soddisfacente) che non esiste alcuna formula per radicali
che esprima gli zeri dellequazione generale
(12)
di quinto grado in funzione
dei suoi coecienti. La memoria di Runi pass`o inosservata e fu solo nel
1824 che il mondo matematico prese coscienza di quel risultato, allorche
apparve un lavoro del grande e sfortunato matematico norvegese Abel
(13)
che
lo ridimostrava indipendentemente da Runi e con assoluto rigore logico.
Come si `e detto, pu`o capitare che in casi particolari gli zeri siano in-
vece esprimibili per radicali. Ma quali casi particolari?
`
E questo il problema
che si `e posto e che ha risolto un altro grande genio matematico, il francese
Galois
(14)
. Egli ha infatti determinato sotto quali condizioni sui coecienti
di una data equazione algebrica di grado n le sue radici sono esprimibili per
radicali in funzione dei coecienti. Va detto che per ottenere questo risultato
Galois ha dovuto introdurre diverse idee assai profonde che hanno modicato
lo status stesso dellalgebra. Questa materia, che complessivamente prende
il nome di Teoria di Galois, `e troppo complessa perche qui se ne possa dare
anche solo un semplice cenno illustrativo. Tuttavia, in occasione di futuri,
pi` u specialistici corsi di Algebra, non mancher`a allo studente interessato
lopportunit`a di approfondire sia questi temi che altri ad essi strettamente
collegati. Vogliamo qui solo aggiungere che lo sviluppo di queste teorie ha
consentito, tra laltro, di trovare una risposta negativa ai tre classici proble-
mi di geometria elementare che da oltre duemila anni sdavano lingegno dei
matematici. Ci riferiamo al problema della quadratura del cerchio (trovare
il lato di un quadrato che sia equivalente ad un cerchio dato), quello della
duplicazione del cubo (trovare lo spigolo di un cubo di volume doppio rispetto
ad uno dato) e quello della trisezione dellangolo (dividere in tre parti uguali
un angolo dato). Per comprendere come quei risultati sulla risolubilit`a o
meno delle equazioni abbiano a che fare con questi problemi geometrici oc-
corre tener presente che la soluzione cercata per questi ultimi avrebbe dovuto
consistere in una costruzione geometrica (che, partendo dai dati del proble-
ma, facesse ottenere lelemento desiderato) che facesse esclusivamente uso
(11)
Paolo RUFFINI (17651822), medico e matematico bolognese.
(12)
Non si esclude tuttavia che ci`o sia invece possibile per particolari classi di equazioni.
(13)
Niels ABEL (18021829), geniale quanto sfortunato. Di famiglia numerosa e dalle
modeste condizioni economiche, fu perseguitato dalla sorte no al punto di morir di
tisi a ventisei anni alcuni giorni prima che arrivasse la lettera che gli comunicava che
gli era stata attribuita una cattedra di matematica allUniversit`a di Berlino. Fece
comunque in tempo a lasciare dei risultati rivoluzionari non solo in algebra ma anche
in analisi.
(14)
Evariste GALOIS (18111832), altra gura romantica e tragica. Si osservi che Abel
e Galois, alla loro morte, non sommavano insieme cinquanta anni!
120
di riga e compasso. Una costruzione, cio`e, che richiedesse solo la possibilit`a
di tracciar rette (congiungenti due punti noti) e circonferenze (di centro e
raggio noti) e di determinare punti dintersezione di rette e/o circonferenze.
Poiche, ssato un sistema di riferimento cartesiano ortogonale, le rette sono
rappresentate da equazioni lineari e le circonferenze da particolari equazioni
quadratiche, una costruzione geometrica con riga e compasso si traduce in
una formula algebrica per radicali quadratici
(15)
. Bene, due di quei tre
problemi (trisezione dellangolo e duplicazione del cubo) si traducono alge-
bricamente in equazioni che la teoria prova non essere risolubili per radicali
quadratici mentre il terzo (quadratura del cerchio) `e insolubile con riga e
compasso in virt` u della trascendenza
(16)
di .
10.9 Risultante e discriminante
Non pochi problemi sui polinomi sarebbero facilmente risolubili se si dispo-
nesse di un algoritmo di decomposizione in fattori lineari o, equivalentemente,
(15)
Si ricorda che ogni circonferenza `e rappresentata da unequazione della forma
x
2
+y
2
+ax +by +c = 0
e che il sistema di quarto grado
_
x
2
+y
2
+ax +by +c = 0
x
2
+y
2
+a
x +b
y +c
= 0
si riconduce ad uno di secondo grado
_
x
2
+y
2
+ax +by +c = 0
(a a
)x + (b b
)y + (c c
) = 0
che d`a le due soluzioni al nito. Naturalmente cos` si trascurano le due soluzioni im-
proprie, peraltro comuni a tutte le circonferenze del piano, cio`e i punti di coordinate
omogenee (1, i, 0) (punti ciclici).
(16)
Altro concetto che trova la sua giusta collocazione nella teoria dei campi. Ricordiamo
che un numero complesso viene detto algebrico (su Q) se `e radice di unequazione
algebrica a coecienti razionali. In caso contrario si dice trascendente. Facendo uso
del secondo procedimento diagonale di Cantor si dimostra che linsieme dei numeri
algebrici `e numerabile e quindi che quello dei numeri trascendenti ha la cardinalit`a
del continuo, cio`e che i trascendenti sono molti di pi` u. Meno facile `e provare che
un dato numero `e trascendente. Quella di fu provata nel 1882 dal matematico
tedesco Carl Louis Ferdinand LINDEMANN (18521939), che svilupp`o le idee che in
precedenza (1873) avevano portato il grande matematico francese Charles HERMITE
(18221901) a dimostrare la trascendenza della costante di Nepero e.
121
di uno per la determinazione delle radici. Limpossibilit`a teorica di determi-
narle algebricamente preclude per`o questa via. Si sono dovute quindi cercare
altre strade. In taluni casi questa ricerca ha avuto successo. Un esempio `e
fornito dallalgoritmo euclideo per la determinazione del massimo comun di-
visore illustrato nel 10.4. Qui di seguito studieremo altri problemi di questo
tipo.
Consideriamo in primo luogo il problema seguente:
(I) Dati due polinomi
a(x) = a
n
x
n
+a
n1
x
n1
+ +a
0
,
b(x) = b
m
x
m
+b
m1
x
m1
+ +b
0
,
stabilire se essi hanno o meno radici comuni.
La risposta a questo problema `e fornita dal calcolo di un determinante,
detto forma di Sylvester
(17)
per il risultante Res(a, b) di a(x) e b(x). Si
tratta del determinante di una matrice dordine n +m le cui prime m righe
contengono i coecienti di a(x) e le ultime n quelli di b(x):
Res(a, b) =
=
a
n
a
n1
a
n2
. . . a
1
a
0
0 0 . . . 0 0
0 a
n
a
n1
. . . a
1
a
0
0 . . . 0 0
. . .
0 0 0 . . . 0 a
n
a
n1
a
n2
. . . a
1
a
0
b
m
b
m1
b
m2
. . . b
1
b
0
0 0 . . . 0 0
0 b
m
b
m1
. . . b
1
b
0
0 . . . 0 0
. . .
0 0 0 . . . 0 b
m
b
m1
b
m2
. . . b
1
b
0
_
m
_
_
n
Proviamo che lannullarsi del risultante Res(a, b) `e condizione necessaria
e suciente anche i due polinomi a(x) e b(x) abbiano (almeno) una radice
in comune. A tal ne proviamo dapprima la proposizione seguente.
(17)
James Joseph SYLVESTER (18141897), algebrista inglese.
122
Prop. 10.14 : Dati due polinomi a(x) e b(x), essi ammettono una radice
comune se e solo se esistono due polinomi non nulli (x) e (x), con deg() <
deg(b) e deg() < deg(a), tali che a(x)(x) +b(x)(x) = 0.
Dimostrazione: Poiche deg() < deg(b), non ogni fattore lineare di b(x)
pu`o dividere (x); supponiamo che (x)[b(x) e (x) ,[(x); allora (x),
dividendo b(x)(x), deve dividere anche a(x)(x), e quindi a(x) giacche non
divide (x).
Viceversa, se a(x) = (x ) a(x) e b(x) = (x )
b(x), allora a
b b a =
(x) a
b(x) a
m1
x
m1
+
m2
x
m2
+ +
0
_
+
+
_
b
m
x
m
+b
m1
x
m1
+ +b
0
__
n1
x
n1
+
n2
x
n2
+ +
0
_
=
=
_
a
n
m1
+b
m
n1
_
x
n+m1
+
+
_
a
n1
m1
+a
n
m2
+b
m1
n1
+b
m
n2
_
x
n+m2
+
+
_
a
0
0
+b
0
0
_
da cui il sistema
_
_
a
n
m1
+b
m
n1
= 0
a
n1
m1
+a
n
m2
+b
m1
n1
+b
m
n2
= 0
a
0
0
+b
0
0
= 0
Il precedente `e un sistema omogeneo di n + m equazioni lineari nelle n +
m incognite
m1
,
m2
, . . . ,
0
,
n1
,
n2
, . . . ,
0
e quindi ammette una
soluzione diversa da quella nulla se e solo se si annulla il determinante della
123
matrice dei coecienti. Poiche, come si vede facilmente, questo `e proprio il
determinante di Sylvester, la nostra aermazione resta provata.
Enunciamo, senza dimostrarlo, lulteriore risultato.
Prop. 10.15: Sia
a(x) =
h
i=1
_
x
i
_
r
i
, (r
1
+ +r
h
= n;
i
C)
b(x) =
k
j=1
_
x
j
_
s
j
, (s
1
+ +s
k
= m;
i
C).
Valgono le formule seguenti:
Res(a, b) = a
m
n
b
n
m
i, j
_
i
j
_
r
i
s
j
= (1)
nm
Res(b, a),
Res(a, b) = a
m
n
h
i=1
_
b(
i
)
_
r
i
= (1)
nm
b
n
m
k
j=1
_
a(
j
)
_
s
j
.
Siamo ora in grado di risolvere anche il problema seguente:
(II) Dato un polinomio
a(x) = a
n
x
n
+a
n1
x
n1
+ +a
0
,
stabilire se esso ammette radici multiple.
La soluzione di questo problema discende da quella del precedente e
dalla proposizione che segue. Occorre per`o prima descrivere loperatore di
derivazione D. Si tratta di una nozione che trova la sua pi` u generale col-
locazione nellambito dellanalisi matematica, ma che almeno per quanto
concerne i polinomi pu`o essere denita senza far uso della nozione di
limite. Basta in eetti chiarire che D `e un operatore lineare
(18)
tale che
Dx
n
:= nx
n1
per ogni n N. Da ci`o consegue immediatamente che
D
_
a(x)
_
= D
_
a
n
x
n
+a
n1
x
n1
+ +a
0
_
(18)
Cio`e unapplicazione da C[x] in se che soddisfa le due condizioni
D(f +g) = D(f) + D(g), D(f) = D(f) (f, g C[x]); C).
124
= na
n
x
n1
+ (n 1)a
n1
x
n2
+ + 2a
2
x +a
1
.
Poniamo inoltre D
h
_
a(x)
_
:= D
_
D
h1
_
a(x)
_
_
; D
h
_
a(x)
_
viene detta derivata
h-esima di a(x). Lasciamo al lettore la semplice dimostrazione della formula
seguente
D
_
a(x)b(x)
_
= a(x)D
_
b(x)
_
+b(x)D
_
a(x)
_
.
Come duso scriveremo a
(x), a
(x), a
(x), . . . a
(h)
(x) in luogo di D
_
a(x)
_
,
D
2
_
a(x)
_
, D
3
_
a(x)
_
, . . ., D
h
_
a(x)
_
.
Prop. 10.16 : Un polinomio a(x) ammette una radice (almeno) doppia
se e solo se essa `e radice anche del suo polinomio derivato a
(x). Pi` u in
generale, `e una radice di molteplicit`a h se e solo se annulla, insieme con
a(x), anche tutte le sue derivate successive no alla (h 1)-esima ma non
la h-esima: a() = a
() = a
() = . . . = a
(h1)
() = 0 ,= a
(h)
().
Dimostrazione: Sia una radice di a(x); allora a(x) = (x )q(x).
Ovviamente `e (almeno) doppia se e solo se q() = 0. Si ha a
(x) =
q(x) + (x )q
(x), da cui a
() = q() + ( )q
) .
Dimostrazione:
`
E conseguenza immediata dei risultati precedenti.
10.10 Cenni ai sistemi di grado superiore al primo
Nel corso di Geometria 1 lo studente ha studiato lAlgebra Lineare e quindi
certamente sa risolvere un qualunque sistema di (un numero arbitrario di)
equazioni lineari a coecienti reali in un qualunque numero di incognite. La
soluzione `e anzi abbastanza semplice, richiedendo solo luso del Teorema di
RoucheCapelli e della Regola di Cramer, o equivalenti. Tuttaltro discorso
vale invece per i sistemi (di equazioni algebriche) di grado
(19)
superiore al
primo.
Che per tali sistemi le cose possano essere enormemente complicate si
intuisce facilmente riferendosi alla loro interpretazione geometrica. Dato
infatti un sistema di m equazioni algebriche di grado arbitrario in n variabili
(19)
Ricordiamo che il grado di un sistema di equazioni algebriche `e dato dal prodotto
dei gradi delle singole equazioni che lo compongono.
125
a coecienti reali
(20)
(10.23)
_
_
f
1
(x
1
, . . . , x
n
) = 0
f
2
(x
1
, . . . , x
n
) = 0
f
m
(x
1
, . . . , x
n
) = 0
linsieme dei punti P(
1
, . . . ,
n
) R
n
le cui coordinate soddisfano il si-
stema (10.23) formano, allinterno dello spazio ane n-dimensionale R
n
, un
qualcosa di analogo alla gura dello spazio ordinario costituita da un numero
nito di superci e/o curve e/o punti isolati. Tale insieme viene detto variet`a
algebrica ane dellideale I = (f
1
, . . . , f
m
) di R[x
1
, . . . , x
n
] generato dai
polinomi f
1
(x
1
, . . . , x
n
), . . . , f
m
(x
1
, . . . , x
n
) e viene solitamente indicato con
1(I) R
n
.
Nonostante la dicolt`a del caso generale, in alcuni casi particolari `e
tuttavia possibile pervenire ad una soluzione in modo non troppo compli-
cato. Ad esempio quando il sistema `e composto da unequazione di grado
p 2 e da una o pi` u equazioni lineari (questo `e sicuramente il caso quando
il grado del sistema `e un numero primo p). La parte lineare del sistema
potr`a ammettere una, nessuna o innite soluzioni tra le quali occorre iso-
lare quelle eventuali che soddisfano anche allequazione non lineare. In altri
termini: a meno che gi`a solo le equazioni lineari non siano incompatibili,
queste consentono di esprimere alcune delle (eventualmente tutte le) varia-
bili ad esempio, x
1
, . . . , x
r
, r n in funzione delle rimanenti. So-
stituendo le espressioni (lineari) x
j
= x
j
(x
r+1
, . . . , x
n
), j = 1, . . . , r cos`
ottenute nellequazione di grado p si ottiene unequazione di grado minore o
uguale a p nelle variabili x
r+1
, . . . , x
n
che nello spazio ane n dimensionale
R
n
rappresenta una ipersupercie la cui intersezione con (tutti insieme) gli
iperpiani x
j
= x
j
(x
r+1
, . . . , x
n
), j = 1, . . . , r costituisce la variet`a cercata.
Vediamo alcuni semplicissimi esempi di situazioni di questo tipo, invi-
tando nel contempo lo studente a inventarne altri per suo conto ed a studiarli.
(A) Consideriamo il sistema
(A1)
_
_
_
x
2
+y
2
+z
2
1 = 0
x +y z = 0
Per risolverlo ricaviamo z dalla seconda equazione
(A2) z = x +y
(20)
Ma analoghe considerazioni varrebbero nel caso in cui i coecienti e le soluzioni
appartenessero ad un arbitrario campo K; conta per`o il fatto che K sia o meno
algebricamente chiuso.
126
e sostituiamola nella prima
(A3) x
2
+y
2
+ (x +y)
2
1 = 2(x
2
+y
2
+xy 1/2) = 0 .
Questultima ammette inniti zeri (, ) in corrispondenza a ciascuno dei
quali il sistema (A1) ammette una soluzione, (, , +).
Sicuramente quanto precede viene chiarito dallinterpretazione geome-
trica. Le due equazioni in (A1) rappresentano, nello spazio ordinario riferito
ad un sistema Oxyz di assi cartersiani ortogonali, la sfera di raggio unitario
con centro nellorigine O e, rispettivamente, un piano per lorigine, diciamoli
e . Le soluzioni di (A1) sono quindi interpretabili come le coordinate dei
punti della circonferenza intersezione della sfera col piano . Lequazione
(A3) rappresenta invece (i) se interpretata nel piano Oxy, la circonferenza
ottenuta proiettando ortogonalmente su tale piano, mentre (ii) se in-
terpretata nello spazio ordinario Oxyz, il cilindro C avente per direttrice
e generatrici parallele allasse z; va da se che C interseca e/o lungo la
circonferenza .
(B) Consideriamo il sistema
(B1)
_
_
x
2
+y
2
+z
2
1 = 0
x y +z + 1 = 0
x + 2y z = 0
La prima equazione rappresenta ancora la sfera gi`a considerata pi` u sopra,
mentre le altre due rappresentano due piani (diciamoli
1
e
2
) se prese
separatamente o, se considerate insieme, la setta r intersezione di
1
e
2
.
`
E
facile vedere che queste due equazioni lineari consentono di esprimere y e z
in funzione di x:
(B2)
y = 2x 1
z = 3x 2
(equazioni parametriche della retta r, quando si assuma la x come parametro).
Sostituendo nella prima si ottiene lequazione
(B3) 7x
2
+ 8x + 2 = 0
le cui radici sono
4
2
7
. Il sistema (B1) ammette quindi i due zeri
(B4)
x =
4
2
7
,
y = 2
4
2
7
1 =
12
2
7
,
z = 3
4
2
7
2 =
23
2
7
127
che possiamo interpretare come le coordinate dei due punti dintersezione di
r con .
Un altro caso che si sa risolvere `e quello costituito da due equazioni
algebriche di grado qualunque in due variabili
(10.24)
_
_
_
f(x, y) = 0
g(x, y) = 0
In questo caso viene in soccorso la nozione di risultante. Possiamo infatti
riguardare i due polinomi f(x, y) e g(x, y) come polinomi nella sola variabile
x aventi per coecienti dei polinomi nella variabile y:
(10.25)
f(x, y) =
r
(y)x
r
+
r1
(y)x
r+1
+ +
0
(y) =
(y)
(x),
g(x, y) =
r
(y)x
s
+
s1
(y)x
s+1
+ +
0
(y) =
(y)
(x);
lannullarsi del risultante (y) :=Res(
(y)
(x),
(y)
(x)) `e condizione neces-
saria e suciente anche i due polinomi
(y)
(x) e
(y)
(x) ammettano una
radice comune. Indicate pertanto con y
1
, . . . , y
1
2
. . .
n
_
che, per quanto ridondante, pu`o essere pi` u comoda della (11.1).
Linsieme di tutte le permutazioni su n oggetti viene usualmente indicato
con S
n
. Quanti sono i suoi elementi? (Si noti che si tratta della domanda b)
con cui si `e aperto questo capitolo.) Non `e dicile convincersi che la risposta
`e data dal prodotto n! (leggi: n fattoriale, o anche fattoriale
(1)
di n) dei
primi n numeri interi positivi:
n! := 1 2 n .
In eetti possiamo scegliere in n modi diversi lelemento
1
che corrisponde
a 1, e poi, per ognuna di queste n possibili scelte, possiamo scegliere in n1
modi diversi lelemento
2
che corrisponde a 2; ci`o comporta che possiamo
scegliere in n(n 1) modi diversi la coppia ordinata
1
,
2
degli elementi
corrispondenti a 1 e 2 rispettivamente. A questo punto lelemento
3
pu`o
essere scelto in n 2 modi diversi e quindi . . . e cos` via
(2)
.
Non `e dicile vericare (si riveda il 1.5) che linsieme S
n
`e dotato della
struttura di gruppo dalla composizione funzionale : : i ((i)) =
(
i
) =
i
. Poiche sappiamo dal primo capitolo che la composizione fun-
zionale non `e commutativa, si tratta di un gruppo non abeliano. In luogo di
(1)
La funzione fattoriale ammette anche unelegante denizione ricorsiva:
0! := 1, n! := (n 1)! n .
(2)
Una dimostrazione che si conclude con un e cos` via per quanto convincente
e, almeno in questo caso, sostanzialmente corretta tuttavia non `e mai particolar-
mente elegante; invitiamo pertanto il lettore a tradurre il ragionamento precedente
in una pi` u formale dimostrazione per induzione.
130
preferiremo la notazione , o anche
(3)
. Lelemento neutro
`e dato dalla permutazione identica
1 =
_
1 2 . . . n
1 2 . . . n
_
,
mentre la permutazione inversa della (3) `e la
(11.4)
_
1
2
. . .
n
1 2 . . . n
_
.
Si noti che la notazione qui utilizzata, pur dierendo leggermente da quella
introdotta in (11.3), contiene tuttavia tutta linformazione necessaria per
individuare in modo univoco la permutazione considerata: ci`o che bisogna
conoscere `e la corrispondenza
i
i e questa viene data dalle colonne
_
i
i
_
indipendentemente dallordine in cui vengono disposte. Cos` ad esempio la
permutazione di S
5
_
1 2 3 4 5
3 2 5 1 4
_
pu`o essere anche rappresentata da
_
4 1 2 5 3
1 3 2 4 5
_
In matematica e nelle sue applicazioni limportanza del gruppo simmetri-
co S
n
`e enorme, giacche interviene in modo signicativo in una gran variet`a
di questioni. Da un punto di vista teorico questo fatto `e ben espresso da un
famoso teorema di Cayley che aerma che tutti i gruppi niti si riducono ad
essere (a meno di isomorsmi) i gruppi simmetrici S
n
(al variare di n) ed i
loro sottogruppi
(4)
. Rimandando ai corsi successivi sia la dimostrazione (per-
altro assai semplice) di questo teorema come pure uno studio approfondito
del gruppo simmetrico S
n
, ci limitiamo qui a evidenziarne alcune propriet`a
elementari.
Iniziamo con losservare che, cos` come per gli interi e per i polinomi,
anche per le permutazioni
(5)
vale un teorema di decomposizione unica in
(3)
Occorre avvisare il lettore che alcuni autori denotano con il nostro .
(4)
Sotto laspetto pratico, questo risultato purtroppo promette pi` u di quanto poi non
mantenga: il fatto `e che lo studio della struttura di S
n
e dei suoi sottogruppi `e di
una complessit`a proibitiva anche per (relativamente) piccoli valori di n.
(5)
Questa aermazione `e, tuttavia, un po forzata e rischia pertanto di essere fuorviante;
non `e quindi opportuno dare alla Prop. 11.1 risalto pari a quello di altri teoremi simi-
li (Teorema fondamentale dellaritmetica e Teorema fondamentale dellAlgebra). In
eetti, contrariamente al caso degli interi e a quello dei polinomi, i fattori irriducibili
di cui qui parliamo (cicli) non lo sono nel senso dellindecomponibilit`a nel prodotto
di altri cicli qualunque ma solo nel senso che un ciclo non si pu`o rappresentare come
prodotto di altri cicli disgiunti.
131
fattori irriducibili. In questo caso i fattori irriducibili vengono detti cicli.
Un ciclo di lunghezza r n `e una permutazione di S
n
che trasforma i
1
in
i
2
, i
2
in i
3
, . . ., i
r2
in i
r1
, i
r1
in i
r
, i
r
in i
1
(r n, h ,= k i
h
,= i
k
)
e che lascia invariato ogni elemento j 1, . . . , n diverso dagli elementi
i
1
, i
2
, . . . , i
r
; viene rappresentato con la notazione
(i
1
, i
2
, i
3
, . . . , i
r2
, i
r1
, i
r
) (r n);
il contesto ci impedir`a di confondere questultima con la (11.1). Due cicli
(i
1
, i
2
, . . . , i
r
) e (j
1
, j
2
, . . . , j
s
) vengono detti disgiunti se i
h
,= j
k
comunque
si prendano h 1, . . . , r e k 1, . . . , s. Va osservato che, come subito si
verica, un prodotto di cicli disgiunti `e commutativo. Ci`o premesso possiamo
enunciare la proposizione seguente.
Prop. 11.1 (Teorema di decomposizione unica in cicli disgiunti):
Una permutazione S
n
si pu`o decomporre in modo essenzialmente unico
come prodotto di cicli disgiunti:
= (i
1
, i
2
, . . . , i
r
)(j
1
, j
2
, . . . , j
s
) (h
1
, h
2
, . . . , h
p
)
con r + s + + p n . Qui lavverbio essenzialmente va inteso nel
senso che nella decomposizione precedente si prescinde dallordine dei fattori
nonche dallaver trascurato o meno eventuali cicli di lunghezza 1
(6)
.
Dimostrazione: Viene lasciata per esercizio al lettore. [Suggerimento: si
proceda per induzione su n.]
Merita attenzione anche una diversa decomposizione delle permutazioni,
quella i cui fattori sono trasposizioni. Con questo termine vendono denotati
i cicli di lunghezza 2, cio`e della forma (i, j). Si noti che le trasposizioni sono
involutorie, cio`e che (i, j)
2
= 1, ovvero (i, j)
1
= (i, j). Osserviamo pure che
la permutazione := (i, j) ottenuta moltiplicando per la trasposizione
(i, j) dierisce da esclusivamente per il fatto che nella seconda riga gli
elementi
i
e
j
sono stati scambiati. Ci`o premesso proviamo che:
Prop. 11.2: Si pu`o ottenere la permutazione identica moltiplicando unarbi-
traria permutazione per opportune trasposizioni.
Dimostrazione: Per induzione su n. Se n = 1 allora `e essa stessa la
permutazione identica e non vi `e quindi niente da dimostrare. Supponiamo
quindi n > 1. Sia j il pi` u grande tra gli indici 1, . . . , n tali che j >
j
, per
cui
=
_
1 . . . i . . . j 1 j j + 1 . . . n
1
. . .
i
= j . . .
j1
j
j + 1 . . . n
_
.
(6)
Che poi non sono altro che la permutazione identica.
132
Si ha
(i, j) =
=
_
1 . . . i . . . j 1 j j + 1 . . . n
1
. . .
i
= j . . .
j1
j
j + 1 . . . n
_
(i, j) =
=
_
1 . . . i . . . j 1 j j + 1 . . . n
1
. . .
j
. . .
j1
i
= j j + 1 . . . n
_
= .
Per lipotesi induttiva la permutazione
:=
_
1 . . . i . . . j 1
1
. . .
j
. . .
j1
_
S
j1
viene trasformata nella permutazione identica moltiplicandola per opportune
trasposizioni:
1 =
(i
1
, j
1
) (i
r
, j
r
)
Passando da S
j1
a S
n
si ha pure
1 = (i
1
, j
1
) (i
r
, j
r
)
Ne consegue
(i, j)(i
1
, j
1
) (i
r
, j
r
) = (i
1
, j
1
) (i
r
, j
r
) = 1
che `e quanto volevasi dimostrare.
In virt` u del fatto che le trasposizioni sono involutorie, dalla proposizione
precedente consegue direttamente il seguente
Corollario 11.3: Una permutazione non identica S
n
pu`o essere rap-
presentata come prodotto di trasposizioni. Pi` u precisamente, con le notazioni
della dimostrazione della proposizione precedente si ha
(11.5) = (i
r
, j
r
) (i
1
, j
1
)(i, j) .
I risultati precedenti possono essere anati. A tale scopo occorre in-
trodurre alcuni nuovi concetti. Chiamiamo inversione di = (
1
, . . . ,
n
)
ogni coppia
i
,
j
con i < j e
i
>
j
; il numero delle inversioni di verr`a
denotato con i(). Poniamo inoltre
() := (1)
i()
=
1i<jn
j
i
j i
133
Si dir`a che `e di classe pari o, rispettivamente, di classe dispari (o, pi` u
semplicemente, permutazione pari e permutazione dispari) a seconda
che abbia un numero pari o dispari di inversioni, cio`e a seconda che ()
valga 1 o 1.
`
E facile provare che in S
n
vi sono esattamente
n!
2
permutazioni
pari e altrettante permutazioni dispari. Non `e neppure dicile convincersi
che () = ()() e che di conseguenza linsieme A
n
S
n
di tutte le
n!
2
permutazioni pari (ma non quello delle permutazioni dispari) forma un
sottogruppo di S
n
, che viene detto gruppo alterno.
Il simbolo () viene detto carattere o segnatura della permutazione
. Accanto ad esso talvolta si usa pue il simbolo
j
1
,...,j
n
:=
_
_
_
1 se (j
1
, . . . , j
n
) `e una permutazione pari di (1, . . . , n)
1 se (j
1
, . . . , j
n
) `e una permutazione dispari di (1, . . . , n)
0 se (j
1
, . . . , j
n
) non `e una permutazione di (1, . . . , n)
.
Entrambi intervengono talvolta in matematica, ad esempio nella denizione
di determinante di una matrice quadrata dordine n, A = (a
i
j
):
det A :=
S
n
() a
1
1
a
n
n
=
n
j
1
,...,j
n
=1
j
1
,...,j
n
a
1
j
1
a
n
j
n
Unaltra nozione di cui dobbiamo far uso `e quella di trasposizione
elementare: si tratta di una trasposizione di elementi contigui, cio`e di un
2-ciclo della forma (i, i + 1); notiamo che la segnatura di una trasposizione
elementare vale 1:
(11.6)
_
(i, i + 1)
_
= 1
e quindi che si ha
(11.7) ( (i, i + 1)) = ()
La stessa propriet`a vale anche nel caso di una trasposizione (i, j) qualunque
(11.8)
_
(i, j)
_
= 1,
_
(i, j)
_
= ()
Si tratta di una conseguenza diretta della seguente proposizione:
Prop. 11.3: Ogni trasposizione presenta un numero dispari di inversioni
e quindi () = 1.
Dimostrazione: Sia
= (i, j) =
_
1 . . . i i + 1 . . . j 1 j j + 1 . . . n
1 . . . j i + 1 . . . j 1 i j + 1 . . . n
_
134
la trasposizione considerata. Essa presenta 2(j i) 1 inversioni, e precisa-
mente quelle (in numero di ji) dovute al fatto che i segue j, i+1, . . . , j1 =
i + (j i 1), vale a dire le inversioni
j 1 = i + (j i 1), i; j 2 = i + (j i 2), i; . . . ; i + 1, i;
pi` u quelle (in numero di j i 1 dovute al fatto che j precede i + 1, i +
2, . . . , j 1 = i + (j i 1), vale a dire le inversioni
j, i + 1; j, i + 2; . . . ; j, j 1 = i + (j i 1).
Avendo presente la denizione data di det(A) dalla (11,8) consegue di-
rettamente la propriet`a secondo cui se si invertono due righe o colonne ddella
matrice A il determinante det(A) cambia di segno discende; infatti quellope-
razione comporta uninversione di parit`a nella permutazione variabile da
cui dipende il valore del coeciente ().
Prop. 11.4: Ogni trasposizione pu`o essere rappresentata mediante un prodotto
di trasposizioni elementari. Tale rappresentazione non `e unica, ma ciascuna
di esse `e comunque sempre costituita da un numero dispari di fattori.
Dimostrazione: Conserviamo le notazioni della proposizione precedente.
Ciascuna di quelle inversioni pu`o essere eliminata moltiplicando successiva-
mente la trasposizione mediante una opportuna trasposizione elementare:
_
j 1, j
__
j 2, j 1
_
_
i = j (j i), i + 1
_
_
i + 1, i + 2
__
i + 2, i + 3
_
_
j 1 = i + (j i 1), j
_
= 1
Pertanto `e data dal seguente prodotto di 2(ji)1 trasposizioni elementari:
=
_
_
j 1, j
__
j 2, j 1
_
_
i = j (j i), i + 1
_
_
i + 1, i + 2
__
i + 2, i + 3
_
_
j 1 = i + (j i 1), j
_
_
1
=
=
_
j 1 = i + (j i 1), j
__
j 1, j 2
_
. . .
_
i + 2, i + 3
__
i + 1, i + 2
_
_
i, i + 1
_
(i + 1, i + 2) . . .
_
j 2, j 1
__
j 1 = i + (j i 1), j
_
Va sottolineato che la decomposizione di ottenuta non `e necessaria-
mente lunica possibile come prodotto di trasposizioni elementari. Qualche
semplice esempio convincer`a facilmente il lettore che ve ne sono sicuramente
altre, come pure che due diverse decomposizioni possono dierire non solo
per le trasposizioni elementari che intervengono ma anche per il numero delle
135
stesse. Questultima dierenza `e per`o sicuramente un numero pari. Per con-
vincersi di questo fatto, con riferimento ad una data decomposizione come
prodotto di trasposizioni elementari, =
1
s
, occorre riguardare la
data permutazione = 1
1
s
come ottenuta a partire dalla permu-
tazione identica mediante successive moltiplicazioni per
1
,
2
, . . . ,
s
e
ricordare che ciascuno di questi prodotti non fa altro che scambiare tra loro,
volta per volta, due elementi contigui della seconda riga; pertanto se nella
seconda riga del risultato nale un elemento h > k precede k (al contrario
di quanto avviene nella permutazione identica) vi sar`a necessariamente una
delle trasposizioni
i
che provveder`a ad operare tale scambio; se invece suc-
cede che h < k precede k (esattamente come nella permutazione identica) e
per caso una delle trasposizioni
i
utilizzate ha portato k > h a precedere
h, occorrer`a che unaltra trasposizione
j
riporti gli elementi h e k alla loro
mutua posizione iniziale corretta. Pertanto eventuali trasposizioni elemen-
tari inutili si presentano sempre a coppie. Ci`o prova che il numero delle
trasposizioni elementari che compaiono in una decomposizione di una data
trasposizione (equivalentemente: il numero delle trasposizioni elementari
per cui occorre moltiplicare per ricondurla alla permutazione identica), pur
variando, `e sempre pari o sempre dispari.
In conseguenza delle due proposizioni precedenti possiamo aermare che
una data permutazione `e pari o dispari a seconda che sia pari o dispari il
numero dei fattori che compaiono in una qualunque rappresentazione di
come prodotto di trasposizioni (non necessariamente elementari).
11.3 Numeri di Bell e numeri di Stirling
In quanti modi diversi si possono chiamare i cugini? Una mia amica
antropologa per celia ma non era celia sciocca amava dire che le sue
ricerche vertevano sui diversi modi in cui si possono chiamare i cugini. Es-
sendosi posta il problema di determinare quanti fossero quelli teoricamente
possibili e non essendo sicura della completezza della lista che aveva pazien-
temente prodotto, mi chiese di sfruttare le mie competenze matematiche per
ottenere una risposta certa.
`
E quella che troverete qui di seguito. Prelimi-
narmente occorre per`o precisare il problema.
Lantropologia culturale studia le relazioni di varia natura che legano
tra loro gli individui (e i gruppi di individui) allinterno di una determinata
societ`a, storicamente data. Non `e necessario aver letto LeviStrauss
(7)
per
(7)
Claude Levi-Strauss (Bruxelles, 1908), antropologo francese che ha applicato il metodo
di indagine strutturalista agli studi antropologici. La sua opera principale, Les Struc-
tures elementaires de la parente, 1949, `e una sorta di bibbia per molti antropologi
culturali contemporanei.
136
capire che, tra queste relazioni, un posto privilegiato `e sicuramente occupato
da quelle gestite dalle regole matrimoniali vigenti nella societ`a considerata
e che i rapporti di parentela giocano un ruolo primario nel determinare tali
regole. Spesso tali rapporti riguardano solo i fratelli e i cugini primi. Si
tratta delle seguenti cinque classi distinte, che per comodit`a indicheremo con
i numeri da 1 a 5:
[1] fratelli;
[2] gli del fratello del padre;
[3] gli della sorella del padre;
[4] gli del fratello della madre;
[5] gli della sorella della madre.
In situazioni di questo tipo la natura delle regole di matrimonio comporta
lidenticazione di alcune di queste classi, identicazione che ovviamente si
traduce nellattribuire loro un nome comune
(7)
. Va da se che i nomi utilizzati
sono almeno uno ed al pi` u cinque. Ci proponiamo qui di determinare:
a) il numero N di tutte le possibili attribuzioni di nome alle cinque classi
suddette;
b) il numero N
k
di quelle facenti uso di esattamente k nomi diversi (per
k = 1, 2, 3, 4, 5). Naturalmente si ha N = N
1
+. . . +N
5
.
Inne daremo una lista completa di tutte le possibilit`a, solo alcune delle
quali, presumibilmente, risultano eettivamente realizzate in natura.
Determiniamo dapprima N.
`
E facile convincersi che esso `e il numero
delle partizioni di un insieme con cinque elementi, e cio`e 52 . Ricordiamo
che si dice partizione T
1
, . . . , T
t
di un insieme T una decomposizione di
T in sottoinsiemi T
1
, . . . , T
t
non vuoti e a due a due disgiunti (cio`e, T
i
,=
e T
i
T
j
= ) tale che T coincida con la loro unione (cio`e, T =
t
i=1
T
i
).
Se T `e un insieme nito contenente n elementi allora il numero di tutte le
partizioni di T `e noto come numero di Bell B(n). Si ha B(0) = 1, B(1) = 1,
B(2) = 2, B(3) = 5, B(4) = 15, B(5) = 52, B(6) = 203, B(7) = 877, . . . . La
successione dei numeri di Bell pu`o essere costruita ricorsivamente mediante
la relazione
(8)
B(n + 1) =
n
i=0
_
n
i
_
B(i)
(7)
Ad esempio, nella nostra societ`a distinguiamo solo tra fratelli e cugini, in accordo col
fatto che non `e consentito il matrimonio tra due individui della prima classe mentre
non lo si vieta negli altri casi.
(8)
Ricordiamo che il coeciente binomiale
_
n
i
_
:= n!/i!(n i)! conta il numero dei
modi in cui un insieme con n elementi pu`o essere spezzato in due sottoinsiemi aventi
i ed n i elementi rispettivamente.
137
come pure facendo uso della funzione generatrice
e
(e
x
1)
=
n0
B(n)x
n
/n! .
Passiamo ora a determinare il valore di N
k
. Il nostro problema equivale
a quello di contare il numero dei modi in cui 5 palle diverse (si tratta nel
nostro caso delle cinque classi [1], . . . , [5]) possono essere messe in k scatole
tra loro indistinguibili (queste sono per noi i k nomi che si vogliono adottare)
in modo tale che ogni scatola contenga almeno una palla. Si pu`o vedere il
problema anche come quello di determinare il numero delle partizioni con k
parti di un insieme con 5 elementi. Nel caso pi` u generale di un insieme con n
elementi tale numero, denotato con S(n, k), viene detto numero di Stirling
di seconda specie. I numeri di Stirling di seconda specie soddisfano alla
relazione di ricorrenza
S(n, k) = kS(n 1, k) +S(n 1, k 1)
che, insieme con le condizioni iniziali
S(0, 0) = 1 , S(n, 0) = S(0, k) = 0 (n, k ,= 0),
pu`o essere usata per costruirne la tabella seguente, nella quale le righe indi-
cano la cardinalit`a dellinsieme considerato e le colonne il numero delle parti
della partizione:
1 0 0 0 0 0 0 0 0 0 0 0
0 1 0 0 0 0 0 0 0 0 0 0
0 1 1 0 0 0 0 0 0 0 0 0
0 1 3 1 0 0 0 0 0 0 0 0
0 1 7 6 1 0 0 0 0 0 0 0
0 1 15 25 10 1 0 0 0 0 0 0
0 1 31 90 65 15 1 0 0 0 0 0
0 1 63 301 350 140 21 1 0 0 0 0
0 1 127 966 1701 1050 266 28 1 0 0 0
. . . . . . . . . . . .
. . . . . . . . . . . .
Nel nostro caso interessa la quinta riga: vi sono S(5, 1) = 1 modi di chiamare
i cugini con un unico nome, S(5, 2) = 15 modi di chiamarli con due nomi,
S(5, 3) = 25 modi di chiamarli con tre nomi, S(5, 4) = 10 modi di chiamarli
con quattro nomi ed inne S(5, 1) = 1 modi di chiamarli con cinque nomi.
Ovviamente: 52 = 1+15+25+10+1, in accordo con la pi` u generale formula
B(n) =
n
k=1
S(n, k).
138
Cap. 12
Serie formali
12.1 La nozione di serie formale
Prendiamo le mosse dalla cosiddetta serie geometrica
(12.1)
1
1 x
= 1 +x +x
2
+x
3
+x
4
+
che probabilmente molti lettori gi`a conoscono. Comunque sia, chiediamoci
che cosa signica quelluguaglianza. E, prima ancora, che cosa sono i termini
che la (1) aerma essere uguali.
Per il termine di sinistra sembra non esservi alcuna ambiguit`a: lespres-
sione
1
1x
indica la funzione che ad ogni x ,= 1 associa linverso di 1 x ,= 0.
(Vedremo poi per`o che a noi converr`a darne uninterpretazione completa-
mente diversa.)
Non `e altrettanto scontata linterpretazione del termine a destra 1+x+
x
2
+ x
3
+ x
4
+ Accettando di poter attribuire a x un ben determinato,
per quanto arbitrario, valore reale, che senso ha quella somma di inniti
termini? E ammesso che abbia un senso, si deve attribuire a quella somma
un numero reale? e come calcolarlo? Ad esempio, se in (1) si pone x = 0
allora ovviamente 1 + 0 + 0 + = 1, che `e proprio il valore
1
10
. Se invece
poniamo x = n, con 1 n N, `e chiaro che la somma di quegli inniti
termini va allinnito; ma non `e un numero reale! E pur ammesso di voler
ampliare R con , questo non vale certo
1
1n
, che `e un numero razionale
compreso tra 1 e 0. Tutto ci`o ci fa capire che bisogna procedere con cautela.
In eetti, se si attribuisce a x un qualunque valore reale maggiore di 1
e minore di 1, cio`e [x[ < 1, allora `e possibile attribuire alla serie 1 +x+x
2
+
x
3
+ x
4
+ un ben determinato valore reale e tale valore risulta uguale a
quello assunto dalla funzione
1
1x
.
La cosa si realizza procedendo nel modo seguente. Per ogni m N,
poniamo
R
m
(x) := 1 +x +x
2
+x
3
+ +x
m
Si dimostra che il limite
R(x) := lim
m
R
m
(x)
139
esiste ed `e nito per ogni x per cui [x[ < 1 e, come abbiamo detto, vale
proprio
1
1x
.
Questo fatto si esprime solitamente dicendo che la serie 1 + x + x
2
+
x
3
+ x
4
+ converge a
1
1x
per ogni x per cui [x[ < 1 o anche dicendo
lo sviluppo in serie di potenze della funzione
1
1x
, valido per [x[ < 1, `e
1 +x +x
2
+x
3
+x
4
+ , e si scrive
(12.1
)
1
1 x
= 1 +x +x
2
+x
3
+x
4
+ ([x[ < 1)
Tutto ci`o `e sicuramente molto interessante e, nei primi corsi universitari
di Analisi matematica, lo studente avr`a modo di riprendere largomento e
di approfondirlo come merita. A noi qui basta averne accennato per sottoli-
neare che ben consapevoli della possibilit`a di quellapproccio, che in tanti
contesti `e sicuramente da preferire tuttavia esso non `e il solo possibile e
che in altri contesti `e invece preferibile un approccio pi` u formale al concetto
di serie di potenze.
Senza indugiare oltre diciamo che una serie formale `e unespressione
della forma
(12.2) f(x) = f
0
+f
1
x +f
2
x
2
+f
3
x
3
+ +f
n
x
n
+ =
n=0
f
n
x
n
in cui i coecienti f
n
appartengono ad un ssato campo, ad esempio quello
reale R. Va chiarito che, in questo contesto, (i) la notazione f(x) che com-
pare in (12.2) non deve indurre a pensare che si tratti di una funzione; essa
`e solo un nome che usiamo per indicare concisamente lespressione a secondo
membro
(1)
; (ii) la notazione x
n
non va interpretata come la potenza n-esima
di x, ma piuttosto come un segnaposto; (iii) similmente, il simbolo di
somma + non rappresenta lusuale somma di numeri reali ma serve unica-
mente per separare un termine dallaltro, non diversamente dalluso che, in
altre situazioni, si fa della virgola. Per dirla in altri termini, bisogna aver
chiaro che lespressione
f
0
+f
1
x +f
2
x
2
+f
3
x
3
+ +f
n
x
n
+ ,
se intesa come serie formale formale, non rappresenta nientaltro che se stessa.
Stanti cos` le cose, il lettore potrebbe essere indotto a pensare che le serie
formali siano molto poco interessanti dal punto di vista matematico e che
addirittura la loro stessa collocazione naturale vada ricercata in ambiti diversi
(1)
In questo contesto labuso notazionale non si arresta qui. Ad esempio, il termine
noto f
0
della serie f(x) = f
0
+f
1
x +f
2
x
2
+ + pu`o essere indicato con f(0).
140
dalla matematica, ad esempio nella graca. Lo preghiamo di pazientare
ancora un poco, e sicuramente si convincer`a dellutilit`a di questo approccio
e del grande interesse matematico di quegli oggetti.
Linsieme di tutte le serie formali a coecienti nel campo reale R si
indica con R[[x]]. Notiamo che in virt` u delle osservazioni contenute nel
terzo capoverso del 10.1 linsieme R[x] dei polinomi a coecienti reali
nellindeterminata x `e un sottoinsieme di R[[x]]. Osserviamo anche che vale
la bigezione
(12.3)
R[[x]]
R
N
f
0
+f
1
x +f
2
x
2
+ (f
0
, f
1
, f
2
, . . .)
che estende alle serie formali la (10.2).
Anche la struttura di anello viene estesa in modo naturale da R[x] a
R[[x]]. Laddizione e la moltiplicazione di serie formali sono denite esatta-
mente allo stesso modo che per i polinomi:
(12.4)
+ : K[[x]] K[[x]] K[[x]]
_
i=0
a
i
x
i
,
j=0
b
j
x
j
_
h=0
(a
h
+b
h
)x
h
;
(12.5)
: K[[x]] K[[x]] K[[x]]
_
i=0
a
i
x
i
,
j=0
b
j
x
j
_
h=0
_
h
j=0
a
j
b
hj
_
x
h
;
Possiamo perci`o aermare che lanello K[[x]] `e un sovranello di K[x]. Si
badi per`o che ci`o non comporta aatto che ogni aermazione (espressa nel
linguaggio della teoria degli anelli) che sia valida in K[x] valga anche in K[[x]].
Ad esempio laermazione secondo cui i polinomi invertibili sono tutti e soli
quelli di grado zero (cio`e le costanti non nulle), che `e certamente vera in
K[x], non lo `e pi` u in K[[x]]. Vale infatti la seguente
Prop. 12.1: Nellanello K[[x]] delle serie formali, le serie (e quindi anche,
in particolare, i polinomi) invertibili sono tutte e sole quelle il cui termine
noto `e diverso da zero.
Dimostrazione: Sia data la serie formale f(x) = f
0
+ f
1
x + f
2
x
2
+ ,
con f(0) = f
0
,= 0; vogliamo provare che esiste una serie formale g(x) =
g
0
+g
1
x +g
2
x
2
+ tale che f(x) g(x) = 1. Poiche si ha
f(x) g(x) = (f
0
+f
1
x +f
2
x
2
+ )(g
0
+g
1
x +g
2
x
2
+ ) =
(f
0
g
0
)+(f
0
g
1
+f
1
g
0
)x+(f
0
g
2
+f
1
g
1
+f
2
g
0
)x
2
+(f
0
g
3
+f
1
g
2
+f
2
g
1
+f
3
g
0
)x
3
+
+ (f
0
g
n
+f
1
g
n1
+f
2
g
n2
+ +f
0
g
n
)x
n
+
141
lequazione f(x) g(x) = 1 si traduce nel sistema di innite equazioni lineari
nelle incognite g
i
_
_
f
0
g
0
= 1
f
0
g
1
+ f
1
g
0
= 0
f
0
g
2
+ f
1
g
1
+ f
2
g
0
= 0
f
0
g
3
+ f
1
g
2
+ f
2
g
1
+ f
3
g
0
= 0
f
0
g
n
+ f
1
g
n1
+ f
2
g
n2
+ + f
0
g
n
= 0
di cui `e facile calcolare la soluzione
g
0
=
1
f
0
, g
1
=
f
1
f
2
0
, g
2
=
f
2
1
f
2
f
0
f
3
0
, . . .
Se in particolare f(x) = 1 x, allora la sua inversa f
1
=
1
1x
`e la serie
formale
1
1x
= 1 +x +x
2
+x
3
+x
4
+ , ci`o che chiarisce linterpretazione
della (12.1) nel contesto delle serie formali.
12.2 Funzioni generatrici
Vogliamo dedicare questo paragrafo ad illustrare una delle situazioni in
cui `e vantaggioso far uso del concetto di serie formale.
Prendiamo le mosse dalla formula
(12.6) (x + 1)
n
=
_
n
0
_
+
_
n
1
_
x +
_
n
2
_
x
2
+
_
n
3
_
x
3
+ +
_
n
n
_
x
n
che `e un caso particolare del ben noto Teorema binomiale
(12.7) (x +y)
n
=
_
n
0
_
x
0
y
n
+
_
n
1
_
x
1
y
n1
+
_
n
2
_
x
2
y
n2
+ +
_
n
n
_
x
n
y
0
Il secondo membro in (12.6) pu`o essere riguardato in modo formale, vale a
dire come uno dei modi mediante cui si pu`o descrivere la lista di coecienti
binomiali
_
n
0
_
,
_
n
1
_
,
_
n
2
_
,
_
n
3
_
, . . . ,
_
n
n
_
.
142
cio`e la n-esima riga del Triangolo di Tartaglia. Si dice allora che il primo
membro (x + 1)
n
`e la funzione generatrice di quella lista di coecienti
binomiali.
Pi` u in generale, quando, in luogo di una lista nita, si voglia descrivere
una sequenza innita
f
0
, f
1
, f
2
, f
3
, . . . , f
n
, . . . ,
che ovviamente possiamo anche rappresentare mediante la serie formale
f
0
+f
1
x +f
2
x
2
+f
3
x
3
+ +f
n
x
n
+ =
n=0
f
n
x
n
,
si dir`a funzione generatrice di quella sequenza una opportuna espressione
f(x)
(2)
per la quale si possa formalmente giusticare luguaglianza
f(x) = f
0
+f
1
x +f
2
x
2
+f
3
x
3
+ +f
n
x
n
+ =
n=0
f
n
x
n
.
Cos`, ad esempio, possiamo interpretare la (12.1) dicendo che
1
1x
`e la fun-
zione generatrice della sequenza
1, 1, 1, . . .
In questo caso, come abbiamo visto, la giusticazione formale delluguaglianza
in (12.1) consiste nella constatazione che la serie formale
1 +x +x
2
+x
3
+x
4
+
`e linversa moltiplicativa (con riferimento al prodotto denito formalmente
in (12.5)) di 1 x.
Ragionando allo stesso modo e facendo uso delluguaglianza
(12.8)
_
n
k
__
k + 1
0
_
_
n 1
k
__
k + 1
1
_
+
_
n 2
k
__
k + 1
2
_
+ (1)
k+1
_
n k 1
k
__
k + 1
k + 1
_
= 0
(valida per ogni n k + 1), pi` u in generale si prova che, per ogni numero
naturale k,
x
k
(1x)
k+1
`e la funzione generatrice della sequenza dei coecienti
binomiali che occupano la k-esima colonna (k 0) del Triangolo di Tartaglia:
(12.9)
x
k
(1 x)
k+1
=
n=0
_
n
k
_
x
n
(2)
Ribadiamo che non si deve pensare che f(x) sia da riguardare come funzione della x.
143
La giusticazione delle uguaglianze (12.1) e (12.9) ha richiesto poco pi` u
che la moltiplicazione (12.5). Vediamo anche un altro esempio. Ci serve
la nozione di partizione di un intero positivo n. Viene cos` chiamata una
qualunque rappresentazione di n come somma di interi positivi minori o
uguali a n. Ad esempio
4 = 3 + 1 = 2 + 2 = 2 + 1 + 1 = 1 + 1 + 1 + 1
sono le cinque possibili partizioni di 4. Lesempio che vogliamo considerare
ha a che fare col numero p(n) delle partizioni di n. Si tratta della bella
formula (dovuta a Eulero):
(12.10)
1
(1 x)(1 x
2
)(1 x
3
)
= 1 +
n1
p(n)x
n
,
che non `e dicile da dimostrare: in virt` u di (12.1), si ha
1
(1 x)(1 x
2
)(1 x
3
)
=
=
_
1+(x)+x
2
+
__
1+(x
2
)+(x
2
)
2
+
__
1+(x
3
)+(x
3
)
2
+
_
_
1 + (x
4
) + (x
4
)
2
+
_
=
= 1 1 1 + (x) 1 +
_
(x)
2
1 + 1 (x
2
) 1
_
+
+
_
(x)
3
1 + (x)(x
2
) 1 + 1 1 (x
3
)
_
+
+
_
(x)
4
1 +(x)
2
(x
2
)1 +(x)1(x
3
)1 +1(x
2
)
2
1 +111(x
4
)1
_
+ =
= 1+x
1
+(x
1+1
+x
2
)+(x
1+1+1
+x
1+2
+x
3
)+(x
1+1+1+1
+x
1+1+2
+x
1+3
+x
2+2
+x
4
)+ =
= 1 +x + 2x
2
+ 3x
3
+ 5x
4
+ = 1 +
n1
p(n)x
n
La notazione adottata in questo calcolo pu`o apparire pesante ma `e stata
scelta apposta perche mette bene in evidenza che ogni partizione di n con-
tribuisce per 1 al coeciente di x
n
.
144
12.3 Equazioni alle dierenze
Unintera classe di funzioni generatrici (che comprende anche gli esempi
(12.1) e (12.9)) `e costituita dalle funzioni razionali, cio`e quelle della forma
f(x) = q(x) +
r(x)
a(x)
con q(x), r(x) e a(x) in K[x] e deg(r) < deg(a). Sebbene quanto diremo
varr`a nel caso di un qualunque campo K algebricamente chiuso, per non
appesantire il discorso ci riferiremo al caso in cui K = C. Inoltre, per ragioni
che quanto segue render`a evidenti, possiamo:
(i) assumere, senza ledere la generalit`a, che il termine noto di a(x) sia uguale
a 1, per cui
a(x) = 1 a
k1
x a
k2
x
2
a
0
x
k
;
(ii) supporre (ci`o che non modicher`a in modo sostanziale il nostro discorso)
che il quoziente q(x) di f(x) nella divisione per a(x) sia nullo, e quindi che
si abbia
(12.11) f(x) =
r(x)
a(x)
=
r
0
+r
1
x + +r
h
x
h
1 a
k1
x a
k2
x
2
a
0
x
k
con h < k. Posto
(12.12) f(x) = f
0
+f
1
x +f
2
x
2
+
si ha
r
0
+r
1
x+ +r
h
x
h
=
_
1a
k1
xa
k2
x
2
a
0
x
k
__
f
0
+f
1
x+f
2
x
2
+
_
(qui, se h < k 1, si intende che r
h+1
= r
h+2
= . . . = r
k1
= 0) da cui,
sviluppando il secondo membro e confrontando col primo, si ottiene
(12.13)
_
_
f
0
= r
0
a
k1
f
0
+f
1
= r
1
a
k2
f
0
a
k1
f
1
+f
2
= r
2
a
1
f
0
a
2
f
1
a
k1
f
k2
+f
k1
= r
k1
e, per ogni n 0,
(12.14) f
n+k
a
k1
f
n+k1
a
k2
f
n+k2
a
0
f
n
= 0.
Il primo `e un sistema triangolare di k equazioni lineari nelle k incognite
f
0
, f
1
, . . . , f
k1
che quindi ammette una ed una sola soluzione che si calcola
145
facilmente. Questa fornisce i primi coecienti della serie (12.12). Per deter-
minare gli altri, e cio`e f
k
, f
k+1
, f
k+2
, . . . occorre studiare la relazione (12.14),
che viene detta relazione di ricorrenza. Nel 6 dellAppendice 2 si trover`a
il perche di questo secondo nome; invece, giustichiamo subito il primo. La
(12.14) si pu`o infatti scrivere nella forma
(12.14
) f
n+k
= a
k1
f
n+k1
+a
k2
f
n+k2
+ +a
0
f
n
(n 0) e pertanto, noti i primi k coecienti f
0
, f
1
, . . . , f
k1
, tutti gli altri
possono esser calcolati per ricorrenza tramite la (12.14
).
Si capisce tuttavia che questo non sempre `e comodo: se si vuole conoscere
il valore di un dato coeciente f
n
`e infatti necessario calcolare il valore di
tutti quelli che lo precedono. Possiamo tuttavia arontare il problema anche
in un altro modo. Per capire come, `e per`o necessario sviluppare un po pi` u
di teoria.
Una qualunque successione u = (u
n
) = (u
0
, u
1
, u
2
, . . . , u
n
, . . .) C
N
che, per ogni n 0, soddis alla relazione di ricorrenza
(12.15) u
n+k
= a
k1
u
n+k1
+a
k2
u
n+k2
+ +a
0
u
n
viene detta successione ricorrente lineare. Alla (12.15) possiamo asso-
ciare il polinomio
(12.16) g(x) = x
k
a(x
1
) = x
k
a
k1
x
k1
a
k2
x
k2
a
1
x a
0
che si chiama polinomio caratteristico o anche scala di ricorrenza della
successione ricorrente lineare u. Indicato con E loperatore (detto shift
operator)
E: C
N
C
N
(u
0
, u
1
, u
2
, . . .) (u
1
, u
2
, u
3
, . . .)
e posto
(12.17) g(E) = E
k
a
k1
E
k1
a
k2
E
k2
a
1
E a
0
la (12.15) si pu`o scrivere anche nella forma pi` u compatta
(12.15
); g(E)u = 0;
ancora, considerato loperatore dierenza
(12.18)
:= E I: C
N
C
N
(u
n
) (u
n+1
u
n
)
146
e posto p(x) := g(x + 1), le si pu`o dare anche la forma
(12.15
) p()u = 0
La (12.15
0
=
1
= . . . =
k1
= 0. Ovviamente allora tali successioni costituiscono
anche un insieme di generatori, e quindi una base, per C
N
g
. Tale `e ad esempio
quella formata dalle seguenti successioni di scala g(x):
r
0
= (1, 0, . . . , 0, . . .)
r
1
= (0, 1, . . . , 0, . . .)
r
k1
= (0, 0, . . . , 1, . . .)
(qui si sono indicati esplicitamente solo i primi k termini di ciascuna succes-
sione). A proposito di queste osserviamo che, qualunque sia la successione
ricorrente lineare u di scala g(x), si ha
u = u
0
r
0
+u
1
r
1
+. . . +u
k1
r
k1
.
Vediamo unaltra importante base di C
N
g
. Sia
(12.17) g(x) =
s
i=1
(x
i
)
r
i
con i ,= j
i
,=
j
, r
i
,= 0 e r
1
+ + r
s
= k. Non `e dicile vericare
(3)
che per ogni i 1, . . . , s e per ogni j 0, . . . , r
i
1 la successione w
i,j
denita da
w
i,j
n
:= n
j
n
i
(3)
A tal ne si sfrutti la propriet`a per cui se `e una radice di molteplicit`a r per g(x)
allora `e pure radice di molteplicit`a r 1 per il polinomio g
i=1
_
r
i
1
j=0
ij
n
j
_
n
i
(
ij
C)
o anche
(12.19) u
n
=
s
i=1
_
P
i
(n)
_
n
i
con P
i
(n) polinomio in n di grado r
i
1 al pi` u. Lespressione (12.19) prende
talvolta il nome di polinomio esponenziale.
Mostriamo con alcuni semplici esempi come quanto precede possa essere
utilizzato per determinare facilmente (a patto, come si vedr`a, che si sappi-
ano trovare le radici del polinomio caratteristico) ln-esimo termine di una
successione ricorrente lineare. Non si pu`o che prendere le mosse dalla pi` u
famosa, la successione di Fibonacci. Si tratta della successione
F
0
= 0, F
1
= 1, F
2
= 1, F
3
= 2, F
4
= 3, F
5
= 5, F
6
= 8, F
7
= 13,
F
8
= 21, F
9
= 34, F
10
= 55, F
11
= 89, F
12
= 144, . . . F
n
, . . .
caratterizzata dalla relazione di ricorrenza lineare
(12.20) F
n+2
= F
n+1
+F
n
che esprime che ogni termine `e la somma dei due che lo precedono. La sua
scala di ricorrenza `e pertanto
(12.21) g(x) = x
2
x 1 =
_
x
1 +
5
2
__
x
1
5
2
_
.
Si noti che una delle sue radici `e il numero aureo
(12.22) =
1 +
5
2
= 1, 618033988 . . .
mentre laltra `e
(12.23)
1
5
2
=
1
= 1 = 0, 618033988 . . .
148
Si avr`a allora
F
n
=
_
1 +
5
2
_
n
+
_
1
5
2
_
n
Per le condizioni iniziali F
0
= 0, F
1
= 1, e devono soddisfare le relazioni
_
_
_
+ = 0
1+
5
2
+
1
5
2
= 1
per cui
= =
1
5
e quindi
(12.24) F
n
=
1
5
_
1 +
5
2
_
n
5
_
1
5
2
_
n
.
Come secondo esempio consideriamo la successione u = (u
n
) denita
dalle condizioni iniziali
u
0
= u
1
= u
2
= 0, u
3
= 1
e dalla relazione di ricorrenza
u
n+4
= 4u
n+3
6u
n+2
+ 4u
n+1
u
n
.
Il suo polinomio caratteristico `e
g(x) = x
4
4x
3
+ 6x
2
4x + 1 = (x 1)
4
e pertanto si avr`a
u
n
= +n +n
2
+n
3
dove i coeciente soddisfano il sistema di equazioni lineari:
_
_
= 0
+ + + = 0
+ 2 + 4 + 8 = 0
+ 3 + 9 + 27 = 1
Si ottiene
= 0, =
1
3
, =
1
2
, =
1
6
149
e quindi
u
n
=
1
3
n
1
2
n
2
+
1
6
n
3
=
n
3
3n
2
+ 2n
6
=
n(n 1)(n 2)
3!
=
_
n
3
_
per cui la successione cercata `e la quarta colonna del Triangolo di Tartaglia.
Si pu`o, pi` u in generale, provare che la k-esima colonna di quel Triangolo `e
una successione ricorrente lineare di polinomio caratteristico (x 1)
k+1
, ci`o
che `e un altro modo per esprimere la (12.9). Osserviamo a questo proposito
che la relazione di ricorrenza lineare (12.8) che giusticava la (12.9) `e un caso
particolare (in corrispondenza di h = 0) della relazione di ricorrenza lineare
non omogenea
k+1
1=0
(1)
i
_
k + 1
i
__
n +i
k +h
_
=
_
n
h 1
_
Indicando con t
s
= (t
s
n
)
n0
:=
_
n
s
_
la s-esima colonna del Triangolo di
Tartaglia (s = 0, 1, 2, . . .), la precedente assume la forma
k+1
1=0
(1)
i
_
k + 1
i
_
t
k+h
n+i
= t
h1
n
o anche
(E 1)
k+1
(t
k+h
) =
k+1
1=0
(1)
i
_
k + 1
i
_
E
i
(t
k+h
) = t
h1
In altri termini: se si applica loperatore (E 1)
k+1
che costituisce la
scala di ricorrenza della k-esima colonna del Triangolo di Tartaglia alla
colonna (k +h)-esima si ottiene la colonna (h 1)-esima.
Vediamo ancora altri due esempi. Il primo `e il problema delle torri
di Hanoi. Si considerino tre pali piantati per terra diciamoli P, Q e R
e si supponga di formare una torre ad es. nel palo P inlandovi n+1 dischi
forati aventi diametri tutti diversi, con la condizione che dischi di diametro
maggiore siano disposti sempre sotto dischi di diametro minore: ci si chiede
quante operazioni `e necessario compiere per spostare la torre in un altro palo
spostando un disco alla volta in modo da soddisfare sempre alla condizione
che i dischi pi` u grandi non possano essere disposti sopra quelli pi` u piccoli.
Possiamo risolvere il problema facendo uso delle successioni ricorrenti lineari:
sia infatti u
n
il numero delle operazioni che bisogna compiere per spostare n
dischi da un palo ad un altro e si consideri il caso di n +1 dischi. Una volta
eettuate le u
n
operazioni necessarie per spostare i primi n dischi da P su
ad es. Q, rimarr`a il disco pi` u grande alla base del palo P; questo verr`a ora
150
spostato da P a R dopo di che sposteremo, ancora mediante u
n
operazioni, gli
altri dischi da Q a R. In totale avremo compiuto 2u
n
+1 operazioni, e quindi
u
n+1
= 2u
n
+1. Da u
n+1
2u
n
1 = 0 e da u
n+2
2u
n+1
1 = 0, sottraendo
membro a membro, si ottiene u
n+2
3u
n+1
+ 2u
n
= 0, che costituisce una
relazione di ricorrenza lineare e pertanto (u
n
) `e una successione ricorrente
lineare associata al polinomio x
2
3x+2 = (x2)(x1), quindi della forma
u
n
= 2
n
+: dovendo essere u
0
= 0 e u
1
= 1, risulta u
n
= 2
n
1.
Da ultimo consideriamo il problema seguente
(4)
. Consideriamo su Z
2
i
cammini non autointersecantisi che originano in O =
_
0
0
_
e che siano
sequenze dei passi seguenti:
W: Z
2
Z
2
_
i
j
_
_
i 1
j
_
(un passo verso ovest),
E: Z
2
Z
2
_
i
j
_
_
i + 1
j
_
(un passo verso est),
N: Z
2
Z
2
_
i
j
_
_
i
j + 1
_
(un passo verso nord)
Indichiamo con u
n
il numero dei cammini siatti che si compongono di
n passi. Ciascuno di essi sar`a rappresentabile mediante una sequenza del
P
1
P
2
P
n
tale che P
i
W, E, N e P
i
P
i+1
,= WE, EW, (1 i n 1).
Cos`, i possibili cammini di due passi sono
WW, WN, NW, NN, NE, EN, EE
mentre quelli di tre passi sono
WWW, WWN, WNN, WNW, WNE, NNN, NNW, NNE, NWW,
(4)
cfr. Richard P. Stanley, Enumerative Combinatorics, Wadsworth & Brooks/Cole,
Monterey, California, 1986, pp. 31-36
151
NWN, NEE, NEN, EEE, EEN, ENN, ENE, ENW.
Si ha pertanto
u
0
= 1, u
1
= 3, u
2
= 7, u
3
= 17.
Ma qual `e il valore di u
n
per un n arbitrario? Al ne di determinarlo,
osserviamo in primo luogo che linsieme, diciamolo T
n
, di tutti i possibili
cammini P
1
P
2
P
n
di n passi pu`o essere diviso in due sottoinsiemi disgiunti:
quello, T
n
, per cui P
n
= N e quello, T
n
, per cui P
n
,= N. Pertanto u
n
=
#T
n
= #T
n
+ #T
n
. Ovviamente si ha #T
n
= u
n1
(un elemento di #T
n
`e della forma P
1
P
2
P
n1
N con P
1
P
2
P
n1
arbitrario). Per calcolare
#T
n
, suddividiamo T
n
a sua volta in quattro sottoinsiemi disgiunti:
Q
1
:= linsieme degli elementi di T
n
della forma P
1
P
2
P
n2
WW
Q
2
:= linsieme degli elementi di T
n
della forma P
1
P
2
P
n2
EE
Q
3
:= linsieme degli elementi di T
n
della forma P
1
P
2
P
n2
NW
Q
1
:= linsieme degli elementi di T
n
della forma P
1
P
2
P
n2
NE
e osserviamo che #(Q
1
Q
2
Q
3
) = u
n1
(infatti togliendo lultima lettera
agli elementi di Q
1
Q
2
Q
3
si ottengono tutti gli elementi di T
n1
) mentre
#Q
4
= u
n2
. Pertanto
#T
n
= #T
n
+ #T
n
= #T
n
+ #(Q
1
Q
2
Q
3
) + #Q
4
e quindi
u
n
= 2u
n1
+u
n2
.
La successione
u
0
= 1, u
1
= 3, . . . , u
n
, . . .
`e quindi una s.r.l. di polinomio caratteristico
x
2
2x 1 =
_
x (1 +
2)
__
x (1
2)
_
Pertanto
u
n
= (1 +
2)
n
+(1
2)
n
.
Per n = 0 e n = 1 si ha
_
+ = 1
(1 +
2) + (1
2) = 3
da cui
=
1 +
2
2
, =
1
2
2
e quindi
u
n
=
1
2
_
(1 +
2)
n+1
+ (1
2)
n+1
_
=
[
n+1
2
]
s=0
_
n + 1
2s
_
2
s
.
152
Appendice 1
Cenni alle strutture algebriche astratte
A1.1 Denizione ed esempi di gruppo
In quanto segue le lettere latine maiuscole A, B, G, H, K, etc. denoteranno
sempre degli insiemi non vuoti ed i simboli di moltiplicazione e quello di
addizione + denoteranno delle operazioni binarie arbitrarie (eventualmente
proprio la moltiplicazione e laddizione ordinarie) su uno di quegli insiemi.
Ci`o comporta che operazioni diverse potranno venir denotate, in contesti
diversi, con lo stesso simbolo, ad es. con quello della moltiplicazione [in
tal caso si parler`a di notazione moltiplicativa mentre si parler`a di notazione
additiva quando si far`a uso del simbolo di addizione +], salvo restando
il fatto che ci`o verr`a accuratamente evitato allinterno dello stesso contesto.
Tutto ci`o non solo `e giusticato dal fatto che le notazioni che via via ci verr`a
comodo introdurre sono del tutto convenzionali (e quindi in ultima analisi
luna vale laltra) ma, a raorzare questo, vi `e anche il fatto che spesso le
operazioni considerate non saranno concretamente determinate, ma di esse
ci interesser`a solo sapere che soddisfano ben determinate relazioni formali.
`
E proprio quanto succede nelle denizioni seguenti delle strutture astratte di
gruppo, di anello, di campo, etc.
Sia G un insieme non vuoto; si dir`a che unoperazione binaria
GG
G
(x, y) x y
dota G della struttura di gruppo [o anche che la coppia (G, ) o
semplicemente G `e un gruppo] se sono soddisfatte le propriet`a seguenti:
i) propriet`a associativa: qualunque siano x, y, z G si ha (xy)z = x(yz);
ii) esistenza dellelemento neutro 1: esiste in G un elemento che
convenzionalmente verr`a denotato con 1 tale che, qualunque sia x G,
si abbia x 1 = 1 x = x;
iii) esistenza dellinverso: per ogni x G, esiste un elemento che con-
venzionalmente verr`a denotato con x
1
tale che x x
1
= x
1
x = 1.
153
Il gruppo G viene detto commutativo o abeliano
(1)
se, accanto alle
precedenti, `e soddisfatta anche la
iv) propriet`a commutativa: qualunque siano x, y, G si ha xy = yx.
Talvolta pu`o essere preferibile evitare la notazione moltiplicativa (ad
esempio perch`e gi`a usata per un altro gruppo) e si adotta allora quella ad-
ditiva; in tal caso vengono adeguati a questa scelta anche gli altri simboli:
lelemento neutro verr` a denotato con 0 (in luogo di 1) e linverso di un ele-
mento x con x (in luogo di x
1
). Inoltre, loperazione iterata (n volte) di un
elemento x G con se stesso verr`a denotata con x
n
:= x x x
nvolte
o con
nx := x +x + +x
nvolte
a seconda che si faccia uso della notazione molti-
plicativa o di quella additiva. Osseviamo inne che, di norma, la notazione
additiva viene preferita a quella moltiplicativa nel caso in cui il gruppo con-
siderato sia abeliano.
Esempi di gruppo:
a) (Z, +), (Q, +), (R, +), (C, +).
b) (Q 0, ), (R 0, ), (C 0, )
c) (Z
n
, +), con n intero positivo qualunque.
d) (Z
p
0, ), con p primo.
e) Linsieme dei complessi di ugual anomalia rispetto alladdizione.
f) Linsieme dei complessi di modulo 1 rispetto alla moltiplicazione.
g) Linsieme delle radici n-esime dellunit`a rispetto alla moltiplicazione. In
particolare linsieme 1, 1, i, i (radici quarte dellunit`a).
Negli esempi precedenti, che sono tutti abeliani, la moltiplicazione e
laddizione + sono quelle usuali.
h) Linsieme delle matrici mn rispetto alla somma di matrici.
i ) Linsieme delle matrici quadrate dordine n non degeneri rispetto al
prodotto (righe per colonne) di matrici. Viene detto gruppo lineare ge-
nerale e denotato con GL(n, K), dove K indica il campo delle entrate delle
matrici. (Gruppo non abeliano.)
j) Linsieme delle matrici quadrate dordine n unimodulari (cio`e con deter-
minante uguale a 1) rispetto al prodotto di matrici. Viene detto gruppo
lineare speciale e denotato con SL(n, K). (Gruppo non abeliano.)
k) Linsieme delle matrici triangolari superiori (risp.: inferiori) dordine n
rispetto alla somma di matrici.
l) Linsieme delle matrici triangolari superiori (risp.: inferiori) non degeneri
dordine n rispetto al prodotto di matrici. (Gruppo non abeliano.)
(1)
In omaggio al grande matematico norvegese Niels Henrik ABEL (18021829).
154
m) Per ogni insieme A, linsieme G di tutte le bigezioni di A in se rispetto
alla composizione funzionale . (Gruppo non abeliano.)
n) Linsieme S
n
di tutte le permutazioni su n elementi rispetto al prodotto
di permutazioni. Tale gruppo, che viene detto gruppo simmetrico, `e ov-
viamente un caso particolare del precedente. (Gruppo non abeliano.)
o) Linsieme A
n
di tutte le permutazioni di classe pari su n elementi rispetto
al prodotto di permutazioni. A
n
viene detto gruppo alterno. (Gruppo non
abeliano.)
p) Linsieme delle traslazioni piane rispetto alla composizione di trasfor-
mazioni. (Gruppo abeliano.)
q) Linsieme delle rotazioni piane (intorno ad un centro sso) rispetto alla
composizione di trasformazioni. (Gruppo abeliano.)
r) Linsieme dei movimenti del piano rispetto alla composizione di trasfor-
mazioni. (Gruppo abeliano.)
s) Linsieme 1, i, j, k, 1, i, j, k con una moltiplicazione (per la quale
1 `e lelemento neutro) denita dalle relazioni: (1)
2
= 1, i
2
= j
2
=
2
= k
2
=
1, ij = k = ji, jk = kj = i, ki = ik = j. Si tratta del cosiddetto
gruppo dei quaternioni. (Vedi pi` u oltre lesempio ) in A.3)
Dato un gruppo (G, ), un sottoinsieme non vuoto S G si dir`a sot-
togruppo del gruppo G se viene dotato della struttura di gruppo dalla
stessa
(2)
operazione considerata nel gruppo G.
A1.2 Denizione ed esempi di semigruppo e di monoide
Se loperazione binaria
GG
G
(x, y) x y
denita sullinsieme non vuoto G soddisfa alla sola propriet`a associativa si
dir`a che G `e dotato della struttura di semigruppo. Inoltre, viene detto
monoide un semigruppo che possiede lelemento neutro.
Esempi di semigruppo e di monoide:
A) Dagli esempi di gruppo indicati pi` u sopra `e facile trarre degli esempi
di semigruppo e/o di monoide. Ad esempio (N, +) `e un monoide mentre
(N 0, +) `e un semigruppo.
B) Linsieme dei monomi (monici) x
r
1
1
x
r
2
2
x
r
n
n
nelle n indeterminate x
1
, x
2
,
(2)
Pi` u precisamente: dalla restrizione a S delloperazione considerata nel gruppo G.
155
. . . , x
n
`e un monoide rispetto allusuale prodotto
(x
r
1
1
x
r
2
2
x
r
n
n
) (x
s
1
1
x
s
2
2
x
s
n
n
) = x
r
1
+s
1
1
x
r
2
+s
2
2
x
r
n
+s
n
n
.
C) Per ogni insieme A, linsieme S di tutte le applicazioni di A in se `e un
monoide non commutativo rispetto alla composizione funzionale .
D) Dato un insieme non vuoto, nito o innito, A (che diremo alfabeto),
indichiamo con S la totalit`a delle parole, cio`e delle sequenze nite di lettere
dellalfabeto A (sono ammesse ripetizioni, anche consecutive, di una stessa
lettera). Possiamo dotare S della struttura di semigruppo (non commutativo
se A possiede almeno due lettere) tramite loperazione di giustapposizione,
cio`e quella che associa alle due parole (a
1
a
2
. . . a
m
) e (b
1
b
2
. . . b
n
) la parola
(a
1
a
2
. . . a
m
b
1
b
2
. . . b
n
). Tale semigruppo viene detto semigruppo libero
generato da A. Se si ammette che appartenga ad S anche la parola vuota,
che denoteremo con (), allora si ha addirittura un monoide.
A1.3 Denizione ed esempi di anello, corpo, campo
Sia R un insieme non vuoto; si dir`a che una coppia di operazioni binarie
R R
+
R
(x, y) x +y
,
R R
R
(x, y) x y
dota R della struttura di anello (con unit`a
(3)(4)
) se sono soddisfatte le
propriet`a seguenti:
i) (R, +) `e un gruppo abeliano;
ii) (R, ) `e un monoide;
iii) propriet`a distributiva del prodotto rispetto alla somma: qualun-
que siano x, y, z G si ha (x +y)z = xz +yz e z(x +y) = zx +zy.
Un anello (R, +, ) verr`a poi detto corpo se (R 0, ) `e addirittura un
gruppo, se cio`e ogni elemento non nullo di R ammette inverso moltiplicativo.
Un anello (R, +, ) si dice commutativo se tale `e il monoide (R, ).
Inne, un corpo commutativo (R, +, ) viene anche detto campo.
Esempi di anello, di corpo e di campo.
(3)
Spesso si parla di anello sottintendendo la presenza dellunit`a moltiplicativa 1. Va
tuttavia tenuto presente che molti autori, quando parlano della struttura di anello,
non richiedono lesistenza di tale elemento (cio`e nella ii) la parola monoide `e so-
stituita da semigruppo).
(4)
Osserviamo che col termine unit`a di un anello si indica, a seconda del contesto,
non solo come qui lelemento neutro moltiplicativo ma anche un qualunque
elemento invertibile dellanello. Cos` si dice, ad esempio, che i polinomi costanti non
nulli sono le unit`a dellanello polinomiale R[x
1
, . . . , x
n
] (vedi pi` u oltre lesempio )).
156
) Gli interi (Z, +, ) sono un anello commutativo mentre i razionali (Q, +, ),
i reali (R, +, ) ed i complessi (C, +, ) sono campi. In proposito si ricordi che
linverso del numero complesso a +bi `e il numero
a
a
2
+b
2
b
a
2
+b
2
i.
) (Z
n
, +, ) `e un anello qualunque sia il modulo n ed `e addirittura un campo
quando n `e primo.
) Un esempio di corpo (o, come pure si dice, campo sgembo) che non sia
anche un campo `e fornito dal corpo quaternioni (H, +, ) . Linsieme H `e
costituito da tutte le espressioni del tipo a+bi+cj +dk, con a, b, c, d R, che
si sommano e si moltiplicano come se fossero polinomi (nelle variabili non
commutative 1, i, j, k) semplicando alla ne mediante luso delle relazioni
indicate nel gruppo s) considerato di pi` u sopra. Ad esempio: (1 + 3i j +
2k)(2 i +k) = 2 +6i 2j +4k i 3i
2
+ji 2ki +k +3ik jk +2k
2
=
2+6i 2j +4k i +3k 2j +k 3j i 2 = 3+4i 7j +4k. Si verichi
che rispetto al prodotto cos` denito linverso del quaternione a+bi +cj +dk
`e il quaternione
a
a
2
+b
2
+c
2
+d
2
b
a
2
+b
2
+c
2
+d
2
i
c
a
2
+b
2
+c
2
+d
2
j
d
a
2
+b
2
+c
2
+d
2
k.
) Linsieme R[x
1
, . . . , x
n
] dei polinomi nelle n indeterminate x
1
, . . . , x
n
a co-
ecienti nel campo reale R (come pure, pi` u in generale, quello A[x
1
, . . . , x
n
]
a coecienti in un anello A qualunque) forma anello rispetto alle usuali ad-
dizione e moltiplicazione di polinomi.
Similmente a quella di sottogruppo vengono denite le nozioni di sot-
toanello e sottocampo.
A1.4 Nozione di omomorsmo di gruppi, di anelli, di campi
Dati due gruppi (G, ) e (G
), unapplicazione
f: G G
x f(x)
viene detta omomorsmo di gruppi se essa `e compatibile con le operazioni
di (G, ) e (G
, +
), unapplicazione
f: R R
x f(x)
viene detta omomorsmo di anelli (campi) se, qualunque siano x, y R,
si ha i)f(x +y) = f(x) +
) (1
e 1
denotano le unit`a di R e R
rispettivamente).
Un omomorsmo che sia iniettivo (risp.: suriettivo) viene detto mo-
nomorsmo (risp.: epimorsmo). Inoltre, un monomorsmo che sia al
contempo un epimorsmo viene detto isomorsmo. Inne, un isomorsmo
di un gruppo (anello, campo) in se si chiama automorsmo
157
A1.5 Gruppo e anello quoziente
Nel Cap.3 si `e visto quanto sia utile passare da un insieme A al suo
quoziente A/R rispetto ad una relazione dequivalneza R: in soldoni il van-
taggio `e quello di trascurare identicando elementi di A tra loro equivalenti
modulo R eventuali dierenze che, in un contesto in cui si `e interessati
principalmente alla R, risultassero ininuenti.
Vogliamo ora mostrare brevemente come questo processo possa essere
esteso anche ai gruppi e agli anelli, intendendo con ci`o che il quoziente ot-
tenuto debba a sua volta essere dotato della struttura di gruppo o di anello,
rispetto ad operazioni sul quopziente indotte da quelle delle strutture di
partenza. Tra quelli gi`a visti, lesempio che pi` u facilmente possa aiutare a
capire quanto ci accingiamo a fare `e quello del passaggio dallanello [gruppo]
Z degli interi allanello [gruppo] Z
n
=
Z
nZ
delle classi dei resti modulo n.
Ci`o premesso, consideriamo un gruppo G e sia H un suo sottogruppo
soddisfacente alla condizione xH = Hx per ogni x G; qui con xH [risp.:
Hx] si intende linsieme xh [ h H [risp.: hx [ h H]. In tal caso
si dice che H `e un sottogruppo normale; `e banale osservare che se G
`e abeliano allora ogni suo sottogruppo `e normale. Con riferimento al sot-
togruppo H introduciamo du G la seguente relazione di equivalenza
H
,
detta congruenza modulo H:
x
H
y xy
1
H.
Al solito, indicheremo con [x] = Hx la classe dequivalenza dellelemento x di
G, mentre il relativo insieme quoziente verr`a denotato con G/H. Su questo
insieme quoziente induciamo, da quella operante in G, la moltiplicazione
[x][y] := [xy].
Si dimostra che :
(i) tale operazione `e denita in modo corretto
(5)
, cio`e il risultato [xy] dipende
esclusivamente dalle classi [x] e [y] che si moltiplicano e non dagli elementi
x e y scelti a rappresentarle;
(ii) essa gode della propriet`a associativa;
(iii) lelemento [1] si comporta da elemento neutro e [x
1
] `e linverso [x]
1
di [x].
(5)
Ci`o dipende dal fatto che H `e nornale; infatti nel caso di un sottogruppo H non
normale la relazione
H
costituisce ancora una relazione di equivalenza, per cui ha
senso anche in tal caso di parlare dellinsieme quoziente G/H, ma non ha pi` u senso
parlare di gruppo quoziente giacche la denizione [x][y] := [xy] non ha pi u senso in
quanto la classe [x
di L.
Si pu`o dimostrare
(8)
che in ogni spazio vettoriale U esistono sottoin-
siemi massimali di vettori linearmente indipendenti cio`e sottoinsiemi L
di vettori linearmente indipendenti che non sono contenuti propriamente in
alcun altro sottoinsieme L
b
i
B
u
i
b
i
(somme nite, u
i
K).
Vale anche il viceversa, e cio`e: un insieme di generatori linearmente indipen-
denti `e una base. Le costanti u
i
che occorrono nella precedente
(9)
vengono
dette le componenti di u rispetto alla base B.
Conviene che una ssata base B venga dotata di un buon ordine
(10)
. Nel
caso nito (n = dim(U)) ci`o avviene in modo naturale: B = b
1
, b
2
, . . . , b
n
(11)
.
Questo fatto consente di disporre le componenti di u in una n-upla ordinata;
seguendo la convenzione (peraltro generalmente adottata) di rappresentare
(8)
La dimostrazione fa uso del Lemma di Zorn che `e una delle aermazioni equivalenti
allAssioma di scelta.
(9)
Avendo indicato gli elementi di base b
i
con un indice in basso, conveniamo di notare
le corrispondenti componenti u
i
con un indice in alto; ci`o al ne di poter far uso
della cosiddetta convenzione di Einstein, secondo cui si intende che rispetto ad un
indice ripetuto in alto e in batto si somma. Ad esempio, la sommatoria
n
i=1
u
i
b
i
pu`o, qualora si sappia a priori che il campo di variabilit` a di i `e 1, . . . , n, esser pi` u
semplicemente rappresentata da u
i
b
i
. In alcuni contesti nei quali si fa gran uso di
sommatorie multiple, questa semplicazione (che richiede solo un minimo di pratica
perche diventi familiare) rende formule complesse molto compatte e quindi facil-
mente leggibili con un solo colpo docchio. E uno studente, che abbia anche solo
esperienza di decomposizione in fattori di un polinomio, non pu`o mancare di con-
venire sullimportanza di questo aspetto.
(10)
Il Teorema del buon ordine o di Zermelo altra aermazione equivalente allAssioma
di scelta garantisce la possibilit`a (teorica) di dotare di un buon ordine un qualunque
insieme. Naturalmente nel caso presente occorre scomodare questo risultato solo
quando la cardinalit`a di B `e maggiore di
0
.
(11)
Ma la notazione insiemistica, che adottiamo seguendo una prassi consolidata, `e im-
propria e fuorviante; meglio sarebbe B = (b
1
, b
2
, . . . , b
n
), che evidenzia che B `e una
n-upla ordinata. Questa considerazione acquista maggior forza nel caso degli spazi a
dimensione innita, giacche a un insieme innito (ma non ad uno nito) corrisponde
s` un solo cardinale ma inniti numeri ordinali. In altri termini, una base innita
pu`o essere dotata di inniti buoni ordini, a coppie non isomor.
161
gli elementi di una matrice A con una lettera minuscola accompagnata da
due indici, a
i
j
, di cui quello in alto rappresenta la riga e quello in basso la
colonna, tale n-upla ordinata sar`a rappresentata da un vettore-colonna (cos`
chiameremo una matrice di una sola colonna) e quindi porremo
u =
n
i=1
u
i
b
i
=
_
_
_
_
_
u
1
u
2
u
n
_
_
_
_
_
Inoltre, unapplicazione lineare f: U V tra due K-spazi vettoriali U e V , di
dimensioni n ed m rispettivamente, pu`o venir rappresentata da una matrice
F di tipo mn. Fissiamo infatti una base b
1
, b
2
, . . . , b
n
in U ed una base
c
1
, c
2
, . . . , c
m
in V e poniamo
f(u) = v =
m
i=1
v
i
c
i
=
_
_
_
_
_
v
1
v
2
v
m
_
_
_
_
_
,
Ci si convince facilmente che la trasformazine lineare f `e assegnata non
appena si conoscono le immagini dei vettori di base b
j
f(b
j
) =
m
i=1
f
i
j
c
i
(i = 1, . . . , m; j = 1, . . . , n)
e che si ha
_
_
_
_
_
_
_
_
_
_
_
_
_
v
1
v
2
v
m
_
_
_
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
_
_
_
_
_
_
_
_
f
1
1
f
1
2
f
1
n
f
2
1
f
2
2
f
2
n
f
m
1
f
m
2
f
m
n
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
u
1
u
2
u
n
_
_
_
_
_
_
_
_
_
_
_
_
_
.
Infatti:
m
i=1
v
i
c
i
= v = f(u) = f
_
n
j=1
u
j
b
j
_
=
n
j=1
u
j
f(b
j
) =
n
j=1
u
j
_
m
i=1
f
i
j
c
i
_
=
m
i=1
_
n
j=1
f
i
j
u
j
_
c
i
162
da cui, confrontando il punto di partenza e quello darrivo,
v
i
=
n
j=1
f
i
j
u
j
(i = 1, . . . , m)
che `e proprio quanto, in forma matriciale, esprimeva luguaglianza prece-
dente. Uguaglianza che verr`a anche espressa tramite la notazione pi` u com-
patta
f(u) = Fu, dove F := (f
i
j
).
Vale anche il viceversa: rispetto a due basi b
1
, b
2
, . . . , b
n
e c
1
, c
2
, . . . , c
m
= b
1
, b
2
, . . . , b
n
su uno stesso spazio
vettoriale U (per comodit`a ritorniamo a riferirci al caso a dimensione nita),
si vogliano esprimere le componenti
_
_
_
_
_
_
_
_
_
_
_
_
_
u
1
u
2
u
n
_
_
_
_
_
_
_
_
_
_
_
_
_
163
di un generico vettore u nella seconda base note quelle
_
_
_
_
_
_
_
_
_
_
_
_
_
u
1
u
2
u
n
_
_
_
_
_
_
_
_
_
_
_
_
_
dello stesso vettore nella prima base. In questo caso si ha ancora
_
_
_
_
_
_
_
_
_
_
_
_
_
u
1
u
2
u
n
_
_
_
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
_
_
_
_
_
_
_
_
f
1
1
f
1
2
f
1
n
f
2
1
f
2
2
f
2
n
f
n
1
f
n
2
f
n
n
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
u
1
u
2
u
n
_
_
_
_
_
_
_
_
_
_
_
_
_
.
dove per`o ora la j-esima colonna della matrice F esprime le componenti nella
base B
i=1
f
i
j
b
i
In questo caso, inoltre, la matrice F deve essere non solo quadrata ma anche
invertibile (per cui det(F) ,= 0); infatti il cambiamento di base da B
a
B dovr`a essere rappresentato da una matrice F
F = FF
= I e quindi F
= F
1
.
A1.7 Spazio duale
Osservato che il campo K `e esso stesso un K-spazio vettoriale (di dimensione
1), ha senso considerare linsieme U
ha
dimensione n; si verica infatti facilmente che le n forme lineari b
i
(i =
1, . . . , n) denite da
b
i
(b
j
) :=
i
j
:=
_
1 se i = j
0 se i ,= j
(i, j = 1, . . . , n)
costituiscono una base di U
i=1
i
b
i
la sua i-esima componente `e data dal valore che assume sulli-esimo vettore
della base b
j
(j = 1, . . . , n) di U:
i
= (b
i
)
In accordo con () e con le citate convenzioni sugli indici, la sar`a anche
rappresentata da un vettore-riga
(
1
,
2
, . . . ,
n
)
Inoltre, le componenti (
1
,
2
, . . . ,
m
) dellimmagine = f() V
di
U
j=1
f
i
j
c
j
,
cio`e le componenti rispetto alla base c
j
(j = 1, . . . , m) di V
, duale della
base c
j
(j = 1, . . . , m) ssata in V di f(b
i
) riempiono la i-esima riga della
matrice F = (f
i
j
) che rappresenta la f: U
.
La nozione di dualit`a si pu`o estendere anche alle trasformazioni lineari.
Infatti lapplicazione lineare
f: U V
induce unapplicazione lineare, detta duale della f,
f
: V
denita da
f
() := f ( V
)
[Suggeriamo al lettore di memorizzare la notazione simbolica f
=f per
ricordare come funziona f
.] Si verichi che si ha
(g f)
= f
.
Questo si pu`o anche esprimere dicendo che, dato un diagramma di spazi vet-
toriali e applicazioni lineari, lo si dualizza aggiungendo dappertutto asterischi
e contemporaneamente invertendo il verso delle frecce.
Si coglie il vantaggio delle convenzioni sugli indici adottate pi` u sopra
se si osserva che, rappresentata unapplicazione lineare f: U V da una
matrice F rispetto a ssate basi in U e V , allora, con riferimento alle basi
duali di quelle, lapplicazione duale f
: V
iJ
i
b
i
,
Se #J =
0
un modo equivalente consiste nel rappresentare mediante un
vettore-riga innito
= (
0
,
1
, . . . ,
n
, . . .)
166
Il fatto che, nel caso a dimensione innita, linsieme (b
i
)
iJ
non pu`o co-
stituire una base per U
di U
`e
:
dimU
b
i
B
u
i
b
i
(somme nite, u
i
K)
vi sono esattamente
+ + + =
elementi u U:
#U = .
Ci`o premesso occupiamoci della
Dimostrazione del Teorema: Qualunque sia la base B di U si ha =
#B e pertanto
`e la cardinalit`a di K
B
, la totalit`a delle applicazioni
da B in K e quindi poiche ciascuna di queste determina univocamente
unapplicazione lineare da U in K (e viceversa)
`e anche la cardinalit`a
di U
. Ergo
= #U
167
e quindi
= sup(,
)
Per poter concludere che
= dim(U
) =
Siccome = dim(U)
0
, esiste sicuramente in U una sequenza di
b
1
, b
2
, . . . , b
n
, . . .
di vettori linearmente indipendenti e, per ogni a K, esiste quindi al-
meno unapplicazione lineare da U in K tale che b
i
a
i
. Indichiamo con
a
: U K quella tra queste che manda a zero ogni vettore di U che non sia
combinazione lineare dei b
i
. Linsieme
:=
a
[ 0 ,= a K U
che `e quanto restava da provare.
168
Appendice 2
SUL TRIANGOLO DI TARTAGLIA E DINTORNI
(che sarebbero: relazioni di ricorrenza, successione di Fibonacci,
pigne e girasoli, numero aureo, frazioni continue,
equazioni alle dierenze ed altre amenit`a)
(i)
1. Due parole dintroduzione. Nel decidere quali argomenti toccare
nel corso di questa chiacchierata e come trattarli ho cercato di avere
come costante punto di riferimento alcuni aspetti tra i pi` u interessanti, af-
fascinanti e peculiari della matematica. Essi impongono di collocare questa
disciplina in una posizione aatto particolare, non condivisa da nessuna delle
(i)
Testo di una conferenza rivolta agli studenti delle Scuole secondarie superiori che sono
stati impegnati nelle gare eliminatorie provinciali di Cagliari (curate dal Prof.Sandro
Remondini) per le Olimpiadi di matematica (febbraio 2000).
169
altre scienze esatte. La cosa sorprendente `e che per cogliere tali aspetti non `e
aatto necessaria una gran cultura specialistica: al contrario, essi sono sicu-
ramente alla portata di uno studente liceale, purche sia disposto a dedicare
un po dattenzione alle questioni proposte.
Questa osservazione mi porta subito al primo di quegli aspetti: la mate-
matica `e una scienza per menti giovani!
`
E opinione diusa tra i matematici che un buon matematico dia il meglio
di se prima dei quaranta anni. La storia della matematica infatti insegna
che le pi` u importanti scoperte, quelle veramente grandi, quelle che hanno
cambiato la faccia della matematica sono sempre state opera di matematici
che non avevano ancora raggiunto quellet`a. Alcuni di quei matematici e
tra i pi` u grandi erano addirittura poco pi` u che ragazzini: Evariste Galois
(181132) mor` che non aveva ancora ventunanni e Niels Abel (180229)
quando ne aveva pochi di pi` u per citarne solo due le cui ricerche hanno
veramente rivoluzionato la matematica. A conferma di queste aermazioni
faccio osservare che la Medaglia Fields (lanalogo, per la matematica, del
Premio Nobel) per regolamento viene negata agli ultraquarantenni.
Queste osservazioni mi interessano qui non tanto per se stesse, quanto
piuttosto perche suggeriscono unimportante indicazione didattica: bisogna
mettere in grado i giovani interessati alla matematica a cimentarsi prima
possibile con la ricerca autonoma. E, in primo luogo, ad aver coraggio
intellettuale e ducia nelle proprie forze. Siete quindi tutti caldamente in-
vitati a darvi da fare per intuire interessanti propriet`a ed a sforzarvi poi di
trovarne una dimostrazione, o eventualmente di confutarle, qualora come
pure capita spesso la vostra intuizione vi abbia giocato un tiro mancino
(ii)
.
Mi rendo conto che, detto cos`, questo invito possa apparire un tantino insen-
sato, ma vi assicuro che non lo `e. Spero nel seguito di riuscire a suggerire un
possibile ambito di indagine quello che d`a appunto il titolo alla presente
conferenza adeguato alle conoscenze e alle forze di uno studente medio:
esso ore il destro per scoprire abbastanza facilmente delle propriet`a, che
peraltro spesso non sono di dicile dimostrazione. Riuscire da soli a in-
tuire una propriet`a e poi a dimostrarla `e un piacere immenso, eventualmente
solo in parte mitigato dallo scoprire pi` u tardi (cosa che pur bisogna met-
ter in conto come assai probabile) che quella propriet`a sia gi`a nota. Resta
comunque, insieme con laver fatto della buona palestra matematica, anche
una maggior profondit`a di comprensione della stessa propriet`a.
Un secondo aspetto che vorrei emergesse da quanto dir`o in seguito con-
(ii)
La cosa non deve scoraggiare. Nel mondo matematico circola questa considerazione:
La dierenza tra un matematico eccellente ed un matematico mediocre `e che mentre
a questultimo, su mille idee che gli passano per la testa, dopo aver scartato quelle
banali o sciocche, ne resta al pi` u una interessante, di contro il matematico eccellente
ne deve scartare solo novecentonovanta, e delle restanti dieci solo due o tre al massimo
sono veramente buone.
170
siste nella quasi magica capacit`a di molti oggetti matematici di saltar fuori in
modo tanto ecace quanto imprevedibile in settori sia interni che esterni
alla matematica in apparenza molto lontani da quelli che inizialmente
li avevano generati. Capita addirittura che la cosa sia cos` frequente che
questo aspetto quasi smette di sorprendere: ad esempio non ci si meraviglia
poi tanto ma si dovrebbe! di veder spuntare = 3, 14159 . . . come
il prezzemolo in questioni che in apparenza niente hanno a che fare con la
circonferenza. Altre volte imprevedibilit`a ed ecacia sono tanto plateali da
arrivare a provocare persino irritazione nei non matematici. Sicuramente se
ne nota una punta non disgiunta peraltro da sincera ammirazione nelle
parole di Eugene Wigner,
(iii)
laddove parla di irragionevole ecacia della
matematica nelle scienze naturali.
Questo aspetto costituisce a mio parere uno dei punti pi` u interessanti e
controversi della losoa della matematica e dei rapporti della matematica
con le altre scienze e con la realt`a e meriterebbe ben pi` u ampia attenzione
di quanto non faccia il rapido cenno che qui gli `e dedicato.
Inne un terzo aspetto sul quale mi piace sollecitare la vostra attenzione
`e il carattere di eternit`a delle scoperte matematiche. Le verit`a della sica,
della chimica o della biologia sono tali esclusivamente durante una ben deter-
minata fase storica di quelle discipline. Cos` il Sistema Tolemaico ha dovuto
cedere il posto a quello Copernicano, del ogisto nessun chimico parla pi` u da
oltre duecento anni, dopo Einstein il tempo sico non `e pi` u un assoluto, prima
di Francesco Redi (16261698) (e qualcuno ahim`e anche dopo!) molti biologi
erano propensi a credere nella generazione spontanea della vita etc.etc. Non
cos` in matematica. Il Teorema di Pitagora `e cos` come lo conoscete voi da
almeno duemilacinquecento anni, e potete star certi che tale rimarr`a nche
vi sar`a lumanit`a.
2. Il Triangolo di Tartaglia. Ci`o premesso, addentriamoci nalmente
in alcune semplici questioni matematiche. Partiamo proprio dal Triangolo
di Tartaglia. Diciamo subito che cos` piace chiamarlo a noi italiani, in onore
del matematico bresciano Niccol`o Tartaglia (1500ca1557)
(iv)
; i francesi lo
chiamano Triangolo di Pascal (162362), ma in precedenza era stato gi`a
scoperto da un matematico tedesco e prima ancora dai cinesi. Come vedete
le riscoperte fanno parte della migliore tradizione matematica!
(iii)
Fisico statunitense di origine ungherese, premio Nobel per la sica per il 1963; va
ricordato, oltre che per molti altri fondamentali contributi, per esser stato uno dei
primi ad applicare la teoria dei gruppi alla sica.
(iv)
A Tartaglia va anche ascritta la scoperta delle formule risolutive dellequazione al-
gebrica di terzo grado, formule che sono passate alla storia col nome di formule
cardaniche, dal nome del matematico (ma anche medico e mago) Cardano (1501
1576) che se ne appropri`o in modo non del tutto legittimo.
171
Il Triangolo di Tartaglia che sicuramente molti di voi gi`a conoscono
pu`o essere introdotto in pi` u modi. Due dei pi` u semplici e signicativi sono
quelli forniti dallapproccio algebrico e da quello combinatorio. Dellalgebra
avete sicuramente una qualche idea, ma forse non sapete cosa sia la com-
binatoria. Premettendo che `e sempre rischioso dare denizioni generali per
oggetti complessi e tale sicuramente `e la combinatoria possiamo molto
grosso modo dire che essa `e quella parte della matematica che si occupa di
contare il numero degli elementi di taluni insiemi niti. Quanto appena
detto pu`o essere chiarito proprio dalla denizione combinatoria del Triangolo
di Tartaglia. Vediamo quindi questa per prima.
Consideriamo un insieme A che abbia n elementi ed indichiamo col sim-
bolo
_
n
k
_
il numero dei sottoinsiemi di A che hanno esattamente k elementi.
Tale simbolo
_
n
k
_
si legge: n su k viene detto coeciente binomiale
(il motivo di tale nome sar`a chiaro dopo, quando ne vedremo lapproccio al-
gebrico). Si ottiene il Triangolo di Tartaglia distribuendo ordinatamente
i coecienti binomiali per righe e per colonne:
_
n
k
_
occuper`a lintersezione
della n-esima riga con la k-esima colonna. Va ancora precisato che lindice
di riga `e crescente dallalto verso il basso e quello di colonna da sinistra verso
destra; inoltre vengono normalmente tralasciati i coecienti binomiali uguali
a zero.
`
E chiaro che
_
n
k
_
ha senso per coppie n, k di interi non negativi e che
vale zero quando n < k.
`
E anche facile vedere che
_
n
0
_
=
_
n
n
_
= 1
per ogni n: ogni insieme A ha un solo sottoinsieme (linsieme vuoto ) con
zero elementi ed uno solo (linsieme A stesso) con n elementi. Inoltre, poiche
vi sono tanti sottoinsiemi con k elementi quanti ve ne sono con n k, si ha:
_
n
k
_
=
_
n
n k
_
.
Ancora:
_
n
1
_
=
_
n
n 1
_
= n.
Senza troppa dicolt`a possiamo poi calcolare direttamente il valore dei co-
ecienti binomiali
_
n
k
_
per piccoli valori di n (e quindi di k). Otteniamo cos`
172
linizio del Triangolo:
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 6 15 20 15 6 1
1 7 21 35 35 21 7 1
1 8 28 56 70 56 28 8 1
. . . . . . . . . .
_
n
0
_ _
n
1
_ _
n
2
_ _
n
3
_ _
n
4
_
. . . .
_
n
n1
_ _
n
n
_
. . . . . . . . . . .
`
E anche chiaro per`o che questo procedimento si fa via via pi` u dicoltoso
man mano che n cresce. Occorre quindi trovare un qualche trucco per pro-
cedere con maggior speditezza. In questo caso il trucco giusto consiste di una
relazione di ricorrenza, di una relazione cio`e che consente di costruire velo-
cemente una riga dopo laltra. Tale relazione viene espressa dalla seguente
formula
(1)
_
n
k
_
=
_
n 1
k
_
+
_
n 1
k 1
_
.
Come dire: ogni elemento del Triangolo si ottiene sommando quello che gli
sta immediatamente sopra con quello che precede questultimo nella riga.
La (1) pu`o essere provata ragionando come segue. Fissiamo lattenzione su
un elemento a di A e sia A
, che sono
_
n1
k1
_
. La (1) resta cos`
provata.
Con un ragionamento combinatorio leggermente pi` u sosticato (che qui
per semplicit`a tralasciamo) si pu`o dimostrare la formula seguente
(2)
_
n
k
_
=
n(n 1) (n k + 1)
1 2 k
che come si vede consente un calcolo diretto
(v)
del coeciente binomiale
_
n
k
_
.
Direste, guardando la (2), che i coecienti binomiali
_
n
k
_
sono numeri interi?
Accennavamo prima ad un possibile approccio algebrico. Certamente,
ricordando i prodotti notevoli che avete studiato a scuola, avete capito
dove vado a parare. Occorre considerare lo sviluppo della potenza n-esima
(x +y)
n
del binomio x +y:
(3)
(x +y)
n
=
_
n
0
_
x
n
y
0
+
_
n
1
_
x
n1
y
1
+
_
n
2
_
x
n2
y
2
+
+
_
n
k
_
x
nk
y
k
+ +
_
n
n1
_
x
1
y
n1
+
_
n
n
_
x
0
y
n
La formula precedente `e nota col nome di Teorema binomiale o anche di
formula di Newton. Ma come la si dimostra? La cosa non `e dicile se
si fa uso del processo di induzione matematica. Spero che a tutti voi
sia familiare questa importantissima tecnica dimostrativa. In due parole:
per dimostrare una propriet`a (o una formula) che dipende da un indice n
basta vericarla prima per qualche (piccolo) valore di n (solitamente n = 0
o n = 1) e poi dimostrarla per un n generico nellipotesi detta ipotesi
induttiva che sia vera per i valori dellindice inferiori a n. Nel nostro
caso la prima parte della dimostrazione `e immediata. Per quanto riguarda
la seconda, essa si riduce al semplice calcolo seguente:
(x +y)
n
= (x +y)
(n1)
(x +y) = (per lipotesi induttiva)
=
_
_
n 1
0
_
x
n1
y
0
+ +
_
n 1
k
_
x
nk1
y
k
+ +
_
n 1
n 1
_
x
0
y
n1
_
_
xy
_
=
(v)
Cio`e un calcolo che non sia ricorsivo, non costringa cio`e a calcolare anche tutti i
coecienti binomiali precedenti, come quando si fa uso della (1).
174
=
_
n 1
0
_
x
n
y
0
+
_
n 1
1
_
x
n1
y
1
+ +
_
n 1
n 1
_
x
1
y
n1
+
+
_
n 1
0
_
x
n1
y
1
+ +
_
n 1
n 2
_
x
1
y
n1
+
_
n 1
n 1
_
x
0
y
n
=
=
_
n 1
0
_
x
n
y
0
+
_
_
n 1
1
_
+
_
n 1
0
_
_
x
n1
y
1
+
+
_
_
n 1
k
_
+
_
n 1
k 1
_
_
x
nk
y
k
+
+
_
_
n 1
n 1
_
+
_
n 1
n 2
_
_
x
1
y
n1
+
_
n 1
n 1
_
x
0
y
n
=
(per la (1))
=
_
n
0
_
x
n
y
0
+
_
n
1
_
x
n1
y
1
+ +
_
n
k
_
x
nk
y
k
+ +
_
n
n 1
_
x
1
y
n1
+
_
n
n
_
x
0
y
n
Dicevo allinizio che il Triangolo di Tartaglia rappresenta una ottima
palestra per allenarsi alla ricerca.
`
E infatti abbastanza facile, giocandoci
un po senza troppa fretta, riuscire ad individuare qualche interessante pro-
priet`a, la cui dimostrazione risulta pure abbordabile. Oltre alle propriet`a
viste pi` u sopra ed a quelle che vedremo nei paragra successivi, eccovene a
titolo di ulteriore esempio alcune altre, che vi invito a dimostrare:
1) La somma degli elementi che stanno sulla n-esima riga del Triangolo d`a
2
n
mentre la loro somma a segni alterni d`a zero:
(4)
_
n
0
_
+
_
n
1
_
+
_
n
2
_
+
_
n
3
_
+ +
_
n
n 1
_
+
_
n
n
_
= 2
n
(5)
_
n
0
_
_
n
1
_
+
_
n
2
_
_
n
3
_
+ + (1)
n1
_
n
n 1
_
+ (1)
n
_
n
n
_
= 0
[Si richiede sia una dimostrazione algebrica che una combinatoria.]
2) Si provi la formula
(6)
_
2n
n
_
=
_
n
0
_
2
+
_
n
1
_
2
+
_
n
2
_
2
+
_
n
3
_
2
+ +
_
n
n 1
_
2
+
_
n
n
_
2
175
[Suggerimento: si consideri il termine in x
n
di (x + 1)
2n
= (x + 1)
n
(x + 1)
n
. . .]
3) Si dimostrino le formule
(7)
_
n
k
_
=
n
k
_
n 1
k 1
_
,
(8)
_
n + 1
k + 1
_
=
_
k
k
_
+
_
k + 1
k
_
+ +
_
n 1
k
_
+
_
n
k
_
3. La successione di Fibonacci. Una bella propriet`a, invero poco
nota, del Triangolo di Tartaglia (propriet`a di cui pure lasciamo la non dicile
dimostrazione al lettore) `e la seguente: se si sommano i coecienti binomiali
nel modo indicato dalle frecce qui sotto
1
1
2
1 3
5
1 1 8
13
1 2 1 21
34
1 3 3 1 55
89
1 4 6 4 1 .
.
1 5 10 10 5 1 .
.
1 6 15 20 15 6 1
1 7 21 35 35 21 7 1
1 8 28 56 70 56 28 8 1
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
si ottiene la famosa successione di Fibonacci, cio`e la successione
F
1
= 1, F
2
= 1, F
3
= 2, F
4
= 3, F
5
= 5, F
6
= 8, F
7
= 13, F
8
= 21, F
9
= 34,
176
F
10
= 55, F
11
= 89, F
12
= 144, . . . F
n
, . . .
caratterizzata dalla relazione di ricorrenza lineare
(8) F
n+2
= F
n+1
+F
n
che esprime che ogni termine `e la somma dei due che lo precedono.
Prima di vedere alcune delle sorprendenti propriet`a di questa succes-
sione, meriterebbe soermarsi sulla gura e sullopera del matematico Leonar-
do Fibonacci (1175ca1235ca) o Leonardo Pisano come pure lo si chiama
da cui prende il nome. Purtroppo ce ne manca il tempo. Qui basti dire
che fu forse il pi` u importante matematico medievale e che, introducendo con
la sua opera Liber Abbaci (1202) il sistema di numerazione decimale (quello
che ancora oggi noi usiamo per rappresentare i numeri razionali e per far cal-
coli) nel mondo cristiano, segn`o linizio della rinascita degli studi matematici
in Occidente.
Ma torniamo alla successione di Fibonacci. Questi se la trov`o tra le
mani quando dovette risolvere un problema di conigli. Ecco di che si tratta.
Supponiamo di avere inizialmente una coppia di conigli che si riproduca con
regolarit`a, gliando una nuova coppia ogni mese. E che anche le coppie cos`
generate si riproducano, a partire dal secondo mese di vita, con la stessa
modalit`a. Ci si chiede quante coppie popoleranno la conigliera alln-esimo
mese. La risposta `e data dalln-esimo numero di Fibonacci F
n
. Vediamo
come si ragiona. Iniziamo col chiamare adulte le coppie che gliano. Allora
il numero F
n+2
di coppie presenti all(n+2)-esimo mese sar`a dato dal numero
x di coppie adulte pi` u il numero y di coppie neonate.
`
E facile convincersi che
il numero x di coppie adulte `e esattamente quello, F
n+1
, di tutte le coppie
all(n + 1)-esimo mese mentre il numero y di coppie neonate `e quello, F
n
,
di tutte le coppie alln-esimo mese. Pertanto F
n+2
= F
n+1
+ F
n
; poiche
F
1
= F
2
= 1, laermazione resta provata.
Lultimo (in ordine cronologico) grande exploit della successione di Fi-
bonacci nellambito della ricerca matematica pura risale al 1970, allorche il
giovane matematico russo Matjasievic la tir`o in ballo per porre lultimo tas-
sello (quelli precedenti si devono ai matematici statunitensi Martin Davis,
Julia Robinson e Hilary Putnam) alla dimostrazione della non esistenza di un
algoritmo atto a stabilire la risolubilit`a di unequazione diofantea (si tratta
del X problema di Hilbert
(vi)
).
Stranamente i numeri di Fibonacci interessano anche i botanici. Forse,
osservando un ore di girasole, vi `e capitato di notare che i suoi semi dise-
gnano due serie di spirali logaritmiche, una di spirali che ruotano in senso
(vi)
Ci si riferisce al famoso elenco di 23 problemi aperti che Hilbert, durante il Congresso
internazionale dei matematici del 1900, indic`o come i pi` u importanti della matematica
di allora.
177
orario e laltra in senso antiorario. Bene, se vi prendete la briga di contare
il numero di spirali delle due serie, vi accorgerete con meraviglia che trat-
tasi sempre di due numeri consecutivi della successione di Fibonacci (non
sempre gli stessi due!) Lo stesso fenomeno si nota guardando i osculi di
una margherita, o le squame che, nelle pigne, ricoprono i pinoli. Sino a non
molti anni fa questo fenomeno era misterioso. Oggi si `e nalmente riusciti a
comprenderlo, anche se la spiegazione `e piuttosto complessa.
I numeri di Fibonacci intervengono anche in altre questioni di botanica:
ad esempio in llotassi. In certe piante le foglie amano disporsi a spirale
intorno al fusto. In tal caso pare che esse conoscano i numeri di Fibonacci:
accade infatti che sia proprio uno di questi il numero delle foglie che si contano
lungo una spira, tra una qualunque di esse e quella che la sovrasta.
4. Il numero aureo. Passiamo dalla botanica allarte, che anche qui in-
terviene la successione di Fibonacci. A scuola forse avete studiato la sezione
aurea di un segmento. Si tratta della parte AP di un segmento AB che `e
media proporzionale tra lintero segmento e la parte restante PB:
(9)
AB
AP
=
AP
PB
Vi ricordo la costruzione geometrica con riga e compasso della sezione
aurea. In un triangolo rettangolo di ABC di cateti AB e BC = AB/2 sia D
un punto dellipotenusa AC tale che DC = BC; allora P `e il punto su AB
per cui AP = AD.
La nozione di sezione aurea di un segmento era gi`a nota a Euclide,
anche se laggettivo aurea viene usato a partire dallottocento. Ma perche
aurea? Sicuramente sapete che gli antichi Greci erano quasi ossessionati
dalla ricerca dellarmonia delle forme, sia di quelle del corpo umano che di
quelle di un edicio. E non v`e dubbio che una delle forme geometriche pi` u
comuni negli edici sia il rettangolo. Parimenti indubbio `e che il nostro occhio
trova assai sgradevole sia un rettangolo troppo schiacciato che uno troppo
simile ad un quadrato (senza esser tale). Si poneva allora il problema di
trovare il rettangolo pi` u armonioso. I Greci lo individuarono in uno i cui lati
stessero in quel rapporto. E lo utilizzarono, ad esempio, nella costruzione
del Partenone, la cui facciata rispetta tale rapporto. La questione venne
ripresa nel Rinascimento, soprattutto ad opera del matematico Fra Luca
Pacioli (14451517), allievo di Piero della Francesca e amico di Leonardo da
Vinci, che chiam`o quel rapporto proporzione divina e gli dedic`o unopera,
De divina proportione (1496) appunto. Pi` u di recente queste idee estetiche
sono state riprese sistematicamente dal grande architetto contemporaneo Le
Corbusier.
178
Per i Greci un altro motivo di merito della sezione aurea risiedeva nel
fatto che essa compare nel pentagono regolare e nel pentagono stellato (cio`e
la stella a cinque punte che si ottiene tracciando le diagonali del pentagono
regolare) cui i Greci attribuivano poteri magici
(vii)
.
Con riferimento alla gura
(viii)
A
B
C D
E
P
Q
R
S T
si hanno infatti i seguenti rapporti:
(10)
AB
AC
=
AC
AB AC
,
AC
AS
=
AS
AC AS
,
AS
ST
=
ST
AS ST
Essi si provano nel modo seguente. Ricordiamo in primo luogo che la somma
degli angoli interni di un pentagono vale 3 radianti per cui, in quello rego-
lare, ciascun angolo interno vale
3
5
radianti. Osserviamo poi che, per ragioni
di simmetria, il pentagono PQRST ottenuto tracciando le diagonali del
pentagono regolare ADBEC `e anchesso regolare (per cui i suoi angoli
interni misurano
3
5
radianti e quindi quelli esterni
2
5
radianti) e inoltre
tutti i triangoli individuabili in gura sono isosceli. Da ci`o consegue che le
(vii)
Entrambe le gure si ottengono facilmente facendo un nodo piano con una striscia
di carta.
(viii)
Pentagono regolare di lato l. Posto :=
1+
5
2
= 1, 61803 . . . (numero aureo),
le coordinate dei vertici sono: E(a; 0), B(a + l; 0) A(a +
l
2
; l sin
2
5
), C(a
l cos
2
5
; l sin
2
5
), D(a + l + l cos
2
5
; l sin
2
5
). Inoltre, posto := EQ =
l
2 cos
5
le coordinate delle intersezioni delle diagonali sono: P(a + l cos
2
5
; l sin
5
),
Q(a +
l
2
; cos
5
), R(a +cos
2
5
; l sin
5
), S(a +
l
2
sin
10
; l sin
2
5
), T(a +
l
2
+
sin
10
; l sin
2
5
)
179
due diagonali che originano in ciascun vertice dividono il corrispondente an-
golo interno in tre parti uguali e che alcune coppie di triangoli in gura sono
simili; ad es. i triangoli ARB e ASC. Pertanto
AB
AC
=
AR
AS
Daltra parte si ha AR = AC e AS = AT = AB BT = AB BD =
AB AC e quindi
AB
AC
=
AC
AB AC
Similmente si provano le altre proporzioni.
Assumendo in (9) come unitaria la lunghezza della sezione aurea AP, la
misura dellintero segmento AB viene detta numero aureo e indicata con
. Come consegue immediatamente dalla (9), il numero aureo deve essere
la radice maggiore di 1 dellequazione
(11)
x
1
=
1
x 1
cio`e x
2
x 1 = 0
per cui
(12) =
1 +
5
2
= 1, 618033988 . . .
Inoltre:
(13)
1
= 1 =
5 1
2
= 0, 618033988 . . .
Si osservi che il polinomio in (11) `e proprio il polinomio caratteristico della
successione di Fibonacci che verr`a descritto nel successivo paragrafo. Ma
le relazioni tra numero aureo e successione di Fibonacci non niscono qui.
Si pu`o infatti dimostrare che `e approssimato dal rapporto F
n+1
/F
n
, con
tanta maggior precisione quanto maggiore `e n. In altri termini si ha:
(14) lim
n
F
n+1
F
n
= = 1, 618033988 . . .
e quindi
(14
) lim
n
F
n
F
n+1
=
1
= 1 =
5 1
2
= 0, 618033988 . . .
180
5. Frazioni continue. Il numero aureo `e anche notevole per leleganza
della sua espressione sotto forma di frazione continua:
(15) = 1, 618033988 . . . = 1 +
1
1 +
1
1 +
nonche sotto forma di radice multipla
(16) = 1, 618033988 . . . =
_
1 +
_
1 +
1 +
Proviamo la (15): invertendo la prima delle (11), in cui si sia posto x = ,
si ottiene:
(17) = 1 +
1
,
da cui, sostituendo indenitamente la a denominatore con tutto il secondo
membro di (17), si ottiene
= 1 +
1
= 1 +
1
1 +
1
= . . . = 1 +
1
1 +
1
1+
In modo non molto dissimile si ottiene la (16): si parta da =
1 +.
Possiamo esprimere sotto forma di frazione continua ogni numero reale
a: indicata con a
0
la parte intera di a, la dierenza a a
0
`e minore di 1 e
quindi, a meno che non sia nulla, il suo inverso a
:=
1
aa
0
`e maggiore di 1.
Possiamo scrivere
a = a
0
+
1
a
e ripetere per a
= a
0
+
1
a
1
+
1
a
= . . . = a
0
+
1
a
1
+
1
a
2
+
1
a
3
+
Naturalmente lo sviluppo in frazione continua pu`o venir troncato dopo un
numero nito di passi, ottenendo cos` un numero razionale
(19)
p
n
q
n
= a
0
+
1
a
1
+
1
+
1
a
n
181
che approssima il reale a. Si tratta in eetti di unottima approssimazione,
molto migliore in generale di quella che si ottiene troncando lo sviluppo de-
cimale di a. In un certo senso si tratta anzi della migliore approssimazione
possibile: si dimostra infatti che se il razionale
p
> q
n
(entrambe le frazioni natural-
mente le si suppone ridotte ai minimi termini).
Da ci`o consegue una interessante propriet`a aritmetica del numero au-
reo . Partiamo dalla (18) e dalla (19) per osservare che (a) le a
i
che vi
compaiono essendo parti intere di numeri reali maggiori di 1 sono ovvia-
mente numeri interi maggiori o uguali a 1 e poi che (b) tanto maggiori sono
a
1
, . . . , a
n
tanto pi` u rapidamente, al crescere di n, il numero razionale
p
n
q
n
ap-
prossima il reale a. Tenendo conto del fatto che comunque
p
n
q
n
d`a la migliore
approssimazione possibile, il fatto che nello sviluppo in frazione continua di
le a
i
siano proprio degli 1 ci consente di concludere che il numero aureo
`e in assoluto il numero reale che viene peggio approssimato da numeri razio-
nali. Si noti che, in accordo con la (14), in tale approssimazione compare di
nuovo la successione di Fibonacci:
p
0
q
0
= 1,
p
1
q
1
= 1 +
1
1
=
2
1
,
p
2
q
2
= 1 +
1
1 +
1
1
=
3
2
,
p
3
q
3
=
5
3
,
p
4
q
4
=
8
5
,
p
5
q
5
=
13
8
,
p
6
q
6
=
21
13
,
p
7
q
7
=
34
21
,
p
8
q
8
=
55
34
, . . .
6. Equazioni alle dierenze. La relazione (8) cui soddisfa la succes-
sione di Fibonacci costituisce un caso particolare di una situazione pi` u gen-
erale cui vogliamo ora dedicare qualche rapido cenno. Una data successione
u = (u
0
, u
1
, u
2
, . . . , u
n
, . . .) = (u
n
) viene detta successione ricorrente li-
neare se i suoi termini soddisfano ad una relazione di ricorrenza lineare
a coecienti costanti:
(20) u
n+k
= a
k1
u
n+k1
+a
k2
u
n+k2
+ +a
0
u
n
(per ogni n)
A tale relazione conviene associare il polinomio
(21) g(x) = x
k
a
k1
x
k1
a
k2
x
k2
a
1
x a
0
che viene detto polinomio caratteristico o anche scala di ricorrenza
della u = (u
n
). Ad esempio quello della successione di Fibonacci `e il poli-
nomio g(x) = x
2
x 1. Il polinomio caratteristico `e strettamente legato
alle successioni ricorrenti associate ad esso. Ad esempio, se `e una radice di
g(x), la successione delle sue potenze
1, ,
2
,
3
, . . .
n
, . . .
182
soddisfa alla (20).
Tornando per un attimo al Triangolo di Tartaglia, il lettore `e invitato
a vericare che la sua k-esima colonna `e, al variare di n, una successione
ricorrente lineare avente come scala di ricorrenza il polinomio g(x) = (x
1)
k+1
. Anzi questa scala funziona anche per le colonne che precedono la
k-esima.
La (20) viene anche detta equazione alle dierenze, quando si voglia
esprimere che la u = (u
n
) sia una successione incognita che si cerca di de-
terminare proprio sapendo che soddisfa alla (20). Ci manca ora il tempo di
soermarci su questo aspetto che, pur essendo elementare, occuperebbe da
solo pi` u di una lezione. Dico solo che, facendo uso delloperatore di slitta-
mento E che associa alla successione u = (u
0
, u
1
, u
2
, u
3
, . . .) la successione
Eu = (u
1
, u
2
, u
3
, u
4
, . . .) e quindi anche E
n
u = (u
n
, u
n+1
, u
n+2
, . . .) la
(20) pu`o essere scritta sotto forma di equazione alloperatore E:
(22) g(E)(u) =
_
E
k
a
k1
E
k1
a
k2
E
k2
a
1
E a
0
E
0
_
(u) = 0
Ancora, considerato loperatore dierenza = E I (I `e loperatore
identit`a) che associa alla successione u = (u
0
, u
1
, u
2
, u
3
, . . .) la successione
(u) = (E I)(u) = (u
1
u
0
, u
2
u
1
, u
3
u
2
, u
4
u
3
, . . .), la (22) diventa
lequazione alle dierenze
(23) g(+I)(u) = f()(u) =
_
k
b
k1
k1
b
1
b
0
0
_
(u) = 0
con facile calcolo dei coecienti b
i
in funzione degli a
i
. Linteresse didattico
della (22) o, equivalentemente, della (23), consiste nel fatto che essa rap-
presenta lesatto analogo discreto della equazione dierenziale lineare a
coecienti costanti. In quanto tale, essa `e soggetta a una teoria in tutto e
per tutto analoga a quella che governa queste equazioni dierenziali e quindi
lo studio delle equazioni alle dierenze costituisce un ottima introduzione a
questa parte del calcolo dierenziale. Col vantaggio ulteriore che, contraria-
mente alloperatore di derivazione D, la comprensione delloperatore E (o,
se si preferisce, di ) non richiede prerequisiti.
183
Bibliograa
Non esistomo molti manuali di Algebra che seguano limpostazione scelta
per queste dispense. Tra le opere seguenti, le sole che in qualche modo vi si
avvicinino sono [6] e [10]. Tutte le altre hanno un carattere esclusivamente
indicativo per gli studenti di Algebra 1 che volessero approfondire alcuni
degli argomenti trattati nelle dispense. Ci`o non toglie che siano tutte degli
ottimi manuali, la cui utilit`a non si restringe alla preparazione dei successivi
Corsi di Algebra.
[1] M. Artin, Algebra, Bollati Boringhieri, torino, 1997
[2] L. Comtet, Analyse combinatoire, Presses Univeritaires de France,
Paris, 1970
[3] G.H. Hardy, E.M. Wright, An Introduction to the Theory of Numbers,
Oxford University Press, Oxford, 1979
[4] I.N. Herstein, Algebra, Editori Riuniti, 1982
[5] L. Koulikov, Alg`ebre et theorie des nombres, Mosca,
Editions MIR,
1982
[6] A. Kurosh, Higher Algebra, Mir Publishers, Mosca, 1972
[7] S. Lang, Algebra, Springer, New York, 2002
[8] F. Le Lionnais (a cura di), Le grands courants de la pens`ee mathema-
tique, Paris, Blanchard, 1962
[9] S. Mac Lane, G. Birgho, Algebra, Mursia, 1975
[10] G.M. Piacentini Cattaneo, Matematica discreta e applicazioni, Zani-
chelli, 2008
[11] D. Wells, Numeri memorabili Dizonario dei numeri matematica-
mente curiosi, Bologna, Zanichelli, 1991
184