You are on page 1of 0

Elementi di

Teoria degli Errori

LORENZO ROI
Edizioni HALPHA

c Edizioni HALPHA. Luglio 2000


Limmagine di copertina rappresenta un particolare dellinsieme di Mandelbrot centrato
in (-1.25355701245029394, 0.344742481317140914) e ingrandito 99.744.425 volte.
Titolo: Schizzi frattali.

PREFAZIONE

In questo lavoro sono esposti alcuni concetti che stanno alla base della teoria classica
della misura e, facendo ricorso a delle esemplicazioni didattiche, vengono presentati i
metodi di trattamento dei dati sperimentali.
Lintendimento ` quello di fornire a studenti della scuola superiore i primi elementi per
e
un corretto approccio alla stima delle misure e delle relative incertezze e quindi favorire
lacquisizione di quei criteri che permettono di valutare la quantit` e la qualit` delle ina
a
formazioni deducibili da un qualunque esperimento scientico. La materia ` sviluppata
e
prevalentemente in modo informale per cui le conoscenze matematiche richieste risultano abbastanza elementari (la funzione esponenziale pur presente, non viene usata nelle
dimostrazioni e non viene utilizzato il calcolo dierenziale).
Rispetto alla versione originaria di queste pagine, oramai risalente ai primi anni Novanta,
sono stati corretti solo alcuni errori e rifatti ex-novo i diversi graci: il testo ` pertanto
e
sostanzialmente immutato. Ancora un grazie a quanti, studenti e colleghi, hanno contribuito al perfezionamento di questo lavoro.

Vicenza, luglio 2000


Lorenzo Roi

INDICE

Capitolo 1
1.1
1.2
1.3
1.4

Introduzione . . . . . . . . . . . . . .
Grandezze siche e loro denizione operativa
Metodo di misura diretto e indiretto . . .
Strumenti e loro caratteristiche . . . . .
Tipi di errore . . . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

1
1
1
2
4

Errori massimi . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Propagazione degli errori massimi . . . . . . . . . . . . . . . . . . .

6
8

Capitolo 2
2.1
2.2

Capitolo 3
3.1
3.2
3.3
3.4

Errori casuali: giusticazione della media


Scarti . . . . . . . . . . . . . . . .
Frequenza e distribuzione degli scarti . .
Funzione di Gauss . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

15
18
19
22

Capitolo 4
4.1

Stima dello scarto quadratico medio

. . . . . . . . . . . . . . . . . . 27

Capitolo 5
5.1
5.2

Analisi dei dati sperimentali (I) . . . . . . . . . . . . . . . . . . . . 30


Analisi dei dati (II) . . . . . . . . . . . . . . . . . . . . . . . . . . 33

Capitolo 6
6.1

Propagazione degli errori statistici

. . . . . . . . . . . . . . . . . . . 38

Capitolo 7
7.1

Metodo dei minimi quadrati (regressione lineare) . . . . . . . . . . . . . 43

iii
7.2
7.3

Coeciente di correlazione lineare . . . . . . . . . . . . . . . . . . . 48


Esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

Capitolo 8
8.1
8.2

Cifre signicative . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Media pesata . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

Appendice
Formule principali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Bibliograa

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

CAPITOLO 1

Lo scopo di queste pagine ` di presentare alcuni metodi di elaborazione dei dati sperie
mentali. Tali metodi hanno una loro precisa sistemazione nella Statistica ma il carattere
prevalentemente operativo che ci si pone suggerisce una esposizione delle nozioni quasi del
tutto priva di rigore formale. Inoltre solo una conoscenza approfondita dellAnalisi Matematica, del Calcolo Combinatorio e della Teoria delle Probabilit` assicura gli strumenti
a
concettuali opportuni per una deduzione formale delle idee esposte.
Tuttavia nei limiti di una trattazione introduttiva, verranno arontati importanti concetti
probabilistici e presentate con il supporto di numerosi esempi, le relative metodologie.
Dove sar` possibile si forniranno anche delle dimostrazioni formali o quanto meno delle
a
giusticazioni.

1.1

Grandezze siche e loro denizione operativa

`
E noto che il concetto di grandezza sica si ritiene specicato quando risulta possibile
associare in modo univoco attraverso un gruppo ben preciso di operazioni, un numero,
la misura di questa grandezza sica. La grandezza sica ` pertanto denita operativae
mente dal corrispondente gruppo di operazioni e questo ne costituisce il procedimento di
misura.*
Da ci` discende lattenzione che si deve porre alle operazioni concrete che si svolgono
o
in laboratorio, alla loro successione temporale, agli strumenti adoperati cos` da ridurre

le sempre presenti ambiguit` che ostacolano la riproducibilit` delle esperienze e che,


a
a
vedremo, disperdono il loro contenuto informativo e la loro oggettivit`.
a
Loperazione di misura di una grandezza sica pu` essere condotta in due modi diversi:
o
con il metodo di misura diretto o con quello indiretto.

1.2

Metodo di misura diretto e indiretto

Nel modo diretto la grandezza sica che si vuole misurare viene confrontata con unaltra
a questa omogenea scelta come campione. Questultima `, come sappiamo, convenzioe
* Si veda il cap. 1 di P. Bridgman: La logica della Fisica moderna e per una rassegna critica di tale
posizione il cap. 4 di K. Lambert, G. Gordon: Introduzione alla Filosoa della Scienza.

Strumenti e loro caratteristiche

nalmente assunta come unit` di misura. Per quanto accennato sopra, un tale confronto
a
assume un signicato operativo solo se si ` stabilito preventivamente cosa signica per
e
due grandezze essere denite uguali o che una ` il doppio o il triplo dellaltra. Il
e
risultato che esprime tale confronto ` un numero, la misura della grandezza in esame.
e
Pertanto una grandezza sica risulta caratterizzata dalla sua dimensione (lunghezza,
tempo, . . .) e dalla sua misura associata alla relativa unit` (per es. 3 metri,. . .).
a
Daltra parte lo scopo principale per chi voglia arontare lo studio di un fenomeno ` quello
e
di ricercare, se possibile, delle relazioni tra le grandezze siche coinvolte cos` da denire

delle leggi che riescano a spiegare * in qualche modo levidenza sperimentale. Dal punto
di vista classico si vorrebbe che queste leggi determinassero delle rigide concatenazioni di
cause ed eetti. Altre volte invece, si desidera vericare se eventuali previsioni teoriche
siano o meno coerenti con lesperienza.
Comunque in ogni caso, le grandezze siche sono legate tramite delle relazioni matematiche ad altre grandezze: per esempio, volendo misurare la velocit` media di un corpo ed
a
essendo questa denita come
vm =

s
t

allora, dalla conoscenza dello spazio s percorso nellintervallo t si deduce vm eseguendo


semplicemente il rapporto delle misure di s e t. In ci` consiste il metodo di misura
o
indiretto.
In generale, se la grandezza y dipende dalle grandezze siche x1 x2 , . . . xn , tramite la
legge
y = f (x1 , x2 , . . . xn )
la sua misura si ottiene misurando in modo diretto x1 , x2 , . . . xn ed inserendo queste
determinazioni nella relazione che denisce y. Le x1 , x2 , . . . xn si dicono grandezze
fondamentali e la y grandezza derivata. Lunit` di misura di questultima risulta ssata
a
quando si siano denite le unit` delle grandezze fondamentali: per es. se lunit` in cui si
a
a
esprime s ` il metro m e t il secondo s, avremo per la velocit` lunit` derivata m/s.
e
a
a

1.3

Strumenti e loro caratteristiche

Lesecuzione delle misure avviene utilizzando opportuni strumenti che essendo degli oggetti reali permettono di conoscere il valore della grandezza misurata con una certa
`
indeterminazione. E necessario perci` aver ben presenti le caratteristiche di questi dio
spositivi.
Innanzitutto bisogna tener conto dellintervallo di funzionamento di uno strumento. Difatti ogni strumento ` in grado di fornire delle misure di una grandezza partendo da un
e
valore minimo detto soglia e no ad un valore massimo che ne ` la portata. Lampiezza
e
di questo intervallo dipende dalle sue caratteristiche costruttive e queste sono pure responsabili del fatto che al di fuori di questi limiti la risposta dello strumento ` in genere
e
* Per il concetto di spiegazione, si veda LambertGordon.

Strumenti e loro caratteristiche

alterata cosicch la corrispondenza tra questa e la grandezza da misurare non ore pi`
e
u
sucienti garanzie di riproducibilit`. Spesso difatti si pu` danneggiare lo strumento se
a
o
usato al di fuori dei suoi limiti di funzionamento: si provi a pesare un elefante con una
bilancia pesapersone!
Supponiamo di dover misurare con un calibro il diametro di una sferetta dacciaio: osserviamo che lo zero del cursore sta tra le incisioni che indicano 8 e 9 mm. Diremo che
il diametro d ` compreso tra 8 e 9 mm ossia
e
8 mm < d < 9 mm
o come si usa pi` spesso
u
d = (8,5 0,5) mm.
Analogamente se misuriamo il tempo di caduta della sferetta da unaltezza h = 1 m con
o
un cronometro digitale al centesimo di secondo e troviamo t = 45 102 s, ci` devessere
interpretato in realt` come
a
44,5 102 s < t < 45,5 102 s
ossia
t = (45 0,5) 102 s.
Ci` signica che questi strumenti non sono sensibili per variazioni di questa entit` delle
o
a
grandezze da misurare.
Si denisce pertanto sensibilit` di uno strumento il minimo valore della grandezza che
a
si vuole misurare ancora apprezzabile dallo strumento e lindeterminazione che ne segue
nella misura della grandezza ` detto errore di sensibilit`. Negli esempi presentati lerrore
e
a
di sensibilit` dellunica misura eettuata ` di 0,5 mm per il calibro e 0,5 102 s per il
a
e
cronometro digitale.
Una tale situazione ` generale riscontrandosi per la misura di qualsiasi grandezza sica:
e
il valore di questa non pu` essere conosciuto con una incertezza minore della sensibilit`
o
a
dello strumento usato.
Il passo successivo ` perci` quello di aumentare la sensibilit` degli strumenti. Nel caso
e
o
a
del calibro ci` si realizza aggiungendo il nonio con il quale si pu` eseguire comunemente
o
o
una misura di lunghezza a meno di 1/20 mm (se questo ha un numero di suddivisioni
pari a 20). In tal modo lerrore di sensibilit` diviene l = 0,5/20 = 0,025 mm e se prima
a
una serie di misure forniva i valori
d1 = 8,5 0,5 mm

d2 = 8,5 0,5 mm

ora con una sensibilit` maggiore si ottiene


a

d3 = 8,5 0,5 mm

Tipi di errore

4
d1 = 8,25 0,025 mm

d2 = 8,40 0,025 mm

d3 = 8,45 0,025 mm.

`
E immediato notare la sostanziale dierenza delle due serie. Anche pensando di disporre
di uno strumento ideale estremamente sensibile, ripetendo pi` volte la misura nelle meu
desime condizioni operative si otterrebbero risultati numerici diversi e con un numero
maggiore di cifre diverse quanto pi` piccolo ` lerrore di sensibilit`. La causa di ci` sta
u
e
a
o
da un lato nella impossibilit` pratica di assicurare la riproducibilit` delle operazioni di
a
a
misura essendo queste la manifestazione di un notevole numero di contributi di cui non `
e
possibile tener conto individualmente (si pensi ad es. a tutti gli attriti che un indice mobile trova quando si muove su un quadrante o alle variazioni di lunghezza indotte su un
calibro dal variare della temperatura), e dallaltro nelle variazioni casuali della grandezza
da misurare, fattore questo che implica una non riproducibilit` intrinseca. Basta pena
sare al tempo di caduta di un corpo in un uido e come questo sia inuenzato dallurto
con un elevato numero di particelle in moto disordinato oppure alla corrente elettrica
(funzione della carica e del moto di un gran numero di particelle) per convincersi della
imprevedibilit` dei valori istantanei.
a
Ne segue che il valore vero di una grandezza risulta comunque una entit` che non `
a
e
possibile conoscere: il risultato ` perci` sempre un numero che approssima il valore vero
e
o
della grandezza misurata cio` la misura ` aetta da errori che si manifestano quando la
e
e
loro ampiezza supera lerrore di sensibilit` dello strumento.
a
Una misura non `, in conclusione, mai esatta.
e
La presente trattazione ha lo scopo di introdurre ad una metodologia che, pur rinunciando
sin dallinizio alla conoscenza del vero, dia la possibilit` di stimare lindeterminazione
a
che ` associata ad una serie di misure e quindi fornisca dei criteri per valutare la quantit`
e
a
e la qualit` delle informazioni che da queste si possono dedurre. Lentit` di questa
a
a
indeterminazione fornisce in ultima analisi, lattendibilit` delle misure.
a

1.4

Tipi di errore

Le cause responsabili degli errori sono sempre molteplici ma esse intervengono sulle misure essenzialmente in due modi distinti, originando errori di tipo sistematico o errori
casuali. Lazione degli errori sistematici ` tale da condurre a valori sistematicamente in
e
eccesso o in difetto rispetto al valore eettivo: hanno cio` sempre lo stesso segno.
e
Se per es. utilizziamo una bilancia per determinare la massa di un corpo e questa ha un
braccio leggermente pi` lungo dellaltro, ponendo la massa incognita sul piatto sospeso
u
al braccio pi` lungo, i risultati che si ottengono sono sempre in eccesso rispetto al valore
u
vero.
Cos` se eseguiamo delle misure di lunghezza con il calibro alla temperatura di 0 C, i

valori letti saranno sistematicamente in eccesso in quanto al diminuire della temperatura


il calibro si contrae.
Un altro classico esempio ` quello di un orologio regolato su una frequenza che non `
e
e
quella prevista e pertanto potr` risultare sempre in anticipo o in ritardo.
a
Inne ` a tutti noto che lampiezza delle oscillazioni di un pendolo semplice non ` coe
e
stante ma che diminuisce con il tempo. Daltra parte ` spesso comodo trascurare questa
e

Tipi di errore

osservazione e sviluppare una teoria dove lampiezza ` una costante. Basandoci su quee
sta teoria e andando a misurare lampiezza di oscillazione di un pendolo troviamo dei
risultati costantemente in difetto.
Da questi esempi come da numerosi altri, si deduce che gli errori sistematici possono
essere causati da
a. difetti costruttivi (bilancia),
b. difetti di taratura (orologio),
c. da un non corretto uso condotto in condizioni non previste (calibro),
d. da denizioni teoriche approssimative,
e. da realizzazioni pratiche poco precise dove il fenomeno sico in esame viene mascherato da altri eetti perturbativi (pendolo).
Il ripetere pi` volte la misura nelle medesime condizioni sperimentali non elimina la preu
senza di questo tipo di errore e non ore nessuna garanzia sul loro valore e segno. Spesso
non ` quindi possibile evidenziare questi errori. Daltra parte pur non potendosi elimie
nare del tutto, lindividuazione delle possibili cause permette di ridurre sostanzialmente
il loro peso. Ci` si pu` realizzare perfezionando lo studio teorico del fenomeno mentre in
o
o
generale, per determinarne il valore e segno, vanno eseguite misure alternative con tecniche diverse e con diverse sensibilit`. Lanalisi di questi errori dipende in denitiva dalla
a
preparazione teorica e pratica dello sperimentatore, dalla sua abilit` e dal suo intuito
a
sico.
Gli errori casuali sono dovuti ad un numero elevato di fattori non controllabili e per i
quali non ` possibile unanalisi puntuale. Agiscono in entrambe le direzioni fornendo
e
valori in eccesso o in difetto rispetto al valore vero. Come gi` sottolineato questi si
a
manifestano quando si ripete pi` volte la misura e le uttuazioni di questa sono maggiori
u
dellerrore di sensibilit` dellapparato. Le cause principali possono ricercarsi nel variare
a
incontrollato di alcune condizioni sperimentali come la temperatura, pressione, umidit`,
a
corrente, tensione oppure per la presenza di disturbi originati sia dagli strumenti di
misura che da fattori esterni allesperimento quali vibrazioni, campi elettrici e magnetici,
polvere. . .. Altre volte lerrore ` introdotto dallo stesso sperimentatore che talvolta fa
e
parte dellapparato per es. azionando a mano un cronometro o con lo stimare ad
occhio la posizione di un indice allinterno della pi` piccola divisione dello strumento e
u
tale stima `, evidentemente, soggetta a variare. Inne, cos` come per gli errori sistematici,
e

spesso contribuisce ad errori casuali limprecisione nella denizione della grandezza da


misurare. Per es. la misura del diametro di una sferetta dipende evidentemente dalle
posizioni considerate su di essa non essendo questa perfettamente sferica.
Lo studio di questi errori presuppone lesecuzione di un numero sucientemente alto di
misure, svolte tutte, per quanto possibile, nelle medesime condizioni. Ottenuta la relativa
distribuzione e in base alla teoria che sar` sviluppata, si potranno estrarre dei valori con
a
diversi gradi di attendibilit` e di contenuto informativo.
a
La teoria degli errori che segue riguarda appunto solo gli errori casuali.

CAPITOLO 2

2.1

Errori massimi

Il risultato di una serie di 10 misure del periodo di un pendolo semplice fatte con un
contasecondi `
e
T1 = 3 s
T2 = 3 s
.
.
.
T10 = 3 s.
Come si vede si ` sempre ottenuto lo stesso numero. Se deniamo frequenza f di una
e
certa misura il rapporto che si ottiene fra il numero n di volte che questa si ` presentata
e
con il numero totale N di prove o misure eettuate cio`
e
f=

n
N

si pu` aermare che nel nostro esempio f (3) = 1.


o

frequenza
1

errore
1.0

0.5

0.5

Fig. 1 Distribuzione dellerrore

Errori massimi

Per quanto detto alle sezioni 1.2 e 1.3, non possiamo concludere che il periodo del pendolo
` esattamente T = 3 s cio` credere che la misura eettuata sia priva di errore. Difatti
e
e
chiamando lerrore della misura, ossia la dierenza = T Tv tra la misura T e il
valore vero del periodo Tv , possiamo solo aermare che ogni valore di compreso tra
0,5 s e +0,5 s ` ugualmente probabile in quanto, a causa della sensibilit` dellorologio,
e
a
ogni valore di T tale che 2,5 s T 3,5 s d` lo stesso risultato e quindi ` pure
a
e
esso ugualmente probabile. Se associamo alla frequenza f lasse verticale e ad lasse
orizzontale, la g. 1 rappresenta la distribuzione dellerrore mentre la g. 2 esprime la
distribuzione sperimentale delle misure di T . Una tale situazione si determina ogni qual
volta lerrore di sensibilit` ` maggiore delle uttuazioni dovute agli errori casuali: in tal
ae
modo eventuali informazioni di tipo statistico vengono mascherate dallapparato.

frequenza
1

misure di T
2,5

3,5

Fig. 2 Distribuzione sperimentale.

In generale, quando una certa grandezza x che chiameremo anche variabile casuale assume valori nellintervallo a x b e questi hanno tutti la medesima probabilit` di
a
realizzarsi, la sua funzione di frequenza ` del tipo di g. 3.
e

frequenza
1

misure di x
a

Fig. 3 Distribuzione uniforme.

In tal caso il valore medio della variabile casuale `


e
x=

a+b
2

(2.1)

Propagazione degli errori massimi

e lampiezza dellintervallo [a, b] cio` b a si suole identicare con il doppio dellerrore di


e
sensibilit`
a
2x = b a.

(2.2)

Nellesempio riportato (cos` come in quello di p. 3) ` T = 3 s, T = 0,5 s e la misura va

e
riportata come
T = 3,0 0,5 s.
Lerrore che cos` si associa alla misura viene detto errore massimo e la sua valutazione

costituisce fondamentalmente un riconoscimento della limitata sensibilit` dellapparato


a
usato, sensibilit` che non permette di evidenziare le uttuazioni casuali che lapparato
a
`
e la grandezza in esame comunque possiedono. E ancora questo tipo di errore che si
considera quando la grandezza sica viene misurata una sola volta.

2.2

Propagazione degli errori massimi

Le considerazioni svolte nora ci hanno permesso di associare ad una misura o ad una serie
di misure avente una distribuzione uniforme (g. 3) una stima x sulla loro attendibilit`.
a
Tutto ci` si applica a misure dirette.
o
Daltra parte spesso capita di dover risalire ad una grandezza sica in modo indiretto.
Si pensi ad es. alla dicolt` (!) di misurare direttamente la distanza terrasole oppure
a
la distanza tra due atomi in un reticolo cristallino o ancora la frequenza di un laser elio
neon o la massa della terra. Altre volte ci si trova nelle condizioni di voler vericare se
una certa ipotesi ` coerente con il resto della teoria o con risultati gi` acquisiti per altre
e
a
vie. Allora, ricordando quanto detto a p. 2, alla misura della grandezza y
y = f (x1 , x2 , . . . , xn )

(2.3)

e
si pu` risalire tramite la misura diretta delle xi . Il nostro scopo ` di determinare lerrore
o
y da assegnare alla y a seguito delle incertezze xi presenti sulle xi . Supponiamo per
semplicit` che
a
y = f (x)

(2.4)

ossia che y sia funzione della sola variabile x. Un esempio molto semplice della precedente
`
e
1
x
(2.5)
T =
10
dove x ` il tempo impiegato da un pendolo semplice per compiere 10 oscillazioni e T ` il
e
e
periodo di una oscillazione. Se riportiamo su un piano cartesiano il graco della funzione

Propagazione degli errori massimi

f (x + x)

f (x)
f (x x)

x x

x + x

Fig. 4 Approssimazione lineare ad una funzione.


(2.4), g. 4, poich la x ` conosciuta con un errore x e gli estremi dellintervallo in cui
e
e
essa pu` assumere dei valori sono
o
x + x

x x

(2.6)

f (x x).

(2.7)

in corrispondenza abbiamo i valori


f (x + x)

Se lerrore x ` piccolo, il tratto di curva compreso tra gli estremi indicati in (2.6) si pu`
e
o
confondere con la retta tangente in x e concludere che, poich lampiezza degli intervalli
e
[x x, x], [x, x + x] ` la medesima, in prima approssimazione pu` pure essere uguale
e
o
quella dei corrispondenti valori di y cio`
e
f (x + x) f (x) = f
f (x) f (x x) = f .

(2.7a)
(2.7b)

Sommando membro a membro


f (x + x) f (x x) = 2f,
da cui dividendo per 2 otteniamo
f =

f (x + x) f (x x)
.
2

(2.8)

Notando che nella g. 4 f (x + x) corrisponde al valore massimo di f (x) nellintervallo


[x x, x+ x] indicato come f (max), e f (x x) al minimo f (min), la (2.8) si riscrive
anche

Propagazione degli errori massimi

10

y =

f (max) f (min)
2

(2.9)

Una tale stima dellerrore, detta anche semidispersione massima evidentemente si basa
sullipotesi che gli errori siano piccoli e che perci` si possa linearizzare la funzione f (x)
o
approssimandola ad una retta (le piccole dierenze riscontrabili nella g. 4 diventano cos`

trascurabili). In caso contrario conviene fornirsi di uno strumento pi` preciso (` inutile
u
e
voler misurare la massa di una zanzara con la bilancia pesaelefanti!). Nellesempio (2.5),
noto x con lerrore x allora
f (max) = T1 =

(x + x)
10

f (min) = T2 =

(x x)
10

e il periodo ` noto con lerrore (2.9)


e

1 x + x x x

2
10
10
x
1 2 x
=
.
=
2
10
10

T =

x + x x + x
10
(2.10)

Il passo successivo consiste nellestendere questa analisi a funzioni y pi` generali. Soeru
mandoci alle forme pi` comuni, sia
u
y = x1 + x2 = f (x1 , x2 )
e
con x1 e x2 errori massimi per x1 e x2 . Poich f (x1 + x1 , x2 + x2 ) = (x1 + x1 ) +
(x2 + x2 ) utilizzando la (2.7a) discende

y = (x1 + x1 + x2 + x2 ) (x1 + x2 )
= x1 + x1 + x2 + x2 x1 x2 = x1 + x2 .

(2.11)

e
Se invece ` y = x1 x2 il suo valore massimo ` raggiunto quando il primo termine assume
e
il valore massimo x1 + x1 e il secondo il valore minimo x2 x2 per cui, sempre in
base alla (2.7a)

y = (x1 + x1 ) (x2 x2 ) (x1 x2 )


= x1 + x1 x2 + x2 x1 + x2 = x1 + x2
che ` analoga alla (2.11).
e
Se y = x1 x2 avremo f (max) = (x1 + x1 )(x2 + x2 )

(2.12)

Propagazione degli errori massimi

11

y = (x1 + x1 )(x2 + x2 ) x1 x2
= x1 x2 + x1 x2 + x2 x1 x1 x2
= x1 x2 + x2 x1 .

(2.13)

Per
y=
risulta
f (max) =

x1
x2
x1 + x1
x2 x2

per cui

x1
x1 + x1

x2 x2
x2
x1 x2 + x2 x1 x1 x2 + x1 x2
=
(x2 )2 x2 x2
x2 x1 + x1 x2
=
(x2 )2

y =

(2.14)

dove si ` ritenuto di trascurare x2 x2 nei confronti di (x2 )2 (siamo nellipotesi di errori


e
piccoli nei confronti con la misura).
La generalizzazione delle (2.11) e (2.12) al caso di una somma algebrica di n termini `
e
evidentemente espressa dalla
n

xi

y =

(2.15)

i=1

in cui per la prima volta appare il simbolo


di sommatoria. Lespressione a secondo
membro della (2.15) si legge somma sullindice i da 1 a n dei termini xi , sta in luogo
della somma
n

xi = x1 + x2 + . . . + xn
i=1

e costituisce una notazione molto comoda e sintetica. Nel caso invece delle (2.13) e
(2.14) la generalizzazione diviene pi` comprensibile se si introduce lerrore relativo r
u
della grandezza x, denito come

x
.
x

(2.16)

Propagazione degli errori massimi

12
Allora dividendo la (2.13) per y = x1 x2

x1 x2 + x2 x1
y
x1 x2
x2 x1
=
=
+
y
x1 x2
x1 x2
x1 x2
x1
x2
=
+
x1
x2

(2.17)

e analogamente la (2.14) per y = x1 /x2


x2 x1 + x1 x2 x1
y
=
:
y
(x2 )2
x2
x2 x1 + x1 x2 x2
=

(x2 )2
x1
x2 x1 + x1 x2
x1
x2
=
=
+
x1 x2
x1
x2

(2.18)

da cui segue che, se y ` espressa come prodotto o quoziente di n termini, si giunge alla
e
x1
x2
xn
y
=
+
+ ... +
=
y
x1
x2
xn
ossia

y = y
i=1

xi
xi

i=1

xi
xi

(2.19)

(2.20)

Qualche esempio potr` chiarire lutilit` della (2.15) e della (2.20). Supponiamo di
a
a
voler determinare lerrore sul valore dellaccelerazione di gravit` g dedotto per mezzo
a
dellespressione
g=

4 2 l
T2

(2.21)

dimostrata valida per il pendolo semplice.


Appare evidente che i termini responsabili dellerrore g su g sono la lunghezza l con
il relativo errore massimo l, il periodo T con T e pure in quanto costante non
nota esattamente per la quale si deve usare sempre un valore approssimato: difatti se si
utilizza 3,14 allora = 0,01 in quanto = 3,14 0,01.
Riscritta la (2.21) come
g =4

l
T T

ed essendo 5 i termini che compaiono come fattori nel numeratore e nel denominatore
(4 ` una costante nota esattamente) si ha per la (2.19)
e

Propagazione degli errori massimi

13

l T
T
l
T
g
=
+
+
+
+
=2
+
+2
g

l
T
T

l
T
che per la (2.20) diviene
g = g 2

T
l
+
+2
,

l
T

(2.22)

relazione che esprime la dipendenza funzionale di g dagli errori massimi delle grandezze
, l, T .
Analogamente se si vuole lerrore sul coeciente di dilatazione dei gas , espresso dalla
=

Vf Vi
Vi (tf ti )

notando la presenza dei 3 termini (Vf Vi ), Vi , (tf ti ), per la (2.20)


=

(tf ti )
(Vf Vi ) Vi
+
+
Vf Vi
Vi
tf ti

(2.23)

mentre per la (2.15)


(Vf Vi ) = Vf + Vi = 2V
(tf ti ) = tf + ti = 2t
dove si ` supposto che lerrore sulla determinazione del volume nale Vf ed iniziale
e
e

Vi sia lo stesso cio` Vf = Vi = V cos` come quello sulle rispettive temperature


o
tf = ti = t. In base a ci` la (2.23) assume la forma denitiva
= 2

V
t
V
+
+2
.
Vf Vi
Vi
tf ti

Lultimo esempio fa uso della legge dei punti coniugati


f=

pq
p+q

(2.24)

che d` la lunghezza focale f di una lente sottile. Con la medesima simbologia, essendo 3
a
i termini che compaiono al numeratore e a denominatore p, q, (p + q), per la (2.20)
f = f
che per la (2.15) diviene

(p + q)
p q
+
+
p
q
p+q

Propagazione degli errori massimi

14

f = f

p + q
p q
+
+
.
p
q
p+q

Supponendo ancora che p = q = l in quanto p e q sono delle lunghezze misurate


con il medesimo strumento, si ha
f = f

l
l l
+
+2
.
p
q
p+q

Ricordiamo che un tale modo di procedere ` sostituito ad un livello pi` approfondito


e
u
di conoscenze matematiche da un uso appropriato del concetto di dierenziale di una
funzione. Inne, ulteriori considerazioni sul signicato e limportanza dellerrore relativo
verranno esposte in seguito (cap. 6.1).

CAPITOLO 3

3.1

Errori casuali: giusticazione della media

Ritorniamo a considerare il problema della misura diretta di una grandezza sica G


nellipotesi di disporre di uno strumento con errore di sensibilit` sucientemente piccolo
a
cosicch diventa possibile evidenziare gli errori casuali.
e
Il risultato di N misure sperimentali sar` costituito da x1 , x2 . . . , xN valori numerici tutti
a
ottenuti nelle medesime condizioni sperimentali e con gli stessi strumenti. Lesempio che
ci servir` per sviluppare la teoria degli errori casuali si basa sulla misura della durata di
a
10 oscillazioni di un pendolo semplice, grandezza sica che indicheremo con T10 ma che,
per non appesantire la scrittura di troppi indici, scriveremo pi` semplicemente T . Nella
u
tabella 1 sono riportate 100 determinazioni dirette di T10 , eettivamente ottenute (che
divertimento!) con un comune cronometro digitale.
Appare subito evidente la diversit` dei valori ottenuti, diversit` che fa nascere il problema
a
a
e
di quale valore assegnare alla grandezza sica G (nel nostro caso T10 ): ci chiediamo cio`
u
e
quale `, e lo indicheremo con x, il valore pi` attendibile per G. Non ` possibile ovviamente
e
e
privilegiare un determinato valore xi e scartare gli altri in quanto non c` alcuna ragione
che pu` giusticare tale scelta preferenziale e che dierenzia xi dalle rimanenti N 1
o
a
determinazioni. Il valore x dovr` pertanto dipendere da tutte le xi e in modo che ciascuna
abbia la medesima importanza o peso.
Per ottenere lespressione di x riportiamo in un piano cartesiano i punti (i, xi ) dove
lascissa ` il numero dordine i = 1 . . . N della misura e lordinata ` il valore di questa
e
e
(g. 5). Tracciata una retta parallela allasse delle ascisse, ogni punto avr` da questa
a
una distanza che si ottiene prendendo il valore assoluto della dierenza tra le ordinate
di (i, xi ) e del corrispondente punto H avente la medesima ascissa ma appartenente alla
retta (g. 6).
Assumiamo come ipotesi plausibile che il valore cercato corrisponda a quella retta orizzontale y = x che lascia approssimativamente un egual numero di punti nei due semipiani
in cui essa divide il piano cartesiano: in tal caso y = x interpola nel miglior modo possibile i valori sperimentali. Convenendo di considerare la distanza con segno dei punti
sperimentali da H(i, x) cio`
e

Errori casuali: giusticazione della media

16

Tabella 1: durata di 10 oscillazioni


N
1
2

s
33,39
33,36

N
21
22

s
33,32
33,36

N
41
42

s
33,46
33,39

N
s
61 33,45
62 33,32

N
81
82

s
33,38
33,52

3
4
5

33,31
33,34
33,28

23
24
25

33,46
33,39
33,36

43
44
45

33,45
33,56
33,46

63 33,49
64 33,51
65 33,28

83
84
85

33,28
33,35
33,41

6
7
8

33,36
33,57
33,54

26
27
28

33,36
33,35
33,46

46
47
48

33,46
33,40
33,51

66 33,37
67 33,52
68 33,53

86
87
88

33,52
33,51
33,47

9
10
11

33,47
33,35
33,48

29
30
31

33,49
33,38
33,41

49
50
51

33,41
33,47
33,46

69 33,50
70 33,41
71 33,48

89
90
91

33,49
33,53
33,60

12
13

33,54
33,35

32
33

33,43
33,56

52
53

33,49
33,49

72 33,53
73 33,53

92
93

33,56
33,52

14
15
16

33,40
33,49
33,43

34
35
36

33,72
33,34
33,34

54
55
56

33,62
33,58
33,50

74 33,63
75 33,43
76 33,41

94
95
96

33,44
33,49
33,45

17
18
19

33,36
33,40
33,54

37
38
39

33,51
33,51
33,42

57
58
59

33,39
33,38
33,59

77 33,50
78 33,38
79 33,52

97
98
99

33,54
33,52
33,47

20

33,56

40

33,50

60

33,45

80 33,57

100

33,54

zi = xi x,

i punti con xi > x avranno cos` una distanza positiva dalla retta mentre gli altri che
appartengono al semipiano inferiore possiederanno distanze negative. Lipotesi fatta
richiede quindi che la somma delle distanze di tutti i punti sia nulla ossia che i punti
appartenenti a semipiani opposti abbiano lo stesso peso. Ne segue
N

(xi x) = 0

xi

i=1

i=1

xi N x = 0

x=0
i=1

(3.1)

i=1

dove si ` utilizzata la propriet` associativa della somma (es. [4 x] + [2 x] + [5 x] =


e
a
4 x + 2 x + 5 x = [4 + 2 + 5] [x + x + x] = [4 + 2 + 5] 3x). Dalla terza delle (3.1)
discende
N

N x=

xi
i=1

x=

xi
N i=1

(3.2)

Errori casuali: giusticazione della media

17

MISURE di T10 (s)


33.7
33.6
33.5
33.4
33.3
33.2
0

10

20

30

40

50

60

70

80

90

100

Numero dordine
Fig. 5 Diagramma a dispersione dei dati sperimentali.

MISURE di T10 (s)


33.7
33.6
33.5
H

33.4
33.3
33.2
0

10

20

30

40

50

60

70

80

90

100

Numero dordine
Fig. 6 Distribuzione dei dati.
che risolve il problema iniziale: il valore pi` attendibile per la grandezza G non ` altro
u
e
che la media aritmetica delle N determinazioni.
In modo alternativo e con luso di concetti dellAnalisi Matematica (si veda anche il
metodo dei minimi quadrati, cap. 7.1) possiamo giungere a x supponendo che questo sia
il valore che rende minima la quantit` D(x) = (xi x)2 dove per la prima volta si sono
a
sottintesi gli estremi della somma . Per determinare il minimo della funzione D(x) `
e
suciente calcolare la sua derivata prima e porla uguale a zero:

D (x) =

2(xi x)(1) = 0

(xi + x) = 0

:2

Scarti

18
(xi ) + N x = 0

xi + N x = 0

Nx =

xi

da cui, dividendo per N , si riottiene la (3.2).

3.2

Scarti

Per quanto detto iniziamente, al valore appena ottenuto x ` necessario associare anche
e
e
una stima dellerrore. Se quindi xv ` il valore vero della grandezza G, lerrore di una
singola misura xi sar`
a
i

e lerrore

= xi xv

(3.3)

da attribuire a x `
e

= x xv =

1
N

xi xv =
=

1
xi N xv
=

N
N

(xi xv )
(3.4)

Daltra parte gli errori i possono essere sia positivi che negativi per cui la somma a
secondo membro della (3.4) sar` tanto pi` vicina allo zero tanto maggiore ` il numero
a
u
e
N delle misure, per cui tende a zero allaumentare di N . La media aritmetica quindi
approssima il valore vero tanto meglio quanto pi` numerose sono le misure ottenute.
u
e
e
Purtroppo (e succede sempre cos` il valore vero xv non ` noto (e non ` conoscibile), per
!)
cui anche le espressioni relative agli errori delle misure e della media (3.3, 3.4) rimangono
incognite e sono inutilizzabili.
Una quantit` che invece ` conosciuta ` lo scarto dalla media della i-esima misura e questo
a
e
e
` denito come
e
zi = xi x.
Confrontato con la (3.3), se N ` grande, zi dovrebbe approssimare lerrore
e
sottraendo membro a membro la (3.3) con la (3.5)
i

zi = xi xv (xi x) = xi xv xi + x = x xv

(3.5)
i:

difatti

(3.6)

che per la (3.4) risulta


i

zi = ,

(3.7)

relazione che mostra come uno scarto qualsiasi dierisca dallerrore della corrispondente
misura di una quantit` costante che ` lerrore della media. Se perci` il numero N `
a
e
o
e
sucientemente grande N , allora 0 e lo scarto ore una buona valutazione
dellerrore di cui ` aetta la singola misura.
e

Frequenza e distribuzione degli scarti

19

Conviene inne ribadire una notevole propriet` degli scarti che inizialmente ci ` servita
a
e
per ottenere il valore medio di una variabile casuale e che ci sar` utile in seguito (sezione
a
4.1).
Dalla prima delle (3.1) risulta che la somma di tutti gli scarti delle N misure
zi =

(xi x) = 0.

e
zi `
(3.8)

La somma degli scarti rispetto alla media di tutte le misure ` pertanto nulla.
e

3.3

Frequenza e distribuzione degli scarti

Vediamo di approfondire operativamente le conclusioni del paragrafo precedente, ottenendo la distribuzione delle 100 misure della tabella 1.
Per far ci` ` necessario denire lampiezza x degli intervalli entro i quali raggruppare le
oe
misure ottenute. Se lerrore di sensibilit` dello strumento ` S ` ovvio che non potremo
a
e
e
ridurre lampiezza a valori x < 2S. Difatti nel nostro caso essendo S = 0,5 102
s, lampiezza minima ` x = 1 102 s cio` di un centesimo di secondo. Contando il
e
e
numero n di volte che si ` ottenuta una certa misura x (per es. n = 7 per 33,49 e n = 4 per
e
33,38) e dividendolo per il numero totale di queste (in questo caso N = 100) otteniamo
la frequenza sperimentale con cui questa si ` presentata. Riportiamo in ascissa i diversi
e
intervalli ampi x e costruiti i rettangoli aventi la base x e altezza pari alla frequenza
n/N , otteniamo listogramma di g. 7 che rappresenta la distribuzione sperimentale
cercata.

0.07
FREQUENZA f
0.06
0.05
0.04
0.03
0.02
0.01
0
33.25 33.30 33.35 33.40 33.45 33.50 33.55 33.60 33.65 33.70
Valori di T (s)
Fig. 7 Istogramma sperimentale x = 0,01 s.

20

Frequenza e distribuzione degli scarti

`
E evidente la dierenza sostanziale con la distribuzione uniforme di p. 7 e come in
questultima siano presenti delle uttuazioni nella frequenza in funzione dei valori ottenuti dalle misure.
Unaltra caratteristica rilevabile dallistogramma di g. 7 ` che le misure sono in qualche
e
modo raggruppate ossia la frequenza delle misure che dieriscono dai valori centrali
dellistogramma tende a zero. Scegliendo un x = 2102 s e procedendo analogamente
nel determinare la frequenza di misure che cadono in intervalli di tale ampiezza (per
es. n = 9 per le misure comprese nellintervallo [33,50; 33,51]), si ottiene listogramma
e
rappresentato dalla g. 8. Cos` se x = 3 102 s il risultato dellelaborazione `
,
listogramma di g. 9 (es. n = 6 se [33,55; 33,57]).
FREQUENZA f
0.10
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
33.25 33.30 33.35 33.40 33.45 33.50 33.55 33.60 33.65 33.70
Valori di T (s)
Fig. 8 Istogramma sperimentale x = 0,02 s.

Da questi tre istogrammi si pu` notare come allaumentare dellampiezza dellintervallo


o
x vadano scomparendo i dettagli della distribuzione, come si riducano le uttuazioni
statistiche della frequenza e come questa assuma valori sempre pi` prossimi ad uno (si
u
noti la scala verticale).
Difatti, nel caso estremo, supponendo di disporre di un orologio con errore di sensibilit`
a
di 0,5 s per cui lampiezza minima sar` x = 1 s, la distribuzione sperimentale sarebbe
a
risultata uniforme (g. 10) e ogni informazione di origine statistica non avrebbe potuto
manifestarsi.
Considerando il valor medio T = 33,46 s e riportandolo come retta verticale x = T ,
possiamo ora specicare maggiormente il carattere della distribuzione trovata. Questa
mostra una tendenza a disporsi in modo simmetrico attorno al valor medio, ossia la
frequenza assume valori approssimativamente simmetrici rispetto alla retta x = T .
In secondo luogo, i valori x della grandezza misurata (riportati in ascissa) che dieriscono
maggiormente dal valor medio, hanno una frequenza che tende allo zero. Utilizzando la

Frequenza e distribuzione degli scarti

21
FREQUENZA f

0.16
0.14
0.12
0.10
0.08
0.06
0.04
0.02

0
33.25 33.30 33.35 33.40 33.45 33.50 33.55 33.60 33.65 33.70
Valori di T (s)
Fig. 9 Istogramma sperimentale x = 0,03 s.

FREQUENZA
1

misure di T
34,00

33,00

Fig. 10 Istogramma sperimentale x = 1 s.

nozione di scarto zi = xi x (nel nostro caso zi = Ti T ), la frequenza degli scarti


maggiori tende allo zero o in altre parole, gli scarti maggiori risultano meno frequenti.
Questultima aermazione suggerisce anche un altro modo per ottenere le distribuzioni
sperimentali dei dati. Anzich riportare in ascissa i valori delle misure che cadono in
e
intervalli di una certa ampiezza e ottenerne poi la frequenza f , si calcola il valor medio
x e quindi lo scarto zi di ciascuna misura. Fissata una certa ampiezza z si ottiene la
frequenza f = n/N con cui gli scarti sono compresi negli intervalli (0, z), (z, 2z) . . . ;
(z, 0), (2z, z) . . .
La rappresentazione fornisce ancora istogrammi del tutto analoghi a quelli gi` visti.
a
Difatti, gli istogrammi degli scarti non sono altro che i precedenti dopo che si ` eseguita
e
la traslazione tra il sistema cartesiano di coordinate (x, f ) al nuovo sistema di ascissa
e
z = x x e medesima ordinata. La nuova origine ` posta in O (x, 0) (g. 11).

Funzione di Gauss

22

FREQUENZA f
0.10
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
0.21 0.16 0.11 0.06 0.01 0.04 0.09 0.14 0.19 0.24
Scarti dal valor medio (T = 33,46 s)
Fig. 11 Istogramma degli scarti.

3.4

Funzione di Gauss

Le distribuzioni discrete ottenute nel paragrafo precedente rappresentano la frequenza


e
relativa con cui una misura xi ` compresa nellintervallo [x, x + x].
Supponiamo ora di eseguire un numero molto alto di misure (N ) e di poter ridurre
le ampiezze x degli intervalli allo zero (x 0). Ciascun valore x si presenta un
numero n(x) di volte. In tali ipotesi si dimostra* che listogramma delle frequenze
n(x)
N
assume una distribuzione continua caratterizzata dalla funzione limite

f (x) =

(x xv )2
22

(3.9)

e tale che
n(x)
= f (x) x.
N

(3.10)

La f (x) si chiama funzione di Gauss o legge normale e moltiplicata per x esprime la


frequenza con cui il valore di una misura x ` compreso nellintervallo [x, x + x].
e
Se deniamo come probabilit` p(x) di un evento x il valore limite verso cui tende la
a
frequenza
* D. Valenza: La misura sica con elementi di teoria degli errori.

Funzione di Gauss

23
n(x)
N

quando

N +

e in termini formali
p(x) =

n(x)
N + N
lim

allora dalla (3.10)


p(x) = f (x) x

(3.11)

e potremo dire che la f (x) x


d` la probabilit` di ottenere una misura x compresa nellintervallo [x, x + x]. Geomea
a
tricamente la (3.11) si pu` interpretare come larea del rettangolo di base x e altezza
o
f (x) (g. 12).
FREQUENZA
f (x)
p(x)
variabile casuale x
x
Fig. 12 Rappresentazione geometrica di p(x).

Pi` in generale, larea compresa tra le due rette verticali x = x1 , x = x2 , la curva e lasse
u
delle ascisse, d` la probabilit` di ottenere una misura x compresa in
a
a
x1 x x2 .
e
Tale informazione sar` scritta come P (x1 x x2 ). Poich dalla (3.11)
a
p(x)
= f (x),
x
si dice che la funzione di Gauss esprime una densit` di probabilit`. Essa ` determinata
a
a
e
e
completamente una volta che si siano ottenuti i 2 parametri xv e . Il primo ` il valore
vero della grandezza che, per quanto gi` detto, si pu` confondere con la media aritmetica
a
o
xv x

Funzione di Gauss

24

mentre ` detto scarto quadratico medio o deviazione standard (s.q.m. o standard dee
viation = s.d.) ed ` un numero positivo denito dalla
e
2 =

( i )2
N

(3.12)

( i )2
N

(3.13)

(che si dice varianza) cio`


e

u
dove gli i sono deniti dalla (3.3). Pi` avanti daremo una stima della (3.13) ottenuta
sulla base dei dati sperimentali.
Le caratteristiche fondamentali della distribuzione normale (3.9) sono riassunte dal graco di g. 13.

FREQUENZA f

0.20

0.15

0.10

0.05

0
0

4
5
6
variabile casuale

10

Fig. 13 Distribuzione gaussiana.

e
Laspetto ` quello di una campana, simmetrica rispetto alla retta x = xv . Poich > 0
e
e lesponenziale della (3.9) pure, allora f (x) > 0 e la curva giace nel semipiano delle
ordinate positive. Cos` se x , f (x) 0 ossia
,
lim f (x) = 0,

e perci` f (x) si avvicina asintoticamente allasse x che risulta il suo asintoto orizzontale.
o
La curva raggiunge in x = xv il valore massimo
f (x) =

(3.14)

Funzione di Gauss

25

che dipende da in modo inversamente proporzionale.


Se si considerano poi i punti aventi ascisse x , si ha che per
a
a. xv < x < xv + il graco di f (x) ha la concavit` rivolta verso il basso,
ae
b. x < xv e x > xv + la concavit` ` rivolta verso lalto:
e
x = xv sono cio` due punti di esso. Sostituendo xv + nellespressione (3.9) si trova
che lordinata di questi punti sta nel rapporto
3
1

e
5
con quella del massimo, il che signica che i punti di esso stanno circa a 3/5 dellaltezza
totale. Con queste informazioni possiamo tracciare diverse gaussiane relative ciascuna
a dierenti valori di e al medesimo valor medio (g. 14).

FREQUENZA f
=3
=2
=1
= 0.5

0.6

0.4

0.2

0
0

4
5
6
variabile casuale

10

Fig. 14 Gaussiane relative a diversi valori di .

Per la (3.14) risulta evidente che al diminuire di la curva si contrae attorno al valor
medio e si innalza. La dispersione dei valori attorno a xv e quindi la precisione delle
misure ` in qualche modo rappresentata dallo scarto quadratico medio che per tale
e
ragione ` detto anche indice di precisione. Una gaussiana con grande cio` abbastanza
e
e
larga sar` indice di una misura poco precisa, mentre al contrario se la distribuzione `
a
e
molto addensata attorno al valor medio, ` piccolo e la misura risulta molto precisa
e
(vedi anche cap. 4.1).
`
Inne nella g. 15 compaiono varie gaussiane relative a diversi valori medi. E immediato
notare come questo parametro determini la posizione della curva sullasse x tanto che,
analogamente a quanto detto per gli istogrammi, si pu` ottenere la distribuzione teorica
o

Funzione di Gauss

26

FREQUENZA f

0.20

media = 5
media = 7
media = 9

0.15

0.10

0.05

0
0

6
7
8
9
variabile casuale

10

11

12

13

14

Fig. 15 Gaussiane relative a diversi valori medi.


degli scarti attorno allo zero eseguendo nientaltro che la traslazione x xv = z. La (3.9)
assume cos` la forma

f (z) =

z2
2
e 2 .

(3.15)

CAPITOLO 4

4.1

Stima dello scarto quadratico medio

Lo scopo che ci proponiamo in questo capitolo ` di tradurre le formule presentate nel


e
precedente in espressioni che partendo dai dati sperimentali, forniscano delle stime dei
parametri caratterizzanti la distribuzione gaussiana, cos` da poter confrontare i diversi

istogrammi sperimentali con la curva di Gauss generata dalla serie di dati.


Lespressione (3.4) non ` operativamente utilizzabile per due motivi: N ` limitato e gli
e
e
non sono noti in quanto ` ignoto il valore vero xv contenuto in essi (vedi sezione 3.3).
e
i
Daltra parte abbiamo dimostrato che una buona stima di xv risulta essere la media
e

aritmetica x da cui ` possibile risalire agli scarti zi (deniti dalla 3.5). Cos` lerrore di
una singola misura ` legato agli scarti dalla (3.7) che riscriviamo come
e
i

= zi + .

Quadrando
( i )2 = (zi + )2 = (zi )2 +

+ 2 zi

e sommando ciascuno di questi errori (come sempre da 1 a N ), otteniamo


( i )2 =
poich per la (3.8),
e

(zi )2 +

+ 2 zi =

(zi )2 + N

zi = 0,
( i )2 =

(zi )2 + N

da cui dividendo per N


( i )2
=
N

(zi )2
+
N

+2

zi

Stima dello scarto quadratico medio

28
cio`, ricordando la (3.12)
e

(zi )2
+
N

2 =

(4.1)

Questa fornisce lo scarto quadratico medio in funzione degli scarti e del quadrato dellerrore della media che risulta essere una grandezza ancora incognita (vedi 3.4, 3.7). Eseguendo il quadrato della (3.4) ed esplicitando le somme
( )2 =
=

N2

1
(
N2

2
N)

1
( 1 )2 + ( 2 )2 + . . . + (
N2

+2

1 2

+2

1 3

+ ... +

2
N)

+ ...

da cui
( )2 =

1
N2

( i )2 + (2

1 2

+2

1 3

+ . . .) .

a
Essendo gli i sia positivi che negativi ed avendo quasi la medesima probabilit` di manifestarsi in quanto la curva di Gauss ` simmetrica, possiamo supporre che
e
2

1 2

+2

1 3

+ ... 0

per cui, sempre per la (3.12)


( )2 =

N2

( i )2 =

( i )2
2
=
.
N
N

(4.2)

Introdotta nella (4.1)


2
(zi )2
+
N
N

2 =
ed esplicitando , si ottiene
2 1

1
N

(zi )2
N

cio`
e

N 1
=
N

(zi )2
N

2 =

(zi )2
N 1

che conduce alla fondamentale espressione


=

(zi )2
.
N 1

(4.3)

Le quantit` che compaiono a secondo membro sono ora tutte note perch deducibili dai
a
e
dati sperimentali.

Stima dello scarto quadratico medio

29

Confrontando la (4.1) con il quadrato della (4.3), se N ` preso sucientemente grande,


e
allora N N 1, 0 e per la (3.7) zi i , per cui la dierenza tra queste espressioni
tende ad annullarsi.
Dalla (4.2) discende unaltra importante relazione. Se si calcola tramite la (4.3), lerrore
della media di tutta la serie di misure, che si deduce estraendo la radice quadrata di (4.2),
` espresso dalla
e

2
=
N
N

(4.4)

(zi )2
N (N 1)

(4.5)

o pi` esplicitamente, per la (4.3)


u

dove si ` preferito introdurre il nuovo simbolo per distinguere lespressione nota (4.5)
e
dal valore incognito .
Chiameremo errore (o scarto) quadratico medio della media in quanto si pu` dimostrare
o
che se si eseguono diverse serie di misure e si va a studiare la distribuzione dei valori medi
ottenuti nellambito di ciascuna serie, questa ` ancora un istogramma avente come
e
scarto quadratico medio.
Per esempio, se i 100 dati della tabella 1 anzich ottenuti in ununica serie, si fossero
e
ottenuti in 10 diverse serie, si potrebbe studiare come si distribuiscono i valori medi di
ciascuna (110, 1120, . . . 91100). Questi formano listogramma di g. 16 avente come
errore quadratico medio (collegato allo scarto di ciascuna serie dalla 4.4).

FREQUENZA f
0.4
0.3
0.2
0.1
0
33.35

33.40

33.45
33.50
33.55
Variabile casuale valori medi (s)
Fig. 16 Istogramma delle medie

CAPITOLO 5

5.1

Analisi dei dati sperimentali (I)

Siamo ora in grado di confrontare listogramma sperimentale ottenuto da un insieme di


misure con la curva di Gauss generata da queste. A tal ne, ` suciente:
e
a. ssare nella (3.10) lintervallo x, di valore identico a quello che ` stato scelto per
e
costruire listogramma,
b. determinare in base alle (3.2) e (4.3) x e ,
c. sostituirli nella (3.9).
Per esempio, la serie rappresentata dalla tabella 1 implica
T = 33,456 s

= 0,086 s

per cui la distribuzione generata da queste stime e con x = 0,01, ` espressa dalla
e

n(T )
=
N

1
e
0,086 2

(T 33,456)2
2 (0,086)2

0,01

(5.1)

e possiede il graco di g. 17, dove si ` riportato il corrispondente istogramma sperimene


tale di g.7.
Cambiando nella (5.1) solo lampiezza dellintervallo x si deducono per x = 0,02 s e
x = 0,03 s rispettivamente i graci delle gg. 18 e 19. Risulta pertanto immediato confrontare ladattamento della curva allistogramma e valutare se le misure hanno seguito
una distribuzione normale.
`
E pure utile a questo punto mostrare come con pochi dati le distribuzioni sperimentali
abbiano scarso contenuto informativo. Difatti, considerando i soli primi 10 dati della
tabella 1, cio` supponendo di aver fatto solo 10 misure, si deducono da queste x = 33,40
e
e = 0,097 che, con x = 0,05, forniscono listogramma e la curva di Gauss di g. 20.
Tenendo presente la scala dellasse verticale, risultano evidenti le notevoli uttuazioni

Analisi dei dati sperimentali (I)

31

FREQUENZA f
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
33.25 33.30 33.35 33.40 33.45 33.50 33.55 33.60 33.65 33.70
Valori di T (s)
Fig. 17 Istogramma e relativa distribuzione x = 0,01 s.

FREQUENZA f
0.10
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
33.25 33.30 33.35 33.40 33.45 33.50 33.55 33.60 33.65 33.70
Valori di T (s)
Fig. 18 Istogramma e relativa distribuzione x = 0,02 s.

rilevabili dal confronto tra listogramma e la gaussiana. Per quanto detto e visto, tali
uttuazioni diminuiscono allaumentare di N .
In alternativa a questo metodo graco ` possibile vericare laccordo delle due distribue
zioni utilizzando la denizione di errore medio. Questo si denisce come

Analisi dei dati sperimentali (I)

32

0.16

FREQUENZA f

0.14
0.12
0.10
0.08
0.06
0.04
0.02
0
33.25 33.30 33.35 33.40 33.45 33.50 33.55 33.60 33.65 33.70
Valori di T (s)
Fig. 19 Istogramma e relativa distribuzione x = 0,03 s.

FREQUENZA f
0.30
0.25
0.20
0.15
0.10
0.05
0
33.20

33.25

33.30

33.35

33.40

33.45

33.50

33.55

33.60

Valori di T10 (s)


Fig. 20 Istogramma e distribuzione delle prime 10 misure.

a=

| i|
=
N

|xi xv |
.
N

Se N ` abbastanza grande una sua stima ottenuta in base ai dati sperimentali pu` essere
e
o
a=

|zi |
N

(5.2)

Analisi dei dati (II)

33

e poich nellambito della teoria accennata si pu` dimostrare che tra lerrore medio a e
e
o
lo scarto quadratico medio sussiste la relazione

=
a

(5.3)

allora ` suciente calcolare il rapporto /a in base ai dati e vericare la bont` dellape


a
prossimazione al numero /2. Per esempio nel caso di N = 100 si ottiene a = 0,070 s
che implica il valore

= 1,23
sper.

in buon accordo con

1,25.

Per le prime 10 misure invece

= 0,95
sper.

che dierisce sensibilmente dal valore aspettato di 1,25.


Altri metodi pi` elaborati (ad es. luso del chiquadro < 2 >) forniscono tests magu
giormente signicativi ma escono dai limiti di tale trattazione.*

5.2

Analisi dei dati (II)

Ricordando che larea sottesa dalla curva di Gauss tra le rette x = x1 e x = x2 esprime
e
la probabilit` P che una misura xi sia compresa tra questi due estremi (p. 23) cio`
a
P (x1 xi x2 )
diviene allora conveniente conoscere le seguenti probabilit` (dora in poi sostituiremo a
a
xv , x)

P (x xi x + )

P (x 2 xi x + 2)

P (x 3 xi x + 3)

* Per la stima del 2 si vedano i testi: P. R. Bevington: Data reduction and Error Analysis for the
Physical Sciences, M. Loreti: Teoria degli Errori e fondamenti di Statistica, M. Severi: Introduzione
alla Esperimentazione Fisica.

Analisi dei dati (II)

34
FREQUENZA f

0.20

0.15

0.10

0.05

0
5 4 3 2 1 0

3 4 5 6 7 8
variabile casuale

9 10 11 12 13 14

Fig. 21 Intervallo di semiampiezza 1 ( = 2, x = 5).

FREQUENZA f

0.20

0.15

0.10

0.05

0
5 4 3 2 1 0

3 4 5 6 7 8
variabile casuale

9 10 11 12 13 14

Fig. 22 Intervallo di semiampiezza 2 ( = 2, x = 5).


rispettivamente rappresentate dalle regioni delle gg. 21, 22, 23.
Si trova che
P (x xi x + ) = 0,6827
P (x 2 xi x + 2) = 0,9545
P (x 3 xi x + 3) = 0,9973
Ci` signica che la probabilit` di ottenere una misura interna allintervallo x xi
o
a
x + ossia che dierisca in valore assoluto dal valor medio per una quantit` inferiore o
a

Analisi dei dati (II)

35

FREQUENZA f

0.20

0.15

0.10

0.05

0
5 4 3 2 1 0

3 4 5 6 7 8
variabile casuale

9 10 11 12 13 14

Fig. 23 Intervallo di semiampiezza 3 ( = 2, x = 5).


e
eguale allo scarto quadratico medio |xi x| (o analogamente |zi | ) ` del 68%.
Per lo stesso motivo, una misura cadr` nellintervallo
a
[x 2, x + 2] circa il 95% delle volte (|zi | 2)
mentre in
[x 3, x + 3] approssimativamente il 99,7% (|zi | 3).
Da queste osservazioni comprendiamo come lo scarto quadratico medio costituisca un
parametro utile a denire lattendibilit` di una singola misura e come fornisca un criterio
a
per decidere se una data misura con un determinato scarto sia accettabile o meno.
Difatti se eseguiamo un numero limitato di misure la probabilit` di ottenerne una con
a
uno scarto maggiore di 3 ` decisamente trascurabile (0,3%), per cui se si presenta una
e
tale eventualit` possiamo supporre che una qualche causa ignota abbia inuenzato la
a
determinazione e quindi modicato le condizioni sperimentali (pu` essere, e spesso lo
o
`, una distrazione delloperatore). In tal senso la misura va scartata e necessariamente
e
vanno ricalcolati x e .
Analogamente potremo accettare solo le misure con scarto inferiore a 2 e riutare quelle
con scarto maggiore che hanno una probabilit` di vericarsi solo del 5%.
a
Nellesempio del pendolo, se scegliessimo di accettare i valori compresi nellintervallo
x 2 x x + 2 cio` 33,29 x 33,63 allora andrebbero scartate 3 misure uguali
e
a 33,28 e quella pari a 33,72.
In generale stabilita la regione di accettazione (g. 24) in base a considerazioni sul numero
N di misure eseguite e sul valore di , si elaborano denitivamente solo quei dati che
vi sono compresi, calcolando per essi la nuova media e il nuovo scarto quadratico . Il

Analisi dei dati (II)

36

0.07
FREQUENZA f
0.06
0.05
0.04
0.03
0.02
0.01
0
33.25 33.30 33.35 33.40 33.45 33.50 33.55 33.60 33.65 33.70
Valori di T (s)
Fig. 24 Zona di accettazione: la semiampiezza ` pari a 2.
e
numero totale delle misure sar` evidentemente quello che si ottiene trascurando quelle
a
riutate.
`
E sulla base di queste considerazioni che si giustica il modo di presentare il risultato di
una serie di misure della grandezza x.
Sapendo che la miglior stima del valore vero ` la media aritmetica x, vorremmo ora
e
conoscerne la sua attendibilit`. Ricordando che (p. 29) rappresenta lo scarto quadratico
a
medio della distribuzione dei valori medi ottenuti in diverse serie di misure e che, per le
(4.4, 4.5), questo ` noto anche senza eettivamente eseguire questo insieme (decisamente
e
lungo!) di misure essendo suciente conoscere lo s.q.m. dellunica serie realizzata, se
riportiamo il risultato nella forma
x =x

(5.4)

signica aermare che la probabilit` che lintervallo


a
[x , x + ]
contenga la media di una nuova serie di misure ` del 68,27%. Di norma questo intervallo
e
si considera quello entro il quale si ipotizza cada eettivamente il valore vero e viene
detto intervallo di attendibilit`. In corrispondenza si usa dire che x ha un livello di
a
condenza del 68%. Se invece si sceglie
x = x 2
evidentemente il livello di condenza sale al 95%.

Analisi dei dati (II)

37

Lerrore (o scarto) quadratico medio della media assume cos` un signicato fondamentale

in quanto collegato alla probabilit` che ha il valor medio di dierire dal valore vero della
a
grandezza.

In base alla (4.4), poich ` N volte minore di , possiamo concludere che il valor
e e

medio ha una precisione N volte maggiore di quella della singola misura.

CAPITOLO 6

6.1

Propagazione degli errori statistici

Nella sezione 2.2 abbiamo discusso della propagazione degli errori massimi nel caso di
misure indirette della grandezza sica y, funzione delle ulteriori grandezze x1 , x2 , . . . , xn ,
cio`
e
y = f (x1 , x2 , . . . , xn ).
`
E necessario ora denire come lindeterminazione associata a ciascuna x1 , x2 , . . . , xn ed
espressa dal relativo scarto quadratico medio 1 , 2 , . . . , n , si propaga sulla y.
Riprendendo lesempio di p. 12 sul calcolo dellaccelerazione di gravit` tramite delle mia
sure di tempo e di lunghezza, supponiamo di conoscere gli scarti quadratici medi del
periodo T , della lunghezza l e, naturalmente, il periodo medio T e la lunghezza media
`
l. E abbastanza evidente che la misura di g si otterr` sostituendo questi valori medi nella
a
espressione
g=

4 2 l
.
T2

Ci` signica che in generale il valor medio di una grandezza y = f (x1 , x2 , . . ., xn ), y, si


o
e
otterr` sostituendo alle grandezze x1 , x2 , . . . , xn i rispettivi valori medi cio`
a
y = f (x1 , x2 , . . . , xn ).

(6.1)

Il problema sta invece nel determinare lo scarto quadratico medio di y. Il caso pi`
u
semplice della (6.1) ` una dipendenza del tipo
e
y = kx
e
dove k ` una costante nota esattamente. Si ha y = kx e poich
e

Propagazione degli errori statistici

39

(zi )2
N 1

y =

e
con zi = yi y, discende zi = kxi kx = k(xi x) cio`
k2 (xi x)2
=
N 1

y =

k2

(xi x)2
= |k|
N 1

(xi x)2
N 1

che per la (4.3) si riduce alla


y = |k|x .

(6.2)

Se invece
y = x1 x2
e y = x1 x2 , si dimostra che
y =

(x1 )2 + (x2 )2 .

(6.3)

Analogamente se compaiono 3 o pi` addendi


u
y = x1 x2 . . . xn
la (6.3) si generalizza nella
(x1 )2 + (x2 )2 + + (xn )2 .

y =

(6.4)

Nel caso di un prodotto, la formula che si ottiene diviene pi` semplice se si denisce
u
lerrore relativo (di origine statistica) della grandezza sica y come il rapporto
r (y)

y
.
y

(6.5)

Si dimostra allora che se


y = (x1 ) (x2 ) (xn )

(6.6)

si ha
r (y)

y
=
y

r (x1 )

r (x2 )

+ +

Qualche esempio potr` chiarire luso di questultima espressione. Se


a

r (xn )

(6.7)

Propagazione degli errori statistici

40

y=

x1
= (x1 )1 (x2 )1
x2

da cui
y
=
y

x
1 1
x1

x
+ 1 2
x2

x1
x1

x2
x2

Cos` se

g=

4 2 l
T

= (4 2 ) l (T )2

abbiamo
g
=
g

l
l

T
+ 2
T

l
l

T
T

+4

+4

T
T

da cui lo scarto quadratico medio della g

g = g

l
l

Le (6.4) e (6.7) orono pertanto le leggi di propagazione degli errori per le dipendenze
funzionali pi` semplici.
u
Capita spesso che, in una misura indiretta di y, alcune grandezze da cui questa dipende,
siano caratterizzate da errori statistici ed altre da errori massimi. Per esempio nel calcolo
di g la misura della lunghezza l del pendolo semplice ` stata fatta una sola volta con un
e
metro trovando
l = (278,1 0,1) cm.
Lerrore l = 0,1 ` pertanto un errore massimo. In tali casi la formula da utilizzare `
e
e
quella degli errori massimi (2.20), (2.22) dove per` gli errori di origine statistica sono stati
o
opportunamente trasformati in errori massimi. Poich la probabilit` che un valore della
e
a
grandezza x cada allesterno di un intervallo centrato sul valore medio e di semiampiezza
e
o
e
pari a 3x ` trascurabile, si pu` identicare questo valore come lerrore massimo x cio`
x = 3x .

(6.8)

Siamo ora in grado di completare lesposizione dei risultati del nostro esempio. Difatti
ricordando che le misure della tabella 1 si riferiscono alla grandezza T10 , discende per il
periodo di una oscillazione T

Propagazione degli errori statistici


T 10 = 10 T

T =

1
T 10
10

41

T =

33,456
= 3,3456 s
10

e in base alle (5.1) e (6.2) lo scarto quadratico di una oscillazione `


e
T =

0,086
= 0,0086 s,
10

lerrore massimo che si deduce dalla (6.8)


T = 3 (0,0086) = 0,0258 s,
per cui laccelerazione media risulta
g=

4 2 (278,1)
cm
= 980,9 2 .
(3,3456)2
s

Dalla (2.22), assegnando al termine g il valore medio trovato, discende

g = g 2

T
l
+2
+

T
l

= 980,9

0,026
0,1
+2
278,1
3,3456

(6.9)

= 980,9 3,6 104 + 1,6 102 = 15,6 cm/s2

(6.10)

che approssimiamo a 16. In denitiva risulta


2

g = (981 16) cm/s .


Lutilit` dellerrore relativo ` abbastanza evidente se si osserva la struttura della (2.20) e
a
e
della (6.7). Difatti ` completamente inutile misurare con precisioni estreme e quindi con
e
notevole impegno di tempo e di mezzi una certa grandezza sica, quando lerrore relativo
di unaltra risulta molto maggiore della prima. Per esempio nella (6.10), il maggiore
dei due termini ` quello relativo al periodo ed ` perci` inutile cercare di spingere la
e
e
o
misura della lunghezza a valori pi` precisi quando laltro termine che contribuisce ` circa
u
e
40 volte meno accurato. Lattenzione eventualmente va posta nel ridurre ulteriormente
questa componente dellerrore.
In generale si cercher` di mantenere un certo equilibrio in modo che le varie componenti
a
degli errori relativi siano confrontabili e compatibili con gli eventuali fattori moltiplicativi.
`
E sulla base di tali considerazioni che nella (6.9) converrebbe misurare il periodo con una
accuratezza maggiore: difatti questo dovrebbe avere un errore relativo 2 volte pi` piccolo
u
di quello sulla lunghezza.

42

Propagazione degli errori statistici

Concludiamo accennando pure allerrore percentuale. Questo ` evidentemente denito


e
come
(6.11)
% = 100 r
e ad esso si possono facilmente estendere le considerazioni fatte per

r.

CAPITOLO 7

7.1

Metodo dei minimi quadrati (regressione lineare)

Finora abbiamo arontato i problemi connessi alla stima dei valori pi` probabili di una
u
grandezza sica x e della loro incertezza, supponendo che le condizioni sperimentali,
per quanto possibile, non variassero durante il rilevamento dei dati. In caso contrario,
abbiamo pure discusso sulla necessit` di riutare la misura.
a
Capita molto spesso per` di dover eseguire una serie di N misure di una grandezza y,
o
e
funzione di unaltra quantit` x, in modo tale che ciascuna misura yi ` stata ottenuta in
a
o
corrispondenza di un valore diverso xi . Si dispone perci` di un insieme di N coppie
(x1 , y1 ), (x2 , y2 ), . . . , (xN , yN )
di dati sperimentali. Per esempio le yi potrebbero rappresentare gli spazi si percorsi da
un carrello in un moto rettilineo uniforme e rilevati nei corrispondenti istanti ti xi ,
e
oppure le tensioni Vi misurate ai capi di una resistenza quando questa ` attraversata
dalla corrente Ii o ancora le pressioni Pi (o volumi Vi ) di un gas assunte alle diverse
temperature ti .
In generale y sar` funzione di x e di un certo numero di parametri a, b, c, . . .
a
y = f (x, a, b, c, . . .)

(7.1)

che si suppongono indipendenti da x e da y e che durante la raccolta dei dati rappresentano


delle grandezze siche costanti. Questo fatto dierenzia sostanzialmente lespressione
sopra (7.1) da quelle simili (2.3) trattate nei paragra riguardanti la propagazione degli
errori. Il problema che si vuole arontare consiste nello stimare nel miglior modo possibile
questi parametri.
Supponiamo perci` di disporre di una serie di N coppie di misure. In tal modo a ciascuna
o
si pu` far corrispondere sul piano cartesiano di assi x e y il punto Pi (xi , yi ), (g. 25),
o
cosicch` abbiamo sul piano un certo insieme di punti, detto diagramma a dispersione. Se
e
ci limitiamo allo studio di una relazione lineare tra y e x del tipo

Metodo dei minimi quadrati (regressione lineare)

44

variabile y

4
3
2
1
variabile x
1

10

Fig. 25 Diagramma a dispersione per due grandezze siche e retta interpolante.

y = ax + b

(7.2)

allora ci` che dobbiamo determinare ` la migliore stima di a e b, ossia determinare quella
o
e
retta che approssima nel miglior modo possibile i dati sperimentali o, come si suol dire,
quella che meglio interpola i dati. A tal ne dobbiamo denire univocamente un criterio
per tale scelta.
Supponiamo di aver tracciato una retta y = ax + b interpolante i dati di g. 25. In
e
corrispondenza di ciascun punto Pi (xi , yi ) ` possibile determinare la distanza di dalla
retta e questa ` espressa dalla
e
di =

|yi (axi + b)|

1 + a2

(7.3)

Se non si considera il valore assoluto si ha che di > 0 se il punto sta sopra la retta
e
(ossia lordinata yi ` maggiore dellordinata del punto avente la medesima ascissa xi ma
appartenente alla retta) e di < 0 se P appartiene al semipiano inferiore. Allora, ad ogni
possibile retta del piano si pu` associare un numero reale D ottenuto sommando tutti i
o
e
valori di cio`

D=

di =

1
=
1 + a2

yi (axi + b)

1 + a2
yi (axi + b) .

(7.4)

Per quanto gi` detto circa la media aritmetica, la retta che meglio interpola i dati dovr`
a
a
mediamente assegnare la stessa importanza ai punti che appartengono ai semipiani opposti in cui ` diviso il piano cartesiano per cui la somma delle distanze dei punti che
e

Metodo dei minimi quadrati (regressione lineare)

45

stanno nel semipiano superiore devessere uguale a quella ottenuta dai punti appartenenti allaltro semipiano. Ci` signica richiedere che la somma (7.4) valga zero
o
D=

1
1 + a2

yi (axi + b) = 0

che implica
yi (axi + b) = 0.

(7.5)

Questo risultato equivale alla richiesta che la somma delle dierenze tra le ordinate dei
punti ottenuti sperimentalmente yi e quelli aventi la medesima ascissa ma appartenenti
alla retta cercata, sia nulla.
Daltra parte questa condizione non assicura da sola la soluzione del problema in quanto
vi compaiono 2 grandezze incognite a e b. Vi possono pertanto essere pi` rette che soddiu
sfano alla (7.5) per cui va ricercata unulteriore restrizione. Se quindi, detta deviazione
delli-esima misura la dierenza
yi (axi + b)
consideriamo il suo quadrato
2

yi (axi + b) ,
possiamo ritenere che questo fornisca una qualche misura dellentit` che separa la
a
e
coppia di dati (xi , yi ) dallandamento ideale. Pertanto ` ragionevole supporre che la retta
cercata sar` tanto pi` prossima allinsieme dei dati sperimentali tanto pi` la somma dei
a
u
u
quadrati delle singole deviazioni (che individueremo con S)
S=

yi (axi + b)

(7.6)

sar` minima. La seconda condizione si ottiene perci` ricercando il valore minimo della
a
o
quantit` S (da ci` deriva il nome del metodo, noto come metodo dei minimi quadrati).
a
o
Sviluppando il quadrato a secondo membro della (7.6)
S=
=

(yi axi b)2


(yi )2 + a2 (xi )2 + b2 2axi yi 2byi + 2abxi

e, tenute presenti le propriet` associativa e distributiva


a
S=
= a2

(yi )2 +

a2 (xi )2 +

(xi )2 2a

b2

xi yi + 2ab

2axi yi
xi +

2byi +

(yi )2 2b

2abxi
y i + N b2

Metodo dei minimi quadrati (regressione lineare)

46
si ottiene
S = a2

(xi )2 2a

xi yi b

(yi )2 2b

xi +

y i + N b2 .

La relazione sopra evidenzia lincognita a e possiede la forma tipica di una parabola


e
(y = ax2 + bx + c) nella variabile a. Poich il coeciente di a2 risulta (xi )2 > 0,
S volge la concavit` verso lalto e il suo valore minimo ` raggiunto in corrispondenza
a
e
e
dellascissa del vertice (xV = b/2a) cio`
2
a=

xi yi b
2

xi yi b

xi
=

(xi )2

xi
.

(xi )2

Questultima condizione, con la (7.5), costituisce il sistema


yi (axi + b) = 0
a

xi yi b

(xi )2 =

xi

che permette la soluzione del problema. Difatti, riscrivendo la prima equazione come
yi (axi + b) =
=

yi a

yi a

xi

xi N b = 0

e la seconda in
xi y i a

(xi )2 b

xi = 0,

esplicitando dalla prima b


b=

xi

yi
N

(7.7)

e sostituita nella seconda


xi y i a

(xi )2

xi
N

yi
N

xi = 0

xi y i a

(xi )2 +

xi
N

yi

xi
N

= 0,

moltiplicando per N
N

xi y i a N

da cui si pu` estrarre a


o

(xi )2

xi

yi

xi = 0

Metodo dei minimi quadrati (regressione lineare)


xi y i

N
a=

xi

yi
.

(xi )2

47

(7.8)

xi

Sostituendo nella (7.7)

b=

xi y i

xi

yi

(xi )2

yi
xi
+
N
N

xi

eseguendo il minimo comun denominatore

b=

xi y i

xi +

N N
N

xi

yi
2

(xi )2

xi
2

(xi )2

yi

yi

xi

+
N N

(xi )2

xi

discende
b=

xi y i
N N

xi +

(xi )2

yi
2

(xi )2

xi

e in denitiva
yi
b=
N

(xi )2
(xi

)2

xi yi

xi
2

(7.9)

xi

Le (7.8) e (7.9) costituiscono le espressioni fondamentali cercate. Con metodi che esulano
dalla seguente trattazione ` anche possibile stimare lindeterminazione di a e b. Difatti
e
nellipotesi che y sia lo scarto quadratico medio comune di tutte le misure della variabile
y e supposto trascurabile quello della variabile indipendente x, si dimostra* che lo scarto
quadratico medio di a e b `
e

a =

N
y

(7.10)
2

b =

(xi )
y

(7.11)

* Si veda G. Castelnuovo: Calcolo delle probabilit`, e le gi` citate opere di P. R. Bevington, M. Severi
a
a
e M. Loreti.

Coeciente di correlazione lineare

48
dove si ` posto
e

(xi )2

=N

7.2

xi

Coeciente di correlazione lineare

Le formule precedenti permettono di determinare in ogni caso la retta di regressione


o
per un insieme di N coppie di valori (x1 , y1 ), (x2 , y2 ), . . ., (xN , yN ). Daltra parte pu`
capitare che la distribuzione dei dati stessi non suggerisca alcuna correlazione oppure
che una correlazione lineare tra le grandezze x e y sia troppo semplice e restrittiva: in
questi casi tale procedimento non avrebbe motivo di essere applicato. Trascurando quei
casi macroscopici dove un legame lineare viene escluso gi` in base a considerazioni tratte
a
dallevidenza graca della dispersione delle coppie (xi , yi ) sul relativo piano cartesiano (le
misure non giacciono ragionevolmente vicino ad una retta), consideriamo come esempio
uneventualit` pi` dubbia e problematica.
a u

Tabella 2
N tempo spazio
s
cm
1
1,57
20

tempo2
s2
2,46

N
6

tempo spazio
s
cm
2,36
45

tempo2
s2
5,57

2
3
4

1,75
1,91
2,07

25
30
35

3,06
3,65
4,28

7
8
9

2,49
2,62
2,74

50
55
60

6,20
6,86
7,51

2,22

40

4,93

10

2,86

65

8,18

La tabella 2 riassume una serie di misure degli spazi percorsi da un carrello su rotaia
a cuscino daria e i tempi impiegati a percorrerli. Il carrello, collegato tramite un lo
sottile ad un pesetto, veniva trainato da questo con partenza da fermo. Disponendo in
ascissa i tempi (ti ) e in ordinata gli spazi (yi ) (consideriamo trascurabili gli errori sulla
misura del tempo), si ottiene il diagramma di g. 26.
Conoscendo le leggi del moto uniformemente accelerato valide in questo caso, (e quindi
usando lesperienza come una conferma di nozioni gi` note) un legame lineare tra y e t
a
va escluso mentre risulta corretto quello quadratico cio` y = (1/2)at2 . Inversamente, se
e
la legge devessere indotta dai dati sperimentali, c` la necessit` di valutare quale dei due
e
a
andamenti (o altri pi` complicati eventualmente ipotizzabili) spieghi nel modo migliore
u
la distribuzione osservata.
In denitiva si vuole chiarire se
a. le variazioni della grandezza y siano o meno correlate con quelle della quantit` x,
a
b. due grandezze siano legate da una relazione lineare.
Per quanto discusso nella precedente sezione se la quantit` y ` linearmente dipendente
a e
dalla grandezza x cio` entrambe soddisfano alla
e

Coeciente di correlazione lineare

49

spazio percorso (cm)


60
50
40
30
20
10
1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9
tempo t (s)
Fig. 26 Spazio in funzione del tempo in un moto uniformemente accelerato.

y = ax + b,

(7.12)

allora il coeciente angolare a ` dato dalla (7.8) e il termine noto b dalla (7.9). Se
e
non ci fosse alcuna correlazione tra y e x allora i valori di y non dovrebbero mostrare
alcuna tendenza ad aumentare o a diminuire allaumentare di x. La quantit` y pertanto
a
dovrebbe rimanere costante al variare di x ossia il coeciente angolare a della (7.12)
dovrebbe essere nullo e la retta dei minimi quadrati sarebbe parallela allasse delle x. A
prima vista quindi il termine a potrebbe fornire unindicatore del grado di correlazione,
a costo comunque di rinunciare a discriminare quelle correlazioni dove il termine stesso `
e
prossimo allo zero. Daltra parte, cos` come abbiamo ipotizzato un legame del tipo (7.12)

` possibile considerare che il legame tra i dati sia del tipo


e
x=ay+b,

(7.13)

e, nellipotesi di variabili correlate, i valori a, a , e b, b saranno in relazione uno con


laltro.
Difatti nel caso di una correlazione lineare esatta la (7.13) si riscrive come
y=

b
1
x ,
a
a

(7.14)

per cui confrontata con (7.12) implica


a=

1
a

b=

b
a

(7.15)

da cui discende che


aa = 1.

(7.16)

Esempi

50

Nel caso opposto di nessuna correlazione, le osservazioni precedenti rimangono valide e


risulta
a=a =0

ossia

aa = 0.

Ne segue che il prodotto aa fornisce un parametro adeguato alla stima del grado di
correlazione, pertanto, poich dalla (7.13) in modo del tutto analogo e simmetrico a
e
quanto fatto precedentemente discende
xi yi

N
a =
N

xi

yi
,

(yi )2

(7.17)

yi

si pu` denire come coeciente di correlazione lineare r il termine


o
xi y i

N
r=
N

(xi

)2

xi
2

xi

yi
(yi

)2

(7.18)

yi

e
dove, anzich il prodotto aa si ` preferito considerare la sua radice quadrata. In tal caso
e
i valori di r appartengono allintervallo [1, +1] e se
1. r 0 allora i punti non sono correlati e non mostrano alcuna tendenza a disporsi in
prossimit` di una retta,
a
2. r +1 oppure r 1, le coppie di misure suggeriscono una interpolazione lineare.
Va pure notato che il segno di r ` il medesimo di quello di a e a anche se, per quanto
e
esposto, le informazioni principali si ottengono osservando quanto il valore assoluto di r
si avvicina a 1.
Conviene inne ribadire i limiti di quanto esposto e cio` come le nozioni presentate siano
e
solo una introduzione intuitiva ai minimi quadrati. Difatti la sola deduzione formale
delle formule richiede conoscenze speciche di Analisi Matematica (derivate parziali,
dovendo determinare le condizioni sotto le quali la somma di quadrati [yi (axi + b)]2
possiede il valore minimo) che esulano dai programmi tradizionali delle scuole superiori.
Analogamente ulteriori possibili considerazioni sulla probabilit` che un certo insieme di
a
misure conduca a valori di r maggiori o eguali a quanto determinato sperimentalmente
tramite la (7.18) esulano dallo scopo di tali note, in quanto richiedono approfondite
conoscenze di Statistica.

7.3

Esempi

Diamo qualche esempio sulluso delle relazioni denite nei precedenti due paragra.
ESEMPIO 1.
In un moto rettilineo uniforme di un carrello su una rotaia a cuscino daria si sono
ottenute le seguenti (tabella 3) coppie di dati.

Esempi

51

Tabella 3
N tempo spazio

tempo spazio

s
0,09

cm
5

s
0,56

cm
30

2
3
4

0,19
0,28
0,38

10
15
20

7
8
9

0,66
0,75
0,84

35
40
45

0,47

25

10

0,93

50

spazio percorso (cm)


50
40
30
20
10
0
0

0.1

0.2

0.3

0.4 0.5 0.6


tempo t (s)

0.7

0.8

0.9

Fig. 27 Spazio percorso in funzione del tempo in un moto rettilineo uniforme.

Riportando in ascissa il tempo t e in ordinata lo spazio y, linsieme dei punti rappresentativi (g. 27) suggerisce, anche visivamente, una correlazione di tipo lineare: dalla
teoria ` y = vt. Se quindi, in base alla (7.8) si calcola la velocit` v si trova
e
a
v = 53,6 cm/s.
Considerando lerrore sul posizionamento dei due traguardi ottici pari a y = 0,1 cm e
ritenuto trascurabile quello sul tempo, la (7.10) fornisce
v = 0,1 cm/s.
Il calcolo del coeciente di correlazione conduce al risultato
r = 0,9999

Esempi

52

che conferma, con il suo valore prossimo ad 1, lottima correlazione lineare dei dati. La
velocit` di tale moto uniforme ` quindi v = (53,6 0,1) cm/s.
a
e
ESEMPIO 2.
In una serie di misure di tensione V e corrente I attraverso una resistenza R incognita
si sono ottenuti i dati della tabella 4 e riportati nel graco di g. 28.

Tabella 4
N tensione corrente
V
A
1
0,2
0,2
2
0,4
0,34
3
4
5

0,5
0,6
0,8

6
7
8

1
1,2
1,5

N
9
10

tensione
V
2
2,5

corrente
A
1,97
2,49

0,48
0,58
0,75

11
12
13

2,8
3
3,5

2,81
2,98
3,48

0,89
1,2
1,49

14
15

3,8
4

3,79
4

tensione (V)
4
3
2
1
0
0

0.5

1.0

1.5

2.0
2.5
corrente i (A)

3.0

3.5

4.0

Fig. 28 Misure di corrente e tensione attraverso una resistenza.

La teoria aerma che V = RI: possiamo perci` in base al metodo dei minimi quadrati
o
determinare R utilizzando la (7.8), dove le xi corrispondono alle misure di corrente e le
yi a quelle di tensione. Si trova
R = 0,99

Esempi

53

Lo scarto quadratico medio di R si ottiene dalla (7.10), supposti trascurabili gli errori
a
sulla corrente e identicando V con lerrore di sensibilit` del voltmetro (V = 0,05 volt),
per cui
R = 0,044 .
Il coeciente di correlazione risulta
r = 0,9998
e ci` conferma come una correlazione di tipo lineare sia ben seguita dai dati. In denitiva
o
si ha
R = (0,99 0,04) .

ESEMPIO 3
Riprendiamo lesempio introduttivo del paragrafo 7.2 e basato sulla tabella 2 di dati. Se si
suppone una interpolazione lineare dei dati della forma y = vm t + y0 con vm interpretata
come velocit` media, e ssato un errore sulla posizione y di y = 0,1 cm, si ottiene
a
vm = 34.97 cm/s
vm = 0,08 cm/s
r = 0,9978.
Daltra parte sappiamo che landamento lineare non ` quello corretto in questo caso
e
e che la teoria svolta nora non permette di stabilire direttamente ladattamento tra
e
la corretta legge quadratica y = (1/2)at2 e i dati. In tal caso comunque ` possibile
con opportune posizioni linearizzare la dipendenza funzionale in modo tale da poter
applicare il metodo esposto. Se quindi si pone la grandezza in ascissa pari a x t2 (si
veda la tabella 2 e la g. 29), la legge quadratica assume una forma lineare y = (1/2)ax
e la nuova interpretazione implica i risultati
a = 15,71 cm/s
a = 0,03 cm/s
r = 0,9999.

Emerge con evidenza come tale linearizzazione porti ad un coeciente r molto prossimo
ad 1 e quindi come landamento quadratico sia preferibile ad uno lineare.
ESEMPIO 4.
Inne, nello studio sperimentale della legge di Boyle si sono rilevati i seguenti valori
(tabella 5) per il volume V e la pressione P di un gas mantenuto a temperatura costante.

Esempi

54
spazio percorso (cm)
60
50
40
30
20
10
0
0

3
4
5
6
2
tempo al quadrato t (s2 )

Fig. 29 Linearizzazione della dipendenza quadratica.

Tabella 5
N

pressione
105 Pa
1,07

volume
106 m3
10,7

volume
106 m3
7,63

pressione
105 Pa
1,50

2
3
4

10,2
9,36
8,57

1,12
1,22
1,33

7
8
9

7,04
6,75
6,30

1,63
1,70
1,80

8,11

1,41

10

5,67

2,00

Poich la dipendenza funzionale corretta ` del tipo P V = K con K costante, la teoria


e
e
` comunque possibile una linearizzazione di tale dipensvolta ancora non ` applicabile. E
e
denza se si denisce la nuova variabile y 1/V . La legge diviene pertanto y = (1/K)P
e se, per motivi connessi alle caratteristiche dellapparato sperimentale usato, si assegna
P = 150 Pa, si trova
K = 1,129 Pa m3
K = 0,002 Pa m3
r = 0,9997.
Anche in tal caso r ` prossimo ad 1 per cui la dipendenza ipotizzata risulta sucientee
mente giusticata. La g. 30 esprime la distribuzione dei dati e la loro proporzionalit`
a
inversa (con riferimento al sistema di assi (P, V )), mentre la g. 31 rappresenta i dati
linearizzati nel sistema di assi (P, 1/V ).

Esempi

55
volume (106 m3 )
11
10
9
8
7
6
5
4
1

1.1

1.2

1.3

1.4

1.5 1.6 1.7 1.8


pressione (105 Pa)

1.9

2.0

Fig. 30 Proporzionalit` inversa della pressione e del volume.


a

1/volume (105 m3 )
1.75
1.50
1.25
1.00
0.75
0.50
0.25
0
1

1.1

1.2

1.3

1.4

1.5

1.6

1.7

1.8

1.9

2.0

pressione (10 Pa)


Fig. 31 Linearizzazione della relazione inversa tra pressione e volume.

CAPITOLO 8

8.1

Cifre signicative

Abbiamo visto nei capitoli precedenti come ogni misura sia aetta da un errore e come
sia possibile sviluppare dei metodi per misurare questa indeterminazione.
Esprimere pertanto la misura di una grandezza sica con un numero arbitrariamente
grande di cifre, non solo complicherebbe inutilmente le cose ma soprattutto signicherebbe considerare nulla lindeterminazione che, come detto, le ` sempre associata. Anche
e
per gli errori e per gli stessi motivi, risulta scorretto esprimere la loro entit` con un
a
numero eccessivo di cifre, tanto pi` se si tiene presente il signicato probabilistico che `
u
e
stato loro assegnato.
Pertanto, supponendo di aver misurato la durata T di un certo fenomeno e di aver trovato
un risultato aetto dallerrore di
T = 0,01 s,
risulta scorretto voler esprimere la misura di T con un numero di cifre superiori a quelle
permesse dallindeterminazione di un centesimo di secondo, cos` come non ` esatto indi
e
carne un numero inferiore.
Esemplicando ulteriormente, sia
T = 13,2 s
che
T = 13,274582 s,
sono scritture non accettabili in quanto la prima, non indicando la cifra corrispondente
ai centesimi ` insuciente nel contenuto informativo, e la seconda propone cifre prive di
e
signicato (pura fantasia!).

Cifre signicative

57

Nellesprimere quindi una misura ` necessario riportare il risultato con un numero di cifre
e
corrispondente alla entit` dellerrore, ossia alla precisione eettivamente ottenuta. A tale
a
scopo, si conviene di scrivere lerrore con non pi` di due cifre signicative e la misura,
u
con un numero di cifre tale che, la cifra relativa alla potenza minore di 10 (cio` quella che
e
si scrive pi` a destra) abbia lo stesso esponente di quella che le corrisponde nellerrore. In
u
altre parole, la misura dovr` avere un numero di cifre tale che quella scritta pi` a destra
a
u
occupi lo stesso posto, rispetto alla virgola, di quella che sta pi` a destra nellerrore.
u
Nellesempio precedente si dovr` scrivere
a
T = (13,27 0,01) s
in quanto le cifre, 1 nellerrore, e 7 nella misura, sono relative alla medesima potenza
(2) di 10 (le altre non hanno signicato). In tal modo si potr` scrivere
a
m = (423,2 0,3) g
ma non
m = (423,20 0,3) g
essendo la cifra 0 della misura relativa alla potenza 2 di 10, mentre la cifra 3 dellerrore
corrisponde allesponente 1.
In tal modo anche gli zeri dopo la virgola hanno un preciso signicato, tanto pi` rilevante
u
se si tiene presente che spesso viene sottintesa lindicazione dellerrore. In questi casi si
conviene di considerare lerrore uguale allunit` sullultima cifra scritta. Ne segue che le
a
aermazioni
T1 = 24,8 s

T2 = 24,80 s

possiedono un signicato sostanzialmente diverso, essendo di 0,1 lerrore su T1 e di 0,01


su T2 . Esplicitamente queste corrispondono alle scritture
T1 = (24,8 0,1) s

T2 = (24,80 0,01) s

In generale, determinato (con una o due cifre signicative) lerrore da assegnare alla misura (ottenuta direttamente o pi` spesso indirettamente tramite il calcolo) si eliminano
u
le cifre eccedenti seguendo la convenzione esposta sopra ma lasciando come ultima quella
che si avvicina maggiormente a quelle tolte. Per esempio se x = 0,003 e la corrispondente misura ` x = 6,257369 (in questo caso, visto il numero di cifre decimali, signica
e
che ` stata calcolata e non ottenuta direttamente), dovremo mantenere tre cifre decimali
e
ma essendo la quarta un 3 che ` < 5, allora si scriver`
e
a
x = 6,257 0,003
mentre se fosse stato x = 7,231737, si sarebbe scritto

Media pesata

58
x = 7,232 0,003
in quanto 7 > 5.

Da questi esempi e dalle elaborazioni presentate nei capitoli precedenti, si comprende


come il risultato di una misura o di una serie di misure possa (ma non sempre lo `, per
e
motivi di maggior immediatezza) assumere la forma generale
x = (x, x1 x2 x3 . . . xn1 xn e) 10k u
dove x ` una cifra diversa da zero, x1 x2 x3 . . . xn1 xn rappresentano le eventuali cifre
e
decimali della misura, ed e lerrore che si scrive come
e = 0,00 . . . 0en1 en ,
scrittura che evidenzia le cifre decimali incerte, la (n 1)-esima e la n-esima.
Il fattore 10k con k = 0, 1, 2 . . . costituisce il termine caratteristico della notazione
scientica, spesso conveniente quando il numero ` molto grande o molto piccolo e pere
mette di riconoscere immediatamente lordine di grandezza k della misura. Inne u
rappresenta lunit` di misura e le n + 1 cifre (la x pi` le n cifre decimali) rappresentano
a
u
le cifre signicative della misura.
Seguendo questa notazione laccelerazione di gravit` g ottenuta a p. 41 va scritta
a
g = (9,81 0,16) 102 cm/s2
o anche
2

g = (9,81 0,16) m/s .


Analogamente, le grandezze discusse negli esempi del capitolo precedente, vanno riportate
come
v = (5,36 0,01) 101 cm/s,
R = (9,9 0,4) 101 ,
a = (1,571 0,003) 101 cm/s2 ,
K = (1,129 0,002) Pa m3 .

8.2

Media pesata

Vogliamo inne arontare il problema della stima di una certa grandezza sica x, relativa
allo stesso fenomeno, e della quale disponiamo di un certo numero di misure xi , ottenute
per` in contesti diversi e indipendenti e quindi ciascuna aetta da un diverso errore
o
statistico ossia da un diverso scarto quadratico medio della media i . Si vuole pertanto

Media pesata

59

combinare le diverse determinazioni in modo tale che ciascuna misura sia opportunamente
pesata cos` da ottenere una migliore stima per la grandezza in oggetto.

Una tale esigenza si presenta quando i risultati che vogliamo elaborare provengono da
fonti diverse, ciascuna delle quali ha misurato la medesima grandezza con propria stru`
mentazione e metodi. E evidente che eliminare semplicemente le stime peggiori e quindi
usare solo quella con lo scarto quadratico medio minore verrebbe ad essere una procedura del tutto arbitraria che disperderebbe il contenuto informativo associato a ciascuna
misura.
Daltra parte se una misura presenta rilevanti dierenze rispetto a tutte le altre si pu`
o
sospettare che questa sia aetta da qualche tipo di errore sistematico non emerso durante
il processo di misura: in tal caso viene a mancare la consistenza di questa con il restante
insieme di dati ed ` quindi legittimo escludere tale determinazione. Lesempio seguente
e
vuole sottolineare come tale procedura talvolta si renda necessaria.
In una classe di 24 studenti si ` misurata laccelerazione di gravit` g in base alla durata
e
a
delle oscillazioni di un pendolo semplice. Ciascun studente disponeva di un diverso
pendolo e, indipendentemente dai compagni, ha rilevato la lunghezza e il periodo. Il
risultato dellelaborazione di ciascuno (media e ) ` riportato in tabella 6 e in gura 32.
e

Tabella 6
N

gravit`
a
cm/s

cm/s

N
2

gravit`
a
cm/s

cm/s2

978

22

13

987

18

2
3
4

971
977
974

14
12
24

14
15
16

981
968
919

16
22
24

5
6
7

980
979
1093

22
5
64

17
18
19

989
981
996

26
11
19

8
9

992
982

21
8

20
21

979
971

14
14

10
11
12

979
964
980

14
7
12

22
23
24

987
983
981

11
21
21

Appare evidente che le misure numero 7 e 16 possiedono un andamento anomalo rispetto


alle restanti. Difatti calcolando indicativamente la media di tutti i valori, si trova g = 982
cm/s2 con uno scarto quadratico medio = 27 cm/s2 mentre lo scarto di ciascuna risulta
z7 = 1093 982 = 111 cm/s2 e z16 = 919 982 = 63 cm/s2 . Per quanto detto
sulla distribuzione normale (p. 35) ma anche sulla base del confronto di questi scarti con
quelli della tabella 6, possiamo ritenere con buona probabilit` che vi sia la presenza
a

Media pesata

60
cm/s2

Accelerazione di gravit`
a

1080
1060
1040
1020
1000
980
960
940
920
900
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
studente
Fig. 32 Dierenti stime dellaccelerazione di gravit`.
a
di errori sistematici in queste due rilevazioni e quindi sia giusticata la loro esclusione
dalle successive elaborazioni. Di queste misure, dovrebbero essere riviste le metodologie
seguite, analizzando nei particolari il funzionamento e luso degli strumenti e riprendendo
le elaborazioni numeriche.
Chiarita quindi la necessit` di disporre di un insieme di dati sucientemente consistente,
a
siano le xi le N determinazioni di cui disponiamo e i le rispettive incertezze. Ricordando
quanto detto nel cap. 3.1, la stima cercata non potr` essere la media aritmetica in quanto
a
questa d` a ciascuna misura la medesima importanza mentre in questo caso si vuole
a
assegnare alla misura pi` precisa un peso maggiore. Allora un termine del tipo
u
xi
2
i

(8.1)

pu` soddisfare a questa richiesta in quanto al diminuire di i il peso


o
wi =

1
2
i

della singola misura xi aumenta. Sommando tutti i termini analoghi a (8.1) si ottiene
una relazione
xi
2
i

(8.2)

che combina linearmente tutte le determinazioni.


Unulteriore condizione da imporre alla precedente espressione riguarda il caso in cui tutte
le misure xi possiedono le medesime incertezze i = e quindi lo stesso peso w = 1/ 2 .

Media pesata

61

La formula cercata dovr` evidentemente ridursi a quella della media. Dividiamo quindi
a
(8.2) per la somma di tutti i pesi
1
2 =
i

wi ,

(8.3)

ottenendo
wi xi
wi .

(8.4)

Questa, nellipotesi che per ogni i valga i = , diviene


wxi
w xi
=
=
N w
w

wi xi
=
wi

xi
N

che risulta essere proprio la media aritmetica.


Applicando metodi che esulano dagli obiettivi di tale trattazione (metodo della massima verosimiglianza*) si giunge a dimostrare che un termine del tipo (8.4) ` quello che
e
rende massima la probabilit` di trovare leettiva distribuzione delle misure per cui, in
a
denitiva, il valore cercato x risulta essere esplicitamente
xi
2
i
.
1
2
i

x=

(8.5)

2
a
a
Alla x si d` il nome di media pesata e, come gi` detto, i termini wi = 1/i sono i relativi
pesi.

Lerrore che si assegna alla x si ottiene applicando le formule della propagazione degli
errori (6.2) e (6.4) cio` considerando la x come una funzione delle variabili xi , di ognuna
e
delle quali ` noto lo scarto quadratico medio i . Si ottiene
e
1

x =

1
2
i

(8.6)

espressione che si riduce alla gi` nota x = / N nellipotesi i = .


a
Le (8.5) e (8.6) risolvono il problema iniziale. In base a queste, il valore dellaccelerazione
di gravit` g che si deduce dalla tabella 6 risulta:
a
2

g = (978 3) cm/s = (9,78 0,03) m/s


in buon accordo con quanto aspettato.
* Si veda la nota a p. 33.

APPENDICE

Principali formule presenti nel testo


Nelle seguenti formule il simbolo

va sempre inteso come


N

i=1

dove N rappresenta il numero totale dei dati xi (o yi ) . Inoltre x, y e i rappresentano


rispettivamente i valori medi di x, y e lo scarto quadratico medio della media.
Propagazione degli errori massimi in una somma
y =

xi

(2.15)

Propagazione degli errori massimi in prodotti o quozienti


y = y

xi
xi

(2.20)

Media
x=

xi
N

(3.2)

Scarto quadratico medio


=

(xi x)2
N 1

(4.3)

Appendice

63

Scarto quadratico medio della media

=
N

(4.4)

Errore medio
|xi x|
N

a=

(5.2)

Propagazione degli errori statistici in una somma


(x1 )2 + (x2 )2 + + (xn )2

y =

(6.4)

Propagazione degli errori statistici in prodotti o quozienti


y
=
y

r (x1 )

r (x2 )

+ +

r (xn )

(6.7)

Retta dei minimi quadrati: y = ax + b


xi yi

N
a=

xi

(xi )2

xi yi

xi
xi

=
con

yi
2

yi
(7.8)

=N

yi
b=
N
yi
=

(xi )2

xi

(xi )2

xi yi

(xi )2

xi

x2
i

xi

xi yi

xi
(7.9)

Scarti quadratici medi di a e b


a =

N
y

b =

(xi )2
y

Appendice

64
Coeciente di correlazione r
xi yi

N
r=
N

xi
2

(xi )2

xi

yi
(yi )2

xi yi N x y

=
(xi

)2

Nx

(yi

yi
(7.18)

)2

Ny

Media pesata
xi
i 2
1
2
i

x=

(8.5)

Scarto quadratico medio della media pesata


x =

(8.6)
1
2
i

BIBLIOGRAFIA

M. Severi

Introduzione alla Esperimentazione Fisica


Zanichelli

M. Bertolotti, T. Papa, Metodi dosservazione e misura


D. Sette
Veschi
D. Valenza
La misura con elementi di Teoria degli Errori
Casa Editrice Ambrosiana
M. Loreti
J. R. Taylor
G. Castelnuovo
L. Vajani
P. R. Bevington

M. Spiegel

Teoria degli Errori e Fondamenti di Statistica


Decibel Editrice
Introduzione allanalisi degli errori
Zanichelli
Calcolo delle Probabilit`
a
Zanichelli
Elementi di Statistica
Cedam
Data reduction and error analysis
for the Physical Sciences
Mc GrawHill
Statistica
Etas Libri

You might also like