You are on page 1of 54

Introduction aux techniques

audio-numriques
S. Natkin
Dcembre 2005

Audio Numrique
Introduction: la chane des outils
audionumriques
Numrisation du son
Transformations et effets
Exemple d'outils

La chane de traitement du son

La chane de traitement du son


(2)

La chane de traitement du son


(3)

La chane de traitement du son


(4)

Limites
Capacit de traitement
(Fft/convolution) => la ralisation des tapes
complexes
en temps rel ncessite soit des processeurs
ddis (dsp), soit une capacit de traitement
relativement importante
Capacit de stockage
1 s de son mono a 44.1 mpeg layer2 = 128kb
1h de son stro qualit cd=500 600 mo
7

Effets et transformations

Filtrage numrique
Trs nombreuses techniques de transformation portant
soit sur le signal temporel soit sur le spectre
Principales transformations bases sur le filtrage
numrique linaire

x(n)

y(n)

Retard d

Retard d
+

y(n)=x(n)+x(n-d)

+
y(n)=x(n)+y(n-d)

Exemples de base dun filtre FIR et IIR

Effet dun filtre sur le spectre dun


signal
Modifie la phase (effet de retard)
Modifie le spectre damplitude

Passe bande

Passe haut
A

idal

rel

idal

Passe bas
A

f
rel
Coupe bande

idal

rel

idal

rel

10

Filtrage numrique audio

11

Un filtre non linaire:


effet de saturation
Signal initial
1
0,8
0,6
Srie1

0,4
0,2

y (n) = min(1,5.s (n),0,9)

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Signal satur
1
0,8
0,6
Srie1

0,4
0,2
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

12

Les effets de retards


Schma dune ligne
retard simple

Amplitude du signal retard

x
+

Amplitude du signal originel

Court <10 ms modification du spectre (un ou deux chantillons


passe bas FIR, plus long filtre en peigne)
Moyen >10ms et <50 ms effet dambiance, rehausse un signal
mince
Long > 50 ms effet dcho
Utiliser aussi pour donner un effet de localisation dans lespace

13

Flanger
f(t) est une fonction
priodique ou une fonction
alatoire de moyenne nulle
et comprise ente -1 et +1

=d+q.f(t)
+

Rolling Stone

Rolling Stone Flang


Version plus labore le phasing

14

Effet Chorus
x(n)
Une
technique

Fl

Fl

Fl

a0
x

a1
x

ak
x

+
Sans

Avec
15

Spatialisation
Effet de rverbration
Effet de localisation

Localis

Spectre du signal rverbr (JMJ)

16

Dtermination de la position dun


son dans lespace

Dtermination de lazimut et zenith


Diffrence de temps entre les deux oreilles
Diffrence damplitude avant arrire (ombre de la tte)
Diffrence spectrale lies aux rflexions asymtriques (pavillons, paules, torses)
Dtermination de la distance
Rapport entre le signal direct et le signal rverbr
Pertes des composantes hautes frquences
17
Pertes des dtails

Restitution
Mono (distance)
Stro (distance et localisation sur un
plan)
Spatial avec deux hauts parleurs
(transaural)
Spatial avec un casque (binaural)
Spatial avec N haut parleurs
18

HRTF

Dtermination exprimentale des filtres


dfinissant la diffrences de perception
entre les deux oreilles pour une position
dun objet sonore.
Dpend de la tte

19

Exemple de processus de
spatialisation binaural

HRTF D

Modle de salle

Son
direct

position
Filtre de rverbration
HRTF G
Rflexions prcoces
Rflexions tardives

20

Pan Pot dintensit (2D)


r

max

2
[cos + sin ]
AG = A. f (r ).
2
2
[cos sin ]
AD = A. f (r ).
2
f(r) dcrot avec la distance. Peut tre diffrente
pour le son direct, les rflexions prcoces et tardives

21

Codage du son numrique

22

Elments de codage
Frquence d chantillonnage (2Khz-80 Khz)
La loi de quantification (8-16 bits)
La (les) algorithmes de compression
(symtrique ou asymtrique)
La reprsentation binaire
Exemple : le codage sur un CD frquence 44.1
Khz chantillonnage sur 16 bits
soit 700 kb/s
23

Pulse Code Modulation


Reprsentation temporelle du signal chantillonn
Frquences dchantillonnage
de 4Khz 44Khz
Quantification linaire sur 8 ou 16 bits
Reprsentation en complment 2

24

PCM diffrentiel
DCMP codage diffrentiel: on code x(0) et
dn =x(n)-x(n-1)
Efficace si le signal varie lentement.
Par exemple si x(n) est sur 16 bits on code
la longueur de d(n) sur 3 bits puis dn
Efficace si dn tient sur moins de 13 bits
ADCMP: coder la variation des diffrences.
Par exemple (schma IMA) 16 bits->4bits
25

26

Adaptative PCM : ADPCM


Principe: coder la variation des diffrences. Par
exemple (schma IMA)
x(n-1)=x(n-2)+dn-1 avec dn-1 =D(k)
Notons in-1 =k
Table des diffrences D
x(n)=x(n-1)+dn avec dn =D(t)
in =t
D(0)
D(1)
On code
D(2)
x(0) sur 16 bits
.
D(k)
i1 sur 8 bits
.
D(t)
din = in- in-1 sur 4 bits
.

27

Compression psycho perceptive


La perception du son est logarithmique
Utiliser une quantification logarithmique
Loreille distingue mieux les sons dans la
bande 300 6000 Hz
Echantillonner diffremment selon les
bandes de frquence
Certains sons en masque dautre
Supprimer les informations non perues
28

MIC
Modulation par Impulsion et
Codage
Codage utilise pour le tlphone numrique (RNIS)
Bande passante de 4000hz
=> 8000 chantillons par secondes (th de niqyst)
Un chantilon toutes les 125 microsecondes
Une numrisation sur 8 bits (loi de quantification non
linaire tenant compte des spectres d'audition (mu law
USA/ A law en Europe)
Dbit 8000x8=64kb/s

29

Quantification perceptive:
lois de quantification mu et A

Segment
A

Mu: 8 segments de 16 Valeurs,


incrments de 2 de 256
A : 7 segments le premier de
32 valeurs et les autres de 16
valeurs

Segment
B
Segment
C
30

Notion de bande critique


Dans un intervalle de frquence autour dune
frquence centrale, loreille ne distingue pas
nettement deux sons.
Si un son a une intensit forte il masque,
pendant une courte priode les sons dintensit
plus faible dans sa bande critique
La notion de bande critique est li un effet de
filtrage en peigne Q contant effectu par
loreille
En premire approximation il est possible de
dcomposer un son audible sur une vingtaine de
bande de frquences (pendant du RVB visuel)
31

Compression frquentielle
perceptive (ex MP3)
MPEG 1 est une norme de transmission de vido numrique
(Image anime+ son) intgrant diffrentes qualits selon les types
D'application (visiophonie...Video a la demande)
Le son est chantillonne a 32, 44,1 kHz ou 48 kHz
MPEG 1 Layer 3 (MP3) est un codage du son , il sagit dune
compression non conservative base sur le masquage
3 niveaux avec des codeurs de plus en plus complexes en
Fonction de la qualit de son vise
32

Utilisation des effets de


masquage

33

Codeur MP3

34

Compression MPEG1

35

Compression dynamique de la
voix
Mode de compression utilis pour un
traitement en temps rel de la voix sur un
canal faible dbit (GSM, RealAudio)
Bas sur un modle acoustique de la gorge
qui permet de caractrise le son initial et
l effet de rsonance (formants)

36

LPC: Linear Predictive Coding


Les formants sont prdits par un filtre linaire
adaptatif qui induit le formant courant par
rapport aux prcdents.
Une fois le formant calcul il est soustrait du
signal initial ce qui donne le rsidu qui doit en
thorie contenir le son direct
En pratique il faut transmettre une partie du
formant ou une rfrence un formant voisin
Amlioration le CELP
37

MPEG Audio

38

Codec
MPEG 4

39

Dbits MPEG 4

40

Formats Audio en gnral

41

Comparaison superficielle
Codage

F Ech

Dbit
Kb/s

Facteur de
comp

Sym/Assym

PCM/CD

44100

16

705600

ADCMP

44100

16

176400

MP3

44100

16

70560

10

MIC

8000

10

64000

11

LPC (Cell)

8000

8000

88,2

42

Introduction aux techniques


de synthse du son
S. Natkin 2003

43

Gnralits
Construction d'un son par un dispositif lectronique (ici numrique) .
Synthse par tables dondes
Par exploration et altrations dchantillons enregistrs
Synthse additive
Par addition de signaux simples (sinusoidaux par exemple)
Synthse granulaire
Multiplexage temporel de petits lments dont lensemble des lments sont contrls
Synthse soustractive
Par filtrage de signaux riches en harmoniques
Synthse par modulation
Par variation temporelle d'un paramtre d'un signal se dcomposant selon une srie de
Fourrier dont les harmoniques dpendent de ce paramtre
Synthse par modles physiques
Par simulation des lois acoustiques

44

Synthse par table donde


On part dune table dun son enregistrs qui est
lue priodiquement
On modifie le frquences soit en sautant des
chantillons , soit en crant artificiellement
(avec ventuellement un processus
dinterpolation)
Les chantillons peuvent tre altrs en hauteur
en suivant une enveloppe damplitude

45

Utilisation de plusieurs tables


Enchanes (pour des priodes
dtermines)
Additionne (Somme des constructions
prcdentes)
Version plus complexes (terrains donde)
Standard Microsoft Downlodable Sound
Level (DSL)
46

Synthse additive

47

Schma de base
Gnrateur de base

Enveloppe de frquence

Amplitude max
Enveloppe damplitude

Frquence
centrale

Gnrateur
denveloppe

Gnrateur
denveloppe

+
Osc
48

Schma dune synthse


sinusoidale

Amplitude max

Frquence
centrale

Enveloppe damplitude

Osc

49

Synthse complexe

S1

S2

Sn

+
50

Synthse par modulation

Principe:
Moduler un Signal sinuosidal par un autre signal
S(t)= A(t). Sin(.t+) Amplitude
S(t)= A. Sin(.t+(t)) Phase
S(t)= A Sin((t).t+) Frquence

51

Modulation de frquences
Schma de base
Amplitude max

Frquence
centrale

Enveloppe damplitude

Osc
Amplitude de
la porteuse

Frquence centrale

Enveloppe damplitude

+
Osc
52

Utilisation de fonction
complexes

53

Bibliographie
Laudionumrique, Curtis Raod,
Dunod1998
The technology of video and audio
streaming, David Auterberry, Focal Press,
2002
Le son musical, John Pierce, Pour la
Science, Belin 1984

54

You might also like