3. Introduction
Ce projet est effectu´e dans le cadre d’une licence 2 en Science Pour
l’Ing´enieur sp´ecialit´e Acoustique, `a l’Universit´e du Maine. Le th`eme choisi
est donc la Synth`ese Sonore Simplifi´ee d’un Instrument de Musique (cette
toute premi`ere ´etude sera port´ee sur un piano).
Un peu d’Histoire... Le Telharmonium peut ˆetre consid´er´e comme l’ancˆetre
du synth´etiseur, brevet´e en 1897 par un scientifique Canadien, Thaddeus
Cahill. Cet instrument est ´electrom´ecanique (l’´electronique n’´etait pas en-
core invent´ee). Il aura coˆut´e 200.000$ et demand´e 10 ans de mise au point,
p`ese 200 tonnes et s’´etend sur 18 m`etres de large. Il est polyphonique, dot´e
d’un clavier sensitif et peut produire des sons de n’importe quelle fr´equence
et de n’importe quelle intensit´e, avec leurs harmoniques.
En 1935 (apr`es de nombreuses inventions technologiques telles que l’´electronique :
diode, triode,..) est con¸cu l’orgue Hammond de Laurens Hammond que l’on
peut consid´erer comme le pr´ecurseur de la synth`ese additive. Ce n’est pas un
synth´etiseur, mais c’est l’instrument qui a permis `a la musique ´electronique
de toucher le grand public.
Bien plus tard, dans les ann´ees 80, l’´emergence de la micro-informatique
et des synth´etiseurs num´eriques va rapprocher l’informatique et la synth`ese
sonore.
La synth`ese sonore est un ensemble de techniques permettant la g´en´eration
de signaux sonores. Cela touche divers domaines tels que la t´el´ecommunication,
les bruitages de films, les sons (interactifs ou non) de jeux-vid´eo... et, en ce
qui concerne ce projet, la musique.
R´ealiser une synth`ese sonore consiste d’abord `a faire des choix parmi plusieurs
voies et sous-voies possibles :
3
4. – les synth`eses par lecture d’´echantillons : qui comporte les synth`eses
bas´ees sur la modification d’enregistrements sonores (limit´ees par les
quantit´es et diversit´es d’´echantillons sonores qu’utilise le fabricant) ;
– les synth`eses par mod`eles physiques : qui comporte les synth`eses
bas´ees sur la description du comportement physique des sources sonores
(prennent beaucoup de param`etres en compte et tr`es lourdes en cal-
culs) ;
– les synth`eses par algorithmes abstraits : qui comporte les synth`eses
bas´ees sur l’utilisation de divers algorithmes pour la g´en´eration des ob-
jets sonores (moins de param`etres et calculs plus l´egers mais sonorit´es
g´en´er´ees peu r´ealiste par rapport aux sons d’origines physiques) ;
– les synth`eses par mod`eles de signaux : (choix de ce projet) qui
comporte les synth`eses bas´ees sur la description des caract´eristiques
sonores de sources sonores per¸cues par l’auditeur (ex : synth`ese sonore
additive). Elle pr´esente l’inconv´enient de g´en´erer un grand nombre de
param`etres de synth`ese. Toutefois les algorithmes du traitement du sig-
nal permettent d’obtenir automatiquement les param`etres de synth`ese
`a partir de sons enregistr´es.
L’objectif de ce projet est, `a partir de nombreuses mesures faites sur un
piano, d’´ecrire un programme capable de synth´etiser des sons ressemblant
(dans la mesure du possible et de notre niveau peu ´elev´e dans ce domaine)
au piano d’origine. Il s’agit donc, d’apr`es nos choix d’´etude, d’une synth`ese
sonore musicale par mod`eles de signaux (synth`ese additive modul´ee par une
enveloppe temporelle). Le contexte technique de ce projet (outils, connais-
sances personnelles sur le sujet,...) est semblable `a celui des ann´ees 80.
Ce rapport est divis´e en quatre parties : la d´emarche qui d´ecrit de fa¸con
plus d´etaill´ee les choix et les outils utilis´es pour le projet, la partie mesure
qui d´etaille le protocole de mesure des sons ´emis par le piano, ensuite vien-
nent deux parties sur les deux ´etudes de ces sons : une ´etude fr´equentielle et
une ´etude temporelle (chacune en trois sous-parties : traitement de donn´ees,
analyses et mod´elisations), puis enfin, la synth`ese et les tests auditifs qui en
d´ecoule.
4
5. 1 D´emarche
La perception d’un son d´epend de trois caract´eristiques :
– la hauteur (li´ee `a la fr´equence fondamentale) ;
– l’intensit´e (li´ee `a l’amplitude de l’onde sonore en pression acoustique) ;
– le timbre (li´e au contenu spectral et `a l’enveloppe temporelle du son).
Une note de piano (seule) provient de la vibration de trois cordes m´etalliques
de mˆeme mode propre (fr´equence fondamentale) qui ont ´et´e frapp´ee simul-
tan´ement par un mˆeme marteau recouvert de feutre, les vibrations sont trans-
mise `a la table d’harmonie par le bais du chevallet et ainsi le bois qui compose
cette table ´emet le son du piano en vibrant. Dans le cas du piano la hauteur
n’est que le choix de la fr´equence (note jou´ee) et l’intensit´e ne d´epend que de
la force de frappe (volume) qui sera fix´e pour toutes les mesures. En revanche
le timbre d´epend `a la fois de la fr´equence (cordes diff´erentes pour chaque
note : diam`etres, longueurs, tensions,...) et de la force et vitesse de frappe
(volume : fort, pas fort ; dynamique : sec, doux,...). De plus il peut varier tr`es
vite en fonction de chacun de ces param`etres.
La Simplification mentionn´ee dans le titre de ce projet consiste `a fixer
non seulement le volume mais aussi la dynamique. Ainsi le piano ne peut ˆetre
jou´e par un humain pendant les mesures, cela doit ˆetre fait par un robot. Le
syst`eme robot + piano est remplac´e par un synth´etiseur dont le volume et
surtout la dynamique sont fixables. Toutes les explications physiques, lors des
´etudes sur les notes men´ees dans ce projet, seront conjectur´ees comme si les
mesures avaient ´et´e effectu´ees sur un v´eritable piano acoustique. En effet nous
partons du principe que les fabricants, du piano synth´etique (synth´etiseur de
bonne qualit´e) utilis´e, auront pris tous les param`etres physiques en compte
dans leur synth`ese.
5
6. Les mesures sont effectu´ees avec un microphone `a une distance fixe de
la source. Chaque mesure produit un tableau de valeurs qui correspondent
`a l’amplitude du signal au cours du temps. Ce tableau est ensuite trait´e `a
l’aide du logiciel Octave de deux mani`eres diff´erentes.
En fr´equentiel : par une FFT qui est un programme de la biblioth`eque
d’Octave qui permet d’obtenir le spectre de la version num´erique du signal
´etudi´e et qui est bas´ee sur la Transform´ee de Fourier X(F) d’un signal x(t) :
X(F) = TF{x(t)} =
+∞
−∞
x(t).e−j2πFt
.dt
Le spectre de chaque note est ainsi g´en´er´e, ceci dans l’espoir de trouver des
mod`eles math´ematiques pour l’amplitude de chaque harmonique en fonction
de son rang (1,2,3,..,n) et de la fr´equence de la fondamentale.
En temporel : par un programme (qui a dˆu ˆetre ´ecrit) qui r´ecup`ere
l’enveloppe temporelle du signal ´etudi´e, en plusieurs phases : silence, at-
taque, relˆachement,... d´etaill´ees dans la partie ´etude temporelle. L’enveloppe
de chaque note est ainsi g´en´er´ee, ´egalement dans l’espoir de trouver des
mod`eles math´ematiques pour le gain en fonction du temps et de la fr´equence
(note).
La synth`ese est l’´elaboration d’un programme qui g´en`ere un son synth´etis´e
`a une fr´equence demand´ee par l’utilisateur en utilisant les mod`eles pr´ealablement
´etablis, soient :
– f : la fr´equence demand´ee par l’utilisateur ;
– n : le rang des harmoniques ;
– N : le nombre maximal d’harmoniques prises en compte dans la synth`ese ;
– A(f,n) : l’amplitude de chaque harmonique ;
– G(f,t) : le gain (enveloppe temporelle).
Dans le cas id´eal o`u chaque mod`ele a effectivement pu ˆetre ´etabli en fonction
de tous leurs param`etres, le signal synth´etis´e peut ˆetre g´en´eralis´e ainsi :
s(t) = G(f,t).
N
n=1
(A(f,n).cos(2πnft))
6
7. 2 Mesures
Figure 1 : Sch´ema du montage pour les prises de sons
Ce montage se fait dans une salle semi-an´echo¨ıque (pr´esence de mousse
sur le plafond et les murs). La distance source-microphone est fix´ee `a 10cm `a
l’aide d’un pied. Le microphone est ensuite reli´e `a la carte d’acquisition,
laquelle est branch´ee `a l’ordinateur par USB. Le logiciel CTTM permet
d’acqu´erir toutes les prises de sons et de les exporter. Toutes les notes du
do3 jusqu’au do5 (25 notes) sont ainsi enregistr´es. Chaque mesure (pour une
note) est r´ep´et´ee dix fois afin qu’il soit possible, dans les parties qui vont
suivre, d’en tirer une ´etude statistique pour le domaine fr´equentiel et d’avoir
le plus de choix possible pour l’enveloppe temporelle.
Quelques notes suppl´ementaires sont ´egalement mesur´ees comme un do2 et
un do6 isol´es ainsi que quelques sons diff´erents tels que trumpet, vibraphone,
oboe, clarinet, orguan, piano ´electrique et un autre piano ”acoustique”, `a
titre de comparaisons.
7
8. 3 ´Etude fr´equentielle
Il s’agit dans cette partie de traiter les mesures pour en tirer des spectres
en fr´equences, analyser ces r´esultats et en d´eduire, si possible, des ´equations
mod´elisant l’amplitude de chaque harmonique en fonction de son rang et de
la fr´equence fondamentale (note) ´etudi´ee.
3.1 Traitement des donn´ees
Ici l’objectif est, `a partir des sons enregistr´es, bruit´es, non-synchronis´es...,
de g´en´erer pour chaque note un tableau statistique comprenant chaque har-
monique, son rang, sa fr´equence, et son amplitude (relative par rapport `a la
fondamentale). Le programme Octave est donn´e en annexe A (programme
fr´equentiel).
D´emarche (pour une note) : chacun des dix enregistrements sont
d’abord trait´es en parall`eles, car le fait qu’ils ne soient pas synchronis´es influe
beaucoup sur les amplitudes absolues. Toutes les FFT sont effectu´ees apr`es
l’attaque mais donc, pour des raisons d’automatisation, pas tout `a fait au
mˆeme moment pour les dix signaux (car la position de la fenˆetre est constante
mais pas celle des signaux) :
Figure 2 : FFT d’un signal
Le programme r´ecup`ere ensuite les maximums (toujours pour les dix en
parall`ele) :
8
9. Figure 3 : R´ecup´eration des maximums
Ces amplitudes ”absolues” variant fortement selon l’emplacement de la
fenˆetre (de la fft) il convient de les normaliser par rapport `a la fondamentale
avant de pouvoir calculer des moyennes :
Figure 4 : Normalisation (amplitudes relatives par rapport `a la
fondamentale)
9
10. Les moyennes sur les dix prises ont un sens physique seulement apr`es
toutes ces ´etapes, voici donc `a quoi ressemble un r´esultat apr`es tout le traite-
ment :
Figure 5 : Moyennes des amplitudes relatives
Et le tableau des harmoniques correspondant :
Tableau 1 : Tableau des harmoniques
(Les quinze premi`eres seulement sont prises en compte car il a ´et´e observ´e
auparavant que quelle que soit la note ´etudi´ee il n’y a pas ou tr`es tr`es peu
d’´energie `a partir de la seizi`eme.)
10
11. 3.2 Analyses
Tous les r´esultats sont donn´es en annexe B (graphes fr´equentiels).
Il y a plusieurs observations `a faire :
1. les sons du piano sont bien plus riches en harmoniques dans les notes
graves que dans les aigus ;
2. en comparaison avec les spectres des autres instruments (trumpet, or-
gan, etc...) il est possible de dire que tous les spectres du piano suivent
une mˆeme forme globale ;
3. mais lorsqu’ils sont compar´es entre eux ils peuvent tout de mˆeme
paraˆıtre tr`es diff´erents (entre deux notes quelconques du piano ´etudi´e) ;
4. plus embarrassant encore : les spectres de deux notes cˆotes `a cˆotes
(demi-ton) sont parfois similaires mais parfois tr`es diff´erents ´egalement,
selon le demi-ton observ´e.
Tout ceci s’explique par le fait que chaque note d’un piano est g´en´er´ee par
des cordes diff´erentes (en masses, longueurs, diam`etres, tensions, etc...). Le
fait qu’elles soient toutes des cordes en m´etal les rapprochent (spectralement
parlant) par rapport aux autres instruments. Mais chaque corde du piano
est, en comparaison plus pr´ecise avec les autres cordes, un instrument `a part
enti`ere.
3.3 Mod´elisation
Comme le laissait pr´evoir les observations 3 et 4, il n’a pas ´et´e r´ealisable
de mod´eliser math´ematiquement le ph´enom`ene de changement d’enveloppe
spectrale en fonction de la hauteur de la note. Il est n´ecessaire de faire un
choix diff´erent pour la mod´elisation dans le domaine fr´equentiel. Il a donc
´et´e choisi pour ce projet de prendre une ou plusieurs notes comme r´ef´erences
(tableaux d’harmoniques) pour la partie fr´equentielle de la synth`ese.
11
12. 4 ´Etude temporelle
Il s’agit dans cette partie de traiter les mesures afin d’en tirer des en-
veloppes temporelles, analyser ces r´esultats et en d´eduire, si possible, des
´equations mod´elisant le gain en fonction du temps et de la note (fr´equence
fondamentale).
4.1 Traitement des donn´ees
L’objectif est ici de trouver l’enveloppe temporelle d’un signal en reliant
les maximums. Dans notre programme Octave les maximums sont rep´er´es par
leur valeur en amplitude et leur position, ce qui permet d’´etablir l’enveloppe
temporelle qui passe obligatoirement par ces points. Le programme est donn´e
en annexe C (programmes partie temporelle).
Figure 6 : Extraction de l’enveloppe d’un signal
12
13. 4.2 Analyses
Tous les r´esultats sont donn´es en annexe D (graphes temporels).
1. La plupart des enveloppes se ressemblent fortement, il est donc possible
de les g´en´eraliser en plusieurs phases qui resteront les mˆemes quelle que
soit la note ´etudi´ee :
2. deux phases principales sont observ´ees : l’”attaque” et le ”relˆachement”.
La premi`ere comprend deux pics de pression et un minimum entre les
deux. La deuxi`eme, le relˆachement, est une simple d´ecroissance de la
pression au cours du temps.
3. Ces phases sont plus longues, en dur´ee, dans les notes graves (et donc
plus courtes dans les aigus) : Il y a un ph´enom`ene de dilatation/compression
des dur´ees en fonction de la hauteur (fr´equence fondamentale).
4. Il y a aussi la pr´esence d’un battement de l’amplitude (surtout dans
les graves). Ceci peut ˆetre dˆu aux interf´erences entre les fr´equences tr`es
proches des trois cordes frapp´ees lors de l’´emission de la note mais peut
ˆetre dˆu aussi `a la pr´esence d’ondes stationnaires venant des r´eflexions
sur les parois de la caisse de r´esonance du piano. Mais ce ph´enom`ene
ne serai ´etudi´e que pour, au mieux, am´eliorer la synth`ese en aval du
projet, et ne sera donc pas mod´elis´e dans le cadre de ce premier projet
de synth`ese.
4.3 Mod´elisation
L’attaque est d´ecoup´ee en trois phases : mod´elis´ees par trois droites affines
(une croissante, une d´ecroissante puis une croissante). Le relˆachement est
mod´elis´e par une exponentielle inverse. Les enveloppes sont normalis´ee en
amplitude : toute valeur devient un pourcentage de l’amplitude du deuxi`eme
pic (fronti`ere entre l’attaque et le relˆachement, qui vaut donc 1 → 100%).
Normaliser les amplitudes est n´ecessaire afin que les coefficients (directeurs
pour les droites, et d’´evasement pour l’exponentielle inverse) aient du sens
d’une note `a une autre. Le fait de choisir ce point (deuxi`eme pic) en parti-
culier pour la normalisation est un choix seulement ”pratique” qui simplifie
le programme Octave de mod´elisation. Ce deuxi`eme programme donc, nor-
malise et d´ecoupe l’enveloppe (r´ecup´er´ee par le premier programme) en cinq
phases et renvoie les coefficients et dur´ees de chacune des phases (programme
donn´e en annexe C ´egalement).
13
14. Figure 7 : Coefficients et dur´ees de chaque phase, calcul´es avec Octave
Info : les coefficients d’ajustements affines sont obtenus avec de simples
calculs de pentes. En revanche le coefficient d’´evasement α, de la phase de
d´ecroissance exponentielle exp−αt
, est calcul´e `a partir de relations logiques
entre d’un cˆot´e les coefficients renvoy´e par l’ajustement de courbe polynomial
propos´e par Octave (commande : polyfit) et de l’autre le d´eveloppement
limit´e de l’exponentielle :
exp−αt
= 1 −
α
1!
t +
α2
2!
t2
−
α3
3!
t3
+ ... + (−1)n αn
n!
tn
Une fois tous calcul´es, chaque coefficient (affine ou exponentiel) et dur´ee
d’une mˆeme phase sont ensuite compar´es pour toutes les notes (graphes en
annexe D), ce qui permet de trouver le sch´ema g´en´eral suivant :
14
15. Figure 8 : Sch´ema pour la mod´elisation g´en´erale de l’enveloppe d’une
note de piano
Apr`es avoir ´etudi´e les r´esultats num´eriques des coefficients et des dur´ees
avec un logiciel tableur, le gain normalis´e G (en fonction du temps t et de la
hauteur f0) qui sera finalement retenu pour la synth`ese est le suivant :
G(f0,t) =0 pour une dur´ee de 0, 3 seconde
puis =72t pour une dur´ee de 0, 025 seconde
puis = − 80t pour une dur´ee de 0, 01 seconde
puis =
0, 2.f0
17, 4
t pour une dur´ee de
17, 4
f0
seconde
puis = exp(−0,0085.f0).t
pour une dur´ee de 5 − (0, 335 +
17, 4
f0
) seconde
15
16. 5 Synth`ese
5.1 Choix, explications
Synth`ese additive modul´ee par une enveloppe La synth`ese sonore
additive consiste `a cr´eer un son en superposant des signaux sinuso¨ıdaux har-
moniques. Ces signaux ´el´ementaires sont utilis´es dans la synth`ese additive
pour obtenir des sons plus complexes. Cette m´ethode permet th´eoriquement
de cr´eer tous les sons p´eriodiques. Le nombre d’oscillateur dans un synth´etiseur
´etant fini, il est obligatoire de se contenter d’une somme finie de signaux si-
nuso¨ıdaux. La fr´equence et l’amplitude de chaque oscillateur est param´etrable,
de mˆeme que l’enveloppe.
Programmes synth`ese (donn´es en annexe E). Le premier programme
prend en entr´ee une fr´equence et une note de r´ef´erence pour le contenu spec-
tral. Il g´en`ere un son de ”piano” selon la formule d´ecrite dans la d´emarche :
s(t) = G(f,t).
15
n=1
(A(n).cos(2πnft))
Le gain G(f,t) est donn´e par les relations trouv´ees lors de l’´etude temporelle
des signaux et les A(n) sont les amplitudes relatives de chaque harmonique
que le programme r´ecup`ere dans le tableau d’harmoniques de la note de
r´ef´erence choisie (ces tableaux ont ´et´e g´en´er´es lors de l’´etude fr´equentielle
des signaux).
Figure 9 : Exemple de son synth´etis´e
16
17. Un deuxi`eme programme permet de synth´etiser tout un clavier du do2
jusqu’au do5 (49 notes) `a partir d’une seule entr´ee : une note de r´ef´erence pour
le contenu spectral de la synth`ese. Ainsi pour obtenir un piano synth´etis´e, il
y a deux m´ethodes diff´erentes (qui donne deux sons diff´erents) :
– r´ef´erence unique : les notes sont synth´etis´ees demi-ton par demi-ton
avec une unique r´ef´erence spectrale. Les fr´equences ´eloign´ees de la note
de r´ef´erence risquent d’ˆetre d´eform´ees mais le clavier n’est pas limit´e :
il est possible de g´en´erer des fr´equences qui n’ont pas ´et´e ´etudi´ees (et
la synth`ese du clavier peut ˆetre enti`erement automatis´ee) ;
– ”multi-r´ef´erence” : chaque note synth´etis´ee est associ´ee `a son spectre
particulier. Les aigus et les graves sont ainsi moins d´eform´es mais en
revanche le clavier et limit´e par la bande de fr´equence sur laquelle les
spectres ont ´et´e ´etudi´es ;
– une troisi`eme m´ethode consisterai `a concilier les deux pr´ec´edentes en
g´en´erant le clavier octave par octave avec une r´ef´erence par octave (ou
demi octave, tiers, quart,...).
5.2 Tests auditifs : commentaires
Comme pr´evus d`es le d´epart les sons synth´etis´es ne sont pas vraiment
fid`eles au son du piano d’origine. Plus la note est aigu¨es plus la sensation
de ”synth´etique” est accrue. Globalement nos claviers synth´etis´es durant ce
projet ressemblent plus `a des pianos ´electriques ”jouets” pour enfants ou
encore aux tout premiers synth´etiseurs num´eriques des ann´ees 80. Plusieurs
raisons pour lesquelles nos sons ne ressemblent pas au son d’origine :
– les amplitudes relatives de chaque harmonique ne sont pas g´en´er´ees en
fonction de la fr´equence demand´ee ;
– l’attaque est mod´elis´ee de mani`ere tr`es approximative, il manque ´eventuellement
un bruit impulsionnel de marteau qui frappe la corde (le pic synth´etis´e
ici n’est ”rempli” que par une somme de sinus), et les ajustements
affines ne correspondent pas toujours exactement `a l’enveloppe du son
r´eel ;
– les r´eflexions (ondes stationnaires de la caisse de r´esonance du piano)
ne sont pas prises en compte ; les interf´erences entre les sons des trois
cordes d’une mˆeme notes ne sont pas prises en compte non plus.
– et probablement d’autres raisons encore.
Ces diverses raisons ont plusieurs origines : parfois, le manque de temps
pour pr´evoir d’approfondir l’´etude de certains param`etres, mais en g´en´eral,
le manque de connaissances, de mat´eriel (piano + ”robot”), et/ou de talent ?,
dans le domaine de la synth`ese sonore.
17
18. Conclusion
Ce projet est une premi`ere approche de la synth`ese sonore. Celle choisie
pour ce projet est la synth`ese additive par mod`ele de signaux d’un piano.
L’´etude fr´equentielle (g´en´eration des spectres associ´es aux diff´erentes notes)
et temporelle (g´en´eration des enveloppes temporelles) a permis d’´etablir des
mod`eles (`a grand renforts d’approximations) permettant de reproduire ces
notes et donc de r´ealiser un synth´etiseur plus ou moins fid`ele au piano d’o-
rigine. Pour ce projet un certain nombre de param`etres ont ´et´e fix´es et cela
`a une influence non n´egligeable sur le timbre final de la note synth´etis´ee. De
mˆeme les approximations, sur les diff´erentes phases de l’enveloppe temporelle
et sur le contenu spectral, modifient consid´erablement le timbre de la note
de synth`ese en comparaison `a l’instrument enregistr´e. Malgr´e des r´esultats
discutables, ce projet nous `a permis de se familiariser avec le langage de
programmation Octave, avec les composantes essentielles qui d´eterminent la
perception du son par l’oreille humaine, ainsi qu’avec la prise de conscience
des nombreuses difficult´es et complexit´es qu’il y a dans la r´ealisation d’une
synth`ese sonore correcte d’un instrument de musique. Pour continuer cette
´etude il faudrait en priorit´e ´etudier bien plus en profondeur les ph´enom`enes
physiques qui r´egissent l’attaque et le contenu spectral des sons ´emis par un
v´eritable piano acoustique.
18
19. Annexe A : Programme fréquentiel
Générateur de spectres et de tableaux
d'harmoniques statistiques :
19