rapport_projet-l2spi_xu-carrero-lomet

Projet L2-SPI :
Synthèse Sonore Simplifiée d’un Instrument de
Musique
Huiyang Xu, Etienne Lomet, Rémy Carrero
1

Table des matières
Introduction 3
1 Démarche 5
2 Mesures 7
3 Étude fréquentielle 8
3.1 Traitement des données . . . . . . . . . . . . . . . . . . . . . . 8
3.2 Analyses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.3 Modélisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4 Étude temporelle 12
4.1 Traitement des données . . . . . . . . . . . . . . . . . . . . . . 12
4.2 Analyses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4.3 Modélisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5 Synthèse 16
5.1 Choix, explications . . . . . . . . . . . . . . . . . . . . . . . . 16
5.2 Tests auditifs : commentaires . . . . . . . . . . . . . . . . . . 17
Conclusion 18
Annexe A : Programme fréquentiel 19
Annexe B : Graphes fréquentiels 20
Annexe C : Programmes temporels 22
Annexe D : Graphes temporels 24
Annexe E : Programmes synthèse 28
Annexe F : Graphes synthèse 29
2

Introduction
Ce projet est effectué dans le cadre d’une licence 2 en Science Pour
l’Ingénieur spécialité Acoustique, à l’Université du Maine. Le thème choisi
est donc la Synthèse Sonore Simplifiée d’un Instrument de Musique (cette
toute première étude sera portée sur un piano).
Un peu d’Histoire... Le Telharmonium peut être considéré comme l’ancêtre
du synthétiseur, breveté en 1897 par un scientifique Canadien, Thaddeus
Cahill. Cet instrument est électromécanique (l’électronique n’était pas en-
core inventée). Il aura coûté 200.000$ et demandé 10 ans de mise au point,
pèse 200 tonnes et s’étend sur 18 mètres de large. Il est polyphonique, doté
d’un clavier sensitif et peut produire des sons de n’importe quelle fréquence
et de n’importe quelle intensité, avec leurs harmoniques.
En 1935 (après de nombreuses inventions technologiques telles que l’électronique :
diode, triode,..) est con¸cu l’orgue Hammond de Laurens Hammond que l’on
peut considérer comme le précurseur de la synthèse additive. Ce n’est pas un
synthétiseur, mais c’est l’instrument qui a permis à la musique électronique
de toucher le grand public.
Bien plus tard, dans les années 80, l’émergence de la micro-informatique
et des synthétiseurs numériques va rapprocher l’informatique et la synthèse
sonore.
La synthèse sonore est un ensemble de techniques permettant la génération
de signaux sonores. Cela touche divers domaines tels que la télécommunication,
les bruitages de films, les sons (interactifs ou non) de jeux-vidéo... et, en ce
qui concerne ce projet, la musique.
Réaliser une synthèse sonore consiste d’abord à faire des choix parmi plusieurs
voies et sous-voies possibles :
3

– les synthèses par lecture d’échantillons : qui comporte les synthèses
basées sur la modification d’enregistrements sonores (limitées par les
quantités et diversités d’échantillons sonores qu’utilise le fabricant) ;
– les synthèses par modèles physiques : qui comporte les synthèses
basées sur la description du comportement physique des sources sonores
(prennent beaucoup de paramètres en compte et très lourdes en cal-
culs) ;
– les synthèses par algorithmes abstraits : qui comporte les synthèses
basées sur l’utilisation de divers algorithmes pour la génération des ob-
jets sonores (moins de paramètres et calculs plus légers mais sonorités
générées peu réaliste par rapport aux sons d’origines physiques) ;
– les synthèses par modèles de signaux : (choix de ce projet) qui
comporte les synthèses basées sur la description des caractéristiques
sonores de sources sonores per¸cues par l’auditeur (ex : synthèse sonore
additive). Elle présente l’inconvénient de générer un grand nombre de
paramètres de synthèse. Toutefois les algorithmes du traitement du sig-
nal permettent d’obtenir automatiquement les paramètres de synthèse
à partir de sons enregistrés.
L’objectif de ce projet est, à partir de nombreuses mesures faites sur un
piano, d’écrire un programme capable de synthétiser des sons ressemblant
(dans la mesure du possible et de notre niveau peu élevé dans ce domaine)
au piano d’origine. Il s’agit donc, d’après nos choix d’étude, d’une synthèse
sonore musicale par modèles de signaux (synthèse additive modulée par une
enveloppe temporelle). Le contexte technique de ce projet (outils, connais-
sances personnelles sur le sujet,...) est semblable à celui des années 80.
Ce rapport est divisé en quatre parties : la démarche qui décrit de fa¸con
plus détaillée les choix et les outils utilisés pour le projet, la partie mesure
qui détaille le protocole de mesure des sons émis par le piano, ensuite vien-
nent deux parties sur les deux études de ces sons : une étude fréquentielle et
une étude temporelle (chacune en trois sous-parties : traitement de données,
analyses et modélisations), puis enfin, la synthèse et les tests auditifs qui en
découle.
4

1 Démarche
La perception d’un son dépend de trois caractéristiques :
– la hauteur (liée à la fréquence fondamentale) ;
– l’intensité (liée à l’amplitude de l’onde sonore en pression acoustique) ;
– le timbre (lié au contenu spectral et à l’enveloppe temporelle du son).
Une note de piano (seule) provient de la vibration de trois cordes métalliques
de même mode propre (fréquence fondamentale) qui ont été frappée simul-
tanément par un même marteau recouvert de feutre, les vibrations sont trans-
mise à la table d’harmonie par le bais du chevallet et ainsi le bois qui compose
cette table émet le son du piano en vibrant. Dans le cas du piano la hauteur
n’est que le choix de la fréquence (note jouée) et l’intensité ne dépend que de
la force de frappe (volume) qui sera fixé pour toutes les mesures. En revanche
le timbre dépend à la fois de la fréquence (cordes différentes pour chaque
note : diamètres, longueurs, tensions,...) et de la force et vitesse de frappe
(volume : fort, pas fort ; dynamique : sec, doux,...). De plus il peut varier très
vite en fonction de chacun de ces paramètres.
La Simplification mentionnée dans le titre de ce projet consiste à fixer
non seulement le volume mais aussi la dynamique. Ainsi le piano ne peut être
joué par un humain pendant les mesures, cela doit être fait par un robot. Le
système robot + piano est remplacé par un synthétiseur dont le volume et
surtout la dynamique sont fixables. Toutes les explications physiques, lors des
études sur les notes menées dans ce projet, seront conjecturées comme si les
mesures avaient été effectuées sur un véritable piano acoustique. En effet nous
partons du principe que les fabricants, du piano synthétique (synthétiseur de
bonne qualité) utilisé, auront pris tous les paramètres physiques en compte
dans leur synthèse.
5

Les mesures sont effectuées avec un microphone à une distance fixe de
la source. Chaque mesure produit un tableau de valeurs qui correspondent
à l’amplitude du signal au cours du temps. Ce tableau est ensuite traité à
l’aide du logiciel Octave de deux manières différentes.
En fréquentiel : par une FFT qui est un programme de la bibliothèque
d’Octave qui permet d’obtenir le spectre de la version numérique du signal
étudié et qui est basée sur la Transformée de Fourier X(F) d’un signal x(t) :
X(F) = TF{x(t)} =
+∞
−∞
x(t).e−j2πFt
.dt
Le spectre de chaque note est ainsi généré, ceci dans l’espoir de trouver des
modèles mathématiques pour l’amplitude de chaque harmonique en fonction
de son rang (1,2,3,..,n) et de la fréquence de la fondamentale.
En temporel : par un programme (qui a dû être écrit) qui récupère
l’enveloppe temporelle du signal étudié, en plusieurs phases : silence, at-
taque, relâchement,... détaillées dans la partie étude temporelle. L’enveloppe
de chaque note est ainsi générée, également dans l’espoir de trouver des
modèles mathématiques pour le gain en fonction du temps et de la fréquence
(note).
La synthèse est l’élaboration d’un programme qui génère un son synthétisé
à une fréquence demandée par l’utilisateur en utilisant les modèles préalablement
établis, soient :
– f : la fréquence demandée par l’utilisateur ;
– n : le rang des harmoniques ;
– N : le nombre maximal d’harmoniques prises en compte dans la synthèse ;
– A(f,n) : l’amplitude de chaque harmonique ;
– G(f,t) : le gain (enveloppe temporelle).
Dans le cas idéal où chaque modèle a effectivement pu être établi en fonction
de tous leurs paramètres, le signal synthétisé peut être généralisé ainsi :
s(t) = G(f,t).
N
n=1
(A(f,n).cos(2πnft))
6

2 Mesures
Figure 1 : Schéma du montage pour les prises de sons
Ce montage se fait dans une salle semi-anécho¨ıque (présence de mousse
sur le plafond et les murs). La distance source-microphone est fixée à 10cm à
l’aide d’un pied. Le microphone est ensuite relié à la carte d’acquisition,
laquelle est branchée à l’ordinateur par USB. Le logiciel CTTM permet
d’acquérir toutes les prises de sons et de les exporter. Toutes les notes du
do3 jusqu’au do5 (25 notes) sont ainsi enregistrés. Chaque mesure (pour une
note) est répétée dix fois afin qu’il soit possible, dans les parties qui vont
suivre, d’en tirer une étude statistique pour le domaine fréquentiel et d’avoir
le plus de choix possible pour l’enveloppe temporelle.
Quelques notes supplémentaires sont également mesurées comme un do2 et
un do6 isolés ainsi que quelques sons différents tels que trumpet, vibraphone,
oboe, clarinet, orguan, piano électrique et un autre piano ”acoustique”, à
titre de comparaisons.
7

3 Étude fréquentielle
Il s’agit dans cette partie de traiter les mesures pour en tirer des spectres
en fréquences, analyser ces résultats et en déduire, si possible, des équations
modélisant l’amplitude de chaque harmonique en fonction de son rang et de
la fréquence fondamentale (note) étudiée.
3.1 Traitement des données
Ici l’objectif est, à partir des sons enregistrés, bruités, non-synchronisés...,
de générer pour chaque note un tableau statistique comprenant chaque har-
monique, son rang, sa fréquence, et son amplitude (relative par rapport à la
fondamentale). Le programme Octave est donné en annexe A (programme
fréquentiel).
Démarche (pour une note) : chacun des dix enregistrements sont
d’abord traités en parallèles, car le fait qu’ils ne soient pas synchronisés influe
beaucoup sur les amplitudes absolues. Toutes les FFT sont effectuées après
l’attaque mais donc, pour des raisons d’automatisation, pas tout à fait au
même moment pour les dix signaux (car la position de la fenêtre est constante
mais pas celle des signaux) :
Figure 2 : FFT d’un signal
Le programme récupère ensuite les maximums (toujours pour les dix en
parallèle) :
8

Figure 3 : Récupération des maximums
Ces amplitudes ”absolues” variant fortement selon l’emplacement de la
fenêtre (de la fft) il convient de les normaliser par rapport à la fondamentale
avant de pouvoir calculer des moyennes :
Figure 4 : Normalisation (amplitudes relatives par rapport à la
fondamentale)
9

Les moyennes sur les dix prises ont un sens physique seulement après
toutes ces étapes, voici donc à quoi ressemble un résultat après tout le traite-
ment :
Figure 5 : Moyennes des amplitudes relatives
Et le tableau des harmoniques correspondant :
Tableau 1 : Tableau des harmoniques
(Les quinze premières seulement sont prises en compte car il a été observé
auparavant que quelle que soit la note étudiée il n’y a pas ou très très peu
d’énergie à partir de la seizième.)
10

3.2 Analyses
Tous les résultats sont donnés en annexe B (graphes fréquentiels).
Il y a plusieurs observations à faire :
1. les sons du piano sont bien plus riches en harmoniques dans les notes
graves que dans les aigus ;
2. en comparaison avec les spectres des autres instruments (trumpet, or-
gan, etc...) il est possible de dire que tous les spectres du piano suivent
une même forme globale ;
3. mais lorsqu’ils sont comparés entre eux ils peuvent tout de même
paraˆıtre très différents (entre deux notes quelconques du piano étudié) ;
4. plus embarrassant encore : les spectres de deux notes côtes à côtes
(demi-ton) sont parfois similaires mais parfois très différents également,
selon le demi-ton observé.
Tout ceci s’explique par le fait que chaque note d’un piano est générée par
des cordes différentes (en masses, longueurs, diamètres, tensions, etc...). Le
fait qu’elles soient toutes des cordes en métal les rapprochent (spectralement
parlant) par rapport aux autres instruments. Mais chaque corde du piano
est, en comparaison plus précise avec les autres cordes, un instrument à part
entière.
3.3 Modélisation
Comme le laissait prévoir les observations 3 et 4, il n’a pas été réalisable
de modéliser mathématiquement le phénomène de changement d’enveloppe
spectrale en fonction de la hauteur de la note. Il est nécessaire de faire un
choix différent pour la modélisation dans le domaine fréquentiel. Il a donc
été choisi pour ce projet de prendre une ou plusieurs notes comme références
(tableaux d’harmoniques) pour la partie fréquentielle de la synthèse.
11

4 Étude temporelle
Il s’agit dans cette partie de traiter les mesures afin d’en tirer des en-
veloppes temporelles, analyser ces résultats et en déduire, si possible, des
équations modélisant le gain en fonction du temps et de la note (fréquence
fondamentale).
4.1 Traitement des données
L’objectif est ici de trouver l’enveloppe temporelle d’un signal en reliant
les maximums. Dans notre programme Octave les maximums sont repérés par
leur valeur en amplitude et leur position, ce qui permet d’établir l’enveloppe
temporelle qui passe obligatoirement par ces points. Le programme est donné
en annexe C (programmes partie temporelle).
Figure 6 : Extraction de l’enveloppe d’un signal
12

4.2 Analyses
Tous les résultats sont donnés en annexe D (graphes temporels).
1. La plupart des enveloppes se ressemblent fortement, il est donc possible
de les généraliser en plusieurs phases qui resteront les mêmes quelle que
soit la note étudiée :
2. deux phases principales sont observées : l’”attaque” et le ”relâchement”.
La première comprend deux pics de pression et un minimum entre les
deux. La deuxième, le relâchement, est une simple décroissance de la
pression au cours du temps.
3. Ces phases sont plus longues, en durée, dans les notes graves (et donc
plus courtes dans les aigus) : Il y a un phénomène de dilatation/compression
des durées en fonction de la hauteur (fréquence fondamentale).
4. Il y a aussi la présence d’un battement de l’amplitude (surtout dans
les graves). Ceci peut être dû aux interférences entre les fréquences très
proches des trois cordes frappées lors de l’émission de la note mais peut
être dû aussi à la présence d’ondes stationnaires venant des réflexions
sur les parois de la caisse de résonance du piano. Mais ce phénomène
ne serai étudié que pour, au mieux, améliorer la synthèse en aval du
projet, et ne sera donc pas modélisé dans le cadre de ce premier projet
de synthèse.
4.3 Modélisation
L’attaque est découpée en trois phases : modélisées par trois droites affines
(une croissante, une décroissante puis une croissante). Le relâchement est
modélisé par une exponentielle inverse. Les enveloppes sont normalisée en
amplitude : toute valeur devient un pourcentage de l’amplitude du deuxième
pic (frontière entre l’attaque et le relâchement, qui vaut donc 1 → 100%).
Normaliser les amplitudes est nécessaire afin que les coefficients (directeurs
pour les droites, et d’évasement pour l’exponentielle inverse) aient du sens
d’une note à une autre. Le fait de choisir ce point (deuxième pic) en parti-
culier pour la normalisation est un choix seulement ”pratique” qui simplifie
le programme Octave de modélisation. Ce deuxième programme donc, nor-
malise et découpe l’enveloppe (récupérée par le premier programme) en cinq
phases et renvoie les coefficients et durées de chacune des phases (programme
donné en annexe C également).
13

Figure 7 : Coefficients et durées de chaque phase, calculés avec Octave
Info : les coefficients d’ajustements affines sont obtenus avec de simples
calculs de pentes. En revanche le coefficient d’évasement α, de la phase de
décroissance exponentielle exp−αt
, est calculé à partir de relations logiques
entre d’un côté les coefficients renvoyé par l’ajustement de courbe polynomial
proposé par Octave (commande : polyfit) et de l’autre le développement
limité de l’exponentielle :
exp−αt
= 1 −
α
1!
t +
α2
2!
t2
−
α3
3!
t3
+ ... + (−1)n αn
n!
tn
Une fois tous calculés, chaque coefficient (affine ou exponentiel) et durée
d’une même phase sont ensuite comparés pour toutes les notes (graphes en
annexe D), ce qui permet de trouver le schéma général suivant :
14

Figure 8 : Schéma pour la modélisation générale de l’enveloppe d’une
note de piano
Après avoir étudié les résultats numériques des coefficients et des durées
avec un logiciel tableur, le gain normalisé G (en fonction du temps t et de la
hauteur f0) qui sera finalement retenu pour la synthèse est le suivant :
G(f0,t) =0 pour une durée de 0, 3 seconde
puis =72t pour une durée de 0, 025 seconde
puis = − 80t pour une durée de 0, 01 seconde
puis =
0, 2.f0
17, 4
t pour une durée de
17, 4
f0
seconde
puis = exp(−0,0085.f0).t
pour une durée de 5 − (0, 335 +
17, 4
f0
) seconde
15

5 Synthèse
5.1 Choix, explications
Synthèse additive modulée par une enveloppe La synthèse sonore
additive consiste à créer un son en superposant des signaux sinuso¨ıdaux har-
moniques. Ces signaux élémentaires sont utilisés dans la synthèse additive
pour obtenir des sons plus complexes. Cette méthode permet théoriquement
de créer tous les sons périodiques. Le nombre d’oscillateur dans un synthétiseur
étant fini, il est obligatoire de se contenter d’une somme finie de signaux si-
nuso¨ıdaux. La fréquence et l’amplitude de chaque oscillateur est paramétrable,
de même que l’enveloppe.
Programmes synthèse (donnés en annexe E). Le premier programme
prend en entrée une fréquence et une note de référence pour le contenu spec-
tral. Il génère un son de ”piano” selon la formule décrite dans la démarche :
s(t) = G(f,t).
15
n=1
(A(n).cos(2πnft))
Le gain G(f,t) est donné par les relations trouvées lors de l’étude temporelle
des signaux et les A(n) sont les amplitudes relatives de chaque harmonique
que le programme récupère dans le tableau d’harmoniques de la note de
référence choisie (ces tableaux ont été générés lors de l’étude fréquentielle
des signaux).
Figure 9 : Exemple de son synthétisé
16

Un deuxième programme permet de synthétiser tout un clavier du do2
jusqu’au do5 (49 notes) à partir d’une seule entrée : une note de référence pour
le contenu spectral de la synthèse. Ainsi pour obtenir un piano synthétisé, il
y a deux méthodes différentes (qui donne deux sons différents) :
– référence unique : les notes sont synthétisées demi-ton par demi-ton
avec une unique référence spectrale. Les fréquences éloignées de la note
de référence risquent d’être déformées mais le clavier n’est pas limité :
il est possible de générer des fréquences qui n’ont pas été étudiées (et
la synthèse du clavier peut être entièrement automatisée) ;
– ”multi-référence” : chaque note synthétisée est associée à son spectre
particulier. Les aigus et les graves sont ainsi moins déformés mais en
revanche le clavier et limité par la bande de fréquence sur laquelle les
spectres ont été étudiés ;
– une troisième méthode consisterai à concilier les deux précédentes en
générant le clavier octave par octave avec une référence par octave (ou
demi octave, tiers, quart,...).
5.2 Tests auditifs : commentaires
Comme prévus dès le départ les sons synthétisés ne sont pas vraiment
fidèles au son du piano d’origine. Plus la note est aiguës plus la sensation
de ”synthétique” est accrue. Globalement nos claviers synthétisés durant ce
projet ressemblent plus à des pianos électriques ”jouets” pour enfants ou
encore aux tout premiers synthétiseurs numériques des années 80. Plusieurs
raisons pour lesquelles nos sons ne ressemblent pas au son d’origine :
– les amplitudes relatives de chaque harmonique ne sont pas générées en
fonction de la fréquence demandée ;
– l’attaque est modélisée de manière très approximative, il manque éventuellement
un bruit impulsionnel de marteau qui frappe la corde (le pic synthétisé
ici n’est ”rempli” que par une somme de sinus), et les ajustements
affines ne correspondent pas toujours exactement à l’enveloppe du son
réel ;
– les réflexions (ondes stationnaires de la caisse de résonance du piano)
ne sont pas prises en compte ; les interférences entre les sons des trois
cordes d’une même notes ne sont pas prises en compte non plus.
– et probablement d’autres raisons encore.
Ces diverses raisons ont plusieurs origines : parfois, le manque de temps
pour prévoir d’approfondir l’étude de certains paramètres, mais en général,
le manque de connaissances, de matériel (piano + ”robot”), et/ou de talent ?,
dans le domaine de la synthèse sonore.
17

Conclusion
Ce projet est une première approche de la synthèse sonore. Celle choisie
pour ce projet est la synthèse additive par modèle de signaux d’un piano.
L’étude fréquentielle (génération des spectres associés aux différentes notes)
et temporelle (génération des enveloppes temporelles) a permis d’établir des
modèles (à grand renforts d’approximations) permettant de reproduire ces
notes et donc de réaliser un synthétiseur plus ou moins fidèle au piano d’o-
rigine. Pour ce projet un certain nombre de paramètres ont été fixés et cela
à une influence non négligeable sur le timbre final de la note synthétisée. De
même les approximations, sur les différentes phases de l’enveloppe temporelle
et sur le contenu spectral, modifient considérablement le timbre de la note
de synthèse en comparaison à l’instrument enregistré. Malgré des résultats
discutables, ce projet nous à permis de se familiariser avec le langage de
programmation Octave, avec les composantes essentielles qui déterminent la
perception du son par l’oreille humaine, ainsi qu’avec la prise de conscience
des nombreuses difficultés et complexités qu’il y a dans la réalisation d’une
synthèse sonore correcte d’un instrument de musique. Pour continuer cette
étude il faudrait en priorité étudier bien plus en profondeur les phénomènes
physiques qui régissent l’attaque et le contenu spectral des sons émis par un
véritable piano acoustique.
18

Annexe A : Programme fréquentiel
Générateur de spectres et de tableaux
d'harmoniques statistiques :
19

Annexe B : Graphes fréquentiels
20

Annexe C : Programmes temporels
Récupération d'enveloppes temporelles :
22

Ajustements de courbes et modèles pour
l'enveloppe :
23

Annexe D : Graphes temporels
24

Générateur de sons de synthèse :
Annexe E : Programme synthèse
28

Annexe F : Graphes synthèse
29

rapport_projet-l2spi_xu-carrero-lomet

Recommandé

Recommandé

Contenu connexe

En vedette

En vedette (16)

Similaire à rapport_projet-l2spi_xu-carrero-lomet

Similaire à rapport_projet-l2spi_xu-carrero-lomet (20)

rapport_projet-l2spi_xu-carrero-lomet