2. TABLE DES MATIÈRES
❖ Généralités sur la compression de données.
❖ Quelques approches populaires de compression.
❖ La quantification Vectorielle et Auto-encodeurs dans la
compression de données.
❖ Implémentation
❖ Résultats
3. La Compression de données
➢ C’est l'opération informatique consistant à transformer une
suite de bits A en une suite de bits B plus courte pouvant
restituer les mêmes informations, ou des informations voisines,
en utilisant un algorithme de décompression.
✓
➢ C'est une opération de codage qui raccourcit la taille (de
transmission, de stockage) des données au prix d'un travail de
compression.
✓
➢ Celle-ci est l'opération inverse de la décompression.
4. La Compression de données
➢ Les données en informatique nécessitent souvent beaucoup d’espace pour être stocker.
✓
➢ Transmettre ces données lourdes à travers d’un point à l’autre est une opération coûteuse
en temps.
✓
➢ Ce sont là, quelques raisons ayant poussé à la mis sur pieds des techniques de
compression de données.
➢
➢ Plus précisément, on distingue au moins 4 raisons pouvant mener à la compression de
données, à savoir :
5. La Compression de données
➢ Le gain en Espace mémoire
✓ probablement la raison la plus évidente. La recherche de ce gain est guidé par deux
éléments :
✓ Le stockage (minimiser l’espace pour stocker plus de données)
✓ Le transfert (minimiser la taille des données pour réduire la bande passante)
➢ Le gain en temps de traitement
✓ il est souvent plus rapide de traiter la donnée compressées que la version originale.
✓ La compression effectue souvent la suppression des informations superflues qui
n’interviennent pas ou peu dans le résultat du traitement.
6. La Compression de données
➢ La compatibilité :
✓ Le transfert de données a mené à la compression et à la mise sur pieds d’outils capables de
lire ces données compressés.
✓ De nos même si les données compressées peuvent êtres utilisées, ces outils sont
incapables de les exploiter. D'où la nécessité de compresser, pour assurer la compatibilité.
➢ La sécurité :
✓ la compression peut être utilisée pour le cryptage de données.
✓ L’exemple s’observe avec les images protégées de la copie et de l’utilisation abusive
à l’aide d’une compression avec perte.
7. Quelques approches populaires de
compression.
01 Les Approches prédictives
02 La quantification vectorielle
03 Les approches par transformées
04 Les techniques en sous-bandes
8. La Quantification Vectorielle
La technique de la quantification vectorielle
est celle sur laquelle porte la suite de la
présentation.
9. La Quantification Vectorielle
➢ Avant de parler de la quantification vectorielle, il faut noter que tout commence avec la
quantification scalaire.
✓
➢ La quantification scalaire consiste à coder des échantillons qui sont représentés par une
valeur.
✓
➢ La quantification vectorielle est une généralisation de la quantification scalaire.
✓ L’idée de base est de coder ou de remplacer par une clé des valeurs d’un espace
vectoriel multidimensionnel vers des valeurs d’un sous-espace discret de plus petite
dimension.
10. La Quantification Vectorielle
➢ La quantification vectorielle propose une
quantification optimisée.
✓
➢ l’espace est divisé en classes adaptées à l'ensemble des
échantillons
✓
➢ on calcule un représentant pour chaque classe
(élément rouge sur la figure ci-contre).
✓
➢ L'ensemble des représentants est appelé dictionnaire.
✓
➢ Pour quantifier un échantillon (x1,x2), on lui attribue
les valeurs du représentant le plus proche.
11. La Quantification Vectorielle
➢ Après avoir représenté les échantillons d’un groupe par leur représentant, on obtient
bien une forme réduite du groupe initial.
✓
➢ On voit bien là que la quantification est proche de la compression.
✓
➢ C'est une technique très utilisée en reconnaissance de parole, compression de parole,
codage d’image.
✓
➢ A ce niveau, nous nous tournons vers les réseaux de neurones afin de mettre en oeuvre
la technique de quantification dans la compression d’image.
12. La Quantification Vectorielle
➢ La compression d’image par
quantification peut être réaliser en
utilisant un réseau de Neurones.
✓
➢ Le types de réseau utilisé est
l’Auto-encodeur.
✓
➢ Ci-contre, la structure d’un
auto-encodeur pour la compression
d’image.
13. La Quantification Vectorielle et
Auto-encodeur
➢ En utilisant des techniques de compression des données, il est possible de supprimer une
partie des informations redondantes contenues dans les images.
✓
➢ On observe effectivement l’application de la quantification vectorielle dans ce sens ou
l’image obtenue est plus petite (nécessite moins d'espace de stockage et moins de temps
de transmission).
✓
➢ L’objectif d’un auto-encodeur dans la compression est de pouvoir réaliser la fonction
identité. Regardons cela plus en détails.
14. La Quantification Vectorielle et
Auto-encodeur
➢ Imaginons une image de grande taille (NxM) à l’entrée (Input Layer) de l’auto-encodeur.
✓
➢ Cette image est acheminée vers la couche cachée (Hidden Layer) et possède désormais
des dimensions (N1xM1), tels que N1xM1 > N1xM1.
✓
➢ L’image N1xM1 est enfin acheminée vers la couche de sortie, ou elle sera retransformée
en l’image initiale de dimensions NxM.
✓
➢ Bien évidemment, l’image obtenue à la sortie peut avoir une distorsion par rapport à
l’image initiale, d'où la perte dans la compression.
15. La Quantification Vectorielle et
Auto-encodeur
➢ L’auto-encodeur passe en oeuvre en
séparant l’encodeur et le décodeur.
✓
➢ La partie encodeur sera utilisée comme
compresseur
✓
➢ Tandis que la partie décodeur servira à
la décompression
✓ ddd
NB : Il faut noter que les sorties de la couche cachée ont des valeurs réelles. La véritable compression
produit donc lorsque les sorties de cette couche sont quantifiées avant la transmission de l’image.
16. Implémentation
➢ Environnement.
✓ Jupyter notebook
✓ Keras
✓ MatplotLib
✓ Numpy
➢ Data Set
✓ MNIST : National Institute of Standards and Technology.
✓ 70 000 images 28×28 pixels représentant des chiffres uniques écrits à la main
entre 0 et 9.
✓ 60 000 images pour l'entraînement et 10 000 pour le test.