Cours4 gdm

305 vues

Publié le

0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
305
Sur SlideShare
0
Issues des intégrations
0
Intégrations
3
Actions
Partages
0
Téléchargements
6
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Cours4 gdm

  1. 1. Chapitre 2: Les données Multimédia Cours N°04 du 05 Mars 2014 Présenté par: Mme ZERF.N 1
  2. 2. Plan 2
  3. 3.  Media: Tout support de diffusion de l’information constituant à la fois un moyen d’expression et un intermédiaire transmettant un message à l’attention d’un groupe.  Le mot multimédia est apparu vers la fin des années 1980, lorsque les CD-ROM se sont développés. Il désignait alors les applications qui, grâce à la mémoire du CD et aux capacités de l'ordinateur, pouvaient générer, utiliser ou piloter différents médias simultanément […]  Aujourd'hui on utilise le mot multimédia pour désigner toute application utilisant ou servant à travailler sur au moins un média spécifique.  Par ailleurs, en recherche en informatique, on nomme multimédia l'étude des médias non textuels, principalement les images, les vidéo et les sons. 3 Le Multimédia
  4. 4. Croissance…  Nombre d’unités  ► Internet visible : nécessite “seulement” 5-10 To de capacité de stockage  Sept 2013: > plus de 1 milliards de recherches / jour  ► Films : http://www.imdb.org recense plus de 400 000 films  ► Images (semi-)pro : Corbis, Getty, Fotolia = 10-100 M images  Images/vidéo spécifiques : photos satellites, vidéo- surveillance (4 M en GB), 4
  5. 5.  Croissance très importante, en raison de l’accumulation des contenus  numériques auto-produits par le grand public  ► Images : par exemple, Flickr, Picasa, Facebook  → ordre de grandeur: 10-100 milliards d’images  → Facebook + 100 M d’images / jour  ► http://www.flickr.com : “9600 images uploaded in the last minute”  → extrapolation : 14M d’images par jour, 5.2G d’images par an  ► http://www.youtube.com : 2G de vidéos délivrées chaque jour + 24 de vidéo / minute  ► croissance > loi de Moore → “datacenters” 5 Croissance…
  6. 6. Applications types de BD multimedia  News: journaux, TV…  Films à la demande  Commerce électronique  Informations médicales  Systèmes d’informations géographiques  Architecture/Design  Géo-localisation  Enquêtes policières  Militaire  Expérimentations scientifiques  Enseignement  Archivage, gestion des bases de données de contenu (personnelles ou professionnelles)  Moteur de recherche (ex: Internet)  Applications industrielles 6
  7. 7. Numérisation  La plupart des informations sont distribuées sous forme de textes, d'images, de sons, de vidéo. 7
  8. 8. Numérisation des textes  Composés de caractères dits d'imprimerie, la numérisation s'opère simplement par codage de chaque caractère en une suite de 0 et de 1. Le code ASCII (American Standard Code for Information Interchange) sur 7 bits permet de coder 128 caractères usuels. Comme les ordinateurs travaillent usuellement sur des mots qui sont des multiples de mots de 8 bits (octets), on peut rajouter un 0 devant le code ASCII, ce qui correspond au code normalisé. Ainsi le caractère "A" est codé 01000010. 8
  9. 9.  Il est également possible de coder la mise en forme du texte : gras, italique, souligné, la taille des caractères, l'alignement, etc. Là encore, il n'y a pas de normalisation et les logiciels manipulant du texte possèdent encore leur propre système.  Pour un texte comportant 2000 caractères (espaces compris), sans style, la taille du fichier numérisé sera donc de 2000 octets ce qui correspond à un volume faible. 9 Numérisation des textes
  10. 10.  Le pixel :est la taille du plus petit élément de l’image. Il désigne aussi un point de la matrice image.  Un pixel possède une valeur qui peut être un scalaire et représenter un niveau de gris ou un vecteur représentant une couleur.  1) Les images dites en ”noir et blanc” sont composées de pixels binaires noirs ou blancs (chaque point est codé sur 2 bits (0 pour noir, 1 pour blanc).  2) Les images en niveaux de gris sont composées de pixels de valeurs scalaires représentant la luminosité, Pour une image avec 256 nuances de gris allant du noir total au blanc total, chaque point sera codé sur 8 bits (de 00000000 pour noir à 11111111 pour blanc) 10 Numérisation des images
  11. 11.  3) Pour une image couleur, on exprime cette couleur comme une superposition du Rouge, du Vert et du Bleu (système RVB) ; si on permet une variation de 0 à 255 pour chaque rang de couleur, une couleur quelconque sera codée comme combinaison de trois octets, soit 24 bits (2^24 donc 16 777 216 couleurs possibles) 11 Numérisation des images
  12. 12.  Pour les applications multimédias, les images sont converties en matrices de points. Chaque point est codé suivant sa "couleur" et les codes résultants sont placés séquentiellement dans un fichier, ligne par ligne, colonne par colonne Une image est définie par : lensemble de pixels qui la compose en largeur et en hauteur 12 Numérisation des images
  13. 13.  Considérons une image pour laquelle sa résolution est 640*480 points.  1) Si l'image est binaire, sa taille est de 38 400 octets,  2) Si l'image est à 256 nuances de gris, sa taille est de 307 200 octets ;  3) Si l'image possède des couleurs codées sur 24 bits, sa taille est de 921 600 octets.  Sans prendre en compte le nom de l’image et sa signature. 13 Numérisation des images
  14. 14.  Les technologies d'acquisition du son ont été longtemps analogiques : le son était représenté par les variations d'une grandeur physique, une tension électrique par exemple. Les techniques actuelles permettent d'obtenir directement un son numérisé : c'est notamment le cas des magnétophones produisant un enregistrement sur cassettes D.A.T. (Digital Audio Tapes, digitalisation du son à une fréquence de 48 KHz) . 14 Numérisation du son
  15. 15.  Pour numériser un son enregistré de manière analogique, on procède en trois étapes :  1) Echantillonnage : l'amplitude du signal analogique est mesurée à une fréquence d'échantillonnage f. On obtient ainsi une collection de mesures.  2) Quantification : une échelle arbitraire allant de 0 à 2n-1 est employée pour convertir les mesures précédentes. Une approximation est faite de manière à ce que chaque mesure coïncide avec une graduation de l'échelle (cette approximation, qui modifie légèrement le signal, est appelée bruit de quantification).  3) Codage : suivant sa grandeur dans cette nouvelle échelle, chaque mesure est codée sur n bits et placée séquentiellement dans un fichier  binaire. 15 Numérisation du son
  16. 16. 16 Numérisation du son
  17. 17.  Comme pour le son, la vidéo s'exprime par des signaux de nature analogique qu'il faut numériser pour une utilisation multimédia. Il existe ici quatre signaux à numériser : trois pour l'image et un pour le son. Les signaux d'image se répartissent en signal de luminance Y et deux signaux  de chrominance Db et Dr, reliés aux composantes R,V,B (Rouge, Vert, Bleu) par les relations linéaires  Y = 0.30R + 0.59V + 0.11B  Db = B - Y  Dr = R - Y.  La composante Y est échantillonnée à une fréquence de 13,5 MHz, tandis que les composantes de chrominance sont échantillonnées à une fréquence de 6,75 MHz. La quantification pour les trois signaux d'image s'opère sur 8 bits. 17 Numérisation de la vidéo
  18. 18.  Les données peuvent être simultanément ou ultérieurement compressées. Plusieurs systèmes sont actuellement utilisés. La compression Indéo d'Intel est utilisée dans le logiciel Vidéo For Windows (le résultat de la numérisation et de la compression conduit à des fichiers vidéo AVI).  un grand intérêt de Quick Time est sa possibilité d'intégration de données initiales diverses (images, sons, textes) et de proposer plusieurs types de compression. Les logiciels Video For Windows et Quick Time réalisent également la synchronisation du son avec les images. 18 Numérisation de la vidéo
  19. 19.  ► Objets multimédia traités comme un seul item comme champs au sein d’une base de données relationnelle (ex: Oracle, LOB –Large Object)  Recherche sur mots clés introduits manuellement dans le système par la personne : nécessité d’un système d’annotation (Tag dans xml)  ► Utilisation des relations entre objets  ► Recherche sur les mots présents dans les pages Web  conjointement avec l’objet multimédia:  http://images.google.com  http://www.exalead.fr/image  http://images.search.yahoo.com  http://youtube.com 19 Base de données pour le multimédia
  20. 20. Spécificités des bases de données multimédia (MMDB)  Exemple de requête impossible avec un SGDB “classique”:  ► récupérer tous les images “qui ressemblent” à une image requête  Grosky et Fotouhi caractérisent le multimédia à partir du type d’activité impliquée dans la création des données  L’information portée par le multimédia est tout ce qui peut venir du monde réel, alors que l’information portée par une base de données classique ne peut être qu’une représentation symbolique de faits limites a l’univers de la base de données.  Donc ,le développeur d’une MMDB ne peut expliciter tous les aspects des données qui seront importants pour l’utilisateur.  W.I. Grosky, F. Fotouhi and Z. Ziang. Multimedia data Management. 20
  21. 21. Bases de données multimédia ...  Un système de gestion de bases de données  multimédia doit :  1) offrir les mêmes caractéristiques qu’un SGBD classique (persistance, gestion des transactions, interrogation …) 2) permettre de représenter, interroger et manipuler tout type de media  Les recherches actuelles :  représentation, stockage, interrogation,  liaison image et sémantique 21
  22. 22. Intégration du multimédia dans les BD classiques  Exemple : package (ORDSYS) de classes fourni par Oracle8 pour gérer des données multimédia :  1) localData : contient les données multimédia stockées localement comme un BLOB (Binary Large Object - jusqu'à 4 GB).  2) srcType : identifie le type de source des données (FILE, HTTP, …)  3) srcLocation : identifie où les données peuvent être trouvées (dépendant de srcType (FILE -> directory, HTTP -> URL ou user-defined).  4) srcName : identifie le nom des données.  5) updateTime : la date à laquelle le fichier a été modifié pour la dernière fois.  6) local : valeur qui détermine si le fichier est local ou pas (1 = BLOB, 2 = externe). 22
  23. 23. 23
  24. 24.  Classe ORDImage pour gérer les données image sous Oracle : 1) source : source de l'image 2) height : la hauteur de l'image, en pixels 3) width : la largeur de l'image, en pixels 4) contentLength : la taille de l'image, en bytes 5) fileFormat : le type dans lequel l'image est stockée (jpg, tiff, etc) 6) contentFormat : le type de l'image (monochrome, gris 8- bit, etc) 7) compressionFormat : l'algorithme de compression (LZW, JPEG,…) 8) mimeType : le type MIME de l'image 24 Intégration du multimédia dans les BD classiques
  25. 25. 25 Recherche par annotation
  26. 26. Recherche par annotation 26
  27. 27. 27

×