1
Le plan Première partie : Introduction       1-Kinect       2-Squelettisation Deuxième partie :Les données        1-L’im...
Première partieIntroduction                  3
Introduction        Le monde réel est composé essentiellement d’objetstridimensionnels. Une des tâches principales d’un sy...
KinectKinect, initialement connu sous le nom de code Project Natal1 est unpériphérique destiné à la console de jeux vidéo ...
ProjecteurIR(Infrarouge)RGB(Red Green Blue)                      6
Squelettisation        Décrire un objet par une         représentation de type "squelette"         constitue une étape im...
Deuxième partieLes données                  8
Les données 2 problèmes font faces au développement du domaine :    - Génération d’images réalistes en utilisant lestechn...
Les données1/-Image de profondeur (1)    Cam kinect résolution de 640*480 donnant 30 image/seconde                        ...
Les données 1/-Profondeur d’imagerie (2)Caractéristiques de la Cam Kinect :       -fonctionne en faible luminosité .      ...
Les données2/-Données de capture de mouvements (1)   Problème :          La variété de mouvement du corps                ...
Les données2/-Données de capture de mouvements (2) Solution :utilisation de la mocap C’est quoi la mocap (La capture de ...
Les données2/-Données de capture de mouvements (3)Les enregistrements pris avec des sujet de largecorpuscule:- pas de capt...
Les données2/-Données de capture de mouvements (4)               1iers résultats obtenus   Acceptables ,mais ne couvrent p...
Les données3/-Générations de données synthétiques (1)                L’objectif de cette étape Avoir une succession d’ima...
Les données3/-Générations de données synthétiques (2)                                             17
Troisième partieProposition donnée pour les positions          du corps humain                                        18
Proposition donner pour les positions du corps humain            1/-Etiquetage des parties du corps (1) Répartition du co...
Proposition donner pour les positions du corps humain      2/- Caractéristique de l’image de profondeur(1)  Croix jaune = ...
Proposition donner pour les positions du corps humain     2/-Caractéristique de l’image de profondeur(2)   DI ( x ) =   Pr...
Proposition donner pour les positions du corps humain              3/-Foret de décision randomiséeArbres et forêt de décis...
Proposition donner pour les positions du corps humain     4/-Proposition pour les positions communes Pixel =information p...
Quatrième partieExpériences                   24
Expériences  Dans cette section, nous décrivons desexpériences réalisées au évaluer notre méthode.  Nous montrons à la foi...
Expériences4.1. Les résultats qualitatifs(1)                                    26
Expériences        4.2. précision de la classification(1)    Nous étudions leffet de plusieurs paramètresde formation sur ...
Expériences4.2. précision de la classification(2)                   Silhouette dimages. Nous montrons aussi              ...
Expériences4.2. précision de la classification(3)                                         29
Expériences4.2. précision de la classification(4)                     nous montre la formation des images                ...
Conclusion La kinect est un appareil très récent qui offre encore de  nombreuses opportunités pour les années à venir.  L...
32
Prochain SlideShare
Chargement dans…5
×

Real time human pose recognition in parts from single

412 vues

Publié le

0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
412
Sur SlideShare
0
Issues des intégrations
0
Intégrations
2
Actions
Partages
0
Téléchargements
18
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Real time human pose recognition in parts from single

  1. 1. 1
  2. 2. Le plan Première partie : Introduction 1-Kinect 2-Squelettisation Deuxième partie :Les données 1-L’image de profondeur 2-Données de capture de mouvement 3-Génération des données de synthétiques Troisième partie : Partie du corps et proposition conjointes 1-Etiquetage des partie du corps 2-Caracteristiques de l’image de profondeur 3-Foret de décision randomisée 4-Propositions pour les positions communes Quatrième partie : Expériences 1-Résultats qualitatifs 2-Précision de la classification• Cinquième partie : Conclusion 2
  3. 3. Première partieIntroduction 3
  4. 4. Introduction Le monde réel est composé essentiellement d’objetstridimensionnels. Une des tâches principales d’un systèmede vision artificielle est de pouvoir identifier et localiserces objets à partir d’informations reçues del’environnement. La reconnaissance d’objets a pour but d’extraireautomatiquement et efficacement le contenu intéressant,pertinent et utile de la scène c’est-à-dire de déterminerl’identité des objets formant la scène et leur dispositionspatiale dans le contexte d’une tâche ou d’un processus àréaliser. 4
  5. 5. KinectKinect, initialement connu sous le nom de code Project Natal1 est unpériphérique destiné à la console de jeux vidéo Xbox 360permettant decontrôler des jeux vidéo sans utiliser de manette, 5
  6. 6. ProjecteurIR(Infrarouge)RGB(Red Green Blue) 6
  7. 7. Squelettisation  Décrire un objet par une représentation de type "squelette" constitue une étape importante dans un certain nombre d’applications relevant du domaine du traitement des images ou de la reconnaissance de formes. 7
  8. 8. Deuxième partieLes données 8
  9. 9. Les données 2 problèmes font faces au développement du domaine : - Génération d’images réalistes en utilisant lestechnologies informatiques . -La position du corps de synthèse qui va être sujetd’étude en utilisant la «mocap»(malgré l’ éxistance deplusieurs logiciel et application permettant de simuler lemouvement humain) . 9
  10. 10. Les données1/-Image de profondeur (1) Cam kinect résolution de 640*480 donnant 30 image/seconde 10
  11. 11. Les données 1/-Profondeur d’imagerie (2)Caractéristiques de la Cam Kinect : -fonctionne en faible luminosité . -permet de résoudre le problèmes d’ambiguïté dessilhouettes des personnes utilisées comme sujet . -élimine les problèmes liés aux textures de vêtements,leur couleur et la formes des cheveux . -Synthétisation des images réalistes de profondeurs,cela donne un ensemble de données de grandes formation . 11
  12. 12. Les données2/-Données de capture de mouvements (1)  Problème : La variété de mouvement du corps humain Difficulté de simulation 12
  13. 13. Les données2/-Données de capture de mouvements (2) Solution :utilisation de la mocap C’est quoi la mocap (La capture de mouvements) ?? Mocap : une technique permettant de capter les mouvements dun élément réel afin de les renvoyer dans un univers virtuel : les mouvements sont enregistrés ou restitués en temps réel vers dautres systèmes. Base de données de la mocap utilisés est d’environ500 kcadres . 13
  14. 14. Les données2/-Données de capture de mouvements (3)Les enregistrements pris avec des sujet de largecorpuscule:- pas de capture de mocap avec rotation sur un axe vertical- la mise en miroir de la scène de gauche a droite aussi la forme du corps et la taille .- Aucune information temporelle n’est prise en charge 14
  15. 15. Les données2/-Données de capture de mouvements (4) 1iers résultats obtenus Acceptables ,mais ne couvrent pas la totalité du corps de synthèse utilisé 15
  16. 16. Les données3/-Générations de données synthétiques (1) L’objectif de cette étape Avoir une succession d’images réalistes et variantes 16
  17. 17. Les données3/-Générations de données synthétiques (2) 17
  18. 18. Troisième partieProposition donnée pour les positions du corps humain 18
  19. 19. Proposition donner pour les positions du corps humain 1/-Etiquetage des parties du corps (1) Répartition du corps humain en partie grâce a des pièces lumineuses couvrant le corps permettant la localisation des articulations et le squelette humain . Les pièces lumineuses sont placés sur une combinaison utilisés sur différents personnes Pour l’ expérience 31 parties du corps seront utilisées 19
  20. 20. Proposition donner pour les positions du corps humain 2/- Caractéristique de l’image de profondeur(1) Croix jaune = le pixel x Cercle rouge = pixel compensé tq le définit l’ équation 20
  21. 21. Proposition donner pour les positions du corps humain 2/-Caractéristique de l’image de profondeur(2) DI ( x ) = Profondeur de x pixels de l’image U et V = Paramètres de compensation 21
  22. 22. Proposition donner pour les positions du corps humain 3/-Foret de décision randomiséeArbres et forêt de décision randomisés ont prouvé leur efficacité et rapidité pouravoir un classificateurs multi-classes pour de nombreuses tâches, ils peuvent êtreappliquées efficacement sur le GPU .une forêt est un ensemble darbres de décision T, chacun composé de diviser et denœuds ou feuilles. Chaque nœud est constitué dun diviseur de fonctionnalité.Pour classer x pixel dans limage I, on commence de la racine et on évalue plusieursreprises 22
  23. 23. Proposition donner pour les positions du corps humain 4/-Proposition pour les positions communes Pixel =information pour avoir la reconnaissance des partie du corps Résultats accumulés =possibilité de faire un auto-suivi permettant aussi la récupération en cas d’ echec 23
  24. 24. Quatrième partieExpériences 24
  25. 25. Expériences Dans cette section, nous décrivons desexpériences réalisées au évaluer notre méthode. Nous montrons à la fois des résultats qualitativeset quantitatives sur plusieurs jeux de donnéesdifficiles, et de comparer avec les deux plusproches voisins des approches et lEtat de lart . 25
  26. 26. Expériences4.1. Les résultats qualitatifs(1) 26
  27. 27. Expériences 4.2. précision de la classification(1) Nous étudions leffet de plusieurs paramètresde formation sur la précision de la classification.Les tendances sont fortement corrélés entre lesensembles de test synthétiques et réelles, et levéritable test mis en apparaît constamment plus«facile» que lensemble de test synthétique,probablement dû à la moins varié poseactuellement. 27
  28. 28. Expériences4.2. précision de la classification(2)  Silhouette dimages. Nous montrons aussi dans la Fig. 6 (a) la qualité de notre approche sur des images de synthèse silhouette, où les fonctions dans léquation 1 sont donnés soit léchelle (comme la profondeur moyenne) ou non (une profondeur constante fixée). Pour larticulation correspondante prédiction utilisant une métrique 2D avec un effet positif de 10 pixels vraie seuil, nous avons obtenu 0,539 MAP avec léchelle et 0,465 mAP sans. Sil est clair que la tâche des ambiguïtés en raison de la profondeur, Ces résultats suggèrent lapplicabilité de notre approche dautres modalités dimagerie. 28
  29. 29. Expériences4.2. précision de la classification(3) 29
  30. 30. Expériences4.2. précision de la classification(4)  nous montre la formation des images 5k, où «maximum offset de la sonde », le max. valeur absolue proposé pour les deux coordonnées x et y de u et v dans léquation. 1. Le concentriques cases sur la droite montrent loff 5 maximale testée jeux calibrés pour un pixel épaule gauche dans cette image, le plus compensée couvre presque tout le corps. (Rappelons que cette décalage maximum des échelles avec la profondeur du monde du pixel). Comme la sonde décalage maximum est augmenté, le classificateur est capable à utiliser le contexte plus spatial pour rendre ses décisions, même si sans suffisamment de données finirait risques sur-apprentissage à cette contexte. Augmente la précision avec la sonde décalage maximum, si les niveaux hors environ 129 mètres de pixels. 30
  31. 31. Conclusion La kinect est un appareil très récent qui offre encore de nombreuses opportunités pour les années à venir. Létude de ses caractéristiques prouve que cest un appareil fiable. Cependant on peut voir quon aura du mal à obtenir des résultats très précis. Dun autre côté, la stéréoscopie permet dobtenir des résultats aux premiers abords moins bons, mais qui peuvent être améliorés avec de meilleures caméras et des conditions optimales. Ainsi, avant de chercher à modéliser lensemble dune main, il faut trouver une technologie qui nous permette dobtenir des résultats précis et convainquant pour la modélisation 3D. 31
  32. 32. 32

×