Reconnaissance de formes

RECONNAISSANCE DE FORMES
MOS 4.4
Nouvelles Technologies de
l’Information et de la Communication

PLAN DE LA PRÉSENTATION
Introduction
Possibilités
OPEN CV
Perspectives
CONCLUSION
Démarche et Orientation de la
veille

Démarche et Orientation de la veille

Démarche et Orientation de la veille
Notre veille nous a amené à utiliser les outils suivants :
Diigo
– Pour la gestion et le partage des pages différentes information trouver sur le
web
– Enregistrement des pages et annotation
Paper.li
– Utiliser pour récupérer différente actualités sur la reconnaissance de forme et
l’analyse d’image
Tweetdeck : Pour suivre l’actualité du #vtecl
Publication : Slideshare ou Zohoshow
Outils utilisés

Possibilités de la reconnaissance de formes et
du traitement d’images

Possibilités
Reconnaissance de visages
- L’iphone X
- La “Face API“ des “Microsoft Cognitive Services” de Microsoft
- L’ API Project Oxford de Microsoft de reconnaissance d’émotion
Un des principaux problèmes des algorithmes de reconnaissances faciales est la
reconnaissance en fonction des genres de peaux et plusieurs progrès sont encore à faire
sur le sujet.
(vidéo gender shades https://www.youtube.com/watch?v=TWWsW1w-BVo )
Reconnaissance de visages

Possibilités
http://bfmbusiness.bfmtv.com/mediaplayer/video/anthony-morel-des-lunettes-a-reconnaissance-faciale-pour-
la-police-chinoise-1302-1035345.html
Tout droit sortie d’un film de science fiction américain, cette paire de lunette récemment mise en circulation au
sein de la police chinoise permet de scanner une foule et de repérer les visages d’éventuels criminels.
Elle aurait déjà fait 33 victimes dans un gare de la province de Zhenghou.
Police chinoise et lunette de reconnaissance faciale

Possibilités
La course aux améliorations dans les smartphones a amener les constructeurs vers l’utilisation de technologies
reliées au traitement d’image et à la reconnaissances de formes dans leurs appareils. Aussi on a pu voir
apparaître des scanners d’iris, reconnaissance de visage et d’expression faciale sur des téléphones. Aujourd’hui
la capacité à réaliser de telles prouesses est devenu un facteur discriminant dans le choix d’un smartphone. Un
des exemples les plus récents sur le sujet est celui de la nouvelle puce électronique pour smartphones Huawei
Kirin 970 qui a surpassé la puce Snapdragon 845 la plus puissante à ce jour. Elle est capable de traiter 2000
images par seconde. Le Kirin 970 est alimenté par un processeur à 8 cœurs et un GPU à 12 cœurs de nouvelle
génération. Construit en utilisant un processus avancé de 10nm, le chipset emballe 5,5 milliards de transistors
dans une zone de seulement un cm². Le nouveau fleuron de Huawei, Kirin 970, est la première plate-forme
informatique mobile de Huawei dotée d'une unité de traitement neural dédiée (NPU)
L’industrie des smartphones

Possibilités
Le 17 Novembre 2017 un post sur le blog de Google research annonçait : « Nous avons développé un système
de machine learning qui peut automatiquement produire une légende pour décrire avec précision les images la
première fois qu’il les voit » . Comme il l’annonçait est désormais possible de créer des descriptions textuelles
des images trouvées sur le web, grâce à un nouvel algorithme. Il s’agit d’un algorithme développé par des
ingénieurs de google et des chercheurs de Stanford. Cet algorithme est basé sur des systèmes d'apprentissage
automatique (machine-learning) et issus du monde de la traduction automatique et des Recurrent Neural
Network (RNN) / Convolutional Neural Network (CNN). On a des exemples de ses réalisations
"Un troupeau d'éléphants marche dans un champ d'herbes sèches."
LE PROJET DE GOOGLE ET STANFORD

Possibilités
Les enjeux de ce nouvel Algorithme
Faciliter la recherche et le référencement sur Google Images
Améliorer les conditions de navigation des internautes malvoyants,
Offrir des alternatives aux connexions à très faible débit
Google pourra aiguiser la classification et l’archivage de ses images. L’internaute
pourra par exemple rechercher l’intégralité des photos référencées comportant
un chapeau, un éléphant et/ou un stylo.
Mais cet algorithme n’est pas parfait . Deux principaux types d’erreurs sont
commises :

Possibilités
Erreurs mineurs
« Deux joueurs de hockey se disputent le palet »
Erreurs majeurs
« Un homme vole dans les airs en faisant du
snowboard »

OpenCV (pour Open Computer Vision) est une bibliothèque graphique libre,
développée par Intel, spécialisée dans le traitement d'images en temps réel.
La bibliothèque OpenCV met à disposition de nombreuses fonctionnalités très
diversifiée.
Dans le traitement de vidéos :
o lecture, écriture et affichage d’une vidéo (depuis un fichier ou une caméra)
o détection de droites, de segment et de cercles par Transformée de Hough
o détection de visages par la méthode de Viola et Jones
o détection de mouvement, historique du mouvement
o détection de points d'intérêts
o triangulation de Delaunay
o diagramme de Voronoi
OpenCV

Dans le traitement d’image:
o lecture, écriture et affichage d’une image ;
o calcul de l'histogramme des niveaux de gris ou d'histogrammes couleurs ;
o lissage, filtrage ;
o seuillage d'image (méthode d'Otsu, seuillage adaptatif)
OpenCV met aussi à la disposition de ces utilisateurs des algorithmes
d’apprentissage artificiel basiques :
o K-means
o Réseau de neurones artificiels
o Estimateur (statistique)
o Les arbres de décision et les forêts aléatoires
OpenCV

Avec OpenCV on peut réaliser énormément de choses assez interessant dont :
• Détection de visage
• Détection de main
• Détection de mouvement
• Tracking d’objet
• Détection de plaque d’immatriculation
(Vidéo sur les OpenCV https://www.youtube.com/watch?v=8h9vU1pnNZA )
Un autre système de détection d’image temps réel populaire et capable d’être implémenter
à une plus grande échelle est YOLO (You Only Look Once)
( https://www.youtube.com/watch?v=uG2UOasIx2I )
OpenCV

En reconnaissance de forme, de nombreux défis restent
encore à relever :
Les point de vues
Les différences d’éclairages
Les parties d’images cachées
Arrières plans mixtes et camouflages
Perspectives

Le traitement d’image est entrain de connaître un essor sans précédent grâce aux
algorithmes de deep learning. Plusieurs exemples existe sur le sujet qui sera
approfondit dans la suite de la veille. Notamment celui de la reconnaissance
d’émotions. Approfondir le sujet sera un de nos objectifs en explorant des pistes
telles ques :
YOLO
DARKNET (plus grand framework open source pour deep learning en computer
vision)
Standford & Ucla travail sur des algorithmes très performant dont « Phase
Stretch Transform algorithm » qui est un algorithme à base de réseau
convolutionnel de neurones il peut être utiliser pour détecter la structure
interne d'une lampe LED qui serait impossible à analyser avec une technique
traditionnelle en raison de la luminosité. De telles qualités pourraient avoir des
applications dans le domaine astronomique sur l'observation des étoiles
distantes.
Perspectives

Reconnaissance de visages :
http://thesis.univ-
biskra.dz/944/5/Chap%202%20Etat%20de%20l%E2%80%99art%20de%20la%20reconnaissance%20de%20visage.pdf
https://www.programmez.com/tutoriels/la-reconnaissance-faciale-avec-microsoft-cognitive-service
https://www.numerama.com/tech/130443-microsoft-lance-une-api-pour-detecter-vos-emotions-sur-photos-et-ca-
marche.html
Google & Stanford’s progress :
https://www.la-revanche-des-sites.fr/blog/la-reconnaissance-dimage-google-et-stanford-avancent-main-dans-la-main
Huawei Kirin 970 :
https://www.espacemanager.com/le-huawei-kirin-970-surpasse-le-qualcomm-snapdragon-845.html
Deep learning and computer vision
https://www.analyticsvidhya.com/blog/2016/04/deep-learning-computer-vision-introduction-convolution-neural-
networks/
UCLA « « Phase Stretch Transform algorithm »
http://www.open-source-guide.com/Actualites/Les-chercheurs-de-ucla-rendent-open-source-un-algorithme-de-
reconnaissance-d-images-plus-puissant
BIBLIOGRAPHIE

Reconnaissance de formes

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (20)

Similaire à Reconnaissance de formes

Similaire à Reconnaissance de formes (20)

Reconnaissance de formes