SlideShare une entreprise Scribd logo
1  sur  22
RECONNAISSANCE DE FORMES
MOS 4.4
Nouvelles Technologies de
l’Information et de la Communication
PLAN DE LA PRÉSENTATION
Introduction
Possibilités
OPEN CV
Perspectives
CONCLUSION
Démarche et Orientation de la
veille
INTRODUCTION
Démarche et Orientation de la veille
Démarche et Orientation de la veille
Notre veille nous a amené à utiliser les outils suivants :
Diigo
– Pour la gestion et le partage des pages différentes information trouver sur le
web
– Enregistrement des pages et annotation
Paper.li
– Utiliser pour récupérer différente actualités sur la reconnaissance de forme et
l’analyse d’image
Tweetdeck : Pour suivre l’actualité du #vtecl
Publication : Slideshare ou Zohoshow
Outils utilisés
Possibilités de la reconnaissance de formes et
du traitement d’images
Possibilités
Reconnaissance de visages
- L’iphone X
- La “Face API“ des “Microsoft Cognitive Services” de Microsoft
- L’ API Project Oxford de Microsoft de reconnaissance d’émotion
Un des principaux problèmes des algorithmes de reconnaissances faciales est la
reconnaissance en fonction des genres de peaux et plusieurs progrès sont encore à faire
sur le sujet.
(vidéo gender shades https://www.youtube.com/watch?v=TWWsW1w-BVo )
Reconnaissance de visages
Possibilités
http://bfmbusiness.bfmtv.com/mediaplayer/video/anthony-morel-des-lunettes-a-reconnaissance-faciale-pour-
la-police-chinoise-1302-1035345.html
Tout droit sortie d’un film de science fiction américain, cette paire de lunette récemment mise en circulation au
sein de la police chinoise permet de scanner une foule et de repérer les visages d’éventuels criminels.
Elle aurait déjà fait 33 victimes dans un gare de la province de Zhenghou.
Police chinoise et lunette de reconnaissance faciale
Possibilités
La course aux améliorations dans les smartphones a amener les constructeurs vers l’utilisation de technologies
reliées au traitement d’image et à la reconnaissances de formes dans leurs appareils. Aussi on a pu voir
apparaître des scanners d’iris, reconnaissance de visage et d’expression faciale sur des téléphones. Aujourd’hui
la capacité à réaliser de telles prouesses est devenu un facteur discriminant dans le choix d’un smartphone. Un
des exemples les plus récents sur le sujet est celui de la nouvelle puce électronique pour smartphones Huawei
Kirin 970 qui a surpassé la puce Snapdragon 845 la plus puissante à ce jour. Elle est capable de traiter 2000
images par seconde. Le Kirin 970 est alimenté par un processeur à 8 cœurs et un GPU à 12 cœurs de nouvelle
génération. Construit en utilisant un processus avancé de 10nm, le chipset emballe 5,5 milliards de transistors
dans une zone de seulement un cm². Le nouveau fleuron de Huawei, Kirin 970, est la première plate-forme
informatique mobile de Huawei dotée d'une unité de traitement neural dédiée (NPU)
L’industrie des smartphones
Possibilités
Le 17 Novembre 2017 un post sur le blog de Google research annonçait : « Nous avons développé un système
de machine learning qui peut automatiquement produire une légende pour décrire avec précision les images la
première fois qu’il les voit » . Comme il l’annonçait est désormais possible de créer des descriptions textuelles
des images trouvées sur le web, grâce à un nouvel algorithme. Il s’agit d’un algorithme développé par des
ingénieurs de google et des chercheurs de Stanford. Cet algorithme est basé sur des systèmes d'apprentissage
automatique (machine-learning) et issus du monde de la traduction automatique et des Recurrent Neural
Network (RNN) / Convolutional Neural Network (CNN). On a des exemples de ses réalisations
"Un troupeau d'éléphants marche dans un champ d'herbes sèches."
LE PROJET DE GOOGLE ET STANFORD
Possibilités
Les enjeux de ce nouvel Algorithme
Faciliter la recherche et le référencement sur Google Images
Améliorer les conditions de navigation des internautes malvoyants,
Offrir des alternatives aux connexions à très faible débit
Google pourra aiguiser la classification et l’archivage de ses images. L’internaute
pourra par exemple rechercher l’intégralité des photos référencées comportant
un chapeau, un éléphant et/ou un stylo.
Mais cet algorithme n’est pas parfait . Deux principaux types d’erreurs sont
commises :
LE PROJET DE GOOGLE ET STANFORD
Possibilités
Erreurs mineurs
« Deux joueurs de hockey se disputent le palet »
Erreurs majeurs
« Un homme vole dans les airs en faisant du
snowboard »
LE PROJET DE GOOGLE ET STANFORD
OpenCV
OpenCV (pour Open Computer Vision) est une bibliothèque graphique libre,
développée par Intel, spécialisée dans le traitement d'images en temps réel.
La bibliothèque OpenCV met à disposition de nombreuses fonctionnalités très
diversifiée.
Dans le traitement de vidéos :
o lecture, écriture et affichage d’une vidéo (depuis un fichier ou une caméra)
o détection de droites, de segment et de cercles par Transformée de Hough
o détection de visages par la méthode de Viola et Jones
o détection de mouvement, historique du mouvement
o détection de points d'intérêts
o triangulation de Delaunay
o diagramme de Voronoi
OpenCV
Dans le traitement d’image:
o lecture, écriture et affichage d’une image ;
o calcul de l'histogramme des niveaux de gris ou d'histogrammes couleurs ;
o lissage, filtrage ;
o seuillage d'image (méthode d'Otsu, seuillage adaptatif)
OpenCV met aussi à la disposition de ces utilisateurs des algorithmes
d’apprentissage artificiel basiques :
o K-means
o Réseau de neurones artificiels
o Estimateur (statistique)
o Les arbres de décision et les forêts aléatoires
OpenCV
Avec OpenCV on peut réaliser énormément de choses assez interessant dont :
• Détection de visage
• Détection de main
• Détection de mouvement
• Tracking d’objet
• Détection de plaque d’immatriculation
(Vidéo sur les OpenCV https://www.youtube.com/watch?v=8h9vU1pnNZA )
Un autre système de détection d’image temps réel populaire et capable d’être implémenter
à une plus grande échelle est YOLO (You Only Look Once)
( https://www.youtube.com/watch?v=uG2UOasIx2I )
OpenCV
PERPECTIVES
En reconnaissance de forme, de nombreux défis restent
encore à relever :
Les point de vues
Les différences d’éclairages
Les parties d’images cachées
Arrières plans mixtes et camouflages
Perspectives
Le traitement d’image est entrain de connaître un essor sans précédent grâce aux
algorithmes de deep learning. Plusieurs exemples existe sur le sujet qui sera
approfondit dans la suite de la veille. Notamment celui de la reconnaissance
d’émotions. Approfondir le sujet sera un de nos objectifs en explorant des pistes
telles ques :
YOLO
DARKNET (plus grand framework open source pour deep learning en computer
vision)
Standford & Ucla travail sur des algorithmes très performant dont « Phase
Stretch Transform algorithm » qui est un algorithme à base de réseau
convolutionnel de neurones il peut être utiliser pour détecter la structure
interne d'une lampe LED qui serait impossible à analyser avec une technique
traditionnelle en raison de la luminosité. De telles qualités pourraient avoir des
applications dans le domaine astronomique sur l'observation des étoiles
distantes.
Perspectives
CONCLUSION
Reconnaissance de visages :
http://thesis.univ-
biskra.dz/944/5/Chap%202%20Etat%20de%20l%E2%80%99art%20de%20la%20reconnaissance%20de%20visage.pdf
https://www.programmez.com/tutoriels/la-reconnaissance-faciale-avec-microsoft-cognitive-service
https://www.numerama.com/tech/130443-microsoft-lance-une-api-pour-detecter-vos-emotions-sur-photos-et-ca-
marche.html
Google & Stanford’s progress :
https://www.la-revanche-des-sites.fr/blog/la-reconnaissance-dimage-google-et-stanford-avancent-main-dans-la-main
Huawei Kirin 970 :
https://www.espacemanager.com/le-huawei-kirin-970-surpasse-le-qualcomm-snapdragon-845.html
Deep learning and computer vision
https://www.analyticsvidhya.com/blog/2016/04/deep-learning-computer-vision-introduction-convolution-neural-
networks/
UCLA « « Phase Stretch Transform algorithm »
http://www.open-source-guide.com/Actualites/Les-chercheurs-de-ucla-rendent-open-source-un-algorithme-de-
reconnaissance-d-images-plus-puissant
BIBLIOGRAPHIE
A compléter…

Contenu connexe

Tendances

Réseaux des neurones
Réseaux des neuronesRéseaux des neurones
Réseaux des neuronesMed Zaibi
 
Introduction au traitement d'images
Introduction au traitement d'imagesIntroduction au traitement d'images
Introduction au traitement d'imagesAbdelouahed Abdou
 
BigData_TP4 : Cassandra
BigData_TP4 : CassandraBigData_TP4 : Cassandra
BigData_TP4 : CassandraLilia Sfaxi
 
Analyse des Sentiments -cas twitter- "Opinion Detection with Machine Lerning "
Analyse des Sentiments  -cas twitter- "Opinion Detection with Machine Lerning "Analyse des Sentiments  -cas twitter- "Opinion Detection with Machine Lerning "
Analyse des Sentiments -cas twitter- "Opinion Detection with Machine Lerning "Soumia Elyakote HERMA
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesMohamed Heny SELMI
 
SeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQLSeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQLParis, France
 
Metasploit et Metasploitable2 : exploiter VSFTPD v2.3.4
Metasploit et Metasploitable2 : exploiter VSFTPD v2.3.4 Metasploit et Metasploitable2 : exploiter VSFTPD v2.3.4
Metasploit et Metasploitable2 : exploiter VSFTPD v2.3.4 Khalid EDAIG
 
Apprentissage supervisé.pdf
Apprentissage supervisé.pdfApprentissage supervisé.pdf
Apprentissage supervisé.pdfhanamettali
 
le NLP à l'ére de l'IA
le NLP à l'ére de l'IAle NLP à l'ére de l'IA
le NLP à l'ére de l'IAhabib200
 
devoir traitement d'images
devoir traitement d'imagesdevoir traitement d'images
devoir traitement d'imagesomar bllaouhamou
 
Machine Learning et Intelligence Artificielle
Machine Learning et Intelligence ArtificielleMachine Learning et Intelligence Artificielle
Machine Learning et Intelligence ArtificielleSoft Computing
 
Conférence: Catalyseurs de l'Intelligence Artificielle et Écosystème des Fram...
Conférence: Catalyseurs de l'Intelligence Artificielle et Écosystème des Fram...Conférence: Catalyseurs de l'Intelligence Artificielle et Écosystème des Fram...
Conférence: Catalyseurs de l'Intelligence Artificielle et Écosystème des Fram...ENSET, Université Hassan II Casablanca
 

Tendances (20)

Réseaux des neurones
Réseaux des neuronesRéseaux des neurones
Réseaux des neurones
 
Big data
Big dataBig data
Big data
 
Introduction au traitement d'images
Introduction au traitement d'imagesIntroduction au traitement d'images
Introduction au traitement d'images
 
BigData_TP4 : Cassandra
BigData_TP4 : CassandraBigData_TP4 : Cassandra
BigData_TP4 : Cassandra
 
Analyse des Sentiments -cas twitter- "Opinion Detection with Machine Lerning "
Analyse des Sentiments  -cas twitter- "Opinion Detection with Machine Lerning "Analyse des Sentiments  -cas twitter- "Opinion Detection with Machine Lerning "
Analyse des Sentiments -cas twitter- "Opinion Detection with Machine Lerning "
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes Principales
 
SeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQLSeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQL
 
Metasploit et Metasploitable2 : exploiter VSFTPD v2.3.4
Metasploit et Metasploitable2 : exploiter VSFTPD v2.3.4 Metasploit et Metasploitable2 : exploiter VSFTPD v2.3.4
Metasploit et Metasploitable2 : exploiter VSFTPD v2.3.4
 
Présentation Cryptographie
Présentation CryptographiePrésentation Cryptographie
Présentation Cryptographie
 
Apprentissage supervisé.pdf
Apprentissage supervisé.pdfApprentissage supervisé.pdf
Apprentissage supervisé.pdf
 
Tp n 6 linux
Tp n 6 linuxTp n 6 linux
Tp n 6 linux
 
Deep learning
Deep learningDeep learning
Deep learning
 
arbres de decision.ppt
arbres de decision.pptarbres de decision.ppt
arbres de decision.ppt
 
Python avancé : Lecture et écriture de fichiers
Python avancé : Lecture et écriture de fichiersPython avancé : Lecture et écriture de fichiers
Python avancé : Lecture et écriture de fichiers
 
le NLP à l'ére de l'IA
le NLP à l'ére de l'IAle NLP à l'ére de l'IA
le NLP à l'ére de l'IA
 
devoir traitement d'images
devoir traitement d'imagesdevoir traitement d'images
devoir traitement d'images
 
Machine Learning et Intelligence Artificielle
Machine Learning et Intelligence ArtificielleMachine Learning et Intelligence Artificielle
Machine Learning et Intelligence Artificielle
 
Bi
BiBi
Bi
 
La Biométrie
La BiométrieLa Biométrie
La Biométrie
 
Conférence: Catalyseurs de l'Intelligence Artificielle et Écosystème des Fram...
Conférence: Catalyseurs de l'Intelligence Artificielle et Écosystème des Fram...Conférence: Catalyseurs de l'Intelligence Artificielle et Écosystème des Fram...
Conférence: Catalyseurs de l'Intelligence Artificielle et Écosystème des Fram...
 

Similaire à Reconnaissance de formes

Connected Developper Ep6 (25-05-2013)
Connected Developper Ep6 (25-05-2013)Connected Developper Ep6 (25-05-2013)
Connected Developper Ep6 (25-05-2013)Badr Hakkari
 
Connected Developer Ep3 (04-05-2013)
Connected Developer Ep3 (04-05-2013)Connected Developer Ep3 (04-05-2013)
Connected Developer Ep3 (04-05-2013)Badr Hakkari
 
Projet ROBOT MOBILE SUIVEUR DE LIGNE BASE SUR LE TRAITEMENT D'IMAGE
Projet ROBOT MOBILE SUIVEUR DE LIGNE BASE SUR LE TRAITEMENT D'IMAGEProjet ROBOT MOBILE SUIVEUR DE LIGNE BASE SUR LE TRAITEMENT D'IMAGE
Projet ROBOT MOBILE SUIVEUR DE LIGNE BASE SUR LE TRAITEMENT D'IMAGEHASSOU mohamed
 
Rapport projet UniceBot
Rapport projet UniceBotRapport projet UniceBot
Rapport projet UniceBottheoopparadigm
 
Kinect en moins de 10 Minutes
Kinect en moins de 10 MinutesKinect en moins de 10 Minutes
Kinect en moins de 10 MinutesMicrosoft
 
Présentation c2i impression 3 d
Présentation c2i impression 3 dPrésentation c2i impression 3 d
Présentation c2i impression 3 dMathis Hervé
 
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4Test
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4TestIA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4Test
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4TestMimoun Kissi 🤖
 
Conception Web 2011
Conception Web 2011Conception Web 2011
Conception Web 2011Bontempelli
 
Les écrans souples liotard guilbault tourneux ei2
Les écrans souples   liotard guilbault tourneux ei2Les écrans souples   liotard guilbault tourneux ei2
Les écrans souples liotard guilbault tourneux ei2aliotard
 
Expérience classique VS moderne sur Studio
Expérience classique VS moderne sur StudioExpérience classique VS moderne sur Studio
Expérience classique VS moderne sur StudioCristina Vidu
 
iA Générative : #ChatGPT #MidJourney
iA Générative : #ChatGPT #MidJourney iA Générative : #ChatGPT #MidJourney
iA Générative : #ChatGPT #MidJourney Hicham Sabre
 
UX Republic UX-Radar - juin 2018
UX Republic UX-Radar - juin 2018 UX Republic UX-Radar - juin 2018
UX Republic UX-Radar - juin 2018 romain landsberg
 
Nouvelles technologies émergentes - NUI Day 2015
Nouvelles technologies émergentes - NUI Day 2015Nouvelles technologies émergentes - NUI Day 2015
Nouvelles technologies émergentes - NUI Day 2015NUI Day
 
soft-shake.ch - Adoption de l'Agilité par les usages
soft-shake.ch - Adoption de l'Agilité par les usagessoft-shake.ch - Adoption de l'Agilité par les usages
soft-shake.ch - Adoption de l'Agilité par les usagessoft-shake.ch
 
Veille : L'impact de l'évolution des technologies web sur le référencement et...
Veille : L'impact de l'évolution des technologies web sur le référencement et...Veille : L'impact de l'évolution des technologies web sur le référencement et...
Veille : L'impact de l'évolution des technologies web sur le référencement et...maclic
 
La veille de Red Guy du 15.01.14 - CES 2014
La veille de Red Guy du 15.01.14 - CES 2014La veille de Red Guy du 15.01.14 - CES 2014
La veille de Red Guy du 15.01.14 - CES 2014Red Guy
 
dt_medecine_personalis.pptx
dt_medecine_personalis.pptxdt_medecine_personalis.pptx
dt_medecine_personalis.pptxnour91922
 
L'analyse qualitative informatique pas cher
L'analyse qualitative informatique pas cherL'analyse qualitative informatique pas cher
L'analyse qualitative informatique pas cherHubert Maisonneuve
 
Dossier de Conception d'OPI - DreamTime
Dossier de Conception d'OPI - DreamTimeDossier de Conception d'OPI - DreamTime
Dossier de Conception d'OPI - DreamTimeRoyer Sophie
 

Similaire à Reconnaissance de formes (20)

Eye tracking
Eye trackingEye tracking
Eye tracking
 
Connected Developper Ep6 (25-05-2013)
Connected Developper Ep6 (25-05-2013)Connected Developper Ep6 (25-05-2013)
Connected Developper Ep6 (25-05-2013)
 
Connected Developer Ep3 (04-05-2013)
Connected Developer Ep3 (04-05-2013)Connected Developer Ep3 (04-05-2013)
Connected Developer Ep3 (04-05-2013)
 
Projet ROBOT MOBILE SUIVEUR DE LIGNE BASE SUR LE TRAITEMENT D'IMAGE
Projet ROBOT MOBILE SUIVEUR DE LIGNE BASE SUR LE TRAITEMENT D'IMAGEProjet ROBOT MOBILE SUIVEUR DE LIGNE BASE SUR LE TRAITEMENT D'IMAGE
Projet ROBOT MOBILE SUIVEUR DE LIGNE BASE SUR LE TRAITEMENT D'IMAGE
 
Rapport projet UniceBot
Rapport projet UniceBotRapport projet UniceBot
Rapport projet UniceBot
 
Kinect en moins de 10 Minutes
Kinect en moins de 10 MinutesKinect en moins de 10 Minutes
Kinect en moins de 10 Minutes
 
Présentation c2i impression 3 d
Présentation c2i impression 3 dPrésentation c2i impression 3 d
Présentation c2i impression 3 d
 
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4Test
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4TestIA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4Test
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4Test
 
Conception Web 2011
Conception Web 2011Conception Web 2011
Conception Web 2011
 
Les écrans souples liotard guilbault tourneux ei2
Les écrans souples   liotard guilbault tourneux ei2Les écrans souples   liotard guilbault tourneux ei2
Les écrans souples liotard guilbault tourneux ei2
 
Expérience classique VS moderne sur Studio
Expérience classique VS moderne sur StudioExpérience classique VS moderne sur Studio
Expérience classique VS moderne sur Studio
 
iA Générative : #ChatGPT #MidJourney
iA Générative : #ChatGPT #MidJourney iA Générative : #ChatGPT #MidJourney
iA Générative : #ChatGPT #MidJourney
 
UX Republic UX-Radar - juin 2018
UX Republic UX-Radar - juin 2018 UX Republic UX-Radar - juin 2018
UX Republic UX-Radar - juin 2018
 
Nouvelles technologies émergentes - NUI Day 2015
Nouvelles technologies émergentes - NUI Day 2015Nouvelles technologies émergentes - NUI Day 2015
Nouvelles technologies émergentes - NUI Day 2015
 
soft-shake.ch - Adoption de l'Agilité par les usages
soft-shake.ch - Adoption de l'Agilité par les usagessoft-shake.ch - Adoption de l'Agilité par les usages
soft-shake.ch - Adoption de l'Agilité par les usages
 
Veille : L'impact de l'évolution des technologies web sur le référencement et...
Veille : L'impact de l'évolution des technologies web sur le référencement et...Veille : L'impact de l'évolution des technologies web sur le référencement et...
Veille : L'impact de l'évolution des technologies web sur le référencement et...
 
La veille de Red Guy du 15.01.14 - CES 2014
La veille de Red Guy du 15.01.14 - CES 2014La veille de Red Guy du 15.01.14 - CES 2014
La veille de Red Guy du 15.01.14 - CES 2014
 
dt_medecine_personalis.pptx
dt_medecine_personalis.pptxdt_medecine_personalis.pptx
dt_medecine_personalis.pptx
 
L'analyse qualitative informatique pas cher
L'analyse qualitative informatique pas cherL'analyse qualitative informatique pas cher
L'analyse qualitative informatique pas cher
 
Dossier de Conception d'OPI - DreamTime
Dossier de Conception d'OPI - DreamTimeDossier de Conception d'OPI - DreamTime
Dossier de Conception d'OPI - DreamTime
 

Reconnaissance de formes

  • 1. RECONNAISSANCE DE FORMES MOS 4.4 Nouvelles Technologies de l’Information et de la Communication
  • 2. PLAN DE LA PRÉSENTATION Introduction Possibilités OPEN CV Perspectives CONCLUSION Démarche et Orientation de la veille
  • 5. Démarche et Orientation de la veille Notre veille nous a amené à utiliser les outils suivants : Diigo – Pour la gestion et le partage des pages différentes information trouver sur le web – Enregistrement des pages et annotation Paper.li – Utiliser pour récupérer différente actualités sur la reconnaissance de forme et l’analyse d’image Tweetdeck : Pour suivre l’actualité du #vtecl Publication : Slideshare ou Zohoshow Outils utilisés
  • 6. Possibilités de la reconnaissance de formes et du traitement d’images
  • 7. Possibilités Reconnaissance de visages - L’iphone X - La “Face API“ des “Microsoft Cognitive Services” de Microsoft - L’ API Project Oxford de Microsoft de reconnaissance d’émotion Un des principaux problèmes des algorithmes de reconnaissances faciales est la reconnaissance en fonction des genres de peaux et plusieurs progrès sont encore à faire sur le sujet. (vidéo gender shades https://www.youtube.com/watch?v=TWWsW1w-BVo ) Reconnaissance de visages
  • 8. Possibilités http://bfmbusiness.bfmtv.com/mediaplayer/video/anthony-morel-des-lunettes-a-reconnaissance-faciale-pour- la-police-chinoise-1302-1035345.html Tout droit sortie d’un film de science fiction américain, cette paire de lunette récemment mise en circulation au sein de la police chinoise permet de scanner une foule et de repérer les visages d’éventuels criminels. Elle aurait déjà fait 33 victimes dans un gare de la province de Zhenghou. Police chinoise et lunette de reconnaissance faciale
  • 9. Possibilités La course aux améliorations dans les smartphones a amener les constructeurs vers l’utilisation de technologies reliées au traitement d’image et à la reconnaissances de formes dans leurs appareils. Aussi on a pu voir apparaître des scanners d’iris, reconnaissance de visage et d’expression faciale sur des téléphones. Aujourd’hui la capacité à réaliser de telles prouesses est devenu un facteur discriminant dans le choix d’un smartphone. Un des exemples les plus récents sur le sujet est celui de la nouvelle puce électronique pour smartphones Huawei Kirin 970 qui a surpassé la puce Snapdragon 845 la plus puissante à ce jour. Elle est capable de traiter 2000 images par seconde. Le Kirin 970 est alimenté par un processeur à 8 cœurs et un GPU à 12 cœurs de nouvelle génération. Construit en utilisant un processus avancé de 10nm, le chipset emballe 5,5 milliards de transistors dans une zone de seulement un cm². Le nouveau fleuron de Huawei, Kirin 970, est la première plate-forme informatique mobile de Huawei dotée d'une unité de traitement neural dédiée (NPU) L’industrie des smartphones
  • 10. Possibilités Le 17 Novembre 2017 un post sur le blog de Google research annonçait : « Nous avons développé un système de machine learning qui peut automatiquement produire une légende pour décrire avec précision les images la première fois qu’il les voit » . Comme il l’annonçait est désormais possible de créer des descriptions textuelles des images trouvées sur le web, grâce à un nouvel algorithme. Il s’agit d’un algorithme développé par des ingénieurs de google et des chercheurs de Stanford. Cet algorithme est basé sur des systèmes d'apprentissage automatique (machine-learning) et issus du monde de la traduction automatique et des Recurrent Neural Network (RNN) / Convolutional Neural Network (CNN). On a des exemples de ses réalisations "Un troupeau d'éléphants marche dans un champ d'herbes sèches." LE PROJET DE GOOGLE ET STANFORD
  • 11. Possibilités Les enjeux de ce nouvel Algorithme Faciliter la recherche et le référencement sur Google Images Améliorer les conditions de navigation des internautes malvoyants, Offrir des alternatives aux connexions à très faible débit Google pourra aiguiser la classification et l’archivage de ses images. L’internaute pourra par exemple rechercher l’intégralité des photos référencées comportant un chapeau, un éléphant et/ou un stylo. Mais cet algorithme n’est pas parfait . Deux principaux types d’erreurs sont commises : LE PROJET DE GOOGLE ET STANFORD
  • 12. Possibilités Erreurs mineurs « Deux joueurs de hockey se disputent le palet » Erreurs majeurs « Un homme vole dans les airs en faisant du snowboard » LE PROJET DE GOOGLE ET STANFORD
  • 14. OpenCV (pour Open Computer Vision) est une bibliothèque graphique libre, développée par Intel, spécialisée dans le traitement d'images en temps réel. La bibliothèque OpenCV met à disposition de nombreuses fonctionnalités très diversifiée. Dans le traitement de vidéos : o lecture, écriture et affichage d’une vidéo (depuis un fichier ou une caméra) o détection de droites, de segment et de cercles par Transformée de Hough o détection de visages par la méthode de Viola et Jones o détection de mouvement, historique du mouvement o détection de points d'intérêts o triangulation de Delaunay o diagramme de Voronoi OpenCV
  • 15. Dans le traitement d’image: o lecture, écriture et affichage d’une image ; o calcul de l'histogramme des niveaux de gris ou d'histogrammes couleurs ; o lissage, filtrage ; o seuillage d'image (méthode d'Otsu, seuillage adaptatif) OpenCV met aussi à la disposition de ces utilisateurs des algorithmes d’apprentissage artificiel basiques : o K-means o Réseau de neurones artificiels o Estimateur (statistique) o Les arbres de décision et les forêts aléatoires OpenCV
  • 16. Avec OpenCV on peut réaliser énormément de choses assez interessant dont : • Détection de visage • Détection de main • Détection de mouvement • Tracking d’objet • Détection de plaque d’immatriculation (Vidéo sur les OpenCV https://www.youtube.com/watch?v=8h9vU1pnNZA ) Un autre système de détection d’image temps réel populaire et capable d’être implémenter à une plus grande échelle est YOLO (You Only Look Once) ( https://www.youtube.com/watch?v=uG2UOasIx2I ) OpenCV
  • 18. En reconnaissance de forme, de nombreux défis restent encore à relever : Les point de vues Les différences d’éclairages Les parties d’images cachées Arrières plans mixtes et camouflages Perspectives
  • 19. Le traitement d’image est entrain de connaître un essor sans précédent grâce aux algorithmes de deep learning. Plusieurs exemples existe sur le sujet qui sera approfondit dans la suite de la veille. Notamment celui de la reconnaissance d’émotions. Approfondir le sujet sera un de nos objectifs en explorant des pistes telles ques : YOLO DARKNET (plus grand framework open source pour deep learning en computer vision) Standford & Ucla travail sur des algorithmes très performant dont « Phase Stretch Transform algorithm » qui est un algorithme à base de réseau convolutionnel de neurones il peut être utiliser pour détecter la structure interne d'une lampe LED qui serait impossible à analyser avec une technique traditionnelle en raison de la luminosité. De telles qualités pourraient avoir des applications dans le domaine astronomique sur l'observation des étoiles distantes. Perspectives
  • 21. Reconnaissance de visages : http://thesis.univ- biskra.dz/944/5/Chap%202%20Etat%20de%20l%E2%80%99art%20de%20la%20reconnaissance%20de%20visage.pdf https://www.programmez.com/tutoriels/la-reconnaissance-faciale-avec-microsoft-cognitive-service https://www.numerama.com/tech/130443-microsoft-lance-une-api-pour-detecter-vos-emotions-sur-photos-et-ca- marche.html Google & Stanford’s progress : https://www.la-revanche-des-sites.fr/blog/la-reconnaissance-dimage-google-et-stanford-avancent-main-dans-la-main Huawei Kirin 970 : https://www.espacemanager.com/le-huawei-kirin-970-surpasse-le-qualcomm-snapdragon-845.html Deep learning and computer vision https://www.analyticsvidhya.com/blog/2016/04/deep-learning-computer-vision-introduction-convolution-neural- networks/ UCLA « « Phase Stretch Transform algorithm » http://www.open-source-guide.com/Actualites/Les-chercheurs-de-ucla-rendent-open-source-un-algorithme-de- reconnaissance-d-images-plus-puissant BIBLIOGRAPHIE