Présentation du Projet sur l'application de l'intelligence artificielle sur le cancer du sein chez la femme. Si vous êtes intéressé par les travaux du document merci de me contacter par mail aicha01galledou@gmail.com
1. Université Cheikh Anta DIOP de Dakar
Faculté des Sciences et Techniques
Département Mathématiques et Informatique
Laboratoire d’Algèbre de Cryptologie de
Géométrie Algébrique et Applications
LACGAA
Master Transmission de Données et Sécurité de
l’Information
Thème :
Présenté et soutenu par:
Mlle. Aichétou Djimé GALLÉDOU
Sous la direction du:
Dr. Ousmane NDIAYE
Année Académique 2017 – 2018
Étude et Implémentation d’un Outil d’aide à
la Décision Médicale Basé sur l’intelligence
artificielle: Cas du Cancer du Sein chez la
Femme
5. 3
I . 1.Etape de mise en place de l’outil
Étape #1
Étape #2
Étape #3
Étape #4
Étape #5
Connaissance Préalables et
Objectifs dans le domaine Choix et Training du Modèle
Déployer le Modèle,
Obtenir les prédictions à
partir du modèle
entraîner
Collecte, Sélection et
Prétraitement des Données
Test sur les Données
Interprétation des Résultats
7. 5
ACR 0 : signifie incomplet.
ACR 1 : signifie normal.
ACR 2 : bénin.
ACR 3 : probablement bénin mais à surveiller.
ACR 4 : lésion indéterminée ou suspecte.
ACR 5 : anomalie évoquant un cancer.
ACR 6 : Biopsie connue malignité prouvé
II. Problématique
Les ACR 4 et 5 impliquent des examens
complémentaires. Les mammographies classées
1 et 2 sont revues en deuxième lecture par un
second radiologue
La patiente se voit remettre un compte rendu et le
résultat de sa mammographie selon une classification
établie par l’American college of radiology.
10. Type A
A
Type B
B
Type C
C
Type D
D
Type A
GRAISSE > GLANDE
Chez les femmes âgées
Type B
GRAISSE = GLANDE
Type C
GRAISSE < GLANDE
Type D
GLANDULAIRE
chez les jeunes filles
8 III. 2. Anatomie du sein
11. 9 III. 4. Symptômes
Liquide verdâtre ou
sanglant sortant du
mamelon
La peau ride
Une boule ou une
masse apparait dans le
sein ou sous l’aisselle
Le mamelon
change
d’apparence
La peau change de
couleur ou de
texture
12. Taille du sein
Rétraction, ride, rougeur
Position de la masse
Masse dure ou Molle
Lors de la visite chez le medecin celui-ci consulte la patiente pour voir les
signes suivantes:
10
III. 4. Signes
Douloureuse ou Indolore
13. 05
Localisé dans un seul endroit
02
Homogène
03
Peut gonfler
01
Contours bien délimité
11
06
Ne contamine pas les autres organes
07
N’entraine pas de métastases
08
N’entraine pas le décès
III.5. Critère Tumeurs
Bénignes
15. 13 III. 8. Métastases
Propagation de la tumeur malignes dans les autres organes tels que :
Les Os Le Foie Le Cerveau
Les Poumons
16. 14 III. 7.Calcification
La Calcification représente l’aspect dur et rigide d’une tumeur
Ils existe deux types
o Macrocalcifications sont des dépôts
grossier représentant le plus souvent des
tumeurs bénignes
o Microcalcifications apparaissent de petite
taille isolées ou regroupé en grappe, il
s’agit du plus souvent des cellules
cancéreuses
17. L'âge
Les facteurs génétiques
Les risques hormonaux
L’alimentation
Le tabac
15
III. 8. Facteurs de risques
La pilule
THM : Traitement Hormonal de la Ménopause
Antécédent de Cancer
18. 16
III. 9.Types Histologiques du cancer du sein
Cancer du Sein Non-
Infiltrant In situ
Cancer Lobulaire In
Situ (CLIS)
Cancer canalaire In
Situ (CCIS)
Cancer canalaire
Infiltrant (CCI)
Cancer Lobulaire
Infiltrant(CLI)
Cancer du Sien
Infiltrant
21. 19 III. 9.Types Histologiques du cancer du sein
Cancer canalaire Infiltrant (CCI)
22. 20 III. 9.Types Histologiques du cancer du sein
Cancer Lobulaire Infiltrant(CLI)
23. 17
III. 10. Diagnostic
La Microbiopsie
echoguidée
La cytoponction
L’échographie
La Mammographie
La Mammographie
Clichés (images) en noir et blanc
effectué aux rayons X
L’échographie
Images en temps réel effectué avec
des ultrasons.
La cytoponction
Prélevement de cellules ou de liquide
sur la tumeur.
La Microbiopsie échoguidée
Prélèvement de fragment de tissus
sur la tumeur.
33. 3
IV. 4. Intelligence Artificiel
27
100% programmés par
l’Homme.
Phase 3
Horizon 2030
Phase 2
2010 – aujourd’hui
Phase 1
1960 - 2010
Machine Learning &
Deep Learning
Horizontale
/ Transversale
Algorithmes
On ne programme plus
les machines. On les
éduque !
Capable de multiplier
les disciplines et de les
croiser.
Phase 4
Inconnue
La phase ultime
Intelligence
artificielle FORTE
Intelligence conceptuelle:
- Langage
- Raisonnements
complexes
35. 29
V. Machine Learning
Machine
Learning
Machine Learning est une moyen d’enseigner une
machine en alimentant d’une grande quantité de
données.
Un Modèle est un formule mathématique résultant
de la mise en œuvre d'un algorithme ML.
Les algorithmes ML sont des concepts théoriques qui
décrivent ce qu’il faut faire pour une tache spécifique.
36. 30
V. 1. Apprentissage Machine
1
2
3
4
5
01 Données d’Entrainement
02 Apprentissage
03 Analyse des erreurs ensuite le
Modèle statique est créé
04 Application du Modèle sur les
nouvelles données
05 Prédictions
38. 32
Régression Classification Association Classification Clustering Control
Prédiction
du prix d’une
maison
Imagerie
Médicale
Segmentation
des Données
Analyses
du Panier
des produits
Classification
Texte
Lane-Finding
sur les
Données GPS
Voiture
Autonome
Types d’apprentissage en
Machine Learning
Marketing
Réseaux
Variable
cible
continue
Unsupervised
Learning
Semi-Supervised
Learning
Supervised
Learning
Variable
cible
disponible
Variable
cible non
disponible
Clustering
Variable cible catégorique
Variable cible non
disponible
Variable
cible
catégorique
Reinforcement
Learning
Classification
39. 33
V. 3. SUPERVISED LEARNING
Le supervised Learning consiste à donner à la machine un ensemble de données labellisés
en entrée (données d’entraînement) et il est composé de deux catégories qui sont:
Les problèmes de
Régression
Les problèmes de
Classification
40. V. 4. SUPERVISED LEARNING
34
Supervised Learning soit un ensemble d’apprentissage composé
de 𝑁 exemples de pair entrée-sortie :
(𝒙 𝟏
, 𝒚 𝟏
), (𝒙 𝟐
, 𝒚 𝟐
), … , (𝒙 𝑴
, 𝒚 𝑴
)
Chaque 𝑦(𝑖)
a été généré par une fonction 𝑭 𝒙 = 𝒚 inconnue, le
but est découvrir la fonction 𝑓 qui se rapproche de 𝐹.
En représentation un peu plus mathématiques en Surpervised Learning,
on reçoit en entrer des données d’exemple annotées : (x 1,y1), (x2,y2),
(x3,y3),… et on prédit la sortie sur une nouvelle observation : x∗
→ y∗
41. 35
V. 5. UNSUPERVISED LEARNING
Modèle
Trouver les
patterns
Chercher les
ensembles
L’ensemble des données
d’apprentissage
42. 36
V. 6. UNSUPERVISED LEARNING
Unsupervised Learning dans ce cas l’algorithme doit découvrir par lui-
même les structures des données les ciblées selon leurs attributs
disponibles, pour les classer en groupes.
Et on découvre la relation avec des variables latentes structurelles :
𝑥𝑖 → 𝑦𝑖
En représentation un peu plus mathématiques en l’apprentissage non-
supervisé, on reçoit uniquement des observations brutes de variables
aléatoires : 𝒙𝟏, 𝒙𝟐, 𝒙𝟑, 𝒙𝟒, 𝒙𝟓, …
54. Avantages :
oCapacité à découvrir les dépendances par lui-même ;
o Résistance aux bruits.
Inconvénients
o C’est un modèle boite noire qui n’explique pas ses
décisions.
V. 9. Avantage et Inconvénients
48
56. VI. 1. Concept du Deep Learning
50
Synapse Neuronale
Réseaux de Neurones simple
Réseaux de Neurones profonds
57. VI. 2. Les Différents Types D’architecture Deep
Learning
51
Deep Neural Network (DNN)
Deep Belief Network
Les Réseaux de Neurones Réccurents
Les Réseaux de Neurones Convolutionels
58. 52 Relation entre IA, ML et DL
Technique qui permet aux
machines d'imiter le
comportement humain
Sous-ensemble de l‘Intelligence
Artificielle (IA) utilisant des
méthodes statistiques pour
permettre aux machines de
s'améliorer avec l'expérience
Sous-ensemble du Machine
Learning (ML) permettant le
calcul d'un réseau de neurones
multicouches
77. 1994
2012
2013
2014
2014
2015
Alexnet
Alex Krizhevsky,
Ila Sutskerer et
Geoffrey Hinton
Le Net
Yann LeCun
ZFnet
Matthew Zeiler et
Rob Fergus
VGGNet
VGG (Groupe de
Géométrie Visuelle)
de l'Université
d'Oxford.
GoogleNet
/Inception
L’équipe de
chercheur de Google.
ResNet
L’équipe de
chercheur de
Microsoft.
VII. 13. Les modèles pré-entrainés célèbres
71
81. 75
VIII. 3. Résultats et Interprétations
Trois (3) Types de classification
Création de 3 ensemble d’apprentissages
suivant les labels ci-dessous.
Classification binaire
Normal et Anormal
Classification Normal, Bénin et Malin
Classification Normal, Bénin Mass,
Bénin Calcification, Malin Mass, Malin
Calcification
99% 68% 39%
Le terme décision médical renvoi au choix d’une action à faire.
Selon la complexité pour la prise de décision, il est souvent utile de faire appel à une aide extérieur.
Le processus de la décision médical consiste entre autres à poser le diagnostic.
Dans le cas du cancer du sein cette diagnostic passe par un ensemble d’examen dont la mammographie qui est l’examen de premier instance cet diagnostic doit être précis et rapide pour que le médecin puissent proposer un traitement ou différer.
Or avec la prouesse de calcul des machines
Le stockage massif des données dans les serveurs
On est entrain d’assister à un monde completement boulverser par l’accroissement des performance de l’IA notamment avec le ML, DL.
Notre objectif seras de trouver de donnée mammographie et une machine puissant pour faire un apprentissage machine avec les mammographies.
Pourquoi ce projet cancer Et IA
De nos jours on est l’avennement de palier l’informatique à la médecine
Aide à la décision mais la décision final c’est le médecin qui décider à la fin
associer la médecine avec l’informatique
1.Comprendre le domaine, les connaissances préalables et les objectifs
2. Collecte, Sélection, nettoyage et prétraitement des données
3. Modèles d'apprentissage
4. Tester et Interprétation des résultats
5. Consolidation et déploiement des connaissances découvertes
ACR 0 nécessite une évaluation d'imagerie supplémentaire et / ou une mammographie antérieure à des fins de comparaison.
https://www.diagnosticimaging.com/article/confused-about-bi-rads-0-here-are-guidelines-help-you-along
Un sein normal est reparti en quatre types :
Type A : le sein présente plus de graisse que de glande (chez les personnes âgées) ;
Type B : le sein présente plus de glande que de graisse ;
Type C : le sein présente plus de glande que de graisse ;
Type D : le sein est glandulaire et tout à fait blanc (chez les jeunes filles).
Selon les cas observés, une ablation chirurgicale peut être nécessaire
Maligne propagation de la tumeur metastas
L’age : rare chez les moins de 30ans risque augmente entre 50 et 75
Les facteurs génétiques: si ql dans la famille (mère, grand-mère, tante..) prensence dans les chromosomes contrairement au maladie infectieuse
Les Risques hormonaux: puberté précoce ou ménopause tardive, enfant tardive
Alimention: Obésité, Consommation d’alcool, faible consomation de fruit et legumes
Le tabac: passif(inhaler involontérement) comme actif
La pilule: conception orale
THM: traitement Hormonal de la ménopause
Antécédent de cancer: recidive
FIG page 18: Cancer du sein Non-Infiltrant In situ: le cancer est dans les glandes ou le conduit du lait
Cancer canalaire In Situ (CCIS):cellules cancéreuses qui se sont formés dans les conduits du canal galactophore et bouche le conduit
Cancer Lobulaire In Situ (CLIS):CC dans les glande mammaire
Cancer du sien Infiltrant
Cancer canalaire Infiltrant (CCI): Sur les parois canaux galactorphores
Cancer du Sein Lobulaire Infiltrant(CLI): Risque plus élever d’être dans les deux seins
Page 24
MedioLateral-Oblique:MLO
Mammographie examen de 1 ere intension pour diagnostiquer une anomalie dans le sein CANCER DU SEIN la mammographie est plus spécifique
Page 25
Page 26
L'intelligence artificielle (IA) est « l'ensemble de théories et de techniques mises en œuvre en vue de réaliser des machines capables de simuler l'intelligence ».
La technologie émergente de l'intelligence artificielle, ou IA, croise plusieurs techniques simulant les processus cognitifs humains.
'intelligence artificielle vise à comprendre comment fonctionne la cognition humaine et à la reproduire.
Les chatbots = ROBO
Et autres voiture autonomes qui ne fonctionne que sur la reconnaissance d’images
Tous intelligence actuel sont devenue indispensable
Phase1: phase des algorithmes
Phase2: ‘est la phase actuelle on programme pas les IA on les éduque! (transversale font une seule chose mais le fais bien)
Phase 3 : multiplier les taches
Phase 4:Concience d’elle-même et de son environnement
Livre: La guerre des intelligence de Laurent Alexandre : Chirurgien- Urologue
Page 35
jusqu’à ce que le nombre de tour sur les données soit terminer
Catégories=Branches=Types
Le mot « Supervisé » vient du fait que les données doivent être attribué par un humain donc un superviseur.
Un modèle de régression est un modèle de ML dont les sorties y sont des nombres (exemple: la température de demain). Un modèle de classification est un modèle de ML dont les sorties y appartiennent à un ensemble fini de valeurs (exemple : bon, mauvais).
NN : proposé par Warren McCulloch et Walter Pitts en 1943
Poids = Weight
La fonction d’activation d’un nœud definit la sortie de ce nœud à partir d’un entré ou un ensemble d’ensemble d’entré comme ce que illustre ce shemas (c’est la sortie d’un nœud )
Deep Learning Neural Network = Réseaux de Neurones profonds d’où le mot Deep
NN = Réseaux de Neurones simple
Le DNN prend en compte des paramètre tels que la taille(nbre couche et unités par couche) le réseaux parcours les couches en calculant la probabilités de chaque sortie
Le Deep Belief Network est un algorithme d'apprentissage non supervisé. Il est composé de plusieurs couches de nœuds cachées.
Les Réseaux de Neurones Réccurents sont des NN dans lequels l’info peut se propager dans les deux sens, en cela, ils sont plus proches du vrai fonctionnement du système nerveux, qui n’est pas à sens unique(classification des video)
Les Réseaux de Neurones Convolutionels : est inspirée de celle du cortex visuel des mammifères utilisé dans la classification des images
Matrice
Profondeur 3 couleur
Chaque couleur codé sous 8 bits
Diminuer le volume de l’image
Profondeur appliqué des noyaux sur l’images
Le Pas: nombre de pixels décalé
Forcé force les neurones à retouné une valeur positif lors du classement
Calcul de la moyenne
Enseignat – Eleve :un "transfert" d'informations du savant au novice
Un modèle pré-entrainé peut ne pas être précis à 100% dans des applications, mais il épargne d'énormes efforts pour réinventer la roue.
Ce sont les modèles qui sont déjà implémenté dans une API célèbre dont on va en parler par la suite.
LeNet: lecture code postaux
AlexNet plus pronfond, plus grand couche convolution empilé(60M de paramètre)
Inception: AVG pooling à la fin du réseau ce qui élimine une grande quantité de paramètre (4M paramètre)
basés sur l’idée 3 × 3 de VGGNet à d’autres fins ou dans d’autres domaines le plus célèbre est VGG16 et VGG19.
VGGNet: le premier finaliste et non le gagnant du concours ILSVRC (concours de reconnaissance visuelle à grande échelle ImageNet ) 2014
VGGNet bat GoogLeNet et a remporté la tâche de localisation dans ILSVRC 2014
Valid la machine s’auto evalut au cours de l’apprentissage
Remarque : Plus nos labels augmentent plus le pourcentage de prédiction diminue. En conséquent il faut plus de temps d’apprentissage pour avoir d'excellents résultats. Cependant, après 5 jour d’apprentissage, la mémoire de la machine est saturée, il ne répond plus. Donc on s’est arrêté à un training de 120 passage sur les données durant 5 jour.
Test clinique sont effectué toujours sur des animaux en premier ensuite sur des humains
Les médicaments que nous buvons ont été tester sur des animaux avant donc nous allons faire la même chose avant tous
Cette application est destinée à soutenir le personnel de santé dans leurs prises de décisions.
Limite 99,99 pourquoi pas 100%
Domaine en plein recherche
J’ai parler avec startupper américain installer au japon
Limite pas de machine puissant Si le docteur sais pas ou se trouve l’anomalie => collaboration future pour continuer
Oscar wilde
Travailler avec des mammographies locales
Faire le training (l’apprentissage) avec des machines dotés de GPU ou TPU puissantes en calcul avec bcp de mémoire RAM
Travailler avec des modèles plus profond
Faire la détection de l’anomalie sur l’image