SlideShare une entreprise Scribd logo
Université Cheikh Anta DIOP de Dakar
Faculté des Sciences et Techniques
Département Mathématiques et Informatique
Laboratoire d’Algèbre de Cryptologie de
Géométrie Algébrique et Application
LACGAA
Thème :
Étude et Implémentation d’un Outil d’aide à la
Décision Médicale sur Basé l’intelligence
artificielle : cas du Cancer du Sein chez la
Femme
Présenté et soutenu par:
Mlle. Aichétou Djimé GALLÉDOU
Sous la direction du:
Dr. Ousmane NDIAYE
Jury :
Président : Pr. Cheikh Thiécoumba GUEYE UCAD
Membres : Pr. Agrégé. Boucar NDONG UCAD
Dr. Ousmane NDIAYE UCAD
Dr. Jean Klamti BELO UCAD
Master Transmission de Données et Sécurité de l’Information
Année Académique 2017 – 2018
i
I propose to consider the question, “Can machines think”?
A computer would deserve to be called intelligent if it could deceive a
human into believing that it was human.
- Alan Turing, Mathématicien et Cryptanalyste -
ii
DÉDICACES
Je dédie ce modeste travail :
À ma mère, ma meilleure amie, ma confidente, ma conseillère, la prunelle de
mes yeux Hawa Bocar Diagana pour l’Amour et le soutien inconditionnel
qu’elle me donne chaque jour certes, je ne serais pas là où je suis aujourd’hui
sans ses conseils, toutes les lettres du monde ne sauraient trouver les mots pour
que je puisse exprimer tout ce que j’ai sur le cœur pour elle. Aucun hommage
ne pourra être à la hauteur de l’Amour qu’elle me porte, qui ne cesse de me
combler qu'ALLAH la procure une bonne santé et une longue vie et je prie
qu’il nous réunît dans FIRDAWS son PARADIS ETERNEL ;
À mon père Djimé Dahaba Gallédou qui guide mes pas chaque jour, qui est
un exemple pour moi, qui a fait de moi la personne que je suis aujourd’hui
par son Amour, ces conseils, son soutien, je ne saurais exprimer l’Amour, la
gratitude, le respect et la reconnaissance que j’ai pour lui. Aucun hommage
ne pourra être à la hauteur de l’Amour qu’il me porte qui ne cesse de me
combler qu'ALLAH lui procure une bonne santé, une longue vie et je prie
qu’il nous réunît dans FIRDAWS son PARADIS ETERNEL.
À mon oncle Tahara Dahaba Gallédou que j'aime beaucoup qui a guidé
mes premiers pas à l'école, mon premier jour que je n’oublierais jamais en
fermant seulement les yeux, je peux remémorer ce souvenir mémorable, toi
qui ne cesse de me donner des Douas à chaque fois qu'on se
parle qu'ALLAH t'accorde AL-FIRDAWS son PARADIS ETERNEL.
À mes frères, mes sœurs, mes amis, à toutes les membres de ma famille et à mes
camarades avec qui j'ai partagé ces années d'études à mes voisines djiboutiennes
et comoriennes, je prie pour chacun de vous, qu'ALLAH vous accorde tout ce
que vous voulez dans la vie qui est bon pour vous et l'au-delà.
iii
REMERCIEMENTS
« Au nom d'Allah, le Tout Miséricordieux le très Miséricordieux et paix et salut sur Mouhamad
Rassoulilah son serviteur »
Alhamdoulil’Allah, Ô ALLAH à toi la louange jusqu’à ce que tu agrées, à toi la Louange
lorsque tu as agréé et à toi la louange après l’agrément, Louange à toi dans toutes les situations,
à toi la Louange tout comme tu dis et mieux que ce que nous disons, merci à toi le tout-puissant
et le tout miséricordieux de m'avoir donnée la patience et le courage durant ces années d’étude,
de m’avoir donné la santé et la volonté d’entamer et de terminer ce mémoire.
Je tiens à remercier mon encadreur le Docteur Ousmane Ndiaye pour l'orientation, la
confiance et la patience qui ont constitué un apport considérable sans lequel ce travail n’aurait
pas pu être mené.
Je tiens à remercier Mr. Cheikh Djibril Sow pour sa grande générosité et pour ses bonnes
explications qui m’ont éclairé le chemin dans l’accomplissement de ce travail.
Je tiens à remercier les membres du jury pour l’intérêt qu’ils ont porté à ce mémoire acceptant
d’examiner et de l’enrichir par leurs propositions particulièrement au Professeur Boucar Ndong de
la Faculté de Médecine de Pharmacie et d’odontologie.
Mes profonds remerciements s’adressent à tous les membres du corps professoral de la TDSI
de m’avoir accompagné tout au long de ces 5 années de formation certes ils m’ont beaucoup
appris, avec générosité et patience.
Je tiens à remercier le Docteur Ibrahima Diakhaté de m'avoir accueilli au Centre d'Imagerie
Diagnostique et Interventionnelle, certes bon nombre de personnes m'ont fermé leur porte au
nez et vous avez ouvert le vôtre je vous en serai toujours reconnaissante.
Un grand merci au Dr. Dialla Traoré, au Dr. Mouhamed Diawara et à Mr. Ibrahima Soccé
Radiologue technicien à CIDIS.
iv
A LA MEMOIRE DE
Tous ceux qui ont contribué à mon éducation, à ma formation et à ceux qui étaient là pour moi,
mes rayons de soleil et qui ne sont plus là malheureusement.
Mes grands Parent :
- Mariam Moussa Séméga
- Maro Moussa Séméga
- Mohamed Moussa Séméga
- Bakary Moussa Séméga
- Djénéba Lakhami Séméga
- Bocar Diagana
- Dahaba Djimé Gallédou
- Assa Diagana
- Assa Tandia
- Gniouma Kandé Magassouba
- Aminéta Doungou
Mon Oncle Hadya Kaou Diagana
Ma petite sœur et Mon petit frère :
- Maro Djimé Gallédou
- Bocar Djimé Gallédou
Mes professeurs :
- Nima Kanté
- Ba Khassoum
Certes, la mort nous a séparé vous êtes plus là ainsi est le destin de chaque être humain, mais je
ne vous oublierai jamais vous resterez à jamais dans mon cœur jusqu’à mon dernier souffle.
Reposez en paix qu’ALLAH vous accorde AL-FIRDAWS SON PARADIS ÉTERNEL.
v
AVANT-PROPOS
Laboratoire d’Algèbre, de Cryptographie, de Géométrie Algébrique et Applications
(LACGAA): objectifs et Domaine de recherche.
Depuis 2004, le laboratoire LACGAA est le seul de la sous-région spécialisé sur la formation
et la recherche en cryptographie et dans les domaines de la sécurité de l’information. Le
laboratoire LACGAA a déjà formé en master, plus de 100 titulaires du master 2 (niveau
ingénieur) qui travaillent dans les entreprises en France, aux USA, au Sénégal et dans la sous-
région ; et en licence, plus de 40 techniciens. En Thèse, le labo est entrain de former plus de 10
thèses en codage et cryptologie à Dakar et en France dont 5 ont terminés.
Sous la direction du Professeur Mamadou Sangharé, le laboratoire LACGAA a pour
objectifs:
1. La formation à la recherche fondamentale et appliquée dans les domaines de La
Cryptographie, de la Théorie des codes, de l’Algèbre, de la Géométrie et de leurs
applications (en logique, en informatique, en sécurité de l’information, en biologie, en
robotique etc.) par :
 des enseignements pour les jeunes doctorants durant leur première année
d’inscription en thèse ;
 l’encadrement des jeunes doctorants durant toute la durée de leur thèse ;
 la mise en place d’un cadre approprié pour l’épanouissement des jeunes
doctorants.
2. L’organisation de la recherche par la mise en place d’un cadre approprié pour
l’épanouissement des chercheurs et le développement de la recherche ;
3. la création de licences et de masters professionnels et recherches en algèbre, géométrie
et leur application notamment en sécurité informatique les principaux domaines de
recherche sont l’algèbre et ses différentes applications : Algèbre commutative, algèbre
non commutative, algèbre associative, algèbre non associative; géométrie algébrique
commutative et non commutative, Homologie et Cohomologie, Théorie algébrique et
analytique des nombres, Cryptographie, Théorie des Codes Correcteurs d’Erreurs,
Théorie du signal Informatique théorique, Sécurité informatique etc.
vi
SOMMAIRE
INTRODUCTION GÉNÉRALE---------------------------------------------------------------------- 1
PARTIE I :CADRE THÉORIQUE ET MÉTHODOLOGIQUE ------------------------------ 2
CHAPITRE 1: CADRE THÉORIQUE----------------------------------------------------------- 3
INTRODUCTION-------------------------------------------------------------------------------- 3
1.1. PROBLÉMATIQUE-------------------------------------------------------------------- 3
1.2. LES OBJECTIFS DU PROJET ------------------------------------------------------- 3
1.3. LES HYPOTHÈSES DE RECHERCHE -------------------------------------------- 4
1.4. LA PERTINENCE DU SUJET ------------------------------------------------------- 4
CONCLUSION ----------------------------------------------------------------------------------- 4
CHAPITRE 2: CADRE MÉTHODOLOGIQUE ---------------------------------------------- 5
INTRODUCTION-------------------------------------------------------------------------------- 5
2.1. TECHNIQUES D’INVESTIGATION ----------------------------------------------- 5
2.2. PRÉSENTATION DES DONNÉES MAMMOGRAPHIQUES ----------------- 5
2.3. DIFFICULTÉS RENCONTRÉES---------------------------------------------------- 6
CONCLUSION ----------------------------------------------------------------------------------- 7
PARTIE II : CADRE ANALYTIQUE ET IMPLÉMENTATION ---------------------------- 8
CHAPITRE 1: LE CANCER DU SEIN----------------------------------------------------------- 9
INTRODUCTION-------------------------------------------------------------------------------- 9
1.1. ANATOMIE DU SEIN----------------------------------------------------------------- 9
1.2. SYMPTÔMES ET SIGNES ----------------------------------------------------------10
1.3. TUMEURS DU SEIN ----------------------------------Erreur ! Signet non défini.
1.4. CANCER DU SEIN--------------------------------------------------------------------12
1.5. TYPES HISTOLOGIQUES DU CANCER DU SEIN----------------------------15
1.6. CLASSIFICATION TNM ------------------------------------------------------------18
1.7. EVOLUTION ---------------------------------------------------------------------------20
1.8. DIAGNOSTICS ------------------------------------------------------------------------21
1.9. TRAITEMENTS -----------------------------------------------------------------------26
CONCLUSION ----------------------------------------------------------------------------------26
CHAPITRE 2: INTELLIGENCE ARTIFICIELLE------------------------------------------28
INTRODUCTION-------------------------------------------------------------------------------28
2.1. PRÉSENTATION DE L’INTELLIGENCE ARTIFICIELLE-------------------28
2.2. HISTOIRE DE L’INTELLIGENCE ARTIFICIELLE----------------------------29
2.3. LES DIFFÉRENTS TYPES D’INTELLIGENCE ARTIFICIELLE------------29
CONCLUSION ----------------------------------------------------------------------------------32
CHAPITRE 3: MACHINE LEARNING --------------------------------------------------------33
INTRODUCTION-------------------------------------------------------------------------------33
4.1. PRÉSENTATION DU MACHINE LEARNING----------------------------------33
4.2. LA COLLECTE DE DONNÉES ----------------------------------------------------34
4.3. LA MODÉLISATION-----------------------------------------------------------------35
4.4. LA TÂCHE À ACCOMPLIR --------------------------------------------------------36
4.5. LES DIFFÉRENTS TYPES D’APPRENTISSAGE ------------------------------36
vii
4.6. LES ALGORITHMES D’APPRENTISSAGE-------------------------------------39
4.7. LE SURAPPRENTISSAGE ----------------------------------------------------------59
4.8. LA RÉGULARISATION -------------------------------------------------------------61
4.9. LE SOUS-APPRENTISSAGE -------------------------------------------------------62
CONCLUSION ----------------------------------------------------------------------------------63
CHAPITRE 4: DEEP LEARNING---------------------------------------------------------------64
INTRODUCTION-------------------------------------------------------------------------------64
4.1. PRÉSENTATION DU DEEP LEARNING ----------------------------------------64
4.2. LES DIFFÉRENTS TYPES D’ARCHITECTURE DEEP LEARNING-------67
CONCLUSION ----------------------------------------------------------------------------------69
CHAPITRE 5: LES RÉSEAUX DE NEURONES CONVOLUTIONELS ---------------70
INTRODUCTION-------------------------------------------------------------------------------70
5.1. PRÉSENTATION DES RÉSEAUX DE NEURONES CONVOLUTIONELS --
-----------------------------------------------------------------------------------------------------70
5.2. TRANSFER LEARNING EN CNN-------------------------------------------------80
CONCLUSION ----------------------------------------------------------------------------------84
CHAPITRE 6: IMPLÉMENTATION ----------------------------------------------------------86
INTRODUCTION-------------------------------------------------------------------------------86
6.1. PRÉSENTATION DES OUTILS----------------------------------------------------86
6.2. IMPLÉMENTATION -----------------------------------------------------------------92
6.3. PRÉ -TRAITEMENT ET DATA AUGMENTATION---------------------------94
6.2. ARCHITECTURE ET APPRENTISSAGE DU MODÉLE----------------------95
6.3. RÉSULTATS OBTENUS ET INTERPRETATIONS----------------------------96
6.4. PRÉSENTATION DE L’INTERFACE------------------------------------------- 105
CONCLUSION -------------------------------------------------------------------------------- 107
CONCLUSION GÉNÉRALE ET PERSPECTIVES------------------------------------------ 108
BIBLIOGRAPHIE ET WEBOGRAPHIE------------------------------------------------------- 109
viii
LISTE DES FIGURES
Figure 1: Structure anatomique du sein...................................................................................... 9
Figure 2: Présentation d'une tumeur du sein vue de face. ........................................................ 15
Figure 3: Cancer canalaire in situ (CCIS) - Macroscopie à gauche et histologie à droite. ...... 16
Figure 4: Cancer lobulaire in situ (CLIS) - Macroscopie à gauche et histologie à droite........ 16
Figure 5: Cancer canalaire infiltrant......................................................................................... 17
Figure 6: Cancer canalaire infiltrant (CCI) - Macroscopie à gauche et histologie à droite. .... 17
Figure 7: Cancer lobulaire infiltrant(CLI) - Macroscopie à gauche et histologie à droite....... 17
Figure 8: Le mamographe. ...................................................................................................... 21
Figure 9: Mammographie montrant une tumeur au sein vue d'en face à gauche et vue de profil
à droite. ............................................................................................................................. 22
Figure 10: Résultat d'un examen de mammographique. ......................................................... 23
Figure 11: Échographie montrant une masse kystique............................................................. 24
Figure 12: Cytoponction d'une tumeur..................................................................................... 25
Figure 13: histologie d'une bénigne et d'une tumeur maligne.................................................. 25
Figure 14: Étapes de l’apprentissage en ML............................................................................ 35
Figure 15: Illustration de la différence entre régression linéaire et classification linéaire. ..... 37
Figure 16: Exemple de représentation de Régression Linéaire................................................ 40
Figure 17: Prix d’une maison par sa taille................................................................................ 40
Figure 18: Une relation linéaire. .............................................................................................. 41
Figure 19: Représentation de la perte dans un cas de régression linéaire. ............................... 42
Figure 20: Représentation de Perte élevée dans le modèle à gauche, perte faible dans le modèle
à droite. ............................................................................................................................. 43
Figure 21: Fonction sigmoïde. ................................................................................................. 45
Figure 22: Résultat de la régression logistique. ....................................................................... 46
Figure 23: Taux de VP et de FP pour différents seuils de classification. ................................ 50
Figure 24: AUC (aire sous la courbe ROC). ............................................................................ 51
Figure 25: L’algorithme k-means regroupe les données en k cluster, ici k = 3. Les centres de
gravité sont représentés par de petits cercles. ................................................................... 52
Figure 26: Pour k = 3 la classe majoritaire du point central est la classe B, mais si on change la
valeur du voisinage k = 6 la classe majoritaire devient la classe A.................................. 52
Figure 27: On cherche un hyperplan qui divise les observations en deux catégories.............. 54
ix
Figure 28: Exemple d’un problème non linéairement séparable. La courbe devient une bande
linéaire après avoir appliqué la transformation non-linéaire. ........................................... 55
Figure 29: Neurone du cerveau humain. .................................................................................. 55
Figure 30: Réseau de neurone artificiel.................................................................................... 56
Figure 31: Représentation d’un neurone artificiel.................................................................... 57
Figure 32: Représentations de différentes fonctions d'activation............................................. 58
Figure 33: Représentation d’un Rétro-Propagation du Gradient. ............................................ 59
Figure 34: Perte de l'ensemble d'apprentissage et de l'ensemble de validation........................ 61
Figure 35: La relation entre l’intelligence artificielle, le ML et le Deep Learning.................. 64
Figure 36: Synapse Neuronale. ................................................................................................ 65
Figure 37: Comparaison entre un NN et un Deep Learning Neural Network ......................... 66
Figure 38: Représentation des trois couleurs RVB en proportion égale.................................. 70
Figure 39: Matrice de matrice RVB......................................................................................... 71
Figure 40: Réseau de neurones avec plusieurs couches convolutives...................................... 72
Figure 41: Une matrice d’image multipliée par un noyau ou filtre de matrice........................ 72
Figure 42: Exemple de matrice d’image multiplie la matrice de noyau ou de filtre................ 73
Figure 43: Convolution d'une matrice avec 2 pas de pixels..................................................... 76
Figure 44: Exemple d’application du ReLU. ........................................................................... 77
Figure 45: Max-Pooling avec un filtre 2x2. ............................................................................. 78
Figure 46: Average Pooling avec un filtre 2x2. ....................................................................... 78
Figure 47: Aplatissement d'une matrice.................................................................................. 79
Figure 48: Mise en pool en tant que couche FC....................................................................... 79
Figure 49: Illustration du Transfer Learning............................................................................ 80
Figure 50: Architecture du modèle LeNet................................................................................ 81
Figure 51: Architecture du modèle AlexNet............................................................................ 82
Figure 52: Architecture du modèle Inception V3 de Google. .................................................. 82
Figure 53: Architecture du modèle VGGNet. .......................................................................... 83
Figure 54: Étude comparative des différents modèles VGGNet.............................................. 83
Figure 55: Architecture du modèle ResNet.............................................................................. 84
Figure 56: Le taux d’erreur dans ImageNet Visual recognition Challenge. ............................ 84
Figure 57: Python..................................................................................................................... 86
Figure 58: Theano. ................................................................................................................... 87
Figure 59: TensorFlow............................................................................................................. 87
x
Figure 60: Keras....................................................................................................................... 88
Figure 61: PYTORCH.............................................................................................................. 89
Figure 62: Croissance de popularité de TensorFlow................................................................ 90
Figure 63: Logo Flask. ............................................................................................................. 91
Figure 64: Jinja......................................................................................................................... 91
Figure 65: MySQL. .................................................................................................................. 91
Figure 66: Répartition des données dans les dossiers cas normal/anormal.............................. 92
Figure 67: Répartition des données dans les dossiers cas normal, bénin et malin................... 93
Figure 68: Répartition des données dans les dossiers cas normal et bénin/malin(masse et
calcification)...................................................................................................................... 93
Figure 69: Architecture de notre modèle.................................................................................. 96
Figure 70: Architecture du modèle - cas normal/anormal........................................................ 97
Figure 71: Résultat obtenu - cas normal/anormal. ................................................................... 98
Figure 72: Histogrammes de l’apprentissage et de la validation du cas normal/anormal........ 98
Figure 73: Test sur les données cas normal/anormal - Matrice de confusion. ......................... 99
Figure 74: Architecture du modèle - cas normal, bénin et malin........................................... 100
Figure 75: Résultat obtenu - cas normal, bénin et malin........................................................ 100
Figure 76: Histogrammes de l’apprentissage et de la validation du cas normal, malin et bénin.
......................................................................................................................................... 101
Figure 77: Test sur les données cas normal, bénin et malin - Matrice de confusion. ............ 101
Figure 78: Architecture du modèle - cas normal et bénin/malin (masse et calcification)...... 102
Figure 79: Résultat obtenu - cas normal et bénin/malin (masse et calcification)................... 103
Figure 80: Histogrammes de l’apprentissage et de la validation du cas normal et
malin/bénin(masse et calcification). ............................................................................... 103
Figure 81: Test sur les données cas normal et bénin/malin(masse et calcification): Matrice de
confusion......................................................................................................................... 104
Figure 82: Présentation de l'interface de l'application............................................................ 105
Figure 83: Inscription et connexion d'un utilisateur............................................................... 106
Figure 84: Aperçus de la base de données MySQL (les mots de passe sont chiffrés). .......... 106
Figure 85: Test de prédiction sur une mammographie dans l'interface de l'application. ....... 107
xi
LISTES DES TABLEAUX
Tableau 1: Classification TNM................................................................................................ 19
Tableau 2: Classification de cancer du sein par stade.............................................................. 20
Tableau 3: Gradient du Linéaire régression. ............................................................................ 44
Tableau 4: Classification vrai ou faux et positif ou négatif. ................................................... 49
Tableau 5: Histoire du Deep Learning. .................................................................................... 67
Tableau 6: Quelques exemples d'effets pouvant être obtenus par la convolution des noyaux et
des images......................................................................................................................... 75
Tableau 7: Nombre d’étoile par framework sur github............................................................ 90
Tableau 8: Interprétation des résultats cas normal/anormal..................................................... 99
Tableau 9: Interprétation des résultats cas normal, bénin et malin. ....................................... 102
Tableau 10: Interprétation des résultats cas normal et bénin/malin(masse et calcification).. 104
xii
LISTE DES ABRÉVIATIONS
ACR American College of Radiology
AND Acide DésoxyriboNucléique
av. J.-C. Avant Jesus-Christ
API Application Programming Interface
ASI Artificial SuperIntelligence
AUC Area Under Curv
BI-RADS Breast Imaging-Reporting And Data System
CC Cranio-Caudal
CCIS Cancer Canalaire In situ
CBIS-DDSM Curated Breast Imaging Subset of DDSM
CIDIS Centre d'Imagerie Diagnostique et Interventionnelle de Soumbédioune
CNN Convolutional Neural Network
CPU Central Processing Unit
DAI Distributed Artificial Intelligence
DBN Deep Belief Network
DDSM Digital Database for Screening Mammography
DL Deep Learning
DNN Deep Neural Network
FCFA Franc Communauté Financière Africaine
FN Faux Négatif
FP Faux Positif
GPU Graphics Processing Unit
IA Intelligence Artificielle
xiii
IARC International Agency for Research on Cancer
IID Indépendantes et Identiquement Distribuées
ILSVRC ImageNet Large Scale Visual Recognition Competition
IRM Imagerie par Résonance Magnétique
KNN K-Nearest Neighbors
MCP McCulloch–Pitts
MGH Massachusetts General Hospital
MILA Montreal Institute for Learning Algorithms
ML Machine Learning
MLO MedioLateral-Oblique
MSE Mean Squared Error
NLP Natural Langage Processing
NN Neural Network
RAM Random-Access Memory
RNN Recurrent Neural Network
ROC Receiver Operating Characteristic
ROI Region Of Interest
SVM Support Vector Machine
TCIA The Cancer Imaging Archive
TPU Tensor Processing Unit
UAMS University of Arkansans for Medical Sciences
VGG Visual Geometry Group
VN Vrai Négatif
VP Vrai Positif
xiv
WFU Wake Forest University
WUSTL Washington University of St. Louis School of Medicine
1
INTRODUCTION GÉNÉRALE
INTRODUCTION GÉNÉRALE
Le diagnostic et la prévention dans les hôpitaux et dans les établissements de soin de santé sont
des tâches difficiles pour le personnel médical qualifié. Le personnel médical n’a pas souvent
la possibilité d’observer chacun de ces patients à temps plein et faire des diagnostics précis très
rapidement. Bien que le personnel médical soit efficace pour identifier les besoins immédiats,
ils ne parviennent pas toujours à faire le diagnostic des pathologies sur la base d’un
interrogatoire et d’un examen clinique. Il a souvent recours à des moyens de diagnostic
biologique et d’imagerie médicale. Malgré cet arsenal utilisé, il peut avoir recours au traitement
de l’image dans sa forme matricielle pour une aide un diagnostic. C’est pourquoi au cours de
ces dernières années, avec le récent accroissement des performances de l’Intelligence
Artificielle (IA) notamment avec le Machine Learning (ML), le Deep Learning (DL), le
stockage massif des données sur des serveurs et la prouesse des calculs des machines, nous
assistons à une véritable révolution. En effet, l’avènement de l’IA a permis de nombreux
avancées dans le traitement de l’image améliorant ainsi le diagnostic médical.
Ce présent document s’articule en deux parties :
première partie : la problématique, les objectifs, la pertinence du sujet, les techniques
d’investigation et les difficultés rencontrés ;
deuxième partie : le cancer du sein, l’intelligence artificielle, le Machine Learning, le
Deep Learning, les réseaux de neurones convolutionels (CNN), le prétraitement, la
labélisation des données, l’implémentation de notre modèle de prédiction et la
présentation des résultats et de l’application.
2
PARTIE I : CADRE THÉORIQUE ET MÉTHODOLOGIQUE
3
CHAPITRE 1 : CADRE THÉORIQUE
CHAPITRE 1: CADRE THÉORIQUE
INTRODUCTION
La médecine est la science qui accompagne l’humanité depuis des millénaires. C’est la
discipline qui cherche à préserver la santé physique et mentale des êtres humains par la
prévention et le traitement des maladies. Au fur et à mesure qu’on avance dans le temps, de
nouvelles maladies sont découvertes et d’autres sont devenues plus fréquentes. L’ampleur et
les progrès de l’imagerie, le développement des tests biologiques, ainsi que la mise sur le
marché de nouveaux médicaments et d’autres procédures thérapeutiques ont beaucoup amélioré
la prise en charge des patients. Dans ce présent chapitre, nous aborderons la problématique
rencontrée lors d’un diagnostic de cancer du sein, les objectifs et les hypothèses de recherche
puis la pertinence de notre sujet.
1.1. PROBLÉMATIQUE
Les performances médicales bien qu’elles soient très évoluées en terme de diagnostic ne
permettent pas de faire le diagnostic différentiel de certaines pathologies médicales. Et même
si le diagnostic de cancer est fait la stadification peut souvent poser de sérieux problèmes. C’est
pourquoi nous collaborons avec ces médecins en utilisant les algorithmes mathématiques pour
une aide au diagnostic et à la classification des tumeurs mammaires. Celles-ci étaient stratifiées
jusque-là sur la base d’une interprétation qui faisaient intervenir l’expérience du radiologue
mais également le pouvoir discriminatoire de l’œil humain malgré une relecture par un autre
radiologue pour établir la classification ACR de BI-RADS. Ce qui justifie notre étude.
1.2. LES OBJECTIFS DU PROJET
L’objectif de ce présent mémoire est de concevoir un outil (une application) possédant un
modèle intelligent et performant pour la classification des images mammographiques en faisant
appel à l’intelligence artificielle afin d’assister le médecin (le radiologue) dans son
raisonnement en vue d’identifier rapidement, efficacement et avec une certaine précision la
présence d’une anomalie dans une mammographie. Ceci serait plus facile à réaliser en utilisant
les réseaux de neurones artificiel. Ce qui nous permettra d’être plus précis, d’obtenir un gain en
matière de temps et de réaliser des économies. De ce fait, on améliore la prise en charge des
patients respectant les bonnes pratiques cliniques, le médecin outillé pourra réaliser des tâches
4
complexes, plus rapide avec une certaine précision. Cette application permettra au radiologue
de prédire le cas de la présence d’une anomalie dans une mammographie qui résultera par des
examens plus approfondies.
1.3. LES HYPOTHÈSES DE RECHERCHE
La mammographie permet de prendre une décision dans le cas de la présence d’une anomalie
(s’il s'agit d’une tumeur cancéreuse). Et c’est dans cette phase sensible et décisive qu’on peut
rencontrer des erreurs, ainsi emmètre une fausse analyse et par conséquent risquer de perdre
une vie. Il convient donc de mettre en place un outil d’aide à la décision assistant le médecin
pour un diagnostic rapide et efficace. Cette analyse doit être plus précise et ce n’est pas toujours
fournie par une analyse manuelle, tous cela nous conduit vers un traitement automatique exigent
rapidité et précision. Dans le Deep Learning on va utiliser plus exactement la technologie des
réseaux de neurones convolutifs (CNN) qui atteignent, voire dépassent les performances
humaines en matière de classification des images. Ces modèles ont un potentiel énorme en
analyse d'imagerie médicale.
1.4. LA PERTINENCE DU SUJET
Le cancer est la 2ème
cause de mortalité après les cardiopathies ischémiques et les accidents
vasculaires cérébraux, il tue plus que le sida, le paludisme, les accidents de la voie publique, les
homicides, les suicides, les guerres, les incendies réunis [W, 5]. Cette maladie se développe et
s’accroît dans le corps humain silencieusement ce qui rend son diagnostic difficile.
Le cancer du sein n’est qu’une étape pour pouvoir se lancer dans l’étude des autres types de
cancer. Le cancer du sein est le premier cancer de la femme dans le monde avec 1 million de
nouveaux cas par an et au Sénégal c’est le deuxième cancer chez la femme (2014) [B, 1]. En
2015, le cancer du sein a fait 8,8 millions morts, près d’un (1) décès sur six (6) est dû au cancer
ces chiffres ne cesse de s’accroître, on estime que pour l’année 2018, près de 18 millions de
personnes recevront le diagnostic de cancer, et 9.6 millions en décéderont [W, 8] Source : World
Cancer Report 2018 - International Agency for Research on Cancer (IARC).
CONCLUSION
Dans ce chapitre, nous avons présenté les problèmes rencontrés pour l’identification des
cellules cancéreuses du sein. On a proposé une solution pour avoir des précisions plus exactes
sur un diagnostic et on a expliqué les raisons qui nous ont poussés à réaliser cette étude.
5
CHAPITRE 2 : CADRE MÉTHOLOGIQUE
CHAPITRE 2: CADRE MÉTHODOLOGIQUE
INTRODUCTION
Dans ce présent chapitre, nous allons aborder les recherches faites afin de trouver des
mammographies (des images médicales) avec lesquelles nous allons travailler dans ce mémoire.
Présenter ces données leurs caractéristiques et les difficultés rencontré lors de la recherche et
de la collecte des données.
2.1. TECHNIQUES D’INVESTIGATION
En avril 2018, nous avons cherché dans les hôpitaux de Dakar notamment à Aristide
Le Dantec et Fann des données mammographiques, mais en vain. Les documents produits
n’étaient pas sauvegardés dans un serveur, autrement dit il n’y avait pas d’archivage et que les
données recueillies étaient supprimées au fur et à mesure.
Nous avons pensé à visiter d’autres centres parmi lequel le centre Centre d'Imagerie
Diagnostique et Interventionnelle de Soumbédioune (CIDIS). Ils ont bien voulu collaboré avec
nous en nous expliquant la procédure de diagnostic de cancer du sein. Et malheureusement, ils
ont dit qu’ils ne possédaient pas de serveur de stockage d'images mammographiques pour
l’instant, mais qu'il en avait déjà commandé. Et dans un avenir proche une collaboration serait
possible.
Donc on s'est retourné vers les archives de mammographie internationale celui qui avait le plus
de données était Digital Database for Screening Mammography (DDSM).
2.2. PRÉSENTATION DES DONNÉES MAMMOGRAPHIQUES
PRÉSENTATION DES DONNÉES DDSM
La base de données numérique pour la mammographie de dépistage reconnue en anglais sous
le nom de DDSM : Digital Database for Screening Mammography a été ressemblée par un
groupe de chercheur de l’Université du sud de la Floride, elle contient 2 620 cas c’est à dire que
les examens ont été effectués sur 2 620 patientes, il existe 2 types de mammographie sur la base
de donnée un MLO, MedioLateral-Oblique est une vue oblique ou angulaire et un CC, Cranio-
Caudal est une vue d'en haut, les mammographies sont recueillies auprès de l’hôpital
6
"Massachusetts General Hospital" (MGH), l’université "Wake Forest University" (WFU) et
l’hôpital "Washington University of St. Louis School of Medicine" (WUSTL), il contient des
cas normaux, bénins et malins avec des informations de pathologie vérifiées. DDSM a
largement été utilisée par la communauté scientifique dans le domaine du diagnostic cancer du
sein ; elle a l’avantage d’utiliser le même lexique normalisé par l’American College of
Radiology (ACR) dans le BI-RADS (Breast Imaging-Reporting And Data System).
Nous avons prélevé un échantillon composé de 4 473 images : 1 377 normales, 1 739 bénignes
et 1 357 malignes les mammographies sont de taille différente, ces exemples seront partitionnés
en trois dossiers exemples d’apprentissage, exemple de validation et exemple de test.
2.3. DIFFICULTÉS RENCONTRÉES
Le DDSM qui est une base de données plus intéressante que les autres par sa grande quantité
de donnée mammographique, mais cependant pour télécharger les images, il a fallu faire
plusieurs semaines vu la connexion internet de bas débit utilisé. Ensuite les
données DDSM sont enregistrées au format JPEG sans perte (LJPEG, Less Lost JPEG) il a
fallu les décompresser.
La collection CBIS-DDSM comprend un sous-ensemble des données DDSM sélectionnées et
conservées. Elle a été créé et a été initialement hébergé par l’Université de Washington à Saint-
Louis. En décembre 2010, le National Cancer Institute, par l’intermédiaire du Fredrick National
Laboratory, a confié à l’Université de Washington l’établissement d’un environnement
d’hébergement haute disponibilité basée sur des clusters permettant de collecter et de gérer les
collections d’images actuelles et futures. En octobre 2015, le Dr Prior et l'équipe principale de
TCIA ont été transférés à Mallinckrodt Institute of Radiology de l'Université de
Washington au département d'informatique biomédicale de l'Université de l'Arkansas pour
les sciences médicales. Un nouvel environnement d’accueil pour TCIA a été créé à UAMS et
tous les logiciels, processus et données ont été transférés de St. Louis à Little Rock au mois
d’octobre 2015. Les archives conservées fournissent des collections d’images de haute qualité
et de grande valeur aux chercheurs en cancérologie du monde entier.
Les images CBIS-DDSM ont été pré-traitées par type d’anomalie, c’est-à-dire sur chaque
image on a identifié l’anomalie et pris les limites de la tumeur sur les images on appelle ça
7
extraction du ROI Region Of Interest et enregistrées en tant qu'image DiCom, mais puisque cet
ensemble de données ne contient que des numérisations présentant des anomalies. Donc les
données mammographies normales, ont été téléchargées dans le site DDSM et les données
anormales des cas de bénins et malins, on était téléchargé à partir du site CBIS-DDSM afin de
créer un jeu de données pouvant être utilisé pour prédire la présence d'anomalies.
CONCLUSION
Dans ce chapitre, nous avons pu aborder la manière dont on a collecté nos données, des
universités qui héberge les données mammographiques. Ensuite présenter les données et leurs
caractéristiques et enfin on a parlé des difficultés rencontrés lors des recherches.
8
PARTIE II : CADRE ANALYTIQUE ET IMPLÉMENTATION
9
CHAPITRE 1 : LE CANCER DU SEIN
CHAPITRE 1: LE CANCER DU SEIN
INTRODUCTION
Le cancer du sein comme son nom l’indique est localisé dans l’organe humain qu’on appelle le
sein, il résulte d’un dérèglement de certaines cellules qui se multiplient et forme une masse
appelée tumeur. Il en existe différents types qui n’évoluent pas de la même manière certains
sont « agressifs » et évoluent très rapidement, d’autres lentement. Le développement du cancer
du sein peut prendre plusieurs mois, voire plusieurs années.
Dans ce présent chapitre, nous allons étudier la structure du sien, les symptômes cancer du sein
(ce que la patiente à remarquer chez elle d’anormal) et les signes (ce que le docteur à découvert
en l’examinant). Par la suite décrire une tumeur du sein et de ces différents aspects, aborder les
facteurs de risque du cancer du sein, son diagnostic et enfin de certains traitements.
1.1. ANATOMIE DU SEIN
Les seins sont situés au niveau de la face antérieure du thorax, reposent en arrière sur le muscle
pectoral, centrés par les mamelons, ces derniers entourés d’une zone pigmentée appelée
l’aréole. La peau de l’aréole est très fine, légèrement déformée par les orifices des glandes
sébacées, des glandes sudoripares et des follicules pileux. La glande mammaire est constituée
d’une vingtaine de lobes glandulaires noyés dans du tissu graisseux. Les canaux excréteurs de
ces lobes, appelés canaux galactophores, débouchent sur le mamelon.
Figure 1: Structure anatomique du sein.
10
Avant de connaître une anomalie on doit différencier un sein normal d’un sein anormal, c’est-
à-dire reconnaître l’aspect normal du tissu glandulaire (des lobules) aussi bien que chez la jeune
fille que chez la personne âgée c’est à partir de ce moment qu’on pourra déterminer si une lésion
est pathologique pour pouvoir identifier une anomalie dans un sein.
Un sein normal est reparti en quatre types :
Type A : le sein présente plus de graisse que de glande (chez les personnes âgées) ;
Type B : le sein présente autant de glande que de graisse ;
Type C : le sein présente plus de glande que de graisse ;
Type D : le sein est glandulaire et tout à fait blanc (chez les jeunes filles).
1.2. SYMPTÔMES ET SIGNES
Les symptômes sont découverts par la patiente elle-même un cancer du sein peut se manifester
chez une patiente par « une grosseur » (nodule), un écoulement de liquide clair ou sanglant par
le mamelon, une déformation du galbe du sein ou du mamelon (rétraction), plus rarement par
une douleur. Mais il peut aussi ne pas présenter parfois aucun symptôme.
L’examen permet de rechercher :
 A l’inspection : la taille du sein malade (à augmenter ou à diminuer) par rapport au sein
controlatéral, s’il y a une déformation orientée d’un côté par rapport à l’autre, s’il y a
une rétraction, ride, Aspect de la peau en regard (rougeur ou ecchymose).
 A la palpation caractériser la masse siège, la consistance est ce que la masse est dure ou
molle, douloureuse ou indolore, est ce qu’il y a un écoulement, etc.
1.3. TUMEURS DU
Le terme de tumeur (synonyme : « néoplasme » ou « néoplasie ») désigne une prolifération
cellulaire excessive aboutissant à SEIN une masse tissulaire ressemblant plus ou moins au tissu
normal homologue (adulte ou embryonnaire), ayant tendance à persister et à croître, témoignant
de son autonomie biologique.
11
1.3.1. CRITÈRES DES TUMEURS BÉNIGNES
Les tumeurs bénignes ont des contours bien délimités donnent un nodule opaque, dense,
hétérogène, aspect stellaire, spéculer, plus souvent de petite taille. Cependant, on peut en
trouver de grande taille. Elles ont une croissance lente et restent localisées dans le tissu où
l’organe dans lequel elles sont apparues. Elles n’entraînent pas de métastases dans d’autres
endroits du corps. Les tumeurs bénignes sont composées de cellules qui ressemblent aux
cellules normales du tissu concerné. On dit qu’elles sont bien différenciées. La tumeur bénigne
qui se développe le plus souvent dans le sein est appelé fibroadénome. Les autres affections
bénignes du sein sont les kystes, les changements fibrokystiques, l'hyperplasie, la
gynécomastie.
Une tumeur bénigne est localisée dans un seul endroit la tumeur en un moment donné, peut
augmenter de taille, sans risque de métastase.
1.3.2. CRITÈRES DES TUMEURS MALIGNES
Les tumeurs malignes ont des contours le plus souvent mal délimités. Certaines sont toutefois
bien limitées et peuvent alors être considérées un temps comme bénignes, ceci pouvant retarder
le diagnostic de cancer. Les cellules cancéreuses qui composent les tumeurs malignes
présentent diverses anomalies par rapport à des cellules normales : forme et taille différentes,
contours irréguliers… On parle de cellules indifférenciées, car elles ont perdu leurs
caractéristiques d’origine. Les tumeurs malignes ont tendance à envahir les tissus voisins. Elles
peuvent entraîner des métastases : des cellules cancéreuses s’échappent de la tumeur primitive
et vont coloniser une autre région du corps tel que le foie, le cerveau, poumon pour y former
une nouvelle tumeur qu’on appelle tumeur secondaire ou métastase.
La bénignité (nature non-cancéreuse) ou la malignité (nature cancéreuse) peuvent être évoquées
sur l'aspect retrouvé sur les examens d'imagerie pratiqués. Mais c’est grâce à l’examen
anatomopathologique d’un échantillon de tumeur que l’on peut déterminer si elle est
cancéreuse ou non, c'est-à-dire l’examen qui permettra son étude et orienté le traitement.
1.3.3. CALCIFICATIONS
Les calcifications mammaires sont des dépôts de calcium qui se forment dans le tissu
mammaire. Elles n’ont aucun lien avec la quantité de calcium absorbée au cours de
12
l’alimentation ou obtenue par l’intermédiaire de compléments alimentaires. En effet, la
calcification donne un aspect dure à la tumeur
Il existe deux types de calcifications : les macrocalcifications et les microcalcifications.
Les macrocalcifications sont des dépôts grossiers de calcium dans le sein. Elles sont
plus fréquentes chez les femmes âgées de plus de 50 ans. Elles sont souvent associées à
des modifications bénignes qui se produisent dans le sein et qui sont liées par exemple
au vieillissement des artères du sein, à des anciennes lésions, à une inflammation ou à
des masses telles qu'un fibroadénome.
Les microcalcifications sont de minuscules dépôts de calcium dans le sein. Leur
présence signifie parfois que l'activité de certaines cellules du sein est accrue. Une
cellule plus active absorbe en effet davantage de calcium que celle qui l’est moins. Les
microcalcifications peuvent faire suspecter un cancer du sein (comme un carcinome
canalaire in situ-CCIS), notamment lorsqu’elles apparaissent isolées ou regroupées en
grappes à la mammographie. Si tel est le cas, le radiologue recommande de réaliser une
biopsie afin de vérifier qu’il ne s’agit pas d’un cancer, et en fonction des résultats, on
détermine le traitement qui sera suivit par la patiente.
1.4. CANCER DU SEIN
Le cancer est la présence d’une tumeur maligne. Il survient à la suite de mutations ou de
changements anormaux dans les gènes responsables de la régularisation, de la croissance des
cellules. Les gènes sont dans le noyau de chaque cellule qui agit comme la salle de contrôle.
Normalement, les cellules de notre corps se remplacent par un processus ordonné de la
croissance cellulaire : de nouvelles cellules prennent en charge alors que les anciens
disparaissent. Mais au fil du temps, les mutations peuvent apparaître dans certains et engendré
un début de malformation qui peut engendrer une tumeur bénigne ou maligne.
On distingue les cancers in situ (confinés dans les canaux ou les lobules) et les cancers invasifs
ou infiltrants. La tumeur cancéreuse érode (incruste) tout son entourage par dans la lymphe
atteint les organes tels que le cerveau, le poumon, le foie.
On pense que le cancer du sein n’arrive qu’aux femmes, mais environ 1% des cancers du sein
se produisent chez les hommes. Les hommes ont une petite quantité de tissu derrière le mamelon
et bien qu’elle ne soit pas aussi importante que chez les femmes, un cancer peut quand même
13
se développer. Peu d’hommes en sont conscients si bien qu’il est généralement diagnostiqué
plus tardivement que chez les femmes. Par conséquent, le cancer du sein masculin est
généralement plus avancés quand il est diagnostiqué et donc plus difficile à traiter.
1.4.1. LES FACTEURS DE RISQUE
Malgré les progrès qui ont permis de mieux connaître les mécanismes de développement des
cancers, les causes du cancer du sein ne sont actuellement pas connues. Néanmoins, les études
ont mis en évidence certains facteurs de risque qui favorisent le cancer du sein. Il existe
différents types de facteurs de risque de survenue d’un cancer du sein.
1.4.2. L’AGE
L’âge est le facteur de risque le plus important vis-à-vis du cancer du sein, la maladie est rare
chez les femmes de moins de 30 ans. Le risque augmente entre 50 et 75 ans (près des deux tiers
des cancers du sein). Le cancer du sein masculin apparaît surtout chez les hommes de plus de
60 ans.
1.4.3. LES FACTEURS GÉNÉTIQUES
On parle dans ce cas de gènes de prédisposition ou de risque de développer un cancer du sein.
Plusieurs femmes dans une même famille (mère, grand-mère, tante, sœurs) peuvent présenter
un cancer du sein. On soupçonne alors une origine génétique à cette maladie.
Grâce à la recherche génétique, on sait aujourd’hui détecter certaines anomalies
chromosomiques qui pourraient être responsable de la survenue d’un cancer du sein (5% à 10%
des cas) en rapport avec certains gènes. Si une telle anomalie est retrouvée chez une femme, il
est possible de faire une recherche chez les autres femmes de la même famille, mais il faut
savoir que les résultats ne sont jamais affirmatifs.
1.4.4. LES RIQUES HORMONAUX
Il semble que les femmes ayant une puberté précoce, une ménopause tardive, n’ayant pas
d’enfants ou ayant des enfants tardivement, n’ayant pas allaité, auraient un risque plus
important d’avoir un cancer du sein.
14
1.4.5. L’ALIMENTATION
L’effet le plus important est celui de la quantité de calories absorbées, plus elle est élevée, plus
le risque augmente. L’obésité, une consommation importante d’alcool (équivalent de ½ Litre
de vin par jour), la faible consommation de fruits et de légumes sont également suspectées
d’augmenter le risque. Toutes ces données ne sont valables que sur un plan statistique et non
pas individuel.
1.4.6. LE TABAC
La fumée du tabac est une importante source de substances cancérogènes. Le tabagisme passif
est aussi nocif pour le cancer du sein que le tabagisme actif. Selon une étude de l'Inserm de la
France (Institut National de la Santé Et de la Recherche Médicale) une augmentation de risque
associé au tabagisme. Le fait d’inhaler involontairement de la fumée dégagée par la cigarette
ou cigares (tabagisme passif) semble associé à un risque augmenté d’environ 60% ; ce risque
est multiplié par trois chez les femmes après la ménopause. Il a été rapporté que les fumeuses
ont une ménopause précoce et une concentration urinaire réduite d’œstrogènes pendant la phase
lutéale du cycle menstruel.
1.4.7. LA PILULE
Pour les contraceptions orales, les études faites aux Etats-Unis conclut à une augmentation
minime du risque (+14%). Le risque serait un peu plus élevé (+20%) pour les femmes ayant
pris des contraceptions orales pendant plus de 5 ans avant une première grossesse.
1.4.8. LE TRAITEMENT HORMONAL DE LA MÉNOPAUSE (THM)
Il existe un risque élevé d’augmentation du cancer du sein chez les femmes utilisant des THM.
Le risque de cancer est augmenté avec la durée du traitement. Aucune différence n’est
démontrée en fonction de la voie d’administration (orale, parentéral), le risque de cancer du
sein lié au traitement œstroprogestatif pourrait varier en fonction du type de progestatif, mais
ces données nécessitent d’être confirmées par d’autres études [W, 27].
1.4.9. ANTÉCÉDENTS DE CANCER
Les femmes qui ont déjà présenté un cancer du sein ont plus de risques que les autres n’ayant
pas des antécédents de cancer (risque de deuxième cancer est de 10 %). Elles seront suivies
attentivement après. Même la présence d’un ou de plusieurs de ces facteurs favorise le
15
développement d’un cancer du sein, il faut savoir que, mis à part les facteurs familiaux ou
génétiques, ces autres facteurs augmentent généralement assez peu le risque : une femme qui
possède une ou plusieurs de ces caractéristiques peut ne jamais développer un cancer du sein.
En revanche, il est possible qu’une femme n’ayant aucune de ces caractéristiques soit atteinte
d’un cancer du sein. Les facteurs de risque ne permettent donc pas de déterminer les causes
exactes à l’origine d’un cancer du sein chez une femme.
Figure 2: Présentation d'une tumeur du sein vue de face.
1.5.TYPES HISTOLOGIQUES DU CANCER DU SEIN
Les différentes composantes de chaque tumeur du sein peuvent présenter des aspects
morphologiques particuliers qui peuvent être regroupés par types histologiques. Les tumeurs
sont ainsi classées en fonction de critères histologiques communs, définis par les classifications
internationales, éditées par l’Organisation mondiale de la santé (OMS), et remises à jour
régulièrement. La reconnaissance de ces critères et le classement de la tumeur dans le type
adéquat sont la base du diagnostic anatomopathologique de toute tumeur. On ne peut déterminer
qu’une tumeur est cancéreuse sans l’examen et le rapport histologique.
1.5.1. LE CANCER DU SEIN NON-INFILTRANT (IN SITU)
Le cancer du sein non-infiltrant (in situ) se réfère à un cancer qui est encore dans le conduit du
lait et/ou les lobules du sein. En d’autres termes, le cancer n’a pas envahi les murs des canaux
galactophores ou des lobules c’est repartie en deux les CCIS et les CLIS.
Le Cancer Canalaire In situ (CCIS), également appelé carcinome intracanalaire (figure
3), fait référence aux cellules cancéreuses qui se sont formées dans les conduits du canal
galactophore et sont encore confinées dans cet espace. Les conduits se bouchent et
16
élargie à cause des cellules cancéreuses qui s’accumulent à l’intérieur. Le calcium a
tendance à s’accumuler dans les canaux bloqués et est visible sur la mammographie.
Figure 3: Cancer canalaire in situ (CCIS) - Macroscopie à gauche et histologie à droite.
Le Cancer Lobulaire in situ (CLIS) comme le montre la figure 4 fait référence à des
cellules cancéreuses qui se sont formés dans les glandes mammaires et qui sont encore
confinées dans cet espace. Ce type de cancer est souvent constaté chez les femmes
autour de la ménopause. CLIS est différente de CCIS, celui-ci présente un risque plus
élevé, l’ensemble du tissu des deux seins peut développer un cancer. Par conséquent, le
traitement de CLIS doit viser les deux seins.
Figure 4: Cancer lobulaire in situ (CLIS) - Macroscopie à gauche et histologie à droite.
1.5.2. LE CANCER DU SEIN INFILTRANT
Le cancer du sein infiltrant se réfère à des cellules qui se sont développé à travers les parois des
canaux galactophores et des glandes dans le tissu normal graisseux du sein. Les cellules
continuent de croître entraînant une masse. Ils peuvent alors former des métastases à travers la
17
circulation sanguine ou les vaisseaux lymphatiques vers d’autres parties du corps. Les
principaux types du sein infiltrant sont les suivants :
le Cancer Canalaire Infiltrant (CCI) est le plus populaire et est également appelé
cancer mammaire ou adénocancer infiltrant (figure 5) ;
Figure 5: Cancer canalaire infiltrant.
Figure 6: Cancer canalaire infiltrant (CCI) - Macroscopie à gauche et histologie à droite.
le Cancer Lobulaire Infiltrant (CLI) : moins fréquent et difficile à diagnostiquer sur la
mammographie, présente un risque légèrement plus élever d’être dans les deux seins
(figure 7).
Figure 7: Cancer lobulaire infiltrant(CLI) - Macroscopie à gauche et histologie à droite.
18
Il existe d’autres types de cancer du sein que nous pouvons rencontrer (des cas plus rares) :
Cancer mucineux (colloide), Cancer médullaire, Cancer papillaire, Cancer tubuleux, Cancer
adénoïde kystique, Cancer sécrétant juvénile, Cancer apocrine, Cancer métaplasique de type
épidermoïde, Cancer métaplasique de type à cellules fusiformes, Cancer métaplasique de type
chodroide et osseux, Cancer métaplasique de type mixte, Maladie de Paget du mamelon.
1.6. CLASSIFICATION TNM
La classification TNM est une norme mondialement reconnue pour classer l'étendue de la
propagation du cancer proposé par le chirurgien français Pierre Denoix de l’Institut Gustave-
Roussy entre 1943 et 1952. C'est un système de classification de l'étendue anatomique des
tumeurs cancéreuses. Il a acquis une large acceptation internationale pour de nombreux cancers
à tumeur solide, mais ne s'applique pas à la leucémie et aux tumeurs du système nerveux central.
Le système TNM possède des notations décrivant le stade d'un cancer, provenant d'une tumeur
solide, à l'aide de codes alphanumériques ainsi, les trois lettres symbolisant la propagation de
la maladie cancéreuse sont les suivants [B, 1] :
T décrit la taille de la tumeur initiale (primitive) et indique si elle a envahi les tissus
voisins ;
N décrit les ganglions lymphatiques voisins (Node) impliqués ;
M décrit les métastases à distance (propagation du cancer d'une partie du corps à une
autre).
T = Tumeur primitive
Tx : Détermination de la tumeur primitive impossible
T0 : Pas de signe de tumeur primitive (non palpable)
Tis : Carcinome in situ : carcinome intracanalaire, ou carcinome lobulaire in situ, ou
maladie de Paget du mamelon sans tumeur décelable
T1 : Tumeur de moins de 20 mm, avec la
sous-classification suivante :
T1mic : micro-invasion <1 mm
T1a : moins de 5 mm
T1b : de 5 à 10 mm
T1c : de 10 à 20 mm
T2 : Tumeur de 20 à 50 mm
19
T3 : Tumeur de plus de 50 mm
T4 : Quelle que soit la taille, avec :
T4a : Extension à la paroi thoracique
T4b : Extension à la peau y compris,
ulcération cutanée ou nodules de perméation
T4c : T4a + T4b
T4c : Cancer inflammatoire
N = Adénopathies régionales
Nx : Appréciation impossible de l’atteinte ganglionnaire (du fait, par exemple d’une
exérèse antérieure)
N0 : Absence de signe d’envahissement ganglionnaire régional
N1 :Ganglions axillaires homolatéraux suspect mobiles
N2 : Ganglions axillaires homolatéraux
suspects fixés entre eux ou à d’autres
structures, ou présence clinique
d’adénopathies mammaires internes en
absence d’adénopathies cliniques axillaires
N2a : Ganglions axillaires homolatéraux
fixés
N2b : Ganglions mammaires internes
homolatéraux cliniquement apparent sans
adénopathies axillaires cliniques
N3 : Ganglions sous-claviculaires
homolatéraux (niveau III axillaire) ou
mammaires internes avec présence
d’adénopathies axillaire ou ganglions sus-
claviculaires présents (avec ou sans la
présence de ganglions axillaires ou
mammaires internes)
N3a : Ganglions suspects sous-claviculaires
et axillaires homolatéraux
N3b : Ganglions mammaires internes et
ganglions axillaires homolatéraux suspects
N3c : Ganglions sus-claviculaires
homolatéraux suspects
M = Métastases
Mx : Renseignement insuffisants pour classer les métastases à distance
M0 : Absence de métastases à distance
M1 : Présence de métastase(s) à distance
Tableau 1: Classification TNM.
20
1.7. EVOLUTION
Comme la plupart des cancers, le cancer du sein évolue d’abord localement, avec extension
aux organes de voisinage et aux ganglions lymphatiques axillaires, puis se propage par voie
sanguine (métastases), surtout aux os, au cerveau, au foie, et aux poumons. Ces métastases
peuvent apparaître tardivement, jusqu’à 10 ans après la découverte du cancer initial.
Stade TNM Chances de Survie
Stade 0 Tis N0 M0 > 95%
Stade I T1 N0 M0 85%
Stade IIA
T0 N1 M0
T1 N1 M0
T2 N0 M0
66%
Stade IIB
T2 N1 M0
T3 N0 M0
66%
Stade IIIA
T0 N2 M0
T1 N2 M0
T2 N2 M0
T3 N1 M0
T3 N2 M0
41%
Stade IIIB
T4 N0 M0
T4 N1 M0
T4 N2 M0
41%
Stade IIIC Tous T N3 M0 41%
Stade IV Tous T Tous N M1 10%
Tableau 2: Classification de cancer du sein par stade.
21
1.8. DIAGNOSTICS
Un cancer du sein est découvert soit à l’occasion d’un examen systématique par le gynécologue,
soit par la patiente elle-même au cours d’un auto-palpation mammaire qui découvre un nodule
ou une masse mammaire qui très souvent fait l’objet d’examens d’imagerie médicale en
l’occurrence l’échographie et la mammographie qui peuvent plaider en faveur d’un cancer du
sein. Ce diagnostic est objectivé par la biopsie.
Par ailleurs le cancer peut être découvert au cours de complications ou de localisation régionale
ou à distance.
1.8.1. LA MAMMOGRAPHIE
Le cancer du sein est à l’heure actuelle, est mis en évidence par une mammographie (examen
radiologique du sein) réalisé à titre systématique dans le cadre du suivi médical individuel ou
lors d’une campagne de dépistage (découvert de manière fortuite). La mammographie est un
examen aux rayons X, qui emploie de faibles doses de rayonnements, mais qui néanmoins doit
être évitée chez la femme enceinte. C’est une technique de radiographie qui vise à détecter les
tumeurs mammaires. Elle est réalisée lorsqu’une patiente présente des symptômes pouvant faire
évoquer un cancer du sein. Cet examen est réalisé avec un mamographe comme le montre la
figure suivante.
Figure 8: Le mamographe.
22
Les mammographies sont des clichés (des images en noir et blanc) centrés sur les zones
suspectes. La mammographie est l’examen de référence de dépistage du cancer du sein elle est
effectué sur chaque sein chacun sous des angles différents essentiellement, on peut citer le MLO
è_Médio-Latéral Oblique qui offre une vue de profil du sein et le CC Cranio-Caudal une vue
de face du sein. Elles permettent de mettre en évidence des cancers de petite taille, à un stade
précoce, avant l’apparition de symptômes. Cet examen permet d’orienter le médecin dans son
diagnostic. L’examen ne s’accompagne d’aucun effet secondaire.
Figure 9: Mammographie montrant une tumeur au sein vue d'en face à gauche et vue de
profil à droite.
Une mammographie systématique est conseillée tous les 2 ans chez les femmes à partir de 50
ans. Elle est aussi effectuée sur un avis médical lorsqu’une femme présente un risque accru de
cancer du sein (famille à risque, antécédents personnels).
On utilise la classification BIRADS (Breast Imaging Reporting And Data System) de l’ACR
qui est une classification internationale établie par l’American College of Radiology.
Le système BI-RADS ACR permet de classer les images mammographiques en 6 catégories :
 ACR 0 : mammographie de mise en attente, pour laquelle une comparaison à l’examen
antérieur, ou des clichés complémentaires (localisés ou agrandis) sont nécessaires,
mammographie de dépistage est lue et l’évaluation finale est « incomplète »;
 ACR 1 : mammographie normale, pour laquelle une surveillance habituelle est
préconisée :
 ACR 2 : mammographie présentant une anomalie bénigne appelée aussi kyste (c’est-à-
dire sans gravité).
 ACR 3 : il existe une anomalie probablement bénigne pour laquelle une surveillance à
court terme (3 ou 6 mois) est conseillée ;
23
 ACR 4 : il existe une anomalie indéterminée ou suspecte, pour laquelle la poursuite des
investigations reste nécessaire (microbiopsie échoguidée, macrobiopsie stéréotaxique,
cytoponction, IRM mammaire…). Souvent, une subdivision en ACR4a, ACR4b, et
ACR4c est réalisée pour mieux apprécier le risque de pathologie maligne ;
 ACR 5 : il existe une anomalie évocatrice d’un cancer et pour laquelle la poursuite des
investigations reste indispensable (microbiopsie sous échographie, macrobiopsie
stéréotaxique, cytoponction…) ;
 ACR 6 : correspond à une mammographie ayant un cancer prouvé, le plus souvent sous
traitement (chimiothérapie, hormonothérapie). [B, 1]
En cas d’images ACR 4 ou ACR 5 présente des cas ou la tumeur est localisé donc, des
prélèvements par biopsie percutanée sont nécessaires pour effectuer un examen
d’anatomopathologie.
Dans la figure qui suit on voit les résultats donnés par le médecin un examen de
mammographique.
Figure 10: Résultat d'un examen de mammographique.
24
1.8.2. ECHOGRAPHIE MAMMAIRE
Une échographie mammaire est un examen pratiqué par le radiologue qui utilise des ultrasons
pour produire des images de l’intérieur du sein. Elle est très utile pour voir la nature liquide ou
solide des nodules palpés ou découverts sur la mammographie.
Cet examen précise les images obtenues par mammographie. Il ne remplace pas une
mammographie qui est un examen de référence pour le sein. Pour les adolescentes, les jeunes
femmes et les femmes enceintes, la mammographie est moins importante : l’échographie
mammaire est donc l’examen de référence. Pour les femmes âgées, la mammographie reste
l’examen de référence.
Une échographie fournit des images « en temps réel », c’est-à-dire visibles immédiatement. Elle
permet ainsi de comparer ce que l’on sent avec les doigts (lors de la palpitation) et ce que l’on
voit sur l’écran elle permet aussi de guider un prélèvement. Cependant, l’échographie ne permet
pas toujours de voir avec certitude s’il s’agit ou non d’un cancer. Pour cela, il faut réaliser
d’autres examens complémentaires.
Figure 11: Échographie montrant une masse kystique.
Pour les seins glandulaires (type D), il est difficile de faire un diagnostic, car les glandes
apparaissent blanches dans la mammographie et la tumeur aussi a un aspect grisâtre donc ça
sera du blanc sur du blanc. C’est pourquoi chez les jeunes filles la mammographie même
effectuée ne donne pas de bon résultat, on procède à une échographie qui ne permet pas de
diagnostiquer à 100%, mais néanmoins dans certains, il peut faire apparaître une tumeur.
25
1.8.3. LA CYTOPONCTION ET LA MICROBIOPSIE ECHOGUIDÉE
Lorsqu’une lésion est visible en mammographie et/ou à l’échographie, la cytoponction est
souvent la technique de choix parce qu’elle est plus simple et plus rapide. C’est un prélèvement
qui se fait à l’aiguille fine introduite dans la masse. Soit sur un kyste un éventuel liquide est
aspiré et/ou bien, il est prélevé sur un nodule quelques cellules sont aspirées par une seringue.
Figure 12: Cytoponction d'une tumeur.
La microbiopsie échoguidée (microbiopsie mammaire sous échographie) est également un
prélèvement qui se fait cette fois ci avec une aiguille de gros diamètre sous anesthésie locale.
On prélève un fragment de tissu. Pour certains les microbiopsie résultent essentiellement des
échecs des cytoponctions notamment pour les lésions suspectes, purement échographiques.
Pour d’autres, elles pourraient se substituer aux cytoponctions.
Figure 13: histologie d'une bénigne et d'une tumeur maligne.
26
1.9. TRAITEMENTS
Il existe quatre types de traitements qui peuvent être entrepris, parfois isolément, parfois en
association les traitements sont les suivants :
la chirurgie : elle consiste à l’ablation de la tumeur si la tumeur est maligne
(cancéreuse) l’ablation des ganglions de l’aisselle (curage ganglionnaire axillaire) est
réalisée, pour les tumeurs volumineuses ou multiples la mastectomie (ablation du sein)
est pratiquée, pour les tumeurs de petites taille (bénigne) la curage du ganglionaire est
proposée pour minoré les conséquences ;
la radiothérapie : pratiquée après une tumorectomie, elle consiste à irradier le sein et
le pourtour de la zone retiré pour éviter les récidives locales. Le traitement comprend
généralement 4 ou 5 séances par semaine pendant 5 à 6 semaines. En fonction du type
histologiques.
la chimiothérapie : elle peut être utilisée en complément de l’ablation chirurgicale du
cancer primitif elle est utilisée en première intention en cas de cancer du sein avec signes
inflammatoires. Les métastases sont aussi traitées par la chimiothérapie. Le traitement
comporte l’association de plusieurs médicaments après un bilan pré thérapeutique.
Compte tenu de la causalité des produits administrés, il nécessite la pose préalable d’une
chambre implantable pour éviter une extravasation, source nécrose cutanée (forme de
dégât qui mène à la mort des cellules dans le tissu vivant) ;
L’hormonothérapie : est très souvent associée aux autres traitements, consiste à
prendre pendant 5 ans par voie orale des antiœstrogènes lorsque le cancer est
hormonodépendant, c’est-à-dire que la tumeur contient des récepteurs hormonaux
participant à la multiplication rapide des cellules cancéreuses.
Les buts des traitements selon les cas sont d’extirper la tumeur et ralentir son extension, éviter
la récidive ou les métastases et améliorer la qualité de vie de la patiente.
CONCLUSION
Dans le monde, le cancer du sein est le premier type de cancer le plus fréquent chez la femme.
Ici, au Sénégal c’est le deuxième cancer féminin (46% en 2014) [B, 1], il vient après celui de
l’endomètre. Son diagnostic passe par plusieurs étapes en commençant par un examen clinique
systématique soit par un gynécologue ou bien par la patiente elle-même. Le cas de présence
d’une tumeur est confirmé par une mammographie et ou une échographie mammaire. Mais le
27
diagnostic de certitude reste l’examen anatomopathogie. Après l’identification de la tumeur, un
bilan sénologique (mise au point globale) : entretien, examen de la patiente, une
mammographie et souvent une échographie seront faites en vus d’étudier les signes de la
tumeur. Le cas d’une tumeur cancéreuse ou non sera confirmé par une analyse dite histologique,
un traitement sera alors pris selon le type de tumeur.
Dans ce chapitre, nous avons pu comprendre le fonctionnement d’une tumeur ces
caractéristiques ces différents aspects. Et comment différentier une tumeur bénigne d’une
tumeur maligne les traitements qui doivent s’appliquer dans chaque cas.
28
CHAPITRE 3 : INTELLIGENCE ARTIFICIELLE
CHAPITRE 2: INTELLIGENCE ARTIFICIELLE
INTRODUCTION
L'Homme a toujours cherché à comprendre et à reproduire les mécanismes naturels qui
l'entourent. Un des domaines les plus passionnants reste celui de l'étude du cerveau. Qu'il soit
humain ou animal, nous restons fascinés par sa capacité à analyser, à comprendre et à
généraliser les problèmes que pose l'environnement.
Dans le but de se rapprocher du fonctionnement du cerveau, on abordera les généralités sur
l’intelligence artificielle.
2.1. PRÉSENTATION DE L’INTELLIGENCE ARTIFICIELLE
L’intelligence artificielle (IA) est un domaine de l’informatique qui met l’accent sur la création
de machines intelligentes qui fonctionnent et réagissent comme des humains. Il est devenu un
élément essentiel de l’industrie des technologies, les principaux problèmes de l’intelligence
artificielle comprennent la programmation des ordinateurs pour certaines caractéristiques telles
que :
la reconnaissance vocale ;
l’apprentissage ;
la planification ;
possibilité de manipuler et déplacer des objets ;
etc…
L’ingénierie des connaissances est au cœur de la recherche en Intelligence Artificielle. Les
machines peuvent souvent agir et réagir comme des humains seulement si elles disposent de
nombreuses information relative au monde. L’IA doit avoir accès aux objets, aux catégories,
aux propriétés et aux relations entre tous pour mettre en œuvre l'ingénierie des connaissances.
Initiez le bon sens, le raisonnement et la résolution de problèmes dans les machines est une
tâche difficile et fastidieuse. La perception de la machine concerne en sa capacité à utiliser les
entrées sensorielles pour déduire les différents aspects, tandis que la vision par ordinateur est
de pouvoir analyser les entrées visuelles avec quelques sous-problèmes tels que la
reconnaissance faciale, des objets et des gestes.
29
La robotique est également un domaine majeur lié à l'IA. Les robots ont besoin d'intelligence
pour gérer des tâches telles que la manipulation d'objets et la navigation, ainsi que des sous-
problèmes de localisation, de planification de mouvement et de cartographie.
2.2. HISTOIRE DE L’INTELLIGENCE ARTIFICIELLE
Les premiers jalons historiques de l'intelligence artificielle datent de la Protohistoire, où
mythes, légendes et rumeurs dotent des êtres artificiels, réalisés par des maîtres-artisans, d'une
intelligence ou d'une conscience.
La recherche en intelligence artificielle a vraiment commencé après une conférence tenue sur
le campus de Dartmouth College pendant l'été 1956 aux Etats Unis. À la suite de cette réunion,
certains participants se sont investis dans une recherche sur l'intelligence artificielle.
Certains idéalistes avaient prédit qu'une machine aussi intelligente qu'un être humain existerait
en moins d'une génération et des millions de dollars ont alors été investis dans un organisme de
prédiction. Avec le temps, il est apparu que les difficultés inhérentes à cette annonce avaient
été grossièrement sous-estimées.
Au début de 1973 jusqu'à la fin des années 1980, nous pouvons dire que ce cycle est discontinu,
les périodes de gel et de dégel en alternance, on disposait d'un support pour l'intelligence
artificielle. Mais il y a encore un idéal qui n’est pas encore atteint pour faire des prédictions
audacieuses.
Depuis 1980 jusqu’au présent. L’intelligence artificielle est devenue au fil du temps une matière
scientifique de plus en plus rigoureuse et formelle. La plupart des approches étudiées
aujourd’hui sont basées sur des théories mathématiques ou des études expérimentales plutôt
que sur l’intuition, et sont appliquées plus souvent aux problèmes issus du monde réel.
2.3. LES DIFFÉRENTS TYPES D’INTELLIGENCE
ARTIFICIELLE
2.3.1. L’INTELLIGENCE ARTIFICIELLE DISTRIBUÉE
L'intelligence artificielle distribuée (Distributed Artificial Intelligence, DAI) est l'une des
nombreuses approches de l'intelligence artificielle. L’ors de l'apprentissage, il effectue une
méthode d'apprentissage complexe, une planification et des prises de décisions à grande échelle.
Il peut utiliser un large éventail de ressources informatiques dans différents domaines (CPU,
30
RAM, GPU...). Cela signifie qu'il peut facilement traiter et analyser de grandes quantités de
données et résoudre rapidement les problèmes.
Il existe de nombreux agents ou nœuds d'apprentissage autonomes dans un tel système. Ces
nœuds sont très distribués et indépendants les uns des autres. De ce fait, les systèmes
d’apprentissage automatique (ML) utilisant l’intelligence artificielle distribuée sont tout à fait
adaptables et fiables. Cela signifie que les systèmes DAI ne doivent pas être complètement
redéployés après toute modification apportée aux fichiers de données en entrée du problème.
L'intégration des solutions se fait par un système de communication efficace entre les agents ou
les nœuds. Cela garantit que le traitement est élastique. Contrairement au système d'IA
centralisé, les données dans les systèmes DAI ne doivent pas être transmises à un seul
emplacement. Les données peuvent être mises à jour au fil du temps. Les nœuds peuvent
interagir avec les uns avec les autres en ce qui concerne la solution de manière dynamique et
disposer des compétences nécessaires pour parvenir à la solution. Ainsi, le DAI est considéré
comme l'une des meilleures approches de l'apprentissage automatique et de l'intelligence
artificielle.
2.3.2. LA SUPER INTELLIGENCE
La super intelligence artificielle (Artificial SuperIntelligence, ASI) fait référence à l'époque où
la capacité des ordinateurs surpassera celle des humains. "L'intelligence artificielle", très
utilisée depuis les années 1970, fait référence à la capacité des ordinateurs à imiter la pensée
humaine. La super intelligence artificielle va plus loin et pose un monde dans lequel les
capacités cognitives d'un ordinateur sont supérieures à celles d'un humain.
Les sociétés n’ont pas encore atteint le stade de la super intelligence artificielle. En effet, les
ingénieurs et les scientifiques tentent toujours d’atteindre un point qui serait considéré comme
une intelligence artificielle complète, où l’on pourrait dire qu’un ordinateur possède la même
capacité cognitive qu’un être humain.
Cependant, il y a beaucoup de théorie qui prévoit que la super intelligence artificielle
interviendra plus tôt que prévue, mais ce ne sont que des théories pour l'instant. En utilisant des
exemples comme la loi de Moore, qui prédit une densité sans cesse croissante de transistors, les
experts parlent de singularité et de croissance exponentielle de la technologie dans laquelle
l'intelligence artificielle complète pourrait se manifester dans quelques années.
31
2.3.3. L’INTELLIGENCE ARTIFICIELLE (IA) FAIBLE
L'intelligence artificielle faible (IA faible) connu aussi sous le nom d'intelligence artificielle
étroite est une approche de la recherche et du développement de l'intelligence artificielle,
sachant que l'IA est et restera toujours une simulation de l'intelligence humaine et que les
ordinateurs ne peuvent pas penser. L'IA faible agit simplement sur les règles qui lui sont
imposées et est liée à celle-ci et elle ne peut pas aller au-delà de ces règles.
Elle est conçue pour se concentrer et pour sembler très intelligente sur une tâche bien spécifique.
Ce fonctionnement est en totale contradiction avec celui de l'Intelligence Artificielle forte, dans
laquelle une Intelligence Artificielle est capable de toutes les fonctions cognitives que peut
avoir un humain, et n'est pas vraisemblablement différente d'un véritable esprit humain. L'IA
faible n'est jamais prise comme une intelligence générale, mais plutôt comme une construction
conçue pour être intelligente dans une tâche bien spécifique à laquelle elle est assignée.
Comme Intelligence faible on peut citer les robots utilisés dans le processus de fabrication de
produits, les chatbots comme Siri d'Apple, Cortana de Microsoft Windows (intégré dans
Windows 10) qui utilise internet comme une base de données. Ils semblent très intelligents, car
ils sont capables de tenir une conversation avec des personnes réelles, même en faisant des
remarques qui ne sont pas sérieux et quelques blagues, mais ils fonctionnent de manières très
spécifiques et bien prédéfinies. Cependant, la spécificité de leur fonction peut être mise à rude
épreuve donnant ainsi des résultats inexacts lorsqu’ils sont engagés dans des conversations
auxquelles ils ne sont pas programmés pour répondre.
2.3.4. L’INTELLIGENCE ARTIFICIELLE (IA) FORTE
L'Intelligence Artificielle forte (IA forte) est une construction d'Intelligence Artificielle qui
possède des capacités mentales et des fonctions qui imitent le cerveau humain. Dans la théorie
de l'IA forte, il n'y a pas de différence essentielle entre le logiciel, qui est l'Intelligence
Artificielle, imitant ainsi exactement les actions du cerveau humain et les actions d'un être
humain, y compris son pouvoir de compréhension et même sa conscience. L'intelligence
artificielle forte est également appelée Intelligence Artificielle complète. Elle est davantage une
philosophie qu'une approche réelle de la création d'IA. C'est une perception différente de l'IA
dans laquelle elle assimile l'IA aux humains. Il stipule qu'un ordinateur peut être programmé
pour fonctionner comme un esprit humain, être intelligent dans tous les sens du terme, avoir
une perception et avoir d‘autres état cognitifs normalement attribués humains.
32
Cependant, comme les humains ne peuvent même pas définir correctement ce qu'est
l'intelligence, il est très difficile de donner un critère clair quant à ce qui constituerait un succès
dans le développement d'une intelligence artificielle forte. La faible IA citée ci-dessus, par
contre, est très réalisable en raison de la manière dont elle définit l’intelligence. Plutôt que
d'essayer d'imiter pleinement un esprit humain, l'insuffisance de l'IA peut seulement se
concentrer sur le développement de l'intelligence liée à une tâche ou à un domaine d'étude
particulier. C’est un ensemble d’activités qui peuvent être décomposées en processus plus petits
et peuvent donc être réalisées à l’échelle définie.
2.3.5. L’AMPLIFICATION DE L’INTELLIGENCE
L'amplification de l'intelligence est l'idée que les technologies peuvent être utiles à l'intelligence
humaine, plutôt que d'être composées de technologies qui créent une intelligence artificielle
indépendante. Les systèmes d'amplification de l'intelligence améliorent l'intelligence d'un être
humain, améliorant d'une certaine manière le fonctionnement ou la capacité d'un décideur
humain. L'amplification de l'intelligence est également appelée intelligence assistée,
intelligence augmentée, augmentation cognitive ou intelligence augmentée par machine.
L'idée de l'amplification de l'intelligence ou de l'intelligence augmentée vient en partie des
craintes et des préoccupations concernant l'intelligence artificielle dans son ensemble.
L'intelligence artificielle évoluant et devenant de plus en plus robuste, les technologies
malveillantes ayant un impact négatif sur la vie humaine suscitent de plus en plus d'inquiétudes.
Il semble plus sûr, dans ce cas, de développer des technologies d’amplification de l’intelligence,
des outils qui tirent leur efficacité de la conscience humaine, au lieu de former leur propre
sensibilité artificielle.
CONCLUSION
Dans ce chapitre, nous avons fait un tour d’horizon dans le monde l’intelligence artificielle un
monde bien fascinant et on peut dire que l’étendue de l’intelligence des robots et des machines
est limitée, car ils ne savent pas quoi faire dans les situations pour lesquelles ils ne sont pas
programmés (entraîner) et en dehors de cela, ils n'ont aucun moyen de déterminer quoi faire.
L'IA équipée pour l'apprentissage automatique qu'on verra dans ce qui suit ne peut qu'apprendre
et appliquer que ce qu'elle a appris et à la portée pour laquelle elle est programmée.
L’Intelligence Artificielle est définie comme l'une des principales menaces pour l'avenir de
l'humanité, mythe ou réalité l'avenir nous le dira.
33
CHAPITRE 4: MACHINE LEARNING
CHAPITRE 3: MACHINE LEARNING
INTRODUCTION
D’une façon générale, l’apprentissage humain est un processus adaptatif grâce à laquelle
l’individu fournit des réponses adéquates à certaines situations. En Psychologie ou en Science
Cognitives, le terme « Apprentissage » désigne le processus d’augmentation de l’efficacité de
l’activité mentale ou comportementale sous l’effet de l’expérience.
Cependant on a à faire un autre type d’apprentissage, vous l’utilisez certainement des centaines
voire des milliers de fois par jour sans même le savoir, chaque jour des millions d’utilisateurs
effectue des recherches sur Google ou Bing, comment font les applications de photos comme
celle de Facebook ou Apple qui reconnaissent des personnes sur les photos. À chaque fois que
quelqu’un lit un e-mail et que le filtre anti-spam évite à la personne de parcourir des tonnes de
spam encore une fois les questions qu’on doit se poser comment l’ordinateur a appris à
distinguer entre les e-mails spam des non-spam et comment tout cela marche si bien, c’est parce
que tout cela est possible grâce à une technologie qu’on appelle le Machine Learning en
français apprentissage automatique.
4.1. PRÉSENTATION DU MACHINE LEARNING
Le Machine Learning (en français apprentissage automatique) est un sous-domaine de
l’intelligence artificielle, qui concerne la conception, l’analyse, le développement et
l’implémentation de méthode permettant à une machine d’évoluer, de remplir des tâches
difficiles ou problématique par le moyen des algorithmes et de modéliser les tâches dans le but
de prendre des décisions stratégiques.
L’apprentissage automatique (Mitchell, 1997) est un Domaine de l’intelligence
Artificielle (IA) dont l’objectif est d’étudier les moyens permettant à une machine, en
accomplissant des tâches, tout en s'améliorant au fur et à mesure.
Apprendre, dans ce cas signifie être capable d’adapter son comportement dans une situation
inconnue (n’ayant pas été prévues par les concepteurs de la machine dans l’accomplissement
d’une tâche) et pouvoir extraire des caractéristiques à partir de bases de données
34
d’apprentissage. L’apprentissage se fait donc par des outils qui permettent d’acquérir, élargir et
améliorer les connaissances disponibles au système.
L'apprentissage automatique est utilisé pour doter des ordinateurs ou des machines de systèmes
de perception de leur environnement : vision, reconnaissance d'objets (visages, schémas,
langages naturels, écriture, formes syntaxiques…), moteurs de recherche, aide aux diagnostics
médical, bio-informatique, chimio-informatique, interfaces cerveau-machine, détection de
fraudes à la carte de crédit, analyse financière, dont analyse du marché boursier, classification
des séquences d’ADN, jeu, génie logiciel, adaptation de sites Web, locomotion de robots,
analyse prédictive en matière juridique et judiciaire…
4.2. LA COLLECTE DE DONNÉES
Cette étape est cruciale, il consiste à récupérer, sélectionner, nettoyer et transformer les données
pertinentes de telle sorte qu’il soit compréhensible par la machine, pour cela, il va falloir
prétraiter les données, c’est-à-dire visualiser les différentes variables, essayer de comprendre
les valeurs extrêmes ou anormales, les liens, etc... Une fois qu’on a une idée de ce à quoi on a
affaire, on peut définir un problématique plus précise.
Les bases de données constituent la source principale de récupération lors d’une étude de cas
en Machine Learning. Il existe des technologies pour récupérer ces données (sql, xml, json…)
ces bases de données peuvent comprendre les différents types d’information :
Les logs d’un serveur web
Les transactions bancaires
Le comportement des utilisateurs d’un site
Le catalogue d’un produit d’un site de e-commerce…
Les données peuvent être du texte, rédiger en langage naturel (humain) ainsi, on peut inclure
tous les types de texte (articles, livres, messages, etc.) le traitement du texte (appelé NLP
Natural Language Processing) constitue un domaine de recherche à lui seul. Elles peuvent être
aussi du code HTML ou encore des séquences d’ADN, mais aussi des audios, des images (et
vidéo) le traitement des images et de vidéos constitue un domaine de recherche à part
(Computer Vision en anglais).
35
4.3. LA MODÉLISATION
La resolution d’un problème de Machine Learning constitue cette étape et permet à un
ordinateur de modéliser les données qui lui sont fournies. Modéliser signifie dans ce cas
représenter le comportement d’un phénomène afin de pouvoir directement aider à la résolution
d’un problème concret.
En Machine Learning, l’idée est que l’algorithme construit une représentation interne tout seul
afin de pouvoir effectuer une tâche qui lui est demandé (prédiction, identification, etc.). Pour
cela, il va falloir lui donner un ensemble de données d’exemples (ou d’entraînement) afin qu’il
puisse s’entraîner et s’améliorer, d’où le mot apprentissage. Cet ensemble de données s’appelle
le training set (ou training dataset). On peut appeler une entrée dans l’ensemble de données une
instance ou une observation.
La première phase sera le choix et l’entraînement de l’algorithme d’apprentissage du modèle,
mais le traitement de la tâche spécifiques sera appris à partir du training set. Ensuite effectué
par l’algorithme lui-même dans une seconde phase.
Le schéma ci-dessus montre les différentes phases de l’utilisation d’un algorithme de Machine
Learning.
Figure 14: Étapes de l’apprentissage en ML.
36
Comme nous le montre le schéma ci-dessus un problème de Machine Learning est composé des
différents éléments :
 Les données (les données d’entraînement, mais aussi les nouvelles données) ;
 La tâche spécifique à accomplir (prédire, recommander, décider quelque chose, etc.) ;
 L’algorithme d’apprentissage en lui-même ;
 L’analyse d’erreur (ou mesure des performances du modèle).
4.4. LA TÂCHE À ACCOMPLIR
La tâche spécifique à accomplir correspond au problème qu’on cherche à résoudre grâce à la
modélisation du phénomène. On distingue entre autres les recommandations de produits, aide
au diagnostic, prédiction météorologique, l’identification d’une personne dans une vidéo,
l’identification de transactions frauduleuse, la prédiction du prix optimal d’un produit pour
maximiser les ventes. Bien sûr, chacun se traduira différemment d’un autre et nécessite le choix
d’un algorithme différent.
4.5. LES DIFFÉRENTS TYPES D’APPRENTISSAGE
La Machine Learning possède différents types d’apprentissage, chaque mode d’apprentissage
regroupe une famille d'algorithme. Dans ce qui suit, on va énumérer et expliquer le concept de
quelques types d’apprentissage en Machine Learning.
4.5.1. SUPERVISED LEARNING
Supervised Learning (en français l’apprentissage Supervisé) consiste à donner à la machine un
ensemble de données en entrée (données d’entraînement) étiquetés et nous savons déjà à quoi
devraient ressembler les résultats correct en ayant une idée qu’il existe une relation entre
l’entrée et la sortie. Sur la base des sorties étiquetées, les entrées sont comparées. En fonction
de la variation entre les deux signaux, une valeur d'erreur est calculée et un algorithme est utilisé
pour apprendre la fonction de mappage de l'entrée à la sortie. Le but est d’approximer les
fonctions de telle sorte que lorsqu’on a une nouvelle donnée d’entrée, on peut prédire les
variables de sortie. L'apprentissage s'arrête lorsque l'algorithme atteint un niveau de
performance acceptable. La tâche de l’apprentissage supervisé est :
Un ensemble d’apprentissage composé de 𝑁 exemples de pair entrée-sortie :
37
(𝒙(𝟏)
, 𝒚(𝟏)
), (𝒙(𝟐)
, 𝒚(𝟐)
), … , (𝒙(𝑴)
, 𝒚(𝑴)
)
Chaque 𝑦(𝑖)
a été généré par une fonction 𝑭(𝒙) = 𝒚 inconnue, le but est découvrir la fonction
𝑓 qui se rapproche de 𝐹.
4.5.1.1. RÉGRESSION ET CLASSIFICATION
Le Supervised Learning est composé de deux catégories qui sont les problèmes de « Régression
» et de « classification », dans un problème de régression : il s’agit de prédire les résultats dans
une sortie continue (faire correspondre les variables d’entrée à fonction continue), dans un
problème de classification, il s’agit de prédire les résultats dans une sortie discrète (faire
correspondre les variables d’entrée en catégories discrète). Cette distinction aidera dans le choix
d’un algorithme de Machine Learning et le type de sortie que l’on attend du programme : est-
ce une valeur continue (un nombre) donc c’est le cas d’une régression ou bien une valeur
discrète (une catégorie) donc c'est le cas d’une classification ?
Figure 15: Illustration de la différence entre régression linéaire et classification linéaire.
Un modèle de régression est un modèle de ML dont les sorties y sont des nombres (exemple: la
température de demain). Un modèle de classification est un modèle de ML dont les sorties y
appartiennent à un ensemble fini de valeurs (exemple : bon, mauvais).
Il existe un autre type de prédiction possible qui est de sortir plusieurs labels de manière
ordonnée (Machine-Learning Ranking en anglais). L’algorithme PageRank de Google retourne
des résultats de recherche dans l’ordre, du plus pertinent au moins pertinent.
En représentation un peu plus mathématiques en Surpervised Learning, on reçoit en entrer des
données d’exemple annotées : (x 1,y1), (x2,y2), (x3,y3),… et on prédit la sortie sur une nouvelle
observation : x∗
→ y∗
38
4.5.2. UNSUPERVISED LEARNING
Unsupervised Learning (en français l’apprentissage non-supervisé) cette fois-ci, on peut
aborder les problèmes avec peu ou quasiment pas d’idée de ce à quoi nos résultats devraient
ressembler. La machine ou ordinateur ne dispose que d’exemples non étiquetés on parle
d’apprentissage non supervisé ou clustering. L’algorithme doit découvrir par lui-même les
structures des données cibles selon leurs attributs disponibles, pour les classer en groupes. On
peut dériver une structure à partir de données pour lesquelles on ne connaît pas l’effet des
variables en regroupant les données en fonction des relations entre les variables dans les
modèles de données.
Le clustering désigne les méthodes de regroupement automatique de données qui se
ressemblent le plus en un ensemble de « nuages » appelés clusters. Un ensemble d’algorithmes
non-supervisés peuvent réaliser cette tâche, ils mesurent de manière automatique la similarité
entre les différentes données. En représentation un peu plus mathématiques en l’apprentissage
non-supervisé, on reçoit uniquement des observations brutes de variables aléatoires :
𝒙𝟏, 𝒙𝟐, 𝒙𝟑, 𝒙𝟒, 𝒙𝟓, …
Et on découvre la relation avec des variables latentes structurelles :
𝑥𝑖 → 𝑦𝑖
4.5.3. SEMI-SUPERVISED LEARNING
Semi-supervised Learning (l’apprentissage semi-supervisé) est effectué de manière probabiliste
ou non. L’apprentissage semi-supervisé est à mi-chemin entre ces deux méthodes précédentes.
On fournit au modèle quelques exemples étiquetés, mais la grande partie des données ne le sont
pas. On trouve des cas d’application partout où l’obtention des données est facile, mais leur
étiquetage demande des efforts, du temps ou de l’argent comme par exemple :
 En reconnaissance de parole, il ne coûte rien d’enregistrer une grande quantité de parole,
mais leur étiquetage nécessite des personnes qui les écoutent.
 Des milliards de pages web sont disponibles, mais pour les classer il faut les lire.
Il est mis en œuvre essentiellement quand des données(étiquettes) manquent, le modèle doit
utiliser des exemples non étiquetés pouvant néanmoins renseigner.
39
4.5.4. REINFORCEMENT LEARNING
Reinforcement Learning (l’apprentissage par renforcement) est aussi un type d’apprentissage,
comme nous le savons, « l'erreur est humaine » et les humains apprennent de nouvelles tâches
principalement par essais et erreurs. L'apprentissage par renforcement est un domaine
d’apprentissage automatique qui s'inspire de cette facette humaine et qui consiste à calculer les
résultats de certaines actions pour maximiser le rendement. Cela implique d'avoir un agent
chargé d'observer son état actuel dans un environnement numérique et de prendre des mesures
qui maximisent le cumul d'une récompense à long terme qui a été établie. L'agent doit peser les
actions et opter pour les stratégies optimales qui aident ou favorisent le progrès pour atteindre
l'objectif souhaité.
4.5.5. TRANSFER LEARNING
Transfer Learning (l’apprentissage par transfert) peut être vu comme la capacité à une machine
de reconnaître et appliquer des connaissances et des compétences, apprises à partir de tâches
antérieures sur une nouvelle tâche ou domaine partageant des similitudes. Son objectif est de
savoir comment alors identifier les similitudes entre la ou les tâche(s) cible(s) et la ou les
tâche(s) source(s), puis comment transférer la connaissance de là ou des tâche(s) source(s) vers
la ou les tâche(s) cible(s).
4.6. LES ALGORITHMES D’APPRENTISSAGE
L’algorithme d’apprentissage constitue la méthode avec laquelle le modèle statistique va se
paramétrer à partir des exemples de donnée. Il existe plusieurs algorithmes différents, le choix
du type d’algorithme dépendra de la tâche que l’on souhaite accomplir.
Voici quelques exemples d’algorithmes de Machine Learning :
Régression Linéaire;
Logistique Régression ;
Support Vector Machine(SVM) ;
K-means ;
K-nn ;
Neural Network…
40
4.6.1. LA RÉGRESSION LINÉAIRE
Une régression linéaire est un algorithme supervisé, avec en entrée 𝑥 et en sortie 𝑌 la sortie
(la prédiction) est de la forme 𝑌 = 𝑤0 + 𝑤1𝑋 ou [𝑤0 et 𝑤1 ] sont des valeurs réelles à calculer.
Figure 16: Exemple de représentation de Régression Linéaire.
Prenons l’exemple suivant s’acheter une maison à Sally est l’objectif de certains Sénégalais,
mais aussi des touristes qui viennent visiter Sénégal pour ainsi s’installer au Sénégal après leur
retraite. Pour établir une relation entre le prix en million de FCFA d’une maison à Sally et la
taille de la maison, on peut ainsi prédire une relation entre ces deux.
La première étape consistera à examiner les données sur un graphiquement :
Figure 17: Prix d’une maison par sa taille.
Bien évidemment, le graphique montre que le prix d’une maison augmente en même temps que
la taille. On peut tracer une droite comme celle-ci pour réaliser une approximation de cette
relation donc la relation entre le prix et la taille est linéaire.
41
Figure 18: Une relation linéaire.
Cette droite ne passe pas exactement par chaque point, mais elle montre clairement la relation
entre les prix et les tailles. Avec un peu d’algèbre, nous pouvons décrire cette relation ainsi :
𝑦 = 𝑎𝑥 + 𝑏
 𝑦 est le prix d’une maison en million de franc cfa, les valeurs qu’on essaie de prédire ;
 𝑎 est la pente de la droite ;
 𝑥 est la taille en mètre carré, c’est la valeur de notre caractéristique d’entrée ;
 𝑏 est l’ordonnée à l’origine.
Pour le Machine Learning, la Linear Regression (la régression linéaire) s’obtient pour un
modèle, en changeant légèrement l’équation précédente, l’équation de prédiction devient
comme suit:
𝑦′
= 𝑏 + 𝑏1𝑥1
On écrit aussi
𝑦′
= 𝑤0 + 𝑤1𝑥1
Pour établir une notation nous utiliserons ce qui suit:
𝑦′
: est l’étiquette prédite / variable de sortie / variable de la cible (ouput/feature)
𝑏 : est le biais(l’ordonnée à l’origine) noté aussi 𝑤0
𝑤1 : est le paramètre(pondération) de la caractéristique 1. La pondération est identique à celui
de pente représenté par la lettre « a » ci-dessus.
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf
MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf

Contenu connexe

Tendances

conception et réalisation d'une application de gestion des rapports téléphoni...
conception et réalisation d'une application de gestion des rapports téléphoni...conception et réalisation d'une application de gestion des rapports téléphoni...
conception et réalisation d'une application de gestion des rapports téléphoni...
ismailbou
 
rapport-finale-ZoubairWassim.pdf
rapport-finale-ZoubairWassim.pdfrapport-finale-ZoubairWassim.pdf
rapport-finale-ZoubairWassim.pdf
SyrinaGaddour
 
projet fin d'étude IWAN
projet fin d'étude IWANprojet fin d'étude IWAN
projet fin d'étude IWAN
Med Amine El Abed
 
Rapport PFE "Conception et développement d'un Portail web pour le Smart Met...
Rapport  PFE  "Conception et développement d'un Portail web pour le Smart Met...Rapport  PFE  "Conception et développement d'un Portail web pour le Smart Met...
Rapport PFE "Conception et développement d'un Portail web pour le Smart Met...
Hajer Dahech
 
Rapport Projet de fin d'etude sur le parc informatique
Rapport Projet  de fin d'etude sur le parc informatiqueRapport Projet  de fin d'etude sur le parc informatique
Rapport Projet de fin d'etude sur le parc informatique
Hicham Ben
 
Rapport final
Rapport finalRapport final
Rapport final
YosraJerbi1
 
Rapport pfe
Rapport pfeRapport pfe
Rapport pfe
Ahmed rebai
 
Rapport Stage Capgemini Otmane DOUIEB
Rapport Stage Capgemini Otmane DOUIEBRapport Stage Capgemini Otmane DOUIEB
Rapport Stage Capgemini Otmane DOUIEB
OtmaneDouieb
 
Rapport de pfe format doc 2013
Rapport de pfe format doc 2013Rapport de pfe format doc 2013
Rapport de pfe format doc 2013
Addi Ait-Mlouk
 
Rapport de stage de perfectionnement - Mahmoudi Mohamed Amine
Rapport de stage de perfectionnement - Mahmoudi Mohamed AmineRapport de stage de perfectionnement - Mahmoudi Mohamed Amine
Rapport de stage de perfectionnement - Mahmoudi Mohamed Amine
Mohamed Amine Mahmoudi
 
Chatbot arabe-dialectale-covid19
Chatbot arabe-dialectale-covid19Chatbot arabe-dialectale-covid19
Chatbot arabe-dialectale-covid19
othmanakka
 
Rapport de stage du fin d'étude
Rapport de stage du fin d'étudeRapport de stage du fin d'étude
Rapport de stage du fin d'étude
Yahyaoui Mohamed Yosri
 
Rapport PFE
Rapport PFERapport PFE
Rapport PFE
IbtissemSlimeni
 
Rapport stage pfe
Rapport stage  pfe Rapport stage  pfe
Rapport stage pfe
rimeh moussi
 
Conception et developpement d'une application mobile Android e-location
Conception et developpement d'une application mobile Android e-locationConception et developpement d'une application mobile Android e-location
Conception et developpement d'une application mobile Android e-location
ALALSYSE
 
Rapport De PFE
Rapport De PFERapport De PFE
Rapport De PFE
Nadir Haouari
 
Mini Projet C gestion d'une location de voiture
Mini Projet C gestion d'une location de voitureMini Projet C gestion d'une location de voiture
Mini Projet C gestion d'une location de voitureOussama Bessrour
 
Guide de présentation de la Soutenance
Guide de présentation de la SoutenanceGuide de présentation de la Soutenance
Guide de présentation de la Soutenance
racouh
 

Tendances (20)

Modele rapport pfe esprit
Modele rapport pfe  espritModele rapport pfe  esprit
Modele rapport pfe esprit
 
conception et réalisation d'une application de gestion des rapports téléphoni...
conception et réalisation d'une application de gestion des rapports téléphoni...conception et réalisation d'une application de gestion des rapports téléphoni...
conception et réalisation d'une application de gestion des rapports téléphoni...
 
rapport-finale-ZoubairWassim.pdf
rapport-finale-ZoubairWassim.pdfrapport-finale-ZoubairWassim.pdf
rapport-finale-ZoubairWassim.pdf
 
projet fin d'étude IWAN
projet fin d'étude IWANprojet fin d'étude IWAN
projet fin d'étude IWAN
 
Rapport PFE "Conception et développement d'un Portail web pour le Smart Met...
Rapport  PFE  "Conception et développement d'un Portail web pour le Smart Met...Rapport  PFE  "Conception et développement d'un Portail web pour le Smart Met...
Rapport PFE "Conception et développement d'un Portail web pour le Smart Met...
 
Rapport
RapportRapport
Rapport
 
Rapport Projet de fin d'etude sur le parc informatique
Rapport Projet  de fin d'etude sur le parc informatiqueRapport Projet  de fin d'etude sur le parc informatique
Rapport Projet de fin d'etude sur le parc informatique
 
Rapport final
Rapport finalRapport final
Rapport final
 
Rapport pfe
Rapport pfeRapport pfe
Rapport pfe
 
Rapport Stage Capgemini Otmane DOUIEB
Rapport Stage Capgemini Otmane DOUIEBRapport Stage Capgemini Otmane DOUIEB
Rapport Stage Capgemini Otmane DOUIEB
 
Rapport de pfe format doc 2013
Rapport de pfe format doc 2013Rapport de pfe format doc 2013
Rapport de pfe format doc 2013
 
Rapport de stage de perfectionnement - Mahmoudi Mohamed Amine
Rapport de stage de perfectionnement - Mahmoudi Mohamed AmineRapport de stage de perfectionnement - Mahmoudi Mohamed Amine
Rapport de stage de perfectionnement - Mahmoudi Mohamed Amine
 
Chatbot arabe-dialectale-covid19
Chatbot arabe-dialectale-covid19Chatbot arabe-dialectale-covid19
Chatbot arabe-dialectale-covid19
 
Rapport de stage du fin d'étude
Rapport de stage du fin d'étudeRapport de stage du fin d'étude
Rapport de stage du fin d'étude
 
Rapport PFE
Rapport PFERapport PFE
Rapport PFE
 
Rapport stage pfe
Rapport stage  pfe Rapport stage  pfe
Rapport stage pfe
 
Conception et developpement d'une application mobile Android e-location
Conception et developpement d'une application mobile Android e-locationConception et developpement d'une application mobile Android e-location
Conception et developpement d'une application mobile Android e-location
 
Rapport De PFE
Rapport De PFERapport De PFE
Rapport De PFE
 
Mini Projet C gestion d'une location de voiture
Mini Projet C gestion d'une location de voitureMini Projet C gestion d'une location de voiture
Mini Projet C gestion d'une location de voiture
 
Guide de présentation de la Soutenance
Guide de présentation de la SoutenanceGuide de présentation de la Soutenance
Guide de présentation de la Soutenance
 

Similaire à MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf

INFECTION À Chlamydia trachomatis : PROFIL EPIDEMIOLOGIQUE CHEZ LES FEMMES RE...
INFECTION À Chlamydia trachomatis : PROFIL EPIDEMIOLOGIQUE CHEZ LES FEMMES RE...INFECTION À Chlamydia trachomatis : PROFIL EPIDEMIOLOGIQUE CHEZ LES FEMMES RE...
INFECTION À Chlamydia trachomatis : PROFIL EPIDEMIOLOGIQUE CHEZ LES FEMMES RE...
jordydemboux1
 
rapport fin d'etude
rapport fin d'etuderapport fin d'etude
rapport fin d'etude
sihem-med
 
YouTaQA : Système de Questions-Réponses Intelligent basé sur le Deep Learning...
YouTaQA : Système de Questions-Réponses Intelligent basé sur le Deep Learning...YouTaQA : Système de Questions-Réponses Intelligent basé sur le Deep Learning...
YouTaQA : Système de Questions-Réponses Intelligent basé sur le Deep Learning...
YounesAGABI
 
Projet de Fin d'études
Projet de Fin d'études Projet de Fin d'études
Projet de Fin d'études
Ghizlane El Karchouli
 
25 exemples de remerciement de mémoire - télécharger ici https://bit.ly/344aObu
25 exemples de remerciement de mémoire - télécharger ici https://bit.ly/344aObu25 exemples de remerciement de mémoire - télécharger ici https://bit.ly/344aObu
25 exemples de remerciement de mémoire - télécharger ici https://bit.ly/344aObu
Hani sami joga
 
Memoire_Fallou_Mbengue.pdf
Memoire_Fallou_Mbengue.pdfMemoire_Fallou_Mbengue.pdf
Memoire_Fallou_Mbengue.pdf
falloumbengue1
 
Rapport de projet de fin d'études - SIEMENS 2016
Rapport de projet de fin d'études - SIEMENS 2016Rapport de projet de fin d'études - SIEMENS 2016
Rapport de projet de fin d'études - SIEMENS 2016
Soufiane KALLIDA
 
La médecine traditionnelle algérienne contre la COVID 19
La médecine traditionnelle algérienne contre la COVID 19La médecine traditionnelle algérienne contre la COVID 19
La médecine traditionnelle algérienne contre la COVID 19
RimMecheri
 
Rapport Pfe Application Web e-commerce Symfony2
Rapport Pfe Application Web e-commerce Symfony2Rapport Pfe Application Web e-commerce Symfony2
Rapport Pfe Application Web e-commerce Symfony2
Ben Abdelwahed Slim
 
Conception et réalisation d'une application mobile cross-platform "Taki Academy"
Conception et réalisation d'une application mobile cross-platform "Taki Academy"Conception et réalisation d'une application mobile cross-platform "Taki Academy"
Conception et réalisation d'une application mobile cross-platform "Taki Academy"
Ibtihel El Bache
 
remerciement mémoire 6 exemples word télécharger www.bit.ly/3eZWRAC
remerciement mémoire 6 exemples word télécharger www.bit.ly/3eZWRACremerciement mémoire 6 exemples word télécharger www.bit.ly/3eZWRAC
remerciement mémoire 6 exemples word télécharger www.bit.ly/3eZWRAC
Hani sami joga
 
Développement et déploiement d’un Application télésurveillance diabétiques HI...
Développement et déploiement d’un Application télésurveillance diabétiques HI...Développement et déploiement d’un Application télésurveillance diabétiques HI...
Développement et déploiement d’un Application télésurveillance diabétiques HI...
HICHAMLATRECHE1
 
Réalisation d’un site web pour la Clinique des Oasis Ghardaïa
Réalisation d’un site web pour la Clinique des Oasis GhardaïaRéalisation d’un site web pour la Clinique des Oasis Ghardaïa
Réalisation d’un site web pour la Clinique des Oasis Ghardaïa
Bachir Benyammi
 
PKI
PKIPKI
Rapport de PFE - Houssem SAKLI (ISIMM)
Rapport de PFE - Houssem SAKLI (ISIMM)Rapport de PFE - Houssem SAKLI (ISIMM)
Rapport de PFE - Houssem SAKLI (ISIMM)
Houssem Sakli
 
Rapport Projet ERP - Plateforme Odoo 12 (PFE Licence)
Rapport Projet ERP - Plateforme Odoo 12 (PFE Licence)Rapport Projet ERP - Plateforme Odoo 12 (PFE Licence)
Rapport Projet ERP - Plateforme Odoo 12 (PFE Licence)
Yasmine Tounsi
 
Dentaire_Durin_Touati_Sandler_Anne_DUMAS.docx.pdf
Dentaire_Durin_Touati_Sandler_Anne_DUMAS.docx.pdfDentaire_Durin_Touati_Sandler_Anne_DUMAS.docx.pdf
Dentaire_Durin_Touati_Sandler_Anne_DUMAS.docx.pdf
ssuser25b144
 
Mémoire complète
Mémoire complèteMémoire complète
Mémoire complète
BoujahWelLimam
 
Les compléments alimentaires entre la réalité scientifique et les médias
Les compléments alimentaires entre la réalité scientifique et les médias Les compléments alimentaires entre la réalité scientifique et les médias
Les compléments alimentaires entre la réalité scientifique et les médias
RimMecheri
 

Similaire à MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf (20)

INFECTION À Chlamydia trachomatis : PROFIL EPIDEMIOLOGIQUE CHEZ LES FEMMES RE...
INFECTION À Chlamydia trachomatis : PROFIL EPIDEMIOLOGIQUE CHEZ LES FEMMES RE...INFECTION À Chlamydia trachomatis : PROFIL EPIDEMIOLOGIQUE CHEZ LES FEMMES RE...
INFECTION À Chlamydia trachomatis : PROFIL EPIDEMIOLOGIQUE CHEZ LES FEMMES RE...
 
rapport fin d'etude
rapport fin d'etuderapport fin d'etude
rapport fin d'etude
 
YouTaQA : Système de Questions-Réponses Intelligent basé sur le Deep Learning...
YouTaQA : Système de Questions-Réponses Intelligent basé sur le Deep Learning...YouTaQA : Système de Questions-Réponses Intelligent basé sur le Deep Learning...
YouTaQA : Système de Questions-Réponses Intelligent basé sur le Deep Learning...
 
Projet de Fin d'études
Projet de Fin d'études Projet de Fin d'études
Projet de Fin d'études
 
25 exemples de remerciement de mémoire - télécharger ici https://bit.ly/344aObu
25 exemples de remerciement de mémoire - télécharger ici https://bit.ly/344aObu25 exemples de remerciement de mémoire - télécharger ici https://bit.ly/344aObu
25 exemples de remerciement de mémoire - télécharger ici https://bit.ly/344aObu
 
Memoire_Fallou_Mbengue.pdf
Memoire_Fallou_Mbengue.pdfMemoire_Fallou_Mbengue.pdf
Memoire_Fallou_Mbengue.pdf
 
Rapport de projet de fin d'études - SIEMENS 2016
Rapport de projet de fin d'études - SIEMENS 2016Rapport de projet de fin d'études - SIEMENS 2016
Rapport de projet de fin d'études - SIEMENS 2016
 
La médecine traditionnelle algérienne contre la COVID 19
La médecine traditionnelle algérienne contre la COVID 19La médecine traditionnelle algérienne contre la COVID 19
La médecine traditionnelle algérienne contre la COVID 19
 
Rapport Pfe Application Web e-commerce Symfony2
Rapport Pfe Application Web e-commerce Symfony2Rapport Pfe Application Web e-commerce Symfony2
Rapport Pfe Application Web e-commerce Symfony2
 
Conception et réalisation d'une application mobile cross-platform "Taki Academy"
Conception et réalisation d'une application mobile cross-platform "Taki Academy"Conception et réalisation d'une application mobile cross-platform "Taki Academy"
Conception et réalisation d'une application mobile cross-platform "Taki Academy"
 
remerciement mémoire 6 exemples word télécharger www.bit.ly/3eZWRAC
remerciement mémoire 6 exemples word télécharger www.bit.ly/3eZWRACremerciement mémoire 6 exemples word télécharger www.bit.ly/3eZWRAC
remerciement mémoire 6 exemples word télécharger www.bit.ly/3eZWRAC
 
Développement et déploiement d’un Application télésurveillance diabétiques HI...
Développement et déploiement d’un Application télésurveillance diabétiques HI...Développement et déploiement d’un Application télésurveillance diabétiques HI...
Développement et déploiement d’un Application télésurveillance diabétiques HI...
 
Réalisation d’un site web pour la Clinique des Oasis Ghardaïa
Réalisation d’un site web pour la Clinique des Oasis GhardaïaRéalisation d’un site web pour la Clinique des Oasis Ghardaïa
Réalisation d’un site web pour la Clinique des Oasis Ghardaïa
 
PKI
PKIPKI
PKI
 
Rapport de PFE - Houssem SAKLI (ISIMM)
Rapport de PFE - Houssem SAKLI (ISIMM)Rapport de PFE - Houssem SAKLI (ISIMM)
Rapport de PFE - Houssem SAKLI (ISIMM)
 
Rapport Projet ERP - Plateforme Odoo 12 (PFE Licence)
Rapport Projet ERP - Plateforme Odoo 12 (PFE Licence)Rapport Projet ERP - Plateforme Odoo 12 (PFE Licence)
Rapport Projet ERP - Plateforme Odoo 12 (PFE Licence)
 
Dentaire_Durin_Touati_Sandler_Anne_DUMAS.docx.pdf
Dentaire_Durin_Touati_Sandler_Anne_DUMAS.docx.pdfDentaire_Durin_Touati_Sandler_Anne_DUMAS.docx.pdf
Dentaire_Durin_Touati_Sandler_Anne_DUMAS.docx.pdf
 
Mémoire complète
Mémoire complèteMémoire complète
Mémoire complète
 
Garde page
Garde pageGarde page
Garde page
 
Les compléments alimentaires entre la réalité scientifique et les médias
Les compléments alimentaires entre la réalité scientifique et les médias Les compléments alimentaires entre la réalité scientifique et les médias
Les compléments alimentaires entre la réalité scientifique et les médias
 

Plus de Aichétou Djimé Gallédou

Pydio_Apache
Pydio_ApachePydio_Apache
Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...
Aichétou Djimé Gallédou
 
Systeme de chiffrement et signature avec RSA en java
Systeme de chiffrement et signature avec RSA en javaSysteme de chiffrement et signature avec RSA en java
Systeme de chiffrement et signature avec RSA en java
Aichétou Djimé Gallédou
 
Enumération et phishing contres mesures
Enumération et phishing contres mesuresEnumération et phishing contres mesures
Enumération et phishing contres mesures
Aichétou Djimé Gallédou
 
ZABBIX ET PRTG
ZABBIX ET PRTG ZABBIX ET PRTG
SASS SQL SERVER
SASS SQL SERVERSASS SQL SERVER
Dfs
DfsDfs

Plus de Aichétou Djimé Gallédou (7)

Pydio_Apache
Pydio_ApachePydio_Apache
Pydio_Apache
 
Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...Proposition d'une politique de sécurité pour les systèmes de base de données ...
Proposition d'une politique de sécurité pour les systèmes de base de données ...
 
Systeme de chiffrement et signature avec RSA en java
Systeme de chiffrement et signature avec RSA en javaSysteme de chiffrement et signature avec RSA en java
Systeme de chiffrement et signature avec RSA en java
 
Enumération et phishing contres mesures
Enumération et phishing contres mesuresEnumération et phishing contres mesures
Enumération et phishing contres mesures
 
ZABBIX ET PRTG
ZABBIX ET PRTG ZABBIX ET PRTG
ZABBIX ET PRTG
 
SASS SQL SERVER
SASS SQL SERVERSASS SQL SERVER
SASS SQL SERVER
 
Dfs
DfsDfs
Dfs
 

MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf

  • 1. Université Cheikh Anta DIOP de Dakar Faculté des Sciences et Techniques Département Mathématiques et Informatique Laboratoire d’Algèbre de Cryptologie de Géométrie Algébrique et Application LACGAA Thème : Étude et Implémentation d’un Outil d’aide à la Décision Médicale sur Basé l’intelligence artificielle : cas du Cancer du Sein chez la Femme Présenté et soutenu par: Mlle. Aichétou Djimé GALLÉDOU Sous la direction du: Dr. Ousmane NDIAYE Jury : Président : Pr. Cheikh Thiécoumba GUEYE UCAD Membres : Pr. Agrégé. Boucar NDONG UCAD Dr. Ousmane NDIAYE UCAD Dr. Jean Klamti BELO UCAD Master Transmission de Données et Sécurité de l’Information Année Académique 2017 – 2018
  • 2. i I propose to consider the question, “Can machines think”? A computer would deserve to be called intelligent if it could deceive a human into believing that it was human. - Alan Turing, Mathématicien et Cryptanalyste -
  • 3. ii DÉDICACES Je dédie ce modeste travail : À ma mère, ma meilleure amie, ma confidente, ma conseillère, la prunelle de mes yeux Hawa Bocar Diagana pour l’Amour et le soutien inconditionnel qu’elle me donne chaque jour certes, je ne serais pas là où je suis aujourd’hui sans ses conseils, toutes les lettres du monde ne sauraient trouver les mots pour que je puisse exprimer tout ce que j’ai sur le cœur pour elle. Aucun hommage ne pourra être à la hauteur de l’Amour qu’elle me porte, qui ne cesse de me combler qu'ALLAH la procure une bonne santé et une longue vie et je prie qu’il nous réunît dans FIRDAWS son PARADIS ETERNEL ; À mon père Djimé Dahaba Gallédou qui guide mes pas chaque jour, qui est un exemple pour moi, qui a fait de moi la personne que je suis aujourd’hui par son Amour, ces conseils, son soutien, je ne saurais exprimer l’Amour, la gratitude, le respect et la reconnaissance que j’ai pour lui. Aucun hommage ne pourra être à la hauteur de l’Amour qu’il me porte qui ne cesse de me combler qu'ALLAH lui procure une bonne santé, une longue vie et je prie qu’il nous réunît dans FIRDAWS son PARADIS ETERNEL. À mon oncle Tahara Dahaba Gallédou que j'aime beaucoup qui a guidé mes premiers pas à l'école, mon premier jour que je n’oublierais jamais en fermant seulement les yeux, je peux remémorer ce souvenir mémorable, toi qui ne cesse de me donner des Douas à chaque fois qu'on se parle qu'ALLAH t'accorde AL-FIRDAWS son PARADIS ETERNEL. À mes frères, mes sœurs, mes amis, à toutes les membres de ma famille et à mes camarades avec qui j'ai partagé ces années d'études à mes voisines djiboutiennes et comoriennes, je prie pour chacun de vous, qu'ALLAH vous accorde tout ce que vous voulez dans la vie qui est bon pour vous et l'au-delà.
  • 4. iii REMERCIEMENTS « Au nom d'Allah, le Tout Miséricordieux le très Miséricordieux et paix et salut sur Mouhamad Rassoulilah son serviteur » Alhamdoulil’Allah, Ô ALLAH à toi la louange jusqu’à ce que tu agrées, à toi la Louange lorsque tu as agréé et à toi la louange après l’agrément, Louange à toi dans toutes les situations, à toi la Louange tout comme tu dis et mieux que ce que nous disons, merci à toi le tout-puissant et le tout miséricordieux de m'avoir donnée la patience et le courage durant ces années d’étude, de m’avoir donné la santé et la volonté d’entamer et de terminer ce mémoire. Je tiens à remercier mon encadreur le Docteur Ousmane Ndiaye pour l'orientation, la confiance et la patience qui ont constitué un apport considérable sans lequel ce travail n’aurait pas pu être mené. Je tiens à remercier Mr. Cheikh Djibril Sow pour sa grande générosité et pour ses bonnes explications qui m’ont éclairé le chemin dans l’accomplissement de ce travail. Je tiens à remercier les membres du jury pour l’intérêt qu’ils ont porté à ce mémoire acceptant d’examiner et de l’enrichir par leurs propositions particulièrement au Professeur Boucar Ndong de la Faculté de Médecine de Pharmacie et d’odontologie. Mes profonds remerciements s’adressent à tous les membres du corps professoral de la TDSI de m’avoir accompagné tout au long de ces 5 années de formation certes ils m’ont beaucoup appris, avec générosité et patience. Je tiens à remercier le Docteur Ibrahima Diakhaté de m'avoir accueilli au Centre d'Imagerie Diagnostique et Interventionnelle, certes bon nombre de personnes m'ont fermé leur porte au nez et vous avez ouvert le vôtre je vous en serai toujours reconnaissante. Un grand merci au Dr. Dialla Traoré, au Dr. Mouhamed Diawara et à Mr. Ibrahima Soccé Radiologue technicien à CIDIS.
  • 5. iv A LA MEMOIRE DE Tous ceux qui ont contribué à mon éducation, à ma formation et à ceux qui étaient là pour moi, mes rayons de soleil et qui ne sont plus là malheureusement. Mes grands Parent : - Mariam Moussa Séméga - Maro Moussa Séméga - Mohamed Moussa Séméga - Bakary Moussa Séméga - Djénéba Lakhami Séméga - Bocar Diagana - Dahaba Djimé Gallédou - Assa Diagana - Assa Tandia - Gniouma Kandé Magassouba - Aminéta Doungou Mon Oncle Hadya Kaou Diagana Ma petite sœur et Mon petit frère : - Maro Djimé Gallédou - Bocar Djimé Gallédou Mes professeurs : - Nima Kanté - Ba Khassoum Certes, la mort nous a séparé vous êtes plus là ainsi est le destin de chaque être humain, mais je ne vous oublierai jamais vous resterez à jamais dans mon cœur jusqu’à mon dernier souffle. Reposez en paix qu’ALLAH vous accorde AL-FIRDAWS SON PARADIS ÉTERNEL.
  • 6. v AVANT-PROPOS Laboratoire d’Algèbre, de Cryptographie, de Géométrie Algébrique et Applications (LACGAA): objectifs et Domaine de recherche. Depuis 2004, le laboratoire LACGAA est le seul de la sous-région spécialisé sur la formation et la recherche en cryptographie et dans les domaines de la sécurité de l’information. Le laboratoire LACGAA a déjà formé en master, plus de 100 titulaires du master 2 (niveau ingénieur) qui travaillent dans les entreprises en France, aux USA, au Sénégal et dans la sous- région ; et en licence, plus de 40 techniciens. En Thèse, le labo est entrain de former plus de 10 thèses en codage et cryptologie à Dakar et en France dont 5 ont terminés. Sous la direction du Professeur Mamadou Sangharé, le laboratoire LACGAA a pour objectifs: 1. La formation à la recherche fondamentale et appliquée dans les domaines de La Cryptographie, de la Théorie des codes, de l’Algèbre, de la Géométrie et de leurs applications (en logique, en informatique, en sécurité de l’information, en biologie, en robotique etc.) par :  des enseignements pour les jeunes doctorants durant leur première année d’inscription en thèse ;  l’encadrement des jeunes doctorants durant toute la durée de leur thèse ;  la mise en place d’un cadre approprié pour l’épanouissement des jeunes doctorants. 2. L’organisation de la recherche par la mise en place d’un cadre approprié pour l’épanouissement des chercheurs et le développement de la recherche ; 3. la création de licences et de masters professionnels et recherches en algèbre, géométrie et leur application notamment en sécurité informatique les principaux domaines de recherche sont l’algèbre et ses différentes applications : Algèbre commutative, algèbre non commutative, algèbre associative, algèbre non associative; géométrie algébrique commutative et non commutative, Homologie et Cohomologie, Théorie algébrique et analytique des nombres, Cryptographie, Théorie des Codes Correcteurs d’Erreurs, Théorie du signal Informatique théorique, Sécurité informatique etc.
  • 7. vi SOMMAIRE INTRODUCTION GÉNÉRALE---------------------------------------------------------------------- 1 PARTIE I :CADRE THÉORIQUE ET MÉTHODOLOGIQUE ------------------------------ 2 CHAPITRE 1: CADRE THÉORIQUE----------------------------------------------------------- 3 INTRODUCTION-------------------------------------------------------------------------------- 3 1.1. PROBLÉMATIQUE-------------------------------------------------------------------- 3 1.2. LES OBJECTIFS DU PROJET ------------------------------------------------------- 3 1.3. LES HYPOTHÈSES DE RECHERCHE -------------------------------------------- 4 1.4. LA PERTINENCE DU SUJET ------------------------------------------------------- 4 CONCLUSION ----------------------------------------------------------------------------------- 4 CHAPITRE 2: CADRE MÉTHODOLOGIQUE ---------------------------------------------- 5 INTRODUCTION-------------------------------------------------------------------------------- 5 2.1. TECHNIQUES D’INVESTIGATION ----------------------------------------------- 5 2.2. PRÉSENTATION DES DONNÉES MAMMOGRAPHIQUES ----------------- 5 2.3. DIFFICULTÉS RENCONTRÉES---------------------------------------------------- 6 CONCLUSION ----------------------------------------------------------------------------------- 7 PARTIE II : CADRE ANALYTIQUE ET IMPLÉMENTATION ---------------------------- 8 CHAPITRE 1: LE CANCER DU SEIN----------------------------------------------------------- 9 INTRODUCTION-------------------------------------------------------------------------------- 9 1.1. ANATOMIE DU SEIN----------------------------------------------------------------- 9 1.2. SYMPTÔMES ET SIGNES ----------------------------------------------------------10 1.3. TUMEURS DU SEIN ----------------------------------Erreur ! Signet non défini. 1.4. CANCER DU SEIN--------------------------------------------------------------------12 1.5. TYPES HISTOLOGIQUES DU CANCER DU SEIN----------------------------15 1.6. CLASSIFICATION TNM ------------------------------------------------------------18 1.7. EVOLUTION ---------------------------------------------------------------------------20 1.8. DIAGNOSTICS ------------------------------------------------------------------------21 1.9. TRAITEMENTS -----------------------------------------------------------------------26 CONCLUSION ----------------------------------------------------------------------------------26 CHAPITRE 2: INTELLIGENCE ARTIFICIELLE------------------------------------------28 INTRODUCTION-------------------------------------------------------------------------------28 2.1. PRÉSENTATION DE L’INTELLIGENCE ARTIFICIELLE-------------------28 2.2. HISTOIRE DE L’INTELLIGENCE ARTIFICIELLE----------------------------29 2.3. LES DIFFÉRENTS TYPES D’INTELLIGENCE ARTIFICIELLE------------29 CONCLUSION ----------------------------------------------------------------------------------32 CHAPITRE 3: MACHINE LEARNING --------------------------------------------------------33 INTRODUCTION-------------------------------------------------------------------------------33 4.1. PRÉSENTATION DU MACHINE LEARNING----------------------------------33 4.2. LA COLLECTE DE DONNÉES ----------------------------------------------------34 4.3. LA MODÉLISATION-----------------------------------------------------------------35 4.4. LA TÂCHE À ACCOMPLIR --------------------------------------------------------36 4.5. LES DIFFÉRENTS TYPES D’APPRENTISSAGE ------------------------------36
  • 8. vii 4.6. LES ALGORITHMES D’APPRENTISSAGE-------------------------------------39 4.7. LE SURAPPRENTISSAGE ----------------------------------------------------------59 4.8. LA RÉGULARISATION -------------------------------------------------------------61 4.9. LE SOUS-APPRENTISSAGE -------------------------------------------------------62 CONCLUSION ----------------------------------------------------------------------------------63 CHAPITRE 4: DEEP LEARNING---------------------------------------------------------------64 INTRODUCTION-------------------------------------------------------------------------------64 4.1. PRÉSENTATION DU DEEP LEARNING ----------------------------------------64 4.2. LES DIFFÉRENTS TYPES D’ARCHITECTURE DEEP LEARNING-------67 CONCLUSION ----------------------------------------------------------------------------------69 CHAPITRE 5: LES RÉSEAUX DE NEURONES CONVOLUTIONELS ---------------70 INTRODUCTION-------------------------------------------------------------------------------70 5.1. PRÉSENTATION DES RÉSEAUX DE NEURONES CONVOLUTIONELS -- -----------------------------------------------------------------------------------------------------70 5.2. TRANSFER LEARNING EN CNN-------------------------------------------------80 CONCLUSION ----------------------------------------------------------------------------------84 CHAPITRE 6: IMPLÉMENTATION ----------------------------------------------------------86 INTRODUCTION-------------------------------------------------------------------------------86 6.1. PRÉSENTATION DES OUTILS----------------------------------------------------86 6.2. IMPLÉMENTATION -----------------------------------------------------------------92 6.3. PRÉ -TRAITEMENT ET DATA AUGMENTATION---------------------------94 6.2. ARCHITECTURE ET APPRENTISSAGE DU MODÉLE----------------------95 6.3. RÉSULTATS OBTENUS ET INTERPRETATIONS----------------------------96 6.4. PRÉSENTATION DE L’INTERFACE------------------------------------------- 105 CONCLUSION -------------------------------------------------------------------------------- 107 CONCLUSION GÉNÉRALE ET PERSPECTIVES------------------------------------------ 108 BIBLIOGRAPHIE ET WEBOGRAPHIE------------------------------------------------------- 109
  • 9. viii LISTE DES FIGURES Figure 1: Structure anatomique du sein...................................................................................... 9 Figure 2: Présentation d'une tumeur du sein vue de face. ........................................................ 15 Figure 3: Cancer canalaire in situ (CCIS) - Macroscopie à gauche et histologie à droite. ...... 16 Figure 4: Cancer lobulaire in situ (CLIS) - Macroscopie à gauche et histologie à droite........ 16 Figure 5: Cancer canalaire infiltrant......................................................................................... 17 Figure 6: Cancer canalaire infiltrant (CCI) - Macroscopie à gauche et histologie à droite. .... 17 Figure 7: Cancer lobulaire infiltrant(CLI) - Macroscopie à gauche et histologie à droite....... 17 Figure 8: Le mamographe. ...................................................................................................... 21 Figure 9: Mammographie montrant une tumeur au sein vue d'en face à gauche et vue de profil à droite. ............................................................................................................................. 22 Figure 10: Résultat d'un examen de mammographique. ......................................................... 23 Figure 11: Échographie montrant une masse kystique............................................................. 24 Figure 12: Cytoponction d'une tumeur..................................................................................... 25 Figure 13: histologie d'une bénigne et d'une tumeur maligne.................................................. 25 Figure 14: Étapes de l’apprentissage en ML............................................................................ 35 Figure 15: Illustration de la différence entre régression linéaire et classification linéaire. ..... 37 Figure 16: Exemple de représentation de Régression Linéaire................................................ 40 Figure 17: Prix d’une maison par sa taille................................................................................ 40 Figure 18: Une relation linéaire. .............................................................................................. 41 Figure 19: Représentation de la perte dans un cas de régression linéaire. ............................... 42 Figure 20: Représentation de Perte élevée dans le modèle à gauche, perte faible dans le modèle à droite. ............................................................................................................................. 43 Figure 21: Fonction sigmoïde. ................................................................................................. 45 Figure 22: Résultat de la régression logistique. ....................................................................... 46 Figure 23: Taux de VP et de FP pour différents seuils de classification. ................................ 50 Figure 24: AUC (aire sous la courbe ROC). ............................................................................ 51 Figure 25: L’algorithme k-means regroupe les données en k cluster, ici k = 3. Les centres de gravité sont représentés par de petits cercles. ................................................................... 52 Figure 26: Pour k = 3 la classe majoritaire du point central est la classe B, mais si on change la valeur du voisinage k = 6 la classe majoritaire devient la classe A.................................. 52 Figure 27: On cherche un hyperplan qui divise les observations en deux catégories.............. 54
  • 10. ix Figure 28: Exemple d’un problème non linéairement séparable. La courbe devient une bande linéaire après avoir appliqué la transformation non-linéaire. ........................................... 55 Figure 29: Neurone du cerveau humain. .................................................................................. 55 Figure 30: Réseau de neurone artificiel.................................................................................... 56 Figure 31: Représentation d’un neurone artificiel.................................................................... 57 Figure 32: Représentations de différentes fonctions d'activation............................................. 58 Figure 33: Représentation d’un Rétro-Propagation du Gradient. ............................................ 59 Figure 34: Perte de l'ensemble d'apprentissage et de l'ensemble de validation........................ 61 Figure 35: La relation entre l’intelligence artificielle, le ML et le Deep Learning.................. 64 Figure 36: Synapse Neuronale. ................................................................................................ 65 Figure 37: Comparaison entre un NN et un Deep Learning Neural Network ......................... 66 Figure 38: Représentation des trois couleurs RVB en proportion égale.................................. 70 Figure 39: Matrice de matrice RVB......................................................................................... 71 Figure 40: Réseau de neurones avec plusieurs couches convolutives...................................... 72 Figure 41: Une matrice d’image multipliée par un noyau ou filtre de matrice........................ 72 Figure 42: Exemple de matrice d’image multiplie la matrice de noyau ou de filtre................ 73 Figure 43: Convolution d'une matrice avec 2 pas de pixels..................................................... 76 Figure 44: Exemple d’application du ReLU. ........................................................................... 77 Figure 45: Max-Pooling avec un filtre 2x2. ............................................................................. 78 Figure 46: Average Pooling avec un filtre 2x2. ....................................................................... 78 Figure 47: Aplatissement d'une matrice.................................................................................. 79 Figure 48: Mise en pool en tant que couche FC....................................................................... 79 Figure 49: Illustration du Transfer Learning............................................................................ 80 Figure 50: Architecture du modèle LeNet................................................................................ 81 Figure 51: Architecture du modèle AlexNet............................................................................ 82 Figure 52: Architecture du modèle Inception V3 de Google. .................................................. 82 Figure 53: Architecture du modèle VGGNet. .......................................................................... 83 Figure 54: Étude comparative des différents modèles VGGNet.............................................. 83 Figure 55: Architecture du modèle ResNet.............................................................................. 84 Figure 56: Le taux d’erreur dans ImageNet Visual recognition Challenge. ............................ 84 Figure 57: Python..................................................................................................................... 86 Figure 58: Theano. ................................................................................................................... 87 Figure 59: TensorFlow............................................................................................................. 87
  • 11. x Figure 60: Keras....................................................................................................................... 88 Figure 61: PYTORCH.............................................................................................................. 89 Figure 62: Croissance de popularité de TensorFlow................................................................ 90 Figure 63: Logo Flask. ............................................................................................................. 91 Figure 64: Jinja......................................................................................................................... 91 Figure 65: MySQL. .................................................................................................................. 91 Figure 66: Répartition des données dans les dossiers cas normal/anormal.............................. 92 Figure 67: Répartition des données dans les dossiers cas normal, bénin et malin................... 93 Figure 68: Répartition des données dans les dossiers cas normal et bénin/malin(masse et calcification)...................................................................................................................... 93 Figure 69: Architecture de notre modèle.................................................................................. 96 Figure 70: Architecture du modèle - cas normal/anormal........................................................ 97 Figure 71: Résultat obtenu - cas normal/anormal. ................................................................... 98 Figure 72: Histogrammes de l’apprentissage et de la validation du cas normal/anormal........ 98 Figure 73: Test sur les données cas normal/anormal - Matrice de confusion. ......................... 99 Figure 74: Architecture du modèle - cas normal, bénin et malin........................................... 100 Figure 75: Résultat obtenu - cas normal, bénin et malin........................................................ 100 Figure 76: Histogrammes de l’apprentissage et de la validation du cas normal, malin et bénin. ......................................................................................................................................... 101 Figure 77: Test sur les données cas normal, bénin et malin - Matrice de confusion. ............ 101 Figure 78: Architecture du modèle - cas normal et bénin/malin (masse et calcification)...... 102 Figure 79: Résultat obtenu - cas normal et bénin/malin (masse et calcification)................... 103 Figure 80: Histogrammes de l’apprentissage et de la validation du cas normal et malin/bénin(masse et calcification). ............................................................................... 103 Figure 81: Test sur les données cas normal et bénin/malin(masse et calcification): Matrice de confusion......................................................................................................................... 104 Figure 82: Présentation de l'interface de l'application............................................................ 105 Figure 83: Inscription et connexion d'un utilisateur............................................................... 106 Figure 84: Aperçus de la base de données MySQL (les mots de passe sont chiffrés). .......... 106 Figure 85: Test de prédiction sur une mammographie dans l'interface de l'application. ....... 107
  • 12. xi LISTES DES TABLEAUX Tableau 1: Classification TNM................................................................................................ 19 Tableau 2: Classification de cancer du sein par stade.............................................................. 20 Tableau 3: Gradient du Linéaire régression. ............................................................................ 44 Tableau 4: Classification vrai ou faux et positif ou négatif. ................................................... 49 Tableau 5: Histoire du Deep Learning. .................................................................................... 67 Tableau 6: Quelques exemples d'effets pouvant être obtenus par la convolution des noyaux et des images......................................................................................................................... 75 Tableau 7: Nombre d’étoile par framework sur github............................................................ 90 Tableau 8: Interprétation des résultats cas normal/anormal..................................................... 99 Tableau 9: Interprétation des résultats cas normal, bénin et malin. ....................................... 102 Tableau 10: Interprétation des résultats cas normal et bénin/malin(masse et calcification).. 104
  • 13. xii LISTE DES ABRÉVIATIONS ACR American College of Radiology AND Acide DésoxyriboNucléique av. J.-C. Avant Jesus-Christ API Application Programming Interface ASI Artificial SuperIntelligence AUC Area Under Curv BI-RADS Breast Imaging-Reporting And Data System CC Cranio-Caudal CCIS Cancer Canalaire In situ CBIS-DDSM Curated Breast Imaging Subset of DDSM CIDIS Centre d'Imagerie Diagnostique et Interventionnelle de Soumbédioune CNN Convolutional Neural Network CPU Central Processing Unit DAI Distributed Artificial Intelligence DBN Deep Belief Network DDSM Digital Database for Screening Mammography DL Deep Learning DNN Deep Neural Network FCFA Franc Communauté Financière Africaine FN Faux Négatif FP Faux Positif GPU Graphics Processing Unit IA Intelligence Artificielle
  • 14. xiii IARC International Agency for Research on Cancer IID Indépendantes et Identiquement Distribuées ILSVRC ImageNet Large Scale Visual Recognition Competition IRM Imagerie par Résonance Magnétique KNN K-Nearest Neighbors MCP McCulloch–Pitts MGH Massachusetts General Hospital MILA Montreal Institute for Learning Algorithms ML Machine Learning MLO MedioLateral-Oblique MSE Mean Squared Error NLP Natural Langage Processing NN Neural Network RAM Random-Access Memory RNN Recurrent Neural Network ROC Receiver Operating Characteristic ROI Region Of Interest SVM Support Vector Machine TCIA The Cancer Imaging Archive TPU Tensor Processing Unit UAMS University of Arkansans for Medical Sciences VGG Visual Geometry Group VN Vrai Négatif VP Vrai Positif
  • 15. xiv WFU Wake Forest University WUSTL Washington University of St. Louis School of Medicine
  • 16. 1 INTRODUCTION GÉNÉRALE INTRODUCTION GÉNÉRALE Le diagnostic et la prévention dans les hôpitaux et dans les établissements de soin de santé sont des tâches difficiles pour le personnel médical qualifié. Le personnel médical n’a pas souvent la possibilité d’observer chacun de ces patients à temps plein et faire des diagnostics précis très rapidement. Bien que le personnel médical soit efficace pour identifier les besoins immédiats, ils ne parviennent pas toujours à faire le diagnostic des pathologies sur la base d’un interrogatoire et d’un examen clinique. Il a souvent recours à des moyens de diagnostic biologique et d’imagerie médicale. Malgré cet arsenal utilisé, il peut avoir recours au traitement de l’image dans sa forme matricielle pour une aide un diagnostic. C’est pourquoi au cours de ces dernières années, avec le récent accroissement des performances de l’Intelligence Artificielle (IA) notamment avec le Machine Learning (ML), le Deep Learning (DL), le stockage massif des données sur des serveurs et la prouesse des calculs des machines, nous assistons à une véritable révolution. En effet, l’avènement de l’IA a permis de nombreux avancées dans le traitement de l’image améliorant ainsi le diagnostic médical. Ce présent document s’articule en deux parties : première partie : la problématique, les objectifs, la pertinence du sujet, les techniques d’investigation et les difficultés rencontrés ; deuxième partie : le cancer du sein, l’intelligence artificielle, le Machine Learning, le Deep Learning, les réseaux de neurones convolutionels (CNN), le prétraitement, la labélisation des données, l’implémentation de notre modèle de prédiction et la présentation des résultats et de l’application.
  • 17. 2 PARTIE I : CADRE THÉORIQUE ET MÉTHODOLOGIQUE
  • 18. 3 CHAPITRE 1 : CADRE THÉORIQUE CHAPITRE 1: CADRE THÉORIQUE INTRODUCTION La médecine est la science qui accompagne l’humanité depuis des millénaires. C’est la discipline qui cherche à préserver la santé physique et mentale des êtres humains par la prévention et le traitement des maladies. Au fur et à mesure qu’on avance dans le temps, de nouvelles maladies sont découvertes et d’autres sont devenues plus fréquentes. L’ampleur et les progrès de l’imagerie, le développement des tests biologiques, ainsi que la mise sur le marché de nouveaux médicaments et d’autres procédures thérapeutiques ont beaucoup amélioré la prise en charge des patients. Dans ce présent chapitre, nous aborderons la problématique rencontrée lors d’un diagnostic de cancer du sein, les objectifs et les hypothèses de recherche puis la pertinence de notre sujet. 1.1. PROBLÉMATIQUE Les performances médicales bien qu’elles soient très évoluées en terme de diagnostic ne permettent pas de faire le diagnostic différentiel de certaines pathologies médicales. Et même si le diagnostic de cancer est fait la stadification peut souvent poser de sérieux problèmes. C’est pourquoi nous collaborons avec ces médecins en utilisant les algorithmes mathématiques pour une aide au diagnostic et à la classification des tumeurs mammaires. Celles-ci étaient stratifiées jusque-là sur la base d’une interprétation qui faisaient intervenir l’expérience du radiologue mais également le pouvoir discriminatoire de l’œil humain malgré une relecture par un autre radiologue pour établir la classification ACR de BI-RADS. Ce qui justifie notre étude. 1.2. LES OBJECTIFS DU PROJET L’objectif de ce présent mémoire est de concevoir un outil (une application) possédant un modèle intelligent et performant pour la classification des images mammographiques en faisant appel à l’intelligence artificielle afin d’assister le médecin (le radiologue) dans son raisonnement en vue d’identifier rapidement, efficacement et avec une certaine précision la présence d’une anomalie dans une mammographie. Ceci serait plus facile à réaliser en utilisant les réseaux de neurones artificiel. Ce qui nous permettra d’être plus précis, d’obtenir un gain en matière de temps et de réaliser des économies. De ce fait, on améliore la prise en charge des patients respectant les bonnes pratiques cliniques, le médecin outillé pourra réaliser des tâches
  • 19. 4 complexes, plus rapide avec une certaine précision. Cette application permettra au radiologue de prédire le cas de la présence d’une anomalie dans une mammographie qui résultera par des examens plus approfondies. 1.3. LES HYPOTHÈSES DE RECHERCHE La mammographie permet de prendre une décision dans le cas de la présence d’une anomalie (s’il s'agit d’une tumeur cancéreuse). Et c’est dans cette phase sensible et décisive qu’on peut rencontrer des erreurs, ainsi emmètre une fausse analyse et par conséquent risquer de perdre une vie. Il convient donc de mettre en place un outil d’aide à la décision assistant le médecin pour un diagnostic rapide et efficace. Cette analyse doit être plus précise et ce n’est pas toujours fournie par une analyse manuelle, tous cela nous conduit vers un traitement automatique exigent rapidité et précision. Dans le Deep Learning on va utiliser plus exactement la technologie des réseaux de neurones convolutifs (CNN) qui atteignent, voire dépassent les performances humaines en matière de classification des images. Ces modèles ont un potentiel énorme en analyse d'imagerie médicale. 1.4. LA PERTINENCE DU SUJET Le cancer est la 2ème cause de mortalité après les cardiopathies ischémiques et les accidents vasculaires cérébraux, il tue plus que le sida, le paludisme, les accidents de la voie publique, les homicides, les suicides, les guerres, les incendies réunis [W, 5]. Cette maladie se développe et s’accroît dans le corps humain silencieusement ce qui rend son diagnostic difficile. Le cancer du sein n’est qu’une étape pour pouvoir se lancer dans l’étude des autres types de cancer. Le cancer du sein est le premier cancer de la femme dans le monde avec 1 million de nouveaux cas par an et au Sénégal c’est le deuxième cancer chez la femme (2014) [B, 1]. En 2015, le cancer du sein a fait 8,8 millions morts, près d’un (1) décès sur six (6) est dû au cancer ces chiffres ne cesse de s’accroître, on estime que pour l’année 2018, près de 18 millions de personnes recevront le diagnostic de cancer, et 9.6 millions en décéderont [W, 8] Source : World Cancer Report 2018 - International Agency for Research on Cancer (IARC). CONCLUSION Dans ce chapitre, nous avons présenté les problèmes rencontrés pour l’identification des cellules cancéreuses du sein. On a proposé une solution pour avoir des précisions plus exactes sur un diagnostic et on a expliqué les raisons qui nous ont poussés à réaliser cette étude.
  • 20. 5 CHAPITRE 2 : CADRE MÉTHOLOGIQUE CHAPITRE 2: CADRE MÉTHODOLOGIQUE INTRODUCTION Dans ce présent chapitre, nous allons aborder les recherches faites afin de trouver des mammographies (des images médicales) avec lesquelles nous allons travailler dans ce mémoire. Présenter ces données leurs caractéristiques et les difficultés rencontré lors de la recherche et de la collecte des données. 2.1. TECHNIQUES D’INVESTIGATION En avril 2018, nous avons cherché dans les hôpitaux de Dakar notamment à Aristide Le Dantec et Fann des données mammographiques, mais en vain. Les documents produits n’étaient pas sauvegardés dans un serveur, autrement dit il n’y avait pas d’archivage et que les données recueillies étaient supprimées au fur et à mesure. Nous avons pensé à visiter d’autres centres parmi lequel le centre Centre d'Imagerie Diagnostique et Interventionnelle de Soumbédioune (CIDIS). Ils ont bien voulu collaboré avec nous en nous expliquant la procédure de diagnostic de cancer du sein. Et malheureusement, ils ont dit qu’ils ne possédaient pas de serveur de stockage d'images mammographiques pour l’instant, mais qu'il en avait déjà commandé. Et dans un avenir proche une collaboration serait possible. Donc on s'est retourné vers les archives de mammographie internationale celui qui avait le plus de données était Digital Database for Screening Mammography (DDSM). 2.2. PRÉSENTATION DES DONNÉES MAMMOGRAPHIQUES PRÉSENTATION DES DONNÉES DDSM La base de données numérique pour la mammographie de dépistage reconnue en anglais sous le nom de DDSM : Digital Database for Screening Mammography a été ressemblée par un groupe de chercheur de l’Université du sud de la Floride, elle contient 2 620 cas c’est à dire que les examens ont été effectués sur 2 620 patientes, il existe 2 types de mammographie sur la base de donnée un MLO, MedioLateral-Oblique est une vue oblique ou angulaire et un CC, Cranio- Caudal est une vue d'en haut, les mammographies sont recueillies auprès de l’hôpital
  • 21. 6 "Massachusetts General Hospital" (MGH), l’université "Wake Forest University" (WFU) et l’hôpital "Washington University of St. Louis School of Medicine" (WUSTL), il contient des cas normaux, bénins et malins avec des informations de pathologie vérifiées. DDSM a largement été utilisée par la communauté scientifique dans le domaine du diagnostic cancer du sein ; elle a l’avantage d’utiliser le même lexique normalisé par l’American College of Radiology (ACR) dans le BI-RADS (Breast Imaging-Reporting And Data System). Nous avons prélevé un échantillon composé de 4 473 images : 1 377 normales, 1 739 bénignes et 1 357 malignes les mammographies sont de taille différente, ces exemples seront partitionnés en trois dossiers exemples d’apprentissage, exemple de validation et exemple de test. 2.3. DIFFICULTÉS RENCONTRÉES Le DDSM qui est une base de données plus intéressante que les autres par sa grande quantité de donnée mammographique, mais cependant pour télécharger les images, il a fallu faire plusieurs semaines vu la connexion internet de bas débit utilisé. Ensuite les données DDSM sont enregistrées au format JPEG sans perte (LJPEG, Less Lost JPEG) il a fallu les décompresser. La collection CBIS-DDSM comprend un sous-ensemble des données DDSM sélectionnées et conservées. Elle a été créé et a été initialement hébergé par l’Université de Washington à Saint- Louis. En décembre 2010, le National Cancer Institute, par l’intermédiaire du Fredrick National Laboratory, a confié à l’Université de Washington l’établissement d’un environnement d’hébergement haute disponibilité basée sur des clusters permettant de collecter et de gérer les collections d’images actuelles et futures. En octobre 2015, le Dr Prior et l'équipe principale de TCIA ont été transférés à Mallinckrodt Institute of Radiology de l'Université de Washington au département d'informatique biomédicale de l'Université de l'Arkansas pour les sciences médicales. Un nouvel environnement d’accueil pour TCIA a été créé à UAMS et tous les logiciels, processus et données ont été transférés de St. Louis à Little Rock au mois d’octobre 2015. Les archives conservées fournissent des collections d’images de haute qualité et de grande valeur aux chercheurs en cancérologie du monde entier. Les images CBIS-DDSM ont été pré-traitées par type d’anomalie, c’est-à-dire sur chaque image on a identifié l’anomalie et pris les limites de la tumeur sur les images on appelle ça
  • 22. 7 extraction du ROI Region Of Interest et enregistrées en tant qu'image DiCom, mais puisque cet ensemble de données ne contient que des numérisations présentant des anomalies. Donc les données mammographies normales, ont été téléchargées dans le site DDSM et les données anormales des cas de bénins et malins, on était téléchargé à partir du site CBIS-DDSM afin de créer un jeu de données pouvant être utilisé pour prédire la présence d'anomalies. CONCLUSION Dans ce chapitre, nous avons pu aborder la manière dont on a collecté nos données, des universités qui héberge les données mammographiques. Ensuite présenter les données et leurs caractéristiques et enfin on a parlé des difficultés rencontrés lors des recherches.
  • 23. 8 PARTIE II : CADRE ANALYTIQUE ET IMPLÉMENTATION
  • 24. 9 CHAPITRE 1 : LE CANCER DU SEIN CHAPITRE 1: LE CANCER DU SEIN INTRODUCTION Le cancer du sein comme son nom l’indique est localisé dans l’organe humain qu’on appelle le sein, il résulte d’un dérèglement de certaines cellules qui se multiplient et forme une masse appelée tumeur. Il en existe différents types qui n’évoluent pas de la même manière certains sont « agressifs » et évoluent très rapidement, d’autres lentement. Le développement du cancer du sein peut prendre plusieurs mois, voire plusieurs années. Dans ce présent chapitre, nous allons étudier la structure du sien, les symptômes cancer du sein (ce que la patiente à remarquer chez elle d’anormal) et les signes (ce que le docteur à découvert en l’examinant). Par la suite décrire une tumeur du sein et de ces différents aspects, aborder les facteurs de risque du cancer du sein, son diagnostic et enfin de certains traitements. 1.1. ANATOMIE DU SEIN Les seins sont situés au niveau de la face antérieure du thorax, reposent en arrière sur le muscle pectoral, centrés par les mamelons, ces derniers entourés d’une zone pigmentée appelée l’aréole. La peau de l’aréole est très fine, légèrement déformée par les orifices des glandes sébacées, des glandes sudoripares et des follicules pileux. La glande mammaire est constituée d’une vingtaine de lobes glandulaires noyés dans du tissu graisseux. Les canaux excréteurs de ces lobes, appelés canaux galactophores, débouchent sur le mamelon. Figure 1: Structure anatomique du sein.
  • 25. 10 Avant de connaître une anomalie on doit différencier un sein normal d’un sein anormal, c’est- à-dire reconnaître l’aspect normal du tissu glandulaire (des lobules) aussi bien que chez la jeune fille que chez la personne âgée c’est à partir de ce moment qu’on pourra déterminer si une lésion est pathologique pour pouvoir identifier une anomalie dans un sein. Un sein normal est reparti en quatre types : Type A : le sein présente plus de graisse que de glande (chez les personnes âgées) ; Type B : le sein présente autant de glande que de graisse ; Type C : le sein présente plus de glande que de graisse ; Type D : le sein est glandulaire et tout à fait blanc (chez les jeunes filles). 1.2. SYMPTÔMES ET SIGNES Les symptômes sont découverts par la patiente elle-même un cancer du sein peut se manifester chez une patiente par « une grosseur » (nodule), un écoulement de liquide clair ou sanglant par le mamelon, une déformation du galbe du sein ou du mamelon (rétraction), plus rarement par une douleur. Mais il peut aussi ne pas présenter parfois aucun symptôme. L’examen permet de rechercher :  A l’inspection : la taille du sein malade (à augmenter ou à diminuer) par rapport au sein controlatéral, s’il y a une déformation orientée d’un côté par rapport à l’autre, s’il y a une rétraction, ride, Aspect de la peau en regard (rougeur ou ecchymose).  A la palpation caractériser la masse siège, la consistance est ce que la masse est dure ou molle, douloureuse ou indolore, est ce qu’il y a un écoulement, etc. 1.3. TUMEURS DU Le terme de tumeur (synonyme : « néoplasme » ou « néoplasie ») désigne une prolifération cellulaire excessive aboutissant à SEIN une masse tissulaire ressemblant plus ou moins au tissu normal homologue (adulte ou embryonnaire), ayant tendance à persister et à croître, témoignant de son autonomie biologique.
  • 26. 11 1.3.1. CRITÈRES DES TUMEURS BÉNIGNES Les tumeurs bénignes ont des contours bien délimités donnent un nodule opaque, dense, hétérogène, aspect stellaire, spéculer, plus souvent de petite taille. Cependant, on peut en trouver de grande taille. Elles ont une croissance lente et restent localisées dans le tissu où l’organe dans lequel elles sont apparues. Elles n’entraînent pas de métastases dans d’autres endroits du corps. Les tumeurs bénignes sont composées de cellules qui ressemblent aux cellules normales du tissu concerné. On dit qu’elles sont bien différenciées. La tumeur bénigne qui se développe le plus souvent dans le sein est appelé fibroadénome. Les autres affections bénignes du sein sont les kystes, les changements fibrokystiques, l'hyperplasie, la gynécomastie. Une tumeur bénigne est localisée dans un seul endroit la tumeur en un moment donné, peut augmenter de taille, sans risque de métastase. 1.3.2. CRITÈRES DES TUMEURS MALIGNES Les tumeurs malignes ont des contours le plus souvent mal délimités. Certaines sont toutefois bien limitées et peuvent alors être considérées un temps comme bénignes, ceci pouvant retarder le diagnostic de cancer. Les cellules cancéreuses qui composent les tumeurs malignes présentent diverses anomalies par rapport à des cellules normales : forme et taille différentes, contours irréguliers… On parle de cellules indifférenciées, car elles ont perdu leurs caractéristiques d’origine. Les tumeurs malignes ont tendance à envahir les tissus voisins. Elles peuvent entraîner des métastases : des cellules cancéreuses s’échappent de la tumeur primitive et vont coloniser une autre région du corps tel que le foie, le cerveau, poumon pour y former une nouvelle tumeur qu’on appelle tumeur secondaire ou métastase. La bénignité (nature non-cancéreuse) ou la malignité (nature cancéreuse) peuvent être évoquées sur l'aspect retrouvé sur les examens d'imagerie pratiqués. Mais c’est grâce à l’examen anatomopathologique d’un échantillon de tumeur que l’on peut déterminer si elle est cancéreuse ou non, c'est-à-dire l’examen qui permettra son étude et orienté le traitement. 1.3.3. CALCIFICATIONS Les calcifications mammaires sont des dépôts de calcium qui se forment dans le tissu mammaire. Elles n’ont aucun lien avec la quantité de calcium absorbée au cours de
  • 27. 12 l’alimentation ou obtenue par l’intermédiaire de compléments alimentaires. En effet, la calcification donne un aspect dure à la tumeur Il existe deux types de calcifications : les macrocalcifications et les microcalcifications. Les macrocalcifications sont des dépôts grossiers de calcium dans le sein. Elles sont plus fréquentes chez les femmes âgées de plus de 50 ans. Elles sont souvent associées à des modifications bénignes qui se produisent dans le sein et qui sont liées par exemple au vieillissement des artères du sein, à des anciennes lésions, à une inflammation ou à des masses telles qu'un fibroadénome. Les microcalcifications sont de minuscules dépôts de calcium dans le sein. Leur présence signifie parfois que l'activité de certaines cellules du sein est accrue. Une cellule plus active absorbe en effet davantage de calcium que celle qui l’est moins. Les microcalcifications peuvent faire suspecter un cancer du sein (comme un carcinome canalaire in situ-CCIS), notamment lorsqu’elles apparaissent isolées ou regroupées en grappes à la mammographie. Si tel est le cas, le radiologue recommande de réaliser une biopsie afin de vérifier qu’il ne s’agit pas d’un cancer, et en fonction des résultats, on détermine le traitement qui sera suivit par la patiente. 1.4. CANCER DU SEIN Le cancer est la présence d’une tumeur maligne. Il survient à la suite de mutations ou de changements anormaux dans les gènes responsables de la régularisation, de la croissance des cellules. Les gènes sont dans le noyau de chaque cellule qui agit comme la salle de contrôle. Normalement, les cellules de notre corps se remplacent par un processus ordonné de la croissance cellulaire : de nouvelles cellules prennent en charge alors que les anciens disparaissent. Mais au fil du temps, les mutations peuvent apparaître dans certains et engendré un début de malformation qui peut engendrer une tumeur bénigne ou maligne. On distingue les cancers in situ (confinés dans les canaux ou les lobules) et les cancers invasifs ou infiltrants. La tumeur cancéreuse érode (incruste) tout son entourage par dans la lymphe atteint les organes tels que le cerveau, le poumon, le foie. On pense que le cancer du sein n’arrive qu’aux femmes, mais environ 1% des cancers du sein se produisent chez les hommes. Les hommes ont une petite quantité de tissu derrière le mamelon et bien qu’elle ne soit pas aussi importante que chez les femmes, un cancer peut quand même
  • 28. 13 se développer. Peu d’hommes en sont conscients si bien qu’il est généralement diagnostiqué plus tardivement que chez les femmes. Par conséquent, le cancer du sein masculin est généralement plus avancés quand il est diagnostiqué et donc plus difficile à traiter. 1.4.1. LES FACTEURS DE RISQUE Malgré les progrès qui ont permis de mieux connaître les mécanismes de développement des cancers, les causes du cancer du sein ne sont actuellement pas connues. Néanmoins, les études ont mis en évidence certains facteurs de risque qui favorisent le cancer du sein. Il existe différents types de facteurs de risque de survenue d’un cancer du sein. 1.4.2. L’AGE L’âge est le facteur de risque le plus important vis-à-vis du cancer du sein, la maladie est rare chez les femmes de moins de 30 ans. Le risque augmente entre 50 et 75 ans (près des deux tiers des cancers du sein). Le cancer du sein masculin apparaît surtout chez les hommes de plus de 60 ans. 1.4.3. LES FACTEURS GÉNÉTIQUES On parle dans ce cas de gènes de prédisposition ou de risque de développer un cancer du sein. Plusieurs femmes dans une même famille (mère, grand-mère, tante, sœurs) peuvent présenter un cancer du sein. On soupçonne alors une origine génétique à cette maladie. Grâce à la recherche génétique, on sait aujourd’hui détecter certaines anomalies chromosomiques qui pourraient être responsable de la survenue d’un cancer du sein (5% à 10% des cas) en rapport avec certains gènes. Si une telle anomalie est retrouvée chez une femme, il est possible de faire une recherche chez les autres femmes de la même famille, mais il faut savoir que les résultats ne sont jamais affirmatifs. 1.4.4. LES RIQUES HORMONAUX Il semble que les femmes ayant une puberté précoce, une ménopause tardive, n’ayant pas d’enfants ou ayant des enfants tardivement, n’ayant pas allaité, auraient un risque plus important d’avoir un cancer du sein.
  • 29. 14 1.4.5. L’ALIMENTATION L’effet le plus important est celui de la quantité de calories absorbées, plus elle est élevée, plus le risque augmente. L’obésité, une consommation importante d’alcool (équivalent de ½ Litre de vin par jour), la faible consommation de fruits et de légumes sont également suspectées d’augmenter le risque. Toutes ces données ne sont valables que sur un plan statistique et non pas individuel. 1.4.6. LE TABAC La fumée du tabac est une importante source de substances cancérogènes. Le tabagisme passif est aussi nocif pour le cancer du sein que le tabagisme actif. Selon une étude de l'Inserm de la France (Institut National de la Santé Et de la Recherche Médicale) une augmentation de risque associé au tabagisme. Le fait d’inhaler involontairement de la fumée dégagée par la cigarette ou cigares (tabagisme passif) semble associé à un risque augmenté d’environ 60% ; ce risque est multiplié par trois chez les femmes après la ménopause. Il a été rapporté que les fumeuses ont une ménopause précoce et une concentration urinaire réduite d’œstrogènes pendant la phase lutéale du cycle menstruel. 1.4.7. LA PILULE Pour les contraceptions orales, les études faites aux Etats-Unis conclut à une augmentation minime du risque (+14%). Le risque serait un peu plus élevé (+20%) pour les femmes ayant pris des contraceptions orales pendant plus de 5 ans avant une première grossesse. 1.4.8. LE TRAITEMENT HORMONAL DE LA MÉNOPAUSE (THM) Il existe un risque élevé d’augmentation du cancer du sein chez les femmes utilisant des THM. Le risque de cancer est augmenté avec la durée du traitement. Aucune différence n’est démontrée en fonction de la voie d’administration (orale, parentéral), le risque de cancer du sein lié au traitement œstroprogestatif pourrait varier en fonction du type de progestatif, mais ces données nécessitent d’être confirmées par d’autres études [W, 27]. 1.4.9. ANTÉCÉDENTS DE CANCER Les femmes qui ont déjà présenté un cancer du sein ont plus de risques que les autres n’ayant pas des antécédents de cancer (risque de deuxième cancer est de 10 %). Elles seront suivies attentivement après. Même la présence d’un ou de plusieurs de ces facteurs favorise le
  • 30. 15 développement d’un cancer du sein, il faut savoir que, mis à part les facteurs familiaux ou génétiques, ces autres facteurs augmentent généralement assez peu le risque : une femme qui possède une ou plusieurs de ces caractéristiques peut ne jamais développer un cancer du sein. En revanche, il est possible qu’une femme n’ayant aucune de ces caractéristiques soit atteinte d’un cancer du sein. Les facteurs de risque ne permettent donc pas de déterminer les causes exactes à l’origine d’un cancer du sein chez une femme. Figure 2: Présentation d'une tumeur du sein vue de face. 1.5.TYPES HISTOLOGIQUES DU CANCER DU SEIN Les différentes composantes de chaque tumeur du sein peuvent présenter des aspects morphologiques particuliers qui peuvent être regroupés par types histologiques. Les tumeurs sont ainsi classées en fonction de critères histologiques communs, définis par les classifications internationales, éditées par l’Organisation mondiale de la santé (OMS), et remises à jour régulièrement. La reconnaissance de ces critères et le classement de la tumeur dans le type adéquat sont la base du diagnostic anatomopathologique de toute tumeur. On ne peut déterminer qu’une tumeur est cancéreuse sans l’examen et le rapport histologique. 1.5.1. LE CANCER DU SEIN NON-INFILTRANT (IN SITU) Le cancer du sein non-infiltrant (in situ) se réfère à un cancer qui est encore dans le conduit du lait et/ou les lobules du sein. En d’autres termes, le cancer n’a pas envahi les murs des canaux galactophores ou des lobules c’est repartie en deux les CCIS et les CLIS. Le Cancer Canalaire In situ (CCIS), également appelé carcinome intracanalaire (figure 3), fait référence aux cellules cancéreuses qui se sont formées dans les conduits du canal galactophore et sont encore confinées dans cet espace. Les conduits se bouchent et
  • 31. 16 élargie à cause des cellules cancéreuses qui s’accumulent à l’intérieur. Le calcium a tendance à s’accumuler dans les canaux bloqués et est visible sur la mammographie. Figure 3: Cancer canalaire in situ (CCIS) - Macroscopie à gauche et histologie à droite. Le Cancer Lobulaire in situ (CLIS) comme le montre la figure 4 fait référence à des cellules cancéreuses qui se sont formés dans les glandes mammaires et qui sont encore confinées dans cet espace. Ce type de cancer est souvent constaté chez les femmes autour de la ménopause. CLIS est différente de CCIS, celui-ci présente un risque plus élevé, l’ensemble du tissu des deux seins peut développer un cancer. Par conséquent, le traitement de CLIS doit viser les deux seins. Figure 4: Cancer lobulaire in situ (CLIS) - Macroscopie à gauche et histologie à droite. 1.5.2. LE CANCER DU SEIN INFILTRANT Le cancer du sein infiltrant se réfère à des cellules qui se sont développé à travers les parois des canaux galactophores et des glandes dans le tissu normal graisseux du sein. Les cellules continuent de croître entraînant une masse. Ils peuvent alors former des métastases à travers la
  • 32. 17 circulation sanguine ou les vaisseaux lymphatiques vers d’autres parties du corps. Les principaux types du sein infiltrant sont les suivants : le Cancer Canalaire Infiltrant (CCI) est le plus populaire et est également appelé cancer mammaire ou adénocancer infiltrant (figure 5) ; Figure 5: Cancer canalaire infiltrant. Figure 6: Cancer canalaire infiltrant (CCI) - Macroscopie à gauche et histologie à droite. le Cancer Lobulaire Infiltrant (CLI) : moins fréquent et difficile à diagnostiquer sur la mammographie, présente un risque légèrement plus élever d’être dans les deux seins (figure 7). Figure 7: Cancer lobulaire infiltrant(CLI) - Macroscopie à gauche et histologie à droite.
  • 33. 18 Il existe d’autres types de cancer du sein que nous pouvons rencontrer (des cas plus rares) : Cancer mucineux (colloide), Cancer médullaire, Cancer papillaire, Cancer tubuleux, Cancer adénoïde kystique, Cancer sécrétant juvénile, Cancer apocrine, Cancer métaplasique de type épidermoïde, Cancer métaplasique de type à cellules fusiformes, Cancer métaplasique de type chodroide et osseux, Cancer métaplasique de type mixte, Maladie de Paget du mamelon. 1.6. CLASSIFICATION TNM La classification TNM est une norme mondialement reconnue pour classer l'étendue de la propagation du cancer proposé par le chirurgien français Pierre Denoix de l’Institut Gustave- Roussy entre 1943 et 1952. C'est un système de classification de l'étendue anatomique des tumeurs cancéreuses. Il a acquis une large acceptation internationale pour de nombreux cancers à tumeur solide, mais ne s'applique pas à la leucémie et aux tumeurs du système nerveux central. Le système TNM possède des notations décrivant le stade d'un cancer, provenant d'une tumeur solide, à l'aide de codes alphanumériques ainsi, les trois lettres symbolisant la propagation de la maladie cancéreuse sont les suivants [B, 1] : T décrit la taille de la tumeur initiale (primitive) et indique si elle a envahi les tissus voisins ; N décrit les ganglions lymphatiques voisins (Node) impliqués ; M décrit les métastases à distance (propagation du cancer d'une partie du corps à une autre). T = Tumeur primitive Tx : Détermination de la tumeur primitive impossible T0 : Pas de signe de tumeur primitive (non palpable) Tis : Carcinome in situ : carcinome intracanalaire, ou carcinome lobulaire in situ, ou maladie de Paget du mamelon sans tumeur décelable T1 : Tumeur de moins de 20 mm, avec la sous-classification suivante : T1mic : micro-invasion <1 mm T1a : moins de 5 mm T1b : de 5 à 10 mm T1c : de 10 à 20 mm T2 : Tumeur de 20 à 50 mm
  • 34. 19 T3 : Tumeur de plus de 50 mm T4 : Quelle que soit la taille, avec : T4a : Extension à la paroi thoracique T4b : Extension à la peau y compris, ulcération cutanée ou nodules de perméation T4c : T4a + T4b T4c : Cancer inflammatoire N = Adénopathies régionales Nx : Appréciation impossible de l’atteinte ganglionnaire (du fait, par exemple d’une exérèse antérieure) N0 : Absence de signe d’envahissement ganglionnaire régional N1 :Ganglions axillaires homolatéraux suspect mobiles N2 : Ganglions axillaires homolatéraux suspects fixés entre eux ou à d’autres structures, ou présence clinique d’adénopathies mammaires internes en absence d’adénopathies cliniques axillaires N2a : Ganglions axillaires homolatéraux fixés N2b : Ganglions mammaires internes homolatéraux cliniquement apparent sans adénopathies axillaires cliniques N3 : Ganglions sous-claviculaires homolatéraux (niveau III axillaire) ou mammaires internes avec présence d’adénopathies axillaire ou ganglions sus- claviculaires présents (avec ou sans la présence de ganglions axillaires ou mammaires internes) N3a : Ganglions suspects sous-claviculaires et axillaires homolatéraux N3b : Ganglions mammaires internes et ganglions axillaires homolatéraux suspects N3c : Ganglions sus-claviculaires homolatéraux suspects M = Métastases Mx : Renseignement insuffisants pour classer les métastases à distance M0 : Absence de métastases à distance M1 : Présence de métastase(s) à distance Tableau 1: Classification TNM.
  • 35. 20 1.7. EVOLUTION Comme la plupart des cancers, le cancer du sein évolue d’abord localement, avec extension aux organes de voisinage et aux ganglions lymphatiques axillaires, puis se propage par voie sanguine (métastases), surtout aux os, au cerveau, au foie, et aux poumons. Ces métastases peuvent apparaître tardivement, jusqu’à 10 ans après la découverte du cancer initial. Stade TNM Chances de Survie Stade 0 Tis N0 M0 > 95% Stade I T1 N0 M0 85% Stade IIA T0 N1 M0 T1 N1 M0 T2 N0 M0 66% Stade IIB T2 N1 M0 T3 N0 M0 66% Stade IIIA T0 N2 M0 T1 N2 M0 T2 N2 M0 T3 N1 M0 T3 N2 M0 41% Stade IIIB T4 N0 M0 T4 N1 M0 T4 N2 M0 41% Stade IIIC Tous T N3 M0 41% Stade IV Tous T Tous N M1 10% Tableau 2: Classification de cancer du sein par stade.
  • 36. 21 1.8. DIAGNOSTICS Un cancer du sein est découvert soit à l’occasion d’un examen systématique par le gynécologue, soit par la patiente elle-même au cours d’un auto-palpation mammaire qui découvre un nodule ou une masse mammaire qui très souvent fait l’objet d’examens d’imagerie médicale en l’occurrence l’échographie et la mammographie qui peuvent plaider en faveur d’un cancer du sein. Ce diagnostic est objectivé par la biopsie. Par ailleurs le cancer peut être découvert au cours de complications ou de localisation régionale ou à distance. 1.8.1. LA MAMMOGRAPHIE Le cancer du sein est à l’heure actuelle, est mis en évidence par une mammographie (examen radiologique du sein) réalisé à titre systématique dans le cadre du suivi médical individuel ou lors d’une campagne de dépistage (découvert de manière fortuite). La mammographie est un examen aux rayons X, qui emploie de faibles doses de rayonnements, mais qui néanmoins doit être évitée chez la femme enceinte. C’est une technique de radiographie qui vise à détecter les tumeurs mammaires. Elle est réalisée lorsqu’une patiente présente des symptômes pouvant faire évoquer un cancer du sein. Cet examen est réalisé avec un mamographe comme le montre la figure suivante. Figure 8: Le mamographe.
  • 37. 22 Les mammographies sont des clichés (des images en noir et blanc) centrés sur les zones suspectes. La mammographie est l’examen de référence de dépistage du cancer du sein elle est effectué sur chaque sein chacun sous des angles différents essentiellement, on peut citer le MLO è_Médio-Latéral Oblique qui offre une vue de profil du sein et le CC Cranio-Caudal une vue de face du sein. Elles permettent de mettre en évidence des cancers de petite taille, à un stade précoce, avant l’apparition de symptômes. Cet examen permet d’orienter le médecin dans son diagnostic. L’examen ne s’accompagne d’aucun effet secondaire. Figure 9: Mammographie montrant une tumeur au sein vue d'en face à gauche et vue de profil à droite. Une mammographie systématique est conseillée tous les 2 ans chez les femmes à partir de 50 ans. Elle est aussi effectuée sur un avis médical lorsqu’une femme présente un risque accru de cancer du sein (famille à risque, antécédents personnels). On utilise la classification BIRADS (Breast Imaging Reporting And Data System) de l’ACR qui est une classification internationale établie par l’American College of Radiology. Le système BI-RADS ACR permet de classer les images mammographiques en 6 catégories :  ACR 0 : mammographie de mise en attente, pour laquelle une comparaison à l’examen antérieur, ou des clichés complémentaires (localisés ou agrandis) sont nécessaires, mammographie de dépistage est lue et l’évaluation finale est « incomplète »;  ACR 1 : mammographie normale, pour laquelle une surveillance habituelle est préconisée :  ACR 2 : mammographie présentant une anomalie bénigne appelée aussi kyste (c’est-à- dire sans gravité).  ACR 3 : il existe une anomalie probablement bénigne pour laquelle une surveillance à court terme (3 ou 6 mois) est conseillée ;
  • 38. 23  ACR 4 : il existe une anomalie indéterminée ou suspecte, pour laquelle la poursuite des investigations reste nécessaire (microbiopsie échoguidée, macrobiopsie stéréotaxique, cytoponction, IRM mammaire…). Souvent, une subdivision en ACR4a, ACR4b, et ACR4c est réalisée pour mieux apprécier le risque de pathologie maligne ;  ACR 5 : il existe une anomalie évocatrice d’un cancer et pour laquelle la poursuite des investigations reste indispensable (microbiopsie sous échographie, macrobiopsie stéréotaxique, cytoponction…) ;  ACR 6 : correspond à une mammographie ayant un cancer prouvé, le plus souvent sous traitement (chimiothérapie, hormonothérapie). [B, 1] En cas d’images ACR 4 ou ACR 5 présente des cas ou la tumeur est localisé donc, des prélèvements par biopsie percutanée sont nécessaires pour effectuer un examen d’anatomopathologie. Dans la figure qui suit on voit les résultats donnés par le médecin un examen de mammographique. Figure 10: Résultat d'un examen de mammographique.
  • 39. 24 1.8.2. ECHOGRAPHIE MAMMAIRE Une échographie mammaire est un examen pratiqué par le radiologue qui utilise des ultrasons pour produire des images de l’intérieur du sein. Elle est très utile pour voir la nature liquide ou solide des nodules palpés ou découverts sur la mammographie. Cet examen précise les images obtenues par mammographie. Il ne remplace pas une mammographie qui est un examen de référence pour le sein. Pour les adolescentes, les jeunes femmes et les femmes enceintes, la mammographie est moins importante : l’échographie mammaire est donc l’examen de référence. Pour les femmes âgées, la mammographie reste l’examen de référence. Une échographie fournit des images « en temps réel », c’est-à-dire visibles immédiatement. Elle permet ainsi de comparer ce que l’on sent avec les doigts (lors de la palpitation) et ce que l’on voit sur l’écran elle permet aussi de guider un prélèvement. Cependant, l’échographie ne permet pas toujours de voir avec certitude s’il s’agit ou non d’un cancer. Pour cela, il faut réaliser d’autres examens complémentaires. Figure 11: Échographie montrant une masse kystique. Pour les seins glandulaires (type D), il est difficile de faire un diagnostic, car les glandes apparaissent blanches dans la mammographie et la tumeur aussi a un aspect grisâtre donc ça sera du blanc sur du blanc. C’est pourquoi chez les jeunes filles la mammographie même effectuée ne donne pas de bon résultat, on procède à une échographie qui ne permet pas de diagnostiquer à 100%, mais néanmoins dans certains, il peut faire apparaître une tumeur.
  • 40. 25 1.8.3. LA CYTOPONCTION ET LA MICROBIOPSIE ECHOGUIDÉE Lorsqu’une lésion est visible en mammographie et/ou à l’échographie, la cytoponction est souvent la technique de choix parce qu’elle est plus simple et plus rapide. C’est un prélèvement qui se fait à l’aiguille fine introduite dans la masse. Soit sur un kyste un éventuel liquide est aspiré et/ou bien, il est prélevé sur un nodule quelques cellules sont aspirées par une seringue. Figure 12: Cytoponction d'une tumeur. La microbiopsie échoguidée (microbiopsie mammaire sous échographie) est également un prélèvement qui se fait cette fois ci avec une aiguille de gros diamètre sous anesthésie locale. On prélève un fragment de tissu. Pour certains les microbiopsie résultent essentiellement des échecs des cytoponctions notamment pour les lésions suspectes, purement échographiques. Pour d’autres, elles pourraient se substituer aux cytoponctions. Figure 13: histologie d'une bénigne et d'une tumeur maligne.
  • 41. 26 1.9. TRAITEMENTS Il existe quatre types de traitements qui peuvent être entrepris, parfois isolément, parfois en association les traitements sont les suivants : la chirurgie : elle consiste à l’ablation de la tumeur si la tumeur est maligne (cancéreuse) l’ablation des ganglions de l’aisselle (curage ganglionnaire axillaire) est réalisée, pour les tumeurs volumineuses ou multiples la mastectomie (ablation du sein) est pratiquée, pour les tumeurs de petites taille (bénigne) la curage du ganglionaire est proposée pour minoré les conséquences ; la radiothérapie : pratiquée après une tumorectomie, elle consiste à irradier le sein et le pourtour de la zone retiré pour éviter les récidives locales. Le traitement comprend généralement 4 ou 5 séances par semaine pendant 5 à 6 semaines. En fonction du type histologiques. la chimiothérapie : elle peut être utilisée en complément de l’ablation chirurgicale du cancer primitif elle est utilisée en première intention en cas de cancer du sein avec signes inflammatoires. Les métastases sont aussi traitées par la chimiothérapie. Le traitement comporte l’association de plusieurs médicaments après un bilan pré thérapeutique. Compte tenu de la causalité des produits administrés, il nécessite la pose préalable d’une chambre implantable pour éviter une extravasation, source nécrose cutanée (forme de dégât qui mène à la mort des cellules dans le tissu vivant) ; L’hormonothérapie : est très souvent associée aux autres traitements, consiste à prendre pendant 5 ans par voie orale des antiœstrogènes lorsque le cancer est hormonodépendant, c’est-à-dire que la tumeur contient des récepteurs hormonaux participant à la multiplication rapide des cellules cancéreuses. Les buts des traitements selon les cas sont d’extirper la tumeur et ralentir son extension, éviter la récidive ou les métastases et améliorer la qualité de vie de la patiente. CONCLUSION Dans le monde, le cancer du sein est le premier type de cancer le plus fréquent chez la femme. Ici, au Sénégal c’est le deuxième cancer féminin (46% en 2014) [B, 1], il vient après celui de l’endomètre. Son diagnostic passe par plusieurs étapes en commençant par un examen clinique systématique soit par un gynécologue ou bien par la patiente elle-même. Le cas de présence d’une tumeur est confirmé par une mammographie et ou une échographie mammaire. Mais le
  • 42. 27 diagnostic de certitude reste l’examen anatomopathogie. Après l’identification de la tumeur, un bilan sénologique (mise au point globale) : entretien, examen de la patiente, une mammographie et souvent une échographie seront faites en vus d’étudier les signes de la tumeur. Le cas d’une tumeur cancéreuse ou non sera confirmé par une analyse dite histologique, un traitement sera alors pris selon le type de tumeur. Dans ce chapitre, nous avons pu comprendre le fonctionnement d’une tumeur ces caractéristiques ces différents aspects. Et comment différentier une tumeur bénigne d’une tumeur maligne les traitements qui doivent s’appliquer dans chaque cas.
  • 43. 28 CHAPITRE 3 : INTELLIGENCE ARTIFICIELLE CHAPITRE 2: INTELLIGENCE ARTIFICIELLE INTRODUCTION L'Homme a toujours cherché à comprendre et à reproduire les mécanismes naturels qui l'entourent. Un des domaines les plus passionnants reste celui de l'étude du cerveau. Qu'il soit humain ou animal, nous restons fascinés par sa capacité à analyser, à comprendre et à généraliser les problèmes que pose l'environnement. Dans le but de se rapprocher du fonctionnement du cerveau, on abordera les généralités sur l’intelligence artificielle. 2.1. PRÉSENTATION DE L’INTELLIGENCE ARTIFICIELLE L’intelligence artificielle (IA) est un domaine de l’informatique qui met l’accent sur la création de machines intelligentes qui fonctionnent et réagissent comme des humains. Il est devenu un élément essentiel de l’industrie des technologies, les principaux problèmes de l’intelligence artificielle comprennent la programmation des ordinateurs pour certaines caractéristiques telles que : la reconnaissance vocale ; l’apprentissage ; la planification ; possibilité de manipuler et déplacer des objets ; etc… L’ingénierie des connaissances est au cœur de la recherche en Intelligence Artificielle. Les machines peuvent souvent agir et réagir comme des humains seulement si elles disposent de nombreuses information relative au monde. L’IA doit avoir accès aux objets, aux catégories, aux propriétés et aux relations entre tous pour mettre en œuvre l'ingénierie des connaissances. Initiez le bon sens, le raisonnement et la résolution de problèmes dans les machines est une tâche difficile et fastidieuse. La perception de la machine concerne en sa capacité à utiliser les entrées sensorielles pour déduire les différents aspects, tandis que la vision par ordinateur est de pouvoir analyser les entrées visuelles avec quelques sous-problèmes tels que la reconnaissance faciale, des objets et des gestes.
  • 44. 29 La robotique est également un domaine majeur lié à l'IA. Les robots ont besoin d'intelligence pour gérer des tâches telles que la manipulation d'objets et la navigation, ainsi que des sous- problèmes de localisation, de planification de mouvement et de cartographie. 2.2. HISTOIRE DE L’INTELLIGENCE ARTIFICIELLE Les premiers jalons historiques de l'intelligence artificielle datent de la Protohistoire, où mythes, légendes et rumeurs dotent des êtres artificiels, réalisés par des maîtres-artisans, d'une intelligence ou d'une conscience. La recherche en intelligence artificielle a vraiment commencé après une conférence tenue sur le campus de Dartmouth College pendant l'été 1956 aux Etats Unis. À la suite de cette réunion, certains participants se sont investis dans une recherche sur l'intelligence artificielle. Certains idéalistes avaient prédit qu'une machine aussi intelligente qu'un être humain existerait en moins d'une génération et des millions de dollars ont alors été investis dans un organisme de prédiction. Avec le temps, il est apparu que les difficultés inhérentes à cette annonce avaient été grossièrement sous-estimées. Au début de 1973 jusqu'à la fin des années 1980, nous pouvons dire que ce cycle est discontinu, les périodes de gel et de dégel en alternance, on disposait d'un support pour l'intelligence artificielle. Mais il y a encore un idéal qui n’est pas encore atteint pour faire des prédictions audacieuses. Depuis 1980 jusqu’au présent. L’intelligence artificielle est devenue au fil du temps une matière scientifique de plus en plus rigoureuse et formelle. La plupart des approches étudiées aujourd’hui sont basées sur des théories mathématiques ou des études expérimentales plutôt que sur l’intuition, et sont appliquées plus souvent aux problèmes issus du monde réel. 2.3. LES DIFFÉRENTS TYPES D’INTELLIGENCE ARTIFICIELLE 2.3.1. L’INTELLIGENCE ARTIFICIELLE DISTRIBUÉE L'intelligence artificielle distribuée (Distributed Artificial Intelligence, DAI) est l'une des nombreuses approches de l'intelligence artificielle. L’ors de l'apprentissage, il effectue une méthode d'apprentissage complexe, une planification et des prises de décisions à grande échelle. Il peut utiliser un large éventail de ressources informatiques dans différents domaines (CPU,
  • 45. 30 RAM, GPU...). Cela signifie qu'il peut facilement traiter et analyser de grandes quantités de données et résoudre rapidement les problèmes. Il existe de nombreux agents ou nœuds d'apprentissage autonomes dans un tel système. Ces nœuds sont très distribués et indépendants les uns des autres. De ce fait, les systèmes d’apprentissage automatique (ML) utilisant l’intelligence artificielle distribuée sont tout à fait adaptables et fiables. Cela signifie que les systèmes DAI ne doivent pas être complètement redéployés après toute modification apportée aux fichiers de données en entrée du problème. L'intégration des solutions se fait par un système de communication efficace entre les agents ou les nœuds. Cela garantit que le traitement est élastique. Contrairement au système d'IA centralisé, les données dans les systèmes DAI ne doivent pas être transmises à un seul emplacement. Les données peuvent être mises à jour au fil du temps. Les nœuds peuvent interagir avec les uns avec les autres en ce qui concerne la solution de manière dynamique et disposer des compétences nécessaires pour parvenir à la solution. Ainsi, le DAI est considéré comme l'une des meilleures approches de l'apprentissage automatique et de l'intelligence artificielle. 2.3.2. LA SUPER INTELLIGENCE La super intelligence artificielle (Artificial SuperIntelligence, ASI) fait référence à l'époque où la capacité des ordinateurs surpassera celle des humains. "L'intelligence artificielle", très utilisée depuis les années 1970, fait référence à la capacité des ordinateurs à imiter la pensée humaine. La super intelligence artificielle va plus loin et pose un monde dans lequel les capacités cognitives d'un ordinateur sont supérieures à celles d'un humain. Les sociétés n’ont pas encore atteint le stade de la super intelligence artificielle. En effet, les ingénieurs et les scientifiques tentent toujours d’atteindre un point qui serait considéré comme une intelligence artificielle complète, où l’on pourrait dire qu’un ordinateur possède la même capacité cognitive qu’un être humain. Cependant, il y a beaucoup de théorie qui prévoit que la super intelligence artificielle interviendra plus tôt que prévue, mais ce ne sont que des théories pour l'instant. En utilisant des exemples comme la loi de Moore, qui prédit une densité sans cesse croissante de transistors, les experts parlent de singularité et de croissance exponentielle de la technologie dans laquelle l'intelligence artificielle complète pourrait se manifester dans quelques années.
  • 46. 31 2.3.3. L’INTELLIGENCE ARTIFICIELLE (IA) FAIBLE L'intelligence artificielle faible (IA faible) connu aussi sous le nom d'intelligence artificielle étroite est une approche de la recherche et du développement de l'intelligence artificielle, sachant que l'IA est et restera toujours une simulation de l'intelligence humaine et que les ordinateurs ne peuvent pas penser. L'IA faible agit simplement sur les règles qui lui sont imposées et est liée à celle-ci et elle ne peut pas aller au-delà de ces règles. Elle est conçue pour se concentrer et pour sembler très intelligente sur une tâche bien spécifique. Ce fonctionnement est en totale contradiction avec celui de l'Intelligence Artificielle forte, dans laquelle une Intelligence Artificielle est capable de toutes les fonctions cognitives que peut avoir un humain, et n'est pas vraisemblablement différente d'un véritable esprit humain. L'IA faible n'est jamais prise comme une intelligence générale, mais plutôt comme une construction conçue pour être intelligente dans une tâche bien spécifique à laquelle elle est assignée. Comme Intelligence faible on peut citer les robots utilisés dans le processus de fabrication de produits, les chatbots comme Siri d'Apple, Cortana de Microsoft Windows (intégré dans Windows 10) qui utilise internet comme une base de données. Ils semblent très intelligents, car ils sont capables de tenir une conversation avec des personnes réelles, même en faisant des remarques qui ne sont pas sérieux et quelques blagues, mais ils fonctionnent de manières très spécifiques et bien prédéfinies. Cependant, la spécificité de leur fonction peut être mise à rude épreuve donnant ainsi des résultats inexacts lorsqu’ils sont engagés dans des conversations auxquelles ils ne sont pas programmés pour répondre. 2.3.4. L’INTELLIGENCE ARTIFICIELLE (IA) FORTE L'Intelligence Artificielle forte (IA forte) est une construction d'Intelligence Artificielle qui possède des capacités mentales et des fonctions qui imitent le cerveau humain. Dans la théorie de l'IA forte, il n'y a pas de différence essentielle entre le logiciel, qui est l'Intelligence Artificielle, imitant ainsi exactement les actions du cerveau humain et les actions d'un être humain, y compris son pouvoir de compréhension et même sa conscience. L'intelligence artificielle forte est également appelée Intelligence Artificielle complète. Elle est davantage une philosophie qu'une approche réelle de la création d'IA. C'est une perception différente de l'IA dans laquelle elle assimile l'IA aux humains. Il stipule qu'un ordinateur peut être programmé pour fonctionner comme un esprit humain, être intelligent dans tous les sens du terme, avoir une perception et avoir d‘autres état cognitifs normalement attribués humains.
  • 47. 32 Cependant, comme les humains ne peuvent même pas définir correctement ce qu'est l'intelligence, il est très difficile de donner un critère clair quant à ce qui constituerait un succès dans le développement d'une intelligence artificielle forte. La faible IA citée ci-dessus, par contre, est très réalisable en raison de la manière dont elle définit l’intelligence. Plutôt que d'essayer d'imiter pleinement un esprit humain, l'insuffisance de l'IA peut seulement se concentrer sur le développement de l'intelligence liée à une tâche ou à un domaine d'étude particulier. C’est un ensemble d’activités qui peuvent être décomposées en processus plus petits et peuvent donc être réalisées à l’échelle définie. 2.3.5. L’AMPLIFICATION DE L’INTELLIGENCE L'amplification de l'intelligence est l'idée que les technologies peuvent être utiles à l'intelligence humaine, plutôt que d'être composées de technologies qui créent une intelligence artificielle indépendante. Les systèmes d'amplification de l'intelligence améliorent l'intelligence d'un être humain, améliorant d'une certaine manière le fonctionnement ou la capacité d'un décideur humain. L'amplification de l'intelligence est également appelée intelligence assistée, intelligence augmentée, augmentation cognitive ou intelligence augmentée par machine. L'idée de l'amplification de l'intelligence ou de l'intelligence augmentée vient en partie des craintes et des préoccupations concernant l'intelligence artificielle dans son ensemble. L'intelligence artificielle évoluant et devenant de plus en plus robuste, les technologies malveillantes ayant un impact négatif sur la vie humaine suscitent de plus en plus d'inquiétudes. Il semble plus sûr, dans ce cas, de développer des technologies d’amplification de l’intelligence, des outils qui tirent leur efficacité de la conscience humaine, au lieu de former leur propre sensibilité artificielle. CONCLUSION Dans ce chapitre, nous avons fait un tour d’horizon dans le monde l’intelligence artificielle un monde bien fascinant et on peut dire que l’étendue de l’intelligence des robots et des machines est limitée, car ils ne savent pas quoi faire dans les situations pour lesquelles ils ne sont pas programmés (entraîner) et en dehors de cela, ils n'ont aucun moyen de déterminer quoi faire. L'IA équipée pour l'apprentissage automatique qu'on verra dans ce qui suit ne peut qu'apprendre et appliquer que ce qu'elle a appris et à la portée pour laquelle elle est programmée. L’Intelligence Artificielle est définie comme l'une des principales menaces pour l'avenir de l'humanité, mythe ou réalité l'avenir nous le dira.
  • 48. 33 CHAPITRE 4: MACHINE LEARNING CHAPITRE 3: MACHINE LEARNING INTRODUCTION D’une façon générale, l’apprentissage humain est un processus adaptatif grâce à laquelle l’individu fournit des réponses adéquates à certaines situations. En Psychologie ou en Science Cognitives, le terme « Apprentissage » désigne le processus d’augmentation de l’efficacité de l’activité mentale ou comportementale sous l’effet de l’expérience. Cependant on a à faire un autre type d’apprentissage, vous l’utilisez certainement des centaines voire des milliers de fois par jour sans même le savoir, chaque jour des millions d’utilisateurs effectue des recherches sur Google ou Bing, comment font les applications de photos comme celle de Facebook ou Apple qui reconnaissent des personnes sur les photos. À chaque fois que quelqu’un lit un e-mail et que le filtre anti-spam évite à la personne de parcourir des tonnes de spam encore une fois les questions qu’on doit se poser comment l’ordinateur a appris à distinguer entre les e-mails spam des non-spam et comment tout cela marche si bien, c’est parce que tout cela est possible grâce à une technologie qu’on appelle le Machine Learning en français apprentissage automatique. 4.1. PRÉSENTATION DU MACHINE LEARNING Le Machine Learning (en français apprentissage automatique) est un sous-domaine de l’intelligence artificielle, qui concerne la conception, l’analyse, le développement et l’implémentation de méthode permettant à une machine d’évoluer, de remplir des tâches difficiles ou problématique par le moyen des algorithmes et de modéliser les tâches dans le but de prendre des décisions stratégiques. L’apprentissage automatique (Mitchell, 1997) est un Domaine de l’intelligence Artificielle (IA) dont l’objectif est d’étudier les moyens permettant à une machine, en accomplissant des tâches, tout en s'améliorant au fur et à mesure. Apprendre, dans ce cas signifie être capable d’adapter son comportement dans une situation inconnue (n’ayant pas été prévues par les concepteurs de la machine dans l’accomplissement d’une tâche) et pouvoir extraire des caractéristiques à partir de bases de données
  • 49. 34 d’apprentissage. L’apprentissage se fait donc par des outils qui permettent d’acquérir, élargir et améliorer les connaissances disponibles au système. L'apprentissage automatique est utilisé pour doter des ordinateurs ou des machines de systèmes de perception de leur environnement : vision, reconnaissance d'objets (visages, schémas, langages naturels, écriture, formes syntaxiques…), moteurs de recherche, aide aux diagnostics médical, bio-informatique, chimio-informatique, interfaces cerveau-machine, détection de fraudes à la carte de crédit, analyse financière, dont analyse du marché boursier, classification des séquences d’ADN, jeu, génie logiciel, adaptation de sites Web, locomotion de robots, analyse prédictive en matière juridique et judiciaire… 4.2. LA COLLECTE DE DONNÉES Cette étape est cruciale, il consiste à récupérer, sélectionner, nettoyer et transformer les données pertinentes de telle sorte qu’il soit compréhensible par la machine, pour cela, il va falloir prétraiter les données, c’est-à-dire visualiser les différentes variables, essayer de comprendre les valeurs extrêmes ou anormales, les liens, etc... Une fois qu’on a une idée de ce à quoi on a affaire, on peut définir un problématique plus précise. Les bases de données constituent la source principale de récupération lors d’une étude de cas en Machine Learning. Il existe des technologies pour récupérer ces données (sql, xml, json…) ces bases de données peuvent comprendre les différents types d’information : Les logs d’un serveur web Les transactions bancaires Le comportement des utilisateurs d’un site Le catalogue d’un produit d’un site de e-commerce… Les données peuvent être du texte, rédiger en langage naturel (humain) ainsi, on peut inclure tous les types de texte (articles, livres, messages, etc.) le traitement du texte (appelé NLP Natural Language Processing) constitue un domaine de recherche à lui seul. Elles peuvent être aussi du code HTML ou encore des séquences d’ADN, mais aussi des audios, des images (et vidéo) le traitement des images et de vidéos constitue un domaine de recherche à part (Computer Vision en anglais).
  • 50. 35 4.3. LA MODÉLISATION La resolution d’un problème de Machine Learning constitue cette étape et permet à un ordinateur de modéliser les données qui lui sont fournies. Modéliser signifie dans ce cas représenter le comportement d’un phénomène afin de pouvoir directement aider à la résolution d’un problème concret. En Machine Learning, l’idée est que l’algorithme construit une représentation interne tout seul afin de pouvoir effectuer une tâche qui lui est demandé (prédiction, identification, etc.). Pour cela, il va falloir lui donner un ensemble de données d’exemples (ou d’entraînement) afin qu’il puisse s’entraîner et s’améliorer, d’où le mot apprentissage. Cet ensemble de données s’appelle le training set (ou training dataset). On peut appeler une entrée dans l’ensemble de données une instance ou une observation. La première phase sera le choix et l’entraînement de l’algorithme d’apprentissage du modèle, mais le traitement de la tâche spécifiques sera appris à partir du training set. Ensuite effectué par l’algorithme lui-même dans une seconde phase. Le schéma ci-dessus montre les différentes phases de l’utilisation d’un algorithme de Machine Learning. Figure 14: Étapes de l’apprentissage en ML.
  • 51. 36 Comme nous le montre le schéma ci-dessus un problème de Machine Learning est composé des différents éléments :  Les données (les données d’entraînement, mais aussi les nouvelles données) ;  La tâche spécifique à accomplir (prédire, recommander, décider quelque chose, etc.) ;  L’algorithme d’apprentissage en lui-même ;  L’analyse d’erreur (ou mesure des performances du modèle). 4.4. LA TÂCHE À ACCOMPLIR La tâche spécifique à accomplir correspond au problème qu’on cherche à résoudre grâce à la modélisation du phénomène. On distingue entre autres les recommandations de produits, aide au diagnostic, prédiction météorologique, l’identification d’une personne dans une vidéo, l’identification de transactions frauduleuse, la prédiction du prix optimal d’un produit pour maximiser les ventes. Bien sûr, chacun se traduira différemment d’un autre et nécessite le choix d’un algorithme différent. 4.5. LES DIFFÉRENTS TYPES D’APPRENTISSAGE La Machine Learning possède différents types d’apprentissage, chaque mode d’apprentissage regroupe une famille d'algorithme. Dans ce qui suit, on va énumérer et expliquer le concept de quelques types d’apprentissage en Machine Learning. 4.5.1. SUPERVISED LEARNING Supervised Learning (en français l’apprentissage Supervisé) consiste à donner à la machine un ensemble de données en entrée (données d’entraînement) étiquetés et nous savons déjà à quoi devraient ressembler les résultats correct en ayant une idée qu’il existe une relation entre l’entrée et la sortie. Sur la base des sorties étiquetées, les entrées sont comparées. En fonction de la variation entre les deux signaux, une valeur d'erreur est calculée et un algorithme est utilisé pour apprendre la fonction de mappage de l'entrée à la sortie. Le but est d’approximer les fonctions de telle sorte que lorsqu’on a une nouvelle donnée d’entrée, on peut prédire les variables de sortie. L'apprentissage s'arrête lorsque l'algorithme atteint un niveau de performance acceptable. La tâche de l’apprentissage supervisé est : Un ensemble d’apprentissage composé de 𝑁 exemples de pair entrée-sortie :
  • 52. 37 (𝒙(𝟏) , 𝒚(𝟏) ), (𝒙(𝟐) , 𝒚(𝟐) ), … , (𝒙(𝑴) , 𝒚(𝑴) ) Chaque 𝑦(𝑖) a été généré par une fonction 𝑭(𝒙) = 𝒚 inconnue, le but est découvrir la fonction 𝑓 qui se rapproche de 𝐹. 4.5.1.1. RÉGRESSION ET CLASSIFICATION Le Supervised Learning est composé de deux catégories qui sont les problèmes de « Régression » et de « classification », dans un problème de régression : il s’agit de prédire les résultats dans une sortie continue (faire correspondre les variables d’entrée à fonction continue), dans un problème de classification, il s’agit de prédire les résultats dans une sortie discrète (faire correspondre les variables d’entrée en catégories discrète). Cette distinction aidera dans le choix d’un algorithme de Machine Learning et le type de sortie que l’on attend du programme : est- ce une valeur continue (un nombre) donc c’est le cas d’une régression ou bien une valeur discrète (une catégorie) donc c'est le cas d’une classification ? Figure 15: Illustration de la différence entre régression linéaire et classification linéaire. Un modèle de régression est un modèle de ML dont les sorties y sont des nombres (exemple: la température de demain). Un modèle de classification est un modèle de ML dont les sorties y appartiennent à un ensemble fini de valeurs (exemple : bon, mauvais). Il existe un autre type de prédiction possible qui est de sortir plusieurs labels de manière ordonnée (Machine-Learning Ranking en anglais). L’algorithme PageRank de Google retourne des résultats de recherche dans l’ordre, du plus pertinent au moins pertinent. En représentation un peu plus mathématiques en Surpervised Learning, on reçoit en entrer des données d’exemple annotées : (x 1,y1), (x2,y2), (x3,y3),… et on prédit la sortie sur une nouvelle observation : x∗ → y∗
  • 53. 38 4.5.2. UNSUPERVISED LEARNING Unsupervised Learning (en français l’apprentissage non-supervisé) cette fois-ci, on peut aborder les problèmes avec peu ou quasiment pas d’idée de ce à quoi nos résultats devraient ressembler. La machine ou ordinateur ne dispose que d’exemples non étiquetés on parle d’apprentissage non supervisé ou clustering. L’algorithme doit découvrir par lui-même les structures des données cibles selon leurs attributs disponibles, pour les classer en groupes. On peut dériver une structure à partir de données pour lesquelles on ne connaît pas l’effet des variables en regroupant les données en fonction des relations entre les variables dans les modèles de données. Le clustering désigne les méthodes de regroupement automatique de données qui se ressemblent le plus en un ensemble de « nuages » appelés clusters. Un ensemble d’algorithmes non-supervisés peuvent réaliser cette tâche, ils mesurent de manière automatique la similarité entre les différentes données. En représentation un peu plus mathématiques en l’apprentissage non-supervisé, on reçoit uniquement des observations brutes de variables aléatoires : 𝒙𝟏, 𝒙𝟐, 𝒙𝟑, 𝒙𝟒, 𝒙𝟓, … Et on découvre la relation avec des variables latentes structurelles : 𝑥𝑖 → 𝑦𝑖 4.5.3. SEMI-SUPERVISED LEARNING Semi-supervised Learning (l’apprentissage semi-supervisé) est effectué de manière probabiliste ou non. L’apprentissage semi-supervisé est à mi-chemin entre ces deux méthodes précédentes. On fournit au modèle quelques exemples étiquetés, mais la grande partie des données ne le sont pas. On trouve des cas d’application partout où l’obtention des données est facile, mais leur étiquetage demande des efforts, du temps ou de l’argent comme par exemple :  En reconnaissance de parole, il ne coûte rien d’enregistrer une grande quantité de parole, mais leur étiquetage nécessite des personnes qui les écoutent.  Des milliards de pages web sont disponibles, mais pour les classer il faut les lire. Il est mis en œuvre essentiellement quand des données(étiquettes) manquent, le modèle doit utiliser des exemples non étiquetés pouvant néanmoins renseigner.
  • 54. 39 4.5.4. REINFORCEMENT LEARNING Reinforcement Learning (l’apprentissage par renforcement) est aussi un type d’apprentissage, comme nous le savons, « l'erreur est humaine » et les humains apprennent de nouvelles tâches principalement par essais et erreurs. L'apprentissage par renforcement est un domaine d’apprentissage automatique qui s'inspire de cette facette humaine et qui consiste à calculer les résultats de certaines actions pour maximiser le rendement. Cela implique d'avoir un agent chargé d'observer son état actuel dans un environnement numérique et de prendre des mesures qui maximisent le cumul d'une récompense à long terme qui a été établie. L'agent doit peser les actions et opter pour les stratégies optimales qui aident ou favorisent le progrès pour atteindre l'objectif souhaité. 4.5.5. TRANSFER LEARNING Transfer Learning (l’apprentissage par transfert) peut être vu comme la capacité à une machine de reconnaître et appliquer des connaissances et des compétences, apprises à partir de tâches antérieures sur une nouvelle tâche ou domaine partageant des similitudes. Son objectif est de savoir comment alors identifier les similitudes entre la ou les tâche(s) cible(s) et la ou les tâche(s) source(s), puis comment transférer la connaissance de là ou des tâche(s) source(s) vers la ou les tâche(s) cible(s). 4.6. LES ALGORITHMES D’APPRENTISSAGE L’algorithme d’apprentissage constitue la méthode avec laquelle le modèle statistique va se paramétrer à partir des exemples de donnée. Il existe plusieurs algorithmes différents, le choix du type d’algorithme dépendra de la tâche que l’on souhaite accomplir. Voici quelques exemples d’algorithmes de Machine Learning : Régression Linéaire; Logistique Régression ; Support Vector Machine(SVM) ; K-means ; K-nn ; Neural Network…
  • 55. 40 4.6.1. LA RÉGRESSION LINÉAIRE Une régression linéaire est un algorithme supervisé, avec en entrée 𝑥 et en sortie 𝑌 la sortie (la prédiction) est de la forme 𝑌 = 𝑤0 + 𝑤1𝑋 ou [𝑤0 et 𝑤1 ] sont des valeurs réelles à calculer. Figure 16: Exemple de représentation de Régression Linéaire. Prenons l’exemple suivant s’acheter une maison à Sally est l’objectif de certains Sénégalais, mais aussi des touristes qui viennent visiter Sénégal pour ainsi s’installer au Sénégal après leur retraite. Pour établir une relation entre le prix en million de FCFA d’une maison à Sally et la taille de la maison, on peut ainsi prédire une relation entre ces deux. La première étape consistera à examiner les données sur un graphiquement : Figure 17: Prix d’une maison par sa taille. Bien évidemment, le graphique montre que le prix d’une maison augmente en même temps que la taille. On peut tracer une droite comme celle-ci pour réaliser une approximation de cette relation donc la relation entre le prix et la taille est linéaire.
  • 56. 41 Figure 18: Une relation linéaire. Cette droite ne passe pas exactement par chaque point, mais elle montre clairement la relation entre les prix et les tailles. Avec un peu d’algèbre, nous pouvons décrire cette relation ainsi : 𝑦 = 𝑎𝑥 + 𝑏  𝑦 est le prix d’une maison en million de franc cfa, les valeurs qu’on essaie de prédire ;  𝑎 est la pente de la droite ;  𝑥 est la taille en mètre carré, c’est la valeur de notre caractéristique d’entrée ;  𝑏 est l’ordonnée à l’origine. Pour le Machine Learning, la Linear Regression (la régression linéaire) s’obtient pour un modèle, en changeant légèrement l’équation précédente, l’équation de prédiction devient comme suit: 𝑦′ = 𝑏 + 𝑏1𝑥1 On écrit aussi 𝑦′ = 𝑤0 + 𝑤1𝑥1 Pour établir une notation nous utiliserons ce qui suit: 𝑦′ : est l’étiquette prédite / variable de sortie / variable de la cible (ouput/feature) 𝑏 : est le biais(l’ordonnée à l’origine) noté aussi 𝑤0 𝑤1 : est le paramètre(pondération) de la caractéristique 1. La pondération est identique à celui de pente représenté par la lettre « a » ci-dessus.