MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf

Université Cheikh Anta DIOP de Dakar
Faculté des Sciences et Techniques
Département Mathématiques et Informatique
Laboratoire d’Algèbre de Cryptologie de
Géométrie Algébrique et Application
LACGAA
Thème :
Étude et Implémentation d’un Outil d’aide à la
Décision Médicale sur Basé l’intelligence
artificielle : cas du Cancer du Sein chez la
Femme
Présenté et soutenu par:
Mlle. Aichétou Djimé GALLÉDOU
Sous la direction du:
Dr. Ousmane NDIAYE
Jury :
Président : Pr. Cheikh Thiécoumba GUEYE UCAD
Membres : Pr. Agrégé. Boucar NDONG UCAD
Dr. Ousmane NDIAYE UCAD
Dr. Jean Klamti BELO UCAD
Master Transmission de Données et Sécurité de l’Information
Année Académique 2017 – 2018

i
I propose to consider the question, “Can machines think”?
A computer would deserve to be called intelligent if it could deceive a
human into believing that it was human.
- Alan Turing, Mathématicien et Cryptanalyste -

ii
DÉDICACES
Je dédie ce modeste travail :
À ma mère, ma meilleure amie, ma confidente, ma conseillère, la prunelle de
mes yeux Hawa Bocar Diagana pour l’Amour et le soutien inconditionnel
qu’elle me donne chaque jour certes, je ne serais pas là où je suis aujourd’hui
sans ses conseils, toutes les lettres du monde ne sauraient trouver les mots pour
que je puisse exprimer tout ce que j’ai sur le cœur pour elle. Aucun hommage
ne pourra être à la hauteur de l’Amour qu’elle me porte, qui ne cesse de me
combler qu'ALLAH la procure une bonne santé et une longue vie et je prie
qu’il nous réunît dans FIRDAWS son PARADIS ETERNEL ;
À mon père Djimé Dahaba Gallédou qui guide mes pas chaque jour, qui est
un exemple pour moi, qui a fait de moi la personne que je suis aujourd’hui
par son Amour, ces conseils, son soutien, je ne saurais exprimer l’Amour, la
gratitude, le respect et la reconnaissance que j’ai pour lui. Aucun hommage
ne pourra être à la hauteur de l’Amour qu’il me porte qui ne cesse de me
combler qu'ALLAH lui procure une bonne santé, une longue vie et je prie
qu’il nous réunît dans FIRDAWS son PARADIS ETERNEL.
À mon oncle Tahara Dahaba Gallédou que j'aime beaucoup qui a guidé
mes premiers pas à l'école, mon premier jour que je n’oublierais jamais en
fermant seulement les yeux, je peux remémorer ce souvenir mémorable, toi
qui ne cesse de me donner des Douas à chaque fois qu'on se
parle qu'ALLAH t'accorde AL-FIRDAWS son PARADIS ETERNEL.
À mes frères, mes sœurs, mes amis, à toutes les membres de ma famille et à mes
camarades avec qui j'ai partagé ces années d'études à mes voisines djiboutiennes
et comoriennes, je prie pour chacun de vous, qu'ALLAH vous accorde tout ce
que vous voulez dans la vie qui est bon pour vous et l'au-delà.

iii
REMERCIEMENTS
« Au nom d'Allah, le Tout Miséricordieux le très Miséricordieux et paix et salut sur Mouhamad
Rassoulilah son serviteur »
Alhamdoulil’Allah, Ô ALLAH à toi la louange jusqu’à ce que tu agrées, à toi la Louange
lorsque tu as agréé et à toi la louange après l’agrément, Louange à toi dans toutes les situations,
à toi la Louange tout comme tu dis et mieux que ce que nous disons, merci à toi le tout-puissant
et le tout miséricordieux de m'avoir donnée la patience et le courage durant ces années d’étude,
de m’avoir donné la santé et la volonté d’entamer et de terminer ce mémoire.
Je tiens à remercier mon encadreur le Docteur Ousmane Ndiaye pour l'orientation, la
confiance et la patience qui ont constitué un apport considérable sans lequel ce travail n’aurait
pas pu être mené.
Je tiens à remercier Mr. Cheikh Djibril Sow pour sa grande générosité et pour ses bonnes
explications qui m’ont éclairé le chemin dans l’accomplissement de ce travail.
Je tiens à remercier les membres du jury pour l’intérêt qu’ils ont porté à ce mémoire acceptant
d’examiner et de l’enrichir par leurs propositions particulièrement au Professeur Boucar Ndong de
la Faculté de Médecine de Pharmacie et d’odontologie.
Mes profonds remerciements s’adressent à tous les membres du corps professoral de la TDSI
de m’avoir accompagné tout au long de ces 5 années de formation certes ils m’ont beaucoup
appris, avec générosité et patience.
Je tiens à remercier le Docteur Ibrahima Diakhaté de m'avoir accueilli au Centre d'Imagerie
Diagnostique et Interventionnelle, certes bon nombre de personnes m'ont fermé leur porte au
nez et vous avez ouvert le vôtre je vous en serai toujours reconnaissante.
Un grand merci au Dr. Dialla Traoré, au Dr. Mouhamed Diawara et à Mr. Ibrahima Soccé
Radiologue technicien à CIDIS.

iv
A LA MEMOIRE DE
Tous ceux qui ont contribué à mon éducation, à ma formation et à ceux qui étaient là pour moi,
mes rayons de soleil et qui ne sont plus là malheureusement.
Mes grands Parent :
- Mariam Moussa Séméga
- Maro Moussa Séméga
- Mohamed Moussa Séméga
- Bakary Moussa Séméga
- Djénéba Lakhami Séméga
- Bocar Diagana
- Dahaba Djimé Gallédou
- Assa Diagana
- Assa Tandia
- Gniouma Kandé Magassouba
- Aminéta Doungou
Mon Oncle Hadya Kaou Diagana
Ma petite sœur et Mon petit frère :
- Maro Djimé Gallédou
- Bocar Djimé Gallédou
Mes professeurs :
- Nima Kanté
- Ba Khassoum
Certes, la mort nous a séparé vous êtes plus là ainsi est le destin de chaque être humain, mais je
ne vous oublierai jamais vous resterez à jamais dans mon cœur jusqu’à mon dernier souffle.
Reposez en paix qu’ALLAH vous accorde AL-FIRDAWS SON PARADIS ÉTERNEL.

v
AVANT-PROPOS
Laboratoire d’Algèbre, de Cryptographie, de Géométrie Algébrique et Applications
(LACGAA): objectifs et Domaine de recherche.
Depuis 2004, le laboratoire LACGAA est le seul de la sous-région spécialisé sur la formation
et la recherche en cryptographie et dans les domaines de la sécurité de l’information. Le
laboratoire LACGAA a déjà formé en master, plus de 100 titulaires du master 2 (niveau
ingénieur) qui travaillent dans les entreprises en France, aux USA, au Sénégal et dans la sous-
région ; et en licence, plus de 40 techniciens. En Thèse, le labo est entrain de former plus de 10
thèses en codage et cryptologie à Dakar et en France dont 5 ont terminés.
Sous la direction du Professeur Mamadou Sangharé, le laboratoire LACGAA a pour
objectifs:
1. La formation à la recherche fondamentale et appliquée dans les domaines de La
Cryptographie, de la Théorie des codes, de l’Algèbre, de la Géométrie et de leurs
applications (en logique, en informatique, en sécurité de l’information, en biologie, en
robotique etc.) par :
 des enseignements pour les jeunes doctorants durant leur première année
d’inscription en thèse ;
 l’encadrement des jeunes doctorants durant toute la durée de leur thèse ;
 la mise en place d’un cadre approprié pour l’épanouissement des jeunes
doctorants.
2. L’organisation de la recherche par la mise en place d’un cadre approprié pour
l’épanouissement des chercheurs et le développement de la recherche ;
3. la création de licences et de masters professionnels et recherches en algèbre, géométrie
et leur application notamment en sécurité informatique les principaux domaines de
recherche sont l’algèbre et ses différentes applications : Algèbre commutative, algèbre
non commutative, algèbre associative, algèbre non associative; géométrie algébrique
commutative et non commutative, Homologie et Cohomologie, Théorie algébrique et
analytique des nombres, Cryptographie, Théorie des Codes Correcteurs d’Erreurs,
Théorie du signal Informatique théorique, Sécurité informatique etc.

vi
SOMMAIRE
INTRODUCTION GÉNÉRALE---------------------------------------------------------------------- 1
PARTIE I :CADRE THÉORIQUE ET MÉTHODOLOGIQUE ------------------------------ 2
CHAPITRE 1: CADRE THÉORIQUE----------------------------------------------------------- 3
INTRODUCTION-------------------------------------------------------------------------------- 3
1.1. PROBLÉMATIQUE-------------------------------------------------------------------- 3
1.2. LES OBJECTIFS DU PROJET ------------------------------------------------------- 3
1.3. LES HYPOTHÈSES DE RECHERCHE -------------------------------------------- 4
1.4. LA PERTINENCE DU SUJET ------------------------------------------------------- 4
CONCLUSION ----------------------------------------------------------------------------------- 4
CHAPITRE 2: CADRE MÉTHODOLOGIQUE ---------------------------------------------- 5
INTRODUCTION-------------------------------------------------------------------------------- 5
2.1. TECHNIQUES D’INVESTIGATION ----------------------------------------------- 5
2.2. PRÉSENTATION DES DONNÉES MAMMOGRAPHIQUES ----------------- 5
2.3. DIFFICULTÉS RENCONTRÉES---------------------------------------------------- 6
CONCLUSION ----------------------------------------------------------------------------------- 7
PARTIE II : CADRE ANALYTIQUE ET IMPLÉMENTATION ---------------------------- 8
CHAPITRE 1: LE CANCER DU SEIN----------------------------------------------------------- 9
INTRODUCTION-------------------------------------------------------------------------------- 9
1.1. ANATOMIE DU SEIN----------------------------------------------------------------- 9
1.2. SYMPTÔMES ET SIGNES ----------------------------------------------------------10
1.3. TUMEURS DU SEIN ----------------------------------Erreur ! Signet non défini.
1.4. CANCER DU SEIN--------------------------------------------------------------------12
1.5. TYPES HISTOLOGIQUES DU CANCER DU SEIN----------------------------15
1.6. CLASSIFICATION TNM ------------------------------------------------------------18
1.7. EVOLUTION ---------------------------------------------------------------------------20
1.8. DIAGNOSTICS ------------------------------------------------------------------------21
1.9. TRAITEMENTS -----------------------------------------------------------------------26
CONCLUSION ----------------------------------------------------------------------------------26
CHAPITRE 2: INTELLIGENCE ARTIFICIELLE------------------------------------------28
INTRODUCTION-------------------------------------------------------------------------------28
2.1. PRÉSENTATION DE L’INTELLIGENCE ARTIFICIELLE-------------------28
2.2. HISTOIRE DE L’INTELLIGENCE ARTIFICIELLE----------------------------29
2.3. LES DIFFÉRENTS TYPES D’INTELLIGENCE ARTIFICIELLE------------29
CONCLUSION ----------------------------------------------------------------------------------32
CHAPITRE 3: MACHINE LEARNING --------------------------------------------------------33
INTRODUCTION-------------------------------------------------------------------------------33
4.1. PRÉSENTATION DU MACHINE LEARNING----------------------------------33
4.2. LA COLLECTE DE DONNÉES ----------------------------------------------------34
4.3. LA MODÉLISATION-----------------------------------------------------------------35
4.4. LA TÂCHE À ACCOMPLIR --------------------------------------------------------36
4.5. LES DIFFÉRENTS TYPES D’APPRENTISSAGE ------------------------------36

vii
4.6. LES ALGORITHMES D’APPRENTISSAGE-------------------------------------39
4.7. LE SURAPPRENTISSAGE ----------------------------------------------------------59
4.8. LA RÉGULARISATION -------------------------------------------------------------61
4.9. LE SOUS-APPRENTISSAGE -------------------------------------------------------62
CONCLUSION ----------------------------------------------------------------------------------63
CHAPITRE 4: DEEP LEARNING---------------------------------------------------------------64
INTRODUCTION-------------------------------------------------------------------------------64
4.1. PRÉSENTATION DU DEEP LEARNING ----------------------------------------64
4.2. LES DIFFÉRENTS TYPES D’ARCHITECTURE DEEP LEARNING-------67
CONCLUSION ----------------------------------------------------------------------------------69
CHAPITRE 5: LES RÉSEAUX DE NEURONES CONVOLUTIONELS ---------------70
INTRODUCTION-------------------------------------------------------------------------------70
5.1. PRÉSENTATION DES RÉSEAUX DE NEURONES CONVOLUTIONELS --
-----------------------------------------------------------------------------------------------------70
5.2. TRANSFER LEARNING EN CNN-------------------------------------------------80
CONCLUSION ----------------------------------------------------------------------------------84
CHAPITRE 6: IMPLÉMENTATION ----------------------------------------------------------86
INTRODUCTION-------------------------------------------------------------------------------86
6.1. PRÉSENTATION DES OUTILS----------------------------------------------------86
6.2. IMPLÉMENTATION -----------------------------------------------------------------92
6.3. PRÉ -TRAITEMENT ET DATA AUGMENTATION---------------------------94
6.2. ARCHITECTURE ET APPRENTISSAGE DU MODÉLE----------------------95
6.3. RÉSULTATS OBTENUS ET INTERPRETATIONS----------------------------96
6.4. PRÉSENTATION DE L’INTERFACE------------------------------------------- 105
CONCLUSION -------------------------------------------------------------------------------- 107
CONCLUSION GÉNÉRALE ET PERSPECTIVES------------------------------------------ 108
BIBLIOGRAPHIE ET WEBOGRAPHIE------------------------------------------------------- 109

viii
LISTE DES FIGURES
Figure 1: Structure anatomique du sein...................................................................................... 9
Figure 2: Présentation d'une tumeur du sein vue de face. ........................................................ 15
Figure 3: Cancer canalaire in situ (CCIS) - Macroscopie à gauche et histologie à droite. ...... 16
Figure 4: Cancer lobulaire in situ (CLIS) - Macroscopie à gauche et histologie à droite........ 16
Figure 5: Cancer canalaire infiltrant......................................................................................... 17
Figure 6: Cancer canalaire infiltrant (CCI) - Macroscopie à gauche et histologie à droite. .... 17
Figure 7: Cancer lobulaire infiltrant(CLI) - Macroscopie à gauche et histologie à droite....... 17
Figure 8: Le mamographe. ...................................................................................................... 21
Figure 9: Mammographie montrant une tumeur au sein vue d'en face à gauche et vue de profil
à droite. ............................................................................................................................. 22
Figure 10: Résultat d'un examen de mammographique. ......................................................... 23
Figure 11: Échographie montrant une masse kystique............................................................. 24
Figure 12: Cytoponction d'une tumeur..................................................................................... 25
Figure 13: histologie d'une bénigne et d'une tumeur maligne.................................................. 25
Figure 14: Étapes de l’apprentissage en ML............................................................................ 35
Figure 15: Illustration de la différence entre régression linéaire et classification linéaire. ..... 37
Figure 16: Exemple de représentation de Régression Linéaire................................................ 40
Figure 17: Prix d’une maison par sa taille................................................................................ 40
Figure 18: Une relation linéaire. .............................................................................................. 41
Figure 19: Représentation de la perte dans un cas de régression linéaire. ............................... 42
Figure 20: Représentation de Perte élevée dans le modèle à gauche, perte faible dans le modèle
à droite. ............................................................................................................................. 43
Figure 21: Fonction sigmoïde. ................................................................................................. 45
Figure 22: Résultat de la régression logistique. ....................................................................... 46
Figure 23: Taux de VP et de FP pour différents seuils de classification. ................................ 50
Figure 24: AUC (aire sous la courbe ROC). ............................................................................ 51
Figure 25: L’algorithme k-means regroupe les données en k cluster, ici k = 3. Les centres de
gravité sont représentés par de petits cercles. ................................................................... 52
Figure 26: Pour k = 3 la classe majoritaire du point central est la classe B, mais si on change la
valeur du voisinage k = 6 la classe majoritaire devient la classe A.................................. 52
Figure 27: On cherche un hyperplan qui divise les observations en deux catégories.............. 54

ix
Figure 28: Exemple d’un problème non linéairement séparable. La courbe devient une bande
linéaire après avoir appliqué la transformation non-linéaire. ........................................... 55
Figure 29: Neurone du cerveau humain. .................................................................................. 55
Figure 30: Réseau de neurone artificiel.................................................................................... 56
Figure 31: Représentation d’un neurone artificiel.................................................................... 57
Figure 32: Représentations de différentes fonctions d'activation............................................. 58
Figure 33: Représentation d’un Rétro-Propagation du Gradient. ............................................ 59
Figure 34: Perte de l'ensemble d'apprentissage et de l'ensemble de validation........................ 61
Figure 35: La relation entre l’intelligence artificielle, le ML et le Deep Learning.................. 64
Figure 36: Synapse Neuronale. ................................................................................................ 65
Figure 37: Comparaison entre un NN et un Deep Learning Neural Network ......................... 66
Figure 38: Représentation des trois couleurs RVB en proportion égale.................................. 70
Figure 39: Matrice de matrice RVB......................................................................................... 71
Figure 40: Réseau de neurones avec plusieurs couches convolutives...................................... 72
Figure 41: Une matrice d’image multipliée par un noyau ou filtre de matrice........................ 72
Figure 42: Exemple de matrice d’image multiplie la matrice de noyau ou de filtre................ 73
Figure 43: Convolution d'une matrice avec 2 pas de pixels..................................................... 76
Figure 44: Exemple d’application du ReLU. ........................................................................... 77
Figure 45: Max-Pooling avec un filtre 2x2. ............................................................................. 78
Figure 46: Average Pooling avec un filtre 2x2. ....................................................................... 78
Figure 47: Aplatissement d'une matrice.................................................................................. 79
Figure 48: Mise en pool en tant que couche FC....................................................................... 79
Figure 49: Illustration du Transfer Learning............................................................................ 80
Figure 50: Architecture du modèle LeNet................................................................................ 81
Figure 51: Architecture du modèle AlexNet............................................................................ 82
Figure 52: Architecture du modèle Inception V3 de Google. .................................................. 82
Figure 53: Architecture du modèle VGGNet. .......................................................................... 83
Figure 54: Étude comparative des différents modèles VGGNet.............................................. 83
Figure 55: Architecture du modèle ResNet.............................................................................. 84
Figure 56: Le taux d’erreur dans ImageNet Visual recognition Challenge. ............................ 84
Figure 57: Python..................................................................................................................... 86
Figure 58: Theano. ................................................................................................................... 87
Figure 59: TensorFlow............................................................................................................. 87

x
Figure 60: Keras....................................................................................................................... 88
Figure 61: PYTORCH.............................................................................................................. 89
Figure 62: Croissance de popularité de TensorFlow................................................................ 90
Figure 63: Logo Flask. ............................................................................................................. 91
Figure 64: Jinja......................................................................................................................... 91
Figure 65: MySQL. .................................................................................................................. 91
Figure 66: Répartition des données dans les dossiers cas normal/anormal.............................. 92
Figure 67: Répartition des données dans les dossiers cas normal, bénin et malin................... 93
Figure 68: Répartition des données dans les dossiers cas normal et bénin/malin(masse et
calcification)...................................................................................................................... 93
Figure 69: Architecture de notre modèle.................................................................................. 96
Figure 70: Architecture du modèle - cas normal/anormal........................................................ 97
Figure 71: Résultat obtenu - cas normal/anormal. ................................................................... 98
Figure 72: Histogrammes de l’apprentissage et de la validation du cas normal/anormal........ 98
Figure 73: Test sur les données cas normal/anormal - Matrice de confusion. ......................... 99
Figure 74: Architecture du modèle - cas normal, bénin et malin........................................... 100
Figure 75: Résultat obtenu - cas normal, bénin et malin........................................................ 100
Figure 76: Histogrammes de l’apprentissage et de la validation du cas normal, malin et bénin.
......................................................................................................................................... 101
Figure 77: Test sur les données cas normal, bénin et malin - Matrice de confusion. ............ 101
Figure 78: Architecture du modèle - cas normal et bénin/malin (masse et calcification)...... 102
Figure 79: Résultat obtenu - cas normal et bénin/malin (masse et calcification)................... 103
Figure 80: Histogrammes de l’apprentissage et de la validation du cas normal et
malin/bénin(masse et calcification). ............................................................................... 103
Figure 81: Test sur les données cas normal et bénin/malin(masse et calcification): Matrice de
confusion......................................................................................................................... 104
Figure 82: Présentation de l'interface de l'application............................................................ 105
Figure 83: Inscription et connexion d'un utilisateur............................................................... 106
Figure 84: Aperçus de la base de données MySQL (les mots de passe sont chiffrés). .......... 106
Figure 85: Test de prédiction sur une mammographie dans l'interface de l'application. ....... 107

xi
LISTES DES TABLEAUX
Tableau 1: Classification TNM................................................................................................ 19
Tableau 2: Classification de cancer du sein par stade.............................................................. 20
Tableau 3: Gradient du Linéaire régression. ............................................................................ 44
Tableau 4: Classification vrai ou faux et positif ou négatif. ................................................... 49
Tableau 5: Histoire du Deep Learning. .................................................................................... 67
Tableau 6: Quelques exemples d'effets pouvant être obtenus par la convolution des noyaux et
des images......................................................................................................................... 75
Tableau 7: Nombre d’étoile par framework sur github............................................................ 90
Tableau 8: Interprétation des résultats cas normal/anormal..................................................... 99
Tableau 9: Interprétation des résultats cas normal, bénin et malin. ....................................... 102
Tableau 10: Interprétation des résultats cas normal et bénin/malin(masse et calcification).. 104

xii
LISTE DES ABRÉVIATIONS
ACR American College of Radiology
AND Acide DésoxyriboNucléique
av. J.-C. Avant Jesus-Christ
API Application Programming Interface
ASI Artificial SuperIntelligence
AUC Area Under Curv
BI-RADS Breast Imaging-Reporting And Data System
CC Cranio-Caudal
CCIS Cancer Canalaire In situ
CBIS-DDSM Curated Breast Imaging Subset of DDSM
CIDIS Centre d'Imagerie Diagnostique et Interventionnelle de Soumbédioune
CNN Convolutional Neural Network
CPU Central Processing Unit
DAI Distributed Artificial Intelligence
DBN Deep Belief Network
DDSM Digital Database for Screening Mammography
DL Deep Learning
DNN Deep Neural Network
FCFA Franc Communauté Financière Africaine
FN Faux Négatif
FP Faux Positif
GPU Graphics Processing Unit
IA Intelligence Artificielle

xiii
IARC International Agency for Research on Cancer
IID Indépendantes et Identiquement Distribuées
ILSVRC ImageNet Large Scale Visual Recognition Competition
IRM Imagerie par Résonance Magnétique
KNN K-Nearest Neighbors
MCP McCulloch–Pitts
MGH Massachusetts General Hospital
MILA Montreal Institute for Learning Algorithms
ML Machine Learning
MLO MedioLateral-Oblique
MSE Mean Squared Error
NLP Natural Langage Processing
NN Neural Network
RAM Random-Access Memory
RNN Recurrent Neural Network
ROC Receiver Operating Characteristic
ROI Region Of Interest
SVM Support Vector Machine
TCIA The Cancer Imaging Archive
TPU Tensor Processing Unit
UAMS University of Arkansans for Medical Sciences
VGG Visual Geometry Group
VN Vrai Négatif
VP Vrai Positif

xiv
WFU Wake Forest University
WUSTL Washington University of St. Louis School of Medicine

1
INTRODUCTION GÉNÉRALE
INTRODUCTION GÉNÉRALE
Le diagnostic et la prévention dans les hôpitaux et dans les établissements de soin de santé sont
des tâches difficiles pour le personnel médical qualifié. Le personnel médical n’a pas souvent
la possibilité d’observer chacun de ces patients à temps plein et faire des diagnostics précis très
rapidement. Bien que le personnel médical soit efficace pour identifier les besoins immédiats,
ils ne parviennent pas toujours à faire le diagnostic des pathologies sur la base d’un
interrogatoire et d’un examen clinique. Il a souvent recours à des moyens de diagnostic
biologique et d’imagerie médicale. Malgré cet arsenal utilisé, il peut avoir recours au traitement
de l’image dans sa forme matricielle pour une aide un diagnostic. C’est pourquoi au cours de
ces dernières années, avec le récent accroissement des performances de l’Intelligence
Artificielle (IA) notamment avec le Machine Learning (ML), le Deep Learning (DL), le
stockage massif des données sur des serveurs et la prouesse des calculs des machines, nous
assistons à une véritable révolution. En effet, l’avènement de l’IA a permis de nombreux
avancées dans le traitement de l’image améliorant ainsi le diagnostic médical.
Ce présent document s’articule en deux parties :
première partie : la problématique, les objectifs, la pertinence du sujet, les techniques
d’investigation et les difficultés rencontrés ;
deuxième partie : le cancer du sein, l’intelligence artificielle, le Machine Learning, le
Deep Learning, les réseaux de neurones convolutionels (CNN), le prétraitement, la
labélisation des données, l’implémentation de notre modèle de prédiction et la
présentation des résultats et de l’application.

2
PARTIE I : CADRE THÉORIQUE ET MÉTHODOLOGIQUE

3
CHAPITRE 1 : CADRE THÉORIQUE
CHAPITRE 1: CADRE THÉORIQUE
INTRODUCTION
La médecine est la science qui accompagne l’humanité depuis des millénaires. C’est la
discipline qui cherche à préserver la santé physique et mentale des êtres humains par la
prévention et le traitement des maladies. Au fur et à mesure qu’on avance dans le temps, de
nouvelles maladies sont découvertes et d’autres sont devenues plus fréquentes. L’ampleur et
les progrès de l’imagerie, le développement des tests biologiques, ainsi que la mise sur le
marché de nouveaux médicaments et d’autres procédures thérapeutiques ont beaucoup amélioré
la prise en charge des patients. Dans ce présent chapitre, nous aborderons la problématique
rencontrée lors d’un diagnostic de cancer du sein, les objectifs et les hypothèses de recherche
puis la pertinence de notre sujet.
1.1. PROBLÉMATIQUE
Les performances médicales bien qu’elles soient très évoluées en terme de diagnostic ne
permettent pas de faire le diagnostic différentiel de certaines pathologies médicales. Et même
si le diagnostic de cancer est fait la stadification peut souvent poser de sérieux problèmes. C’est
pourquoi nous collaborons avec ces médecins en utilisant les algorithmes mathématiques pour
une aide au diagnostic et à la classification des tumeurs mammaires. Celles-ci étaient stratifiées
jusque-là sur la base d’une interprétation qui faisaient intervenir l’expérience du radiologue
mais également le pouvoir discriminatoire de l’œil humain malgré une relecture par un autre
radiologue pour établir la classification ACR de BI-RADS. Ce qui justifie notre étude.
1.2. LES OBJECTIFS DU PROJET
L’objectif de ce présent mémoire est de concevoir un outil (une application) possédant un
modèle intelligent et performant pour la classification des images mammographiques en faisant
appel à l’intelligence artificielle afin d’assister le médecin (le radiologue) dans son
raisonnement en vue d’identifier rapidement, efficacement et avec une certaine précision la
présence d’une anomalie dans une mammographie. Ceci serait plus facile à réaliser en utilisant
les réseaux de neurones artificiel. Ce qui nous permettra d’être plus précis, d’obtenir un gain en
matière de temps et de réaliser des économies. De ce fait, on améliore la prise en charge des
patients respectant les bonnes pratiques cliniques, le médecin outillé pourra réaliser des tâches

4
complexes, plus rapide avec une certaine précision. Cette application permettra au radiologue
de prédire le cas de la présence d’une anomalie dans une mammographie qui résultera par des
examens plus approfondies.
1.3. LES HYPOTHÈSES DE RECHERCHE
La mammographie permet de prendre une décision dans le cas de la présence d’une anomalie
(s’il s'agit d’une tumeur cancéreuse). Et c’est dans cette phase sensible et décisive qu’on peut
rencontrer des erreurs, ainsi emmètre une fausse analyse et par conséquent risquer de perdre
une vie. Il convient donc de mettre en place un outil d’aide à la décision assistant le médecin
pour un diagnostic rapide et efficace. Cette analyse doit être plus précise et ce n’est pas toujours
fournie par une analyse manuelle, tous cela nous conduit vers un traitement automatique exigent
rapidité et précision. Dans le Deep Learning on va utiliser plus exactement la technologie des
réseaux de neurones convolutifs (CNN) qui atteignent, voire dépassent les performances
humaines en matière de classification des images. Ces modèles ont un potentiel énorme en
analyse d'imagerie médicale.
1.4. LA PERTINENCE DU SUJET
Le cancer est la 2ème
cause de mortalité après les cardiopathies ischémiques et les accidents
vasculaires cérébraux, il tue plus que le sida, le paludisme, les accidents de la voie publique, les
homicides, les suicides, les guerres, les incendies réunis [W, 5]. Cette maladie se développe et
s’accroît dans le corps humain silencieusement ce qui rend son diagnostic difficile.
Le cancer du sein n’est qu’une étape pour pouvoir se lancer dans l’étude des autres types de
cancer. Le cancer du sein est le premier cancer de la femme dans le monde avec 1 million de
nouveaux cas par an et au Sénégal c’est le deuxième cancer chez la femme (2014) [B, 1]. En
2015, le cancer du sein a fait 8,8 millions morts, près d’un (1) décès sur six (6) est dû au cancer
ces chiffres ne cesse de s’accroître, on estime que pour l’année 2018, près de 18 millions de
personnes recevront le diagnostic de cancer, et 9.6 millions en décéderont [W, 8] Source : World
Cancer Report 2018 - International Agency for Research on Cancer (IARC).
CONCLUSION
Dans ce chapitre, nous avons présenté les problèmes rencontrés pour l’identification des
cellules cancéreuses du sein. On a proposé une solution pour avoir des précisions plus exactes
sur un diagnostic et on a expliqué les raisons qui nous ont poussés à réaliser cette étude.

5
CHAPITRE 2 : CADRE MÉTHOLOGIQUE
CHAPITRE 2: CADRE MÉTHODOLOGIQUE
INTRODUCTION
Dans ce présent chapitre, nous allons aborder les recherches faites afin de trouver des
mammographies (des images médicales) avec lesquelles nous allons travailler dans ce mémoire.
Présenter ces données leurs caractéristiques et les difficultés rencontré lors de la recherche et
de la collecte des données.
2.1. TECHNIQUES D’INVESTIGATION
En avril 2018, nous avons cherché dans les hôpitaux de Dakar notamment à Aristide
Le Dantec et Fann des données mammographiques, mais en vain. Les documents produits
n’étaient pas sauvegardés dans un serveur, autrement dit il n’y avait pas d’archivage et que les
données recueillies étaient supprimées au fur et à mesure.
Nous avons pensé à visiter d’autres centres parmi lequel le centre Centre d'Imagerie
Diagnostique et Interventionnelle de Soumbédioune (CIDIS). Ils ont bien voulu collaboré avec
nous en nous expliquant la procédure de diagnostic de cancer du sein. Et malheureusement, ils
ont dit qu’ils ne possédaient pas de serveur de stockage d'images mammographiques pour
l’instant, mais qu'il en avait déjà commandé. Et dans un avenir proche une collaboration serait
possible.
Donc on s'est retourné vers les archives de mammographie internationale celui qui avait le plus
de données était Digital Database for Screening Mammography (DDSM).
2.2. PRÉSENTATION DES DONNÉES MAMMOGRAPHIQUES
PRÉSENTATION DES DONNÉES DDSM
La base de données numérique pour la mammographie de dépistage reconnue en anglais sous
le nom de DDSM : Digital Database for Screening Mammography a été ressemblée par un
groupe de chercheur de l’Université du sud de la Floride, elle contient 2 620 cas c’est à dire que
les examens ont été effectués sur 2 620 patientes, il existe 2 types de mammographie sur la base
de donnée un MLO, MedioLateral-Oblique est une vue oblique ou angulaire et un CC, Cranio-
Caudal est une vue d'en haut, les mammographies sont recueillies auprès de l’hôpital

6
"Massachusetts General Hospital" (MGH), l’université "Wake Forest University" (WFU) et
l’hôpital "Washington University of St. Louis School of Medicine" (WUSTL), il contient des
cas normaux, bénins et malins avec des informations de pathologie vérifiées. DDSM a
largement été utilisée par la communauté scientifique dans le domaine du diagnostic cancer du
sein ; elle a l’avantage d’utiliser le même lexique normalisé par l’American College of
Radiology (ACR) dans le BI-RADS (Breast Imaging-Reporting And Data System).
Nous avons prélevé un échantillon composé de 4 473 images : 1 377 normales, 1 739 bénignes
et 1 357 malignes les mammographies sont de taille différente, ces exemples seront partitionnés
en trois dossiers exemples d’apprentissage, exemple de validation et exemple de test.
2.3. DIFFICULTÉS RENCONTRÉES
Le DDSM qui est une base de données plus intéressante que les autres par sa grande quantité
de donnée mammographique, mais cependant pour télécharger les images, il a fallu faire
plusieurs semaines vu la connexion internet de bas débit utilisé. Ensuite les
données DDSM sont enregistrées au format JPEG sans perte (LJPEG, Less Lost JPEG) il a
fallu les décompresser.
La collection CBIS-DDSM comprend un sous-ensemble des données DDSM sélectionnées et
conservées. Elle a été créé et a été initialement hébergé par l’Université de Washington à Saint-
Louis. En décembre 2010, le National Cancer Institute, par l’intermédiaire du Fredrick National
Laboratory, a confié à l’Université de Washington l’établissement d’un environnement
d’hébergement haute disponibilité basée sur des clusters permettant de collecter et de gérer les
collections d’images actuelles et futures. En octobre 2015, le Dr Prior et l'équipe principale de
TCIA ont été transférés à Mallinckrodt Institute of Radiology de l'Université de
Washington au département d'informatique biomédicale de l'Université de l'Arkansas pour
les sciences médicales. Un nouvel environnement d’accueil pour TCIA a été créé à UAMS et
tous les logiciels, processus et données ont été transférés de St. Louis à Little Rock au mois
d’octobre 2015. Les archives conservées fournissent des collections d’images de haute qualité
et de grande valeur aux chercheurs en cancérologie du monde entier.
Les images CBIS-DDSM ont été pré-traitées par type d’anomalie, c’est-à-dire sur chaque
image on a identifié l’anomalie et pris les limites de la tumeur sur les images on appelle ça

7
extraction du ROI Region Of Interest et enregistrées en tant qu'image DiCom, mais puisque cet
ensemble de données ne contient que des numérisations présentant des anomalies. Donc les
données mammographies normales, ont été téléchargées dans le site DDSM et les données
anormales des cas de bénins et malins, on était téléchargé à partir du site CBIS-DDSM afin de
créer un jeu de données pouvant être utilisé pour prédire la présence d'anomalies.
CONCLUSION
Dans ce chapitre, nous avons pu aborder la manière dont on a collecté nos données, des
universités qui héberge les données mammographiques. Ensuite présenter les données et leurs
caractéristiques et enfin on a parlé des difficultés rencontrés lors des recherches.

8
PARTIE II : CADRE ANALYTIQUE ET IMPLÉMENTATION

9
CHAPITRE 1 : LE CANCER DU SEIN
CHAPITRE 1: LE CANCER DU SEIN
INTRODUCTION
Le cancer du sein comme son nom l’indique est localisé dans l’organe humain qu’on appelle le
sein, il résulte d’un dérèglement de certaines cellules qui se multiplient et forme une masse
appelée tumeur. Il en existe différents types qui n’évoluent pas de la même manière certains
sont « agressifs » et évoluent très rapidement, d’autres lentement. Le développement du cancer
du sein peut prendre plusieurs mois, voire plusieurs années.
Dans ce présent chapitre, nous allons étudier la structure du sien, les symptômes cancer du sein
(ce que la patiente à remarquer chez elle d’anormal) et les signes (ce que le docteur à découvert
en l’examinant). Par la suite décrire une tumeur du sein et de ces différents aspects, aborder les
facteurs de risque du cancer du sein, son diagnostic et enfin de certains traitements.
1.1. ANATOMIE DU SEIN
Les seins sont situés au niveau de la face antérieure du thorax, reposent en arrière sur le muscle
pectoral, centrés par les mamelons, ces derniers entourés d’une zone pigmentée appelée
l’aréole. La peau de l’aréole est très fine, légèrement déformée par les orifices des glandes
sébacées, des glandes sudoripares et des follicules pileux. La glande mammaire est constituée
d’une vingtaine de lobes glandulaires noyés dans du tissu graisseux. Les canaux excréteurs de
ces lobes, appelés canaux galactophores, débouchent sur le mamelon.
Figure 1: Structure anatomique du sein.

10
Avant de connaître une anomalie on doit différencier un sein normal d’un sein anormal, c’est-
à-dire reconnaître l’aspect normal du tissu glandulaire (des lobules) aussi bien que chez la jeune
fille que chez la personne âgée c’est à partir de ce moment qu’on pourra déterminer si une lésion
est pathologique pour pouvoir identifier une anomalie dans un sein.
Un sein normal est reparti en quatre types :
Type A : le sein présente plus de graisse que de glande (chez les personnes âgées) ;
Type B : le sein présente autant de glande que de graisse ;
Type C : le sein présente plus de glande que de graisse ;
Type D : le sein est glandulaire et tout à fait blanc (chez les jeunes filles).
1.2. SYMPTÔMES ET SIGNES
Les symptômes sont découverts par la patiente elle-même un cancer du sein peut se manifester
chez une patiente par « une grosseur » (nodule), un écoulement de liquide clair ou sanglant par
le mamelon, une déformation du galbe du sein ou du mamelon (rétraction), plus rarement par
une douleur. Mais il peut aussi ne pas présenter parfois aucun symptôme.
L’examen permet de rechercher :
 A l’inspection : la taille du sein malade (à augmenter ou à diminuer) par rapport au sein
controlatéral, s’il y a une déformation orientée d’un côté par rapport à l’autre, s’il y a
une rétraction, ride, Aspect de la peau en regard (rougeur ou ecchymose).
 A la palpation caractériser la masse siège, la consistance est ce que la masse est dure ou
molle, douloureuse ou indolore, est ce qu’il y a un écoulement, etc.
1.3. TUMEURS DU
Le terme de tumeur (synonyme : « néoplasme » ou « néoplasie ») désigne une prolifération
cellulaire excessive aboutissant à SEIN une masse tissulaire ressemblant plus ou moins au tissu
normal homologue (adulte ou embryonnaire), ayant tendance à persister et à croître, témoignant
de son autonomie biologique.

11
1.3.1. CRITÈRES DES TUMEURS BÉNIGNES
Les tumeurs bénignes ont des contours bien délimités donnent un nodule opaque, dense,
hétérogène, aspect stellaire, spéculer, plus souvent de petite taille. Cependant, on peut en
trouver de grande taille. Elles ont une croissance lente et restent localisées dans le tissu où
l’organe dans lequel elles sont apparues. Elles n’entraînent pas de métastases dans d’autres
endroits du corps. Les tumeurs bénignes sont composées de cellules qui ressemblent aux
cellules normales du tissu concerné. On dit qu’elles sont bien différenciées. La tumeur bénigne
qui se développe le plus souvent dans le sein est appelé fibroadénome. Les autres affections
bénignes du sein sont les kystes, les changements fibrokystiques, l'hyperplasie, la
gynécomastie.
Une tumeur bénigne est localisée dans un seul endroit la tumeur en un moment donné, peut
augmenter de taille, sans risque de métastase.
1.3.2. CRITÈRES DES TUMEURS MALIGNES
Les tumeurs malignes ont des contours le plus souvent mal délimités. Certaines sont toutefois
bien limitées et peuvent alors être considérées un temps comme bénignes, ceci pouvant retarder
le diagnostic de cancer. Les cellules cancéreuses qui composent les tumeurs malignes
présentent diverses anomalies par rapport à des cellules normales : forme et taille différentes,
contours irréguliers… On parle de cellules indifférenciées, car elles ont perdu leurs
caractéristiques d’origine. Les tumeurs malignes ont tendance à envahir les tissus voisins. Elles
peuvent entraîner des métastases : des cellules cancéreuses s’échappent de la tumeur primitive
et vont coloniser une autre région du corps tel que le foie, le cerveau, poumon pour y former
une nouvelle tumeur qu’on appelle tumeur secondaire ou métastase.
La bénignité (nature non-cancéreuse) ou la malignité (nature cancéreuse) peuvent être évoquées
sur l'aspect retrouvé sur les examens d'imagerie pratiqués. Mais c’est grâce à l’examen
anatomopathologique d’un échantillon de tumeur que l’on peut déterminer si elle est
cancéreuse ou non, c'est-à-dire l’examen qui permettra son étude et orienté le traitement.
1.3.3. CALCIFICATIONS
Les calcifications mammaires sont des dépôts de calcium qui se forment dans le tissu
mammaire. Elles n’ont aucun lien avec la quantité de calcium absorbée au cours de

12
l’alimentation ou obtenue par l’intermédiaire de compléments alimentaires. En effet, la
calcification donne un aspect dure à la tumeur
Il existe deux types de calcifications : les macrocalcifications et les microcalcifications.
Les macrocalcifications sont des dépôts grossiers de calcium dans le sein. Elles sont
plus fréquentes chez les femmes âgées de plus de 50 ans. Elles sont souvent associées à
des modifications bénignes qui se produisent dans le sein et qui sont liées par exemple
au vieillissement des artères du sein, à des anciennes lésions, à une inflammation ou à
des masses telles qu'un fibroadénome.
Les microcalcifications sont de minuscules dépôts de calcium dans le sein. Leur
présence signifie parfois que l'activité de certaines cellules du sein est accrue. Une
cellule plus active absorbe en effet davantage de calcium que celle qui l’est moins. Les
microcalcifications peuvent faire suspecter un cancer du sein (comme un carcinome
canalaire in situ-CCIS), notamment lorsqu’elles apparaissent isolées ou regroupées en
grappes à la mammographie. Si tel est le cas, le radiologue recommande de réaliser une
biopsie afin de vérifier qu’il ne s’agit pas d’un cancer, et en fonction des résultats, on
détermine le traitement qui sera suivit par la patiente.
1.4. CANCER DU SEIN
Le cancer est la présence d’une tumeur maligne. Il survient à la suite de mutations ou de
changements anormaux dans les gènes responsables de la régularisation, de la croissance des
cellules. Les gènes sont dans le noyau de chaque cellule qui agit comme la salle de contrôle.
Normalement, les cellules de notre corps se remplacent par un processus ordonné de la
croissance cellulaire : de nouvelles cellules prennent en charge alors que les anciens
disparaissent. Mais au fil du temps, les mutations peuvent apparaître dans certains et engendré
un début de malformation qui peut engendrer une tumeur bénigne ou maligne.
On distingue les cancers in situ (confinés dans les canaux ou les lobules) et les cancers invasifs
ou infiltrants. La tumeur cancéreuse érode (incruste) tout son entourage par dans la lymphe
atteint les organes tels que le cerveau, le poumon, le foie.
On pense que le cancer du sein n’arrive qu’aux femmes, mais environ 1% des cancers du sein
se produisent chez les hommes. Les hommes ont une petite quantité de tissu derrière le mamelon
et bien qu’elle ne soit pas aussi importante que chez les femmes, un cancer peut quand même

13
se développer. Peu d’hommes en sont conscients si bien qu’il est généralement diagnostiqué
plus tardivement que chez les femmes. Par conséquent, le cancer du sein masculin est
généralement plus avancés quand il est diagnostiqué et donc plus difficile à traiter.
1.4.1. LES FACTEURS DE RISQUE
Malgré les progrès qui ont permis de mieux connaître les mécanismes de développement des
cancers, les causes du cancer du sein ne sont actuellement pas connues. Néanmoins, les études
ont mis en évidence certains facteurs de risque qui favorisent le cancer du sein. Il existe
différents types de facteurs de risque de survenue d’un cancer du sein.
1.4.2. L’AGE
L’âge est le facteur de risque le plus important vis-à-vis du cancer du sein, la maladie est rare
chez les femmes de moins de 30 ans. Le risque augmente entre 50 et 75 ans (près des deux tiers
des cancers du sein). Le cancer du sein masculin apparaît surtout chez les hommes de plus de
60 ans.
1.4.3. LES FACTEURS GÉNÉTIQUES
On parle dans ce cas de gènes de prédisposition ou de risque de développer un cancer du sein.
Plusieurs femmes dans une même famille (mère, grand-mère, tante, sœurs) peuvent présenter
un cancer du sein. On soupçonne alors une origine génétique à cette maladie.
Grâce à la recherche génétique, on sait aujourd’hui détecter certaines anomalies
chromosomiques qui pourraient être responsable de la survenue d’un cancer du sein (5% à 10%
des cas) en rapport avec certains gènes. Si une telle anomalie est retrouvée chez une femme, il
est possible de faire une recherche chez les autres femmes de la même famille, mais il faut
savoir que les résultats ne sont jamais affirmatifs.
1.4.4. LES RIQUES HORMONAUX
Il semble que les femmes ayant une puberté précoce, une ménopause tardive, n’ayant pas
d’enfants ou ayant des enfants tardivement, n’ayant pas allaité, auraient un risque plus
important d’avoir un cancer du sein.

14
1.4.5. L’ALIMENTATION
L’effet le plus important est celui de la quantité de calories absorbées, plus elle est élevée, plus
le risque augmente. L’obésité, une consommation importante d’alcool (équivalent de ½ Litre
de vin par jour), la faible consommation de fruits et de légumes sont également suspectées
d’augmenter le risque. Toutes ces données ne sont valables que sur un plan statistique et non
pas individuel.
1.4.6. LE TABAC
La fumée du tabac est une importante source de substances cancérogènes. Le tabagisme passif
est aussi nocif pour le cancer du sein que le tabagisme actif. Selon une étude de l'Inserm de la
France (Institut National de la Santé Et de la Recherche Médicale) une augmentation de risque
associé au tabagisme. Le fait d’inhaler involontairement de la fumée dégagée par la cigarette
ou cigares (tabagisme passif) semble associé à un risque augmenté d’environ 60% ; ce risque
est multiplié par trois chez les femmes après la ménopause. Il a été rapporté que les fumeuses
ont une ménopause précoce et une concentration urinaire réduite d’œstrogènes pendant la phase
lutéale du cycle menstruel.
1.4.7. LA PILULE
Pour les contraceptions orales, les études faites aux Etats-Unis conclut à une augmentation
minime du risque (+14%). Le risque serait un peu plus élevé (+20%) pour les femmes ayant
pris des contraceptions orales pendant plus de 5 ans avant une première grossesse.
1.4.8. LE TRAITEMENT HORMONAL DE LA MÉNOPAUSE (THM)
Il existe un risque élevé d’augmentation du cancer du sein chez les femmes utilisant des THM.
Le risque de cancer est augmenté avec la durée du traitement. Aucune différence n’est
démontrée en fonction de la voie d’administration (orale, parentéral), le risque de cancer du
sein lié au traitement œstroprogestatif pourrait varier en fonction du type de progestatif, mais
ces données nécessitent d’être confirmées par d’autres études [W, 27].
1.4.9. ANTÉCÉDENTS DE CANCER
Les femmes qui ont déjà présenté un cancer du sein ont plus de risques que les autres n’ayant
pas des antécédents de cancer (risque de deuxième cancer est de 10 %). Elles seront suivies
attentivement après. Même la présence d’un ou de plusieurs de ces facteurs favorise le

15
développement d’un cancer du sein, il faut savoir que, mis à part les facteurs familiaux ou
génétiques, ces autres facteurs augmentent généralement assez peu le risque : une femme qui
possède une ou plusieurs de ces caractéristiques peut ne jamais développer un cancer du sein.
En revanche, il est possible qu’une femme n’ayant aucune de ces caractéristiques soit atteinte
d’un cancer du sein. Les facteurs de risque ne permettent donc pas de déterminer les causes
exactes à l’origine d’un cancer du sein chez une femme.
Figure 2: Présentation d'une tumeur du sein vue de face.
1.5.TYPES HISTOLOGIQUES DU CANCER DU SEIN
Les différentes composantes de chaque tumeur du sein peuvent présenter des aspects
morphologiques particuliers qui peuvent être regroupés par types histologiques. Les tumeurs
sont ainsi classées en fonction de critères histologiques communs, définis par les classifications
internationales, éditées par l’Organisation mondiale de la santé (OMS), et remises à jour
régulièrement. La reconnaissance de ces critères et le classement de la tumeur dans le type
adéquat sont la base du diagnostic anatomopathologique de toute tumeur. On ne peut déterminer
qu’une tumeur est cancéreuse sans l’examen et le rapport histologique.
1.5.1. LE CANCER DU SEIN NON-INFILTRANT (IN SITU)
Le cancer du sein non-infiltrant (in situ) se réfère à un cancer qui est encore dans le conduit du
lait et/ou les lobules du sein. En d’autres termes, le cancer n’a pas envahi les murs des canaux
galactophores ou des lobules c’est repartie en deux les CCIS et les CLIS.
Le Cancer Canalaire In situ (CCIS), également appelé carcinome intracanalaire (figure
3), fait référence aux cellules cancéreuses qui se sont formées dans les conduits du canal
galactophore et sont encore confinées dans cet espace. Les conduits se bouchent et

16
élargie à cause des cellules cancéreuses qui s’accumulent à l’intérieur. Le calcium a
tendance à s’accumuler dans les canaux bloqués et est visible sur la mammographie.
Figure 3: Cancer canalaire in situ (CCIS) - Macroscopie à gauche et histologie à droite.
Le Cancer Lobulaire in situ (CLIS) comme le montre la figure 4 fait référence à des
cellules cancéreuses qui se sont formés dans les glandes mammaires et qui sont encore
confinées dans cet espace. Ce type de cancer est souvent constaté chez les femmes
autour de la ménopause. CLIS est différente de CCIS, celui-ci présente un risque plus
élevé, l’ensemble du tissu des deux seins peut développer un cancer. Par conséquent, le
traitement de CLIS doit viser les deux seins.
Figure 4: Cancer lobulaire in situ (CLIS) - Macroscopie à gauche et histologie à droite.
1.5.2. LE CANCER DU SEIN INFILTRANT
Le cancer du sein infiltrant se réfère à des cellules qui se sont développé à travers les parois des
canaux galactophores et des glandes dans le tissu normal graisseux du sein. Les cellules
continuent de croître entraînant une masse. Ils peuvent alors former des métastases à travers la

17
circulation sanguine ou les vaisseaux lymphatiques vers d’autres parties du corps. Les
principaux types du sein infiltrant sont les suivants :
le Cancer Canalaire Infiltrant (CCI) est le plus populaire et est également appelé
cancer mammaire ou adénocancer infiltrant (figure 5) ;
Figure 5: Cancer canalaire infiltrant.
Figure 6: Cancer canalaire infiltrant (CCI) - Macroscopie à gauche et histologie à droite.
le Cancer Lobulaire Infiltrant (CLI) : moins fréquent et difficile à diagnostiquer sur la
mammographie, présente un risque légèrement plus élever d’être dans les deux seins
(figure 7).
Figure 7: Cancer lobulaire infiltrant(CLI) - Macroscopie à gauche et histologie à droite.

18
Il existe d’autres types de cancer du sein que nous pouvons rencontrer (des cas plus rares) :
Cancer mucineux (colloide), Cancer médullaire, Cancer papillaire, Cancer tubuleux, Cancer
adénoïde kystique, Cancer sécrétant juvénile, Cancer apocrine, Cancer métaplasique de type
épidermoïde, Cancer métaplasique de type à cellules fusiformes, Cancer métaplasique de type
chodroide et osseux, Cancer métaplasique de type mixte, Maladie de Paget du mamelon.
1.6. CLASSIFICATION TNM
La classification TNM est une norme mondialement reconnue pour classer l'étendue de la
propagation du cancer proposé par le chirurgien français Pierre Denoix de l’Institut Gustave-
Roussy entre 1943 et 1952. C'est un système de classification de l'étendue anatomique des
tumeurs cancéreuses. Il a acquis une large acceptation internationale pour de nombreux cancers
à tumeur solide, mais ne s'applique pas à la leucémie et aux tumeurs du système nerveux central.
Le système TNM possède des notations décrivant le stade d'un cancer, provenant d'une tumeur
solide, à l'aide de codes alphanumériques ainsi, les trois lettres symbolisant la propagation de
la maladie cancéreuse sont les suivants [B, 1] :
T décrit la taille de la tumeur initiale (primitive) et indique si elle a envahi les tissus
voisins ;
N décrit les ganglions lymphatiques voisins (Node) impliqués ;
M décrit les métastases à distance (propagation du cancer d'une partie du corps à une
autre).
T = Tumeur primitive
Tx : Détermination de la tumeur primitive impossible
T0 : Pas de signe de tumeur primitive (non palpable)
Tis : Carcinome in situ : carcinome intracanalaire, ou carcinome lobulaire in situ, ou
maladie de Paget du mamelon sans tumeur décelable
T1 : Tumeur de moins de 20 mm, avec la
sous-classification suivante :
T1mic : micro-invasion <1 mm
T1a : moins de 5 mm
T1b : de 5 à 10 mm
T1c : de 10 à 20 mm
T2 : Tumeur de 20 à 50 mm

19
T3 : Tumeur de plus de 50 mm
T4 : Quelle que soit la taille, avec :
T4a : Extension à la paroi thoracique
T4b : Extension à la peau y compris,
ulcération cutanée ou nodules de perméation
T4c : T4a + T4b
T4c : Cancer inflammatoire
N = Adénopathies régionales
Nx : Appréciation impossible de l’atteinte ganglionnaire (du fait, par exemple d’une
exérèse antérieure)
N0 : Absence de signe d’envahissement ganglionnaire régional
N1 :Ganglions axillaires homolatéraux suspect mobiles
N2 : Ganglions axillaires homolatéraux
suspects fixés entre eux ou à d’autres
structures, ou présence clinique
d’adénopathies mammaires internes en
absence d’adénopathies cliniques axillaires
N2a : Ganglions axillaires homolatéraux
fixés
N2b : Ganglions mammaires internes
homolatéraux cliniquement apparent sans
adénopathies axillaires cliniques
N3 : Ganglions sous-claviculaires
homolatéraux (niveau III axillaire) ou
mammaires internes avec présence
d’adénopathies axillaire ou ganglions sus-
claviculaires présents (avec ou sans la
présence de ganglions axillaires ou
mammaires internes)
N3a : Ganglions suspects sous-claviculaires
et axillaires homolatéraux
N3b : Ganglions mammaires internes et
ganglions axillaires homolatéraux suspects
N3c : Ganglions sus-claviculaires
homolatéraux suspects
M = Métastases
Mx : Renseignement insuffisants pour classer les métastases à distance
M0 : Absence de métastases à distance
M1 : Présence de métastase(s) à distance
Tableau 1: Classification TNM.

20
1.7. EVOLUTION
Comme la plupart des cancers, le cancer du sein évolue d’abord localement, avec extension
aux organes de voisinage et aux ganglions lymphatiques axillaires, puis se propage par voie
sanguine (métastases), surtout aux os, au cerveau, au foie, et aux poumons. Ces métastases
peuvent apparaître tardivement, jusqu’à 10 ans après la découverte du cancer initial.
Stade TNM Chances de Survie
Stade 0 Tis N0 M0 > 95%
Stade I T1 N0 M0 85%
Stade IIA
T0 N1 M0
T1 N1 M0
T2 N0 M0
66%
Stade IIB
T2 N1 M0
T3 N0 M0
66%
Stade IIIA
T0 N2 M0
T1 N2 M0
T2 N2 M0
T3 N1 M0
T3 N2 M0
41%
Stade IIIB
T4 N0 M0
T4 N1 M0
T4 N2 M0
41%
Stade IIIC Tous T N3 M0 41%
Stade IV Tous T Tous N M1 10%
Tableau 2: Classification de cancer du sein par stade.

21
1.8. DIAGNOSTICS
Un cancer du sein est découvert soit à l’occasion d’un examen systématique par le gynécologue,
soit par la patiente elle-même au cours d’un auto-palpation mammaire qui découvre un nodule
ou une masse mammaire qui très souvent fait l’objet d’examens d’imagerie médicale en
l’occurrence l’échographie et la mammographie qui peuvent plaider en faveur d’un cancer du
sein. Ce diagnostic est objectivé par la biopsie.
Par ailleurs le cancer peut être découvert au cours de complications ou de localisation régionale
ou à distance.
1.8.1. LA MAMMOGRAPHIE
Le cancer du sein est à l’heure actuelle, est mis en évidence par une mammographie (examen
radiologique du sein) réalisé à titre systématique dans le cadre du suivi médical individuel ou
lors d’une campagne de dépistage (découvert de manière fortuite). La mammographie est un
examen aux rayons X, qui emploie de faibles doses de rayonnements, mais qui néanmoins doit
être évitée chez la femme enceinte. C’est une technique de radiographie qui vise à détecter les
tumeurs mammaires. Elle est réalisée lorsqu’une patiente présente des symptômes pouvant faire
évoquer un cancer du sein. Cet examen est réalisé avec un mamographe comme le montre la
figure suivante.
Figure 8: Le mamographe.

22
Les mammographies sont des clichés (des images en noir et blanc) centrés sur les zones
suspectes. La mammographie est l’examen de référence de dépistage du cancer du sein elle est
effectué sur chaque sein chacun sous des angles différents essentiellement, on peut citer le MLO
è_Médio-Latéral Oblique qui offre une vue de profil du sein et le CC Cranio-Caudal une vue
de face du sein. Elles permettent de mettre en évidence des cancers de petite taille, à un stade
précoce, avant l’apparition de symptômes. Cet examen permet d’orienter le médecin dans son
diagnostic. L’examen ne s’accompagne d’aucun effet secondaire.
Figure 9: Mammographie montrant une tumeur au sein vue d'en face à gauche et vue de
profil à droite.
Une mammographie systématique est conseillée tous les 2 ans chez les femmes à partir de 50
ans. Elle est aussi effectuée sur un avis médical lorsqu’une femme présente un risque accru de
cancer du sein (famille à risque, antécédents personnels).
On utilise la classification BIRADS (Breast Imaging Reporting And Data System) de l’ACR
qui est une classification internationale établie par l’American College of Radiology.
Le système BI-RADS ACR permet de classer les images mammographiques en 6 catégories :
 ACR 0 : mammographie de mise en attente, pour laquelle une comparaison à l’examen
antérieur, ou des clichés complémentaires (localisés ou agrandis) sont nécessaires,
mammographie de dépistage est lue et l’évaluation finale est « incomplète »;
 ACR 1 : mammographie normale, pour laquelle une surveillance habituelle est
préconisée :
 ACR 2 : mammographie présentant une anomalie bénigne appelée aussi kyste (c’est-à-
dire sans gravité).
 ACR 3 : il existe une anomalie probablement bénigne pour laquelle une surveillance à
court terme (3 ou 6 mois) est conseillée ;

23
 ACR 4 : il existe une anomalie indéterminée ou suspecte, pour laquelle la poursuite des
investigations reste nécessaire (microbiopsie échoguidée, macrobiopsie stéréotaxique,
cytoponction, IRM mammaire…). Souvent, une subdivision en ACR4a, ACR4b, et
ACR4c est réalisée pour mieux apprécier le risque de pathologie maligne ;
 ACR 5 : il existe une anomalie évocatrice d’un cancer et pour laquelle la poursuite des
investigations reste indispensable (microbiopsie sous échographie, macrobiopsie
stéréotaxique, cytoponction…) ;
 ACR 6 : correspond à une mammographie ayant un cancer prouvé, le plus souvent sous
traitement (chimiothérapie, hormonothérapie). [B, 1]
En cas d’images ACR 4 ou ACR 5 présente des cas ou la tumeur est localisé donc, des
prélèvements par biopsie percutanée sont nécessaires pour effectuer un examen
d’anatomopathologie.
Dans la figure qui suit on voit les résultats donnés par le médecin un examen de
mammographique.
Figure 10: Résultat d'un examen de mammographique.

24
1.8.2. ECHOGRAPHIE MAMMAIRE
Une échographie mammaire est un examen pratiqué par le radiologue qui utilise des ultrasons
pour produire des images de l’intérieur du sein. Elle est très utile pour voir la nature liquide ou
solide des nodules palpés ou découverts sur la mammographie.
Cet examen précise les images obtenues par mammographie. Il ne remplace pas une
mammographie qui est un examen de référence pour le sein. Pour les adolescentes, les jeunes
femmes et les femmes enceintes, la mammographie est moins importante : l’échographie
mammaire est donc l’examen de référence. Pour les femmes âgées, la mammographie reste
l’examen de référence.
Une échographie fournit des images « en temps réel », c’est-à-dire visibles immédiatement. Elle
permet ainsi de comparer ce que l’on sent avec les doigts (lors de la palpitation) et ce que l’on
voit sur l’écran elle permet aussi de guider un prélèvement. Cependant, l’échographie ne permet
pas toujours de voir avec certitude s’il s’agit ou non d’un cancer. Pour cela, il faut réaliser
d’autres examens complémentaires.
Figure 11: Échographie montrant une masse kystique.
Pour les seins glandulaires (type D), il est difficile de faire un diagnostic, car les glandes
apparaissent blanches dans la mammographie et la tumeur aussi a un aspect grisâtre donc ça
sera du blanc sur du blanc. C’est pourquoi chez les jeunes filles la mammographie même
effectuée ne donne pas de bon résultat, on procède à une échographie qui ne permet pas de
diagnostiquer à 100%, mais néanmoins dans certains, il peut faire apparaître une tumeur.

25
1.8.3. LA CYTOPONCTION ET LA MICROBIOPSIE ECHOGUIDÉE
Lorsqu’une lésion est visible en mammographie et/ou à l’échographie, la cytoponction est
souvent la technique de choix parce qu’elle est plus simple et plus rapide. C’est un prélèvement
qui se fait à l’aiguille fine introduite dans la masse. Soit sur un kyste un éventuel liquide est
aspiré et/ou bien, il est prélevé sur un nodule quelques cellules sont aspirées par une seringue.
Figure 12: Cytoponction d'une tumeur.
La microbiopsie échoguidée (microbiopsie mammaire sous échographie) est également un
prélèvement qui se fait cette fois ci avec une aiguille de gros diamètre sous anesthésie locale.
On prélève un fragment de tissu. Pour certains les microbiopsie résultent essentiellement des
échecs des cytoponctions notamment pour les lésions suspectes, purement échographiques.
Pour d’autres, elles pourraient se substituer aux cytoponctions.
Figure 13: histologie d'une bénigne et d'une tumeur maligne.

26
1.9. TRAITEMENTS
Il existe quatre types de traitements qui peuvent être entrepris, parfois isolément, parfois en
association les traitements sont les suivants :
la chirurgie : elle consiste à l’ablation de la tumeur si la tumeur est maligne
(cancéreuse) l’ablation des ganglions de l’aisselle (curage ganglionnaire axillaire) est
réalisée, pour les tumeurs volumineuses ou multiples la mastectomie (ablation du sein)
est pratiquée, pour les tumeurs de petites taille (bénigne) la curage du ganglionaire est
proposée pour minoré les conséquences ;
la radiothérapie : pratiquée après une tumorectomie, elle consiste à irradier le sein et
le pourtour de la zone retiré pour éviter les récidives locales. Le traitement comprend
généralement 4 ou 5 séances par semaine pendant 5 à 6 semaines. En fonction du type
histologiques.
la chimiothérapie : elle peut être utilisée en complément de l’ablation chirurgicale du
cancer primitif elle est utilisée en première intention en cas de cancer du sein avec signes
inflammatoires. Les métastases sont aussi traitées par la chimiothérapie. Le traitement
comporte l’association de plusieurs médicaments après un bilan pré thérapeutique.
Compte tenu de la causalité des produits administrés, il nécessite la pose préalable d’une
chambre implantable pour éviter une extravasation, source nécrose cutanée (forme de
dégât qui mène à la mort des cellules dans le tissu vivant) ;
L’hormonothérapie : est très souvent associée aux autres traitements, consiste à
prendre pendant 5 ans par voie orale des antiœstrogènes lorsque le cancer est
hormonodépendant, c’est-à-dire que la tumeur contient des récepteurs hormonaux
participant à la multiplication rapide des cellules cancéreuses.
Les buts des traitements selon les cas sont d’extirper la tumeur et ralentir son extension, éviter
la récidive ou les métastases et améliorer la qualité de vie de la patiente.
CONCLUSION
Dans le monde, le cancer du sein est le premier type de cancer le plus fréquent chez la femme.
Ici, au Sénégal c’est le deuxième cancer féminin (46% en 2014) [B, 1], il vient après celui de
l’endomètre. Son diagnostic passe par plusieurs étapes en commençant par un examen clinique
systématique soit par un gynécologue ou bien par la patiente elle-même. Le cas de présence
d’une tumeur est confirmé par une mammographie et ou une échographie mammaire. Mais le

27
diagnostic de certitude reste l’examen anatomopathogie. Après l’identification de la tumeur, un
bilan sénologique (mise au point globale) : entretien, examen de la patiente, une
mammographie et souvent une échographie seront faites en vus d’étudier les signes de la
tumeur. Le cas d’une tumeur cancéreuse ou non sera confirmé par une analyse dite histologique,
un traitement sera alors pris selon le type de tumeur.
Dans ce chapitre, nous avons pu comprendre le fonctionnement d’une tumeur ces
caractéristiques ces différents aspects. Et comment différentier une tumeur bénigne d’une
tumeur maligne les traitements qui doivent s’appliquer dans chaque cas.

28
CHAPITRE 3 : INTELLIGENCE ARTIFICIELLE
CHAPITRE 2: INTELLIGENCE ARTIFICIELLE
INTRODUCTION
L'Homme a toujours cherché à comprendre et à reproduire les mécanismes naturels qui
l'entourent. Un des domaines les plus passionnants reste celui de l'étude du cerveau. Qu'il soit
humain ou animal, nous restons fascinés par sa capacité à analyser, à comprendre et à
généraliser les problèmes que pose l'environnement.
Dans le but de se rapprocher du fonctionnement du cerveau, on abordera les généralités sur
l’intelligence artificielle.
2.1. PRÉSENTATION DE L’INTELLIGENCE ARTIFICIELLE
L’intelligence artificielle (IA) est un domaine de l’informatique qui met l’accent sur la création
de machines intelligentes qui fonctionnent et réagissent comme des humains. Il est devenu un
élément essentiel de l’industrie des technologies, les principaux problèmes de l’intelligence
artificielle comprennent la programmation des ordinateurs pour certaines caractéristiques telles
que :
la reconnaissance vocale ;
l’apprentissage ;
la planification ;
possibilité de manipuler et déplacer des objets ;
etc…
L’ingénierie des connaissances est au cœur de la recherche en Intelligence Artificielle. Les
machines peuvent souvent agir et réagir comme des humains seulement si elles disposent de
nombreuses information relative au monde. L’IA doit avoir accès aux objets, aux catégories,
aux propriétés et aux relations entre tous pour mettre en œuvre l'ingénierie des connaissances.
Initiez le bon sens, le raisonnement et la résolution de problèmes dans les machines est une
tâche difficile et fastidieuse. La perception de la machine concerne en sa capacité à utiliser les
entrées sensorielles pour déduire les différents aspects, tandis que la vision par ordinateur est
de pouvoir analyser les entrées visuelles avec quelques sous-problèmes tels que la
reconnaissance faciale, des objets et des gestes.

29
La robotique est également un domaine majeur lié à l'IA. Les robots ont besoin d'intelligence
pour gérer des tâches telles que la manipulation d'objets et la navigation, ainsi que des sous-
problèmes de localisation, de planification de mouvement et de cartographie.
2.2. HISTOIRE DE L’INTELLIGENCE ARTIFICIELLE
Les premiers jalons historiques de l'intelligence artificielle datent de la Protohistoire, où
mythes, légendes et rumeurs dotent des êtres artificiels, réalisés par des maîtres-artisans, d'une
intelligence ou d'une conscience.
La recherche en intelligence artificielle a vraiment commencé après une conférence tenue sur
le campus de Dartmouth College pendant l'été 1956 aux Etats Unis. À la suite de cette réunion,
certains participants se sont investis dans une recherche sur l'intelligence artificielle.
Certains idéalistes avaient prédit qu'une machine aussi intelligente qu'un être humain existerait
en moins d'une génération et des millions de dollars ont alors été investis dans un organisme de
prédiction. Avec le temps, il est apparu que les difficultés inhérentes à cette annonce avaient
été grossièrement sous-estimées.
Au début de 1973 jusqu'à la fin des années 1980, nous pouvons dire que ce cycle est discontinu,
les périodes de gel et de dégel en alternance, on disposait d'un support pour l'intelligence
artificielle. Mais il y a encore un idéal qui n’est pas encore atteint pour faire des prédictions
audacieuses.
Depuis 1980 jusqu’au présent. L’intelligence artificielle est devenue au fil du temps une matière
scientifique de plus en plus rigoureuse et formelle. La plupart des approches étudiées
aujourd’hui sont basées sur des théories mathématiques ou des études expérimentales plutôt
que sur l’intuition, et sont appliquées plus souvent aux problèmes issus du monde réel.
2.3. LES DIFFÉRENTS TYPES D’INTELLIGENCE
ARTIFICIELLE
2.3.1. L’INTELLIGENCE ARTIFICIELLE DISTRIBUÉE
L'intelligence artificielle distribuée (Distributed Artificial Intelligence, DAI) est l'une des
nombreuses approches de l'intelligence artificielle. L’ors de l'apprentissage, il effectue une
méthode d'apprentissage complexe, une planification et des prises de décisions à grande échelle.
Il peut utiliser un large éventail de ressources informatiques dans différents domaines (CPU,

30
RAM, GPU...). Cela signifie qu'il peut facilement traiter et analyser de grandes quantités de
données et résoudre rapidement les problèmes.
Il existe de nombreux agents ou nœuds d'apprentissage autonomes dans un tel système. Ces
nœuds sont très distribués et indépendants les uns des autres. De ce fait, les systèmes
d’apprentissage automatique (ML) utilisant l’intelligence artificielle distribuée sont tout à fait
adaptables et fiables. Cela signifie que les systèmes DAI ne doivent pas être complètement
redéployés après toute modification apportée aux fichiers de données en entrée du problème.
L'intégration des solutions se fait par un système de communication efficace entre les agents ou
les nœuds. Cela garantit que le traitement est élastique. Contrairement au système d'IA
centralisé, les données dans les systèmes DAI ne doivent pas être transmises à un seul
emplacement. Les données peuvent être mises à jour au fil du temps. Les nœuds peuvent
interagir avec les uns avec les autres en ce qui concerne la solution de manière dynamique et
disposer des compétences nécessaires pour parvenir à la solution. Ainsi, le DAI est considéré
comme l'une des meilleures approches de l'apprentissage automatique et de l'intelligence
artificielle.
2.3.2. LA SUPER INTELLIGENCE
La super intelligence artificielle (Artificial SuperIntelligence, ASI) fait référence à l'époque où
la capacité des ordinateurs surpassera celle des humains. "L'intelligence artificielle", très
utilisée depuis les années 1970, fait référence à la capacité des ordinateurs à imiter la pensée
humaine. La super intelligence artificielle va plus loin et pose un monde dans lequel les
capacités cognitives d'un ordinateur sont supérieures à celles d'un humain.
Les sociétés n’ont pas encore atteint le stade de la super intelligence artificielle. En effet, les
ingénieurs et les scientifiques tentent toujours d’atteindre un point qui serait considéré comme
une intelligence artificielle complète, où l’on pourrait dire qu’un ordinateur possède la même
capacité cognitive qu’un être humain.
Cependant, il y a beaucoup de théorie qui prévoit que la super intelligence artificielle
interviendra plus tôt que prévue, mais ce ne sont que des théories pour l'instant. En utilisant des
exemples comme la loi de Moore, qui prédit une densité sans cesse croissante de transistors, les
experts parlent de singularité et de croissance exponentielle de la technologie dans laquelle
l'intelligence artificielle complète pourrait se manifester dans quelques années.

31
2.3.3. L’INTELLIGENCE ARTIFICIELLE (IA) FAIBLE
L'intelligence artificielle faible (IA faible) connu aussi sous le nom d'intelligence artificielle
étroite est une approche de la recherche et du développement de l'intelligence artificielle,
sachant que l'IA est et restera toujours une simulation de l'intelligence humaine et que les
ordinateurs ne peuvent pas penser. L'IA faible agit simplement sur les règles qui lui sont
imposées et est liée à celle-ci et elle ne peut pas aller au-delà de ces règles.
Elle est conçue pour se concentrer et pour sembler très intelligente sur une tâche bien spécifique.
Ce fonctionnement est en totale contradiction avec celui de l'Intelligence Artificielle forte, dans
laquelle une Intelligence Artificielle est capable de toutes les fonctions cognitives que peut
avoir un humain, et n'est pas vraisemblablement différente d'un véritable esprit humain. L'IA
faible n'est jamais prise comme une intelligence générale, mais plutôt comme une construction
conçue pour être intelligente dans une tâche bien spécifique à laquelle elle est assignée.
Comme Intelligence faible on peut citer les robots utilisés dans le processus de fabrication de
produits, les chatbots comme Siri d'Apple, Cortana de Microsoft Windows (intégré dans
Windows 10) qui utilise internet comme une base de données. Ils semblent très intelligents, car
ils sont capables de tenir une conversation avec des personnes réelles, même en faisant des
remarques qui ne sont pas sérieux et quelques blagues, mais ils fonctionnent de manières très
spécifiques et bien prédéfinies. Cependant, la spécificité de leur fonction peut être mise à rude
épreuve donnant ainsi des résultats inexacts lorsqu’ils sont engagés dans des conversations
auxquelles ils ne sont pas programmés pour répondre.
2.3.4. L’INTELLIGENCE ARTIFICIELLE (IA) FORTE
L'Intelligence Artificielle forte (IA forte) est une construction d'Intelligence Artificielle qui
possède des capacités mentales et des fonctions qui imitent le cerveau humain. Dans la théorie
de l'IA forte, il n'y a pas de différence essentielle entre le logiciel, qui est l'Intelligence
Artificielle, imitant ainsi exactement les actions du cerveau humain et les actions d'un être
humain, y compris son pouvoir de compréhension et même sa conscience. L'intelligence
artificielle forte est également appelée Intelligence Artificielle complète. Elle est davantage une
philosophie qu'une approche réelle de la création d'IA. C'est une perception différente de l'IA
dans laquelle elle assimile l'IA aux humains. Il stipule qu'un ordinateur peut être programmé
pour fonctionner comme un esprit humain, être intelligent dans tous les sens du terme, avoir
une perception et avoir d‘autres état cognitifs normalement attribués humains.

32
Cependant, comme les humains ne peuvent même pas définir correctement ce qu'est
l'intelligence, il est très difficile de donner un critère clair quant à ce qui constituerait un succès
dans le développement d'une intelligence artificielle forte. La faible IA citée ci-dessus, par
contre, est très réalisable en raison de la manière dont elle définit l’intelligence. Plutôt que
d'essayer d'imiter pleinement un esprit humain, l'insuffisance de l'IA peut seulement se
concentrer sur le développement de l'intelligence liée à une tâche ou à un domaine d'étude
particulier. C’est un ensemble d’activités qui peuvent être décomposées en processus plus petits
et peuvent donc être réalisées à l’échelle définie.
2.3.5. L’AMPLIFICATION DE L’INTELLIGENCE
L'amplification de l'intelligence est l'idée que les technologies peuvent être utiles à l'intelligence
humaine, plutôt que d'être composées de technologies qui créent une intelligence artificielle
indépendante. Les systèmes d'amplification de l'intelligence améliorent l'intelligence d'un être
humain, améliorant d'une certaine manière le fonctionnement ou la capacité d'un décideur
humain. L'amplification de l'intelligence est également appelée intelligence assistée,
intelligence augmentée, augmentation cognitive ou intelligence augmentée par machine.
L'idée de l'amplification de l'intelligence ou de l'intelligence augmentée vient en partie des
craintes et des préoccupations concernant l'intelligence artificielle dans son ensemble.
L'intelligence artificielle évoluant et devenant de plus en plus robuste, les technologies
malveillantes ayant un impact négatif sur la vie humaine suscitent de plus en plus d'inquiétudes.
Il semble plus sûr, dans ce cas, de développer des technologies d’amplification de l’intelligence,
des outils qui tirent leur efficacité de la conscience humaine, au lieu de former leur propre
sensibilité artificielle.
CONCLUSION
Dans ce chapitre, nous avons fait un tour d’horizon dans le monde l’intelligence artificielle un
monde bien fascinant et on peut dire que l’étendue de l’intelligence des robots et des machines
est limitée, car ils ne savent pas quoi faire dans les situations pour lesquelles ils ne sont pas
programmés (entraîner) et en dehors de cela, ils n'ont aucun moyen de déterminer quoi faire.
L'IA équipée pour l'apprentissage automatique qu'on verra dans ce qui suit ne peut qu'apprendre
et appliquer que ce qu'elle a appris et à la portée pour laquelle elle est programmée.
L’Intelligence Artificielle est définie comme l'une des principales menaces pour l'avenir de
l'humanité, mythe ou réalité l'avenir nous le dira.

33
CHAPITRE 4: MACHINE LEARNING
CHAPITRE 3: MACHINE LEARNING
INTRODUCTION
D’une façon générale, l’apprentissage humain est un processus adaptatif grâce à laquelle
l’individu fournit des réponses adéquates à certaines situations. En Psychologie ou en Science
Cognitives, le terme « Apprentissage » désigne le processus d’augmentation de l’efficacité de
l’activité mentale ou comportementale sous l’effet de l’expérience.
Cependant on a à faire un autre type d’apprentissage, vous l’utilisez certainement des centaines
voire des milliers de fois par jour sans même le savoir, chaque jour des millions d’utilisateurs
effectue des recherches sur Google ou Bing, comment font les applications de photos comme
celle de Facebook ou Apple qui reconnaissent des personnes sur les photos. À chaque fois que
quelqu’un lit un e-mail et que le filtre anti-spam évite à la personne de parcourir des tonnes de
spam encore une fois les questions qu’on doit se poser comment l’ordinateur a appris à
distinguer entre les e-mails spam des non-spam et comment tout cela marche si bien, c’est parce
que tout cela est possible grâce à une technologie qu’on appelle le Machine Learning en
français apprentissage automatique.
4.1. PRÉSENTATION DU MACHINE LEARNING
Le Machine Learning (en français apprentissage automatique) est un sous-domaine de
l’intelligence artificielle, qui concerne la conception, l’analyse, le développement et
l’implémentation de méthode permettant à une machine d’évoluer, de remplir des tâches
difficiles ou problématique par le moyen des algorithmes et de modéliser les tâches dans le but
de prendre des décisions stratégiques.
L’apprentissage automatique (Mitchell, 1997) est un Domaine de l’intelligence
Artificielle (IA) dont l’objectif est d’étudier les moyens permettant à une machine, en
accomplissant des tâches, tout en s'améliorant au fur et à mesure.
Apprendre, dans ce cas signifie être capable d’adapter son comportement dans une situation
inconnue (n’ayant pas été prévues par les concepteurs de la machine dans l’accomplissement
d’une tâche) et pouvoir extraire des caractéristiques à partir de bases de données

34
d’apprentissage. L’apprentissage se fait donc par des outils qui permettent d’acquérir, élargir et
améliorer les connaissances disponibles au système.
L'apprentissage automatique est utilisé pour doter des ordinateurs ou des machines de systèmes
de perception de leur environnement : vision, reconnaissance d'objets (visages, schémas,
langages naturels, écriture, formes syntaxiques…), moteurs de recherche, aide aux diagnostics
médical, bio-informatique, chimio-informatique, interfaces cerveau-machine, détection de
fraudes à la carte de crédit, analyse financière, dont analyse du marché boursier, classification
des séquences d’ADN, jeu, génie logiciel, adaptation de sites Web, locomotion de robots,
analyse prédictive en matière juridique et judiciaire…
4.2. LA COLLECTE DE DONNÉES
Cette étape est cruciale, il consiste à récupérer, sélectionner, nettoyer et transformer les données
pertinentes de telle sorte qu’il soit compréhensible par la machine, pour cela, il va falloir
prétraiter les données, c’est-à-dire visualiser les différentes variables, essayer de comprendre
les valeurs extrêmes ou anormales, les liens, etc... Une fois qu’on a une idée de ce à quoi on a
affaire, on peut définir un problématique plus précise.
Les bases de données constituent la source principale de récupération lors d’une étude de cas
en Machine Learning. Il existe des technologies pour récupérer ces données (sql, xml, json…)
ces bases de données peuvent comprendre les différents types d’information :
Les logs d’un serveur web
Les transactions bancaires
Le comportement des utilisateurs d’un site
Le catalogue d’un produit d’un site de e-commerce…
Les données peuvent être du texte, rédiger en langage naturel (humain) ainsi, on peut inclure
tous les types de texte (articles, livres, messages, etc.) le traitement du texte (appelé NLP
Natural Language Processing) constitue un domaine de recherche à lui seul. Elles peuvent être
aussi du code HTML ou encore des séquences d’ADN, mais aussi des audios, des images (et
vidéo) le traitement des images et de vidéos constitue un domaine de recherche à part
(Computer Vision en anglais).

35
4.3. LA MODÉLISATION
La resolution d’un problème de Machine Learning constitue cette étape et permet à un
ordinateur de modéliser les données qui lui sont fournies. Modéliser signifie dans ce cas
représenter le comportement d’un phénomène afin de pouvoir directement aider à la résolution
d’un problème concret.
En Machine Learning, l’idée est que l’algorithme construit une représentation interne tout seul
afin de pouvoir effectuer une tâche qui lui est demandé (prédiction, identification, etc.). Pour
cela, il va falloir lui donner un ensemble de données d’exemples (ou d’entraînement) afin qu’il
puisse s’entraîner et s’améliorer, d’où le mot apprentissage. Cet ensemble de données s’appelle
le training set (ou training dataset). On peut appeler une entrée dans l’ensemble de données une
instance ou une observation.
La première phase sera le choix et l’entraînement de l’algorithme d’apprentissage du modèle,
mais le traitement de la tâche spécifiques sera appris à partir du training set. Ensuite effectué
par l’algorithme lui-même dans une seconde phase.
Le schéma ci-dessus montre les différentes phases de l’utilisation d’un algorithme de Machine
Learning.
Figure 14: Étapes de l’apprentissage en ML.

36
Comme nous le montre le schéma ci-dessus un problème de Machine Learning est composé des
différents éléments :
 Les données (les données d’entraînement, mais aussi les nouvelles données) ;
 La tâche spécifique à accomplir (prédire, recommander, décider quelque chose, etc.) ;
 L’algorithme d’apprentissage en lui-même ;
 L’analyse d’erreur (ou mesure des performances du modèle).
4.4. LA TÂCHE À ACCOMPLIR
La tâche spécifique à accomplir correspond au problème qu’on cherche à résoudre grâce à la
modélisation du phénomène. On distingue entre autres les recommandations de produits, aide
au diagnostic, prédiction météorologique, l’identification d’une personne dans une vidéo,
l’identification de transactions frauduleuse, la prédiction du prix optimal d’un produit pour
maximiser les ventes. Bien sûr, chacun se traduira différemment d’un autre et nécessite le choix
d’un algorithme différent.
4.5. LES DIFFÉRENTS TYPES D’APPRENTISSAGE
La Machine Learning possède différents types d’apprentissage, chaque mode d’apprentissage
regroupe une famille d'algorithme. Dans ce qui suit, on va énumérer et expliquer le concept de
quelques types d’apprentissage en Machine Learning.
4.5.1. SUPERVISED LEARNING
Supervised Learning (en français l’apprentissage Supervisé) consiste à donner à la machine un
ensemble de données en entrée (données d’entraînement) étiquetés et nous savons déjà à quoi
devraient ressembler les résultats correct en ayant une idée qu’il existe une relation entre
l’entrée et la sortie. Sur la base des sorties étiquetées, les entrées sont comparées. En fonction
de la variation entre les deux signaux, une valeur d'erreur est calculée et un algorithme est utilisé
pour apprendre la fonction de mappage de l'entrée à la sortie. Le but est d’approximer les
fonctions de telle sorte que lorsqu’on a une nouvelle donnée d’entrée, on peut prédire les
variables de sortie. L'apprentissage s'arrête lorsque l'algorithme atteint un niveau de
performance acceptable. La tâche de l’apprentissage supervisé est :
Un ensemble d’apprentissage composé de 𝑁 exemples de pair entrée-sortie :

37
(𝒙(𝟏)
, 𝒚(𝟏)
), (𝒙(𝟐)
, 𝒚(𝟐)
), … , (𝒙(𝑴)
, 𝒚(𝑴)
)
Chaque 𝑦(𝑖)
a été généré par une fonction 𝑭(𝒙) = 𝒚 inconnue, le but est découvrir la fonction
𝑓 qui se rapproche de 𝐹.
4.5.1.1. RÉGRESSION ET CLASSIFICATION
Le Supervised Learning est composé de deux catégories qui sont les problèmes de « Régression
» et de « classification », dans un problème de régression : il s’agit de prédire les résultats dans
une sortie continue (faire correspondre les variables d’entrée à fonction continue), dans un
problème de classification, il s’agit de prédire les résultats dans une sortie discrète (faire
correspondre les variables d’entrée en catégories discrète). Cette distinction aidera dans le choix
d’un algorithme de Machine Learning et le type de sortie que l’on attend du programme : est-
ce une valeur continue (un nombre) donc c’est le cas d’une régression ou bien une valeur
discrète (une catégorie) donc c'est le cas d’une classification ?
Figure 15: Illustration de la différence entre régression linéaire et classification linéaire.
Un modèle de régression est un modèle de ML dont les sorties y sont des nombres (exemple: la
température de demain). Un modèle de classification est un modèle de ML dont les sorties y
appartiennent à un ensemble fini de valeurs (exemple : bon, mauvais).
Il existe un autre type de prédiction possible qui est de sortir plusieurs labels de manière
ordonnée (Machine-Learning Ranking en anglais). L’algorithme PageRank de Google retourne
des résultats de recherche dans l’ordre, du plus pertinent au moins pertinent.
En représentation un peu plus mathématiques en Surpervised Learning, on reçoit en entrer des
données d’exemple annotées : (x 1,y1), (x2,y2), (x3,y3),… et on prédit la sortie sur une nouvelle
observation : x∗
→ y∗

38
4.5.2. UNSUPERVISED LEARNING
Unsupervised Learning (en français l’apprentissage non-supervisé) cette fois-ci, on peut
aborder les problèmes avec peu ou quasiment pas d’idée de ce à quoi nos résultats devraient
ressembler. La machine ou ordinateur ne dispose que d’exemples non étiquetés on parle
d’apprentissage non supervisé ou clustering. L’algorithme doit découvrir par lui-même les
structures des données cibles selon leurs attributs disponibles, pour les classer en groupes. On
peut dériver une structure à partir de données pour lesquelles on ne connaît pas l’effet des
variables en regroupant les données en fonction des relations entre les variables dans les
modèles de données.
Le clustering désigne les méthodes de regroupement automatique de données qui se
ressemblent le plus en un ensemble de « nuages » appelés clusters. Un ensemble d’algorithmes
non-supervisés peuvent réaliser cette tâche, ils mesurent de manière automatique la similarité
entre les différentes données. En représentation un peu plus mathématiques en l’apprentissage
non-supervisé, on reçoit uniquement des observations brutes de variables aléatoires :
𝒙𝟏, 𝒙𝟐, 𝒙𝟑, 𝒙𝟒, 𝒙𝟓, …
Et on découvre la relation avec des variables latentes structurelles :
𝑥𝑖 → 𝑦𝑖
4.5.3. SEMI-SUPERVISED LEARNING
Semi-supervised Learning (l’apprentissage semi-supervisé) est effectué de manière probabiliste
ou non. L’apprentissage semi-supervisé est à mi-chemin entre ces deux méthodes précédentes.
On fournit au modèle quelques exemples étiquetés, mais la grande partie des données ne le sont
pas. On trouve des cas d’application partout où l’obtention des données est facile, mais leur
étiquetage demande des efforts, du temps ou de l’argent comme par exemple :
 En reconnaissance de parole, il ne coûte rien d’enregistrer une grande quantité de parole,
mais leur étiquetage nécessite des personnes qui les écoutent.
 Des milliards de pages web sont disponibles, mais pour les classer il faut les lire.
Il est mis en œuvre essentiellement quand des données(étiquettes) manquent, le modèle doit
utiliser des exemples non étiquetés pouvant néanmoins renseigner.

39
4.5.4. REINFORCEMENT LEARNING
Reinforcement Learning (l’apprentissage par renforcement) est aussi un type d’apprentissage,
comme nous le savons, « l'erreur est humaine » et les humains apprennent de nouvelles tâches
principalement par essais et erreurs. L'apprentissage par renforcement est un domaine
d’apprentissage automatique qui s'inspire de cette facette humaine et qui consiste à calculer les
résultats de certaines actions pour maximiser le rendement. Cela implique d'avoir un agent
chargé d'observer son état actuel dans un environnement numérique et de prendre des mesures
qui maximisent le cumul d'une récompense à long terme qui a été établie. L'agent doit peser les
actions et opter pour les stratégies optimales qui aident ou favorisent le progrès pour atteindre
l'objectif souhaité.
4.5.5. TRANSFER LEARNING
Transfer Learning (l’apprentissage par transfert) peut être vu comme la capacité à une machine
de reconnaître et appliquer des connaissances et des compétences, apprises à partir de tâches
antérieures sur une nouvelle tâche ou domaine partageant des similitudes. Son objectif est de
savoir comment alors identifier les similitudes entre la ou les tâche(s) cible(s) et la ou les
tâche(s) source(s), puis comment transférer la connaissance de là ou des tâche(s) source(s) vers
la ou les tâche(s) cible(s).
4.6. LES ALGORITHMES D’APPRENTISSAGE
L’algorithme d’apprentissage constitue la méthode avec laquelle le modèle statistique va se
paramétrer à partir des exemples de donnée. Il existe plusieurs algorithmes différents, le choix
du type d’algorithme dépendra de la tâche que l’on souhaite accomplir.
Voici quelques exemples d’algorithmes de Machine Learning :
Régression Linéaire;
Logistique Régression ;
Support Vector Machine(SVM) ;
K-means ;
K-nn ;
Neural Network…

40
4.6.1. LA RÉGRESSION LINÉAIRE
Une régression linéaire est un algorithme supervisé, avec en entrée 𝑥 et en sortie 𝑌 la sortie
(la prédiction) est de la forme 𝑌 = 𝑤0 + 𝑤1𝑋 ou [𝑤0 et 𝑤1 ] sont des valeurs réelles à calculer.
Figure 16: Exemple de représentation de Régression Linéaire.
Prenons l’exemple suivant s’acheter une maison à Sally est l’objectif de certains Sénégalais,
mais aussi des touristes qui viennent visiter Sénégal pour ainsi s’installer au Sénégal après leur
retraite. Pour établir une relation entre le prix en million de FCFA d’une maison à Sally et la
taille de la maison, on peut ainsi prédire une relation entre ces deux.
La première étape consistera à examiner les données sur un graphiquement :
Figure 17: Prix d’une maison par sa taille.
Bien évidemment, le graphique montre que le prix d’une maison augmente en même temps que
la taille. On peut tracer une droite comme celle-ci pour réaliser une approximation de cette
relation donc la relation entre le prix et la taille est linéaire.

41
Figure 18: Une relation linéaire.
Cette droite ne passe pas exactement par chaque point, mais elle montre clairement la relation
entre les prix et les tailles. Avec un peu d’algèbre, nous pouvons décrire cette relation ainsi :
𝑦 = 𝑎𝑥 + 𝑏
 𝑦 est le prix d’une maison en million de franc cfa, les valeurs qu’on essaie de prédire ;
 𝑎 est la pente de la droite ;
 𝑥 est la taille en mètre carré, c’est la valeur de notre caractéristique d’entrée ;
 𝑏 est l’ordonnée à l’origine.
Pour le Machine Learning, la Linear Regression (la régression linéaire) s’obtient pour un
modèle, en changeant légèrement l’équation précédente, l’équation de prédiction devient
comme suit:
𝑦′
= 𝑏 + 𝑏1𝑥1
On écrit aussi
𝑦′
= 𝑤0 + 𝑤1𝑥1
Pour établir une notation nous utiliserons ce qui suit:
𝑦′
: est l’étiquette prédite / variable de sortie / variable de la cible (ouput/feature)
𝑏 : est le biais(l’ordonnée à l’origine) noté aussi 𝑤0
𝑤1 : est le paramètre(pondération) de la caractéristique 1. La pondération est identique à celui
de pente représenté par la lettre « a » ci-dessus.

MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf

MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (20)

Similaire à MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf

Similaire à MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf (20)

Plus de Aichétou Djimé Gallédou

Plus de Aichétou Djimé Gallédou (7)

MEMOIRE-INTELLIGENCE-ARTIFICIELLE-CANCER-DU-SEIN.pdf