une petit analyse sur ce que la data science peut apporter comme solutions en période d'épidémie ,avec coronavirus 19 comme exemple.
la diapo inclut aussi des liens sur les projets data science d'actualité a ce sujet.
Histoire de se rappeler un premier weekend de confinement :)
Comment la data science peut aider pendant une épidémie -cas d'étude covid-19
1. COMMENT LA DATA SCIENCE
PEUT AIDER PENDANT UNE
ÉPIDÉMIE
ÉTUDE DE CAS : COVID-19
AL MAHDI MARHOU (DATA SCIENTIST)
22/03/2020
VERSION 1
2. IL EXISTE PLUSIEURS PROBLÉMATIQUES OU LA
DATA SCIENCE PEUT JOUER UN RÔLE IMPORTANT :
• 1-Rapidement identifier les personnes déjà infectées,
• 2-Identifier les personnes les plus vulnérables pour mieux les protéger.
• 3-Cibler les personnes à diagnostiquer , pour un maximum d’impact.
• 4-Identifier les interventions prioritaires pour une prise de décision optimale.
• 5-aider le corps médical dans la recherche et datamining , pour explorer et analyser le flux de données et essayer de trouver la
meilleure façons pour riposter contre le COVID-19.
• 6-Monitorer la progression de l’épidémie et détecter tout changement de comportement ou pattern particulier.
• 7-Informer la population , éviter les rumeurs et la panique.(la meilleure réponse c’est d’informer d’une façons ciblée et
personnalisée.la meilleur façons pour combattre les rumeurs c’est informer rapidement et ciblé personnaliser la
communication
• 8-Aider à informatiser les services publics ou de base pour limiter les déplacements inutiles des habitants.
• 9-aider à améliorer les méthode de tests.
3. 1-RAPIDEMENT IDENTIFIER LES PERSONNES DÉJÀ
INFECTÉES.
• Développement de system de géolocalisation comparable a « google maps timeline »,
• Utiliser l’historique des déplacements d’une personne pour définir le risque d’infection , si deux
personnes se situent a moins de 1m pour une durée de plus de 2min le risque de contamination
devient considérable.
• Utilisation des techniques tels que la théorie des graphs ou le « Social network analysis » pour
définir les personnes à risque et anticiper un intervention.
• Ressources:
• https://takeout.google.com/settings/takeout/custom/location_history?pli=1 (extraire l’historique de
google maps)
• https://github.com/fooock/phone-tracker
• https://github.com/nickfox/GpsTracker
4. 2-IDENTIFIER LES PERSONNES LES PLUS VULNÉRABLES
POUR MIEUX LES PROTÉGER.
• Une autre approche intéressante est d’utiliser ce qu’on appelle « l’index de vulnérabilité » pour
classifier les personnes qui auront besoin d’un soin intensive .
• Pour les protéger.
• Gagner du temps pour préparer l’intervention.
• Calculer la chance de survie d’un patient dans le cas extrême ou le corps médical dois choisir qui sauver
.
• L’ idée est de développer un model pour calculer cet index avec le plus de précision.
• Ressources:
• https://aws.amazon.com/marketplace/pp/ClosedLoopai-COVID-19-Vulnerability-Index/prodview-
o4cte75mycicg
• https://closedloop.ai/cv19index/
• https://github.com/closedloop-ai/cv19index
5. 9-AIDER POUR LES TESTS.
• Surtout pour les pays avec peu de moyen pour faire des tests à grande échelle.
• Il existe quelques idées ,même si déconseillées par l’OMS ,telles que utiliser les rayon X , puisque les machines de radiologie
sont disponible ,mais représente une complexité pour les décontaminer après chaque utilisation, cependant, elles peuvent être
utilisées pour les pré – screening pour ne pas saturer les laboratoires avec des tests négatifs.
• Développer des model d’imagerie pour classifier les malades entre ceux atteins du coronavirus et ceux moins probable de
l’être accélérer les tests.
• Ressources :
• https://towardsdatascience.com/using-deep-learning-to-detect-ncov-19-from-x-ray-images-1a89701d1acd
• https://github.com/ajsanjoaquin/COVID-19-Scanner
• https://github.com/ieee8023/covid-chestxray-dataset
• https://quibim.com/tag/chest-x-ray/
• https://www.pyimagesearch.com/2020/03/16/detecting-covid-19-in-x-ray-images-with-keras-tensorflow-and-deep-learning/
• https://pubs.rsna.org/doi/10.1148/radiol.2020200274
6. AIDER LE CORPS MÉDICAL DANS LA DATAMINING,
L’EXPLORATION DES RECHERCHES ET EXPÉRIENCE
PUBLIÉES.
• Depuis le début de cette crise , tous les professionnels du monde travaillent d’arrache pied pour trouver une approche
optimale et une solution ou remède , ce qui met une pression considérable à ces derniers pour être à jour . Vu les volumes
colossaux de données qui sont générées chaque jour.
• La data science peut aider les professionnels à trouver les informations qu’ils cherchent , et a mieux analyser pour mieux agir.
• Que ca soit on développement des algorithmes de recherche plus performant , ou pour effectuer des analyses de données
pour répondre à des questions spécifiques.
• Pour répondre à toutes les questions des décideurs et leur présenter un rapport avec des statistiques réelles (ex: en utilisant
Jupiter notebook)
• Ressources :
• https://www.kaggle.com/covid19
• https://github.com/gsarti/covid-papers-browser
• http://gabgoh.github.io/COVID/index.html
7. 7-INFORMER LA POPULATION ,POUR ÉVITER LES RUMEURS ET LA PANIQUE.LA MEILLEURE
RÉPONSE EST D’INFORMER D’UNE FAÇONS CIBLÉE ET PERSONNALISÉE.
• Les fake news est un fléau qui peut faire des dégâts réels dans ces conditions incertaines.
• Les data-scientistes peuvent aider sur ce point en développant des algorithmes similaires à ceux
utiliser pour les Spams pour traquer et éliminer les fakes news.
• Cibler plus efficacement les populations susceptibles d’être concernées par cette information à
la manière du ciblage utilisé pour les campagnes publicitaires , géolocalisation, segmentation….
Utiliser le message adéquat pour chaque catégorie
• Ressources :
• https://www.kaggle.com/c/fake-news/data
• https://www.kaggle.com/c/criteo-display-ad-challenge
• https://www.kaggle.com/connorkendrick/classification-for-advertising-campaign-targeting
8. CONCLUSION :
• Le combinaison de plusieurs solutions et leur intégration peut créer une synergie aidant à mieux
optimiser la réponse de traitement de l’épidémie qui est avant tout une course contre la montre et
une guerre d’information .
• Par exemple l’utilisation du système de tracking avec le pré-screening avec l’index de vulnérabilité. Pour
rapidement cerner les porteurs potentiels et les personnes les plus vulnérables.
• Ou l’utilisation de la data science pour le datamining des meilleures pratiques pour combattre la propagation
avec le système de détection de fake news pour éliminer les information erronées ; et le system de ciblage
pour cibler les populations les plus concernés ou qui on été exposées à ces fake news.
• Le management de crise en utilisant la big data est la réponse adéquate pour cerner une épidémie
rapidement avec le minimum de contraintes possible pour l’activité économique et le déplacement des
personnes.
• Ressources :
• https://jhumanitarianaction.springeropen.com/track/pdf/10.1186/s41018-016-0013-9