SlideShare une entreprise Scribd logo
1  sur  22
Télécharger pour lire hors ligne
Data Science
Bootcamp
Abdelilah Mejdoubi
Application des techniques de Machine
Learning à la géolocalisation indoor
Plan
Caractéristiques de la base UJIIndoorLoc
Data Preprocessing
Prédiction
Conclusion
Technologies, techniques et applications de localisation indoor
Applications de localisation indoor
Intelligence ambiante (objets à localiser les uns par rapport aux autres)
Surveillance de personnes à risques (prisonniers, enfants en bas âge, etc.)
Applications de guidage de personnes (milieu hospitalier, musée, automobile, etc.)
Dans les bâtiments (Gestions d’alarmes, obtention de statistiques sur des parcours)
Techniques de localisation indoor
Les dispositifs RFID, La localisation par identification de cellule : Cell ID, La localisation
par mesures temporelles (TOA/TDOA), etc
La localisation par mesure de puissance de signal (fingerprinting / RSSI)
– Information simple à mesurer par les interfaces radio
– Tous les équipements WiFi sont donc "localisables" sans modification
Exploitation de la technique du fingerprinting pour se localiser
– Besoin de créer une base de données
– Localisation : recherche dans cette BDD de celle qui est la plus proche de
la mesure instantanée
Inconvénients
– Besoin de constituer une carte d'empreintes des puissances par enregistrement
en plusieurs points de l'espace (calibrage)
– Carte "invalide" si l’environnement change
Caractéristique de la base UJIIndoorLoc
Couvre une surface de 108 703 m2 - 3 bâtiments de 4 ou 5 étages
L’intensité des signaux varie de -104 dBm (faible intensité) à 0 dbm (forte intensité).
La valeur 100 dBm est utilisé pour indiquer qu’il n’ y a pas de signal détecté
19737 échantillon d'apprentissage et 1111 échantillon de test/validation – 21048 au total
520 différents WAPs (Wireless Access Points)
Les données sont collectées par 18 utilisateurs avec 25 modèles d'appareils mobiles différents
Les coordonnées latitude, longitude, étage et l'ID du bâtiment sont fournis comme des
attributs à prédire.
Data Preprocessing
Aucune donnée manquante pour le training
et le test
Nombre d'enregistrements par bâtiment & étage
Seul le bâtiment 2 a le niveau 5
Répartition relativement uniforme sur tous les
étages des bâtiments 0 et 1
Nombres d’enregistrements plus élevé
au niveau pour le bâtiment 2
Data Preprocessing
Nombre d'enregistrements par Longitude, Latitude & bâtiment
Data Preprocessing
Réduction de dimensions
520 colonnes WAP: pour chaque enregistrement, tous les variables d’entrées sont
remplacées dans une seule colonne [MAXSIGNAL] par la puissance du signal la plus
élevée sur tous les WAP
Certain enregistrements n'ont pas de valeur du signal (pas de lecture RSSI)
Data Preprocessing
Analyse des enregistrements des signaux non détecté
La majorité des enregistrements NaN proviennent de l'utilisateur 8 : 59 signaux (77,63%)
Nombres d'enregistrements des signaux non détecté : 76 (0,38%)
Nombres d'enregistrements NaN dans la base VALIDATION : 0 (0%)
55 enregistrements NaN sont supprimer de la base d’apprentissage
Prédiction : bâtiment & Etage
Algorithme de classification
520 variables d’entrées (dont 55 variables sont exclus)
Variables cibles: bâtiments et étages
13 classes
Modèles utilisés
▪ Linear Discriminant Analysis
▪ Decision Tree
▪ Random Forest
▪ Neural Network
▪ XGBoost
Pour estimer les performances de chaque modèle, on a utilisé 5-fold cross validation
Prédiction : bâtiment & Etage
Algorithme de classification - Modélisation sans paramètres
XGBoost et Random Forest donnent une meilleure performance
Prédiction : bâtiment & Etage
Algorithme de classification - XGBoost (Modélisation avec paramètres)
Accuracy = 87,67 %
Prédiction : bâtiment & Etage
Algorithme de classification - XGBoost (RandomizedSearchCV) & Random Forest
Utilisation de l’algorithme PCA : 200 variables d’entrée
Best paramètres
XGBOOST
Comparaison
XGBOOST improvements Random Forest
Buildings 99.91 % 99.73 %
Floors 90.10 % 87.31 %
Prédiction : Latitude & Longitude
Algorithme de régression
Modèles utilisés ▪ Lasso Regression
▪ Ridge Regression
▪ ElasticNet Regression
▪ K-Nearest Neighbours
▪ Random Forest
▪ Gradient Boosting
▪ XGBoost
Pour estimer les performances de chaque modèle, on a utilisé 5-fold cross validation
520 variables d’entrées (dont 55 variables sont exclus)
Variables cibles : Latitude et Longitude
Prédiction : Latitude & Longitude
Algorithme de régression - Modélisation sans paramètres
La valeur du Mean Square Erreur est plus faible pour les modèles KNN et Random Forest
Prédiction : Latitude & Longitude
Algorithme de régression - K-Nearest Neighbours & Random Forest
K-Nearest Neighbours Random Forest
- Le modèle KNN est précis jusqu’à un rayon de 13,15 m
- Le modèle Random Forest est précis jusqu’à un rayon de 14,28 m
La distance entre la valeur actuel et la valeur prédite est calculé en utilisant le théorème de pythagore
En moyenne :
Prédiction : Latitude & Longitude
Algorithme de régression - K-Nearest Neighbours & Random Forest
K-Nearest Neighbours Random Forest
Algorithme de régression - K-Nearest Neighbours & Random Forest
KNN Random Forest
Prédiction : Latitude & Longitude
Algorithme de régression - K-Nearest Neighbours – Amélioration du modèle
Prédiction : Latitude & Longitude
Conclusion
Les modèles XGBoost, Random Forest et KNN donnent une meilleure performance
La prédiction de la position pour les bâtiments et plus élevée que celle de l’étage
Amélioration
Ajouter d'autres dimensions dans les modèles, par exemple examiner
l'effet du temps sur les prévisions
mejd.abdel@gmail.com
06 10 05 36 17
Questions ?

Contenu connexe

Similaire à Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1

Mesures vibratoires et acoustiques appliquées au contrôle qualité en production
Mesures vibratoires et acoustiques appliquées au contrôle qualité en productionMesures vibratoires et acoustiques appliquées au contrôle qualité en production
Mesures vibratoires et acoustiques appliquées au contrôle qualité en productionSAPHIR - Signal Physique & Instrumentation
 
Présentation solutions nemo (anite) 2014
Présentation solutions nemo (anite) 2014Présentation solutions nemo (anite) 2014
Présentation solutions nemo (anite) 2014Patrick Medenou
 
Entre le LiDAR, l'imagerie stéréoscopique et les MNA gratuits, comment s'y re...
Entre le LiDAR, l'imagerie stéréoscopique et les MNA gratuits, comment s'y re...Entre le LiDAR, l'imagerie stéréoscopique et les MNA gratuits, comment s'y re...
Entre le LiDAR, l'imagerie stéréoscopique et les MNA gratuits, comment s'y re...ACSG Section Montréal
 
Presentation des systemes georadar IDS STREAM
Presentation des systemes georadar IDS STREAMPresentation des systemes georadar IDS STREAM
Presentation des systemes georadar IDS STREAMABEM_France
 
Conception de Réseau WiFi avec AirMagnet Planner
Conception de Réseau WiFi avec AirMagnet PlannerConception de Réseau WiFi avec AirMagnet Planner
Conception de Réseau WiFi avec AirMagnet PlannerSyNAP Services
 
Introduction to NI, LabVIEW, ELVIS and Planet NI
Introduction to NI, LabVIEW, ELVIS and Planet NIIntroduction to NI, LabVIEW, ELVIS and Planet NI
Introduction to NI, LabVIEW, ELVIS and Planet NIslemoslideshare
 
SensLab Anr Stic2010
SensLab Anr Stic2010SensLab Anr Stic2010
SensLab Anr Stic2010Eric Fleury
 
391823580-Presentation4-1.pptx
391823580-Presentation4-1.pptx391823580-Presentation4-1.pptx
391823580-Presentation4-1.pptxRegisBayala
 
Comment le contexte rend l’IA plus fiable et plus efficace ? - Webinaire 11 f...
Comment le contexte rend l’IA plus fiable et plus efficace ? - Webinaire 11 f...Comment le contexte rend l’IA plus fiable et plus efficace ? - Webinaire 11 f...
Comment le contexte rend l’IA plus fiable et plus efficace ? - Webinaire 11 f...Neo4j
 
Conception antenne radio assistée par ordinateur
Conception antenne radio assistée par ordinateurConception antenne radio assistée par ordinateur
Conception antenne radio assistée par ordinateurPassion Radio Amateur
 
Infographie - EDL déploiement compteurs intelligents v2209
Infographie - EDL déploiement compteurs intelligents v2209Infographie - EDL déploiement compteurs intelligents v2209
Infographie - EDL déploiement compteurs intelligents v2209Philo Prt
 
Projet ima4 descamd_michel (1)
Projet ima4 descamd_michel (1)Projet ima4 descamd_michel (1)
Projet ima4 descamd_michel (1)bourouissi
 
L'IoT: Comment passer à l'echelle
L'IoT: Comment passer à l'echelleL'IoT: Comment passer à l'echelle
L'IoT: Comment passer à l'echelleFrancois Hamon
 
Vision et poc EDFsur les enjeux big data
Vision et poc EDFsur les enjeux big dataVision et poc EDFsur les enjeux big data
Vision et poc EDFsur les enjeux big dataBruno Patin
 
Sa data analyst
Sa   data analystSa   data analyst
Sa data analystNcib J
 
SESEN_Atilgan_fr_20150511
SESEN_Atilgan_fr_20150511SESEN_Atilgan_fr_20150511
SESEN_Atilgan_fr_20150511Atilgan Sesen
 
Gaëtan CURT : Photogrammétrie rapprochée
Gaëtan CURT : Photogrammétrie rapprochéeGaëtan CURT : Photogrammétrie rapprochée
Gaëtan CURT : Photogrammétrie rapprochéekmichel69
 

Similaire à Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1 (20)

Mesures vibratoires et acoustiques appliquées au contrôle qualité en production
Mesures vibratoires et acoustiques appliquées au contrôle qualité en productionMesures vibratoires et acoustiques appliquées au contrôle qualité en production
Mesures vibratoires et acoustiques appliquées au contrôle qualité en production
 
Présentation solutions nemo (anite) 2014
Présentation solutions nemo (anite) 2014Présentation solutions nemo (anite) 2014
Présentation solutions nemo (anite) 2014
 
Entre le LiDAR, l'imagerie stéréoscopique et les MNA gratuits, comment s'y re...
Entre le LiDAR, l'imagerie stéréoscopique et les MNA gratuits, comment s'y re...Entre le LiDAR, l'imagerie stéréoscopique et les MNA gratuits, comment s'y re...
Entre le LiDAR, l'imagerie stéréoscopique et les MNA gratuits, comment s'y re...
 
Amc5 emea french
Amc5 emea frenchAmc5 emea french
Amc5 emea french
 
Presentation des systemes georadar IDS STREAM
Presentation des systemes georadar IDS STREAMPresentation des systemes georadar IDS STREAM
Presentation des systemes georadar IDS STREAM
 
Conception de Réseau WiFi avec AirMagnet Planner
Conception de Réseau WiFi avec AirMagnet PlannerConception de Réseau WiFi avec AirMagnet Planner
Conception de Réseau WiFi avec AirMagnet Planner
 
Introduction to NI, LabVIEW, ELVIS and Planet NI
Introduction to NI, LabVIEW, ELVIS and Planet NIIntroduction to NI, LabVIEW, ELVIS and Planet NI
Introduction to NI, LabVIEW, ELVIS and Planet NI
 
Cv malgorn gaël
Cv malgorn gaëlCv malgorn gaël
Cv malgorn gaël
 
SensLab Anr Stic2010
SensLab Anr Stic2010SensLab Anr Stic2010
SensLab Anr Stic2010
 
391823580-Presentation4-1.pptx
391823580-Presentation4-1.pptx391823580-Presentation4-1.pptx
391823580-Presentation4-1.pptx
 
Comment le contexte rend l’IA plus fiable et plus efficace ? - Webinaire 11 f...
Comment le contexte rend l’IA plus fiable et plus efficace ? - Webinaire 11 f...Comment le contexte rend l’IA plus fiable et plus efficace ? - Webinaire 11 f...
Comment le contexte rend l’IA plus fiable et plus efficace ? - Webinaire 11 f...
 
Conception antenne radio assistée par ordinateur
Conception antenne radio assistée par ordinateurConception antenne radio assistée par ordinateur
Conception antenne radio assistée par ordinateur
 
Hug janvier 2016 -EDF
Hug   janvier 2016 -EDFHug   janvier 2016 -EDF
Hug janvier 2016 -EDF
 
Infographie - EDL déploiement compteurs intelligents v2209
Infographie - EDL déploiement compteurs intelligents v2209Infographie - EDL déploiement compteurs intelligents v2209
Infographie - EDL déploiement compteurs intelligents v2209
 
Projet ima4 descamd_michel (1)
Projet ima4 descamd_michel (1)Projet ima4 descamd_michel (1)
Projet ima4 descamd_michel (1)
 
L'IoT: Comment passer à l'echelle
L'IoT: Comment passer à l'echelleL'IoT: Comment passer à l'echelle
L'IoT: Comment passer à l'echelle
 
Vision et poc EDFsur les enjeux big data
Vision et poc EDFsur les enjeux big dataVision et poc EDFsur les enjeux big data
Vision et poc EDFsur les enjeux big data
 
Sa data analyst
Sa   data analystSa   data analyst
Sa data analyst
 
SESEN_Atilgan_fr_20150511
SESEN_Atilgan_fr_20150511SESEN_Atilgan_fr_20150511
SESEN_Atilgan_fr_20150511
 
Gaëtan CURT : Photogrammétrie rapprochée
Gaëtan CURT : Photogrammétrie rapprochéeGaëtan CURT : Photogrammétrie rapprochée
Gaëtan CURT : Photogrammétrie rapprochée
 

Plus de Jedha Bootcamp

DataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdfDataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdfJedha Bootcamp
 
L'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x KardinalL'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x KardinalJedha Bootcamp
 
Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5Jedha Bootcamp
 
Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1Jedha Bootcamp
 
Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackConstruction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackJedha Bootcamp
 
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Jedha Bootcamp
 
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzEstimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzJedha Bootcamp
 
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliTrouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliJedha Bootcamp
 
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliOptimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliJedha Bootcamp
 
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotReconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotJedha Bootcamp
 
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossEstimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossJedha Bootcamp
 
Workshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisWorkshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisJedha Bootcamp
 
Les applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonLes applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonJedha Bootcamp
 
Optimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceOptimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceJedha Bootcamp
 
Connaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiConnaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiJedha Bootcamp
 
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...Jedha Bootcamp
 
Automatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoAutomatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoJedha Bootcamp
 
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Jedha Bootcamp
 
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra PartnersJedha Bootcamp
 

Plus de Jedha Bootcamp (20)

DataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdfDataScientist Job : Between Myths and Reality.pdf
DataScientist Job : Between Myths and Reality.pdf
 
L'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x KardinalL'IA face à l'épreuve du covid-19 - Jedha x Kardinal
L'IA face à l'épreuve du covid-19 - Jedha x Kardinal
 
Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5Générer une image à partir d'un texte - Fullstack Paris #5
Générer une image à partir d'un texte - Fullstack Paris #5
 
Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1Recommander des films - Andreea - Fullstack Lyon #1
Recommander des films - Andreea - Fullstack Lyon #1
 
Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni FullstackConstruction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
Construction d'une voiture autonome - Adrien Dodinet, alumni Fullstack
 
Slide portes ouvertes
Slide portes ouvertesSlide portes ouvertes
Slide portes ouvertes
 
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
Prédire le comportement consommateurs grâce à la Data Science - Jimmy Brumant...
 
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De ForzanzEstimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
Estimer les prix de vente sur une marketplace - Fabien Herry & Marc De Forzanz
 
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed ZebliTrouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
Trouver des offres d'emploi grâce au traitement de texte - Mohamed Zebli
 
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed ZebliOptimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
Optimiser sa stratégie de paris sportifs : le cas du football - Mohamed Zebli
 
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle GuyotReconnaître du mobilier design sur une photographie - Emmanuelle Guyot
Reconnaître du mobilier design sur une photographie - Emmanuelle Guyot
 
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie RossEstimer le prix de bijou lors d'une vente aux enchères - Katie Ross
Estimer le prix de bijou lors d'une vente aux enchères - Katie Ross
 
Workshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha ParisWorkshop Data Visualisation - Jedha Paris
Workshop Data Visualisation - Jedha Paris
 
Les applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha LyonLes applications du Deep Learning - Jedha Lyon
Les applications du Deep Learning - Jedha Lyon
 
Optimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data ScienceOptimiser ses publicités grâce à la Data Science
Optimiser ses publicités grâce à la Data Science
 
Connaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiConnaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessi
 
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
ONU : baisser la mortalité infantile en optimisant les interventions - Antoin...
 
Automatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéoAutomatiser la classification d'un jeu vidéo
Automatiser la classification d'un jeu vidéo
 
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
Reconnaître automatiquement les positions de Yoga - Marine Gubler, programme ...
 
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
2019 : les news du RGPD - Méghane Duval, Juriste-conseil @ KaOra Partners
 

Localiser des objets en intérieur - Abdelilah - Fullstack Lyon #1

  • 2. Application des techniques de Machine Learning à la géolocalisation indoor
  • 3. Plan Caractéristiques de la base UJIIndoorLoc Data Preprocessing Prédiction Conclusion Technologies, techniques et applications de localisation indoor
  • 4. Applications de localisation indoor Intelligence ambiante (objets à localiser les uns par rapport aux autres) Surveillance de personnes à risques (prisonniers, enfants en bas âge, etc.) Applications de guidage de personnes (milieu hospitalier, musée, automobile, etc.) Dans les bâtiments (Gestions d’alarmes, obtention de statistiques sur des parcours)
  • 5. Techniques de localisation indoor Les dispositifs RFID, La localisation par identification de cellule : Cell ID, La localisation par mesures temporelles (TOA/TDOA), etc La localisation par mesure de puissance de signal (fingerprinting / RSSI) – Information simple à mesurer par les interfaces radio – Tous les équipements WiFi sont donc "localisables" sans modification Exploitation de la technique du fingerprinting pour se localiser – Besoin de créer une base de données – Localisation : recherche dans cette BDD de celle qui est la plus proche de la mesure instantanée Inconvénients – Besoin de constituer une carte d'empreintes des puissances par enregistrement en plusieurs points de l'espace (calibrage) – Carte "invalide" si l’environnement change
  • 6. Caractéristique de la base UJIIndoorLoc Couvre une surface de 108 703 m2 - 3 bâtiments de 4 ou 5 étages L’intensité des signaux varie de -104 dBm (faible intensité) à 0 dbm (forte intensité). La valeur 100 dBm est utilisé pour indiquer qu’il n’ y a pas de signal détecté 19737 échantillon d'apprentissage et 1111 échantillon de test/validation – 21048 au total 520 différents WAPs (Wireless Access Points) Les données sont collectées par 18 utilisateurs avec 25 modèles d'appareils mobiles différents Les coordonnées latitude, longitude, étage et l'ID du bâtiment sont fournis comme des attributs à prédire.
  • 7. Data Preprocessing Aucune donnée manquante pour le training et le test Nombre d'enregistrements par bâtiment & étage Seul le bâtiment 2 a le niveau 5 Répartition relativement uniforme sur tous les étages des bâtiments 0 et 1 Nombres d’enregistrements plus élevé au niveau pour le bâtiment 2
  • 8. Data Preprocessing Nombre d'enregistrements par Longitude, Latitude & bâtiment
  • 9. Data Preprocessing Réduction de dimensions 520 colonnes WAP: pour chaque enregistrement, tous les variables d’entrées sont remplacées dans une seule colonne [MAXSIGNAL] par la puissance du signal la plus élevée sur tous les WAP Certain enregistrements n'ont pas de valeur du signal (pas de lecture RSSI)
  • 10. Data Preprocessing Analyse des enregistrements des signaux non détecté La majorité des enregistrements NaN proviennent de l'utilisateur 8 : 59 signaux (77,63%) Nombres d'enregistrements des signaux non détecté : 76 (0,38%) Nombres d'enregistrements NaN dans la base VALIDATION : 0 (0%) 55 enregistrements NaN sont supprimer de la base d’apprentissage
  • 11. Prédiction : bâtiment & Etage Algorithme de classification 520 variables d’entrées (dont 55 variables sont exclus) Variables cibles: bâtiments et étages 13 classes Modèles utilisés ▪ Linear Discriminant Analysis ▪ Decision Tree ▪ Random Forest ▪ Neural Network ▪ XGBoost Pour estimer les performances de chaque modèle, on a utilisé 5-fold cross validation
  • 12. Prédiction : bâtiment & Etage Algorithme de classification - Modélisation sans paramètres XGBoost et Random Forest donnent une meilleure performance
  • 13. Prédiction : bâtiment & Etage Algorithme de classification - XGBoost (Modélisation avec paramètres) Accuracy = 87,67 %
  • 14. Prédiction : bâtiment & Etage Algorithme de classification - XGBoost (RandomizedSearchCV) & Random Forest Utilisation de l’algorithme PCA : 200 variables d’entrée Best paramètres XGBOOST Comparaison XGBOOST improvements Random Forest Buildings 99.91 % 99.73 % Floors 90.10 % 87.31 %
  • 15. Prédiction : Latitude & Longitude Algorithme de régression Modèles utilisés ▪ Lasso Regression ▪ Ridge Regression ▪ ElasticNet Regression ▪ K-Nearest Neighbours ▪ Random Forest ▪ Gradient Boosting ▪ XGBoost Pour estimer les performances de chaque modèle, on a utilisé 5-fold cross validation 520 variables d’entrées (dont 55 variables sont exclus) Variables cibles : Latitude et Longitude
  • 16. Prédiction : Latitude & Longitude Algorithme de régression - Modélisation sans paramètres La valeur du Mean Square Erreur est plus faible pour les modèles KNN et Random Forest
  • 17. Prédiction : Latitude & Longitude Algorithme de régression - K-Nearest Neighbours & Random Forest K-Nearest Neighbours Random Forest - Le modèle KNN est précis jusqu’à un rayon de 13,15 m - Le modèle Random Forest est précis jusqu’à un rayon de 14,28 m La distance entre la valeur actuel et la valeur prédite est calculé en utilisant le théorème de pythagore En moyenne :
  • 18. Prédiction : Latitude & Longitude Algorithme de régression - K-Nearest Neighbours & Random Forest K-Nearest Neighbours Random Forest
  • 19. Algorithme de régression - K-Nearest Neighbours & Random Forest KNN Random Forest Prédiction : Latitude & Longitude
  • 20. Algorithme de régression - K-Nearest Neighbours – Amélioration du modèle Prédiction : Latitude & Longitude
  • 21. Conclusion Les modèles XGBoost, Random Forest et KNN donnent une meilleure performance La prédiction de la position pour les bâtiments et plus élevée que celle de l’étage Amélioration Ajouter d'autres dimensions dans les modèles, par exemple examiner l'effet du temps sur les prévisions
  • 22. mejd.abdel@gmail.com 06 10 05 36 17 Questions ?