Equipe‐projet TATOO Extrac3on de connaissances dans les bases de données : mo3fs séquen3els et ontologies Responsable : Pa...
    Extracon de connaissances dans de grandes bases de données                                                           ...
Fouille de données / Extracon de Connaissance     Fayyad (1996) : the non-trivial process of identifying     valid, poten...
Thèmes scienfiques     Motifs séquentiels (Contraintes temporelles)    Fouille de données complexes             Textes (...
Exemple : Les mofs séquenels   Recherche de corrélaons au sein de gros volumes de    données historisées                 ...
Des données disponibles de plus en plus rapidement   Comment maintenir la connaissance extraite ?        Eviter de recom...
Fouille de données environnementales : CEMAGREF‐LIRMM (M. Teisseire) Quelques exemples …      Suivi de l’évoluon de phéno...
Conclusion    Défis de la fouille de données :          Volume, rapidité et complexité/hétérogénéité des données         ...
Prochain SlideShare
Chargement dans…5
×

Equipe TATOO : Extraction de connaissances dans les bases de données : motifs séquentiels et ontologies

1 133 vues

Publié le

Anne Laurent (LIRMM) présente les compétences de l'équipe TATOO en extraction de connaissances dans les bases de données.

Publié dans : Technologie
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
1 133
Sur SlideShare
0
Issues des intégrations
0
Intégrations
10
Actions
Partages
0
Téléchargements
12
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Equipe TATOO : Extraction de connaissances dans les bases de données : motifs séquentiels et ontologies

  1. 1. Equipe‐projet TATOO Extrac3on de connaissances dans les bases de données : mo3fs séquen3els et ontologies Responsable : Pascal Poncelet 
  2. 2.   Extracon de connaissances dans de grandes bases de données  EXPERTISE DONNEES Représentation Traitement Visualisation PROBLEME Fouille de données CONNAISSANCE DECISION  Mots clés : extracon de connaissances, fouille de données, mofs séquenels,  entrepôts de données, logique floue, ontologie, annotaon automaque  
  3. 3. Fouille de données / Extracon de Connaissance   Fayyad (1996) : the non-trivial process of identifying valid, potentially useful and ultimately understandable patterns in data  Nombreuses applications : marketing, santé, etc.  Algorithmes supervisés/non supervisés  Algorithmes prédictifs/descriptifs  Problématiques associées : nettoyage des données, présentation des résultats, évaluation des méthodes, …
  4. 4. Thèmes scienfiques   Motifs séquentiels (Contraintes temporelles)  Fouille de données complexes   Textes (Text Mining)   Arborescentes (Schema - Web Structure Mining)   Multidimensionnelles (Cube - Web Usage Mining)   Flots (Stream Mining)  Fouille de données approximative
  5. 5. Exemple : Les mofs séquenels   Recherche de corrélaons au sein de gros volumes de    données historisées   ⟨(Lecteur DVD) (Ecran LCD, DVD1, DVD2) (Magnétoscope)⟩ Prise en compte d’informations spatio-temporelles Données mul‐dimensionnelles 
  6. 6. Des données disponibles de plus en plus rapidement   Comment maintenir la connaissance extraite ?    Eviter de recommencer « from scratch »   Comment faire face à des données disponibles sous la  forme d’un flot ?    Impossible de stocker les données (capteurs, clickstream,  RFID, news, …) !    Comment extraire de la connaissance ?    Comment résumer ces données ? 
  7. 7. Fouille de données environnementales : CEMAGREF‐LIRMM (M. Teisseire) Quelques exemples …     Suivi de l’évoluon de phénomènes via des dépêches de presses  (exemple H1N1  traité dans l’équipe)   Evoluon de la Dengue (Nevantropic, CEMAGREF)  A parr d’une base de données de l’INVS, idenficaon des quarers à risque et des  périodes caractérisques précédant une propagaon de l’épidémie  Données Teru‐Lucas     Connaître les différentes catégories d’occupaon du sol et d’usage de l’ensemble  du territoire (agricole, naturel et urbanisé) 
  8. 8. Conclusion   Défis de la fouille de données :    Volume, rapidité et complexité/hétérogénéité des données    Temps réel    Présentaon de la connaissance extraite    Quelle est la qualité des données collectées ?    Imprécisions/incertudes    Comment insérer d’autres connaissances ?    Données externes (e.g. météo)    Connaissance experte   

×