Introduction auDataminingConcepts et techniquesBOUSSAIDI AbdellahCHAÏB IsmaïlESI, 06/04/2009
?????connaissancesMontagne de donnéesProblème?
Datamining
Quoi         Comment 	     Jusqu’ou?
Quoi?Le datamining est un processus de découvertede connaissancesconnaissancesDatamining Bases de données et Datawarehouses
Pourquoi?DescriptionPrédiction
Exemples d’applicationSegmentation des clients Déterminer le panier de la ménagère Détection de Fraude
Champs d’application
AvantagesRenforcer la positioncompétitive de l’entreprise Identifier les facteurs qui déterminent le comportement du client ;Transformer des masses de données en information utileMeilleure prise de décision Identifier les investissements les plus profitables et les moins couteux.
QuoiCommentJusqu’ou?
Le datamining est un processus itératif
Application du processus de datamining :Les Télécoms
Formaliser le problèmeProblématique: Segmentation des clients
 Taux de turn-overCollecte de données Informations clients     (nom, prénom,         âge, profession..etc.); Durée d’appel par client;
 Heures d’appels;
 Appels non aboutis;
 …etc.Prétraitement des données Atténuer le bruit Enlever les informations non pertinentes Sélectionner les données utilesMieux vaut tout prendre ! ACP…etc.16Estimer le modèleSélectionner le modèle adéquatSVMrégressionLogiqueFloueMéthodesStatistiqueRéseauxBayésiensMetaheuristiqueArbresDe décisionRéseaux De NeuronesGoogle Confidential
17Estimer le modèle Implémenter la technique approprié SVMValidationLogiqueFloueVérificationRéseauxBayésiensRéechanRéseaux De NeuronesMéthodesD’apprentissageGoogle Confidential
18Estimer le modèleEstimationDe l’erreurlogicielImplémentationTechniquesDe dataminingGoogle Confidential
19Interpréter le modèle et tirer les conclusionsRésultatsGoogle Confidential
Interpréter le modèle et tirer les conclusions
Quoi CommentJusqu’ou?Le textmining
Le TextMiningTextMiningProcess
Pourquoi?80%de l’information enregistrée, l’est sous forme textuelle
Quoi CommentJusqu’ou?
Logiciels de dataminingPoids lourdsSASSPSS ClementineWeka (Open-source)Tendance : datamining dans la base de donnéesOracle Darwin SuiteSQL Server Analysis Services
Limites du dataminingEffort considérable de développement.Etat inapproprié des données.
PerspectivesAnalyse de plus de données dans un minimum de tempsExploration plus approfondie des donnéesDatamining pour les PMEs.Datamining « domestique »
ConclusionDatamining

Introduction au datamining, concepts et techniques