Classical computer science as transaction and management tools were useful for a long time to save time and money in corporate data processes and procedures. For more than one decade a new challenge has arrived due to an increasing need to aggregate information and report analytic details in little time in order to be able to take strategic decisions when an opportunity is momentarily available...
Business Intelligence : Offres du marché et benchmarkingSamia NACIRI
Editeurs du marché BI
Critères de comparaison des éditeurs BI
Comment choisir le meilleur outil Business Intelligence ?
http://datadictos.site/_media/pdf/BI__tools%20V3.pdf?utm_source=BI_bench_c&utm_medium=social&utm_campaign=init
pour enrichir votre connaissance sur la BI : http://datadictos.site/
Classical computer science as transaction and management tools were useful for a long time to save time and money in corporate data processes and procedures. For more than one decade a new challenge has arrived due to an increasing need to aggregate information and report analytic details in little time in order to be able to take strategic decisions when an opportunity is momentarily available...
Business Intelligence : Offres du marché et benchmarkingSamia NACIRI
Editeurs du marché BI
Critères de comparaison des éditeurs BI
Comment choisir le meilleur outil Business Intelligence ?
http://datadictos.site/_media/pdf/BI__tools%20V3.pdf?utm_source=BI_bench_c&utm_medium=social&utm_campaign=init
pour enrichir votre connaissance sur la BI : http://datadictos.site/
Les entreprises d’aujourd’hui doivent de plus en plus composer avec l’infobésité.
C'est pourquoi elles ont besoin d’une façon efficace d’analyser leurs données afin de prendre de meilleures décisions d’affaires.
Les bases de données standard ne peuvent pas toujours répondre à ces questions parce que cela nécessite de croiser de multiples sources d’informations ensemble.
C’est ici que le processus ETL (Extract – Transform – Load) entre en jeu. L’ETL est un programme qui accède à de multiples sources de données disparates, en fait l’extraction, les manipule et les intègre dans un référentiel commun – l’entrepôt de données ou data warehouse.
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...Jean-Pierre Riehl
Le contrôle de gestion de Edenred, leader des services prépayés aux entreprises, a mis en œuvre des tableaux de bord de pilotage pour mieux suivre les chiffres clés et aider les différentes fonctions de la société.
Au travers d’un retour d’expérience, découvrez comment Power BI peut être un outil puissant de reporting, d’analyse et de pilotage de la performance. L’objectif de cette session est de revenir sur les points clés de la mise en œuvre, de la réalisation des indicateurs, à la gouvernance de la solution en passant par la coopération avec les services informatiques.
Réutilisation de l’existant décisionnel, solution hybride entre le cloud et le système d’information d’Edenred, DataViz adaptée aux utilisateurs et aux usages, indicateurs simples et calculs complexes, explorons toutes les facettes de ce projet métier.
Session faisant partie de la conférence MS Experiences 2017
Co-animée avec Cédric François
https://experiences17.microsoft.fr/attendee/5f26809a-3c58-e711-80c2-000d3a21081a
Competitic simplifiez le pilotage de votre entreprise avec la business inte...COMPETITIC
Retrouvez dans ce support une présentation du concept de business intelligence, ses usages, les solutions et les bonnes pratiques !
Ce document a été réalisé avec la contribution de Keyrus, société de conseil spécialisé en business intelligence.
La deuxième partie sur le cours Business Intelligence et Data warehouse.
Si vous avez des questions, des remarques ou des propositions afin d’améliorer le contenu et la qualité de ce cours, n' hésitez pas à me contacter via mon email:
pr.azizdarouichi@gmail.com.
Bonne lecture.
A. DAROUICHI
Base de données graphe, Noe4j concepts et mise en oeuvreMICHRAFY MUSTAFA
Cette étude vise à présenter les concepts clés d’une base de données orientée graphe. La modélisation et la mise en œuvre des cas d’utilisation seront réalisées avec la base de données NEO4J, version 3.1.
Les entreprises d’aujourd’hui doivent de plus en plus composer avec l’infobésité.
C'est pourquoi elles ont besoin d’une façon efficace d’analyser leurs données afin de prendre de meilleures décisions d’affaires.
Les bases de données standard ne peuvent pas toujours répondre à ces questions parce que cela nécessite de croiser de multiples sources d’informations ensemble.
C’est ici que le processus ETL (Extract – Transform – Load) entre en jeu. L’ETL est un programme qui accède à de multiples sources de données disparates, en fait l’extraction, les manipule et les intègre dans un référentiel commun – l’entrepôt de données ou data warehouse.
MS Experiences 17 - Comment le contrôle de gestion améliore le pilotage de l’...Jean-Pierre Riehl
Le contrôle de gestion de Edenred, leader des services prépayés aux entreprises, a mis en œuvre des tableaux de bord de pilotage pour mieux suivre les chiffres clés et aider les différentes fonctions de la société.
Au travers d’un retour d’expérience, découvrez comment Power BI peut être un outil puissant de reporting, d’analyse et de pilotage de la performance. L’objectif de cette session est de revenir sur les points clés de la mise en œuvre, de la réalisation des indicateurs, à la gouvernance de la solution en passant par la coopération avec les services informatiques.
Réutilisation de l’existant décisionnel, solution hybride entre le cloud et le système d’information d’Edenred, DataViz adaptée aux utilisateurs et aux usages, indicateurs simples et calculs complexes, explorons toutes les facettes de ce projet métier.
Session faisant partie de la conférence MS Experiences 2017
Co-animée avec Cédric François
https://experiences17.microsoft.fr/attendee/5f26809a-3c58-e711-80c2-000d3a21081a
Competitic simplifiez le pilotage de votre entreprise avec la business inte...COMPETITIC
Retrouvez dans ce support une présentation du concept de business intelligence, ses usages, les solutions et les bonnes pratiques !
Ce document a été réalisé avec la contribution de Keyrus, société de conseil spécialisé en business intelligence.
La deuxième partie sur le cours Business Intelligence et Data warehouse.
Si vous avez des questions, des remarques ou des propositions afin d’améliorer le contenu et la qualité de ce cours, n' hésitez pas à me contacter via mon email:
pr.azizdarouichi@gmail.com.
Bonne lecture.
A. DAROUICHI
Base de données graphe, Noe4j concepts et mise en oeuvreMICHRAFY MUSTAFA
Cette étude vise à présenter les concepts clés d’une base de données orientée graphe. La modélisation et la mise en œuvre des cas d’utilisation seront réalisées avec la base de données NEO4J, version 3.1.
Apache SPARK ML : principes, concepts et mise en œuvre MICHRAFY MUSTAFA
Cette étude vise à présenter les concepts et les étapes pour la mise en œuvre d’une méthode d’apprentissage dans le cadre de Spark ML (API de méthodes d'apprentissage en SPARK) :
1. Spark ML : motivations
2. Transformateurs et estimateurs
3. Concepts de Pipeline
4. Évaluation d’une méthode d’apprentissage
5. Validation croisée et sélection des variables
6. Mise en œuvre des concepts sous Spark ML
DataDrill EXPRESS: Les équations dans DataDrill Olivier Pinette
Pour construire ses indicateurs, l’utilisateur de DataDrill EXPRESS a souvent besoin d’utiliser des équations pour valoriser certaines séries. Régulièrement, nous recevons des questions à ce sujet.
Dans ce document, nous avons voulu détailler les principales équations disponibles dans DataDrill EXPRESS (version 4.1), mais aussi les astuces et bonnes pratiques.
https://www.lecfomasque.com Le CFO masqué vous explique les différences entre Excel, Power Query, Power Pivot et Power BI et vous indique quelles sont les nouvelles compétences requises pour les usagers d'Excel qui souhaitent maîtriser Power BI.
MLlib est une librairie de machine Learning qui contient la plus part des algorithmes d’apprentissage classiques (SVMs, naive Bayes, decision tree,régression linéaire, logistic regression,k-means....)
Le Web sémantique est-il un n-ième standard de représentation des données ou une nouvelle façon d’aborder la recherche d’information ?
L'utilisation du terme « Sémantique » a souvent été porteur de confusions donnant à penser que le Web sémantique visait la compréhension du langage naturel par les machines. Même si les objectifs réels du Web sémantique semblent en réalité éloignées des techniques du traitement automatique de la langue, les technologies du Web sémantique n'en restent pas moins intéressantes pour les solutions d'accès et de recherche d'information. En effet, celles-ci sont déployée dans des contextes de plus en plus complexes mêlant données structurées et données non structurées et, dans ce cadre, les technologies du Web sémantique permettent de résoudre de nombreux problèmes de par le cadre d'interopérabilité et l'écosystème de standards et d'outils qu'elles offrent.
Impliqués depuis plusieurs années dans le domaine, nous montrerons comment les technologies du Web sémantique aide les équipes Antidot à mieux gérer, traiter et valoriser les données de leurs clients. Dans cette présentation, nous parcourrons une palette assez large de manipulations des objets sémantiques pratiquées couramment dans nos réalisations et basées sur les technologies du Web sémantique.
Nous illustrerons notre exposé par des réalisations concrètes et nous montrerons en quoi l’utilisation du Web sémantique nous a épargné des heures de développements spécifiques et nous a permis d’adresser des problématiques de plus en plus complexes.
Nous aborderons notamment l’extension sémantique, la navigation par facette, la mise en relation de silos d’informations hétérogènes, l’alignement des données sur des référentiels, l’utilisation du Web des données et d’autres techniques originales que nous avons développées pour la nouvelle version d’AFS.
SQL Server Analysis Services dans sa version 2012 a introduit la notion de BI Semantic Model, BISM, qui se décline soit en modèle Multidimensionnel, soit en modèle Tabulaire. Les besoins adressés par ces deux modes sont pour une grande part communs, mais les prérequis nécessaires à leur implémentation diffèrent sur de nombreux points qu'il est important de connaître avant de se lancer dans un projet. Durant cette session nous comparerons ces deux modes sur de nombreux critères, qu'ils concernent les administrateurs (infrastructures à mettre en place, maintenabilité, sécurité), les architectes (modélisations relationnelles sous-jacentes et frontaux supportés), les développeurs (techniques d'implémentation, performance des requêtes) et les chefs de projet qu'ils soient techniques ou fonctionnels (cas métier adressés, facilité de mise en place).
Introduction aux bases de données NoSQL faite pour l'Ensim (Ecole Nationale Supérieure d'Ingénieurs du Mans), niveau Master. Après un bref historique sur les RDBMS et NoSQL, sont présentées : les modèles de distribution, le map-reduce et les familles de bases NoSQL ainsi que leurs cas d'usage.
Légère mise à jour de l'introduction aux bases de données NoSQL faite pour l'Ensim (Ecole Nationale Supérieure d'Ingénieurs du Mans), niveau Master en Janvier 2014. Ajout d'exemples et d'une présentation rapide des APIs majeures.
Similaire à Informatique Décisionnelle décisionnelle (20)
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La JeunesseOscar Smith
Besoin des conseils pour les Jeunes ? Le document suivant est plein des conseils de la Vie ! C’est vraiment un document conseil de la jeunesse que tout jeune devrait consulter.
Voir version video:
➡https://youtu.be/7ED4uTW0x1I
Sur la chaine:👇
👉https://youtube.com/@kbgestiondeprojets
Aimeriez-vous donc…
-réussir quand on est jeune ?
-avoir de meilleurs conseils pour réussir jeune ?
- qu’on vous offre des conseils de la vie ?
Ce document est une ressource qui met en évidence deux obstacles qui empêchent les jeunes de mener une vie épanouie : l'inaction et le pessimisme.
1) Découvrez comment l'inaction, c'est-à-dire le fait de ne pas agir ou d'agir alors qu'on le devrait ou qu'on est censé le faire, est un obstacle à une vie épanouie ;
> Comment l'inaction affecte-t-elle l'avenir du jeune ? Que devraient plutôt faire les jeunes pour se racheter et récupérer ce qui leur appartient ? A découvrir dans le document ;
2) Le pessimisme, c'est douter de tout ! Les jeunes doutent que la génération plus âgée ne soit jamais orientée vers la bonne volonté. Les jeunes se sentent toujours mal à l'aise face à la ruse et la volonté politique de la génération plus âgée ! Cet état de doute extrême empêche les jeunes de découvrir les opportunités offertes par les politiques et les dispositifs en faveur de la jeunesse. Voulez-vous en savoir plus sur ces opportunités que la plupart des jeunes ne découvrent pas à cause de leur pessimisme ? Consultez cette ressource gratuite et profitez-en !
En rapport avec les " conseils pour les jeunes, " cette ressource peut aussi aider les internautes cherchant :
➡les conseils pratiques pour les jeunes
➡conseils pour réussir
➡jeune investisseur conseil
➡comment investir son argent quand on est jeune
➡conseils d'écriture jeunes auteurs
➡conseils pour les jeunes auteurs
➡comment aller vers les jeunes
➡conseil des jeunes citoyens
➡les conseils municipaux des jeunes
➡conseils municipaux des jeunes
➡conseil des jeunes en mairie
➡qui sont les jeunes
➡projet pour les jeunes
➡conseil des jeunes paris
➡infos pour les jeunes
➡conseils pour les jeunes
➡Quels sont les bienfaits de la jeunesse ?
➡Quels sont les 3 qualités de la jeunesse ?
➡Comment gérer les problèmes des adolescents ?
➡les conseils de jeunes
➡guide de conseils de jeunes
Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...mrelmejri
J'ai réalisé ce projet pour obtenir mon diplôme en licence en sciences de gestion, spécialité management, à l'ISCAE Manouba. Au cours de mon stage chez Attijari Bank, j'ai été particulièrement intéressé par l'impact des critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les décisions d'investissement dans le secteur bancaire. Cette étude explore comment ces critères influencent les stratégies et les choix d'investissement des banques.
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24BenotGeorges3
Les informations et évènements agricoles en province du Luxembourg et en Wallonie susceptibles de vous intéresser et diffusés par le SPW Agriculture, Direction de la Recherche et du Développement, Service extérieur de Libramont.
Le fichier :
Les newsletters : https://agriculture.wallonie.be/home/recherche-developpement/acteurs-du-developpement-et-de-la-vulgarisation/les-services-exterieurs-de-la-direction-de-la-recherche-et-du-developpement/newsletters-des-services-exterieurs-de-la-vulgarisation/newsletters-du-se-de-libramont.html
Bonne lecture et bienvenue aux activités proposées.
#Agriculture #Wallonie #Newsletter #Recherche #Développement #Vulgarisation #Evènement #Information #Formation #Innovation #Législation #PAC #SPW #ServicepublicdeWallonie
Cycle de Formation Théâtrale 2024 / 2025Billy DEYLORD
Pour la Saison 2024 / 2025, l'association « Le Bateau Ivre » propose un Cycle de formation théâtrale pour particuliers amateurs et professionnels des arts de la scène enfants, adolescents et adultes à l'Espace Saint-Jean de Melun (77). 108 heures de formation, d’octobre 2024 à juin 2025, à travers trois cours hebdomadaires (« Pierrot ou la science de la Scène », « Montage de spectacles », « Le Mime et son Répertoire ») et un stage annuel « Tournez dans un film de cinéma muet ».
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...M2i Formation
Améliorez l'intégration de vos nouveaux collaborateurs grâce à notre formation flash sur l'onboarding. Découvrez des stratégies éprouvées et des outils pratiques pour transformer l'intégration en une expérience fluide et efficace, et faire de chaque nouvelle recrue un atout pour vos équipes.
Les points abordés lors de la formation :
- Les fondamentaux d'un onboarding réussi
- Les outils et stratégies pour un onboarding efficace
- L'engagement et la culture d'entreprise
- L'onboarding continu et l'amélioration continue
Formation offerte animée à distance avec notre expert Eric Collin
2. Contexte
But: préciser la robustesse de certains modèles, par rapport à l’incertitude de
données.
Les données économiques sont en effet souvent bruitées (inexactes et
approximatives)
Il est fondamental d’isoler les procédures informatiques robustes au bruit,
c’est à dire qui produisent des résultat approchés lorsque les données sont
bruitées.
2
3. Plan
Modèles d’automates
Modèle relationnel
Modèle Olap
Data-Mining
Modèle XML
3
5. Introduction
Les automates sur les mots se généralisent aux arbres et sont le fondement
du langage du XML.
Le modèle relationnel se généralise au modèle OLAP et constitue le coeur des
systèmes d’information.
Le Data-Mining s’applique à tous les modèles, mais décrit son utilisation à
partir du modèle OLAP, qui constitue les fondements du Business Intelligence.
5
6. Les modèles d’automates
Le traitement de l’information nécessite un modèle de calcul
les automates finis sont un des modèles les plus simples, qui ont des variantes
selon les classes de structures considérés.
Un automate fini est défini par (Q, q0, F, )
- Q est un ensemble fini d’états
- q0 Є est l’état initial
- F Ϲ Q est un ensemble d’états finaux
- Ϲ Q x Σ x Q (Σ alphabet fini)
On présente souvent un automate par un graphe où les noeuds sont les états et les
arêtes sont des transitions possibles lorsque l’automate lit un symbole s.
Chaque arête est étiquetée par un tel symboles s tel que q.s.q’ soit une transition.
6
7. Les modèles d’automates
Dans cet exemple on a 4 états {0,
1, 2, 3}.
L’état 4 est l’état qui permet de
compléter l’automate pour que la
fonctions soit toujours définie.
On obtient alors la complétion de
l’automates.
7
8. Modèle relationnel
Les données sont représentées par des tables.
Une table est constituée de plusieurs colonnes appelées attributs et de
plusieurs lignes appelées enregistrement ou tuples.
Une requête est une fonction qui associe à un ensemble de tables une
nouvelle table.
C’est la représentation mathématique d’une question posée à une BD.
La définition des différentes tables constitue le Schéma.
Pour concevoir un schéma, il est utile d’isoler des entités et des relations
entre entités.
Une entité décrit un objet muni d’attributs.
8
9. Modèle relationnel - Entité-Relations
La conception d’un schéma est facilitée par un diagramme Entité-Relations.
Il qui décrit de manière graphique des entités munies d’attributs et des
relations entre entités.
9
Buy
Name add Date Item Price
10. Modèle relationnel - Schéma relationnel
Chaque relation peut être considérée comme une table.
Un attribut est le nom d’une colonne dont les valeurs sont dans un domaine
Di.
L’information spécifiant le domaine de chaque attribut définit le schéma.
10
11. Modèle Olap
Online Analytic Processing, permet de définir des requêtes.
Effectuer des résumés/ agrégations selon plusieurs critères et sur plusieurs
dimensions.
Générer des rapports.
Répondre à des questions de gestionnaires et d’économistes, pour analyser des
données. Par exemple :
- Quels sont les produits les plus vendus en 2005 ?
- Quels sont les magasins et les produits les plus vendus entre 2004 et 2005 en
Europe ?
Ces requêtes généralisent le GROUP BY de SQL mais en l’intégrant à plusieurs
attributs.
Les requêtes OLAP étendent SQL dans ce sens.
11
12. Modèle Olap – Intégration des
informations
Le besoin: collecter des informations à partir des plusieurs sources dont le
but est d’exploiter leur synthèse.
Le problème: les sources peuvent être autonomes et hétérogènes.
- autorisations nécessaires pour l’extraction
- utilisation de plusieurs langages pour la définition de l’information à
extraire.
La solution: utiliser un schéma fédérateur, avec ou sans données, que les
utilisateurs manipulent comme s’il s’agissait d’une BD habituelle.
12
13. Modèle Olap – Intégration des
informations
Avec données courantes provenant d’une seule source (vues matérialisées) ou de
plusieurs sources autonomes et éventuellement hétérogènes (base de données
intégrée).
besoin d’outils pour la conception du schéma, transformation/chargement de
données et propagation de changements.
Avec données historiques (entrepôt de données, données en avance), c’est notre cas.
besoin d’outils pour la conception du schéma, transformation/chargement de
données propagation de changements et rafraîchissement périodique.
Sans données, au sein d’une seule source (vues virtuelles) ou lié à plusieurs sources
autonomes et éventuellement hétérogènes (médiateurs, données à la demande).
besoin d’outils pour la récriture/évaluation des requêtes et la fusion des résultats.
Dans tous les cas, l’accès aux données se fait presque exclusivement en lecture.
13
14. Modèle Olap – Construction d’un
entrepôt de données
Architecture à trois niveaux : sources – entrepôt – data mart
data mart : ‘petit’ entrepôt orienté sujet, dont les données sont dérivées de l’entrepôt
Extraction, Transformation, Chargement de données outils ETL
Extracteur :
- traduction vers le langage source, évaluation, traduction vers le langage de l’entrepôt
- détection de changements aux sources
Intégrateur :
- réconciliation /correction d’erreurs/filtrage/estampillage pour conformer au schéma de
l’entrepôt
- chargement de données, rafraîchissement
14
15. Modèle Olap – Caractéristiques
principales d’un entrepôt de données
C’est un endroit où les données intégrées sont stockées et exploitées à l’aide
d’un système de gestion de BD.
Par conséquent, un entrepôt de données est avant tout une BD, même si les
caractéristiques suivantes le distinguent clairement des BD transactionnelles
habituelles.
- Utilisations: Les utilisateurs principaux sont les décideurs de l’entreprise qui
ont besoin des schémas faciles à lire.
- Mode d’accès: souvent à travers un data mart, en lecture uniquement.
- Volume: de l’ordre de tera octets
- Maintenance: les mises à jour sont propagées de sources vers l’entrepôt
immédiatement ou périodiquement, par construction ou de manière
incrémentale.
15
16. Modèle Olap – Expressions de chemin
et langage OLAP
Un schéma dimensionnel aussi appelé Schéma Etoile est un graphe connexe,
orienté, acyclique, étiqueté tel que:
Une seule racine, appelé l’origine et notée O.
Chaque noeud a une étiquette (dimension) et chaque arête (flèche) a une
étiquette.
Toutes les flèches ont des étiquettes distinctes.
Les flèches de source O sont d’un de deux types, dimension ou mesure.
16
17. Modèle Olap – Expressions de chemin
Etant donné un schéma dimensionnel S, une expression de chemin sur S est
une expression bien formée dont les opérandes sont des flèches de S et dont
les opérateurs sont ceux de l’algèbre fonctionnelle.
Une expression dimensionnelle sur S: toute expression de chemin constituée
uniquement de flèches figurant sur des chemins dimensionnels.
Une évaluation d’une expression de chemin e par rapport à une BDD sur S:
se fait en remplaçant chaque flèche f figurant dans e par la fonction (f) qui
lui est associée par , et en effectuant les opérations de l’algèbre
fonctionnelle.
Une vue sur S: schéma dimensionnel S’ dont chaque sommet est un sommet
de S et donc chaque flèche est une expression de chemin sur S.
Un data mart est défini comme une vue sur S, pouvant être virtuelle ou
matérialisée suivant les besoins de l’application.
17
18. Modèle Olap – Requête OLAP
Etant donné un schéma dimensionnel S, un ‘OLAP Pattern’ sur S est un couple
P= (u, v), où u est une expression dimensionnelle, v une expression de mesure
et source(u)= source(v)= O.
La cible de u est appelée le niveau d’agrégation de P et la cible de v le niveau
de mesure de P.
Une requête OLAP sur S est alors un couple Q= <P, op>, où P est un OLAP
pattern et op est une opération applicable sur le domaine du niveau de
mesure de P.
18
19. Modèle Olap – Exemple OLAP
Considérons un entrepôt qui
regroupe toutes factures émises
par une chaine de magasin.
Le schéma pourrait être défini par
cet arbre.
On peut analyser le nombre de
ventes par gamme de produits et
par ville.
Les démentions de cette requête
sont Gamme, Ville.
19
20. Modèle Olap – Exemple OLAP
On peut exprimer cette requête
par les chemins: f2of1 pour Gamme
et h2oh1 pour Ville.
La mesure est Ventes et
l’opérateur est la somme.
On peut aussi donner des
conditions de sélection: par
exemple Année= 2004, Région=
Europe.
20
21. Modèle Olap – Exemple OLAP
On affiche alors un tableau ordonné selon les valeurs des attributs.
Dans le cas de l’analyse Gamme, Ville, où Gamme a les valeurs (A,B, C) et
Ville a les valeurs (NY, Paris, Berlin) on aura un tableau comme dans cet
exemple.
21
22. Data-Mining
Le terme Data-Mining est utilisé dans de nombreux contextes avec un sens
différent.
Dans son interprétation la plus simple, il s’agit de trouver une fonction f sur
la base d’échantillons de valeurs xi, yi= f(xi).
22
23. Data-Mining – Arbres de décision
Un arbre de décision est une représentation succincte d’une fonction.
Dans le cas d’une fonction booléenne, on imagine une arbre dont les noeuds
sont les variables et les arêtes représentent les valeurs des variables.
Deux noeuds terminaux correspondent aux valeurs de la fonction.
L’arbre de décision est déterminé par l’ordre des variables.
Deux arbres de décision pour la fonction f= (x1 Λ x2) Λ (x2 V x3), selon deux 23
ordres différents: x1, x2, x3 et x2, x1, x3.
24. Data-Mining – Arbres de décision
Dans le cas d’une table T avec les
attributs A, B, C, supposons que la
3ème colonne soit la valeur de la
fonction.
On peut donc représenter la table
suivante par plusieurs arbres
possibles:
24
25. Data-Mining – Arbres de décision
Approximation et arbre de décision:
Dans un cas réel, on peut imaginer 30
attributs, des valeurs cibles discrètes, par
exemple 10, 20, 50, 100.
On cherche alors un arbre de profondeur
minimum et chaque feuille correspond à
une valeur prépondérante.
Par exemple: la feuille gauche correspond
à la valeur prépondérante de 100, à 90%.
Chaque feuille est une distribution de
valeurs, qui permet de prédire une valeur
et une confiance.
La feuille gauche correspond à la
prédiction 100 avec la confiance 90% ou la
valeur 20 avec la confiance 10% , ou la
valeur 50 avec la confiance 10%.
25
26. Data-Mining – logiciels de Fouille de
Données
3 trois logiciels qui implémentent les techniques de fouilles de données.
Dtree : ce logiciel est très simple, construit des arbres de décision à partir
d’un fichier de données, sur des valeurs discrètes.
SAS / Entreprise Miner: ce module de SAS intègre les 3 principaux modèles et
permet de les comparer, en sortant des courbes de lift.
26
27. Data-Mining – logiciels de Fouille de
Données
Weka: ce logiciel libre a une interface, largement inspirée de celle de SAS/
Entreprise Miner.
De très nombreux modèles sont disponibles, ce qui rend le logiciel plus
difficile à utiliser.
27
28. Modèle XML
Langage générique qui permet d’unifier la manipulation de données sur des
serveurs différents.
Les fonctions essentielles sont:
- La transmission de données semi-structurées entre Client et Serveur.
- L’interrogation de données semi-structurées.
- La transmission de données.
- L’intégration de données.
Ce langage est important dans l’usage du Web, car XML (eXtensible Markup
Langage) est une recommandation du W3C, l’organisme de normalisation de
logiciels pour le Web.
28
29. Conclusion
Nous avons étudier les Modèles d’automates, le Modèle relationnel, le Modèle
Olap, le Data-Mining et le Modèle XML, qui représentent les principaux
modèles informatiques, afin de connaître les principaux liens entre eux et de
préciser leur robustesse par rapport à l’incertitude de données.
29