Aussenac confinvitéeic2014 histoire ic25ans

De la pénurie à la surabondance de
connaissances : évolution de l'ingénierie
des connaissances en France depuis 25 ans
NATHALIE AUSSENAC-GILLES – IRIT (TOULOUSE)
aussenac@irit.fr
14 mai 2014 EVOLUTION DE L’IC DEPUIS 25 ANS 1

Co-auteurs
AUSSENAC-GILLES N., CHARLET J., REYNAUD C. Chapitre 7 - Les enjeux de l’Ingénierie des
Connaissances, in Information-Interaction-Intelligence : le point sur le I3. Eds: Sèdes F., Ogier J-
M., Marquis P., Toulouse : Cépaduès Editions, p 244-266, 2012
AUSSENAC-GILLES N., CHARLET J., REYNAUD C. Chapitre 20 – Ingénierie des connaissances, in
Panorama de l’intelligence artificielle. Représentation des connaissances et formalisation des
raisonnements, Volume 1. Eds: Marquis P., Papini O., Prades H. , Toulouse : Cépaduès Editions,
2014.
AUSSENAC-GILLES N., GANDON F., From the knowledge acquisition bottleneck to the knowledge
acquisition overflow: A brief French history of knowledge acquisition, in Int. J. Human-Computer
Stud.es, 71 (2013) 157–165
GANDON F., préface, actes de IC 2010, Hammamet (Tunisie)

25 ans d’IC en France
Ekaw 1989
Paris
Journée Acquisition des Connaissances 1988
Paris
JAC 1990
Lannion
IC 1998JAVA95 IC 2009
Hammamet
Ekaw 1993
Toulouse-Caylus
Ekaw 2000
Juan-les-Pins
ESWC 2012
Montpellier
Collège IC

Evolution croisée de l’IC et du web
1990
Idée du Web CERN
JAC 1990
Knowledge acquisition
bottleneck
Knowledge overflow

Objectifs de l’exposé
Qu’est-ce qui a fondamentalement changé dans cette evolution?
Nouvelles questions de recherche
En quoi l’IC est-elle toujours de l’IC ?
Quelles sont les questions, problématiques qui fondent l’IC ?

Plan
historique
tout est différent …
… mais des questions fondamentales demeurent

Jalons historiques : au début était l’expert
Les années 70 et le début des années 80 furent
marqués par la réalisation de nombreux systèmes
experts [Smith, 1984], où une connaissance experte
dans un domaine spécialisé est exprimée sous
forme de règles « si ... alors ... » et est applicable à
tout ensemble de faits décrivant une situation sur
laquelle le système doit produire des conclusions.
Les premiers furent : DENDRAL en chimie organique
[Lindsay et al., 1980], MYCIN en médecine
[Buchanan et Shortliffe (eds.), 1984], HEARSAY-II en
compréhension de la parole [Erman et al., 1980],
PROSPECTOR en géologie [Duda et al., 1976, 1981].
Marquis, Papini, Prades, 2014
SI
la coloration de l'organisme est GRAM+
et si la morphologie de l'organisme est Cocci
et si le mode de développement de l'organisme est en colonies
ALORS
il existe une évidence (0.7) que l'identité de l'organisme soit Staphylococcus.
Knowledge
acquisition
bottleneck

Jalons historiques : au début était l’expert
Compromised
Host
Gram-Negative
Infection
Immunosupressed
Leukopenia
WBC < 2.5
E. coli
Abstract
Refine
Match
Abstract
Abstract
SI
la coloration de l'organisme est GRAM+
et si la morphologie de l'organisme est Cocci
et si le mode de développement de l'organisme est en colonies
ALORS
il existe une évidence (0.7) que l'identité de l'organisme soit Staphylococcus.
- Techniques d’entretien
- Observation de l’activité
- Langages de modélisation
- Knowledge Level (Newell)
- Modélisation du processus
de résolution de problème
- Problem solving method
- Generic tasks
- Réutilisation

Jalons historiques :
de l’acquisition à l’ingénierie des connaissances
- La connaissance de l’entreprise est distribuée
et collective
- La connaissance experte est accessible
lorsqu’elle est mise en oeuvre en situation.
JAC 1992
Knowledge
acquisition
Is modelling
KADS
Knowledge acquisition
bottleneck
IC 1998
Knowledge is
(cooperative)
problem solving
CommonKADS
Ekaw 1993
Toulouse-Caylus
.
.
.
.
. .

Jalons historiques : du web au web 2.0
1990
Idée du Web
CERN
1995 : 10 000 serveurs web
1996 : 100 000 serveurs web
1998 : 1 M de serveurs1991
1 serveur web
hors Europe
1994
1999
Web 2.0
Chacun peut produire
des contenus multimedia
1998
1ere ref au web à IC

Jalons historiques : ingénierie des connaissances
14 mai 2014
EVOLUTION DE L’IC DEPUIS 25 ANS
11
- Diversifier les sources de connaissances
- Réutiliser les fragments de modèles
- Gestion des connaissances2000
Systèmes coopératifs
Modèles du domaine
Knowledge engineering
1997
Connaisances du
domaine et
Ontologies
.
.
- Le système aide l’utilisateur
- Le modèle est une construction
.
.
.
.
. .
Ekaw 2000
Juan-Les-Pins

Premiers fondamentaux
L’acquisition des connaissances est un domaine de recherche à part entière.
o proche de l’intelligence artificielle
o Fait partie des sciences cognitives
L’acquisition des connaissances définit une démarche interdisciplinaire.
oPsychologie cognitive
oErgonomie
oSociologie, anthropologie
oSciences de Gestion
oInformatique et intelligence artificielle
o> problématiser les notions de connaissance, information, donnée, activité, tâche

Premiers fondamentaux
L’acquisition des connaissances est une recherche de type ingénierie
oInnovation dans l’articulation de techniques connues
oPrise en compte des usages
oValidation par l’expérimentation en situation : produire “mieux” un système à base de
connaissances.
oImportance de la réutilisation
Contributions attendues
oMéthodologiques
oConceptuelles
oFormellees : Représentation des connaissances
oLogicielles : aides à l’explicitation de connaissances, à la modélisation, à l’évaluation

Jalons historiques : convergence autour du document
14 mai 2014
14
2000
Extraire des
connaissances à
partir de textes
Reasoning
Intelligent browsing
Support systems
1996
HTML
1998
XML
Semantic Web Road Map
.
.
- Approches terminologiques
- Traitement automatique des langues
- Ressources termino-ontologiques
.
. .
.
. .
TIA 1993 Paris

Deuxième série de fondamentaux
la question des sources de connaissances hétérogènes
gérer l’hétérogénéïté
exploiter les complémentarités
adapter les techniques aux sources de connaissances et savoir combiner les résultats
la question de la généricité / réutilisabilité des modèles
prendre en compte l’objectif d’utilisation dans la realisation du modèle
Savoir adapter des ressources génériques
Méthodes de resolution de problème
Ontologies de domaine
Ontologies de haut niveau
.
.
.
.
. .

Deuxième série de fondamentaux
Étudier l’articulation entre langage naturel (écrit) et connaissances formalisées
est un des défis de l’IC
o en lien avec le Traitement Automatique des Langues (TAL)
o en lien avec une analyse fine des phénomènes linguistiques
Changement de paradigme
o recul de la formalisation logique
ocaractérisation des contenus
o approche “annotation sémantique”
o rapprochement de la recherche d’information

Jalons historiques : un monde d’ontologies
14 mai 2014
17
Reasoning
Intelligent browsing
Support systems
2001
Spécification RDF
Spécification RDFs
2003 privacy P3P
.
.
- Plus de navigation, d’annotation
- plus d’accès à l’information /
connaissances
- Moins de resolution de problème
- Dimension sociale des annotations
2001
Semantic web à IC
2004
OWL
2007
FreeBase, DBPedia
2004
Exploiter wiki
Réseaux sociaux

Jalons historiques : des données aux connaissances
14 mai 2014
18
2008
Moteurs de recherche
sémantique
- Plus de manipulation de données
- Fouille des données > connaissances
- Extraction d’information
- Typage, alignement de données
- Dynamique, évolution 2010
Analyse de traces numériques
2008
Web des données
IC2.0
alignements
TAL
.
2011
OWL 2, SPARQL 1.1

Jalons historiques : toujours plus de données liées
- Exploitation des données
- (enfin !) vraie exploitation de la sémantique et
de l’axiomatique des ontologies
- Les règles, le retour
- Typage, alignement de données
- Domaines très porteurs : médecine, agronomie,
données publiques
Inference
TAL
ML

Troisième série de fondamentaux
Evolution des paradigmes
o Exploitation croissante de la formalisation logique
o Caractérisation precise des contenus
o approche “annotation sémantique”
o rapprochement de la recherché d’information
Les ontologies sont-elles les réponses aux questions du web sémantique ?
o nouveau goulet d’étranglement entre ontologies et utilisations des données
oRôle du crowd sourcing à l’avenir ?
oOntologies // big Data

l’IC et les connaissances dans les strategies de recherche
Stratégie de recherche Nationale, atelier 7, M. Ghallab

Ontologies et profusion de données
Thème de l’ “ontology summit” du printemps 2014
oSemantic Web and Big Data Meets Applied Ontology
ohttp://ontolog.cim3.net/cgi-bin/wiki.pl?OntologySummit2014_Communique
Questions
oQuels bouleversements sur les ontologies accompagnent les travaux sur Web Sémantique et
Linked Data ?
oQuel apport des ontologies (de domaine, formelles) aux Linked Data ?
oJusqu’où peut-on automatiser la construction d’ontologies ? Leur peuplement ?
Les travaux du communiqué
oEtat des lieux des usages des ontologies pour caractériser les données
oQuestions d’expressivité des langages
oQuestion de mise au point : RDF rules
oQuestion de couverture des ontologies : plutôt des ontologies spécialisées
oPassage à l’échelle

Ontologies et profusion de données : les conclusions
Vers des approches hybrides
Agile engineering techniques
approches statistiques et sémantiques
ontologies et analyse des contenus « à la demande »
données extraites et ontologies (pour typer les données)
Quels sont les contenus partageables ? Réutilisables ?
limite de la réutilisation des ontologies
Ontology Design patterns : vers des patrons spécifiques à des domaines
prolifération / réutilisation d’ontologies réutilisables et de vocabulaires
Intégration
Modularité
Organiser et documenter des entrepôts d’ontologies

Ontologies et profusion de données : les conclusions
Freins à la construction d’ontologies
oCoût, complexité, temps
oFacteurs sociaux
Bonnes pratiques
o réutilisation : réutiliser, adapter, documenter
o bien formaliser
o design patterns de petite taille
o Exploiter la sémantique
Vers plus d’automatisation de la constructuion des ontologies / BC ?
oIl reste bq à faire, utilisation ML
oAdapter les plate-formes
oRaisonnement et vérification
oUtiliser mappings et alignements

2014 : une IC fondue dans le web sémantique ?
ex de travaux à rendre plus visibles
o Méthodologies
o Plateformes de modélisation (PROTÉGÉ “monopole”)
o modélisation de thesaurus, terminologies et ontologies terminologiques
oproduction d’outils diffusables pour la construction/ manipulation de triplets, d’alignements
ex de travaux moins développés
o dimension cognitive : seulement dans les traces numériques
o dimension cooperative et sociale : wiki sémantiques, collaborations d’experts etc.

2014 : une IC fondue dans le web sémantique ?
Problématiser l’articulation connaissances (experts) de domaine vs données
du web
au-delà d’affirmations de principe
aspects techniques et quantitatifs
complexité sémantique, assister la modélisation >> IC
Faire de la recherche au service d’une INGENIERIE
o articulation avec d’autres aspects de l’informatique (TAL, ML, BD, RI, Cloud, CHP,…)
o effet de mode : effet “tendance” vs travaux fondamentaux
o ne pas y perdre son identité ?
o Revenir à plus d’interdisciplinarité

IC – la conf - est-elle soluble dans les critères
d’évaluation de la recherché ?
IC, une conférence mais aussi une communauté scientifique
IC dans l’AFIA
o participation à la plate-forme de conferences années impaires
o reconnaissances scientifique > qualité, selection
o ateliers
IC vs l’international
◦ Présentation des projets ANR
◦ Et les projet seuropéens
◦ Conférences internationals du domaine : EKAW et K-CAP, ESWC et ISWC

Aussenac confinvitéeic2014 histoire ic25ans

Contenu connexe

En vedette

Similaire à Aussenac confinvitéeic2014 histoire ic25ans

Aussenac confinvitéeic2014 histoire ic25ans