SlideShare une entreprise Scribd logo
Historisches
Institut
Inhaltserschliessung (I-II):
Manuelle und automatische Indexierung
Analyse documentaire (I-II):
indexation manuelle et automatique
Jean-Philippe Accart, MAS ALIS 2014-2016
15 août 2015
Modul/Module 2c
1
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
2
Historisches
Institut
Inhaltserschliessung (I-II): Manuelle und automatische Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Objectifs du cours
- Montrer les différences entre indexation manuelle et
automatique
- Expliquer leur utilité / à la recherche d’information
- Idem pour les classifications
- Introduire la notion de clusters
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
3
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
Sommaire
Introduction : Retours sur la recherche d’information / à la notion
d’info-obésité
• L’indexation manuelle
• L’indexation automatique
• Les classifications
• Les clusters
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
4
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Les contenus (contents) et la technologie
Historisches
Institut
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
5
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
Les contenus (contents) et la technologie
Les contenus d’information sont multiples:
- Revues, presse, livres… papier et numériques
- Internet, Intranet, réseaux d’entreprise
- Emails, documents internes
- Réseaux sociaux, infographies
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
6
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
L
e
s
d
o
n
n
é
e
s
n
L
Les données non structurées
(source http://www.idc.com/)
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
7
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
Le modèle classique de la recherche d’information (1)
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
8
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
Le modèle classique de la recherche d’information (2)
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
9
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
Indexation/Classification/Clusters
10
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
11
Modèles de la recherche d’information sur les moteurs de recherche
3 paramètres sont à considérer:
-> Représentations de documents et de la recherche (traduction
informatique)
-> Stratégies élaborées de recherche pour des résultats pertinents
-> Méthodes de ranking
3 modèles de recherche:
- Booléenne
- Vectorielle
- En utilisant les probabilités
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
12
II – Indexation manuelle et automatique
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
13
II – Indexation manuelle
• Indexation par dérivation
– Les mots-clés servant à l‘indexation sont dérivés du
document et „normalisés“
• Indexation par attribution
– Les mots-clés sont attribués à un document en utilisant une
terminologie autorisée (thesaurus, ontologie, index…)
Elle détermine les sujets importants du document.
Elle pose la question : qu’est-ce qu’un sujet pertinent ?
Fondée sur la lecture humaine et la capacité de comprendre
un document.
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
14
II – Indexation automatique
Elle est fondée sur la fréquence des termes trouvés dans un
document.
Fréquence relative versus absolue
- Par document
- Relative par rapport à une collection de documents
- Elimination des stopswords (mots vides : « le », « la », « de », « du »,
« ce »…)
Fréquence des termes est reliée à la pertinence: sujets principaux sont
plus fréquents.
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
15
II – Indexation automatique
3 modèles:
- Booléen
- Vectoriel
- Probabiliste
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
Indexation/Classification/Clusters
16
II – Indexation automatique : Modèle booléen
Les vecteurs créés (les termes) sont libres.
Ils sont générés par hypothèse :
Soit B la base vectorielle des mots contenus dans le document.
Toute requête R est traitée de la même manière et ne contient que
les mots significatifs.
Le vecteur (le terme) de la requête est l’union des vecteurs de ses termes
significatifs dans B. Le résultat peut être nul.
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
Indexation/Classification/Clusters
17
II – Indexation automatique : Modèle vectoriel
• A partir d‘un ensemble de termes, normalisation des termes et
élimination des stopwords
• Création d‘une matrice avec les termes restant pour chaque
document
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
17
II – Indexation automatique : Modèle probabiliste
• Mesure la probabilité de pertinence d’un document par
rapport à une requête
• Utilise 2 probabilités pour chaque document :
- la probabilité de pertinence du document D, P(per/D),
- la probabilité de non pertinence du document D,P(nonper/D)
• La fonction de recherche g(D) donne un ordonnancement des
documents: g(D) = (P(per/D)/P(nonper/D))
• Probabilités calculées en fonction des termes d’indexation de la
base de données
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
18
III – Les classifications
• Classification manuelle : on attribue manuellement des
classes prédéfinies à des documents.
• Classification automatique :
– on attribue automatiquement des classes prédéfinies à
des documents
– on regroupe des documents automatiquement dans des
clusters
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
19
IV – Les clusters
• Il s‘agit de regrouper des documents similaires dans des
clusters (ensembles) de documents
• Les documents regroupés dans un cluster doivent être
similaires
• Les documents de clusters différents doivent être dans des
clusters différents
• Les clusters sont la forme la plus courante d‘un savoir non
contrôlé
• Non contrôlé = les données ne sont pas annotées
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
20
IV – Les clusters
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
21
IV – Les clusters
• Ce qu‘il faut retenir de la notion de cluster ou de clustering :
– Si un terme trouvé dans un cluster est pertinent, alors les
autres termes du cluster le sont également (principe de
similarité)
– Contrairement à une liste de résultats fournis par un moteur
de recherche, la RI avec clustering affiche les documents
par similarité donc + de chances de fiabilité de la recherche
– http://vivisimo.com (IBM) est un système fondé sur les
clusters
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
22
IV – Les clusters
Applications pratiques:
- En biologie : pour les plantes, le regroupement de gènes
- En médecine: imagerie médicale
- En marketing et business: segments de marchés, clients
- Réseaux sociaux: reconnaissance de communautés
- Sciences sociales: analyse criminologique
- Climatologie : analyse des températures et des océans…
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
23
Bibliographie
AMAR M., Les Fondements théoriques de l’indexation : une approche linguistique, Paris, ADBS, 2000.
CHARTRON G., DALBIN S., MONTEIL M.-G., VÉRILLON M., « Indexation manuelle et indexation
automatique : dépasser les oppositions », Documentaliste/sciences de l’information, vol. 26, no
4-5,
1989, p. 181-187.
CHAUMIER J., DEJEAN M., « L’indexation documentaire : de l’analyse conceptuelle humaine à
l’analyse automatique morphosyntaxique », Documentaliste/sciences de l’information, vol. 27, no
6,
novembre-décembre 1990, p. 275-279.
GARFIELD E., « “Science Citation Index” – A New Dimension in Indexing », Science, New Series,
vol. 144, n° 3619, 1964, p. 649-654.
JOLION J.-M. (dir.), L’Indexation, Paris, Hermès Science Publications, 2001. Numéro de : Document
numérique, 2000, vol. 4, no
1-2.
MENON B., « Quelle indexation pour l’information professionnelle ? », dans L’Information
professionnelle, sous la dir. de Viviane Clavier et Céline Paganelli, Paris, Hermes-Lavoisier, 2013,
p. 83-105.
TIMIMI I., KOVACS S. (coord.), Indice, index, indexation, Paris, ADBS, 2006.
Normes
AFNOR, Norme NF Z 47-102 : principes généraux pour l’indexation des documents, Paris, AFNOR,
1996.
Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
© Jean-Philippe Accart, MAS ALIS 2014/2016 –
Indexation/Classification/Clusters
24
Guide d’indexation Rameau, Paris, BnF, 2010, en ligne : <http://guiderameau.bnf.fr/>.

Contenu connexe

Tendances

Contabilidade geral concursos
Contabilidade geral concursosContabilidade geral concursos
Contabilidade geral concursos
J M
 
Compétitic - Gestion électronique de documents - numérique en entreprise
Compétitic - Gestion électronique de documents - numérique en entrepriseCompétitic - Gestion électronique de documents - numérique en entreprise
Compétitic - Gestion électronique de documents - numérique en entreprise
COMPETITIC
 
Oracle ADF : Vue d'ensemble
Oracle ADF : Vue d'ensembleOracle ADF : Vue d'ensemble
Oracle ADF : Vue d'ensemble
ANASYS
 
Urba ea topo-puits-v4extrait
Urba ea topo-puits-v4extraitUrba ea topo-puits-v4extrait
Urba ea topo-puits-v4extrait
René MANDEL
 
Diaporama GED-SAE
Diaporama GED-SAEDiaporama GED-SAE
Diaporama GED-SAE
inforoutes
 
ISO 9001 version 2008 et Implication du personnel
ISO 9001 version 2008 et Implication du personnelISO 9001 version 2008 et Implication du personnel
ISO 9001 version 2008 et Implication du personnel
Badan Sophia
 
Proposition conciergerie
Proposition conciergerieProposition conciergerie
Proposition conciergerie
Conciergery
 
Cv consultant sig et carto 2015
Cv consultant sig et carto 2015Cv consultant sig et carto 2015
Cv consultant sig et carto 2015Youness STOUK
 
Modelisation conception SI
Modelisation conception SIModelisation conception SI
Modelisation conception SI
Lara L' Impératrice
 
Web Based Fleet Management System
Web Based Fleet Management SystemWeb Based Fleet Management System
Web Based Fleet Management System
Vasil Yordanov
 
Powerpoint Presentatie boekhouden
Powerpoint Presentatie boekhoudenPowerpoint Presentatie boekhouden
Powerpoint Presentatie boekhoudenleovbelzen
 
Présentation Gestion Electronique de Documents (Alfresco)
Présentation Gestion Electronique de Documents (Alfresco)Présentation Gestion Electronique de Documents (Alfresco)
Présentation Gestion Electronique de Documents (Alfresco)
Jibril Touzi
 
Synthèse : démarche de mise en oeuvre d'un portefeuille projets
Synthèse : démarche de mise en oeuvre d'un portefeuille projetsSynthèse : démarche de mise en oeuvre d'un portefeuille projets
Synthèse : démarche de mise en oeuvre d'un portefeuille projets
COMPETENSIS
 
Les 4 normes de description archivistique
Les 4 normes de description archivistiqueLes 4 normes de description archivistique
Les 4 normes de description archivistique
Danis Habib
 
Mise en place d'une cellule de Veille Juridique
Mise en place d'une cellule de Veille JuridiqueMise en place d'une cellule de Veille Juridique
Mise en place d'une cellule de Veille JuridiqueVIR Conseil
 
Matinée3 Gestion Electronique des Documents (GED)
Matinée3   Gestion Electronique des Documents (GED)Matinée3   Gestion Electronique des Documents (GED)
Matinée3 Gestion Electronique des Documents (GED)
ALTITUDE CONCEPT SPRL
 
Tdr Handicap International recherche un consultant pour une mission de réalis...
Tdr Handicap International recherche un consultant pour une mission de réalis...Tdr Handicap International recherche un consultant pour une mission de réalis...
Tdr Handicap International recherche un consultant pour une mission de réalis...
Jamaity
 
Dolibarr
DolibarrDolibarr

Tendances (20)

Contabilidade geral concursos
Contabilidade geral concursosContabilidade geral concursos
Contabilidade geral concursos
 
Compétitic - Gestion électronique de documents - numérique en entreprise
Compétitic - Gestion électronique de documents - numérique en entrepriseCompétitic - Gestion électronique de documents - numérique en entreprise
Compétitic - Gestion électronique de documents - numérique en entreprise
 
Oracle ADF : Vue d'ensemble
Oracle ADF : Vue d'ensembleOracle ADF : Vue d'ensemble
Oracle ADF : Vue d'ensemble
 
Urba ea topo-puits-v4extrait
Urba ea topo-puits-v4extraitUrba ea topo-puits-v4extrait
Urba ea topo-puits-v4extrait
 
Diaporama GED-SAE
Diaporama GED-SAEDiaporama GED-SAE
Diaporama GED-SAE
 
ISO 9001 version 2008 et Implication du personnel
ISO 9001 version 2008 et Implication du personnelISO 9001 version 2008 et Implication du personnel
ISO 9001 version 2008 et Implication du personnel
 
Proposition conciergerie
Proposition conciergerieProposition conciergerie
Proposition conciergerie
 
Cv consultant sig et carto 2015
Cv consultant sig et carto 2015Cv consultant sig et carto 2015
Cv consultant sig et carto 2015
 
Modelisation conception SI
Modelisation conception SIModelisation conception SI
Modelisation conception SI
 
Web Based Fleet Management System
Web Based Fleet Management SystemWeb Based Fleet Management System
Web Based Fleet Management System
 
Powerpoint Presentatie boekhouden
Powerpoint Presentatie boekhoudenPowerpoint Presentatie boekhouden
Powerpoint Presentatie boekhouden
 
Présentation Gestion Electronique de Documents (Alfresco)
Présentation Gestion Electronique de Documents (Alfresco)Présentation Gestion Electronique de Documents (Alfresco)
Présentation Gestion Electronique de Documents (Alfresco)
 
Plaquette partenaires
Plaquette partenairesPlaquette partenaires
Plaquette partenaires
 
Synthèse : démarche de mise en oeuvre d'un portefeuille projets
Synthèse : démarche de mise en oeuvre d'un portefeuille projetsSynthèse : démarche de mise en oeuvre d'un portefeuille projets
Synthèse : démarche de mise en oeuvre d'un portefeuille projets
 
Les 4 normes de description archivistique
Les 4 normes de description archivistiqueLes 4 normes de description archivistique
Les 4 normes de description archivistique
 
Mise en place d'une cellule de Veille Juridique
Mise en place d'une cellule de Veille JuridiqueMise en place d'une cellule de Veille Juridique
Mise en place d'une cellule de Veille Juridique
 
Matinée3 Gestion Electronique des Documents (GED)
Matinée3   Gestion Electronique des Documents (GED)Matinée3   Gestion Electronique des Documents (GED)
Matinée3 Gestion Electronique des Documents (GED)
 
Tdr Handicap International recherche un consultant pour une mission de réalis...
Tdr Handicap International recherche un consultant pour une mission de réalis...Tdr Handicap International recherche un consultant pour une mission de réalis...
Tdr Handicap International recherche un consultant pour une mission de réalis...
 
Gimsi
GimsiGimsi
Gimsi
 
Dolibarr
DolibarrDolibarr
Dolibarr
 

En vedette

Le Métier de documentaliste en mutation
Le Métier de documentaliste en mutationLe Métier de documentaliste en mutation
Le Métier de documentaliste en mutation
Ecole hôtelière de Lausanne - EHL
 
Évolution du rôle du (de la) documentaliste : le travail en réseau
Évolution du rôle  du (de la) documentaliste : le travail en réseauÉvolution du rôle  du (de la) documentaliste : le travail en réseau
Évolution du rôle du (de la) documentaliste : le travail en réseau
Dominique GENUER
 
Les metiers de la documentation et des bibliotheques face aux enjeux professi...
Les metiers de la documentation et des bibliotheques face aux enjeux professi...Les metiers de la documentation et des bibliotheques face aux enjeux professi...
Les metiers de la documentation et des bibliotheques face aux enjeux professi...
Ecole hôtelière de Lausanne - EHL
 
Les défis professionnels et de formation des métiers de la documentation et d...
Les défis professionnels et de formation des métiers de la documentation et d...Les défis professionnels et de formation des métiers de la documentation et d...
Les défis professionnels et de formation des métiers de la documentation et d...
Ecole hôtelière de Lausanne - EHL
 
Les utilisateurs au coeur des services documentaires
Les utilisateurs au coeur des services documentairesLes utilisateurs au coeur des services documentaires
Les utilisateurs au coeur des services documentaires
Vaissaire-Agard Clotilde
 
Évolution du rôle du (de la) documentaliste : des pistes d'avenir
Évolution du rôle  du (de la) documentaliste : des pistes d'avenirÉvolution du rôle  du (de la) documentaliste : des pistes d'avenir
Évolution du rôle du (de la) documentaliste : des pistes d'avenir
Dominique GENUER
 
Rechercher l’information utile
Rechercher l’information utileRechercher l’information utile
Rechercher l’information utile
Ecole hôtelière de Lausanne - EHL
 
Licence pro documentaliste audiovisuel
Licence pro documentaliste audiovisuelLicence pro documentaliste audiovisuel
Licence pro documentaliste audiovisuel
Éric Delcroix
 
Validation Siteweb
Validation SitewebValidation Siteweb
Validation Siteweb
EMontel
 
Livre et lecture numérique
Livre et lecture numériqueLivre et lecture numérique
Livre et lecture numérique
Vaissaire-Agard Clotilde
 
Comprendre la chaîne du livre à l\'heure du numérique
Comprendre la chaîne du livre à l\'heure du numériqueComprendre la chaîne du livre à l\'heure du numérique
Comprendre la chaîne du livre à l\'heure du numériqueYouScribe
 
du signalement à la KB
du signalement à la KBdu signalement à la KB
du signalement à la KB
Nicolas Morin
 
Passeport documentaire Licence et en Master
Passeport documentaire Licence et en MasterPasseport documentaire Licence et en Master
Passeport documentaire Licence et en Masterscduag
 
L\'informatique documentaire à l\'heure du tout web
L\'informatique documentaire à l\'heure du tout webL\'informatique documentaire à l\'heure du tout web
L\'informatique documentaire à l\'heure du tout webNicolas Morin
 
Utiliser les médias sociaux avec ses élèves - Eduquer aux enjeux contemporain...
Utiliser les médias sociaux avec ses élèves - Eduquer aux enjeux contemporain...Utiliser les médias sociaux avec ses élèves - Eduquer aux enjeux contemporain...
Utiliser les médias sociaux avec ses élèves - Eduquer aux enjeux contemporain...
Perrine Le Dûs
 
Stage outils curation_2014-12-03
Stage outils curation_2014-12-03Stage outils curation_2014-12-03
Stage outils curation_2014-12-03
URFIST de Rennes
 
Formation Initiale Informatique 2008
Formation Initiale Informatique 2008Formation Initiale Informatique 2008
Formation Initiale Informatique 2008
pascaljh
 
Logiciels libres en milieu industriel
Logiciels libres en milieu industrielLogiciels libres en milieu industriel
Logiciels libres en milieu industriel
Christian Charreyre
 
Wikipédia : quels usages pédagogiques dans une démarche d'éducation aux médias ?
Wikipédia : quels usages pédagogiques dans une démarche d'éducation aux médias ?Wikipédia : quels usages pédagogiques dans une démarche d'éducation aux médias ?
Wikipédia : quels usages pédagogiques dans une démarche d'éducation aux médias ?
Perrine Le Dûs
 
Contrat 2010-2013 Scduag
Contrat 2010-2013 ScduagContrat 2010-2013 Scduag
Contrat 2010-2013 Scduag
scduag
 

En vedette (20)

Le Métier de documentaliste en mutation
Le Métier de documentaliste en mutationLe Métier de documentaliste en mutation
Le Métier de documentaliste en mutation
 
Évolution du rôle du (de la) documentaliste : le travail en réseau
Évolution du rôle  du (de la) documentaliste : le travail en réseauÉvolution du rôle  du (de la) documentaliste : le travail en réseau
Évolution du rôle du (de la) documentaliste : le travail en réseau
 
Les metiers de la documentation et des bibliotheques face aux enjeux professi...
Les metiers de la documentation et des bibliotheques face aux enjeux professi...Les metiers de la documentation et des bibliotheques face aux enjeux professi...
Les metiers de la documentation et des bibliotheques face aux enjeux professi...
 
Les défis professionnels et de formation des métiers de la documentation et d...
Les défis professionnels et de formation des métiers de la documentation et d...Les défis professionnels et de formation des métiers de la documentation et d...
Les défis professionnels et de formation des métiers de la documentation et d...
 
Les utilisateurs au coeur des services documentaires
Les utilisateurs au coeur des services documentairesLes utilisateurs au coeur des services documentaires
Les utilisateurs au coeur des services documentaires
 
Évolution du rôle du (de la) documentaliste : des pistes d'avenir
Évolution du rôle  du (de la) documentaliste : des pistes d'avenirÉvolution du rôle  du (de la) documentaliste : des pistes d'avenir
Évolution du rôle du (de la) documentaliste : des pistes d'avenir
 
Rechercher l’information utile
Rechercher l’information utileRechercher l’information utile
Rechercher l’information utile
 
Licence pro documentaliste audiovisuel
Licence pro documentaliste audiovisuelLicence pro documentaliste audiovisuel
Licence pro documentaliste audiovisuel
 
Validation Siteweb
Validation SitewebValidation Siteweb
Validation Siteweb
 
Livre et lecture numérique
Livre et lecture numériqueLivre et lecture numérique
Livre et lecture numérique
 
Comprendre la chaîne du livre à l\'heure du numérique
Comprendre la chaîne du livre à l\'heure du numériqueComprendre la chaîne du livre à l\'heure du numérique
Comprendre la chaîne du livre à l\'heure du numérique
 
du signalement à la KB
du signalement à la KBdu signalement à la KB
du signalement à la KB
 
Passeport documentaire Licence et en Master
Passeport documentaire Licence et en MasterPasseport documentaire Licence et en Master
Passeport documentaire Licence et en Master
 
L\'informatique documentaire à l\'heure du tout web
L\'informatique documentaire à l\'heure du tout webL\'informatique documentaire à l\'heure du tout web
L\'informatique documentaire à l\'heure du tout web
 
Utiliser les médias sociaux avec ses élèves - Eduquer aux enjeux contemporain...
Utiliser les médias sociaux avec ses élèves - Eduquer aux enjeux contemporain...Utiliser les médias sociaux avec ses élèves - Eduquer aux enjeux contemporain...
Utiliser les médias sociaux avec ses élèves - Eduquer aux enjeux contemporain...
 
Stage outils curation_2014-12-03
Stage outils curation_2014-12-03Stage outils curation_2014-12-03
Stage outils curation_2014-12-03
 
Formation Initiale Informatique 2008
Formation Initiale Informatique 2008Formation Initiale Informatique 2008
Formation Initiale Informatique 2008
 
Logiciels libres en milieu industriel
Logiciels libres en milieu industrielLogiciels libres en milieu industriel
Logiciels libres en milieu industriel
 
Wikipédia : quels usages pédagogiques dans une démarche d'éducation aux médias ?
Wikipédia : quels usages pédagogiques dans une démarche d'éducation aux médias ?Wikipédia : quels usages pédagogiques dans une démarche d'éducation aux médias ?
Wikipédia : quels usages pédagogiques dans une démarche d'éducation aux médias ?
 
Contrat 2010-2013 Scduag
Contrat 2010-2013 ScduagContrat 2010-2013 Scduag
Contrat 2010-2013 Scduag
 

Plus de Ecole hôtelière de Lausanne - EHL

L'accompagnement au changement comme condition de réussite : un exemple suisse
L'accompagnement au changement comme condition de réussite : un exemple suisseL'accompagnement au changement comme condition de réussite : un exemple suisse
L'accompagnement au changement comme condition de réussite : un exemple suisse
Ecole hôtelière de Lausanne - EHL
 
Comment l'esprit entrepreneurial vient aux bibliothecaires documentalistes
Comment l'esprit entrepreneurial vient aux bibliothecaires documentalistesComment l'esprit entrepreneurial vient aux bibliothecaires documentalistes
Comment l'esprit entrepreneurial vient aux bibliothecaires documentalistes
Ecole hôtelière de Lausanne - EHL
 
Advocacy, lobbying et mesures d'impact des bibliotheques
Advocacy, lobbying et mesures d'impact des bibliothequesAdvocacy, lobbying et mesures d'impact des bibliotheques
Advocacy, lobbying et mesures d'impact des bibliotheques
Ecole hôtelière de Lausanne - EHL
 
Bibliothécaire : entrepreneur en devenir ? - ABF, La Rochelle, 7 juin 2018
Bibliothécaire : entrepreneur en devenir ? - ABF, La Rochelle, 7 juin 2018Bibliothécaire : entrepreneur en devenir ? - ABF, La Rochelle, 7 juin 2018
Bibliothécaire : entrepreneur en devenir ? - ABF, La Rochelle, 7 juin 2018
Ecole hôtelière de Lausanne - EHL
 
Students Information Literacy Skills and Employability
Students Information Literacy Skills and Employability Students Information Literacy Skills and Employability
Students Information Literacy Skills and Employability
Ecole hôtelière de Lausanne - EHL
 
Nouvelles compétences en Info-Doc
Nouvelles compétences en Info-DocNouvelles compétences en Info-Doc
Nouvelles compétences en Info-Doc
Ecole hôtelière de Lausanne - EHL
 
Ressources humaines en bibliothèque : prêtes pour demain ?
Ressources humaines en bibliothèque : prêtes pour demain ?Ressources humaines en bibliothèque : prêtes pour demain ?
Ressources humaines en bibliothèque : prêtes pour demain ?
Ecole hôtelière de Lausanne - EHL
 
Innovative Services in Library and Information Services - Crimea 2015
Innovative Services in Library and Information Services - Crimea 2015Innovative Services in Library and Information Services - Crimea 2015
Innovative Services in Library and Information Services - Crimea 2015
Ecole hôtelière de Lausanne - EHL
 
Veille et curation de données - Lyon - 22 janvier 2015
Veille et curation de données - Lyon - 22 janvier 2015Veille et curation de données - Lyon - 22 janvier 2015
Veille et curation de données - Lyon - 22 janvier 2015
Ecole hôtelière de Lausanne - EHL
 
Systèmes de recommandation: applications en bibliothèque, archives et documen...
Systèmes de recommandation: applications en bibliothèque, archives et documen...Systèmes de recommandation: applications en bibliothèque, archives et documen...
Systèmes de recommandation: applications en bibliothèque, archives et documen...Ecole hôtelière de Lausanne - EHL
 
Prestations des bibliothèques en matière de recherches, avec étude du cas : D...
Prestations des bibliothèques en matière de recherches, avec étude du cas : D...Prestations des bibliothèques en matière de recherches, avec étude du cas : D...
Prestations des bibliothèques en matière de recherches, avec étude du cas : D...
Ecole hôtelière de Lausanne - EHL
 
Dialogue et lien intergénérationnel : que fait la bibliothèques ? Illustrations
Dialogue et lien intergénérationnel : que fait la bibliothèques ? IllustrationsDialogue et lien intergénérationnel : que fait la bibliothèques ? Illustrations
Dialogue et lien intergénérationnel : que fait la bibliothèques ? Illustrations
Ecole hôtelière de Lausanne - EHL
 
التحديات المهنية والتكوينية لمهن التوثيق والمكتبات
التحديات المهنية والتكوينية  لمهن التوثيق والمكتبات التحديات المهنية والتكوينية  لمهن التوثيق والمكتبات
التحديات المهنية والتكوينية لمهن التوثيق والمكتبات
Ecole hôtelière de Lausanne - EHL
 
La mediation en bibliotheque: les 5 mediations
La mediation en bibliotheque: les 5 mediationsLa mediation en bibliotheque: les 5 mediations
La mediation en bibliotheque: les 5 mediations
Ecole hôtelière de Lausanne - EHL
 
Atelier Ecrire pour le web - Université de Genève - Droit de citation
Atelier Ecrire pour le web - Université de Genève - Droit de citationAtelier Ecrire pour le web - Université de Genève - Droit de citation
Atelier Ecrire pour le web - Université de Genève - Droit de citationEcole hôtelière de Lausanne - EHL
 

Plus de Ecole hôtelière de Lausanne - EHL (20)

L'accompagnement au changement comme condition de réussite : un exemple suisse
L'accompagnement au changement comme condition de réussite : un exemple suisseL'accompagnement au changement comme condition de réussite : un exemple suisse
L'accompagnement au changement comme condition de réussite : un exemple suisse
 
Comment l'esprit entrepreneurial vient aux bibliothecaires documentalistes
Comment l'esprit entrepreneurial vient aux bibliothecaires documentalistesComment l'esprit entrepreneurial vient aux bibliothecaires documentalistes
Comment l'esprit entrepreneurial vient aux bibliothecaires documentalistes
 
Advocacy, lobbying et mesures d'impact des bibliotheques
Advocacy, lobbying et mesures d'impact des bibliothequesAdvocacy, lobbying et mesures d'impact des bibliotheques
Advocacy, lobbying et mesures d'impact des bibliotheques
 
Bibliothécaire : entrepreneur en devenir ? - ABF, La Rochelle, 7 juin 2018
Bibliothécaire : entrepreneur en devenir ? - ABF, La Rochelle, 7 juin 2018Bibliothécaire : entrepreneur en devenir ? - ABF, La Rochelle, 7 juin 2018
Bibliothécaire : entrepreneur en devenir ? - ABF, La Rochelle, 7 juin 2018
 
Students Information Literacy Skills and Employability
Students Information Literacy Skills and Employability Students Information Literacy Skills and Employability
Students Information Literacy Skills and Employability
 
Nouvelles compétences en Info-Doc
Nouvelles compétences en Info-DocNouvelles compétences en Info-Doc
Nouvelles compétences en Info-Doc
 
Ressources humaines en bibliothèque : prêtes pour demain ?
Ressources humaines en bibliothèque : prêtes pour demain ?Ressources humaines en bibliothèque : prêtes pour demain ?
Ressources humaines en bibliothèque : prêtes pour demain ?
 
Innovative Services in Library and Information Services - Crimea 2015
Innovative Services in Library and Information Services - Crimea 2015Innovative Services in Library and Information Services - Crimea 2015
Innovative Services in Library and Information Services - Crimea 2015
 
Veille et curation de données - Lyon - 22 janvier 2015
Veille et curation de données - Lyon - 22 janvier 2015Veille et curation de données - Lyon - 22 janvier 2015
Veille et curation de données - Lyon - 22 janvier 2015
 
Systèmes de recommandation: applications en bibliothèque, archives et documen...
Systèmes de recommandation: applications en bibliothèque, archives et documen...Systèmes de recommandation: applications en bibliothèque, archives et documen...
Systèmes de recommandation: applications en bibliothèque, archives et documen...
 
Prestations des bibliothèques en matière de recherches, avec étude du cas : D...
Prestations des bibliothèques en matière de recherches, avec étude du cas : D...Prestations des bibliothèques en matière de recherches, avec étude du cas : D...
Prestations des bibliothèques en matière de recherches, avec étude du cas : D...
 
Dialogue et lien intergénérationnel : que fait la bibliothèques ? Illustrations
Dialogue et lien intergénérationnel : que fait la bibliothèques ? IllustrationsDialogue et lien intergénérationnel : que fait la bibliothèques ? Illustrations
Dialogue et lien intergénérationnel : que fait la bibliothèques ? Illustrations
 
التحديات المهنية والتكوينية لمهن التوثيق والمكتبات
التحديات المهنية والتكوينية  لمهن التوثيق والمكتبات التحديات المهنية والتكوينية  لمهن التوثيق والمكتبات
التحديات المهنية والتكوينية لمهن التوثيق والمكتبات
 
La mediation en bibliotheque: les 5 mediations
La mediation en bibliotheque: les 5 mediationsLa mediation en bibliotheque: les 5 mediations
La mediation en bibliotheque: les 5 mediations
 
Archives : La fabuleuse histoire de l'Hôpital d'Argenteuil
Archives : La fabuleuse histoire de l'Hôpital d'ArgenteuilArchives : La fabuleuse histoire de l'Hôpital d'Argenteuil
Archives : La fabuleuse histoire de l'Hôpital d'Argenteuil
 
Atelier Ecrire pour le web - Université de Genève - Droit de citation
Atelier Ecrire pour le web - Université de Genève - Droit de citationAtelier Ecrire pour le web - Université de Genève - Droit de citation
Atelier Ecrire pour le web - Université de Genève - Droit de citation
 
Et si on communiquait autrement valmedia 09.02.2012
Et si on communiquait autrement valmedia 09.02.2012Et si on communiquait autrement valmedia 09.02.2012
Et si on communiquait autrement valmedia 09.02.2012
 
Hin zu neuen ditgitalen nutzungen
Hin zu neuen ditgitalen nutzungen Hin zu neuen ditgitalen nutzungen
Hin zu neuen ditgitalen nutzungen
 
Outils et usages numeriques - ADBS LR - 15.04.2011
Outils et usages numeriques - ADBS LR - 15.04.2011Outils et usages numeriques - ADBS LR - 15.04.2011
Outils et usages numeriques - ADBS LR - 15.04.2011
 
Documentaliste dans un environnement numérique
Documentaliste dans un environnement numériqueDocumentaliste dans un environnement numérique
Documentaliste dans un environnement numérique
 

Dernier

Proyecto Erasmus Jardineros y jardineras de paz
Proyecto Erasmus Jardineros y jardineras de pazProyecto Erasmus Jardineros y jardineras de paz
Proyecto Erasmus Jardineros y jardineras de paz
Morzadec Cécile
 
Bibliothèque de L'Union - Bilan de l'année 2023
Bibliothèque de L'Union - Bilan de l'année 2023Bibliothèque de L'Union - Bilan de l'année 2023
Bibliothèque de L'Union - Bilan de l'année 2023
Bibliothèque de L'Union
 
Iris van Herpen. pptx
Iris         van        Herpen.      pptxIris         van        Herpen.      pptx
Iris van Herpen. pptx
Txaruka
 
cours-LasergrammetrieLe « LiDAR», de l’anglais « Light.pptx
cours-LasergrammetrieLe « LiDAR», de l’anglais « Light.pptxcours-LasergrammetrieLe « LiDAR», de l’anglais « Light.pptx
cours-LasergrammetrieLe « LiDAR», de l’anglais « Light.pptx
AbdessamadAmimi1
 
Veille Audocdi 90 - mois de juin 2024.pdf
Veille Audocdi 90 - mois de juin 2024.pdfVeille Audocdi 90 - mois de juin 2024.pdf
Veille Audocdi 90 - mois de juin 2024.pdf
frizzole
 
BATIMENT 5.pptx. Fil français tourné en France
BATIMENT 5.pptx. Fil français tourné en FranceBATIMENT 5.pptx. Fil français tourné en France
BATIMENT 5.pptx. Fil français tourné en France
Txaruka
 
Textes de famille concernant les guerres V2.pdf
Textes de famille concernant les guerres V2.pdfTextes de famille concernant les guerres V2.pdf
Textes de famille concernant les guerres V2.pdf
Michel Bruley
 

Dernier (7)

Proyecto Erasmus Jardineros y jardineras de paz
Proyecto Erasmus Jardineros y jardineras de pazProyecto Erasmus Jardineros y jardineras de paz
Proyecto Erasmus Jardineros y jardineras de paz
 
Bibliothèque de L'Union - Bilan de l'année 2023
Bibliothèque de L'Union - Bilan de l'année 2023Bibliothèque de L'Union - Bilan de l'année 2023
Bibliothèque de L'Union - Bilan de l'année 2023
 
Iris van Herpen. pptx
Iris         van        Herpen.      pptxIris         van        Herpen.      pptx
Iris van Herpen. pptx
 
cours-LasergrammetrieLe « LiDAR», de l’anglais « Light.pptx
cours-LasergrammetrieLe « LiDAR», de l’anglais « Light.pptxcours-LasergrammetrieLe « LiDAR», de l’anglais « Light.pptx
cours-LasergrammetrieLe « LiDAR», de l’anglais « Light.pptx
 
Veille Audocdi 90 - mois de juin 2024.pdf
Veille Audocdi 90 - mois de juin 2024.pdfVeille Audocdi 90 - mois de juin 2024.pdf
Veille Audocdi 90 - mois de juin 2024.pdf
 
BATIMENT 5.pptx. Fil français tourné en France
BATIMENT 5.pptx. Fil français tourné en FranceBATIMENT 5.pptx. Fil français tourné en France
BATIMENT 5.pptx. Fil français tourné en France
 
Textes de famille concernant les guerres V2.pdf
Textes de famille concernant les guerres V2.pdfTextes de famille concernant les guerres V2.pdf
Textes de famille concernant les guerres V2.pdf
 

L' Analyse documentaire : indexation, classification, clusters

  • 1. Historisches Institut Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Jean-Philippe Accart, MAS ALIS 2014-2016 15 août 2015 Modul/Module 2c 1
  • 2. © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 2 Historisches Institut Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Objectifs du cours - Montrer les différences entre indexation manuelle et automatique - Expliquer leur utilité / à la recherche d’information - Idem pour les classifications - Introduire la notion de clusters
  • 3. © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 3 Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut Sommaire Introduction : Retours sur la recherche d’information / à la notion d’info-obésité • L’indexation manuelle • L’indexation automatique • Les classifications • Les clusters
  • 4. © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 4 Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Les contenus (contents) et la technologie Historisches Institut
  • 5. © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 5 Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut Les contenus (contents) et la technologie Les contenus d’information sont multiples: - Revues, presse, livres… papier et numériques - Internet, Intranet, réseaux d’entreprise - Emails, documents internes - Réseaux sociaux, infographies
  • 6. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 6 Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut L e s d o n n é e s n L Les données non structurées (source http://www.idc.com/)
  • 7. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 7 Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut Le modèle classique de la recherche d’information (1)
  • 8. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 8 Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut Le modèle classique de la recherche d’information (2)
  • 9. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 9 Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut
  • 10. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut Indexation/Classification/Clusters 10 © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters
  • 11. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 11 Modèles de la recherche d’information sur les moteurs de recherche 3 paramètres sont à considérer: -> Représentations de documents et de la recherche (traduction informatique) -> Stratégies élaborées de recherche pour des résultats pertinents -> Méthodes de ranking 3 modèles de recherche: - Booléenne - Vectorielle - En utilisant les probabilités
  • 12. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 12 II – Indexation manuelle et automatique
  • 13. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 13 II – Indexation manuelle • Indexation par dérivation – Les mots-clés servant à l‘indexation sont dérivés du document et „normalisés“ • Indexation par attribution – Les mots-clés sont attribués à un document en utilisant une terminologie autorisée (thesaurus, ontologie, index…) Elle détermine les sujets importants du document. Elle pose la question : qu’est-ce qu’un sujet pertinent ? Fondée sur la lecture humaine et la capacité de comprendre un document.
  • 14. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 14 II – Indexation automatique Elle est fondée sur la fréquence des termes trouvés dans un document. Fréquence relative versus absolue - Par document - Relative par rapport à une collection de documents - Elimination des stopswords (mots vides : « le », « la », « de », « du », « ce »…) Fréquence des termes est reliée à la pertinence: sujets principaux sont plus fréquents.
  • 15. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 15 II – Indexation automatique 3 modèles: - Booléen - Vectoriel - Probabiliste
  • 16. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut Indexation/Classification/Clusters 16 II – Indexation automatique : Modèle booléen Les vecteurs créés (les termes) sont libres. Ils sont générés par hypothèse : Soit B la base vectorielle des mots contenus dans le document. Toute requête R est traitée de la même manière et ne contient que les mots significatifs. Le vecteur (le terme) de la requête est l’union des vecteurs de ses termes significatifs dans B. Le résultat peut être nul.
  • 17. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut Indexation/Classification/Clusters 17 II – Indexation automatique : Modèle vectoriel • A partir d‘un ensemble de termes, normalisation des termes et élimination des stopwords • Création d‘une matrice avec les termes restant pour chaque document
  • 18. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 17 II – Indexation automatique : Modèle probabiliste • Mesure la probabilité de pertinence d’un document par rapport à une requête • Utilise 2 probabilités pour chaque document : - la probabilité de pertinence du document D, P(per/D), - la probabilité de non pertinence du document D,P(nonper/D) • La fonction de recherche g(D) donne un ordonnancement des documents: g(D) = (P(per/D)/P(nonper/D)) • Probabilités calculées en fonction des termes d’indexation de la base de données
  • 19. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 18 III – Les classifications • Classification manuelle : on attribue manuellement des classes prédéfinies à des documents. • Classification automatique : – on attribue automatiquement des classes prédéfinies à des documents – on regroupe des documents automatiquement dans des clusters
  • 20. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 19 IV – Les clusters • Il s‘agit de regrouper des documents similaires dans des clusters (ensembles) de documents • Les documents regroupés dans un cluster doivent être similaires • Les documents de clusters différents doivent être dans des clusters différents • Les clusters sont la forme la plus courante d‘un savoir non contrôlé • Non contrôlé = les données ne sont pas annotées
  • 21. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 20 IV – Les clusters
  • 22. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 21 IV – Les clusters • Ce qu‘il faut retenir de la notion de cluster ou de clustering : – Si un terme trouvé dans un cluster est pertinent, alors les autres termes du cluster le sont également (principe de similarité) – Contrairement à une liste de résultats fournis par un moteur de recherche, la RI avec clustering affiche les documents par similarité donc + de chances de fiabilité de la recherche – http://vivisimo.com (IBM) est un système fondé sur les clusters
  • 23. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 22 IV – Les clusters Applications pratiques: - En biologie : pour les plantes, le regroupement de gènes - En médecine: imagerie médicale - En marketing et business: segments de marchés, clients - Réseaux sociaux: reconnaissance de communautés - Sciences sociales: analyse criminologique - Climatologie : analyse des températures et des océans…
  • 24. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 23 Bibliographie AMAR M., Les Fondements théoriques de l’indexation : une approche linguistique, Paris, ADBS, 2000. CHARTRON G., DALBIN S., MONTEIL M.-G., VÉRILLON M., « Indexation manuelle et indexation automatique : dépasser les oppositions », Documentaliste/sciences de l’information, vol. 26, no 4-5, 1989, p. 181-187. CHAUMIER J., DEJEAN M., « L’indexation documentaire : de l’analyse conceptuelle humaine à l’analyse automatique morphosyntaxique », Documentaliste/sciences de l’information, vol. 27, no 6, novembre-décembre 1990, p. 275-279. GARFIELD E., « “Science Citation Index” – A New Dimension in Indexing », Science, New Series, vol. 144, n° 3619, 1964, p. 649-654. JOLION J.-M. (dir.), L’Indexation, Paris, Hermès Science Publications, 2001. Numéro de : Document numérique, 2000, vol. 4, no 1-2. MENON B., « Quelle indexation pour l’information professionnelle ? », dans L’Information professionnelle, sous la dir. de Viviane Clavier et Céline Paganelli, Paris, Hermes-Lavoisier, 2013, p. 83-105. TIMIMI I., KOVACS S. (coord.), Indice, index, indexation, Paris, ADBS, 2006. Normes AFNOR, Norme NF Z 47-102 : principes généraux pour l’indexation des documents, Paris, AFNOR, 1996.
  • 25. Inhaltserschliessung (I-II): Manuelle und automatische Indexierung Analyse documentaire (I-II): indexation manuelle et automatique Historisches Institut © Jean-Philippe Accart, MAS ALIS 2014/2016 – Indexation/Classification/Clusters 24 Guide d’indexation Rameau, Paris, BnF, 2010, en ligne : <http://guiderameau.bnf.fr/>.