Intelligence artificielle et
gestion documentaire :
révolution et synergie
Antonin Benoît Diouf
Conservateur de bibliotheques
Introduction
Contexte du colloque: IA et Gestion documentaire
Objectifs de la présentation:
Aider a la compréhension la galaxie IA : composantes essentielles et mode
opérationnel
Montrer en quoi l’IA est une révolution (non une evolution) dans l'écosystème de
la gestion documentaire
Démontrer la synergie entre compétences documentaires et compétences
informatiques nécessaires a la rentabilisation des processus IA en documentation
Contexte et enjeux de
l'IA dans la gestion
documentaire
Définition et concepts clés
Intelligence
artificielle : simuler
l'intelligence humaine
avec des machines.
Gestion documentaire:
processus de gestion,
stockage, et diffusion
des documents.
Algorithmes : séries
d'instructions pour
résoudre des problèmes
ou réaliser des tâches.
IA générative : type d'IA
capable de créer de nouveaux
contenus
Traitement du Langage
naturel (NLP) : domaine de l’IA
qui traite la compréhension et
la génération du langage
humain et permettre aux
machines d'interagir avec lui
Machine Learning : sous-
domaine de l'IA où les
machines apprennent à
partir de données pour
faire des prédictions ou
des décisions sans être
explicitement
programmées.
LLM : Modèle de langage avancé
(GPT) capable de traiter et
générer du texte avec une
compréhension contextuelle,
entraîné sur de vastes corpus
pour accomplir diverses tâches
de traitement du langage naturel
Prompt :
commande ou
question donnée à
une IA pour
obtenir une
réponse ou une
action spécifique.
Chaine de pensée (CoT) :
permet de formuler des
demandes complexes en
encourageant un modèle à
prendre en compte des
étapes intermédiaires dans
son raisonnement.
API (Application
Programming Interface) :
interface permettant aux
applications de
communiquer entre elles
et d'échanger des données
JSON (JavaScript Object Notation) : format de
données textuelles qui représente des objets
structurés et permet d'échanger des données entre
un serveur et une application web. Lisible et facile à
écrire pour les humains et simple à analyser et à
générer pour les machines. Indépendant du langage
de programmation
Enquête en ligne
Méthodologie de l’enquête
Objectif : comprendre les
perceptions et les usages de l'IA
par les professionnels africains
de divers secteurs.
Échantillon/Population : 54
professionnels de l'information
documentaire et autres en
Afrique anglophone et
francophone
Questions clés : compréhension
de l’IA, usage actuel de l'IA,
avantages perçus, attentes
professionnelles, préoccupations
éthiques, réflexions
prospectives.
Canal : Google Form
Analyse des résultats
Profil des Répondants
• Bibliothécaires, Documentalistes,
Archivistes : 45%
• Économistes, Gestionnaires, Analystes : 30%
• Autres professions
(journalistes, informaticiens,
etc.) : 25%
Expérience professionnelle
• Moins de 5 ans : 26%
• 5 à 10 ans : 32%
• 11 à 20 ans : 24%
• Plus de 20 ans : 18%
Connaissance de l'IA
L'évaluation de la connaissance de l'IA parmi
les répondants révèle :
• Aucune connaissance : 13%
• Connaissance limitée : 41%
• Connaissance modérée : 35%
• Bonne connaissance : 11%
79% ont une connaissance limitée de l'IA,
soulignant un besoin crucial de formation.
Utilisation Actuelle de l'IA
• 62% ont déjà utilisé des outils basés sur l'IA
dans leur travail. Parmi les outils les plus
utilisés, on retrouve principalement :
Applications de l'IA
Les tâches pour lesquelles l'IA est
principalement utilisée ou envisagée
incluent :
• Recherche d'informations : 61%
• Gestion de collections numériques : 22%
• Services de référence : 28%
• Catalogage et classification : 20%
• Préservation conservation : 9%
• Sans réponse : 33%
La recherche d'informations est l'application
la plus courante, ce qui correspond aux
capacités des outils d'IA disponibles.
Avantages perçus de l'IA
Automatisation des
tâches répétitives
Amélioration de l'accès à
l'information
Traitement de grandes
quantités de données
Personnalisation des
services
Ces avantages montrent
que les professionnels
voient l'IA comme un
moyen d'améliorer
l'efficacité et la qualité
de leur travail
Appréciation Générale
Positive: 80% voient l'IA
comme un atout.
Négative: 20% craignent
pour l'éthique et la
confidentialité.
Défis et obstacles
Les défis à l'adoption de l'IA incluent :
• Manque de compétences et de formation
• Coût élevé des technologies d'IA
• Questions éthiques et biais algorithmiques
• Manque d'infrastructures technologiques
Le manque de compétences et le coût sont les obstacles les plus
significatifs, suggérant un besoin de programmes de formation
abordables et d'investissements dans les infrastructures.
Perceptions d’avenir, perspectives
IA et avenir professionnel : remplacement ?
• Non : 65%
• Peut-être : 25%
• Oui : 10%
Intérêt pour la formation
• Une grande majorité (85%) des répondants est intéressée par une
• formation certifiante sur l'utilisation de l'IA dans leur domaine,
ce qui reflète la reconnaissance de l'importance croissante de l’IA.
Espoirs et préoccupations
• Les espoirs incluent une amélioration de l'efficacité professionnelle et de l'accès à l'information.
• Les préoccupations concernent principalement les questions éthiques, la protection des données
personnelles et l'impact potentiel sur l'emploi.
Révolution des outils
et méthodologies
Fonctions et Services
(1) Collecte de données
Objet : automatiser la
collecte des données à partir
de multiples sources.
Algorithme : utiliser un script
pour extraire
automatiquement des
informations de sites web ou
plateformes documentaires,
bases de données...
Code : exemple simple en HTML/JavaScript
Rendre fonctionnel
Intégration dans un
système documentaire :
adapter l'URL de l'API pour
qu'elle pointe vers la source
de données documentaire
pertinente.
Sécurité : assurer une
connexion sécurisée avec
des clés API et des
certificats SSL.
Personnalisation : modifier
le script pour extraire les
types spécifiques de
données nécessaires pour
le système documentaire.
(2) Classification automatique des documents
Objet : catégoriser les documents en utilisant des
algorithmes de machine learning.
Algorithme : utiliser un modèle de classification
(portée universelle, local) pour organiser les
documents en catégories.
Code : exemple (HTML/JavaScript)
Rendre fonctionnel
Modèle de classification :
utiliser ou former un modèle de
Machine Learning adapté aux
types de documents spécifiques
(avec vocabulaire contrôlé,
diapo suivante)
API : adapter l'API pour recevoir
et traiter le texte des documents
du système documentaire
Interface utilisateur : intégrer ce
script dans l'interface utilisateur
(Backend) du système
documentaire pour permettre
une classification en temps réel.
Modèle de classification avec
thésaurus : utiliser ou former un
modèle de Machine Learning adapté
aux types de documents spécifiques,
en se basant sur un thésaurus
existant, comme le Macrothesaurus
de l'OCDE.
API : adapter l'API pour recevoir le
texte des documents et la catégorie
correspondante déterminée par la
correspondance avec le thésaurus.
Interface utilisateur : Intégrer ce
script dans l'interface utilisateur
(Backend) du système documentaire
pour permettre une classification en
temps réel, en utilisant le thésaurus
pour améliorer la précision de la
classification.
Rendre fonctionnel
(3) Analyse prédictive pour la gestion des collections
Objet : prévoir les
besoins futurs en
documents pour
optimiser les
collections.
Traitement du Langage naturel (rappel) : domaine
de l’IA qui traite la compréhension et la
génération du langage humain et permettre aux
machines d'interagir avec lui. Permet l’analyse
textuelle dont les donnees extraites servent de
base a l'algorithme de Machine learning
Algorithme :
utiliser des
modèles
prédictifs pour
estimer la
demande future.
Code : exemple (HTML/JavaScript) Rendre fonctionnel
Données historiques :
collecter et formater les
données historiques de
gestion des collections
Modèle prédictif : utiliser un
algorithme de prévision
adapté à la gestion des
collections
Intégration : Intégrer ce script
dans le système de gestion des
collections pour des prévisions
en temps réel.
JavaScript : pour intégrer des
fonctionnalités d'IA dans les interfaces
web des Bbliothèques, Archives, etc.
Explication pour l’intégration dans un système
documentaire
1. Collecte des données historiques :
• recueillir les données historiques des collections depuis le système
documentaire existant.
• formater ces données sous forme de tableau pour les inclure dans la variable
historicalData.
2. Modification de l'URL de l’API :
• adapter l'URL de l'API pour qu'elle pointe vers l'endpoint (point de terminaison,
extrémité d'un canal de communication) de prédiction de votre organisation.
3. Sécurité :
• assurer une connexion sécurisée avec l'API en utilisant des clés API et des
certificats SSL.
4. Interface utilisateur :
• intégrer ce script dans l'interface utilisateur du système documentaire pour
permettre des prédictions en temps réel à partir de l'historique des collections.
Exemples concrets
d’applications IA en
gestion
documentaire
Avec des cas de scenarios realistes qui
peuvent etre la base d’algorithme et de
code correspondant pour l’execution et
la resolution de besoin
Cas 1 : implémentation de l'IA dans une BU
Scénario
Problème:
• l'université a une grande collection de documents qui nécessitent une indexation efficace pour
une recherche rapide.
Solution:
• mise en place d'un système d'indexation automatique basé sur l’IA.
Étapes:
• collecte des métadonnées des documents.
• utilisation d'algorithmes de traitement du langage naturel pour extraire les mots-clés et les
concepts principaux.
• indexation des documents selon les mots-clés extraits.
• intégration de la recherche par mots-clés dans le portail de la bibliothèque.
Résultats:
• réduction du temps d'indexation de 50%.
• amélioration de la précision des résultats de recherche.
Cas 2 : utilisation de l’IA en Archives patrimoniales
Scénario
Problème
• les archives patrimoniales contiennent de nombreux documents anciens et fragiles nécessitant une
conservation et une restauration numériques.
Solution:
• utilisation de l'IA pour la restauration numérique des documents.
Étapes:
• numérisation des documents anciens.
• utilisation d'algorithmes de restauration d'image pour améliorer la qualité des documents numérisés.
• reconnaissance de caractères et de textes (OCR & OTR exemple outil TRANSKRIBUS pour des manuscrits)
• Indexation plein-texte automatisée avec arborescence de mots-clefs
• classification automatique des documents restaurés dans des catégories appropriées.
• stockage sécurisé des documents restaurés dans une base de données numérique.
Résultats:
• amélioration de la qualité des documents numérisés.
• accès facilité aux documents historiques restaurés.
Cas 3 : catalogage automatisé
Scénario : utilisation d'un modèle de langage
pour automatiser la création de fiches de
catalogage pour de nouveaux ouvrages.
Étapes :
• collecte des infos de base (titre, auteur, ISBN,
table des matières, photo de couverture du
document pour littérature grise par exemple)
• utilisation d'un LLM pour générer description
et mots-clés
• création automatique de la fiche de
catalogage
• vérification par le catalogueur
• intégration dans le système de gestion (SIGB,
Bibliothèque numérique) : import de notice(s)
Cas 4 : archivage en municipalité
Scénario : utilisation d'un modèle de langage pour
créer un plan de classement de l'état-civil.
Étapes:
• Collecte des informations sur les documents
d'état-civil:
✓ rassembler les informations sur les types de documents
(naissance, mariage, décès).
• Analyse des catégories existantes:
✓ utiliser un LLM pour analyser les catégories et sous-
catégories actuelles.
• Génération d'un plan de classement:
✓ le modèle génère un plan de classement détaillé pour
les documents d'état-civil.
• Revue et ajustement:
✓ l'archiviste révise et ajuste le plan de classement
proposé.
• Implémentation du plan de classement:
✓ mettre en œuvre le plan de classement dans le système
d'archivage.
Cas 5 : Documentaliste et création de
rapports
Scénario : utilisation d'un modèle de langage pour créer des rapports
de recherche à partir de documents internes en entreprise.
Étapes:
• Collecte des documents internes:
✓rassembler les documents pertinents (rapports, études, notes de
service).
• Analyse des documents par le LLM:
✓utiliser le modèle pour analyser le contenu des documents.
• Génération de rapports de synthèse:
✓le modèle crée un rapport de synthèse basé sur les informations
analysées.
• Revue et personnalisation:
✓le documentaliste révise et personnalise le rapport généré.
• Distribution du rapport:
✓diffuser le rapport aux parties prenantes de l'entreprise.
Compétences
humaines et
interaction avec l'IA
Comprendre le fonctionnement
des LLM
• Voir diapo 18 pour les
algorithmes
• Token (jeton) :
✓petite unité de texte, comme un mot,
une lettre ou une partie de mot, utilisée
par les modèles d'intelligence artificielle
pour lire et créer du texte.
✓élément de base que ces modèles
utilisent pour comprendre et générer du
langage
Utilisation de token en cours de generation. Le
code (python) montre comment un modèle de
langage comme GPT-3 ou GPT-2 utilise des tokens
pour générer du texte (NLP)
Explication du Code
1.Chargement : GPT2Tokenizer et GPT2LMHeadModel chargent le
modèle et le tokenizer.
2.Texte d’entrée : "L'intelligence artificielle".
3.Tokenisation : tokenizer.encode convertit le texte en tokens.
4.Génération : model.generate utilise les tokens pour produire du texte.
5.Décodage : tokenizer.decode convertit les tokens générés en texte
lisible.
6.Résultat : le modèle génère un texte cohérent à partir de
"L'intelligence artificielle".
Développement de prompts efficaces
Techniques : comment
formuler des requêtes
claires et précises pour
l'IA générative.
Méthodes : REACTOR.
Chaîne de pensée
(CoT)
Prompt : Instruction ou question posée à une IA pour obtenir une réponse ou une action
spécifique.
Méthode “Chain-of-
Thought” (CoT)
EXEMPLE
Cas pratiques de prompts
Agis comme un catalogueur en bibliothèque universitaire avec comme attribution la
description bibliographique de la littérature grise. À partir de l'image ci-jointe, il faut
cataloguer la thèse correspondante en UNIMARC et MARC21. La description doit être la
plus complète possible. Indexe le document et fourni une liste de cinq mots-clefs ou
sujets et mets-les dans les champs MARC correspondant. Ensuite construit des indices
de classification en CDU et Dewey et inclus-les dans leur champ correspondant. Propose
aussi un résumé du document à ajouter à la description
Catalogage &
Indexation
« Tu es un bibliothécaire. Réalise une analyse bibliométrique complète des publications de
l’enseignant-chercheur [NOM] de [Universite au Sénégal], en utilisant son ORCID…, par
exemple. L'analyse doit inclure les éléments suivants : Analyse de citation, Indice H,
Cartographie de ses citations individuelles et co-citations, Analyse des revues qui l’ont publié
(facteur d'impact, taux de citation, etc.) »
Analyse
bibliométrique
« Agis comme un bibliothécaire responsable d’un service de référence.
Réalise une recherche bibliographique complète sur les impacts du
changement climatique sur l'agriculture en Afrique de l'Ouest. Cette
recherche doit inclure :
Des articles scientifiques récents : liste les articles scientifiques récents sur
les impacts du changement climatique sur l'agriculture en Afrique de
l'Ouest.
Des études de cas spécifiques : fournis des études de cas sur les effets du
changement climatique sur la production agricole au Sénégal et au Mali.
Des rapports gouvernementaux ou internationaux : quels sont les rapports
des Nations Unies sur l'adaptation de l'agriculture africaine au changement
climatique ?
Des résumés d'articles : donne un résumé des principaux articles de
recherche sur les stratégies de résilience agricole face au changement
climatique en Afrique de l'Ouest. Complete-les avec les sources
bibliographiques en style de citation APA.
Assures-toi que chaque section de la recherche soit bien documentée et
fournisse des informations détaillées et pertinentes pour une
compréhension approfondie du sujet."
Recherche
d’informations
Défis éthiques et pratiques
Questions éthiques en Bibliothèques et Archives
Respect de la vie privée : ne pas garantir la confidentialité et de la sécurité des données personnelles
traitées. (cf. exemple sur analyse bibliométrique)
• les systèmes d'IA peuvent indexer et organiser des documents contenant des informations
personnelles.
• il est essentiel de garantir que ces documents ne divulguent pas d'informations sensibles.
Illustration : lors de la numérisation et de l'indexation de documents d'état civil, il est important de
masquer les informations personnelles telles que les numéros de sécurité sociale ou les adresses.
Biais algorithmiques : ne pas assurer l'équité et l'impartialité des algorithmes (Favorisation de
certaines données ou groupes, entraînant des décisions inéquitables ou discriminatoires.).
• un système d'IA utilisé pour recommander des livres aux utilisateurs peut être biaisé s'il a été
entraîné sur des données qui favorisent certains genres ou auteurs.
• cela peut entraîner une négligence de la diversité des collections.
Illustration : un algorithme favorise inconsciemment les œuvres d'auteurs masculins africains,
réduisant la visibilité des œuvres d'auteurs féminins ou non africains
Défis pratiques. 1, Intégration
Adapter les nouveaux outils d'IA aux flux de travail existants dans les
Bibliothèques et Archives.
• Importance : harmoniser les technologies d'IA avec les processus en place
pour maximiser leur efficacité sans perturber les opérations courantes.
Exemples :
• Formation du personnel :
✓comprendre le fonctionnement et l'intégration des nouveaux outils dans les
tâches quotidiennes.
✓Illustration : formation des bibliothécaires à un système d'IA pour l'indexation
automatique.
• Compatibilité des systèmes :
✓assurer la compatibilité des nouveaux outils d'IA avec les systèmes de gestion
existants.
✓ Illustration : utilisation d'un logiciel d'IA pour la reconnaissance de texte
compatible avec le système de gestion des archives de l’institution.
Défis pratiques. 2, Coût et accessibilité
Solutions d'IA abordables et accessibles à toutes les institutions.
• Importance : rendre les bénéfices de l'IA disponibles
indépendamment de la taille ou du budget des institutions.
Exemples :
• Solutions abordables :
✓développer et promouvoir des outils d'IA open source ou à
faible coût.
✓Illustration : utilisation d'un outil open source pour la
recommandation de livres dans une petite bibliothèque
municipale.
• Accessibilité des ressources :
✓assurer que les ressources et outils d'IA sont accessibles et
utilisables par toutes les institutions.
✓Illustration : formation (en ligne) gratuite pour l'utilisation de
l'IA dans un centre d'archives en zone économiquement
défavorisée.
Propositions
pour l’avenir
Évolution des programmes
de formation
Curricula : Inclure des modules sur
l'IA et les compétences numériques.
Filières : Informatique applicative
a la documentation (cibles :
développeurs, ingenieurs systèmes
& reseaux…). => Specialisation en
information documentaire
Approche Knowledge Management
Communautés de pratiques
• encourager l'échange de
connaissances et d'expériences entre
professionnels (inter pares) et autres
métiers et fonctions partenaires
(Informatique).
• plateformes collaboratives sur des
projets et programmes
Conclusion
L'IA comme accélérateur
Importance de l'IA pour les transitions documentaires :
• l'IA permet d'automatiser et d'optimiser les processus
documentaires, rendant les institutions plus efficaces et
réactives.
• facilite l'accès à l'information, améliore la qualité des services et
réduit les délais de traitement.
Importance de l'IA pour la souveraineté documentaire :
• en adoptant l'IA, les institutions africaines peuvent préserver
leur patrimoine culturel et historique, tout en modernisant leurs
systèmes de gestion documentaire pour un avenir plus
autonome et innovant en la matière.
• elle favorise le développement de solutions technologiques
adaptées aux besoins locaux, permettant à l'Afrique de contrôler
ses propres données et de construire une infrastructure
documentaire robuste et progressivement indépendante
MERCI ! a
EBAD pour
HIER &
AUJOURD’HUI https://antoninbenoitdiouf.com

Intelligence artificielle et gestion Documentaire : revolution_synergie_ABDiouf.pdf

  • 1.
    Intelligence artificielle et gestiondocumentaire : révolution et synergie Antonin Benoît Diouf Conservateur de bibliotheques
  • 2.
    Introduction Contexte du colloque:IA et Gestion documentaire Objectifs de la présentation: Aider a la compréhension la galaxie IA : composantes essentielles et mode opérationnel Montrer en quoi l’IA est une révolution (non une evolution) dans l'écosystème de la gestion documentaire Démontrer la synergie entre compétences documentaires et compétences informatiques nécessaires a la rentabilisation des processus IA en documentation
  • 3.
    Contexte et enjeuxde l'IA dans la gestion documentaire
  • 4.
    Définition et conceptsclés Intelligence artificielle : simuler l'intelligence humaine avec des machines. Gestion documentaire: processus de gestion, stockage, et diffusion des documents. Algorithmes : séries d'instructions pour résoudre des problèmes ou réaliser des tâches. IA générative : type d'IA capable de créer de nouveaux contenus Traitement du Langage naturel (NLP) : domaine de l’IA qui traite la compréhension et la génération du langage humain et permettre aux machines d'interagir avec lui Machine Learning : sous- domaine de l'IA où les machines apprennent à partir de données pour faire des prédictions ou des décisions sans être explicitement programmées. LLM : Modèle de langage avancé (GPT) capable de traiter et générer du texte avec une compréhension contextuelle, entraîné sur de vastes corpus pour accomplir diverses tâches de traitement du langage naturel Prompt : commande ou question donnée à une IA pour obtenir une réponse ou une action spécifique. Chaine de pensée (CoT) : permet de formuler des demandes complexes en encourageant un modèle à prendre en compte des étapes intermédiaires dans son raisonnement. API (Application Programming Interface) : interface permettant aux applications de communiquer entre elles et d'échanger des données JSON (JavaScript Object Notation) : format de données textuelles qui représente des objets structurés et permet d'échanger des données entre un serveur et une application web. Lisible et facile à écrire pour les humains et simple à analyser et à générer pour les machines. Indépendant du langage de programmation
  • 5.
  • 6.
    Méthodologie de l’enquête Objectif: comprendre les perceptions et les usages de l'IA par les professionnels africains de divers secteurs. Échantillon/Population : 54 professionnels de l'information documentaire et autres en Afrique anglophone et francophone Questions clés : compréhension de l’IA, usage actuel de l'IA, avantages perçus, attentes professionnelles, préoccupations éthiques, réflexions prospectives. Canal : Google Form
  • 7.
    Analyse des résultats Profildes Répondants • Bibliothécaires, Documentalistes, Archivistes : 45% • Économistes, Gestionnaires, Analystes : 30% • Autres professions (journalistes, informaticiens, etc.) : 25% Expérience professionnelle • Moins de 5 ans : 26% • 5 à 10 ans : 32% • 11 à 20 ans : 24% • Plus de 20 ans : 18% Connaissance de l'IA L'évaluation de la connaissance de l'IA parmi les répondants révèle : • Aucune connaissance : 13% • Connaissance limitée : 41% • Connaissance modérée : 35% • Bonne connaissance : 11% 79% ont une connaissance limitée de l'IA, soulignant un besoin crucial de formation. Utilisation Actuelle de l'IA • 62% ont déjà utilisé des outils basés sur l'IA dans leur travail. Parmi les outils les plus utilisés, on retrouve principalement :
  • 8.
    Applications de l'IA Lestâches pour lesquelles l'IA est principalement utilisée ou envisagée incluent : • Recherche d'informations : 61% • Gestion de collections numériques : 22% • Services de référence : 28% • Catalogage et classification : 20% • Préservation conservation : 9% • Sans réponse : 33% La recherche d'informations est l'application la plus courante, ce qui correspond aux capacités des outils d'IA disponibles.
  • 9.
    Avantages perçus del'IA Automatisation des tâches répétitives Amélioration de l'accès à l'information Traitement de grandes quantités de données Personnalisation des services Ces avantages montrent que les professionnels voient l'IA comme un moyen d'améliorer l'efficacité et la qualité de leur travail Appréciation Générale Positive: 80% voient l'IA comme un atout. Négative: 20% craignent pour l'éthique et la confidentialité.
  • 10.
    Défis et obstacles Lesdéfis à l'adoption de l'IA incluent : • Manque de compétences et de formation • Coût élevé des technologies d'IA • Questions éthiques et biais algorithmiques • Manque d'infrastructures technologiques Le manque de compétences et le coût sont les obstacles les plus significatifs, suggérant un besoin de programmes de formation abordables et d'investissements dans les infrastructures.
  • 11.
    Perceptions d’avenir, perspectives IAet avenir professionnel : remplacement ? • Non : 65% • Peut-être : 25% • Oui : 10% Intérêt pour la formation • Une grande majorité (85%) des répondants est intéressée par une • formation certifiante sur l'utilisation de l'IA dans leur domaine, ce qui reflète la reconnaissance de l'importance croissante de l’IA. Espoirs et préoccupations • Les espoirs incluent une amélioration de l'efficacité professionnelle et de l'accès à l'information. • Les préoccupations concernent principalement les questions éthiques, la protection des données personnelles et l'impact potentiel sur l'emploi.
  • 12.
    Révolution des outils etméthodologies Fonctions et Services
  • 13.
    (1) Collecte dedonnées Objet : automatiser la collecte des données à partir de multiples sources. Algorithme : utiliser un script pour extraire automatiquement des informations de sites web ou plateformes documentaires, bases de données...
  • 14.
    Code : exemplesimple en HTML/JavaScript Rendre fonctionnel Intégration dans un système documentaire : adapter l'URL de l'API pour qu'elle pointe vers la source de données documentaire pertinente. Sécurité : assurer une connexion sécurisée avec des clés API et des certificats SSL. Personnalisation : modifier le script pour extraire les types spécifiques de données nécessaires pour le système documentaire.
  • 15.
    (2) Classification automatiquedes documents Objet : catégoriser les documents en utilisant des algorithmes de machine learning. Algorithme : utiliser un modèle de classification (portée universelle, local) pour organiser les documents en catégories.
  • 16.
    Code : exemple(HTML/JavaScript) Rendre fonctionnel Modèle de classification : utiliser ou former un modèle de Machine Learning adapté aux types de documents spécifiques (avec vocabulaire contrôlé, diapo suivante) API : adapter l'API pour recevoir et traiter le texte des documents du système documentaire Interface utilisateur : intégrer ce script dans l'interface utilisateur (Backend) du système documentaire pour permettre une classification en temps réel.
  • 17.
    Modèle de classificationavec thésaurus : utiliser ou former un modèle de Machine Learning adapté aux types de documents spécifiques, en se basant sur un thésaurus existant, comme le Macrothesaurus de l'OCDE. API : adapter l'API pour recevoir le texte des documents et la catégorie correspondante déterminée par la correspondance avec le thésaurus. Interface utilisateur : Intégrer ce script dans l'interface utilisateur (Backend) du système documentaire pour permettre une classification en temps réel, en utilisant le thésaurus pour améliorer la précision de la classification. Rendre fonctionnel
  • 18.
    (3) Analyse prédictivepour la gestion des collections Objet : prévoir les besoins futurs en documents pour optimiser les collections. Traitement du Langage naturel (rappel) : domaine de l’IA qui traite la compréhension et la génération du langage humain et permettre aux machines d'interagir avec lui. Permet l’analyse textuelle dont les donnees extraites servent de base a l'algorithme de Machine learning Algorithme : utiliser des modèles prédictifs pour estimer la demande future.
  • 20.
    Code : exemple(HTML/JavaScript) Rendre fonctionnel Données historiques : collecter et formater les données historiques de gestion des collections Modèle prédictif : utiliser un algorithme de prévision adapté à la gestion des collections Intégration : Intégrer ce script dans le système de gestion des collections pour des prévisions en temps réel. JavaScript : pour intégrer des fonctionnalités d'IA dans les interfaces web des Bbliothèques, Archives, etc.
  • 21.
    Explication pour l’intégrationdans un système documentaire 1. Collecte des données historiques : • recueillir les données historiques des collections depuis le système documentaire existant. • formater ces données sous forme de tableau pour les inclure dans la variable historicalData. 2. Modification de l'URL de l’API : • adapter l'URL de l'API pour qu'elle pointe vers l'endpoint (point de terminaison, extrémité d'un canal de communication) de prédiction de votre organisation. 3. Sécurité : • assurer une connexion sécurisée avec l'API en utilisant des clés API et des certificats SSL. 4. Interface utilisateur : • intégrer ce script dans l'interface utilisateur du système documentaire pour permettre des prédictions en temps réel à partir de l'historique des collections.
  • 22.
    Exemples concrets d’applications IAen gestion documentaire Avec des cas de scenarios realistes qui peuvent etre la base d’algorithme et de code correspondant pour l’execution et la resolution de besoin
  • 23.
    Cas 1 :implémentation de l'IA dans une BU Scénario Problème: • l'université a une grande collection de documents qui nécessitent une indexation efficace pour une recherche rapide. Solution: • mise en place d'un système d'indexation automatique basé sur l’IA. Étapes: • collecte des métadonnées des documents. • utilisation d'algorithmes de traitement du langage naturel pour extraire les mots-clés et les concepts principaux. • indexation des documents selon les mots-clés extraits. • intégration de la recherche par mots-clés dans le portail de la bibliothèque. Résultats: • réduction du temps d'indexation de 50%. • amélioration de la précision des résultats de recherche.
  • 24.
    Cas 2 :utilisation de l’IA en Archives patrimoniales Scénario Problème • les archives patrimoniales contiennent de nombreux documents anciens et fragiles nécessitant une conservation et une restauration numériques. Solution: • utilisation de l'IA pour la restauration numérique des documents. Étapes: • numérisation des documents anciens. • utilisation d'algorithmes de restauration d'image pour améliorer la qualité des documents numérisés. • reconnaissance de caractères et de textes (OCR & OTR exemple outil TRANSKRIBUS pour des manuscrits) • Indexation plein-texte automatisée avec arborescence de mots-clefs • classification automatique des documents restaurés dans des catégories appropriées. • stockage sécurisé des documents restaurés dans une base de données numérique. Résultats: • amélioration de la qualité des documents numérisés. • accès facilité aux documents historiques restaurés.
  • 25.
    Cas 3 :catalogage automatisé Scénario : utilisation d'un modèle de langage pour automatiser la création de fiches de catalogage pour de nouveaux ouvrages. Étapes : • collecte des infos de base (titre, auteur, ISBN, table des matières, photo de couverture du document pour littérature grise par exemple) • utilisation d'un LLM pour générer description et mots-clés • création automatique de la fiche de catalogage • vérification par le catalogueur • intégration dans le système de gestion (SIGB, Bibliothèque numérique) : import de notice(s)
  • 26.
    Cas 4 :archivage en municipalité Scénario : utilisation d'un modèle de langage pour créer un plan de classement de l'état-civil. Étapes: • Collecte des informations sur les documents d'état-civil: ✓ rassembler les informations sur les types de documents (naissance, mariage, décès). • Analyse des catégories existantes: ✓ utiliser un LLM pour analyser les catégories et sous- catégories actuelles. • Génération d'un plan de classement: ✓ le modèle génère un plan de classement détaillé pour les documents d'état-civil. • Revue et ajustement: ✓ l'archiviste révise et ajuste le plan de classement proposé. • Implémentation du plan de classement: ✓ mettre en œuvre le plan de classement dans le système d'archivage.
  • 27.
    Cas 5 :Documentaliste et création de rapports Scénario : utilisation d'un modèle de langage pour créer des rapports de recherche à partir de documents internes en entreprise. Étapes: • Collecte des documents internes: ✓rassembler les documents pertinents (rapports, études, notes de service). • Analyse des documents par le LLM: ✓utiliser le modèle pour analyser le contenu des documents. • Génération de rapports de synthèse: ✓le modèle crée un rapport de synthèse basé sur les informations analysées. • Revue et personnalisation: ✓le documentaliste révise et personnalise le rapport généré. • Distribution du rapport: ✓diffuser le rapport aux parties prenantes de l'entreprise.
  • 28.
  • 29.
    Comprendre le fonctionnement desLLM • Voir diapo 18 pour les algorithmes • Token (jeton) : ✓petite unité de texte, comme un mot, une lettre ou une partie de mot, utilisée par les modèles d'intelligence artificielle pour lire et créer du texte. ✓élément de base que ces modèles utilisent pour comprendre et générer du langage Utilisation de token en cours de generation. Le code (python) montre comment un modèle de langage comme GPT-3 ou GPT-2 utilise des tokens pour générer du texte (NLP) Explication du Code 1.Chargement : GPT2Tokenizer et GPT2LMHeadModel chargent le modèle et le tokenizer. 2.Texte d’entrée : "L'intelligence artificielle". 3.Tokenisation : tokenizer.encode convertit le texte en tokens. 4.Génération : model.generate utilise les tokens pour produire du texte. 5.Décodage : tokenizer.decode convertit les tokens générés en texte lisible. 6.Résultat : le modèle génère un texte cohérent à partir de "L'intelligence artificielle".
  • 30.
    Développement de promptsefficaces Techniques : comment formuler des requêtes claires et précises pour l'IA générative. Méthodes : REACTOR. Chaîne de pensée (CoT) Prompt : Instruction ou question posée à une IA pour obtenir une réponse ou une action spécifique.
  • 31.
  • 32.
    Cas pratiques deprompts Agis comme un catalogueur en bibliothèque universitaire avec comme attribution la description bibliographique de la littérature grise. À partir de l'image ci-jointe, il faut cataloguer la thèse correspondante en UNIMARC et MARC21. La description doit être la plus complète possible. Indexe le document et fourni une liste de cinq mots-clefs ou sujets et mets-les dans les champs MARC correspondant. Ensuite construit des indices de classification en CDU et Dewey et inclus-les dans leur champ correspondant. Propose aussi un résumé du document à ajouter à la description Catalogage & Indexation « Tu es un bibliothécaire. Réalise une analyse bibliométrique complète des publications de l’enseignant-chercheur [NOM] de [Universite au Sénégal], en utilisant son ORCID…, par exemple. L'analyse doit inclure les éléments suivants : Analyse de citation, Indice H, Cartographie de ses citations individuelles et co-citations, Analyse des revues qui l’ont publié (facteur d'impact, taux de citation, etc.) » Analyse bibliométrique
  • 33.
    « Agis commeun bibliothécaire responsable d’un service de référence. Réalise une recherche bibliographique complète sur les impacts du changement climatique sur l'agriculture en Afrique de l'Ouest. Cette recherche doit inclure : Des articles scientifiques récents : liste les articles scientifiques récents sur les impacts du changement climatique sur l'agriculture en Afrique de l'Ouest. Des études de cas spécifiques : fournis des études de cas sur les effets du changement climatique sur la production agricole au Sénégal et au Mali. Des rapports gouvernementaux ou internationaux : quels sont les rapports des Nations Unies sur l'adaptation de l'agriculture africaine au changement climatique ? Des résumés d'articles : donne un résumé des principaux articles de recherche sur les stratégies de résilience agricole face au changement climatique en Afrique de l'Ouest. Complete-les avec les sources bibliographiques en style de citation APA. Assures-toi que chaque section de la recherche soit bien documentée et fournisse des informations détaillées et pertinentes pour une compréhension approfondie du sujet." Recherche d’informations
  • 34.
  • 35.
    Questions éthiques enBibliothèques et Archives Respect de la vie privée : ne pas garantir la confidentialité et de la sécurité des données personnelles traitées. (cf. exemple sur analyse bibliométrique) • les systèmes d'IA peuvent indexer et organiser des documents contenant des informations personnelles. • il est essentiel de garantir que ces documents ne divulguent pas d'informations sensibles. Illustration : lors de la numérisation et de l'indexation de documents d'état civil, il est important de masquer les informations personnelles telles que les numéros de sécurité sociale ou les adresses. Biais algorithmiques : ne pas assurer l'équité et l'impartialité des algorithmes (Favorisation de certaines données ou groupes, entraînant des décisions inéquitables ou discriminatoires.). • un système d'IA utilisé pour recommander des livres aux utilisateurs peut être biaisé s'il a été entraîné sur des données qui favorisent certains genres ou auteurs. • cela peut entraîner une négligence de la diversité des collections. Illustration : un algorithme favorise inconsciemment les œuvres d'auteurs masculins africains, réduisant la visibilité des œuvres d'auteurs féminins ou non africains
  • 36.
    Défis pratiques. 1,Intégration Adapter les nouveaux outils d'IA aux flux de travail existants dans les Bibliothèques et Archives. • Importance : harmoniser les technologies d'IA avec les processus en place pour maximiser leur efficacité sans perturber les opérations courantes. Exemples : • Formation du personnel : ✓comprendre le fonctionnement et l'intégration des nouveaux outils dans les tâches quotidiennes. ✓Illustration : formation des bibliothécaires à un système d'IA pour l'indexation automatique. • Compatibilité des systèmes : ✓assurer la compatibilité des nouveaux outils d'IA avec les systèmes de gestion existants. ✓ Illustration : utilisation d'un logiciel d'IA pour la reconnaissance de texte compatible avec le système de gestion des archives de l’institution.
  • 37.
    Défis pratiques. 2,Coût et accessibilité Solutions d'IA abordables et accessibles à toutes les institutions. • Importance : rendre les bénéfices de l'IA disponibles indépendamment de la taille ou du budget des institutions. Exemples : • Solutions abordables : ✓développer et promouvoir des outils d'IA open source ou à faible coût. ✓Illustration : utilisation d'un outil open source pour la recommandation de livres dans une petite bibliothèque municipale. • Accessibilité des ressources : ✓assurer que les ressources et outils d'IA sont accessibles et utilisables par toutes les institutions. ✓Illustration : formation (en ligne) gratuite pour l'utilisation de l'IA dans un centre d'archives en zone économiquement défavorisée.
  • 38.
  • 39.
    Évolution des programmes deformation Curricula : Inclure des modules sur l'IA et les compétences numériques. Filières : Informatique applicative a la documentation (cibles : développeurs, ingenieurs systèmes & reseaux…). => Specialisation en information documentaire
  • 40.
    Approche Knowledge Management Communautésde pratiques • encourager l'échange de connaissances et d'expériences entre professionnels (inter pares) et autres métiers et fonctions partenaires (Informatique). • plateformes collaboratives sur des projets et programmes
  • 41.
  • 42.
    L'IA comme accélérateur Importancede l'IA pour les transitions documentaires : • l'IA permet d'automatiser et d'optimiser les processus documentaires, rendant les institutions plus efficaces et réactives. • facilite l'accès à l'information, améliore la qualité des services et réduit les délais de traitement. Importance de l'IA pour la souveraineté documentaire : • en adoptant l'IA, les institutions africaines peuvent préserver leur patrimoine culturel et historique, tout en modernisant leurs systèmes de gestion documentaire pour un avenir plus autonome et innovant en la matière. • elle favorise le développement de solutions technologiques adaptées aux besoins locaux, permettant à l'Afrique de contrôler ses propres données et de construire une infrastructure documentaire robuste et progressivement indépendante
  • 43.
    MERCI ! a EBADpour HIER & AUJOURD’HUI https://antoninbenoitdiouf.com