Journées ABES 2014 - 21 mai 2014 - Session "ISTEX et le Text and Data Mining" -
Pourquoi fouiller les publications scientifiques ? Retours d'expériences d'un chercheur - Mathieu Roche , CIRAD - UMR TETIS : "Le TDM côté chercheur : besoins, méthodologie et résultats". Une illustration du potentiel de la "fouille de texte" (TDM) appliquée à la recherche environnementale et de santé publique.
El documento caracteriza la logística en Colombia. Describe que la logística colombiana se ha desarrollado en sectores como el manufacturero, portuario, químico-farmacéutico, textil y de confección. También explica que la gestión logística en el país se ha visto influenciada por gremios, empresas privadas y el gobierno a través de iniciativas para mejorar las cadenas de suministro, el flujo de información y la formación de los trabajadores.
Présentation du site Parlera (Portail des Actions et Ressources Linguistiques...Coraia
Support de présentation du site PARLERA (Portail des Actions et Ressources Linguistiques En Rhône-Alpes) utilisé lors de la rencontre régionale CoRAIA du 20 juin 2014
El documento resume una sentencia reciente del Tribunal Supremo sobre la nulidad de unos despidos colectivos realizados por tres empresas. La sentencia de instancia declaró la nulidad al existir un pacto previo de no realizar despidos durante la vigencia de un expediente de suspensión de contratos. El Tribunal Supremo desestima el recurso de casación interpuesto y confirma la sentencia, rechazando los argumentos de las empresas sobre cambios en las condiciones económicas que permitirían eludir el pacto.
On raconte que dans le comté du Gévaudan, le petit village de Mortloup situé entre Mont-Méjan et Malbosc, vit une meute de loups affamés ne sortant que les soirs de pleine lune.
Cette meute constituée principalement de loups noirs des steppes méridionales, est menée par le Grand Loup. Nul n'a jamais pu l'attraper, pas même le grand chasseur Edmond la Picole.
Les loups de Mortloup sont des tueurs et les rumeurs qui circulent dans les villages alentours vont même jusqu'à les rapprocher des lycanthropes.
Les dires se propageant vite, les locaux ont depuis longtemps évité les environs. ...
Mais c'était sans l'intervention d'une troupe de scouts un peu aventuriers. Les loups se sont réveillés dans la troupe de Saint Anne. Certains éléments du groupe ont les poils qui commencent à pousser et la truffe à s'allonger.
Il ne tient qu'à vous pour les démasquer et trouver le ou les scouts-garous.
Chaque jour, les villageois viendront prendre un des votres. Et chaque soir il le brûleront pour annihiler la bête. Faîtes que vous ayez sacrifié le bon.
Bon courage, car vous n'avez plus d'eau bénite et de balles en argent.
El documento caracteriza la logística en Colombia. Describe que la logística colombiana se ha desarrollado en sectores como el manufacturero, portuario, químico-farmacéutico, textil y de confección. También explica que la gestión logística en el país se ha visto influenciada por gremios, empresas privadas y el gobierno a través de iniciativas para mejorar las cadenas de suministro, el flujo de información y la formación de los trabajadores.
Présentation du site Parlera (Portail des Actions et Ressources Linguistiques...Coraia
Support de présentation du site PARLERA (Portail des Actions et Ressources Linguistiques En Rhône-Alpes) utilisé lors de la rencontre régionale CoRAIA du 20 juin 2014
El documento resume una sentencia reciente del Tribunal Supremo sobre la nulidad de unos despidos colectivos realizados por tres empresas. La sentencia de instancia declaró la nulidad al existir un pacto previo de no realizar despidos durante la vigencia de un expediente de suspensión de contratos. El Tribunal Supremo desestima el recurso de casación interpuesto y confirma la sentencia, rechazando los argumentos de las empresas sobre cambios en las condiciones económicas que permitirían eludir el pacto.
On raconte que dans le comté du Gévaudan, le petit village de Mortloup situé entre Mont-Méjan et Malbosc, vit une meute de loups affamés ne sortant que les soirs de pleine lune.
Cette meute constituée principalement de loups noirs des steppes méridionales, est menée par le Grand Loup. Nul n'a jamais pu l'attraper, pas même le grand chasseur Edmond la Picole.
Les loups de Mortloup sont des tueurs et les rumeurs qui circulent dans les villages alentours vont même jusqu'à les rapprocher des lycanthropes.
Les dires se propageant vite, les locaux ont depuis longtemps évité les environs. ...
Mais c'était sans l'intervention d'une troupe de scouts un peu aventuriers. Les loups se sont réveillés dans la troupe de Saint Anne. Certains éléments du groupe ont les poils qui commencent à pousser et la truffe à s'allonger.
Il ne tient qu'à vous pour les démasquer et trouver le ou les scouts-garous.
Chaque jour, les villageois viendront prendre un des votres. Et chaque soir il le brûleront pour annihiler la bête. Faîtes que vous ayez sacrifié le bon.
Bon courage, car vous n'avez plus d'eau bénite et de balles en argent.
La comunicación es el intercambio de información entre dos o más partes. Incluye tanto la comunicación verbal como no verbal, con la comunicación verbal refiriéndose al uso del lenguaje oral para transmitir mensajes e ideas.
Prisma Direct es una empresa colombiana con 5 años de experiencia que ofrece soluciones de contact center y venta de hardware/software. Se enfocan en la tercerización de procesos y la generación de altos niveles de satisfacción en los clientes a través de tecnología confiable y personal capacitado. Sus valores incluyen calidad, honestidad, confidencialidad y trabajo en equipo.
El documento describe los elementos clave de una góndola de supermercado, incluyendo el frente, cenefas, estantes, laterales de puntera, lineal, paños y cabecera de góndola. También explica que la ubicación de las secciones dentro de una tienda debe considerar factores como los productos más vendidos, tipo de compra racional o irracional, complementariedad de productos, y conservación de productos frescos.
Este documento contiene preguntas y respuestas sobre los pasos para formular un proyecto. Arturo realizó un análisis del entorno, planteó un problema y documentó una idea para su proyecto de producción de plátano. Las variables propuestas para la recolección de información fueron suficientes para este propósito de aprendizaje. Los estudios de mercadeo buscan identificar a las personas u organizaciones interesadas en un bien o servicio, mientras que los estudios organizacionales determinan qué tipo de empresa constituir y si el proyecto es viable
La natación es un deporte que mejora la salud física y mental al fortalecer las articulaciones, el sistema cardiovascular y respiratorio, y reducir el estrés. Existen cuatro estilos principales de natación - crawl, pecho, mariposa y espalda - que ejercitan todos los músculos del cuerpo. Además de sus beneficios para la salud general, la natación también puede ayudar con problemas específicos como autismo, discapacidades y asma.
Este documento discute la importancia de la información y las tecnologías de la información y la comunicación (TIC) para las empresas. Explica que la información debe fluir entre todos los niveles de una empresa y que es necesario que el personal esté bien informado sobre los cambios. También describe los tipos principales de información y las herramientas comunes utilizadas para manejar la información, como Internet, intranet y teléfonos. Luego, detalla las TIC y los nuevos medios de comunicación que han surgido a través de ellas, como págin
La desnutrición se clasifica según su causa (primaria, secundaria o mixta), gravedad del déficit de peso, evolución (aguda o crónica) y según la clasificación de Waterlow que combina el déficit de peso y desmedro. Los principales síntomas de la desnutrición severa son la alteración de los procesos vitales, disminución de la inmunidad y predisposición a infecciones. La desnutrición también causa retraso en el crecimiento y disminución de la estatura en los niños
El documento define la continuidad por la izquierda y derecha de una función en un punto, así como la continuidad en un intervalo cerrado. Explica que una función es continua en un punto si es continua por ambos lados. Además, clasifica las discontinuidades en evitables e inevitables. Las evitables pueden eliminarse redefiniendo la función en el punto, mientras que las inevitables presentan saltos o límites laterales diferentes.
Mis à jour le 14/09/2017
Cours sur la recherche d'information et la veille en chimie à destination des étudiants de L1 Pro MIC2F ( Management des Industries Cosmétiques et de la Chimie Fine).
La comunicación es el intercambio de información entre dos o más partes. Incluye tanto la comunicación verbal como no verbal, con la comunicación verbal refiriéndose al uso del lenguaje oral para transmitir mensajes e ideas.
Prisma Direct es una empresa colombiana con 5 años de experiencia que ofrece soluciones de contact center y venta de hardware/software. Se enfocan en la tercerización de procesos y la generación de altos niveles de satisfacción en los clientes a través de tecnología confiable y personal capacitado. Sus valores incluyen calidad, honestidad, confidencialidad y trabajo en equipo.
El documento describe los elementos clave de una góndola de supermercado, incluyendo el frente, cenefas, estantes, laterales de puntera, lineal, paños y cabecera de góndola. También explica que la ubicación de las secciones dentro de una tienda debe considerar factores como los productos más vendidos, tipo de compra racional o irracional, complementariedad de productos, y conservación de productos frescos.
Este documento contiene preguntas y respuestas sobre los pasos para formular un proyecto. Arturo realizó un análisis del entorno, planteó un problema y documentó una idea para su proyecto de producción de plátano. Las variables propuestas para la recolección de información fueron suficientes para este propósito de aprendizaje. Los estudios de mercadeo buscan identificar a las personas u organizaciones interesadas en un bien o servicio, mientras que los estudios organizacionales determinan qué tipo de empresa constituir y si el proyecto es viable
La natación es un deporte que mejora la salud física y mental al fortalecer las articulaciones, el sistema cardiovascular y respiratorio, y reducir el estrés. Existen cuatro estilos principales de natación - crawl, pecho, mariposa y espalda - que ejercitan todos los músculos del cuerpo. Además de sus beneficios para la salud general, la natación también puede ayudar con problemas específicos como autismo, discapacidades y asma.
Este documento discute la importancia de la información y las tecnologías de la información y la comunicación (TIC) para las empresas. Explica que la información debe fluir entre todos los niveles de una empresa y que es necesario que el personal esté bien informado sobre los cambios. También describe los tipos principales de información y las herramientas comunes utilizadas para manejar la información, como Internet, intranet y teléfonos. Luego, detalla las TIC y los nuevos medios de comunicación que han surgido a través de ellas, como págin
La desnutrición se clasifica según su causa (primaria, secundaria o mixta), gravedad del déficit de peso, evolución (aguda o crónica) y según la clasificación de Waterlow que combina el déficit de peso y desmedro. Los principales síntomas de la desnutrición severa son la alteración de los procesos vitales, disminución de la inmunidad y predisposición a infecciones. La desnutrición también causa retraso en el crecimiento y disminución de la estatura en los niños
El documento define la continuidad por la izquierda y derecha de una función en un punto, así como la continuidad en un intervalo cerrado. Explica que una función es continua en un punto si es continua por ambos lados. Además, clasifica las discontinuidades en evitables e inevitables. Las evitables pueden eliminarse redefiniendo la función en el punto, mientras que las inevitables presentan saltos o límites laterales diferentes.
Mis à jour le 14/09/2017
Cours sur la recherche d'information et la veille en chimie à destination des étudiants de L1 Pro MIC2F ( Management des Industries Cosmétiques et de la Chimie Fine).
Présentation faite lors d'une réunion du projet animitex à montpellier en aôut 2014. Cette présentation introduit certains formats du web sémantique en particulier ceux accessible sur le web de données . Ensuite les travaux de Fabien Amarger sur la transformation de SKOS en ontologies OWL sont survollés.
Présentation faite lors d'une réunion du projet animitex à Montpellier en aôut 2014. Cette présentation brosse un apercu des standards du web sémantique disponible sur le web de données. Puis nous introduisons brièvement les travaux de Fabien Amarger sur la transformation de SKOS en ontologie.
Cet atelier est une introduction à la recherche d'information pour les étudiants qui débutent leur baccalauréat en ingénierie. On y présente les bases de la recherche d'information ainsi qu'une méthode.
Journée d'étude "Evolutions des catalogues, évolutions des métiers, ce qui va changer dans nos établissements" le 29 mars 2013, proposée par le CRFCB en collaboration avec l'ABF Midi-Pyrénées
Depuis plusieurs années l’évolution des catalogues, l’arrivée de RDA, l’implémentation des FRBR alimentent les débats. Au-delà du jargon et des débats de spécialistes, il y a de vraies questions pour les bibliothèques, des enjeux importants pour l’avenir, des décisions qu’il convient d’anticiper et de préparer.
Cette journée a pour objectif de rappeler la réalité derrière des mots parfois abscons, souvent lointains, de souligner ce qui va changer dans nos établissements et les questions que soulèvent ces changements certes longs, parfois encore en instance mais auxquels tous les établissements devront demain se préparer...
Support 5 de la journée d'études du 09 déc. 2013 sur l'évolution des catalogues et du catalogage organisée par le CRFCB de Marseille avec les formateurs du groupe technique sur l'adoption de RDA en France.
Introduction sur les domaines scientifiques impliqués dans la fouille de textes
- TAL et fouille de données : En quoi les données textuelles sont particulières (lexique, syntaxe mais aussi diversité langagière, des formats, des entités, des méta-données etc.) et quels sont les types de ressources utiles ou disponibles.
- Des modèles et des tâches (analyse grammaticale, désambiguisation, similarité textuelle, recherche et extraction d'information, classification...) et des collections standard pour évaluer des modèles et des outils
- Les approches automatisées sont associées à différentes manières de travailler les corpus (règles manuelles, apprentissage et bases d'exemples, degrés de supervision humaine, ...) : avantages / inconvénients, risques ...
Panorama méthodologique de l'offre logicielle académique ou commerciale
- Des outils pour l'utilisateur final, des APIs pour le développement, des plateformes d'annotation pour la création de bases d'apprentissage, des outils pour écrire des règles symboliques
- Des outils logiciels plus ou moins interactifs
Jabes 2021 - Poster "Initiation aux études historiques"ABES
MANUEL NUMÉRIQUE EN ACCÈS LIBRE
POUR L’ENSEIGNEMENT SUPÉRIEUR EN HISTOIRE
• Favorise l’apprentissage des modes
de réflexion propres à l’historien
• Familiarise l’étudiant à la maîtrise
des sources et outils de l’historien
• Ouvre l’étudiant aux disciplines qui
environnent et nourrissent la science
historique
• Donne à l’étudiant les repères
historiographiques
Poster présenté par COUPERIN
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"ABES
This document discusses the status of requests in Cidemis, the French ISSN database. It provides statistics on the percentage of requests (corrections, creations, numeration) that were completed in 2015-2020 for ISSN France and other centers. Completion rates were higher for ISSN France than other centers. It also discusses how to track numeration requests that were accepted in the Sudoc database to then close the corresponding requests in Cidemis.
This document provides an overview of the Cidemis application and circuit for requesting ISSN numbers. It begins with a brief introduction to Cidemis and the upstream Sudoc networks. It then discusses the digitization of the request circuit and how technology illuminates the complexity of communication. The rest of the document provides reminders and best practices for users of the application, including the importance of clear communication and documentation. It also references additional resources for learning about and using Cidemis.
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"ABES
Session coordonnée par Marianne Giloux (Abes).
Cette session aborde les points suivants :
- Un renouvellement conceptuel international
- Un renouvellement technologique nécessaire
- La transition bibliographique de l’Abes : l’expérimentation SudocFRBR, le FNE, le projet Sudoc21 et lme projet "Vers la LRMisation des données"
Jabes 2021 - 26 ans après la création de l'AbesABES
Présentation de David Aymonin, directeur de l'Abes
Intervention qui brosse un tableau synthétique de ce que fait l’Abes aujourd’hui : à quoi sert-elle ? dans quel contexte ? pour qui travaille-t-elle ? de quelle manière et avec qui ?
Présentation des Actus de l'Abes 2021, partie 1.
Cette partie est consacré aux actions de l'Abes au service de l'IST, de la Science Ouverte et des grands projets nationaux.
Poster présenté par l'Abes (hors concours).
Depuis 2019, l’Abes teste un nouvel algorithme développé par OCLC pour créer automatiquement des pré-notices d’œuvres, à partir de regroupements de notices bibliographiques. Ce premier pas dans la FRBRisation (aujourd'hui on parle de LRMisation) des données du catalogue Sudoc s’est accompagné d’un contrôle très strict des performances et des résultats de ce "robot". L’expérimentation aujourd’hui terminée, il est temps d’en dresser le bilan, pour vérifier dans quelle mesure, à l’avenir, les algorithmes et l’intelligence artificielle seront d’un précieux recours pour modéliser des millions de données.
Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...ABES
Poster présenté par le SCD de l'Université de Toulouse 2 Jean Jaurès.
Le Service Commun de la Documentation de l’Université Toulouse - Jean Jaurès a mis en place un service d'accompagnement à la gestion des données qui s'articule autour :
- d'une offre de formation à destination des doctorants
- d'un accompagnement des chercheurs
La mise en œuvre de cet appui en collaboration avec l'ensemble des acteurs impliqués au niveau de l'établissement a permis un reconnaissance du SCD comme un acteur primordial sur ces questions. Ainsi, dans le cadre de la formalisation des acteurs de la Science Ouverte au sein de l’établissement, la vice-présidence recherche a chargé le SCD d'assurer les fonctions d'administrateur.rice des données, des algorithmes et des codes sources de la recherche et de co-piloter le comité opérationnel des données de la recherche.
Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...ABES
Poster présenté par l'association KohaLa.
Ce poster présente le plugin Koha qui permet d’insérer des identifiants pérennes trouvés par Bibliostratus dans des notices bibliographiques (ark ou PPN) et autorités (ark, isni, Idref).
Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...ABES
Poster présenté par le SCD de l'Université Toulouse 2 Jean Jaurès.
L’objet de ce poster est de présenter la démarche qui a conduit à un projet d’expositions participatives autour de la collection cartographique patrimoniale de l’Université Toulouse Jean Jaurès, conservée au Centre de Ressources Olympe de Gouges. Après avoir découvert en 2007 cette collection sans usages, alors que j'étais responsable de la bibliothèque de Géographie, j'ai décidé de mener à partir de 2010 des recherches en Sciences de l’Information et de la Communication sur le document carte. Après l'obtention de mon doctorat en 2015, j'ai poursuivi des travaux scientifiques sur une méthode favorisant l’appropriation des valeurs informatives de ce document singulier dans l'idée de développer des médiations. Depuis deux ans, j'expérimente ainsi des ateliers avec des usagers placés en situation d’enquêter sur des cartes, en vue de réaliser des posters documentaires. Les objectifs de l'application professionnelle de mes réflexions sont multiples : créer du lien entre des documents patrimoniaux sans usages et des potentiels récepteurs, les inviter à découvrir et à utiliser des documents dans une démarche de réactivation, les inciter à avoir des lectures plurielles d'un même document, et enfin proposer un autre modèle d’expositions afin de vivifier des collections en dormance documentaire.
Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...ABES
Poster présenté par l'INISTCNRS et le CCSD.
Lancé au printemps 2021 et soutenu par le MESRI, corHAL proposera ses services à la fin de l’année. Porté par l’Inist et le CCSD, ce projet permet de collecter des métadonnées de publications scientifiques françaises issues de plusieurs réservoirs. Ces données sont homogénéisées et enrichies à l’aide d’alignements. Un repérage de doublons assure la création de notices unifiées combinant les informations des différentes sources. Grâce à un système d’alertes (mode push ou pull), le service propose au chercheur ses publications absentes de HAL. Ce dernier choisit d’importer automatiquement aucun, un, plusieurs ou tous les textes intégraux de ses publications dans l’archive ouverte nationale.
CorHAL, un outil au service du chercheur et de la science ouverte.
Cycle de Formation Théâtrale 2024 / 2025Billy DEYLORD
Pour la Saison 2024 / 2025, l'association « Le Bateau Ivre » propose un Cycle de formation théâtrale pour particuliers amateurs et professionnels des arts de la scène enfants, adolescents et adultes à l'Espace Saint-Jean de Melun (77). 108 heures de formation, d’octobre 2024 à juin 2025, à travers trois cours hebdomadaires (« Pierrot ou la science de la Scène », « Montage de spectacles », « Le Mime et son Répertoire ») et un stage annuel « Tournez dans un film de cinéma muet ».
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24BenotGeorges3
Les informations et évènements agricoles en province du Luxembourg et en Wallonie susceptibles de vous intéresser et diffusés par le SPW Agriculture, Direction de la Recherche et du Développement, Service extérieur de Libramont.
Le fichier :
Les newsletters : https://agriculture.wallonie.be/home/recherche-developpement/acteurs-du-developpement-et-de-la-vulgarisation/les-services-exterieurs-de-la-direction-de-la-recherche-et-du-developpement/newsletters-des-services-exterieurs-de-la-vulgarisation/newsletters-du-se-de-libramont.html
Bonne lecture et bienvenue aux activités proposées.
#Agriculture #Wallonie #Newsletter #Recherche #Développement #Vulgarisation #Evènement #Information #Formation #Innovation #Législation #PAC #SPW #ServicepublicdeWallonie
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...M2i Formation
Améliorez l'intégration de vos nouveaux collaborateurs grâce à notre formation flash sur l'onboarding. Découvrez des stratégies éprouvées et des outils pratiques pour transformer l'intégration en une expérience fluide et efficace, et faire de chaque nouvelle recrue un atout pour vos équipes.
Les points abordés lors de la formation :
- Les fondamentaux d'un onboarding réussi
- Les outils et stratégies pour un onboarding efficace
- L'engagement et la culture d'entreprise
- L'onboarding continu et l'amélioration continue
Formation offerte animée à distance avec notre expert Eric Collin
Impact des Critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les...mrelmejri
J'ai réalisé ce projet pour obtenir mon diplôme en licence en sciences de gestion, spécialité management, à l'ISCAE Manouba. Au cours de mon stage chez Attijari Bank, j'ai été particulièrement intéressé par l'impact des critères Environnementaux, Sociaux et de Gouvernance (ESG) sur les décisions d'investissement dans le secteur bancaire. Cette étude explore comment ces critères influencent les stratégies et les choix d'investissement des banques.
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La JeunesseOscar Smith
Besoin des conseils pour les Jeunes ? Le document suivant est plein des conseils de la Vie ! C’est vraiment un document conseil de la jeunesse que tout jeune devrait consulter.
Voir version video:
➡https://youtu.be/7ED4uTW0x1I
Sur la chaine:👇
👉https://youtube.com/@kbgestiondeprojets
Aimeriez-vous donc…
-réussir quand on est jeune ?
-avoir de meilleurs conseils pour réussir jeune ?
- qu’on vous offre des conseils de la vie ?
Ce document est une ressource qui met en évidence deux obstacles qui empêchent les jeunes de mener une vie épanouie : l'inaction et le pessimisme.
1) Découvrez comment l'inaction, c'est-à-dire le fait de ne pas agir ou d'agir alors qu'on le devrait ou qu'on est censé le faire, est un obstacle à une vie épanouie ;
> Comment l'inaction affecte-t-elle l'avenir du jeune ? Que devraient plutôt faire les jeunes pour se racheter et récupérer ce qui leur appartient ? A découvrir dans le document ;
2) Le pessimisme, c'est douter de tout ! Les jeunes doutent que la génération plus âgée ne soit jamais orientée vers la bonne volonté. Les jeunes se sentent toujours mal à l'aise face à la ruse et la volonté politique de la génération plus âgée ! Cet état de doute extrême empêche les jeunes de découvrir les opportunités offertes par les politiques et les dispositifs en faveur de la jeunesse. Voulez-vous en savoir plus sur ces opportunités que la plupart des jeunes ne découvrent pas à cause de leur pessimisme ? Consultez cette ressource gratuite et profitez-en !
En rapport avec les " conseils pour les jeunes, " cette ressource peut aussi aider les internautes cherchant :
➡les conseils pratiques pour les jeunes
➡conseils pour réussir
➡jeune investisseur conseil
➡comment investir son argent quand on est jeune
➡conseils d'écriture jeunes auteurs
➡conseils pour les jeunes auteurs
➡comment aller vers les jeunes
➡conseil des jeunes citoyens
➡les conseils municipaux des jeunes
➡conseils municipaux des jeunes
➡conseil des jeunes en mairie
➡qui sont les jeunes
➡projet pour les jeunes
➡conseil des jeunes paris
➡infos pour les jeunes
➡conseils pour les jeunes
➡Quels sont les bienfaits de la jeunesse ?
➡Quels sont les 3 qualités de la jeunesse ?
➡Comment gérer les problèmes des adolescents ?
➡les conseils de jeunes
➡guide de conseils de jeunes
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Journées ABES 2014 - Pourquoi fouiller les publications scientifiques ? Retours d'expériences d'un chercheur
1. Pourquoi fouiller les publications
scientifiques ?
Mathieu Roche
ABES - 21 mai 2014
1 / 32
2. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Plan
1 Introduction
2 Les algorithmes pour fouiller les documents
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
3 La fouille des publications scientifiques au Cirad
La recherche d’acronymes
L’extraction d’entités spatiales
L’extraction de la terminologie
4 Prospectives
2 / 32
3. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Les 3V du "Big Data"
Volume : Données massives
Variété : Données hétérogènes "syntaxiquement" et
"sémantiquement"
Vélocité : Données disponibles par flux
Et encore plein d’autres V : Versatilité, Véracité, Visualisation,
Valorisation, etc.
3 / 32
4. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Fouille de données
4 / 32
5. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
1 Introduction
2 Les algorithmes pour fouiller les documents
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
3 La fouille des publications scientifiques au Cirad
La recherche d’acronymes
L’extraction d’entités spatiales
L’extraction de la terminologie
4 Prospectives
5 / 32
6. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
Extraction/Acquisition Exploitation/Filtrage
Processus de Fouille de Textes
- - - -
- - - -
- - - -
- - - -
- - - -
- - - -
- - - -
- - - -
- - - -
- - - -
- - - -
- - - -
Données
Textuelles Connaissances
6 / 32
7. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
Les descripteurs linguistiques
Exemple
Il vend son bien de Montpellier
7 / 32
8. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
Traitement linguistique du mot
Sélection des mots ayant une fonction grammaticale définie
(par exemple, noms, verbes, adjectifs)
→ sélection des mots vend, bien et Montpellier
Remarque : distinction du mot bien entre nom, adverbe et adjectif
Exemple - Etiquetage
Il/Pronom vend/Verbe son/AdjPoss bien/Nom de/Prep
Montpellier/NomPropre
Principe de l’étiquetage grammatical (Brill’s tagger) :
lexiques
règles lexicales
règles contextuelles
8 / 32
9. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
Traitement linguistique du mot
Rassemblement des mots d’une même famille présents sous forme
fléchie : lemmatisation ou radicalisation
→ vend : vendre
Ajout de connaissances sémantiques
→ vendre est lié au concept du Commerce
Résolution anaphorique
→ remplacement du pronom
9 / 32
10. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
Traitement linguistique du syntagme
Des collocations aux syntagmes/termes
Sens global déductible des unités composant le groupe
(chapeau en paille)
Connaissances sémantiques
Connaissances syntaxiques (patrons ADJ-NOM,
NOM-PREP-NOM, etc)
Méthodes de TAL pour l’extraction de syntagmes/termes :
linguistiques, statistiques, mixtes
10 / 32
11. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
Résumé : du Corpus... aux descripteurs linguistiques
Mais pour des
personnes très
spontanées ...
Mais/COO pour/PREP
des/DTN:pl
personnes/SBC:pl
très/ADV
spontanées/ADJ
...
Etiquetage
Extraction des
descripteurs (par
exemple, syntagmes)
fichier clients
conseiller clientèle
front page
assurance qualité
logiciel ciel
...
- - - - - -
- - - - - -
- - - - - -
- - - - - -
- - - - - -
- - - - - -
- - - - - -
- - - - - -
- - - - - -
- - - - - -
- - - - - -
- - - - - -
- - - - - -
- - - - - -
- - - - - -
- - - - - -
- - - - - -
- - - - - -
- - - - - -
- - - - - -
Corpus
Nettoyage
Normalisation
Processus de Fouille de textes
11 / 32
12. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
1 Introduction
2 Les algorithmes pour fouiller les documents
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
3 La fouille des publications scientifiques au Cirad
La recherche d’acronymes
L’extraction d’entités spatiales
L’extraction de la terminologie
4 Prospectives
12 / 32
13. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
Recherche d’Information
Première étape : représentation des textes... l’approche "sac de
mots"
Pondération statistique des descripteurs : TF, IDF, TF-IDF,
13 / 32
14. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
Deuxième étape : Application d’un algorithme d’apprentissage
K plus proches voisins (KPPV) :
But : déterminer les K plus proches voisins de textes à prédire
Principe : La classe majoritaire propre à ces K plus proches voisins
est choisie pour les textes à prédire (ou la classe majoritaire après
pondération avec la mesure de similarité)
Paramètres : La valeur K et la mesure de similarité (par exemple,
la mesure cosinus)
14 / 32
15. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
Deuxième étape : Application d’un algorithme d’apprentissage
K plus proches voisins (KPPV) - Exemple :
15 / 32
16. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
1 Introduction
2 Les algorithmes pour fouiller les documents
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
3 La fouille des publications scientifiques au Cirad
La recherche d’acronymes
L’extraction d’entités spatiales
L’extraction de la terminologie
4 Prospectives
16 / 32
17. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
Précision = 9
10 = 90%
17 / 32
18. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
Précision = 9
10 = 90%
18 / 32
19. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
Précision = 9
10 = 90% / Rappel = 9
50 = 18%
19 / 32
20. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
La recherche d’acronymes
L’extraction d’entités spatiales
L’extraction de la terminologie
1 Introduction
2 Les algorithmes pour fouiller les documents
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
3 La fouille des publications scientifiques au Cirad
La recherche d’acronymes
L’extraction d’entités spatiales
L’extraction de la terminologie
4 Prospectives
20 / 32
21. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
La recherche d’acronymes
L’extraction d’entités spatiales
L’extraction de la terminologie
corpus Cirad (∼15 Mo)
corpus TETIS (∼500 Ko)
Merci à la Délégation à l’Information Scientifique Technique du Cirad
21 / 32
22. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
La recherche d’acronymes
L’extraction d’entités spatiales
L’extraction de la terminologie
• Identification automatique d’acronymes dans les textes (1)
Méthode
Étape 1 : Extraction des candidats (méthode par patron)
Étape 2 : Filtrage des candidats (méthode statistique)
Mesure Web (fouille du Web) :
WebDice(acro, def ) = 2×hits(acro,def )
hits(acro)+hits(def )
Exemple :
WebDice(BSV , Banana streak virus) =
2×hits(”BSV ” AND ”Banana streak virus”)
hits(”BSV ”)+hits(”Banana streak virus”)
22 / 32
23. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
La recherche d’acronymes
L’extraction d’entités spatiales
L’extraction de la terminologie
• Identification automatique d’acronymes dans les textes (2)
Résultats (données Cirad) :
Acronym Possible definition WebDice
ATPSM Agricultural Trade Policy Simulation Model 1.3014
TYLCV Tomato yellow leaf curl virus 0.7167
NRPS NonRibosomal Peptide Synthetase 0.4423
CIAT Centro international de agricultura tropical 0.1408
ACMV African cassava mosaic virus 0.0970
CSSV Cacao swollen shoot virus 0.0245
VLE Virtual Laboratory Environment 0.0222
CLF Corynespora Leaf Fall 0.0208
BSV Banana streak virus 0.0053
BMR Bois Massif Reconstitué 0.0046
ER Ehrlichia ruminantium 0.0004
BASIC Brésil, Afrique du Sud, Inde, Chine 0.0001
ASA Articulation du Semi-aride 0
MAE Mesures agrienvironnementales 0
[Roche, ISA workshop’2014]
23 / 32
24. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
La recherche d’acronymes
L’extraction d’entités spatiales
L’extraction de la terminologie
• Identification automatique d’Entités Spatiales (ES) dans les textes
Utilisation de patrons d’extraction pour identifier
des indicateurs spatiaux (orientation, distance, adjacence, inclusion,
figure géométrique)
des Entités Spatiales Absolues et Relatives
[Kergosien et al., IJGIS’2014]
24 / 32
25. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
La recherche d’acronymes
L’extraction d’entités spatiales
L’extraction de la terminologie
• Identification automatique des termes dans les textes (1)
Travaux menés avec Sophie Fortuno, (Cirad, TETIS)
Méthode
Étape 1 : Extraction des candidats termes (méthodes linguistiques +
statistiques)
Exemple : "soft contact" vs. "soft contact lens"
Étape 2 : Filtrage des candidats (combinaison avec d’autres méthodes +
des ressources comme Agrovoc)
25 / 32
26. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
La recherche d’acronymes
L’extraction d’entités spatiales
L’extraction de la terminologie
• Identification automatique des termes dans les textes (2) – Étape 1
[Lossio et al., IJKDB’2014]
26 / 32
27. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
La recherche d’acronymes
L’extraction d’entités spatiales
L’extraction de la terminologie
• Identification automatique des termes dans les textes (3) – Étape 2
+ prise en compte d’Agrovoc (vocabulaire contrôlé issu de la FAO –
Food and Agriculture Organization)
27 / 32
28. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
La recherche d’acronymes
L’extraction d’entités spatiales
L’extraction de la terminologie
• Identification automatique des termes dans les textes (3) – Résultats
Résultats quantitatifs [stage étudiants en informatique (Master IPS)]
Corpus Cirad : 28% des termes simples / 12% des termes
composés de BioTex sont présents dans Agrovoc
Corpus TETIS : 25% des termes simples / 1% des termes
composés de BioTex sont présents dans Agrovoc
Résultats qualitatifs [stage étudiante "Ressources documentaires et bases
de données"]
Définition de critères de pertinence liés à l’indexation :
sélectivité, objectivité, cohérence, indépendance contextuelle
28 / 32
29. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
La recherche d’acronymes
L’extraction d’entités spatiales
L’extraction de la terminologie
• Identification automatique des termes dans les textes (3) – Résultats
Exemples de termes (en français) : développement durable, sécurité
alimentaire, croissance démographique, développement rural,
aménagement du territoire, gouvernance territoriale, etc.
Publication en Open Data (CKAN – Comprehensive Knowledge
Archive Network) :
Mise en correspondance des (1) termes extraits, (2) entités spatiales, (3)
publications Cirad associées (numéros)
29 / 32
30. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
1 Introduction
2 Les algorithmes pour fouiller les documents
Les descripteurs linguistiques
La Recherche d’Information
L’évaluation
3 La fouille des publications scientifiques au Cirad
La recherche d’acronymes
L’extraction d’entités spatiales
L’extraction de la terminologie
4 Prospectives
30 / 32
31. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Veille d’épidémiologie animale : Comment détecter des signaux faibles
dans la masse de données ?
Croisement des publications avec d’autres types de données (dépêches,
presse, tweets, etc.)
31 / 32
32. Introduction
Les algorithmes pour fouiller les documents
La fouille des publications scientifiques au Cirad
Prospectives
Remerciements
Les chercheurs : Sophie Fortuno (Cirad, TETIS), Maguelonne
Teisseire (Irstea, TETIS), Eric Kergosien (LIRMM), Juan Antonio
Lossio (LIRMM)
Les documentalistes : Marie-Claude Deboin (Cirad),
Marie-Christine Duchamp (Cirad), Marie-Francoise Fily (Cirad),
Josée Lessard (Cirad), Sylvie Blin-Sarah (Irstea)
Les étudiants : L3 - UM3 : Marie-Odile Aptel-Barral, M1 IPS -
UM2 : Amira Akli, Thinhinan Lounis, Serigne Toure, Salim Belkebir
32 / 32