Introduction sur les domaines scientifiques impliqués dans la fouille de textes
- TAL et fouille de données : En quoi les données textuelles sont particulières (lexique, syntaxe mais aussi diversité langagière, des formats, des entités, des méta-données etc.) et quels sont les types de ressources utiles ou disponibles.
- Des modèles et des tâches (analyse grammaticale, désambiguisation, similarité textuelle, recherche et extraction d'information, classification...) et des collections standard pour évaluer des modèles et des outils
- Les approches automatisées sont associées à différentes manières de travailler les corpus (règles manuelles, apprentissage et bases d'exemples, degrés de supervision humaine, ...) : avantages / inconvénients, risques ...
Panorama méthodologique de l'offre logicielle académique ou commerciale
- Des outils pour l'utilisateur final, des APIs pour le développement, des plateformes d'annotation pour la création de bases d'apprentissage, des outils pour écrire des règles symboliques
- Des outils logiciels plus ou moins interactifs
Comment faire la veille sur internet outils et techniquesArnaud Dapa
1] --- Comment utiliser internet pour améliorer son expertise dans un domaine ?
--- [2] --- Comment utiliser internet pour mieux cerner ses concurrents ?
--- [3] --- Comment utiliser internet pour postuler et surtout être sélectionné pour des bourses d'études ?
--- [4] --- Comment utiliser internet pour comprendre la vie politique en Côte d'Ivoire ?
--- [5] --- Comment utiliser internet pour changer (améliorer) sa vie ?
Autant de questions que la veille sur le web peut résoudre .
Présentation en 10 slides du socle applicatif Improve Foundations, une distribution opérationnelle de composants Open Source pour le développement d'applications de gestion en Java.
Introduction sur les domaines scientifiques impliqués dans la fouille de textes
- TAL et fouille de données : En quoi les données textuelles sont particulières (lexique, syntaxe mais aussi diversité langagière, des formats, des entités, des méta-données etc.) et quels sont les types de ressources utiles ou disponibles.
- Des modèles et des tâches (analyse grammaticale, désambiguisation, similarité textuelle, recherche et extraction d'information, classification...) et des collections standard pour évaluer des modèles et des outils
- Les approches automatisées sont associées à différentes manières de travailler les corpus (règles manuelles, apprentissage et bases d'exemples, degrés de supervision humaine, ...) : avantages / inconvénients, risques ...
Panorama méthodologique de l'offre logicielle académique ou commerciale
- Des outils pour l'utilisateur final, des APIs pour le développement, des plateformes d'annotation pour la création de bases d'apprentissage, des outils pour écrire des règles symboliques
- Des outils logiciels plus ou moins interactifs
Comment faire la veille sur internet outils et techniquesArnaud Dapa
1] --- Comment utiliser internet pour améliorer son expertise dans un domaine ?
--- [2] --- Comment utiliser internet pour mieux cerner ses concurrents ?
--- [3] --- Comment utiliser internet pour postuler et surtout être sélectionné pour des bourses d'études ?
--- [4] --- Comment utiliser internet pour comprendre la vie politique en Côte d'Ivoire ?
--- [5] --- Comment utiliser internet pour changer (améliorer) sa vie ?
Autant de questions que la veille sur le web peut résoudre .
Présentation en 10 slides du socle applicatif Improve Foundations, une distribution opérationnelle de composants Open Source pour le développement d'applications de gestion en Java.
« Le discours et les choses. Matières technolangagières dans les environnements numériques », conférence au Colloque interdisciplinaire doctorant-e-s & jeunes chercheurs-ses Donnees hybrides et contextualisation des corpus. nouvelles approches, Universités SPC, 24 mai 2014
Portée de la négation : détection par apprentissage supervisé en français et ...CORIA-TALN 2018
Poster issu de la session du jeudi midi de la conférence conjointe CORIA-TALN 2018 qui s'est déroulé du 14 au 18 mai 2018 à Rennes.
https://project.inria.fr/coriataln2018/
Construction d'un corpus multilingue annoté en relations de traductionCORIA-TALN 2018
Poster issu de la session du jeudi midi de la conférence conjointe CORIA-TALN 2018 qui s'est déroulé du 14 au 18 mai 2018 à Rennes.
https://project.inria.fr/coriataln2018/
Analyse des noms agentifs dans des espaces vectoriels distributionnelsCORIA-TALN 2018
Slides de la conférence conjointe CORIA-TALN 2018 qui s'est déroulé du 14 au 18 mai 2018 à Rennes.
https://project.inria.fr/coriataln2018/
Marine Wauquiez
Article soumis à la conférence RJC en format long.
Décodeur neuronal pour la transcription de documents manuscrits anciensCORIA-TALN 2018
Slides de la conférence conjointe CORIA-TALN 2018 qui s'est déroulé du 14 au 18 mai 2018 à Rennes.
Adeline Granet, Emmanuel Morin, Harold Mouchère, Solen Quiniou et Christian Viard-gaudin
Article soumis à la conférence TALN en format long.
De l’usage réel des emojis à une prédiction de leurs catégoriesCORIA-TALN 2018
Slides de la conférence conjointe CORIA-TALN 2018 qui s'est déroulé du 14 au 18 mai 2018 à Rennes.
Gaël Guibon, Magalie Ochs et Patrice Bellot
Article soumis à la conférence TALN en format court.
1. The National Library of Medicine (NLM) was established to assist the advancement of medical and related sciences and to aid the dissemination and exchange of scientific and other information important to the progress of medicine and public health.
2. NLM will focus on understanding how searches are initiated, how information is used, and how questions are posed and answered through corroboration.
3. NLM's strategic plan for 2017-2027 aims to provide answers to questions from clinicians, patients, and consumers by linking research literature and clinical information through technologies like question answering systems and clinical decision support.
« Le discours et les choses. Matières technolangagières dans les environnements numériques », conférence au Colloque interdisciplinaire doctorant-e-s & jeunes chercheurs-ses Donnees hybrides et contextualisation des corpus. nouvelles approches, Universités SPC, 24 mai 2014
Portée de la négation : détection par apprentissage supervisé en français et ...CORIA-TALN 2018
Poster issu de la session du jeudi midi de la conférence conjointe CORIA-TALN 2018 qui s'est déroulé du 14 au 18 mai 2018 à Rennes.
https://project.inria.fr/coriataln2018/
Construction d'un corpus multilingue annoté en relations de traductionCORIA-TALN 2018
Poster issu de la session du jeudi midi de la conférence conjointe CORIA-TALN 2018 qui s'est déroulé du 14 au 18 mai 2018 à Rennes.
https://project.inria.fr/coriataln2018/
Analyse des noms agentifs dans des espaces vectoriels distributionnelsCORIA-TALN 2018
Slides de la conférence conjointe CORIA-TALN 2018 qui s'est déroulé du 14 au 18 mai 2018 à Rennes.
https://project.inria.fr/coriataln2018/
Marine Wauquiez
Article soumis à la conférence RJC en format long.
Décodeur neuronal pour la transcription de documents manuscrits anciensCORIA-TALN 2018
Slides de la conférence conjointe CORIA-TALN 2018 qui s'est déroulé du 14 au 18 mai 2018 à Rennes.
Adeline Granet, Emmanuel Morin, Harold Mouchère, Solen Quiniou et Christian Viard-gaudin
Article soumis à la conférence TALN en format long.
De l’usage réel des emojis à une prédiction de leurs catégoriesCORIA-TALN 2018
Slides de la conférence conjointe CORIA-TALN 2018 qui s'est déroulé du 14 au 18 mai 2018 à Rennes.
Gaël Guibon, Magalie Ochs et Patrice Bellot
Article soumis à la conférence TALN en format court.
1. The National Library of Medicine (NLM) was established to assist the advancement of medical and related sciences and to aid the dissemination and exchange of scientific and other information important to the progress of medicine and public health.
2. NLM will focus on understanding how searches are initiated, how information is used, and how questions are posed and answered through corroboration.
3. NLM's strategic plan for 2017-2027 aims to provide answers to questions from clinicians, patients, and consumers by linking research literature and clinical information through technologies like question answering systems and clinical decision support.
2. 2 Interne Orange
Démos CORIA/TALN
Nouveautés de l’analyseur linguistique LIMA
Gaël de Chalendar
PyRATA, Python Rule-based feAture sTructure Analysis
Nicolas Hernandez
Un outil d’étiquetage rapide et un corpus libre en
entités nommées du Français
Yoann Dupont
Un corpus en arabe annoté manuellement avec des
sens WordNet
Marwa Hadj Salah, Hervé Blanchon, Mounir Zrigui,
Didier Schwab
CuriosiText : application web d’aide au peuplement
d’ontologies métiers comme ressources lexicales
basée sur Word2Vec
Meryl Bothua, Delphine Lagarde, Laurent Pierre
Néonaute, Enrichissement sémantique pour la
recherche d’information
Emmanuel Cartier, Loïc Galand, Peter Stirling, Sara
Aubry
ACCOLÉ : Annotation Collaborative d'erreurs de
traduction pour COrpus aLignÉs
Francis Brunet-Manquat, Emmanuelle Esperança-
Rodier
3. 3 Interne Orange
Projets collaboratifs
DATCHA [ANR]
Extraction de connaissances à partir de vastes
corpus de conversations “chat” client-opérateurs
http://datcha.lif.univ-mrs.fr/
Democrat [ANR]
DEscription et MOdélisation des Chaînes de
Référence
http://www.lattice.cnrs.fr/democrat/
ASADERA [ANR JCJC]
Le résumé automatique à l'ère du tout-numérique
http://linc.iut.univ-paris8.fr/asadera/
NexGenTV [FUI]
http://www.nexgentv.fr/
Profiterole [ANR]
Modélisation de l'évolution de la langue à partir
de textes d'ancien français instrumentés
http://lattice.cnrs.fr/PRocessing-Old-French-
Instrumented-TExts-for-the-Representation-Of-
Language
SynPaFlex [ANR JCJC]
Flexibilité pour la synthèse de la parole expressive
https://synpaflex.irisa.fr
TREMoLo [ANR JCJC]
Transformation de registres par extraction de
motifs langagiers
http://tremolo.irisa.fr/
5. 5 Interne Orange
1/ Présentation générale
• quel est votre domaine d'activité ?
• quand votre entreprise/labo a-t-elle été créée ?
• où êtes-vous implanté ?
• quelle est la taille de votre entreprise ?
2/ Profils métiers et recherche collaborative
• quel est le profil de vos collaborateurs ?
• avez-vous des offres de recrutement en cours ?
• quels sont les compétences que vous recherchez actuellement pour votre entreprise ?
• êtes-vous impliqués dans des projets collaboratifs ? des thèses CIFRE ?
3/ Enjeux actuels du TALN et de la RI en entreprise et de la recherche collaborative