1. Pascal COTTEREAU
www.information-mining.info / www.information-mining.org
Data, Text & Web Mining : A State of The Art
Part D : TALN
Introduction
Le Traitement automatique du langage naturel (abr. TALN) ou Traitement automatique des langues (abr. TAL) est une discipline
à la frontière de la linguistique et de l'informatique, qui concerne l'application de programmes et techniques informatiques à tous
les aspects du langage humain. Définition donnée par : http://fr.wikipedia.org/wiki/Traitement_automatique_du_langage_naturel
Les définitions qui suivent proviennent du site http://ue173.xwiki.com/xwiki/bin/view/Main/glossaire
Analyse morphologique : Vise à ramener tous les mots reconnus dans une phrase à leur forme canonique, en séparant les
variations grammaticales (pluriels, conjugaisons, flexions,…) De cette façon, elle identifie :
• le morphème (élément de base des formes signifiantes)
• l’ensemble des terminaisons grammaticales associées, fondamentales pour l’analyse car elles dévoilent des relations
d’état, d’action et d’appartenance
• les caractères spéciaux,
• les locutions et expressions.
Analyse syntaxique : introduit la notion de syntagme qui analyse l’arrangement des mots, sujets, verbes, compléments, selon
une unité fonctionnelle dans la phrase.
Analyse sémantique : analyse le sens. Consiste à associer l’ensemble des éléments linguistiques définis précédemment en une
représentation pouvant en corriger le sens.
All trademarks and registered trademarks are the property of their respective owners. Page 1
2. Pascal COTTEREAU
www.information-mining.info / www.information-mining.org
Knowledge- Morphologic Syntactic Semantic
Vendor Product/Project Statistic Heuristic
base analysis analysis analysis
Kryloff Subject Search
x x
Technologies Sleuth
INRA Beluga x x x
Wisconsin
Center for
Transana
Education
Research
M. Mark Miller VBPro x
Eastgate System Storyspace and
Inc Tinderbox x x
Semantic-
Tropes
Knowledge x x x x
Semantic-
Zoom x x x x
Knowledge
Overtext
Semantic-
IndexSemantic x x x x
Knowledge
Indexing
Semantic- Web Module for
x x x x
Knowledge Tropes Zoom
Zuma Textpack
Coderead x
Arisem Kaliwatch Server x x
Kaliwatch
Arisem
Professional x x x
Matheo Software Matheo Analyzer x x
LTU
Image-Seeker x x x
Technologies
eZePortal eZePortal x
datops datops Monitor x x x x x
ICAR UMR5191
Weblew
CNRS/ENS-LSH x x
Fred, Rosy The Salsa Project x x x x
Univ de la
Sorbonne Lexico3
nouvelle -Paris 3 x
Sinequa Intuition x x x x x x
Multimedia
Windex Server x
Solutions
ITM, Intelligent
Mondeca x x
Topic Manager
Alogic Select.INT x x x x
QSR
Nvivo 7
International x x
QSR
Xsight
International x x
Power Text NewsFeed
Solutions Researcher x x
Power Text HLS FreeText
Solutions Reporter x x
Astefo Calliope x x x x
NewPhenix NewPhenix Server x x x x x
Noldus
Information Theme x
Technology
Noldus
Information The Observer XT
Technology x
Digimind Evolution x x x
Autonomy Idol Server x x x
i2
OWL Watch &
CEIS x x
OWL Desk
Cipher Cipher Suite x
Soft Concept
Ethnos x
suite
Spirit Suite Spirit x x x x x
SPSS Lexiquest x x x
SPSS Tafs x x x
scope
All trademarks and registered trademarks are the property of their respective owners. Page 2